<aside> 🥧 [ 오늘의 후기 ] 행렬 곱셈이 너무 어려운데 이거 괜찮은 걸까 ??... 연습 문제 같은 거라도 풀어봐야 하나 ㄱ- 그리고 ... 역행렬도 너무 어렵지만 자세히는 몰라도 되는? 거겠지? 아닌가? 흑흑
</aside>
인공지능
→ 사람이 하는 일을 컴퓨터에게 시키는 기술 !
인공지능 구현 방법
중에 머신 러닝과 딥러닝이 있는 것, 그중 딥러닝은 뇌 뉴런의 방식을 이용한 것
지도 학습 ( Supervised Learning )
→ 문제와 정답을 모두 알려주고 공부시키기
많은 양의 정보(x, y)를 통해 학습 후 새로운 문제에 대한 예측 요구
비지도 학습 ( Unsupervised Learning )
→ 답 안 알려주고 공부 시키기
학습 시 주어지는 정보에 x값은 있지만 y값 없음
강화 학습 ( Reinforcement Learning )
→ 상은 최대화, 벌은 최소화 하는 방향으로 행위 강화
학습 유형 | 머신 러닝 유형 | 알고리즘 |
---|---|---|
지도학습 | 분류 | kNN, 베이즈, 결정 트리, 랜덤포레스트, 로지스틱회귀, 그라디언트 부스팅, 신경망 ... |
회귀 | 선형회귀분석, SVM, 신경망 | |
비지도학습 | 군집화 | K-Means, DBASCAN |
데이터 변환 | 스케일링, 정규화, 로그변환 | |
차원 축소 | PCA(주성분 분석), 시각화 |
**수치형 데이터**
→ 관측된 값이 수치로 측정되는 데이터 → 연산 가능
**범주형 데이터**
→ 범주 또는 항목의 형태로 나타내지는 데이터 → 연산 불가능
<aside> 🍪 100개의 쿠키반죽 중 너무 작거나 큰 반죽 균질화 → 연습용 반죽 떼놓기 → 오븐기, 시간 정하기 → 모드, 시간,온도, 세팅 ( 쿠키가 맛있는 하이퍼파라미터 찾기 ) → 다 구운 후 테스트 및 평가
</aside>
**데이터 수집
**
**데이터 전처리
**
이상치 : 예상 기준을 초과하는 극단적 데이터 → 제거 or 대체 ( 평균값, 최빈값 등 )
결측치 : 누락된 데이터 → 제거, 대체 ( 평균값, 최빈값 등 )
홀드아웃 ( Hold out ) → 데이터셋 분리
train(학습 데이터셋), validation(검증 데이터셋), test(테스트 데이터셋) → 6:2:2 비율
⚠️ 데이터가 너무 적을 경우 검증 X