728x90
반응형
지도학습
- 회귀(Regression) : 정답이 연속형 변수
- 분류(Classification) : 정답이 비연속형(범주형) 변수
비지도 학습
- 군집분석(Clustering) : 주어진 데이터가 어떻게 구성되어있는지.
- 강화학습(Reinforcement Learning) : 행동에 따른 보상을 최대화 시키는 방법
선형회귀(Linear Regression)
- 예측값을 직선으로 표현하는 모델
- 실제 값을 잘 예측하는것을 목표로 한다.
Classification 과 Clustering 의 차이
- Classification 은 새로운 데이터를 알고있는 레이블에 포함시키는것.
- 정해진 그룹의 데이터를 파악하여 특징을 찾아 새로운 데이터를 정해진 그룹에 포함시키는것.
- Clustering 은 데이터의 패턴을 찾아 그룹을 만들어 내는것.
- 유사한 성질을 갖고 있는 것끼리 그룹을 만드는것.
- 데이터 세트의 그룹이 2개가 될수 있고 3개가 될수도 있다.
인공신경
- 노드, 엣지로 이루어진다.
- weight(중요도) 곱하고 bias(민감도) 더한다. (함수이다.)
- AI 가 학습한다 라는 것은 주어진 입력에 대해서 원하는 출력이 나오도록 W, B 를 AI 가 알아내는것을 의미한다.
Hyperparameter (정해줘야 하는 숫자 ) <> 반대로 AI 가 정하는 숫자는 파라미터 (weight, bias)
- Epoch : 전체 데이터를 몇번 반복할것인지. - 하나의 Epoch 은 전체 데이터 셋에 대해서 forward pass, backward pass 과정을 거친것을 말한다.
- Batch size : 하나의 Epoch 을 돌때 데이터를 나눠서 학습하기도 하는데 나누어진 데이터를 Batch 라고 하며 그 크기를 Batch size 라고 한다.
- Iteration : 하나의 Epoch 을 완료할때 필요한 Batch 수
- EX : 700 개의 데이터 를 하나당 100개씩 batch 로 나누었을때 1-epoch 을 위해서는 7 Iteration 이 필요하다.
Training vs Test (vs Validation)
- Training data : 파라미터 학습을 위한 data
- Test data : 최종적으로 학습된 모델 테스트용 data
- Validation Data : 하이퍼 라마미터 선택을 위한 data
- Test data 로 학습을 하면 안된다. 이유는 Test Data 로 학습을 하게 되면 처음 보는 data에 대한 결과값을 얻을수 없기 때문이다.
728x90
반응형
'Development > Python' 카테고리의 다른 글
[FastAPI] request body의 필수값 존재 여부에 따른 응답 (0) | 2024.03.20 |
---|---|
맥(Mac)에서 아나콘다(Anaconda) 제거하기 (0) | 2023.08.11 |
colab 에서 kaggle 설정 (0) | 2023.06.07 |
Pandas 사용 (0) | 2023.05.23 |
NumPy 사용 (0) | 2023.05.09 |