반응형

지도학습

  • 회귀(Regression) : 정답이 연속형 변수
  • 분류(Classification) : 정답이 비연속형(범주형) 변수

비지도 학습

  • 군집분석(Clustering) : 주어진 데이터가 어떻게 구성되어있는지.
  • 강화학습(Reinforcement Learning) : 행동에 따른 보상을 최대화 시키는 방법

선형회귀(Linear Regression)

  • 예측값을 직선으로 표현하는 모델
  • 실제 값을 잘 예측하는것을 목표로 한다.

Classification 과 Clustering 의 차이

  • Classification 은 새로운 데이터를 알고있는 레이블에 포함시키는것.
    • 정해진 그룹의 데이터를 파악하여 특징을 찾아 새로운 데이터를 정해진 그룹에 포함시키는것.
  • Clustering 은 데이터의 패턴을 찾아 그룹을 만들어 내는것. 
    • 유사한 성질을 갖고 있는 것끼리 그룹을 만드는것.
    • 데이터 세트의 그룹이 2개가 될수 있고 3개가 될수도 있다. 

인공신경

  • 노드, 엣지로 이루어진다.
  • weight(중요도) 곱하고 bias(민감도) 더한다. (함수이다.)
  • AI 가 학습한다 라는 것은 주어진 입력에 대해서 원하는 출력이 나오도록 W, B 를 AI 가 알아내는것을 의미한다.

Hyperparameter (정해줘야 하는 숫자 ) <> 반대로 AI 가 정하는 숫자는 파라미터 (weight, bias)

  • Epoch : 전체 데이터를 몇번 반복할것인지. - 하나의 Epoch 은 전체 데이터 셋에 대해서 forward pass, backward pass 과정을 거친것을 말한다.
  • Batch size : 하나의 Epoch 을 돌때 데이터를 나눠서 학습하기도 하는데 나누어진 데이터를 Batch 라고 하며 그 크기를 Batch size 라고 한다.
  • Iteration : 하나의 Epoch 을 완료할때 필요한 Batch 수
    • EX : 700 개의 데이터 를 하나당 100개씩 batch 로 나누었을때 1-epoch 을 위해서는 7 Iteration 이 필요하다.

Training vs Test (vs Validation)

  • Training data : 파라미터 학습을 위한 data
  • Test data : 최종적으로 학습된 모델 테스트용 data
  • Validation Data : 하이퍼 라마미터 선택을 위한 data
  • Test data 로 학습을 하면 안된다. 이유는 Test Data 로 학습을 하게 되면 처음 보는 data에 대한 결과값을 얻을수 없기 때문이다.


          

728x90
반응형

'Development > Python' 카테고리의 다른 글

[FastAPI] request body의 필수값 존재 여부에 따른 응답  (0) 2024.03.20
맥(Mac)에서 아나콘다(Anaconda) 제거하기  (0) 2023.08.11
colab 에서 kaggle 설정  (0) 2023.06.07
Pandas 사용  (0) 2023.05.23
NumPy 사용  (0) 2023.05.09

+ Recent posts