본문 바로가기
반응형
CHAPTER 2 머신러닝 프로젝트 처음부터 끝까지 머신러닝 프로젝트 진행 주요 단계 큰 그림 보기 모델의 목적 파악하기(분류, 회귀 등) 솔루션 파악하기(문제 해결 방법에 대한 정보 수집, 참고 성능으로 사용) 성능 측정 지표 선택 평균 제곱근 오차(Root Mean Square Error) - 회귀 문제의 전형적 성능 지표 $RMSE(X,h) = \sqrt({1 \over m}\sum^m_{i=1} (h(x^{(i)})-y^{(i)})^2) $ 평균 절대 오차(Mean Absolute Error) - 이상치로 보이는 구역이 많을 경우 사용 $MAE(X,h) = {1 \over m} \sum^m_{i=1} | h(x^{(i)}) - y^{(i)}| $ RMSE, MAE 모두 예측값의 벡터, 타깃값의 벡터 사이의 거리를 재는 방법 데이터 구하기 일반적으로.. 2020. 3. 26.
CHAPTER 1 한눈에 보는 머신러닝 머신러닝(machine learning) 데이터로부터 학습하도록 컴퓨터를 프로그래밍 하는 과학 명시적 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야 훈련 세트(training set) 시스템이 학습하는 데 사용하는 샘플 훈련 사례(training instance), 샘플(sample) 각 훈련 데이터 왜 머신러닝을 사용하는가? 전통적 접근 방법 보다 프로그램이 짧아지고 유지 보수하기 쉬우며 대부분 정확도가 더 높음(ex 스팸 분류) 데이터 마이닝(data mining) 대용량의 데이터를 분석하여 겉으로 보이지 않던 패턴을 발견하는 기술 차원 축소(dimensionality reduction) 정보를 잃지 않으면서 데이터를 간소화 특성 추출(feature extraction) 원시 데이터.. 2020. 3. 25.
반응형