본문

핸즈온 머신러닝 1일차 "머신러닝 개념정리" 머신러닝이란?


1.1 머신러닝?



데이터로부터 학습하도록 컴퓨터를 프로그래밍하는 과학 기술

명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 분야

-아서 사무엘 1959

w)

훈련 세트(training set) = 학습하는 데 사용하는 example

훈련 사례(training instance) = 각 훈련의 데이터


- 공학적 정의 이해

작업T를 수행하는 프로그램성능P로 측정

경험E로 성능 향상됐다면,

이 컴퓨터 프로그램작업T 성능 측정 P에 대해 경험E학습

-톰 미첼 1997

ex) 스팸메일 필터 프로그램

작업T = 새로운 메일이 스팸인지 구분

경험E  = 훈련 데이터

성능 측정P = 정확하게 분류된 메일 비율(정확도accuracy, 기준은 직접 정의)


1.2 머신러닝 사용 이유?



일반 문제 해결 방식(규칙 작성이 핵심)

규칙이 복잡하고 길어져 유지보수가 어려워짐.

vs

머신러닝( 패턴 감지하여 학습이 핵심)

훨신 짧아 유지보수하기 쉽고, 정확도도 높음.


뛰어난 분야

수동조정·규칙이 많은 문제, 해결방법이 없는 복잡한 문제, 유동적인 환경, 복잡한 문제와 빅데이터에서 insight 발견


머신러닝 접근 방법

문제 연구 →  데이터를 통한 머신러닝 알고리즘 훈련 → 솔루션 평가

평가합격시) 론칭 → 데이터 업데이트(문제이해 증가) → 알고리즘 훈련

평가미흡시) 오차분석 → 문제연구

참고) 데이터 마이닝

머신러닝으로 대용량 데이터 분석 -> 보이지 않던 패턴 발견


공부자료로 필기한 내용으로 모든 참고자료는 핸즈온 머신러닝입니다.

아래 책을 클릭하시면 구매페이지로 이동합니다.


공감댓글은 글쓴이에게 큰 힘이 됩니다. 

마음에 드셨으면 공감댓글부탁드립니다.






댓글