RP씨의 떠나자블로그 ::

핸즈온 머신러닝 6일차 "실제 데이터로 작업 시작"

2. 머신러닝 A-Z

진행할 주요 단계

2.1 실제 데이터로 작업

실제 데이터로 작업하는 것이 가장 좋음.

공개된 데이터는

공개 데이터 저장소(US얼바인 머신러닝저장소, 캐글 데이터셋, 아마존 AWS 데이터셋)

메타 포털(dataportals.org, opendatamonitor.eu, qualdl.com)

공개 데이터 나열 페이지(위키백과 머신러닝 데이터셋 목록, Quora.com, 레딧(데이터셋)

여기서는 StatLib 저장소의 캘리포니아 주택 가격 데이터를 사용하고, 1990년 캘리포니아 인구조사 데이터를 기반으로 합니다. 학습용으로 좋은 데이터임.

2.2 큰 그림

Todo :

캘리포니아 인구조사 데이터로 캘리포니아 주택가격 예측 모델을 만듬.

데이터에는 블록 그룹(600~3000명 정도)마다 인구, 중간소득, 중간 주택가격 등이 담겨 있음. (블록그룹 = 구역)

모델을 학습시켜서 다른 측정 데이터가 주어졌을 때 구역의 중간 주택 가격을 예측!

Tip) 체크리스트를 사용하여 머신러닝을 준비 (부록2참고)

스터디 중 필기한 내용으로 모든 참고자료는 핸즈온 머신러닝입니다.

아래 책을 클릭하시면 구매페이지로 이동합니다.

공감과 댓글은 글쓴이에게 큰 힘이 됩니다.

마음에 드셨으면 공감과 댓글부탁드립니다.

핸즈온 머신러닝 8일차 "가정검사와 데이터 추출 & 히스토그램" (0)	2018.06.06
핸즈온 머신러닝 7일차 "목표 설정 & 성능 측정 지표" (0)	2018.06.05
핸즈온 머신러닝 5일차 "머신러닝의 주요 도전 과제" (0)	2018.06.02
핸즈온 머신러닝 4일차 " 머신러닝 시스템의 종류(3)" 사례기반 vs 모델기반 (0)	2018.06.01
핸즈온 머신러닝 3일차 " 머신러닝 시스템의 종류(2)" 준지도, 강화학습 & 배치학습 vs 온라인 학습 (0)	2018.05.31