파이썬으로 데이터 마이닝 시작하기 : 북윈도
리뷰 0 위시 120

파이썬으로 데이터 마이닝 시작하기 요약정보 및 구매

데이터의 수집, 로딩, 변환, 클러스터링, 예측까지

상품 선택옵션 0 개, 추가옵션 0 개

출판사 에이콘출판
저자 나단 그리넬치
ISBN 9791161753669 (1161753664)
정가 21,000원
판매가 18,900원(10% 할인)
배송비 무료배송
포인트 정책 설명문 닫기

00포인트

포인트 정책 설명문 출력

선택된 옵션

관심상품

상품 정보

사은품
상품 기본설명
데이터의 수집, 로딩, 변환, 클러스터링, 예측까지
상품 상세설명


요즘 가장 인기 있는 프로그래밍 언어인 파이썬을 활용한 데이터 마이닝 기법을 소개한다. 다양한 예제와 데이터 마이닝 기법으로 유용한 인사이트를 어떻게 얻어낼 수 있는지를 배운다. 파이썬 라이브러리를 사용한 데이터 시각화 기법도 함께 소개한다.





목차
1장. 데이터 마이닝과 파이썬 도구 입문
__기술적, 예측적, 처방적 분석
__이 책에서 다루는 것과 다루지 않는 것
__추가적인 학습을 위한 추천 도서
__데이터 마이닝을 위한 파이썬 환경 설정
__아나콘다와 콘다 패키지 관리자 설치하기
____리눅스에 설치하기
____윈도우에서 설치하기
____맥 OS에서 설치하기
__스파이더 IDE 시작하기
__주피터 노트북 실행하기
__고성능 파이썬 설치하기
__추천 라이브러리와 설치 방법
__추천 라이브러리
__요약

2장. 기본 용어와 종합적 사례
__기본적 데이터 용어
__샘플 스페이스
__변수의 종류
__데이터 형태
__기본적 요약 통계량
__파이썬을 활용한 데이터 마이닝 예제
____데이터를 메모리에 로딩하기: pandas를 통해 데이터 보기와 데이터 관리하기
____데이터 플롯과 탐구: seaborn의 능력 체험하기
____데이터 변환: scikit-learn을 활용한 PCA와 LDA
____분리를 계량화하기: k-means 클러스터링과 실루엣 스코어
____의사 결정 혹은 예측
__요약

3장. 데이터의 수집, 탐구, 시각화
__데이터 소스의 형태와 pandas에 데이터 적재하기
____데이터베이스
____기본적 SQL 질의
____디스크
____웹 소스
____URL
____scikit-learn이나 seaborn에 포함된 데이터 사용
__pandas로 데이터 접근, 검색, 점검하기
__seaborn에서의 기본적 플롯
__데이터 시각화를 위한 인기 있는 형태의 플롯들
____스캐터 플롯
____히스토그램
____조인트 플롯
____바이올린 플롯
____페어플롯
__요약

4장. 분석을 위한 데이터 클리닝과 준비
__scikit-learn 변환 API
__입력 데이터 클리닝
____결측값
____결측값 찾기와 제거하기
____결측값을 대체하기 위한 임퓨팅
__특징 스케일링
____정규화
____표준화
__카테고리 데이터 처리
____순서적 인코딩
____원핫 인코딩
____레이블 인코딩
__고차원 데이터
__차원 감소
____특징 선택
____특징 필터링
____래퍼 기법
__변환
____PCA
____LDA
__요약

5장. 데이터의 그룹화와 클러스터링
__클러스터링 개념 소개
__그룹의 위치
____유클리디안 공간(센트로이드)
____비유클리디안 공간(메디오이드)
__유사성
____유클리디안 공간
____비유클리디안 공간
__종료 조건
____알려진 숫자의 그룹의 경우
____알려지지 않은 숫자의 그룹의 경우
____품질 스코어와 실루엣 스코어
__클러스터링 기법들
____평균 분리
____k-means
____계층적 클러스터링
____클러스터의 숫자를 찾기 위해 덴드로그램 재사용하기
____덴드로그램 그리기
__밀도 클러스터링
__스펙트럼 클러스터링
__요약

6장. 회귀와 분류를 이용한 예측
__scikit-learn 추정기 API
__예측 개념 소개
____예측 모델 표기법
__수학적 도구
____손실 함수
____기울기 하강
____품질 체계 적합하기
__회귀
____회귀 모델 예측 지표
____회귀 예제 데이터
____선형 회귀
____다변량 형태로 확장
____처벌 회귀를 활용한 규칙화
____규칙화 처벌
__분류
____분류 예제 데이터
____분류 모델 예측의 지표
____복수 클래스 분류
____로지스틱 회귀
____규칙화된 로지스틱 회귀
____서포트 벡터 머신
____C를 사용한 소프트 마진
____커널 트릭
____트리 기반 분류
____의사 결정 트리
____랜덤 포레스트
__예측 모델의 튜닝
____교차 검증
____검증 데이터 개론
____K-fold 기법을 이용한 복수의 검증 데이터셋
____초모수 튜닝을 위한 그리드 서치
__요약

7장. 고급 주제: 데이터 처리 파이프라인의 생성과 사용
__당신의 분석 파이프라인 생성
____scikit-learn의 파이프라인 객체
__모델 구현하기
____pickle 모듈을 통해 모델을 연속화하고 저장하기
____연속화된 모델을 로딩하고 예측하기
__파이썬에서의 구현 문제
__요약
출판사 서평
★ 이 책에서 다루는 내용 ★■ 데이터셋 요약 및 데이터 시각화 기법 탐구
■ 분석 작업을 위한 데이터 수집과 구성
■ 데이터 포인트를 그룹에 할당하고 클러스터링으로 시각화하기
■ 데이터에 대한 연속적 및 카테고리적 예측 학습
■ 데이터 클리닝, 노이즈 제거, 차원 감소
■ scikit-learn의 파이프라인 특징을 사용한 데이터 처리 모델 연속화
■ 파이썬의 pickle 모듈을 이용한 데이터 처리 모델 구현★ 이 책의 대상 독자 ★파이썬을 활용한 데이터 마이닝과 분석 분야의 초보자를 대상으로 한다. 독자가 파이썬 프로그래밍 경험이 거의 없으며 고등학교 수준 이상의 수학 실력을 갖추지 못한 것으로 가정하고 서술했다. 이 책에 사용된 모든 파이썬 라이브러리는 많은 플랫폼에서 무료로 구할 수 있으므로, 인터넷에 접속할 수 있다면 책에 나오는 개념을 배우고 연습할 수 있을 것이다.★ 이 책의 구성 ★처음 세 장은 데이터 마이닝 프로젝트의 구조적인 내용을 다룬다. 여기에는 데이터 마이닝 파이썬 환경의 생성, 다양한 소스로부터의 데이터 로딩, 다운스트림 분석을 위한 데이터 변환을 포함한다. 나머지 장에서는 주로 개념을 다루며, 신입 사원을 교육하는 것처럼 대화체로 서술했다.
1장. ‘데이터 마이닝과 파이썬 도구 입문’에서는 독자의 소프트웨어 환경에서 파이썬을 시작하는 법을 다룬다. 파이썬, pandas, scikit-learn, seaborn 같은 인기 있는 라이브러리를 설치하는 법을 알려준다. 환경을 설정하고 나면 다음 설명을 따라갈 수 있을 것이다.
2장. ‘기본 용어와 종합적 사례’에서는 데이터 마이닝에서 요구되는 기본적 통계와 데이터 용어를 소개한다. 이 장의 끝에서는 종합적 예제를 다루고, 다음 장에서 소개할 여러 기법을 보여준다. 2장을 읽으면 분석이 의미하는 사고의 과정과 업무에서 맞닥뜨리게 될 문제를 해결하기 위한 절차를 좀 더 명확히 이해할 수 있다.
3장. ‘데이터의 수집, 탐구, 시각화’에서는 데이터베이스, 디스크, 웹에서 데이터를 불러오는 기본적인 방법을 살펴본다. 기본적인 SQL 질의와 pandas의 액세스 및 검색 함수를 다루며, seaborn을 사용한 주요 플롯 형태를 소개한다.
4장. ‘분석을 위한 데이터 클리닝 및 준비’에서는 데이터 클리닝과 차원 감소의 기본을 다룬다. 어떻게 미지의 값을 처리하고, 입력 데이터를 리스케일하고, 카테고리 변수를 다룰지 이해하게 될 것이다. 또한 고차원 데이터의 문제를 필터, 래퍼(wrapper), 변환 기법 등의 특징 감소 기법을 사용해 문제를 어떻게 해결하는지 알아본다.
5장. ‘데이터의 그룹화와 클러스터링’에서는 데이터 마이닝을 위한 클러스터링 알고리즘 설계 배경과 사고 과정을 설명한다. 그리고 실무에서 사용하는 클러스터링 기법을 소개하고 모의 데이터를 사용해 이들을 비교한다. 이 내용을 배우면 평균 분리, 밀도, 연결성에 기반한 클러스터링 알고리즘 간의 차이를 알게 될 것이다. 또한 데이터의 플롯을 해석하고 클러스터링이 여러분의 데이터 마이닝 프로젝트에 어느 정도 적합한지에 대한 인사이트를 얻을 수 있다.
6장. ‘회귀와 분류를 이용한 예측’에서는 손실 함수와 기울기 하강을 통한 예측 모델 학습을 다룬다. 그다음 과대적합, 과소적합 및 적합 과정에서의 모델 정규화를 위한 페널티 접근의 개념을 살펴본다. 그리고 표준적인 회귀 및 분류 기법들과 각각의 정규화된 버전을 다룬다. 교차 검증과 그리드 검색을 포함한 모델 튜닝의 베스트 프랙티스를 다루면서 마무리한다.
7장. ‘고급 주제: 데이터 처리 파이프라인의 생성과 사용’에서는 scikit-learn 기법을 사용해 파이프라인을 생성하고 적용하는 전략을 살펴본다. 이어서 구현 시점에서 일어나는 파이썬 관련 문제를 다룬다. ★ 옮긴이의 말 ★데이터 마이닝의 개념은 학계와 산업계에 소개된 지 오래됐다. 하지만 고급 통계 패키지나 컴퓨터 프로그래밍을 경험해보지 못한 사람도 쉽게 이해하고 간편하게 활용할 수 있는 안내서는 지금껏 찾기 힘들었다.
이 책은 데이터 마이닝 패키지 혹은 컴퓨터 프로그래밍 관련 경험이 없는 독자도 차근차근 쉽게 따라 할 수 있도록 쓰여졌다. 알기 쉬운 예제와 파이썬 프로그램을 활용한 해결 방법을 제공하고 있으므로, 데이터 마이닝에 관심이 있는 학생과 직장인에게 좋은 입문서가 될 것이다.
이 책이 우리나라에서 데이터 마이닝의 대중화를 앞당기는 데 조금이나마 도움이 되길 바란다.
상품 정보 고시
도서명 파이썬으로 데이터 마이닝 시작하기
저자 나단 그리넬치
출판사 에이콘출판
ISBN 9791161753669 (1161753664)
쪽수 212
출간일 2019-12-19
사이즈 187 * 235 * 21 mm /518g
목차 또는 책소개 1장. 데이터 마이닝과 파이썬 도구 입문
__기술적, 예측적, 처방적 분석
__이 책에서 다루는 것과 다루지 않는 것
__추가적인 학습을 위한 추천 도서
__데이터 마이닝을 위한 파이썬 환경 설정
__아나콘다와 콘다 패키지 관리자 설치하기
____리눅스에 설치하기
____윈도우에서 설치하기
____맥 OS에서 설치하기
__스파이더 IDE 시작하기
__주피터 노트북 실행하기
__고성능 파이썬 설치하기
__추천 라이브러리와 설치 방법
__추천 라이브러리
__요약

2장. 기본 용어와 종합적 사례
__기본적 데이터 용어
__샘플 스페이스
__변수의 종류
__데이터 형태
__기본적 요약 통계량
__파이썬을 활용한 데이터 마이닝 예제
____데이터를 메모리에 로딩하기: pandas를 통해 데이터 보기와 데이터 관리하기
____데이터 플롯과 탐구: seaborn의 능력 체험하기
____데이터 변환: scikit-learn을 활용한 PCA와 LDA
____분리를 계량화하기: k-means 클러스터링과 실루엣 스코어
____의사 결정 혹은 예측
__요약

3장. 데이터의 수집, 탐구, 시각화
__데이터 소스의 형태와 pandas에 데이터 적재하기
____데이터베이스
____기본적 SQL 질의
____디스크
____웹 소스
____URL
____scikit-learn이나 seaborn에 포함된 데이터 사용
__pandas로 데이터 접근, 검색, 점검하기
__seaborn에서의 기본적 플롯
__데이터 시각화를 위한 인기 있는 형태의 플롯들
____스캐터 플롯
____히스토그램
____조인트 플롯
____바이올린 플롯
____페어플롯
__요약

4장. 분석을 위한 데이터 클리닝과 준비
__scikit-learn 변환 API
__입력 데이터 클리닝
____결측값
____결측값 찾기와 제거하기
____결측값을 대체하기 위한 임퓨팅
__특징 스케일링
____정규화
____표준화
__카테고리 데이터 처리
____순서적 인코딩
____원핫 인코딩
____레이블 인코딩
__고차원 데이터
__차원 감소
____특징 선택
____특징 필터링
____래퍼 기법
__변환
____PCA
____LDA
__요약

5장. 데이터의 그룹화와 클러스터링
__클러스터링 개념 소개
__그룹의 위치
____유클리디안 공간(센트로이드)
____비유클리디안 공간(메디오이드)
__유사성
____유클리디안 공간
____비유클리디안 공간
__종료 조건
____알려진 숫자의 그룹의 경우
____알려지지 않은 숫자의 그룹의 경우
____품질 스코어와 실루엣 스코어
__클러스터링 기법들
____평균 분리
____k-means
____계층적 클러스터링
____클러스터의 숫자를 찾기 위해 덴드로그램 재사용하기
____덴드로그램 그리기
__밀도 클러스터링
__스펙트럼 클러스터링
__요약

6장. 회귀와 분류를 이용한 예측
__scikit-learn 추정기 API
__예측 개념 소개
____예측 모델 표기법
__수학적 도구
____손실 함수
____기울기 하강
____품질 체계 적합하기
__회귀
____회귀 모델 예측 지표
____회귀 예제 데이터
____선형 회귀
____다변량 형태로 확장
____처벌 회귀를 활용한 규칙화
____규칙화 처벌
__분류
____분류 예제 데이터
____분류 모델 예측의 지표
____복수 클래스 분류
____로지스틱 회귀
____규칙화된 로지스틱 회귀
____서포트 벡터 머신
____C를 사용한 소프트 마진
____커널 트릭
____트리 기반 분류
____의사 결정 트리
____랜덤 포레스트
__예측 모델의 튜닝
____교차 검증
____검증 데이터 개론
____K-fold 기법을 이용한 복수의 검증 데이터셋
____초모수 튜닝을 위한 그리드 서치
__요약

7장. 고급 주제: 데이터 처리 파이프라인의 생성과 사용
__당신의 분석 파이프라인 생성
____scikit-learn의 파이프라인 객체
__모델 구현하기
____pickle 모듈을 통해 모델을 연속화하고 저장하기
____연속화된 모델을 로딩하고 예측하기
__파이썬에서의 구현 문제
__요약
배송공지

사용후기

회원리뷰 총 0개

사용후기가 없습니다.

상품문의

등록된 상품문의

상품문의 총 0개

상품문의가 없습니다.

교환/반품

[반품/교환방법]
마이페이지> 주문배송조회 > 반품/교환신청 또는 고객센터 (070-4680-5689)로 문의 바랍니다.

[반품주소]
- 도로명 : (10882) 경기도 파주시 산남로 62-20 (산남동)
- 지번 : (10882) 경기도 파주시 산남동 305-21

[반품/교환가능 기간]
변심반품의 경우 수령 후 14일 이내, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

[반품/교환비용]
단순 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담

[반품/교환 불가 사유]
- 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
(단지 확인을 위한 포장 훼손은 제외)
- 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
- 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
- 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
- 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
- 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
- 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
* (1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시
‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)

[상품 품절]
공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.

[소비자 피해보상, 환불지연에 따른 배상]
- 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됩니다.
- 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함.

회원로그인

오늘 본 상품

  • 파이썬으로 데이터 마이닝 시작하기
    파이썬으로 데이터
    18,900
  • 오륜행실도
    오륜행실도
    18,000
  • 책 쓰자면 맞춤법
    책 쓰자면 맞춤법
    11,700
  • 백일동안 백 가지 이야기
    백일동안 백 가지
    12,600