데이터 과학 입문자를 위한 R : 북윈도
리뷰 0 위시 120

데이터 과학 입문자를 위한 R 요약정보 및 구매

설치부터 패키지 개발까지 R로 시작하는 데이터 과학

상품 선택옵션 0 개, 추가옵션 0 개

출판사 에이콘출판
저자 재리드 랜더
ISBN 9791161750989 (1161750983)
정가 40,000원
판매가 36,000원(10% 할인)
배송비 무료배송
포인트 정책 설명문 닫기

00포인트

포인트 정책 설명문 출력

선택된 옵션

관심상품

상품 정보

사은품
상품 기본설명
설치부터 패키지 개발까지 R로 시작하는 데이터 과학
상품 상세설명
폴 딕스(시리즈 편집자)

R의 기초부터 프로그래밍까지 소개하고, 다양한 통계학적 방법과 일상에서 사용할 수 있는 도구들을 소개한다. 2판에서는 새로운 내용을 추가해 최신 R 커뮤니티에 소개된 내용들을 망라하고 있다. 타이디버스(Tidyverse)를 활용해 데이터 다루기, R 마크다운, 샤이니에 대한 장들이 그런 예다. 예제로 사용되는 데이터 세트들은 누구나 사용할 수 있는 것을 사용했으며, 이를 잘 정리해 저자의 웹 사이트를 통해 접근할 수 있게 했다. 이 책은 실제로 존재하는 데이터와 재미있는 문제들로 독자의 흥미를 끝까지 유지하게 한다.





목차
1장. R 설치

__1.1 R 다운로드하기
__1.2 R 버전
__1.3 32비트 대 64비트
__1.4 설치
____1.4.1 윈도우에서 설치하기
____1.4.2 맥 OS X에 설치하기
____1.4.3 리눅스에 설치하기
__1.5 마이크로소프트 R 오픈
__1.6 결론

2장. R 환경

__2.1 커맨드라인 인터페이스
__2.2 RStudio
____2.2.1 RStudio 프로젝트
____2.2.2 RStudio 툴
____2.2.3 깃 통합
__2.3 마이크로소프트 비주얼 스튜디오
__2.4 결론

3장. R 패키지

__3.1 패키지 인스톨
____3.1.1 패키지 제거
__3.2 패키지 로딩
____3.2.1 패키지 언로딩
__3.3 패키지 만들기
__3.4 결론

4장. R의 기초

__4.1 기초 수학
__4.2 변수
____4.2.1 변수 할당
____4.2.2 변수 제거
__4.3 데이터 유형
____4.3.1 숫자형 데이터
____4.3.2 문자열 데이터
____4.3.3 날짜
____4.3.4 논리형
__4.4 벡터
____4.4.1 벡터 연산
____4.4.2 팩터형 벡터
__4.5 함수 호출하기
__4.6 함수에 대한 도움말 문서
__4.7 결측값
____4.7.1 NA
____4.7.2 NULL
__4.8 파이프
__4.9 결론

5장. 고급 데이터 구조

__5.1 데이터 프레임
__5.2 리스트
__5.3 행렬
__5.4 배열
__5.5 결론

6장. R로 데이터 읽어 오기

__6.1 CSV 파일 읽기
____6.1.1 read_delim
____6.1.2 fread
__6.2 엑셀 데이터
__6.3 데이터베이스에서 데이터 읽기
__6.4 다른 통계 툴의 데이터
__6.5 R 바이너리 파일
__6.6 R에 포함돼 있는 데이터
__6.7 웹 사이트에서 데이터 추출하기
__6.8 JSON 데이터 읽기
__6.9 결론

7장. R 통계 그래프

__7.1 기본 그래픽스
____7.1.1 기본 히스토그램
____7.1.2 기본 산점도
____7.1.3 상자그림
__7.2 ggplot2
____7.2.1 ggplot2로 히스토그램과 밀도 곡선
____7.2.2 ggplot2 산점도
____7.2.3 ggplot2 상자그림과 바이올린 플롯
____7.2.4 ggplot2 꺾은선그래프
____7.2.5 테마
__7.3 결론

8장. R 함수 작성

__8.1 헬로 월드
__8.2 함수 인자
____8.2.1 디폴트 인자
____8.2.2 부가 인자들
__8.3 Return Values
__8.4 do.call
__8.5 결론

9장. R 제어문

__9.1 if와 else
__9.2 switch
__9.3 ifelse
__9.4 복합 테스트
__9.5 결론

10장. 루프, R에서는 그다지 환영받지 못하는 존재

__10.1 for 루프
__10.2 while 루프
__10.3 루프 조절
__10.4 결론

11장. 그룹별 데이터 조작

__11.1 Apply 패밀리
____11.1.1 apply 함수
____11.1.2 lapply와 sapply 함수
____11.1.3 mapply 함수
____11.1.4 기타 apply 함수들
__11.2 집계
__11.3 plyr 패키지
____11.3.2 llply
____11.3.3 plyr 헬퍼 함수
____11.3.4 속도 대 편이성
__11.4 data.table
____11.4.1 키
____11.4.2 데이터 테이블 집계
__11.5 결론

12장. dplyr 패키지로 빠르게 그룹 단위로 데이터 다루기

__12.1 파이프(Pipes)
__12.2 tbl
__12.3 select
__12.4 filter
__12.5 slice
__12.6 mutate
__12.7 summarize
__12.8 group_by
__12.9 arrange
__12.10 do
__12.11 데이터베이스와 dplyr 사용
__12.12 결론

13장. purrr 패키지를 사용한 순회

__13.1 map
__13.2 반환값의 유형을 정의한 map 함수
__13.3 데이터 프레임에서 순회하기
__13.4 여러 입력값에 대해 map 사용하기
__13.5 결론

14장. 데이터 재구조화

__14.1 cbind와 rbind
__14.2 조인
__14.3 결론

15장. 타이디버스로 데이터 재구조화

__15.1 행과 열을 붙이기
__15.2 dplyr를 사용한 조인
__15.3 데이터 포맷 변환
__15.4 결론

16장. 문자열 처리

__16.1 paste 함수
__16.2 sprintf 함수
__16.3 텍스트 추출
__16.4 정규 표현식
__16.5 결론

17장. 확률 분포

__17.1 정규 분포
__17.2 이항 분포(Binomial Distribution)
__17.3 포아송 분포
__17.4 기타 분포들
__17.5 결론

18장. 기초 통계학

__18.1 요약 통계
__18.2 상관과 공분산(Correlation, Covariance)
__18.3 t-검정
__18.3 단일-표본 t 검정
__18.4 ANOVA
__18.5 결론

19장. 선형 모형

__19.1 단순선형회귀
__19.3 결론

20장. 일반화 선형 모형

__20.1 로직스틱 회귀
__20.2 포아송 회귀
__20.3 기타 일반화 선형 모형들
__20.4 생존 분석
__20.5 결론

21장. 모형 진단

__21.1 잔차(Residuals)
__21.2 모형들을 비교하는 방법
__21.3 교차 타당성 검증(Cross-Validation)
__21.4 부트 스트랩
__21.5 단계적 변수 선택
__21.6 결론

22장. 정형화(Regularization)와 축소(Shrinkage)

__22.2 베이즈 축소(Bayesian Shrinkage)
__22.3 결론

23장. 비선형 모형

__23.1 비선형 최소 제곱
__23.2 스플라인(splines)
__23.3 일반화 가법 모형(Generalized Additive Models)
__23.4 의사결정 나무(decision trees)
__23.5 부스팅 의사결정 나무(boosted tress)
__23.6 랜덤 포리스트(Random Forests)
__23.7 결론

24장. 시계열과 자기상관

__24.1 자기회귀이동평균(Autoregressive Moving Average)
__24.2 벡터자기회귀모형(VAR)
__24.3 일반화 자동회귀 조건부 이분산 모형(GARCH)
__24.4 결론

25장. 군집화

__25.1 K-평균 군집화
__25.2 PAM
__25.3 계층적 군집화
__25.4 결론

26장. Caret을 사용한 모형 적합

__26.1 caret 패키지의 기초
__26.2 Caret 옵션들
__26.3 부스팅 의사결정 나무에 대한 조율
__26.4 결론

27장. 니터(knitr)를 활용한 재현성과 보고서

__271. 레이텍 프로그램 인스톨
__27.2 레이텍의 기초
__27.3 레이텍과 함께 니터 사용하기
__27.4 결론

28장. R 마크다운으로 다양한 포맷의 문서 만들기

__28.1 문서 컴파일
__28.2 문서 헤더
__28.3 마크다운의 기초
__28.4 마크다운 코드 청크
__28.5 htmlwidgets
__28.6 R 마크다운 슬라이드 쇼
__28.7 결론

29장. 샤이니로 인터랙티브 대시보드 만들기

__29.1 R 마크다운 문서 안에서 샤이니 사용하기
__29.2 샤이니에서의 반응성 표현식
__29.3 서버와 UI
__29.4 결론

30장. R 패키지 개발

__30.1 폴더 구조
__30.2 패키지 파일들
__30.3 패키지 문서화
__30.4 테스트
__30.5 체킹, 빌딩, 인스톨링
__30.6 CRAN에 패키지 제출하기
__30.7 C++ 코드
__30.8 결론

부록 A. 주변에서 찾을 수 있는 R 리소스

부록 B. 용어 정리
출판사 서평
★ 이 책에서 다루는 내용 ★■ R, RStudio, R 패키지 둘러보기
■ 계산에 사용되는 R: 변수 타입, 벡터, 함수 호출 등
■ 데이터 프레임, 매트릭스, 리스트 같은 데이터 구조 탐색
■ 여러 가지 유형의 데이터 읽기
■ 매혹적이고 직관적인 통계 그래프 만들기
■ 사용자 정의 함수 작성
■ if, ifesle 등을 사용한 프로그램 컨트롤과 복잡한 조건 만들기
■ 그룹별 데이터 조작
■ 복수의 데이터 세트를 결합하고 구조 바꾸기
■ R을 사용한 문자열 조작과 정규 표현식 다루기
■ 정규, 이항, 포아송 분포 만들기
■ 선형, 일반화 선형, 비선형 모형 만들기
■ 기초 요약 통계: 평균, 표준편차, t-검정
■ 머신 러닝 모형 학습
■ 모형의 질 평가와 변수 선택법
■ 일래스틱 넷과 베이즈 방법을 사용해 과대적합을 막고 변수 선택 실행하기
■ 일변량, 다변량 시계열 데이터 분석
■ K-평균, 계층적 군집화
■ 니터(knitr)를 사용해 레포트, 프리젠테이션, 웹 페이지 만들기
■ R 마크다운과 htmlwidgets을 사용한 인터랙티브 데이터 시각화
■ 샤이니(Shiny)로 대시보드 구현
■ devtools, Rcpp와 함께 R 패키지 만들기★ 이 책의 대상 독자 ★R 언어로 하는 데이터 과학의 전반적인 내용을 다루므로 데이터 과학 입문자에게 안성맞춤인 안내서다. 이 책을 다 읽고 나면, R 프로그램 작성뿐만 아니라 가장 많이 사용하는 통계 방법들을 모두 사용할 수 있게 될 것이다.★ 이 책의 구성 ★1장, ‘R 설치’에서는 R을 다운로드하고 설치하는 방법을 소개한다. 여러 가지 운영체제를 포함해 32비트와 64비트 버전의 차이도 설명한다. R을 설치할 장소에 대한 조언도 들어 있다.
2장, ‘R 환경’에서는 R 사용법에 대한 개론으로, RStudio에 사용하는 방법을 중점적으로 다룬다. RStudio의 프로젝트 기능, 버전 관리 도구인 깃을 사용하고 RStudio를 개별화하는 방법도 소개한다.
3장, ‘R 패키지’에서는 R 패키지를 찾는 방법, 설치하고 로딩하는 방법을 다룬다.
4장, ‘R의 기초’에서는 R을 갖고 수학 계산을 해본다. 숫자형(Numeric), 문자형(Character), 날짜(Date), 벡터 등과 같은 변수의 타입을 소개하고, 함수를 호출하고 함수에 대한 도움말 문서를 찾는 법을 소개한다.
5장, ‘고급 데이터 구조’에서는 가장 강력하면서 자주 사용되는 데이터 구조인 데이터 프레임과 함께 매트릭스, 리스트 등을 다룬다.
6장, ‘R로 데이터 읽어 오기’에서는 R로 데이터를 가져오는 방법을 소개한다. 데이터 분석 이전에 R로 먼저 가져와야 할 것이다. CSV 파일이나 데이터베이스 등의 데이터를 읽는 등 데이터를 갖고 오는 방법은 다양하다.
7장, ‘R 통계 그래프’에서는 왜 그래프가 데이터 분석의 초기 작업과 결과를 소통하는 데 핵심적인 역할을 하는지 분명하게 밝힌다. R의 강력한 플로팅 기능을 활용하면 아름다운 그래프를 만들 수 있다. 베이스 그래픽과 ggplot2를 소개하고 자세히 설명한다.
8장, ‘R 함수 작성’에서는 사용자 정의 함수를 사용해 반복되는 분석 과정을 쉽게 만드는 방법을 소개한다. 함수의 구조, 인자, 반환값 반환 규칙을 설명한다.
9장, ‘R 제어문’에서는 if, ifelse 같은 예약어로 프로그램의 흐름을 제어해 복잡한 일을 하게 만드는 방법을 다룬다.
10장, ’루프, R은 그다지 환영 받지 못하는 존재’에서는 for문, while문을 사용한 순회를 설명한다. R에서의 사용은 권장되지 않지만 알고 있는 것은 중요하다.
11장, ‘그룹별 데이터 조작’에서는 루프보다 나은 방법인 벡터화를 설명한다. 벡터화는 데이터를 일일이 순회시키지 않고 한꺼번에 일을 처리할 수 있게 해준다. apply 계열의 함수들이나 plyr 패키지와 함께 사용하면 효율을 더 높일 수 있다.
12장, ‘dplyr 패키지로 빠르게 그룹 단위로 데이터 다루기’에서는 그룹화된 데이터를 다루는 데 있어 더 발전한 dplyr 패키지를 소개한다. 이 패키지는 데이터 프레임과 함께 가장 잘 작동하도록 최적화돼 있고, 효율적인 코딩 작성과 읽기를 위해 파이프 기능을 적용할 수 있다.
13장, ‘purrr 패키지를 사용한 순회’에서는 purrr 패키지를 활용해 리스트나 벡터를 더 쉽게 순회할 수 있는 또 다른 방법을 다룬다. 이는 R의 함수형 언어 특징을 잘 활용하는 것이다.
14장, ‘데이터 재구조화’에서는 데이터의 구조를 바꾸는 작업에서 흔히 사용되는 스태킹, 조이닝 같이 여러 개의 데이터 세트를 합치는 방법을 소개한다. plyr, reshape2 같은 패키지들은 R 베이스에 있는 rbind, cbind, merge 함수와 함께 복잡한 작업을 쉽게 해주는 기능을 제공한다.
15장, ‘타이디버스로 데이터 재구조화’에서는 데이터 구조를 바꾸거나 결합할 때 plyr, reshape2 패키지를 대신해 더 쉽게 사용할 수 있는 plyr, tidy 패키지를 다룬다.
16장, ‘문자열 처리’는 텍스트에 대한 장이다. 많은 사람은 문자열 데이터와 통계를 잘 연결시켜 생각하지 못할 수도 있지만, 이는 데이터의 중요한 형태다. R은 문자열을 다루는 다양한 기능을 제공하는데, 문자열을 결합하거나 텍스트 안의 정보를 추출하는 등의 일을 할 수 있다. 더불어 정규 표현식도 설명한다.
17장, ‘확률 분포’에서는 정규 분포, 이항 분포, 포와송 분포를 간략히 소개한다. 여러 분포에 대한 수식과 함수들을 설명한다.
18장, ‘기초 통계학’에서는 흔히 배우는 기초 통계학을 다룬다. 평균, 표준편차-t, 검정 등을 소개한다.
19장, ‘선형 모형’에서는 통계학에서 가장 강력하고 흔히 사용되는 선형 모형을 자세히 설명한다.
20장, ‘일반화 선형 모형’에서는 선형 모형을 확장한 로지스틱, 포와송 회귀를 설명한다. 생존 분석도 다룬다.
21장, ‘모형 진단’에서는 모형의 질을 결정하는 방법과 잔차, AIC, 교차 타당성, 붓스트랩, 단계별 변수 선택과 같은 변수 선택 방법을 소개한다.
22장, ’정형화와 축소’에서는 일래스틱 넷과 베이즈 방법을 사용해 과대 적합을 예방하는 방법을 설명한다.
23장, ‘비선형 모형’에서는 선형 모형이 적절하지 않은 상황에서 사용할 수 있는 비선형 방법을 다룬다. 비선형 최소 제곱법, 스플라인, 일반화 가법 모형, 의사결정 나무, 부스팅 의사결정 나무, 랜덤 포리스트 등을 논의한다.
24장, ‘시계열과 자기상관’에서는 일변량, 다변량 시계열 데이터를 분석하는 방법을 다룬다.
25장, ‘군집화’ 데이터를 나누는 클러스터링 방법과 K-평균 군집화, 계층적 군집화를 소개한다.
26장, ‘Caret을 사용한 모형 적합’에서는 caret 패키지로 모형에 대한 자동 조율법을 소개한다. 이 패키지는 수백 개의 모형에 대한 단일 인터페이스를 제공해 모형 적합 작업을 쉽게 해준다.
27장, ‘니터를 활용한 재현성과 보고서’에서는 R 코드와 텍스트를 혼합해 보고서를 만드는 방법을 소개한다. 니터(knitr) 패키지와 레이텍을 사용하면 이 작업이 쉬워진다.
28장, ‘R 마크다운으로 다양한 포맷의 문서 만들기’ R과 R 마크다운을 사용해 재현 가능한 레포트, 슬라이드, 웹 페이지를 만드는 방법과 leaflet, dygraphs 패키지 같은 htmlwidgets을 사용해 사용자 인터랙션을 구현하는 방법을 소개한다.
29장, ‘샤이니로 인터랙티브 대시보드 만들기’에서는 샤이니(Shiny)를 사용한 인터랙티브 대시보드 만들기를 소개한다. 샤이니는 R을 백엔드에 두고 웹 기반의 대시보드를 만들 수 있는 기능을 제공한다.
30장, ‘R 패키지 개발’에서는 R 패키지 개발에 관한 내용을 소개한다. devtools, Rcpp 같은 패키지를 사용하면 패키지 개발이 매우 쉬워진다.
부록 A, ‘주변에서 찾을 수 있는 R 리소스’에서는 R 학습에 도움이 되는 리소스와 R 관련 커뮤니티를 소개한다.
부록 B, ‘용어 정리’에서는 이 책에서 사용한 용어들을 정리한다.★ 옮긴이의 말 ★R 언어가 사용되는 분야는 매우 넓기 때문에 R에 관한 책들도 많이 출판되고 있다. 어떤 학문이나 도메인에 R을 붙이면 거기에 해당하는 책을 찾을 수 있을 정도다. 예를 들면 R for machine learning, R for biology, R for Finance, R for Marketing 관련 책을 어렵지 않게 찾을 수 있다. 이 책은 R for Data Science 분야에 해당한다.
이 책의 장점은 R의 포괄적인 면을 다룬다는 점이다. 저자는 통계학을 전공하고 데이터 회사를 운영하는 데이터 과학자며, 컬럼비아 대학교에서 데이터 과학 개론을 강의하기도 한다. 저자의 서문에 따르면 이 책은 그 강의의 내용을 뼈대로 삼았다고 한다. 즉 R에 초점을 맞춘 데이터 과학 개론서로 책이 기획됐다는 의미다. 그 점은 이 책의 목차를 보더라도 드러난다. 저자는 ‘R for Everyone’이라는 제목을 붙였지만 번역을 마치고 보니 ‘데이터 과학 입문자를 위한 R’ 정도가 가장 적합한 제목이라고 생각한다. 어떤 의도가 있겠지만 책의 내용만 보면 그렇다는 이야기다.
좀 더 구체적으로 보면 컴퓨터 언어로서 R 언어의 이모저모를 설명했으며, 외부에 있는 데이터를 R로 갖고 오는 방법, 갖고 와서 본격적인 분석에 들어가기 전 준비 과정에서 데이터를 정제하는 타이디버스(Tidyverse) 같은 최신의 방법, 데이터 탐색을 위한 데이터 시각화 방법, 데이터에 대한 여러 가지 모형을 만들고 평가하는 방법, 분석된 결과를 다른 사람과 공유하기 위해 R 마크다운/니터 같은 방법으로 문서화하는 방법, 샤이니(shiny) 앱을 좀 더 다이나믹하게 만드는 방법, 그리고 마지막으로 R 패키지로 자신이 만든 것을 다른 사람과 공유하는 방법까지 데이터 과학의 거의 모든 부분을 망라하고 있다. 이것은 데이터 과학자들이 일상적으로 하는 일이다.
따라서 이 책은 데이터 과학자가 되고자 하는 독자에게 좋은 안내서가 될 것이다. 개인적인 생각일지 모르지만, 데이터 과학을 하려는 사람에게 R은 피해갈 수 없는 영역이라고 생각한다. 왜냐하면 데이터 과학의 근간은 통계학이며, R은 통계학자들의 핵심 언어기 때문이다.
통계학 지식이 깊지 않아서 통계학에 대한 부분이 가장 번역이 어려웠다. 저자가 통계학 전공자여서인지 모르지만, 이 책은 선형, 비선형 모형까지 광범위하고 다양하게 설명하고 있다. 비전공자로서 비선형 모형 같은 내용은 낯선 것이었다. 최신 머신 러닝 알고리즘과 관련된 알고리즘에 대한 직감(intuition)을 파악하는 것이 중요해서 저자도 추천하는 책이지만 『An Introduction to Statistical Learning』(Springer, 2017)을 같이 읽으면서 많은 내용을 참고했다. 물론 더 깊이 이해하는 데는 더 많은 시간이 필요할 것이다. 나와 비슷한 처지에 있는 분이라면 이 책도 같이 읽으면서 공부할 것을 추천한다.
장점이 있으면 단점도 있다. 개론서로서 포괄적인 접근법을 선택했기 때문에 한 주제에 대한 깊이 있는 설명 부족하다. 이 책에서 한 장으로 설명되는 내용들이 하나의 책으로 엮어질 수 있는 것들이 많다. 내가 저술하거나 번역한 책들만 예로 들어도 그렇다. 니터(knitr) 패키지와 R 마크다운 패키지를 사용해 코드와 텍스트를 합쳐 문서화하는 방법은 『통계 분석 너머 R의 무궁무진한 활용』(에이콘, 2017), 샤이니(shiny) 패키지로 웹 애플리케이션을 만드는 방법은 『R Shiny 프로그래밍 가이드』 (한나래아카데미, 2017), RStudio 사용법에 대한 번역서 『초보자를 위한 RStudio 마스터』(에이콘, 2017) 등과 관련이 있다. 통계학으로 들어가면 하나하나의 주제가 거대한 산이고, 그것들을 소개하는 다양한 책들이 있다.
체계를 갖춘 모든 것이 그러하듯 처음부터 한 주제에 몰입할 수는 없다. 이 책은 앞에서도 언급했지만 R의 드넓은 지평을 보여준다. 독자들은 이 책을 통해 R의 신세계를 경험할 것이고, 이 책을 계기로 더 멀리, 더 깊이 들어갈 수 있으리라 생각한다.
상품 정보 고시
도서명 데이터 과학 입문자를 위한 R
저자 재리드 랜더
출판사 에이콘출판
ISBN 9791161750989 (1161750983)
쪽수 648
출간일 2017-12-27
사이즈 188 * 235 mm
목차 또는 책소개 1장. R 설치

__1.1 R 다운로드하기
__1.2 R 버전
__1.3 32비트 대 64비트
__1.4 설치
____1.4.1 윈도우에서 설치하기
____1.4.2 맥 OS X에 설치하기
____1.4.3 리눅스에 설치하기
__1.5 마이크로소프트 R 오픈
__1.6 결론

2장. R 환경

__2.1 커맨드라인 인터페이스
__2.2 RStudio
____2.2.1 RStudio 프로젝트
____2.2.2 RStudio 툴
____2.2.3 깃 통합
__2.3 마이크로소프트 비주얼 스튜디오
__2.4 결론

3장. R 패키지

__3.1 패키지 인스톨
____3.1.1 패키지 제거
__3.2 패키지 로딩
____3.2.1 패키지 언로딩
__3.3 패키지 만들기
__3.4 결론

4장. R의 기초

__4.1 기초 수학
__4.2 변수
____4.2.1 변수 할당
____4.2.2 변수 제거
__4.3 데이터 유형
____4.3.1 숫자형 데이터
____4.3.2 문자열 데이터
____4.3.3 날짜
____4.3.4 논리형
__4.4 벡터
____4.4.1 벡터 연산
____4.4.2 팩터형 벡터
__4.5 함수 호출하기
__4.6 함수에 대한 도움말 문서
__4.7 결측값
____4.7.1 NA
____4.7.2 NULL
__4.8 파이프
__4.9 결론

5장. 고급 데이터 구조

__5.1 데이터 프레임
__5.2 리스트
__5.3 행렬
__5.4 배열
__5.5 결론

6장. R로 데이터 읽어 오기

__6.1 CSV 파일 읽기
____6.1.1 read_delim
____6.1.2 fread
__6.2 엑셀 데이터
__6.3 데이터베이스에서 데이터 읽기
__6.4 다른 통계 툴의 데이터
__6.5 R 바이너리 파일
__6.6 R에 포함돼 있는 데이터
__6.7 웹 사이트에서 데이터 추출하기
__6.8 JSON 데이터 읽기
__6.9 결론

7장. R 통계 그래프

__7.1 기본 그래픽스
____7.1.1 기본 히스토그램
____7.1.2 기본 산점도
____7.1.3 상자그림
__7.2 ggplot2
____7.2.1 ggplot2로 히스토그램과 밀도 곡선
____7.2.2 ggplot2 산점도
____7.2.3 ggplot2 상자그림과 바이올린 플롯
____7.2.4 ggplot2 꺾은선그래프
____7.2.5 테마
__7.3 결론

8장. R 함수 작성

__8.1 헬로 월드
__8.2 함수 인자
____8.2.1 디폴트 인자
____8.2.2 부가 인자들
__8.3 Return Values
__8.4 do.call
__8.5 결론

9장. R 제어문

__9.1 if와 else
__9.2 switch
__9.3 ifelse
__9.4 복합 테스트
__9.5 결론

10장. 루프, R에서는 그다지 환영받지 못하는 존재

__10.1 for 루프
__10.2 while 루프
__10.3 루프 조절
__10.4 결론

11장. 그룹별 데이터 조작

__11.1 Apply 패밀리
____11.1.1 apply 함수
____11.1.2 lapply와 sapply 함수
____11.1.3 mapply 함수
____11.1.4 기타 apply 함수들
__11.2 집계
__11.3 plyr 패키지
____11.3.2 llply
____11.3.3 plyr 헬퍼 함수
____11.3.4 속도 대 편이성
__11.4 data.table
____11.4.1 키
____11.4.2 데이터 테이블 집계
__11.5 결론

12장. dplyr 패키지로 빠르게 그룹 단위로 데이터 다루기

__12.1 파이프(Pipes)
__12.2 tbl
__12.3 select
__12.4 filter
__12.5 slice
__12.6 mutate
__12.7 summarize
__12.8 group_by
__12.9 arrange
__12.10 do
__12.11 데이터베이스와 dplyr 사용
__12.12 결론

13장. purrr 패키지를 사용한 순회

__13.1 map
__13.2 반환값의 유형을 정의한 map 함수
__13.3 데이터 프레임에서 순회하기
__13.4 여러 입력값에 대해 map 사용하기
__13.5 결론

14장. 데이터 재구조화

__14.1 cbind와 rbind
__14.2 조인
__14.3 결론

15장. 타이디버스로 데이터 재구조화

__15.1 행과 열을 붙이기
__15.2 dplyr를 사용한 조인
__15.3 데이터 포맷 변환
__15.4 결론

16장. 문자열 처리

__16.1 paste 함수
__16.2 sprintf 함수
__16.3 텍스트 추출
__16.4 정규 표현식
__16.5 결론

17장. 확률 분포

__17.1 정규 분포
__17.2 이항 분포(Binomial Distribution)
__17.3 포아송 분포
__17.4 기타 분포들
__17.5 결론

18장. 기초 통계학

__18.1 요약 통계
__18.2 상관과 공분산(Correlation, Covariance)
__18.3 t-검정
__18.3 단일-표본 t 검정
__18.4 ANOVA
__18.5 결론

19장. 선형 모형

__19.1 단순선형회귀
__19.3 결론

20장. 일반화 선형 모형

__20.1 로직스틱 회귀
__20.2 포아송 회귀
__20.3 기타 일반화 선형 모형들
__20.4 생존 분석
__20.5 결론

21장. 모형 진단

__21.1 잔차(Residuals)
__21.2 모형들을 비교하는 방법
__21.3 교차 타당성 검증(Cross-Validation)
__21.4 부트 스트랩
__21.5 단계적 변수 선택
__21.6 결론

22장. 정형화(Regularization)와 축소(Shrinkage)

__22.2 베이즈 축소(Bayesian Shrinkage)
__22.3 결론

23장. 비선형 모형

__23.1 비선형 최소 제곱
__23.2 스플라인(splines)
__23.3 일반화 가법 모형(Generalized Additive Models)
__23.4 의사결정 나무(decision trees)
__23.5 부스팅 의사결정 나무(boosted tress)
__23.6 랜덤 포리스트(Random Forests)
__23.7 결론

24장. 시계열과 자기상관

__24.1 자기회귀이동평균(Autoregressive Moving Average)
__24.2 벡터자기회귀모형(VAR)
__24.3 일반화 자동회귀 조건부 이분산 모형(GARCH)
__24.4 결론

25장. 군집화

__25.1 K-평균 군집화
__25.2 PAM
__25.3 계층적 군집화
__25.4 결론

26장. Caret을 사용한 모형 적합

__26.1 caret 패키지의 기초
__26.2 Caret 옵션들
__26.3 부스팅 의사결정 나무에 대한 조율
__26.4 결론

27장. 니터(knitr)를 활용한 재현성과 보고서

__271. 레이텍 프로그램 인스톨
__27.2 레이텍의 기초
__27.3 레이텍과 함께 니터 사용하기
__27.4 결론

28장. R 마크다운으로 다양한 포맷의 문서 만들기

__28.1 문서 컴파일
__28.2 문서 헤더
__28.3 마크다운의 기초
__28.4 마크다운 코드 청크
__28.5 htmlwidgets
__28.6 R 마크다운 슬라이드 쇼
__28.7 결론

29장. 샤이니로 인터랙티브 대시보드 만들기

__29.1 R 마크다운 문서 안에서 샤이니 사용하기
__29.2 샤이니에서의 반응성 표현식
__29.3 서버와 UI
__29.4 결론

30장. R 패키지 개발

__30.1 폴더 구조
__30.2 패키지 파일들
__30.3 패키지 문서화
__30.4 테스트
__30.5 체킹, 빌딩, 인스톨링
__30.6 CRAN에 패키지 제출하기
__30.7 C++ 코드
__30.8 결론

부록 A. 주변에서 찾을 수 있는 R 리소스

부록 B. 용어 정리
상품 정보 고시
도서명 상품페이지 참고
저자 상품페이지 참고
출판사 상품페이지 참고
크기 상품페이지 참고
쪽수 상품페이지 참고
제품구성 상품페이지 참고
출간일 상품페이지 참고
목차 또는 책소개 상품페이지 참고
배송공지

사용후기

회원리뷰 총 0개

사용후기가 없습니다.

상품문의

등록된 상품문의

상품문의 총 0개

상품문의가 없습니다.

교환/반품

[반품/교환방법]
마이페이지> 주문배송조회 > 반품/교환신청 또는 고객센터 (070-4680-5689)로 문의 바랍니다.

[반품주소]
- 도로명 : (10882) 경기도 파주시 산남로 62-20 (산남동)
- 지번 : (10882) 경기도 파주시 산남동 305-21

[반품/교환가능 기간]
변심반품의 경우 수령 후 14일 이내, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

[반품/교환비용]
단순 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담

[반품/교환 불가 사유]
- 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
(단지 확인을 위한 포장 훼손은 제외)
- 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
- 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
- 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
- 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
- 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
- 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
* (1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시
‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)

[상품 품절]
공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.

[소비자 피해보상, 환불지연에 따른 배상]
- 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됩니다.
- 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함.

회원로그인

오늘 본 상품

  • 데이터 과학 입문자를 위한 R
    데이터 과학 입문자
    36,000