R 통계 프로그래밍 입문 : 북윈도
리뷰 0 위시 120

R 통계 프로그래밍 입문 요약정보 및 구매

기초 통계부터 데이터 분석 실용 예제까지

상품 선택옵션 0 개, 추가옵션 0 개

출판사 에이콘출판
저자 프라반잔 나라야나차르 타따르
ISBN 9788960776272 (8960776270)
정가 30,000원
판매가 27,000원(10% 할인)
배송비 무료배송
포인트 정책 설명문 닫기

00포인트

포인트 정책 설명문 출력

선택된 옵션

관심상품

상품 정보

사은품
상품 기본설명
기초 통계부터 데이터 분석 실용 예제까지
상품 상세설명


[R 통계 프로그래밍 입문]은 R을 설치하는 방법부터 알려 주고, 처음 접하는 사용자도 쉽게 따라올 수 있도록 R 사용에 필요한 기초적인 사항을 소개한다. 이어서 데이터 가져오기/내보내기, 데이터 시각화, 직관적 데이터 분석, 통계적 가설 검정, 회귀분석, CART 등의 주제에 대해 관련 패키지를 설명하면서 예제를 중심으로 다룬다.

목차
1장. 데이터 형식
__설문조사의 구성요소
____R 환경에서의 데이터 특성
__컴퓨터 과학의 불확실성 체험
__R 설치
____R 패키지
____RSADBE - 이 책에서 사용하는 R 패키지
____이산분포
____이산 일항 분포
____이항 분포
____초기하 분포
____음이항 분포
____포아송 분포
__연속분포
____일항분포
____지수분포
____정규분포
__요약

2장. 데이터 가져오기와 내보내기
__데이터 프레임과 기타 형식
____상수, 벡터, 행렬
____리스트 객체
____데이터 프레임
____테이블 객체
__read.csv, read.xls, 외부 패키지
____MySQL로부터 데이터 가져오기
__데이터와 그래프 내보내기
____R 객체 내보내기
____그래프 내보내기
__R 세션 관리
__요약

3장. 데이터 시각화
__범주형 데이터의 시각화 기술
____막대 차트
______R에 내장된 예시 살펴보기
____점 차트
____스파인과 모자이크 그래프
____파이 차트와 4겹 그래프
__연속형 데이터를 위한 시각화 기법
____상자 그래프
____히스토그램
____산점도
____파레토 차트
__ggplot2 소개
__요약

4장. 탐색적 분석
__기본적인 통계량
____백분위수, 변위수, 중위수
____경첩
____사분위수 범위
____줄기/잎 그래프
__문자 값
__데이터 조정
__Bagplot - 상자 그래프의 이변수 버전
__저항성 직선
__데이터 스무딩
__중위수 분해
__요약

5장. 통계적 추론
__최우추정치__
____우도 함수 시각화
____최우추정
____fitdistr 함수
__신뢰구간
__가설검정
____이항 검정
____모비율 검정과 카이제곱 검정
____정규분포 검정 - 표본이 하나인 경우
____정규분포 검정 - 표본이 둘인 경우
__요약

6장. 선형 회귀 분석
__단순회귀모형
____모수를 임의로 선택하면 어떻게 될까?
____단순회귀모형의 수립
____분산분석과 신뢰구간
____모형의 정당성
__중회귀모형
____k개의 단순회귀모형 평균과 중회귀모형
____중회귀모형의 수립
____중회귀모형의 분산분석과 신뢰구간
____잔차 그래프
__회귀 진단
____지렛점
____영향점
____DFFITS와 DFBETAS
__다중공선성 문제
__모형의 선택
____단계적 절차
______후진제거법
______전진선택법
____기준을 사용하는 방법
__요약

7장. 로지스틱 회귀모형
__이진회귀 문제
__프로빗 회귀모형
__로지스틱 회귀모형
____Hosmer-Lemeshow 적합도 검정 통계량
__모형 검증과 진단
______GLM을 위한 잔차 그래프
____GLM의 영향점과 지렛점
__수신자 조작 곡선
__독일 신용 심사 데이터 세트의 로지스틱 회귀
__요약

8장. 회귀모형의 정규화
__과적합 문제
__스플라인 회귀
____기저 함수
____구간별 선형회귀모형
____3차 스플라인과 일반적인 B-스플라인
____능형 선형회귀모형
__로지스틱 회귀모형을 위한 능형 회귀
__모형 평가
__요약

9장. 분류나무와 회귀나무
__재귀분할
____데이터 분리
____첫 번째 나무
__회귀나무 만들기
__분류나무 만들기
__독일 신용 데이터를 위한 분류나무
__가지치기와 기타 세부 사항
__요약

10장. CART의 확장
__CART의 개선
__배깅
____부트스트랩
____배깅 알고리즘
__랜덤 포레스트
__종합 정리
__요약
출판사 서평
★ 요약 ★이 책은 R을 설치하는 방법부터 알려 주고, 처음 접하는 사용자도 쉽게 따라올 수 있도록 R 사용에 필요한 기초적인 사항을 소개하고, 이어서 데이터 가져오기/내보내기, 데이터 시각화, 직관적 데이터 분석, 통계적 가설 검정, 회귀분석, CART 등의 주제에 대해 관련 패키지를 설명하면서 예제를 중심으로 다룬다. 책과 함께 제공되는 R 코드는 다양한 분야에서 통계 분석 작업에 적용할 수 있다.★ 이 책에서 다루는 내용 ★- 변수의 특성을 감안한 효율적인 데이터 시각화
- 효율적인 추론으로 이어지는 탐색적 데이터 분석
- 고전적인 추론과 현대적인 계산에 의한 시뮬레이션을 바탕으로 한 통계 추론
- 현대 통계학의 바탕이 되는 선형 회귀모형과 로지스틱 회귀모형 탐구
- 비선형적인 데이터에 유용한 기계학습 도구 CART★ 이 책의 대상 독자 ★이 책은 자신의 전문 분야에서 통계 프로그램을 사용해야 하는 재능 있는 독자를 대상으로 한다. 또 처음 7개 장은 통계학과 석사 과정 학생에게 유용하고, 관심이 있다면 이 책의 나머지 부분에서 CART를 쉽게 배울 수 있을 것이다.★ 이 책의 구성 ★1장부터 5장에서는 R 소프트웨어와 통계학의 기초를 다룬다. 6장에서 10장에 걸쳐 실용적이고 현대적인 회귀모형을 자세히 설명한다.
부록인 참고문헌에서는 이 책에서 참조하는 책의 이름을 나열한다.1장, ‘데이터 형식’에서는 설문조사와 데이터 세트를 이용해 여러 데이터 형식을 소개한다. 재미있는 상황을 가정하고 통계 모형의 필요성을 제시한다. 그 다음 R과 관련 패키지의 설치를 간단히 설명한다. R 프로그램을 바탕으로 이산/연속 확률변수를 다룬다.2장, ‘데이터 가져오기와 내보내기’에서는 R을 이용한 간단한 기초 개발 수준에서 시작한다. 간단한 예제를 바탕으로 데이터 프레임, 벡터, 행렬, 리스트를 다룬다. 다음으로 csv나 xls와 같은 외부 파일 읽어오기와 그 밖의 소프트웨어로 데이터와 객체를 내보내는 방법을 배우고 나서 R 세션 관리로 마무리한다. 3장,’ ‘데이터 시각화’에서는 범주형과 수치형 데이터 세트를 위한 효율적인 그래프 그리기를 다룬다. 여기에 해당되는 것은 막대 차트, 점 차트, 스파인 그래프와 모자이크 그래프, 범주형 데이터를 위한 4겹 그래프, 연속/수치형 데이터를 위한 히스토그램, 상자 그래프, 산점도다. ggplot2도 간단히 소개한다.4장, ‘탐색적 분석’에는 사전 분석을 위한 직관적인 기술이 들어 있다. 줄기/잎 그래프, 문자 값 등의 EDA 시각화 기술과 저항성 직선, 데이터 스무딩, 중위수 분해의 모형화는 사전 분석 단계에서 통찰력을 준다.5장, 통계적 가설검증을 우도함수와 최우도 추정으로 시작한다. 문제를 구체적으로 해결하려고 정의한 함수를 사용해서 모수의 신뢰구간을 설명한다. 이 장에서는 평균값 비교를 위한 Z-테스트, t-테스트와 분산 비교를 위한 카이제곱 테스트, F-테스트 같은 중요한 통계적 검정도 다룬다.6장, ‘선형 회귀 분석’에서는 설명 변수와 결과 변수 사이의 선형 관계를 수립한다. 선형 회귀 모형은 많은 가정을 하고 있는데, 검증 기술로 그런 세부 사항을 확인한다. 하나의 관측, 결과 값, 또는 설명변수가 모형이 영향을 끼친다. 통계적 척도가 깊이 있게 논의되는데 이것이 몇 가지 변칙성을 제거할 수 있게 한다. 다수의 설명변수가 주어지면, 모형 선택 기법으로 효율적인 모형을 개발할 수 있다.7장, ‘로지스틱 회귀모형’은 결과 값이 이진형일 때 유용한 모형이다. 잔차에 의한 진단과 모형 검증은 모형 개선으로 이어진다. 더 좋은 분류 모형을 찾는 데 도움이 되는 ROC 곡선을 알아본다.8장, ‘회귀모형의 정규화’에서는 앞의 두 장에서 발전시킨 모형의 과적합 문제를 다룬다. 능형 회귀는 과적합의 가능성을 상당히 줄여주고 스플라인 모형은 다음 장에 나오는 모형의 기초가 된다.9장, ‘분류나무와 회귀나무’에서는 나무에 기반한 회귀모형을 다룬다. 나무는 일단 R 함수를 사용해서 만들고 그 다음 CART를 잘 이해할 수 있게 직접 최종적인 나무를 생성한다.10장, ‘CART의 확장’에서는 bagging과 랜덤 포레스트를 이용한 CART의 두 가지 개선을 다룬다. 6장부터 10장까지의 모든 모형을 데이터 세트에 적용하며 종합 정리한다.★ 저자 서문 ★오픈소스 소프트웨어인 R은 기계학습, 데이터마이닝 등 과학 분야에서 그렇지만 통계 분야에서도 인기를 얻어가고 있다. 현대 수학 이론과 통계에 응용하는 수준은 놀랄만한데, R은 그러는 중에 중요한 역할을 한다. 이 책은 통계학을 조금이라도 아는 독자들에게 R을 이용한 통계적 모델링을 조심스럽게 소개하려는 책이다. 배경이 저마다 다른 동료들과의 경험을 바탕으로 생각해 보면, 많은 사람이 이 책에 담긴 것과 같은 내용을 배워서 자신의 업무 영역에서 불확실한 정보를 분석하기를 원했다. 10여 년 전이었다면 동료들은 괜찮은 참고서적 정도로 만족했을 것이지만 이제는 그렇지 않다. 거의 모든 분야에서 컴퓨터로 업무를 처리하고 있고 자연히 스프레드시트나 데이터베이스 그리고 어떤 때는 텍스트 형식의 데이터를 다루게 됐다. 적당한 통계적 모형을 물어볼 때마다 항상 “그럼 소프트웨어는?”이라는 질문이 따라붙었다. 그럴 때마다 나의 대답은 항상 R이었다. 왜냐면 R이 아주 단순하고, 지난 7년간 내가 R과 함께했기 때문이다. 이 책의 여러 장에 걸쳐 나의 이런 경험을 자세히 담았다. 통계 모델링을 하는 동료들과 의견을 주고받다 보니 어느 부분을 배울 때 어려워하는지 알 수 있었다. 초보자에게는 익숙한 기본 데이터 개념을 소개하는 게 난해함을 줄이려는 첫 번째 시도다. 세부적인 면으로 들어가면 저마다 다르겠지만, 독자가 오랫동안 경험해온 전문 분야를 소개함으로 강한 동기유발을 할 수 있을 것이라고 나는 굳게 믿는다. 대부분의 통계 소프트웨어와 마찬가지로 R에는 최근의 통계 방법론을 포함하는 모듈과 패키지가 있다. 처음 다섯 장은 기본적인 개념과 R의 기초, 데이터 시각화, 탐색적 데이터 분석, 통계적 가설검증에 초점을 맞춘다. 흥미로운 예제를 바탕으로 기본개념을 그려볼 텐데, 이 기본개념은 그 뒤에 나오는 다섯 장의 바탕이 된다. 선형과 로지스틱 회귀모형 등은 응용 측면에서 관심을 끌고 있다. 이론을 설파하는 게 일반적이라면, 방법론은 다양한 분야에 쉽게 적용할 수 있는 것이다. 마지막 두 장은 브라이먼(Breiman) 학파의 영향을 받은 것으로 여기에서는 CART(Classification and Regression Trees)를 자세히 논하고 실제 데이터세트에 이를 적용한다.★ 옮긴이의 말 ★언제인지 기억나지는 않지만 R에 대한 첫 인상은 뭔가 생소하다는 것이었다. 설령 불편한 점이 일부 있더라도, 나름의 프로그래밍 철학을 고집하는 대다수 언어들에 비해, R은 결과를 쉽게 얻는 데만 집중하는 언어로 보여서였을 수도 있다. 어쩌면 R을 프로그래밍 언어로 생각하는 일부터가 잘못이었는지도 모른다.R이 통계 분석을 위한 최적의 도구인지에 답하기는 쉽지 않다. 원론적으로 말하자면 각자 처한 환경에 맞는 도구를 선택해야 하기 때문이기도 하고, SAS나 SPSS와 같은 유명한 통계 소프트웨어나 최근 데이터 분석 분야에서 인기를 얻고 있는 파이썬 등 선택의 여지가 많기 때문이기도 하다. 그럼에도 불구하고 통계와 관련된 작업을 할 때 항상 최우선으로 R을 고려하는 이유로는 R의 특정한 기능보다 R 사용자 커뮤니티의 존재를 꼽을 수 있다. 프로그래밍 언어답지 않음으로 인해 개발자가 아닌 사람도 R 언어에 쉽게 접근할 수 있어서 R 관련 모임에는 다양한 배경을 지닌 사람들이 모여 R 사용환경을 윤택하게 만들고 있다.대다수의 R 입문서가 기초부터 시작해서 문법을 중심으로 진도를 나가는 데 반해, 이 책에서는 데이터 특성과 기초 통계를 설명한 후 바로 실용적인 예제를 제시한다. 즉, R의 문법을 자세히 배우기는 힘들 수 있지만 이미 많은 사람에 의해 개발된 패키지를 사용해서 바로 실무에 활용 가능한 내용을 짧은 시간에 익힐 수 있다. 이렇게 당장 사용할 수 있는 기술로는, 데이터 가져오기와 내보내기, 시각화, 통계적 가설 검정, 회귀분석, CART 등이 있다.다른 프로그래밍 언어도 그렇지만 R을 배울 때도 예제를 중심으로 익히는 것이 좋은 방법이 될 수 있다는 것을 강조하고 싶었다. 전통적인 학습 방법은 아닐 수 있지만 처음부터 끝까지 모든 것을 이해해야겠다는 생각만 하지 않는다면 코드와 실행 결과를 보면서 R로 할 수 있는 일을 쉽게 알 수 있고, 특히 그다지 많은 일을 하지 않고도 목표를 달성할 수 있음도 알게 될 것이다. R은 아직도 계속적으로 확장되는 중으로 독자들이 이 책을 통해 접하게 될 R의 강력한 기능뿐 아니라 앞으로의 발전 가능성도 발견하게 되길 바란다.
상품 정보 고시
도서명 R 통계 프로그래밍 입문
저자 프라반잔 나라야나차르 타따르
출판사 에이콘출판
ISBN 9788960776272 (8960776270)
쪽수 356
출간일 2014-10-31
사이즈 188 * 235 * 30 mm /905g
목차 또는 책소개 1장. 데이터 형식
__설문조사의 구성요소
____R 환경에서의 데이터 특성
__컴퓨터 과학의 불확실성 체험
__R 설치
____R 패키지
____RSADBE - 이 책에서 사용하는 R 패키지
____이산분포
____이산 일항 분포
____이항 분포
____초기하 분포
____음이항 분포
____포아송 분포
__연속분포
____일항분포
____지수분포
____정규분포
__요약

2장. 데이터 가져오기와 내보내기
__데이터 프레임과 기타 형식
____상수, 벡터, 행렬
____리스트 객체
____데이터 프레임
____테이블 객체
__read.csv, read.xls, 외부 패키지
____MySQL로부터 데이터 가져오기
__데이터와 그래프 내보내기
____R 객체 내보내기
____그래프 내보내기
__R 세션 관리
__요약

3장. 데이터 시각화
__범주형 데이터의 시각화 기술
____막대 차트
______R에 내장된 예시 살펴보기
____점 차트
____스파인과 모자이크 그래프
____파이 차트와 4겹 그래프
__연속형 데이터를 위한 시각화 기법
____상자 그래프
____히스토그램
____산점도
____파레토 차트
__ggplot2 소개
__요약

4장. 탐색적 분석
__기본적인 통계량
____백분위수, 변위수, 중위수
____경첩
____사분위수 범위
____줄기/잎 그래프
__문자 값
__데이터 조정
__Bagplot - 상자 그래프의 이변수 버전
__저항성 직선
__데이터 스무딩
__중위수 분해
__요약

5장. 통계적 추론
__최우추정치__
____우도 함수 시각화
____최우추정
____fitdistr 함수
__신뢰구간
__가설검정
____이항 검정
____모비율 검정과 카이제곱 검정
____정규분포 검정 - 표본이 하나인 경우
____정규분포 검정 - 표본이 둘인 경우
__요약

6장. 선형 회귀 분석
__단순회귀모형
____모수를 임의로 선택하면 어떻게 될까?
____단순회귀모형의 수립
____분산분석과 신뢰구간
____모형의 정당성
__중회귀모형
____k개의 단순회귀모형 평균과 중회귀모형
____중회귀모형의 수립
____중회귀모형의 분산분석과 신뢰구간
____잔차 그래프
__회귀 진단
____지렛점
____영향점
____DFFITS와 DFBETAS
__다중공선성 문제
__모형의 선택
____단계적 절차
______후진제거법
______전진선택법
____기준을 사용하는 방법
__요약

7장. 로지스틱 회귀모형
__이진회귀 문제
__프로빗 회귀모형
__로지스틱 회귀모형
____Hosmer-Lemeshow 적합도 검정 통계량
__모형 검증과 진단
______GLM을 위한 잔차 그래프
____GLM의 영향점과 지렛점
__수신자 조작 곡선
__독일 신용 심사 데이터 세트의 로지스틱 회귀
__요약

8장. 회귀모형의 정규화
__과적합 문제
__스플라인 회귀
____기저 함수
____구간별 선형회귀모형
____3차 스플라인과 일반적인 B-스플라인
____능형 선형회귀모형
__로지스틱 회귀모형을 위한 능형 회귀
__모형 평가
__요약

9장. 분류나무와 회귀나무
__재귀분할
____데이터 분리
____첫 번째 나무
__회귀나무 만들기
__분류나무 만들기
__독일 신용 데이터를 위한 분류나무
__가지치기와 기타 세부 사항
__요약

10장. CART의 확장
__CART의 개선
__배깅
____부트스트랩
____배깅 알고리즘
__랜덤 포레스트
__종합 정리
__요약
상품 정보 고시
도서명 상품페이지 참고
저자 상품페이지 참고
출판사 상품페이지 참고
크기 상품페이지 참고
쪽수 상품페이지 참고
제품구성 상품페이지 참고
출간일 상품페이지 참고
목차 또는 책소개 상품페이지 참고
배송공지

사용후기

회원리뷰 총 0개

사용후기가 없습니다.

상품문의

등록된 상품문의

상품문의 총 0개

상품문의가 없습니다.

교환/반품

[반품/교환방법]
마이페이지> 주문배송조회 > 반품/교환신청 또는 고객센터 (070-4680-5689)로 문의 바랍니다.

[반품주소]
- 도로명 : (10882) 경기도 파주시 산남로 62-20 (산남동)
- 지번 : (10882) 경기도 파주시 산남동 305-21

[반품/교환가능 기간]
변심반품의 경우 수령 후 14일 이내, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내

[반품/교환비용]
단순 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담

[반품/교환 불가 사유]
- 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
(단지 확인을 위한 포장 훼손은 제외)
- 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
- 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
- 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
- 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
- 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
- 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
* (1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시
‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)

[상품 품절]
공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.

[소비자 피해보상, 환불지연에 따른 배상]
- 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됩니다.
- 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함.

회원로그인

오늘 본 상품

  • R 통계 프로그래밍 입문
    R 통계 프로그래밍
    27,000