상품 정보
상품 기본설명
유니티 머신러닝 에이전트를 이용한 딥러닝 강화학습
상품 상세설명
연구자와 개발자는 유니티 머신러닝 에이전트와 유니티 에디터를 사용해 게임과 시뮬레이션을 만들 수 있다. 간편하게 사용할 수 있는 파이썬 API와 유니티 에디터를 연동해 지능형 에이전트를 머신러닝 기법으로 훈련할 수 있는 환경을 형성할 수 있다.
이 책에서는 강화학습 및 Q학습의 기본기를 다지고, 여러 에이전트가 활동하는 생태계를 구성하고 서로 협력하거나 경쟁하는 심층 재귀형 Q 신경망을 장착한 에이전트들을 작성하는 과정을 알려 준다. 강화학습의 기본기를 다지는 일부터 문제를 푸는 데 응용하는 방법, 나아가 파이썬과 케라스 및 텐서플로를 사용해 스스로 학습하는 고급 신경망을 구축하는 방법도 설명한다. 이를 바탕으로 A3C 학습, 모방 학습 및 커리큘럼 학습 모델을 사용해 신경망을 훈련하는 혁신적인 방법을 배우게 된다.
이 책을 다 익히고 나면 여러분은 여러 에이전트들이 서로 협력하고 경쟁하는 생태계를 구축하는 식으로 더 복잡한 환경을 구성하는 방법을 알 수 있을 것이다.
목차
▣ 01장: 머신러닝 및 ML-Agents 소개
머신러닝
__훈련 모델
__머신러닝 예제
__게임에 사용되는 머신러닝
ML-Agents
예제 실행
__에이전트 브레인 설정
환경 만들기
__스크립트 이름 바꾸기
Academy, Agent, Brain 컴포넌트
__Academy 설정
__Agent 설정
__Brain 설정
연습문제
요약
▣ 02장: 밴딧과 강화학습
강화학습
__에이전트 구성
상황별 밴딧과 상태
__상황별 밴딧 만들기
__ContextualDecision 스크립트 만들기
__에이전트 업데이트
탐색과 이용
__SimpleDecision을 사용한 의사결정
MDP와 벨만 방정식
Q 학습 및 연결 에이전트
__Q 학습 ConnectedDecision 스크립트 살펴보기
연습문제
요약
▣ 03장: 파이썬을 이용한 심층강화학습
파이썬과 관련 도구 설치
__설치
__설치 테스트
ML-Agent 외부 브레인
__환경 실행
신경망 기초
__어쨌든 신경망이 하는 일은 무엇인가?
심층 Q 학습
__심층 신경망 구축
__모델 훈련
__텐서 탐색
근위 정책 최적화
__PPO 구현
__텐서보드를 사용한 훈련 통계 이해
연습문제
요약
▣ 04장: 더 깊은 딥러닝 속으로
에이전트 훈련 문제
__훈련이 잘못되었을 때
합성곱 신경망
경험 재연
__경험을 바탕으로 빌드하기
부분 관측성, 메모리, 순환 신경망
__부분 관측성
__기억과 순환 신경망
비동기 연기자-비평가 훈련
__다중 비동기 에이전트 훈련
연습문제
요약
▣ 05장: 게임하기
다중 에이전트 환경
적대적 자체 플레이
__내부 브레인 사용
__훈련된 브레인을 내부적으로 사용하기
결정 및 주문형 결정
__통통 튀는 바나나
모방 학습
__복제 행동 훈련기 설정
커리큘럼 학습
연습문제
요약
▣ 06장: 다시 만들어 보는 테라리엄 - 다중 에이전트 생태계
테라리엄이란?
__에이전트 생태계 구축
__유니티 애셋 가져오기
__환경 구축
기본 테라리엄: 식물과 초식 동물
__구조를 기다리는 초식 동물
__초식 동물 구축
__초식 동물 훈련
육식 동물: 사냥꾼
__육식 동물 구축
__육식 동물 훈련
다음 단계들
연습문제
요약
출판사 서평
★ 이 책에서 배우는 내용 ★
◎ 게임용 강화학습 및 심층강화학습 모델을 개발한다.
◎ 강화학습 및 신경망과 관련된 복잡하고 발전된 개념을 이해한다.
◎ 에이전트가 협력하거나 경쟁할 수 있게 개발하는 데 필요한 다양한 훈련 전략을 탐색한다.
◎ Q학습에 사용할 아카데미, 에이전트 및 브레인의 기본 스크립트 컴포넌트를 적용한다.
◎ 탐욕적 엡실론 탐색과 같은 발전된 학습 전략을 사용해 Q 학습 모델을 개선한다.
◎ 케라스로 간단한 신경망을 구현한 다음, 그것을 유니티로 가져와 외부 두뇌로 사용한다.
◎ 기존 DQN(심층 Q 신경망)에 LSTM 블록을 보태는 방법을 이해한다.
◎ 여러 비동기 에이전트를 빌드한 다음에 훈련 시나리오에 맞춰 실행한다.★ 주요 특징 ★
◎ 유니티로 만든 게임에서 머신러닝 개념을 적용하는 방법을 배울 수 있다.
◎ 강화학습 및 Q 학습의 기본 사항을 배워 게임에 적용할 수 있다.
◎ 여러 비동기 에이전트를 작성해 훈련 계획에 따라 그것들을 실행하는 방법을 배울 수 있다.★ 대상 독자 ★
◎ 이 책은 머신러닝 알고리즘과 유니티를 연동해 더 나은 게임과 시뮬레이션을 개발하는 데 관심이 있는 개발자에게 필요한 책이다.
상품 정보 고시
도서명 |
따라 하면서 배우는 유니티 ML-Agents |
저자 |
마이클 랜햄 |
출판사 |
위키북스 |
ISBN |
9791158391256 (1158391250) |
쪽수 |
236 |
출간일 |
2018-11-22 |
사이즈 |
175 * 235 * 14 mm |
목차 또는 책소개 |
▣ 01장: 머신러닝 및 ML-Agents 소개 머신러닝 __훈련 모델 __머신러닝 예제 __게임에 사용되는 머신러닝 ML-Agents 예제 실행 __에이전트 브레인 설정 환경 만들기 __스크립트 이름 바꾸기 Academy, Agent, Brain 컴포넌트 __Academy 설정 __Agent 설정 __Brain 설정 연습문제 요약
▣ 02장: 밴딧과 강화학습 강화학습 __에이전트 구성 상황별 밴딧과 상태 __상황별 밴딧 만들기 __ContextualDecision 스크립트 만들기 __에이전트 업데이트 탐색과 이용 __SimpleDecision을 사용한 의사결정 MDP와 벨만 방정식 Q 학습 및 연결 에이전트 __Q 학습 ConnectedDecision 스크립트 살펴보기 연습문제 요약
▣ 03장: 파이썬을 이용한 심층강화학습 파이썬과 관련 도구 설치 __설치 __설치 테스트 ML-Agent 외부 브레인 __환경 실행 신경망 기초 __어쨌든 신경망이 하는 일은 무엇인가? 심층 Q 학습 __심층 신경망 구축 __모델 훈련 __텐서 탐색 근위 정책 최적화 __PPO 구현 __텐서보드를 사용한 훈련 통계 이해 연습문제 요약
▣ 04장: 더 깊은 딥러닝 속으로 에이전트 훈련 문제 __훈련이 잘못되었을 때 합성곱 신경망 경험 재연 __경험을 바탕으로 빌드하기 부분 관측성, 메모리, 순환 신경망 __부분 관측성 __기억과 순환 신경망 비동기 연기자-비평가 훈련 __다중 비동기 에이전트 훈련 연습문제 요약
▣ 05장: 게임하기 다중 에이전트 환경 적대적 자체 플레이 __내부 브레인 사용 __훈련된 브레인을 내부적으로 사용하기 결정 및 주문형 결정 __통통 튀는 바나나 모방 학습 __복제 행동 훈련기 설정 커리큘럼 학습 연습문제 요약
▣ 06장: 다시 만들어 보는 테라리엄 - 다중 에이전트 생태계 테라리엄이란? __에이전트 생태계 구축 __유니티 애셋 가져오기 __환경 구축 기본 테라리엄: 식물과 초식 동물 __구조를 기다리는 초식 동물 __초식 동물 구축 __초식 동물 훈련 육식 동물: 사냥꾼 __육식 동물 구축 __육식 동물 훈련 다음 단계들 연습문제 요약 |
교환/반품
[반품/교환방법]
마이페이지> 주문배송조회 > 반품/교환신청 또는 고객센터 (070-4680-5689)로 문의 바랍니다.
[반품주소]
- 도로명 : (10882) 경기도 파주시 산남로 62-20 (산남동)
- 지번 : (10882) 경기도 파주시 산남동 305-21
[반품/교환가능 기간]
변심반품의 경우 수령 후 14일 이내, 상품의 결함 및 계약내용과 다를 경우 문제점 발견 후 30일 이내
[반품/교환비용]
단순 변심 혹은 구매착오로 인한 반품/교환은 반송료 고객 부담
[반품/교환 불가 사유]
- 소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
(단지 확인을 위한 포장 훼손은 제외)
- 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우
예) 화장품, 식품, 가전제품(악세서리 포함) 등
- 복제가 가능한 상품 등의 포장을 훼손한 경우
예) 음반/DVD/비디오, 소프트웨어, 만화책, 잡지, 영상 화보집
- 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 ((1)해외주문도서)
- 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
- 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
- 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
* (1) 해외주문도서 : 이용자의 요청에 의한 개인주문상품으로 단순변심 및 착오로 인한 취소/교환/반품 시
‘해외주문 반품/취소 수수료’ 고객 부담 (해외주문 반품/취소 수수료 : ①양서-판매정가의 12%, ②일서-판매정가의 7%를 적용)
[상품 품절]
공급사(출판사) 재고 사정에 의해 품절/지연될 수 있으며, 품절 시 관련 사항에 대해서는 이메일과 문자로 안내드리겠습니다.
[소비자 피해보상, 환불지연에 따른 배상]
- 상품의 불량에 의한 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결 기준 (공정거래위원회 고시)에 준하여 처리됩니다.
- 대금 환불 및 환불지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리함.