Table of Contents
강화학습
강화학습은 “일단 해보자”라는 마인드로 학습을 해 나가는것이다
비유하자면 지도학습이 배움을 통해서
실력을 키우는 것이라면,
강화학습은 일단 해보면서 경험을 통해서
실력을 키워가는 것입니다.
그 행동의 결과가 자신에게 유리한 것이었다면
상을 받고, 불리한 것이었다면 벌을 받는 것입니다.
이 과정을 매우 많이 반복하면
더 많은 보상을 받을 수 있는 더 좋은 답을
찾아낼 수 있다는 것이 강화학습의 기본 아이디어입니다.
강화학습에서는 더 많은 보상을 받을 수 있는
정책을 만드는 것이 핵심입니다.
즉 게임을 이론적으로 배우지 않고도 잘할 수 있다는 것과 같은것이 강화학습과 비슷하다고 볼 수 있죠