Table of Contents
목차
이번 포스트에선 강화학습의 최종 목표와 기초 개념에 대해서 다뤄보겠다.
INTRO: Supervised Learning VS RL
먼저 세세하게 구분하기전, warm up으로 지도학습과 강화학습의 차이부터 알아보겠다.
먼저 아이가 토끼와 강아지를 분류하는 task를 하고있다고 생각해보자.
이 아이는 현재 토끼와 강아지를 구분할 수 없는 무지의 상태다.
여기서 Supervised Learning VS RL의 방식으로 배우는 방법은 다음과 같다.
- Supervised Learning
지도자(Superviser)가 아이에게 토끼와 강아지의 feature(특징)을 먼저알려주면 아이가 이를 바탕으로 학습(Learning)하는 것이다. - Reinforcement Learning
아이가 아무런 지식과 배경이 주어지지 않은 채로 학습하는 것이다.
즉 사진을 보고 계속 시행착오를 반복하면 아이 스스로 ‘토끼는 귀가 길고 강아지는 짧구나’ 와 같은 feature(특징)을 스스로 파악할 수 있고, 이러한 특징을 발견하며 시행착오(trial and error)를 많이 겪으면 언젠간은 제대로 구별하게 될 수 있는 것이다.
강화학습
그렇다면 기계학습(machine Learning)의 분류 정의를 통해 강화학습이 어느 범위에 속해있는지 파악해보겠다.