티스토리 뷰

반응형

1. Deep Learning(딥러닝)이란?


[ Deep Learning ]

Deep Learning은 autonomous, self-teaching system으로 어떤 pattern을 찾기 위한 알고리즘을 학습시키기 위해 존재하는 데이터를 사용한다. 이미지에서 고양이를 찾기 위해 Deep Learning을 사용할 수 있다. 고양이가 있는 이미지와 없는 수백만장의 이미지를 학습 데이터로 사용하다보면 edges, shapes, colors 등과 같은 이미지 데이터를 사용하고 분류하는 패턴을 정립하게 된다. 이러한 패턴들은 학습데이터를 통해 생성한 Model을 기반으로 새로운 이미지를 보고 고양이의 포함여부를 알준다. Deep Learning 알고리즘은 인간의 뇌의 뉴런구조를 흉내난 인공 신경망을 사용한다. 이를 통해 계속된 Cycle을 거쳐 학습을 진행하여 패턴을 좁히고, 각 Cycle마다 예측을 개선합니다. Deep Learning이 잘 적용된 예 중의 하나가 Apple의 Face ID 입니다. 처음에 얼굴을 스캔하면서 학습을 진행합니다. 그리고 Face ID를 통해 로그인을 할 때 마다 우리의 얼굴에 depth map을 만들어 수천 개의 data points를 잡아내는 TrueDepth 카메라가 작동하고, 폰에 내장된 neural engine이 진위 여부를 판단하게 된다.

 

[ Deep Learning 한장 요약]

 

 

2. Reinforcement Learning(강화학습)이란?


[ Reinforcement Learning ]

Reinforcement Learning은 시도와 실패(Trial and Error)를 통해 학습하는 autonomous, self-teaching system이다. 이것은 보상의 극대화에 초점을 두고 행동하며, 최상의 결과를 얻기 위해 학습한다. 이것은 우리가 자전거를 타는 법을 배우는 것과 유사하다. 여러번 시도하고 넘어지며 타는 법을 학습하다가, 자전거를 잘 타게된다. 강화학습 역시 여러 가지의 서로 다른 행동을 취하며 결과에 대한 피드백을 받으며 해당 행위가 최고의 보상을 주는지 학습한다. 그리고 항상 최고의 결과를 내기 전까지 수많은 학습을 통해 알고리즘을 수정하고 변형하며 강화한다. RL을 사용한 좋은 예시가 걷는 방법을 학습하는 로봇이다. 로봇은 먼저 크게 앞 뒤로 걸음을 내딛는다. 하지만 큰 걸음으로 걷지 못하게 되며, 넘어지게 된다. 하지만 이러한 실패라는 결과는 점차 걷는 크기를 줄이게 되는 데이터에 해당하고, 이러한 과정을 반복하면서 점차 걷게된다. 강화학습이 적용된 또 다른 유명 사례 중 하나가 Google의 Deep Mind가 고전적인 Atari 게임에 RL을 적용한 것이다. 목표는 점수를 최대화하기 위한 것이고, 화면 하단에 있는 막대를 움직여 화면 위로 벽돌을 깨기 위해 공을 다시 튀기게한다. 처음에는 많은 실패를 겪지만, 결국에는 최고의 인간 플레이어를 이기게 된다.

 

[ Reinforcement Learning 한장 요약]

3. Deep Learning VS Reinforcement Learning


[ Deep Learning과 Reinforcement Learning의 차이 ]

Deep Learning과 Reinforcement Learning 모두 자동적으로 학습하는 시스템이다. 하지만 Deep Learning은 Traning Set으로부터 학습하고, 진행한 학습을 새로운 데이터에 적용시키는 반면 Reinforcement Learning은 최고의 보상을 위해 계속해서 동적으로 학습하며 행동을 조정한다. Deep Learning과 Reinforcement Learning은 상호 배제적이기보다는 서로 상호작용이 가능하며 우리는 이를 Deep Reinforcement Learning이라고 한다.

 

 

[ Deep Learning과 Reinforcement Learning의 차이 한장 요약 ]

 

 

 

 

 

참고 자료

반응형
댓글
댓글쓰기 폼
반응형
공지사항
Total
1,299,812
Today
214
Yesterday
3,635
TAG
more
«   2021/07   »
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함