티스토리 뷰

인공지능

Experience Replay Memory란?

망나니개발자 2020. 2. 9. 22:37

1. Experience Replay Memory란?

[ Experience Replay Memory ]

머신러닝에서 학습 데이터가 아래와 같다고 하자. 전체 데이터의 분포를 보면 a가 정답에 가장 근접한 직선이지만, b근처의 데이터만으로 학습을 진행한다고 하면 b가 정답에 가장 가까운 직선이 된다. 이를 통해 고르게 분포된 데이터를 사용해야 정답에 근접한 직선을 찾을 수 있음을 알 수 있다. 하지만 DL은 data와 label이 존재하기 때문에 random하게 데이터를 추출하여 correlation을 줄일 수 있지만, RL은 환경과 상호작용하는 data가 들어오기 때문에 b처럼 correlated 되는 데이터가 학습될 수 있습니다. 이를 해결하기 위해 거대한 Experience Replay Memory를 만들고 데이터(Experience)를 저장한 후 랜덤하게 뽑아서 학습하였다. 이를 통해 correlated가 적고 고르게 분포된 데이터로 학습이 가능하다.

[ Experience Replay Memory 한장 요약]

참고 자료

https://blog.lgcns.com/1692

저작자표시 비영리 변경금지 (새창열림)

'인공지능' 카테고리의 다른 글

E-Greedy Algorithm(입실론 그리디 알고리즘)이란? (4)	2020.02.10
마르코프 의사결정 모델(MDP)이란? (0)	2020.02.09
Stochastic Gradient Descent(SGD)란? (0)	2020.02.09
Q-Learning이란? (2)	2020.02.09
CNN(Convolutional Neural Network)란? (0)	2020.02.09

공유하기 링크

페이스북
카카오스토리
트위터

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/10 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

글 보관함

MangKyu's Diary