카트폴 예제에서 DQN과 가상환경 기반의 DQN
설명
단일환경의 DQN 모델과 가상환경 기반의 DQN 모델이 카트폴게임을 학습하는 영상이다
왼쪽이DQN 모델 오른쪽이 가상환경 기반의 DQN 모델 학습 영상이다.
특징
dqn 모델학습시간: 약 20분
가상환경 기반의 dqn 모델학습시간: 약 12분
데모 영상