단일 에이전트의 보상 최대화를 위한 셀프 어텐션 기반의 액터 크리틱 모델




  • 데모 영상