[강화학습] 4. 근사함수와 인공신경망
이 포스트는 '파이썬과 케라스로 배우는 강화학습'이라는 책을 바탕으로 스스로 공부한 내용을 정리한 포스트입니다. 근사함수와 인공신경망 개념에 대해서 다룬다. ※ 몬테카를로, 살사, 큐러닝 개념은 사정상 생략함 근사함수 몬테카를로, 살사, 큐러닝의 한계 이 3가지 개념을 배울 땐, 상태 공간의 크기가 작고 환경이 불변한다는 가정을 가진 간단한 문제들이었다. 그러나 현실의 문제는 이렇게 단순하지 않다. 그래서 요즘 강화학습은 인공신경망을 사용하려는 추세이다. 앞서 다이나믹 프로그래밍의 한계는 다음 3가지였다. 1. 계산 복잡도가 매우 커짐 2. 차원의 저주 3. 환경에 대한 완벽한 정보가 필수 몬테카를로, 살사, 큐러닝 방식은 3번을 해결했지만(model-free), 1번과 2번 문제는 여전히 해결을 못 했..
인공지능/강화학습
2023. 9. 23. 14:37