reinforcement learning
-
Deep Q Network (DQN)최신 기술동향/인공지능 (AI) 2020. 10. 4. 10:05
이번 글에서 리뷰할 강화학습 알고리즘은 Deep Q-Network (DQN)이다. DQN은 AI의 최강자인 Google Deepmind에서 개발한 알고리즘으로, 강화학습에 Deep Learning을 적용하는 방식의 뼈대가되는 논문 [1] [2]이다. 많은 시나리오에서 자주 사용되고, 강화학습 알고리즘의 큰 축 중에 하나기 때문에, 이미 많은 리뷰들이 있다. 이 글에서도, 간단하게 리뷰를 하고, 이를 이용한 여러 논문들도 함께 소개해보고자 한다. DQN 알고리즘 Deep Q-Network (DQN)은 이름에서 알 수 있듯이, state-action value Q값을 Deep Learning을 통해서 Approximate하는 방식이다. DQN이 나오기 전에는, state-action에 따른 값들을 모두 Ta..
-
Policy Gradient Algorithm최신 기술동향/인공지능 (AI) 2020. 8. 13. 10:51
대부분의 강화학습 알고리즘 구조는시행을 반복하며, Agent가 받을 Expected Reward를 최대화하는 방식으로 Training이 이루어진다. 대부분의 Model-Free 알고리즘들은 확실한 Model과 Reward를 알지 못하는 상태에서 Environment (환경)과의 상호작용을 하며 Episode를 여러 번 진행하면서, Reward를 받고, 이를 통해 자신의 Policy를 update시켜 나간다. 강화학습에는 크게 Value-Based RL과 Policy-Based RL이 있다. Value-Based RL은 가치함수인 Q-value를 계산하고, 이를 이용해 action을 선택하는 과정을 반복함으로써 Expected Reward를 최대화하는 방향으로 구현하는데, 대표적으로 Q 함수에 Neural..
-
Vehicular Network RL 논문 리뷰(Multi-Agent)5G & 6G 통신 기반 기술/LTE Communication 2020. 7. 25. 11:11
이 논문은 Vehicular Network 상황에서 V2V와 V2I의 Global Network Performance를 최대화하기 위해 Reinforcement Learning을 사용한다. 강화학습을 적용하기 위해서는 '환경(Environment)'를 설계하는 것이 거의 전부라고 해도 과언이 아닐 정도로 환경 설정이 중요한 이슈다. Vehicular Network 환경만 제대로 정리되어 있으면, 그 안에 들어갈 다양한 강화학습 알고리즘들을 워낙 사용하기 쉬운 API들이 많기 때문에 가져다 쓰면 된다. 따라서, 이번 글에서는 어떻게 환경을 설정했는지에 조금 더 초점을 맞춰서 리뷰해보도록 한다. 제목: Spectrum sharing in vehicular networks based on multi-agent..