雑多な技術系メモ

自分用のメモ。内容は保証しません。よろしくお願いします。

A Comprehensive Survey of Multi-Agent Reinforcement Leraningの概要

A Comprehensive Survey of Multi-Agent Reinforcement Leraningの概要の日本語訳

概要

マルチエージェントシステムは、 ロボティックス、分散制御、通信、経済などの 様々な応用分野に応用可能であると考えられている。

それらの応用分野の複雑さは、 予めエージェントの振る舞いをプログラムすることを 困難にしている。

代わりに、エージェントは「学習」することで、解決策を見つける必要がある。

マルチエージェント学習の研究において重要なことは、 強化学習の技術、つまりマルチエージェント強化学習に着目することである。

この論文はマルチエージェント強化学習についての総合的なサーベイ論文である。

マルチエージェント強化学習の中心的な問題は、学習の目標を定義することである。

別の言い方をすると、問題によって、それぜれ異なる目標を提示することである。それらの目標を大きく分けると2つ区別できる。

1つめはエージェントの学習力学の安定性、 2つめは他のエージェントの振る舞いの変化への適応である。

この論文で述べられているマルチエージェント強化学習アルゴリズムは、明示的にまたは暗黙的に、その二つの内の一つ、もしくは両方をゴールとして設定している。

この論文ではマルチエージェント強化学習の代表的なアルゴリズムについて述べ、各カテゴリの特徴的な問題点についても取り上げる。

加えて、MARLが応用可能な分野と、さらに恩恵と課題についても述べる。

最後にこの分野の展望について述べる