アクチュエータ故障時の固定翼航空機制御のためのハイパーネットワーク強化学習

概要

本論文は、強化学習に基づくパス追従制御器を小型無人航空機（sUAS）に適用する研究を提示しています。ハイパーネットワーク適応を用いてアクチュエータ故障に対するロバスト性を実現し、訓練時に未見の故障モードへの汎化性能を実証しています。現実的な6自由度航空機モデルを用いた高精度シミュレーションにより検証されています。

ポイント

ハイパーネットワーク適応: Feature-wise Linear Modulation（FiLM）とLow-Rank Adaptation（LoRA）といったパラメータ効率的な手法を採用し、アクチュエータ故障のパラメータ化に対応
強化学習の活用: Proximal Policy Optimization（PPO）を使用して、標準的なニューラルネットワークよりロバストな制御ポリシーを訓練
汎化性能: 訓練データに含まれなかった時変的なアクチュエータ故障モードに対して、効果的な汎化を実現
実用的検証: 6自由度固定翼航空機モデルを用いた高精度シミュレーションにより、実装可能性を確認
安全性向上: 航空機の信頼性と安全性を向上させ、無人航空機の運用可能性を拡張

出典

Hypernetwork-Conditioned Reinforcement Learning for Robust Control of Fixed-Wing Aircraft under Actuator Failures

この記事はAIが海外情報を要約・翻訳したものです。元記事は出典リンクをご覧ください。

アクチュエータ故障時の固定翼航空機制御のためのハイパーネットワーク強化学習

概要

ポイント

出典

関連記事