概要
本論文は、強化学習に基づくパス追従制御器を小型無人航空機(sUAS)に適用する研究を提示しています。ハイパーネットワーク適応を用いてアクチュエータ故障に対するロバスト性を実現し、訓練時に未見の故障モードへの汎化性能を実証しています。現実的な6自由度航空機モデルを用いた高精度シミュレーションにより検証されています。
ポイント
- ハイパーネットワーク適応: Feature-wise Linear Modulation(FiLM)とLow-Rank Adaptation(LoRA)といったパラメータ効率的な手法を採用し、アクチュエータ故障のパラメータ化に対応
- 強化学習の活用: Proximal Policy Optimization(PPO)を使用して、標準的なニューラルネットワークよりロバストな制御ポリシーを訓練
- 汎化性能: 訓練データに含まれなかった時変的なアクチュエータ故障モードに対して、効果的な汎化を実現
- 実用的検証: 6自由度固定翼航空機モデルを用いた高精度シミュレーションにより、実装可能性を確認
- 安全性向上: 航空機の信頼性と安全性を向上させ、無人航空機の運用可能性を拡張
出典
この記事はAIが海外情報を要約・翻訳したものです。元記事は出典リンクをご覧ください。