概要

本論文は、強化学習に基づくパス追従制御器を小型無人航空機(sUAS)に適用する研究を提示しています。ハイパーネットワーク適応を用いてアクチュエータ故障に対するロバスト性を実現し、訓練時に未見の故障モードへの汎化性能を実証しています。現実的な6自由度航空機モデルを用いた高精度シミュレーションにより検証されています。

ポイント

  • ハイパーネットワーク適応: Feature-wise Linear Modulation(FiLM)とLow-Rank Adaptation(LoRA)といったパラメータ効率的な手法を採用し、アクチュエータ故障のパラメータ化に対応
  • 強化学習の活用: Proximal Policy Optimization(PPO)を使用して、標準的なニューラルネットワークよりロバストな制御ポリシーを訓練
  • 汎化性能: 訓練データに含まれなかった時変的なアクチュエータ故障モードに対して、効果的な汎化を実現
  • 実用的検証: 6自由度固定翼航空機モデルを用いた高精度シミュレーションにより、実装可能性を確認
  • 安全性向上: 航空機の信頼性と安全性を向上させ、無人航空機の運用可能性を拡張

出典

Hypernetwork-Conditioned Reinforcement Learning for Robust Control of Fixed-Wing Aircraft under Actuator Failures

この記事はAIが海外情報を要約・翻訳したものです。元記事は出典リンクをご覧ください。