概要

本論文は、制御バリア関数(CBF)ベースの安全フィルタを使用した制御システムの安定性向上を目的とした新しいポリシー最適化フレームワークを提案しています。CBFベースの安全フィルタは状態制約を強制する体系的な方法を提供しますが、元の安定化制御器の閉ループダイナミクスを大幅に変更する可能性があり、限界サイクル、無限軌道、望ましくない平衡点などの問題が発生する可能性があります。この研究は、線形システムと線形名目制御器に焦点を当て、これらの問題を解決しながら安定性特性を最大限に向上させる方法を開発しました。

ポイント

  • CBFベースの安全フィルタの課題: 状態制約を強制する一方で、望ましくない閉ループダイナミクス(限界サイクル、無限軌道など)を引き起こす可能性がある
  • 統合的パラメータ化: 名目フィードバックゲインと安全フィルタ成分を共同でパラメータ化し、最適化することで性能向上を実現
  • リアプノフベースの安定性条件: 閉ループシステムの安定性を保証するため、リアプノフ安定性条件を滑らかなスカラー制約として符号化
  • 堅牢な安全勾配流: 訓練全体を通じて名目制御器の安定性を維持するため、堅牢な安全勾配流を使用して制約を強制
  • 軌道ベースの目的関数: 閉ループロールアウトから計算された軌道ベースの目的関数を使用した最適化

出典

Safe Policy Optimization via Control Barrier Function-based Safety Filters

この記事はAIが海外情報を要約・翻訳したものです。元記事は出典リンクをご覧ください。