研究の概要

風力発電ファームの発電量を最大化するウェイクステアリング制御において、純粋な強化学習(RL)には訓練の不安定性という課題がある一方、モデル予測制御(MPC)は精度の高い数学モデルを必要とする。本研究は、これら2つのアプローチを階層的に組み合わせた「RL-MPC」フレームワークを提案し、3基の風車からなるシステムで検証した。

具体的には、RLエージェントがMPCコントローラーに補正的状態推定値を提供する役割を担い、MPCが実際の制御決定を行う二層構造となっている。これにより、RLの柔軟な適応能力とMPCの安定した制御性能を両立させることに成功した。

主な発見・成果

  • 3基の風車システムで、ベースライン制御比23%の発電量増加を達成
  • 完全な状態情報を持つ理想的なMPCを超える性能を実現(不完全情報でも高性能)
  • 直接RLコントロールと比較して制御アクションの安定性が向上
  • 訓練安全性も純粋RL方式より高い特性を示す

実務への応用

ベースライン比23%という発電量増加は、既設風力ファームの収益性を大幅に改善する可能性を持つ。特に「正確な物理モデルが存在しない」または「既設ファームのレトロフィット」のケースで、RLの自己適応能力が有効である。一方でMPCの安定した制御特性を維持することで、電力系統へのグリッド注入の予測可能性も確保される。再生可能エネルギー事業者が制御システムのアップグレードを検討する際の重要な技術選択肢となる。