研究の概要

生成AI(大規模言語モデルの学習・推論)の急速な普及により、データセンターの電力需要が前例のない速度で増大している。しかし実際のAIワークロードの電力消費データは企業秘密として非公開であることが多く、様々な時間解像度で断片的にしか報告されていないため、グリッド接続インフラ・オンサイト発電・マイクログリッドの計画立案が困難な状況にある。

本論文は、National Laboratory of the Rockiesの高性能計算施設(NVIDIA H100 GPU搭載)において、AIワークロードの電力消費を0.1秒単位という高解像度で実測した。モデル学習・ファインチューニング・推論(inference)の各タスクについてMLCommons・vLLMベンチマークを用いて計測し、個別ワークロードの計測値を施設全体レベルへスケールアップするボトムアップ型イベント駆動エネルギーモデルを構築。計測データを公開データセットとして提供している。

主な発見・成果

  • 0.1秒解像度の電力プロファイル: AI学習・ファインチューニング・推論の各オペレーションについて詳細な電力時系列を確立
  • 実際の時間変動を捕捉: AI利用者の行動パターン(ピーク時間・バースト性)を反映した現実的な施設全体の電力需要変動を再現
  • グリッド計画への直接応用: グリッド接続容量・オンサイト発電(太陽光・蓄電池等)・マイクログリッド設計の計画立案に使用可能な標準化されたプロファイルを提供
  • 公開データセット: 方法論と計測データを公開し、業界・研究者が再利用できるようにした。データセンターのエネルギー報告精度向上に貢献

実務への応用

データセンターのエネルギー担当者・GX戦略担当者・施設設計担当者への示唆:(1)AIサーバーの調達計画において、ピーク電力容量だけでなく「電力消費の時間変動パターン」を考慮することが重要。H100等のGPUはワークロードの種類によって電力変動が大きく、静的な容量計算では不十分。(2)データセンターのScope 2排出量算定において、AI推論・学習の稼働パターンに基づく時間帯別電力消費推計が精度向上に有効。24/7 CFEマッチングを目指す際の需要側データとして活用できる。(3)AI需要急増を見据えた電力会社・データセンター事業者向けグリッド接続交渉において、AIワークロードの実電力プロファイルデータは系統影響の定量的評価根拠として使用できる。