Research Infrastructure Statement v0.1
gxceed = GX + exceed
GX 開示の分散・非構造化・比較困難性を「突破」する研究基盤
gxceed は、企業の GX 開示に散在する情報を、研究・分析に使える 構造化データへ変換する研究基盤です。単なる ESG スコアではなく、 誰もやりたがらない「比較可能性を作る前処理」を引き受けて、 研究者・実務家に 原典に戻れるデータ を提供します。
なぜ gxceed が必要か
GX 開示は分散しています。理由は単純で、「重要すぎるのに、 誰が標準化コストを負担するかが決まっていない」から。 制度・投資家・企業 IR・監査・データベンダー・研究者の境界に またがり、全員が「必要だ」と言いながら、誰も一枚岩のデータ基盤を 作りません。
- GX 開示は会計ほど制度化されていない (ISSB は進行中だが配信は分散)
- 地域差が大きい (日本 SSBJ 2025/3、EU CSRD、US SEC は揺れ)
- EU ESAP は 2027/7 から、まだ過渡期
- 企業内で部署が分散 (IR / ESG / 環境 / 法務経理 / 経企 / 調達)
- 既存データベンダーは「閉じる」インセンティブを持つ
gxceed はこの空白地帯に立って、PDF 収集、年度判定、表記揺れ吸収、 Scope 分類、単位変換、出典管理、信頼度判定 — を引き受けることで 研究インフラとして機能します。
SNE Framework との接続
gxceed は SNE Framework (doi:10.5281/zenodo.19889465) の 観測装置の社会接続点 です。
| 軸 | 内容 | 形式 |
|---|---|---|
| S (実体) | Scope 1/2/3、SBT、TCFD、CDP、再エネ%、ICP、クレジット数値 | 数値 |
| N (物語) | 統合報告書、サステナビリティレポート、有報サステナ記載、TCFD/ESG データブック | |
| E (期待) | 投資家・格付・行政・社会からの評価 | 市場・制度・評判 |
問題は、S は数値、N は PDF、E は市場・制度・評判に分散していて、 これらをつなぐ公的な共通レイヤーがまだ弱いこと。gxceed はN (語り) を機械可読化して、S (実体) と E (期待) に 接続可能な観測データへ変換 します。
提供しないもの
意図的に提供しません:
- ESG ランキング・スコア・ベスト/ワースト評価
- 「正解値」「公式値」としての主張
- 投資推奨・格付
- 商用再配布可能な生データ
これらは利用者(研究者・投資家・実務家)の解釈に委ねます。gxceed は観測装置であり、評価装置ではありません。
守るべき5原則
- 観測装置であり評価装置ではない — ランキング・ スコアを公開しない
- AI 抽出値を「真値」と扱わない — 出典・confidence・ review state 併記必須
- 原典の優位性を保つ — gxceed は補助、原典 PDF が常に正
- 再現可能性を保つ — DOI 固定スナップショット・ 抽出モデルバージョン記録
- 誰もやりたがらない地味な前処理を引き受ける — それが価値の核心
レイヤー構造
[Layer 0] SNE Framework ── 観測装置の理論
doi:10.5281/zenodo.19889465
↓ guides
[Layer 1] snecompass.com ── 理論原典・可視化サイト
↓ applies
[Layer 2] jasag-v3.1 ── データエンジン (Mac mini)
URL Subagent · PDF Fetcher · Structured Extractor
DeepSeek V4 Flash + Gemma 4 sanity · $0 cloud cost
↓ pushes via Bearer auth
[Layer 3] gxceed.com ── 公開 GX データ基盤
D1 · Worker · Pages
↓ provides JSON + provenance
[Layer 4] Researchers ── 派生研究・引用・分析システム図 (Figure 1) は /data/pipeline を参照してください。
ロードマップ
| Phase | 期間 | スコープ |
|---|---|---|
| α (現在) | 2026 Q2 | プライム 200 社 × integrated + sustainability × 最新1年・8 GX 指標 |
| β | 2027 | Global 500 社 (JP 200 + US 100 + UK 50 + EU 50 + Asia 100) |
| γ | 2028 | + ISSB / TCFD / CSRD / SEC climate crosswalk |
関連研究
- Kokubu (2026). Limited Marginal Benefit of Reasoning-Heavy Deployment in ESG Narrative Scoring (SSRN, arXiv 投稿中). gxceed のパイプラインは本論文の主張「reasoning-off ensemble + 構造化前処理で実務上十分」を実装します。
- Kokubu (planning, 2026). A Structured GX Disclosure Dataset Derived from Reasoning-Off LLM Pipelines. gxceed Dataset 2026Q2 を引用予定。
アクセス・引用
- 研究者向け申請: /data/researchers
- 引用ガイド: /data/citation
- API ドキュメント: /data/api-docs
- システム図 (Fig. 1): /data/pipeline
- 理論原典 (SNE Framework): snecompass.com