ESG-DocQA: A Three-Reviewer Validated Dataset for Evidence-Grounded Question Answering over Corporate ESG Reports
ESG-DocQA: 企業ESG報告書に対する根拠に基づく質問応答のための3人レビュー検証済みデータセット (AI 翻訳)
Huajian Jiang
🤖 gxceed AI 要約
日本語
ESG報告書を対象に、根拠に基づく質問応答のための300サンプルのベンチマークデータセットを構築。3人のレビュアーによる検証を経て、高い信頼性を達成。ドメイン分布はE=145、S=91、G=64で、検証・比較・推論の3種類の質問を含む。ソース報告書は著作権のため再配布せず、メタデータのみ提供。
English
ESG-DocQA is a 300-sample benchmark for evidence-grounded question answering over corporate ESG reports. Constructed with three-reviewer validation, it achieves substantial inter-reviewer reliability (Fleiss' kappa = 0.644). It includes verification, comparison, and inference questions across environmental, social, and governance topics. The dataset provides metadata and guidelines but not original PDFs due to copyright.
Unofficial AI-generated summary based on the public title and abstract. Not an official translation.
📝 gxceed 編集解説 — Why this matters
日本のGX文脈において
日本でもESG開示(SSBJなど)が進む中、AIを用いた報告書分析の基盤データセットとして有用。日本の報告書への適用には追加の翻訳・調整が必要だが、手法自体は汎用的。
In the global GX context
As ESG disclosure becomes mandatory globally (CSRD, SEC, ISSB), this benchmark enables automated analysis of corporate reports, improving consistency and scalability. It is a valuable resource for NLP researchers and sustainability tech developers.
👥 読者別の含意
🔬研究者:NLPベンチマークとして、ESG報告書の自動質問応答システムの評価に活用できる。
🏢実務担当者:ESGデータ分析ツールの開発や検証に利用可能。
🏛政策担当者:直接の政策材料ではないが、開示の質向上や監視技術の可能性を示唆。
📄 Abstract(原文)
ESG-DocQA is a 300-sample benchmark for evidence-grounded question answering over corporate environmental, social, and governance (ESG) reports. The dataset was constructed from page-level ESG report evidence and contains multi-step verification, comparison, and inference questions. The benchmark was produced through iterative human review and three-reviewer validation, achieving substantial inter-reviewer reliability (Fleiss' kappa = 0.644; Krippendorff's alpha = 0.647). The final dataset contains 300 validated samples with domain distribution E=145, S=91, G=64 and answer-type distribution verification=127, comparison=106, inference=67. The repository includes benchmark JSONL records, data dictionary and metadata, annotation guidelines, validation reports, adjudication and replacement logs, and reproducibility scripts. Original ESG report source PDFs and rendered page images are not redistributed due to copyright considerations. Users can locate source reports using the provided source-report manifest and page-level metadata.
🔗 Provenance — このレコードを発見したソース
- openalex https://doi.org/10.5281/zenodo.20437104first seen 2026-06-02 04:53:31 · last seen 2026-06-16 04:49:20
🔔 こうした論文の新着を逃したくない方は キーワードアラート に登録(無料・3キーワードまで)。
gxceed は公開メタデータに基づく研究支援データセットです。要約・翻訳・解説は AI 支援で生成されています。 最終的な解釈・検証は利用者が原典資料に基づいて行うことを前提とします。