ESG-DocQA: A Three-Annotator Validated Dataset for Evidence-Grounded Question Answering over Corporate ESG Reports
ESG-DocQA: 企業のESG報告書に対するエビデンスに基づく質問応答のための3アノテーター検証済みデータセット (AI 翻訳)
Huajian Jiang
🤖 gxceed AI 要約
日本語
本データセットは、企業のESG報告書に対するエビデンスに基づく質問応答(QA)ベンチマークを提供する。300サンプルの検証済みデータ、アノテーションガイドライン、実験結果を含み、ドキュメント画像に根差したQAに焦点を当てる。NLP研究とESG分析の橋渡しとなる。
English
This dataset provides a validated benchmark for evidence-grounded question answering over corporate ESG reports, including 300 samples, annotation guidelines, and experimental results, with a focus on document-image grounding. It bridges NLP research and ESG analysis.
Unofficial AI-generated summary based on the public title and abstract. Not an official translation.
📝 gxceed 編集解説 — Why this matters
日本のGX文脈において
日本企業がSSBJ対応のESG報告を進める中、本データセットは報告書からの自動質問応答技術の開発を促進し、投資家向け情報提供の効率化に貢献する。
In the global GX context
As global ESG disclosure frameworks (ISSB, CSRD) mature, this dataset enables AI-powered tools to extract targeted information from reports, supporting both companies and stakeholders in navigating complex disclosures.
👥 読者別の含意
🔬研究者:NLP researchers working on domain-specific QA can use this as a benchmark for ESG document understanding.
🏢実務担当者:Corporate sustainability teams can explore this dataset to build internal tools for answering ESG-related queries from their reports.
📄 Abstract(原文)
Version 1.0.4 (2026-05-31): - Fixed file naming consistency: renamed three_reviewer files to three_annotator - Added access notes for 31 URLs with restricted or archived access - Updated all internal references and manifest entries --- This dataset contains the complete submission package for the ESG-DocQA benchmark paper, including the 300-sample validated benchmark, annotation guidelines, experimental results, and supplementary materials. The benchmark focuses on evidence-grounded question answering over corporate ESG reports with document-image grounding.
🔗 Provenance — このレコードを発見したソース
- openalex https://doi.org/10.5281/zenodo.20465552first seen 2026-06-02 04:53:12 · last seen 2026-06-16 04:49:21
🔔 こうした論文の新着を逃したくない方は キーワードアラート に登録(無料・3キーワードまで)。
gxceed は公開メタデータに基づく研究支援データセットです。要約・翻訳・解説は AI 支援で生成されています。 最終的な解釈・検証は利用者が原典資料に基づいて行うことを前提とします。