ESG-DocQA: A Three-Annotator Validated Dataset for Evidence-Grounded Question Answering over Corporate ESG Reports
ESG-DocQA: 企業のESG報告書に対する根拠に基づく質問応答のための3アノテーター検証済みデータセット (AI 翻訳)
Huajian Jiang
🤖 gxceed AI 要約
日本語
ESG報告書に対する質問応答ベンチマークデータセットを発表。300サンプルを3人のアノテーターで検証。文書画像を用いた根拠付き回答を可能にする。
English
We present ESG-DocQA, a benchmark dataset for evidence-grounded question answering over corporate ESG reports, with 300 validated samples annotated by three annotators, enabling document-image grounding.
Unofficial AI-generated summary based on the public title and abstract. Not an official translation.
📝 gxceed 編集解説 — Why this matters
日本のGX文脈において
このデータセットは、日本の企業が開示するESG情報(気候関連開示を含む)の機械的可読性向上に貢献する可能性がある。SSBJや有報との連携が進む中、情報抽出技術の進展は重要。
In the global GX context
This dataset advances the machine readability of ESG disclosures, which is crucial for global frameworks like ISSB and CSRD. It enables automated extraction of climate-related information from reports.
👥 読者別の含意
🔬研究者:Researchers in NLP and ESG disclosure can use this benchmark to develop and evaluate question-answering systems for corporate reports.
🏢実務担当者:Sustainability teams can leverage similar NLP tools to streamline extraction of relevant data from their own reports.
🏛政策担当者:Regulators can consider such benchmarks to improve digital accessibility of mandatory disclosures.
📄 Abstract(原文)
Version 1.0.6 (2026-05-31): - Updated manuscript, cover letter, submission gates, and Overleaf compile package to Zenodo DOI 10.5281/zenodo.20471502. - Rebuilt the final SCIE submission package and package manifests after DOI alignment. - Confirmed source-report manifest status counts: 173 reachable rediscovery URLs and 11 official access-restricted URLs. - Confirmed active validation artifacts use consistent three-annotator naming. This dataset contains the complete submission package for the ESG-DocQA benchmark paper, including the 300-sample validated benchmark, annotation guidelines, experimental results, and supplementary materials. The benchmark focuses on evidence-grounded question answering over corporate ESG reports with document-image grounding.
🔗 Provenance — このレコードを発見したソース
- openalex https://doi.org/10.5281/zenodo.20437103first seen 2026-06-02 04:53:21 · last seen 2026-06-03 04:54:18
🔔 こうした論文の新着を逃したくない方は キーワードアラート に登録(無料・3キーワードまで)。
gxceed は公開メタデータに基づく研究支援データセットです。要約・翻訳・解説は AI 支援で生成されています。 最終的な解釈・検証は利用者が原典資料に基づいて行うことを前提とします。