gxceed
← 論文一覧に戻る

ESG-DocQA: A Three-Annotator Validated Dataset for Evidence-Grounded Question Answering over Corporate ESG Reports

ESG-DocQA: 企業のESG報告書に対する証拠に基づく質問応答のための3注釈者検証済みデータセット (AI 翻訳)

Huajian Jiang

Zenodo (CERN European Organization for Nuclear Research)データセット2026-05-31#ESGOrigin: Global
DOI: 10.5281/zenodo.20471502
原典: https://doi.org/10.5281/zenodo.20471502

🤖 gxceed AI 要約

日本語

ESG-DocQAは、企業のESG報告書に対する証拠に基づく質問応答ベンチマークデータセットです。300サンプルの検証済みベンチマーク、注釈ガイドライン、実験結果を含み、文書画像の根拠付けに焦点を当てています。3人の注釈者により一貫したラベリングが行われています。

English

ESG-DocQA is a validated benchmark dataset for evidence-grounded question answering over corporate ESG reports. It includes 300 samples, annotation guidelines, and experimental results, focusing on document-image grounding. The dataset is annotated by three annotators for consistency.

Unofficial AI-generated summary based on the public title and abstract. Not an official translation.

📝 gxceed 編集解説 — Why this matters

日本のGX文脈において

日本でもSSBJに基づくESG開示が進んでおり、本データセットは日本語対応が今後の課題となるが、ESG報告書の自動解析技術の基盤として参考になる。

In the global GX context

This dataset addresses the growing need for automated analysis of corporate ESG reports, supporting TCFD, ISSB, and CSRD compliance. It provides a standardized benchmark for evidence-grounded QA, advancing AI-assisted ESG assessment.

👥 読者別の含意

🔬研究者:Researchers can use this benchmark to evaluate and improve QA models for ESG reports.

🏢実務担当者:Corporate sustainability teams can explore this dataset to understand how AI can assist in extracting evidence from their own reports.

📄 Abstract(原文)

Version 1.0.6 (2026-05-31): - Updated manuscript, cover letter, submission gates, and Overleaf compile package to Zenodo DOI 10.5281/zenodo.20471502. - Rebuilt the final SCIE submission package and package manifests after DOI alignment. - Confirmed source-report manifest status counts: 173 reachable rediscovery URLs and 11 official access-restricted URLs. - Confirmed active validation artifacts use consistent three-annotator naming. This dataset contains the complete submission package for the ESG-DocQA benchmark paper, including the 300-sample validated benchmark, annotation guidelines, experimental results, and supplementary materials. The benchmark focuses on evidence-grounded question answering over corporate ESG reports with document-image grounding.

🔗 Provenance — このレコードを発見したソース

🔔 こうした論文の新着を逃したくない方は キーワードアラート に登録(無料・3キーワードまで)。

gxceed は公開メタデータに基づく研究支援データセットです。要約・翻訳・解説は AI 支援で生成されています。 最終的な解釈・検証は利用者が原典資料に基づいて行うことを前提とします。