gxceed
← 論文一覧に戻る

ESG-DocQA: A Three-Annotator Validated Dataset for Evidence-Grounded Question Answering over Corporate ESG Reports

ESG-DocQA: 企業ESG報告書に対する根拠に基づく質問応答のための3アノテーター検証済みデータセット (AI 翻訳)

Huajian Jiang

Zenodo (CERN European Organization for Nuclear Research)データセット2026-05-31#AI×ESG
DOI: 10.5281/zenodo.20470633
原典: https://doi.org/10.5281/zenodo.20470633

🤖 gxceed AI 要約

日本語

本データセットは、企業のESG報告書に基づく質問応答(QA)ベンチマークであるESG-DocQAの完全な提出パッケージです。300サンプルの検証済みベンチマーク、アノテーションガイドライン、実験結果、補足資料を含みます。書類画像の根拠付けに焦点を当てています。

English

This dataset contains the complete submission package for the ESG-DocQA benchmark paper, including 300 validated samples, annotation guidelines, experimental results, and supplementary materials. It focuses on evidence-grounded question answering over corporate ESG reports with document-image grounding.

Unofficial AI-generated summary based on the public title and abstract. Not an official translation.

📝 gxceed 編集解説 — Why this matters

日本のGX文脈において

日本ではSSBJ基準や有価証券報告書でのESG開示が進んでおり、本データセットはAIを用いた開示情報の自動分析・検証に活用できる可能性がある。日本語報告書への適用には追加のローカライズが必要だが、手法自体は参考になる。

In the global GX context

This dataset provides a standardized benchmark for evidence-grounded QA on ESG reports, supporting the development of AI tools for automated analysis of corporate disclosures, which is increasingly relevant under global frameworks like ISSB and CSRD.

👥 読者別の含意

🔬研究者:A valuable resource for benchmarking NLP models on ESG report understanding, especially for evidence retrieval and question answering.

🏢実務担当者:Can be used to prototype automated ESG report analysis tools for compliance or investor relations.

🏛政策担当者:Demonstrates the potential of AI to enhance transparency and verification of ESG disclosures.

📄 Abstract(原文)

Version 1.0.4 (2026-05-31): - Fixed file naming consistency: renamed three_reviewer files to three_annotator - Added access notes for 31 URLs with restricted or archived access - Updated all internal references and manifest entries --- This dataset contains the complete submission package for the ESG-DocQA benchmark paper, including the 300-sample validated benchmark, annotation guidelines, experimental results, and supplementary materials. The benchmark focuses on evidence-grounded question answering over corporate ESG reports with document-image grounding.

🔗 Provenance — このレコードを発見したソース

🔔 こうした論文の新着を逃したくない方は キーワードアラート に登録(無料・3キーワードまで)。

gxceed は公開メタデータに基づく研究支援データセットです。要約・翻訳・解説は AI 支援で生成されています。 最終的な解釈・検証は利用者が原典資料に基づいて行うことを前提とします。