Fugu-MT 論文翻訳(概要): SustainableQA: A Comprehensive Question Answering Dataset for Corporate Sustainability and EU Taxonomy Reporting

論文の概要: SustainableQA: A Comprehensive Question Answering Dataset for Corporate Sustainability and EU Taxonomy Reporting

arxiv url: http://arxiv.org/abs/2508.03000v1
Date: Tue, 05 Aug 2025 02:03:59 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-06 18:18:55.740326
Title: SustainableQA: A Comprehensive Question Answering Dataset for Corporate Sustainability and EU Taxonomy Reporting
Title（参考訳）: SustainableQA: 企業サステナビリティのための包括的質問回答データセットとEU分類学レポート
Authors: Mohammed Ali, Abdelrahman Abdallah, Adam Jatowt,
Abstract要約: 企業サステナビリティレポートと年次レポートから包括的なQAデータセットを生成するための,新しいデータセットとスケーラブルなパイプラインであるSustainableQAを紹介する。 195,000以上の多様なファクトイドと非ファクトイドのQAペアを持つSustainableQAは、高度な知識アシスタントの開発とベンチマークに有効なリソースである。
参考スコア（独自算出の注目度）: 16.86139440201837
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The growing demand for corporate sustainability transparency, particularly under new regulations like the EU Taxonomy, necessitates precise data extraction from large, unstructured corporate reports. Large Language Models (LLMs) and Retrieval-Augmented Generation (RAG) systems, requires high-quality, domain-specific question-answering (QA) datasets to excel at particular domains. To address this, we introduce SustainableQA, a novel dataset and a scalable pipeline for generating a comprehensive QA datasets from corporate sustainability reports and annual reports. Our approach integrates semantic chunk classification, a hybrid span extraction pipeline combining fine-tuned Named Entity Recognition (NER), rule-based methods, and LLM-driven refinement, alongside a specialized table-to-paragraph transformation. With over 195,000 diverse factoid and non-factoid QA pairs, SustainableQA is an effective resource for developing and benchmarking advanced knowledge assistants capable of navigating complex sustainability compliance
Abstract（参考訳）: 企業サステナビリティの透明性に対する需要の高まり、特にEUの分類法のような新しい規制の下では、大規模で非構造化の企業レポートから正確なデータを抽出する必要がある。大規模言語モデル (LLM) とレトリーバル拡張生成 (RAG) システムでは、特定のドメインを抽出するために高品質でドメイン固有の質問応答 (QA) データセットが必要である。これを解決するために、企業サステナビリティレポートと年次レポートから包括的なQAデータセットを生成するための、新しいデータセットとスケーラブルなパイプラインであるSustainableQAを紹介します。提案手法はセマンティックチャンク分類, 微調整された名前付きエンティティ認識(NER), ルールベース手法, LLMによる精細化, および特殊テーブル-パラグラフ変換を組み合わせたハイブリッドスパン抽出パイプラインを統合した。 195,000以上の多様なファクトイドと非ファクトイドのQAペアを持つSustainableQAは、複雑な持続可能性コンプライアンスをナビゲートできる高度な知識アシスタントの開発とベンチマークに有効なリソースである。

関連論文リスト

D-SCoRE: Document-Centric Segmentation and CoT Reasoning with Structured Export for QA-CoT Data Generation [12.271220269415878]
D-SCoREはトレーニング不要のパイプラインで、任意のテキストソースから高品質なQAデータセットを生成する。 D-SCoREは、100-200ワードテキストあたりの4オプションの反ファクト素材を持つ6つのQA-CoTペアを90秒で生成する。そのシンプルさとスケーラビリティにより、効率的なQA生成とドメイン間の高性能な微調整が可能になる。
論文参考訳（メタデータ） (2025-08-02T10:45:05Z)
Benchmarking Multimodal Understanding and Complex Reasoning for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。 MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。 MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文参考訳（メタデータ） (2025-07-25T03:58:07Z)
Large Language Models Meet Symbolic Provers for Logical Reasoning Evaluation [24.081573908824353]
一階述語論理(FOL)推論はインテリジェントシステムにおいて重要である。既存のベンチマークは、広範囲の人間のアノテーションや手作りテンプレートに依存していることが多い。本稿では,大言語モデルの生成強度を記号型プローサの厳密性と精度で相乗化するProverGenという新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-10T15:31:54Z)
LLMs to Support a Domain Specific Knowledge Assistant [0.0]
本研究は、国際金融報告基準(IFRS)を用いたサステナビリティレポートのためのドメイン固有知識アシスタントを開発するためのカスタムアプローチを提案する。このドメインでは、公開可能なQAデータセットは存在せず、レポートを提供する企業をサポートするための高品質なパイプラインの開発を阻害している。
論文参考訳（メタデータ） (2025-02-06T14:12:41Z)
TARGA: Targeted Synthetic Data Generation for Practical Reasoning over Structured Data [9.390415313514762]
TARGAは、手動のアノテーションなしで高関連性合成データを生成するフレームワークである。これは、クローズソースモデルを使用する既存の非微調整手法よりも大幅に優れている。非I.I.D.設定下では、優れたサンプル効率、堅牢性、一般化能力を示す。
論文参考訳（メタデータ） (2024-12-27T09:16:39Z)
TQA-Bench: Evaluating LLMs for Multi-Table Question Answering with Scalable Context and Symbolic Extension [8.489816179329832]
TQA-Benchは,大規模言語モデル(LLM)の複雑なQAタスクをリレーショナルデータ上で処理する能力を評価するために設計された,新しいマルチテーブルQAベンチマークである。我々のベンチマークでは、現実世界のパブリックデータセットから得られた多様なリレーショナルデータベースインスタンスを組み込んでいます。我々は、70億から700億のパラメータにまたがる、オープンソースとクローズドソースの両方のLLMを体系的に評価する。
論文参考訳（メタデータ） (2024-11-29T06:48:13Z)
IDEAL: Leveraging Infinite and Dynamic Characterizations of Large Language Models for Query-focused Summarization [59.06663981902496]
クエリ中心の要約(QFS)は、特定の関心事に答え、より優れたユーザ制御とパーソナライゼーションを可能にする要約を作成することを目的としている。本稿では,LLMを用いたQFSモデル,Longthy Document Summarization,およびクエリ-LLMアライメントの2つの重要な特徴について検討する。これらのイノベーションは、QFS技術分野における幅広い応用とアクセシビリティの道を開いた。
論文参考訳（メタデータ） (2024-07-15T07:14:56Z)
Automatic Question-Answer Generation for Long-Tail Knowledge [65.11554185687258]
テールエンティティのための特別なQAデータセットを生成するための自動アプローチを提案する。我々は,新たに生成された長尾QAデータセットに事前学習したLLMを用いて広範な実験を行う。
論文参考訳（メタデータ） (2024-03-03T03:06:31Z)
sustain.AI: a Recommender System to analyze Sustainability Reports [0.2479153065703935]
sustainAIは、監査人や金融投資家を支援するインテリジェントでコンテキスト対応のレコメンデーションシステムである。我々は,ドイツの新しいサステナビリティレポートデータセットを2つ評価し,高いレコメンデーション性能を継続的に達成した。
論文参考訳（メタデータ） (2023-05-15T15:16:19Z)
Towards Complex Document Understanding By Discrete Reasoning [77.91722463958743]
VQA(Document Visual Question Answering)は、自然言語による質問に答えるために、視覚的に豊富なドキュメントを理解することを目的としている。我々は3,067の文書ページと16,558の質問応答ペアからなる新しいドキュメントVQAデータセットTAT-DQAを紹介する。我々は,テキスト,レイアウト,視覚画像など,多要素の情報を考慮に入れたMHSTという新しいモデルを開発し,異なるタイプの質問にインテリジェントに対処する。
論文参考訳（メタデータ） (2022-07-25T01:43:19Z)
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance [71.76018597965378]
TAT-QAと呼ばれるタブラデータとテクスチャデータの両方を含む新しい大規模な質問応答データセットを構築します。本稿では,テーブルとテキストの両方を推論可能な新しいQAモデルであるTAGOPを提案する。
論文参考訳（メタデータ） (2021-05-17T06:12:06Z)
Template-Based Question Generation from Retrieved Sentences for Improved Unsupervised Question Answering [98.48363619128108]
擬似学習データを用いてQAモデルを訓練するための教師なしアプローチを提案する。関連した検索文に簡単なテンプレートを適用してQA学習のための質問を生成すると、元の文脈文よりも、下流QAのパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2020-04-24T17:57:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。