論文の概要: Pharos-ESG: A Framework for Multimodal Parsing, Contextual Narration, and Hierarchical Labeling of ESG Report
- arxiv url: http://arxiv.org/abs/2511.16417v1
- Date: Thu, 20 Nov 2025 14:41:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.674852
- Title: Pharos-ESG: A Framework for Multimodal Parsing, Contextual Narration, and Hierarchical Labeling of ESG Report
- Title(参考訳): Pharos-ESG: マルチモーダルパーシング, 文脈ナレーション, 階層的ラベリングのためのフレームワーク
- Authors: Yan Chen, Yu Zou, Jialei Zeng, Haoran You, Xiaorui Zhou, Aixi Zhong,
- Abstract要約: Pharos-ESGは、ESGレポートをマルチモーダル解析、コンテキストナレーション、階層ラベリングを通じて構造化表現に変換するフレームワークである。
Aurora-ESGはESGの再ポートの大規模なデータセットで、中国本土、香港、米国にまたがる最初の大規模なデータセットです。
- 参考スコア(独自算出の注目度): 9.026784135029034
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Environmental, Social, and Governance (ESG) principles are reshaping the foundations of global financial gover- nance, transforming capital allocation architectures, regu- latory frameworks, and systemic risk coordination mecha- nisms. However, as the core medium for assessing corpo- rate ESG performance, the ESG reports present significant challenges for large-scale understanding, due to chaotic read- ing order from slide-like irregular layouts and implicit hier- archies arising from lengthy, weakly structured content. To address these challenges, we propose Pharos-ESG, a uni- fied framework that transforms ESG reports into structured representations through multimodal parsing, contextual nar- ration, and hierarchical labeling. It integrates a reading-order modeling module based on layout flow, hierarchy-aware seg- mentation guided by table-of-contents anchors, and a multi- modal aggregation pipeline that contextually transforms vi- sual elements into coherent natural language. The framework further enriches its outputs with ESG, GRI, and sentiment labels, yielding annotations aligned with the analytical de- mands of financial research. Extensive experiments on anno- tated benchmarks demonstrate that Pharos-ESG consistently outperforms both dedicated document parsing systems and general-purpose multimodal models. In addition, we release Aurora-ESG, the first large-scale public dataset of ESG re- ports, spanning Mainland China, Hong Kong, and U.S. mar- kets, featuring unified structured representations of multi- modal content, enriched with fine-grained layout and seman- tic annotations to better support ESG integration in financial governance and decision-making.
- Abstract(参考訳): 環境、社会、ガバナンス(ESG)の原則は、グローバル・ファイナンス・ゴーバー・ナンスの基礎を再構築し、資本配分アーキテクチャ、レギュレーション・リアトリー・フレームワーク、システム的リスク調整・メカ・ニムを変革している。
しかし,ESGでは,スライド状不規則なレイアウトからのカオス的な読み出し順序や,長大で弱く構造化された内容から生じる暗黙的なヒアアーアーチが原因で,大規模な理解に重要な課題が報告されている。
これらの課題に対処するために,多モーダル解析,文脈的ナレーション,階層的ラベリングを通じてESGレポートを構造化表現に変換する,ユニファイドフレームワークであるPharos-ESGを提案する。
レイアウトフローに基づく読み取り順序モデリングモジュール、テーブル・オブ・コンテント・アンカーによってガイドされる階層型セグ-メンテーション、そしてコンテキストによってヴィサール要素をコヒーレントな自然言語に変換するマルチモーダル・アグリゲーション・パイプラインを統合する。
このフレームワークはさらにESG、GRI、感情ラベルによるアウトプットを強化し、金融研究における分析的デマンドと整合したアノテーションを提供する。
Anno-tatedベンチマークの大規模な実験は、Pharos-ESGが専用文書解析システムと汎用マルチモーダルモデルの両方を一貫して上回っていることを示している。
さらに、我々は、中国本土、香港、米国のマルケットにまたがるESGリポートの最初の大規模な公開データセットであるAurora-ESGをリリースした。
関連論文リスト
- Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - Domain-Specific Data Generation Framework for RAG Adaptation [58.20906914537952]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文 参考訳(メタデータ) (2025-10-13T09:59:49Z) - MMESGBench: Pioneering Multimodal Understanding and Complex Reasoning Benchmark for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。
MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。
MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文 参考訳(メタデータ) (2025-07-25T03:58:07Z) - Graph Foundation Models: A Comprehensive Survey [66.74249119139661]
Graph Foundation Models (GFMs)は、構造化データにスケーラブルで汎用的なインテリジェンスを提供することを目指している。
この調査は、GFMの概要を包括的に提供し、モジュラーフレームワークの下での多様な取り組みを統合する。
GFMは構造化データに対するオープンエンド推論の基盤となる。
論文 参考訳(メタデータ) (2025-05-21T05:08:00Z) - Relation-R1: Progressively Cognitive Chain-of-Thought Guided Reinforcement Learning for Unified Relation Comprehension [31.952192907460713]
Relation-R1は、テキストファーストの統一関係理解フレームワークである。
認知連鎖(CoT)誘導型微調整(SFT)とグループ相対政策最適化(GRPO)を統合している。
広く使われているPSGデータセットとSWiGデータセットの実験により、リレーショナルR1はバイナリとtextitN-aryリレーショナル理解の両方で最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2025-04-20T14:50:49Z) - Universal Scene Graph Generation [77.53076485727414]
本稿では,包括的セマンティックシーンを特徴付ける新しい表現であるUniversal Universal SG(USG)を紹介する。
クロスモーダルなオブジェクトアライメントとドメイン外課題の2つの重要なボトルネックに効果的に対処するUSG-Parについても紹介する。
論文 参考訳(メタデータ) (2025-03-19T08:55:06Z) - Enhancing Retrieval for ESGLLM via ESG-CID -- A Disclosure Content Index Finetuning Dataset for Mapping GRI and ESRS [15.217878978015856]
気候変動は、組織のプラクティスにおける透明性と説明責任の必要性を増している。
Global Reporting Initiative(GRI)やEuropean Sustainability Reporting Standards(ESRS)といったフレームワークはESGレポートの標準化を目指している。
企業報告スタイルにおけるESG文書の相当な長さと可変性のため、包括的なレポートの生成は依然として困難である。
論文 参考訳(メタデータ) (2025-03-10T18:07:33Z) - Advanced Unstructured Data Processing for ESG Reports: A Methodology for
Structured Transformation and Enhanced Analysis [20.038120319271773]
本研究では,ESGレポートを構造化解析可能な形式に変換する革新的な手法を提案する。
提案手法は,高精度なテキストクリーニング,画像からのテキストの適切な識別と抽出,およびこれらのレポート内の表の標準化を実現する。
この研究は、産業生態学と企業持続可能性評価の分野に多大な貢献をしている。
論文 参考訳(メタデータ) (2024-01-04T06:26:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。