論文の概要: ESGLens: An LLM-Based RAG Framework for Interactive ESG Report Analysis and Score Prediction
- arxiv url: http://arxiv.org/abs/2604.19779v1
- Date: Sun, 29 Mar 2026 00:46:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.07093
- Title: ESGLens: An LLM-Based RAG Framework for Interactive ESG Report Analysis and Score Prediction
- Title(参考訳): ESGLens:対話型ESGレポート分析とスコア予測のためのLLMベースのRAGフレームワーク
- Authors: Tsung-Yu Yang, Meng-Chi Chen,
- Abstract要約: ESGLensは、異種PDFコンテンツをタイプされたチャンクにセグメントするレポート処理モジュールである。
GRI誘導抽出モジュールは、特定の標準に沿った情報を検索して合成する。
スコアリングモジュールは抽出したサマリーを埋め込んで、ロンドン証券取引所グループ(LSEG)の基準スコアに対してトレーニングされた回帰モデルに供給する。
- 参考スコア(独自算出の注目度): 0.42970700836450487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Environmental, Social, and Governance (ESG) reports are central to investment decision-making, yet their length, heterogeneous content, and lack of standardized structure make manual analysis costly and inconsistent. We present ESGLens, a proof-of-concept framework combining retrieval-augmented generation (RAG) with prompt-engineered extraction to automate three tasks: (1)~structured information extraction guided by Global Reporting Initiative (GRI) standards, (2)~interactive question-answering with source traceability, and (3)~ESG score prediction via regression on LLM-generated embeddings. ESGLens is purpose-built for the domain: a report-processing module segments heterogeneous PDF content into typed chunks (text, tables, charts); a GRI-guided extraction module retrieves and synthesizes information aligned with specific standards; and a scoring module embeds extracted summaries and feeds them to a regression model trained against London Stock Exchange Group (LSEG) reference scores. We evaluate the framework on approximately 300 reports from companies in the QQQ, S\&P~500, and Russell~1000 indices (fiscal year 2022). Among three embedding methods (ChatGPT, BERT, RoBERTa) and two regressors (Neural Network, LightGBM), ChatGPT embeddings with a Neural Network achieve a Pearson correlation of 0.48 ($R^{2} \approx 0.23$) against LSEG ground-truth scores -- a modest but statistically meaningful signal given the ${\sim}300$-report training set and restriction to the environmental pillar. A traceability audit shows that 8 of 10 extracted claims verify against the source document, with two failures attributable to few-shot example leakage. We discuss limitations including dataset size and restriction to environmental indicators, and release the code to support reproducibility.
- Abstract(参考訳): 環境、社会、ガバナンス(ESG)レポートは投資決定の中心であるが、その長さ、異質な内容、標準化された構造が欠如しているため、手作業による分析はコストがかかり一貫性がない。
本稿では,(1)GRI(Global Reporting Initiative, グローバルレポーティングイニシアチブ)標準による構造化情報抽出,(2)ソーストレーサビリティによる対話型質問応答,(3)LLM生成した埋め込みにおける回帰によるESGスコア予測の3つのタスクを自動化するための,検索強化生成(RAG)と即時抽出を組み合わせた概念実証フレームワークであるESGLensを提案する。
レポート処理モジュールは、異質なPDFコンテンツをタイプされたチャンク(テキスト、テーブル、チャート)にセグメント化し、GRI誘導抽出モジュールは特定の標準に沿った情報を検索して合成し、スコアリングモジュールは抽出した要約を埋め込み、ロンドン証券取引所グループ(LSEG)の基準スコアに基づいてトレーニングされた回帰モデルにフィードする。
このフレームワークは、QQQ、S\&P~500、Russell~1000インデックス(2022年度)の約300のレポートに基づいて評価する。
3つの埋め込み方法(ChatGPT, BERT, RoBERTa)と2つの回帰器(Neural Network, LightGBM)のうち、ChatGPTとニューラルネットワークの埋め込みはLSEGのグランドトルーススコアに対するパーソン相関0.48(R^{2} \approx 0.23$)を達成する。
トレーサビリティ監査では、10件のクレームのうち8件がソース文書に対する検証であり、2件の失敗は少数例のリークに起因することが示されている。
我々は,データセットのサイズや環境指標の制限などの制限について論じ,再現性をサポートするためのコードをリリースする。
関連論文リスト
- Performance Evaluation of LLMs in Automated RDF Knowledge Graph Generation [0.0]
大規模言語モデル(LLM)はRDF知識グラフ生成を自動化するための有望なアプローチを提供する。
我々は,複数のLPMを評価し,制御フレームワークを用いた自動RDF抽出手法を提案する。
Llama は 99.35% の F1 スコアと100% 有効な RDF 出力を達成している。
論文 参考訳(メタデータ) (2026-02-06T06:30:35Z) - An Empirical Framework for Evaluating Semantic Preservation Using Hugging Face [2.8203629958608722]
我々は,LESSにおける意味保存を,知的コンポーネントの最適化がシステム全体の機能的振る舞いを変化させない特性として定義する。
本稿では,HuggingFaceのマイニングモデル進化データを用いて,LESSにおける意味的保存を評価するための実証的枠組みを提案する。
論文 参考訳(メタデータ) (2025-12-08T19:14:21Z) - OntoMetric: An Ontology-Guided Framework for Automated ESG Knowledge Graph Construction [4.736397889087109]
OntoMetricは、ESG規制文書を検証済みのAIおよびWeb対応の知識グラフに変換するオントロジーガイダンスフレームワークである。
OntoMetricは65-90%のセマンティック精度と80-90%のスキーマ準拠を実現している。
論文 参考訳(メタデータ) (2025-12-01T05:21:22Z) - RefineBench: Evaluating Refinement Capability of Language Models via Checklists [71.02281792867531]
本研究は,2つの改良モード(ガイドリファインメントと自己リファインメント)を評価する。
ガイド付き改良では、プロプライエタリなLMと大きなオープンウェイトLMの両方が目標フィードバックを利用して、5ターン以内のほぼ完全なレベルへの応答を洗練できる。
これらの結果は、フロンティアLMは誤った反応を自己調整するためにブレークスルーを必要とすることを示唆している。
論文 参考訳(メタデータ) (2025-11-27T07:20:52Z) - MARAG-R1: Beyond Single Retriever via Reinforcement-Learned Multi-Tool Agentic Retrieval [50.30107119622642]
大規模言語モデル(LLM)は推論と生成において優れているが、本質的には静的事前学習データによって制限されている。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識に基盤を置くことでこの問題に対処する。
MarAG-R1は、LLMが複数の検索機構を動的に調整できる強化学習型マルチツールRAGフレームワークである。
論文 参考訳(メタデータ) (2025-10-31T15:51:39Z) - Towards Global Retrieval Augmented Generation: A Benchmark for Corpus-Level Reasoning [50.27838512822097]
我々は,グローバルRAG機能を評価するために設計された最初のベンチマークであるGlobalQAを紹介する。
我々は,チャンクレベルの検索によって構造的コヒーレンスを保存するマルチツール協調フレームワークであるGlobalRAGを提案する。
Qwen2.5-14Bモデルでは、GlobalRAGは最強のベースラインである1.51 F1と比較して6.63 F1を達成した。
論文 参考訳(メタデータ) (2025-10-30T07:29:14Z) - Loong: Synthesize Long Chain-of-Thoughts at Scale through Verifiers [103.4410890572479]
スケーラブルな合成データ生成と検証のためのオープンソースのフレームワークであるLoong Projectを紹介します。
LoongBenchは、12のドメインにまたがる8,729の人為的なサンプルを含む、キュレートされたシードデータセットである。
LoongEnvはモジュラー合成データ生成環境であり、新しい質問応答コードのトリプルを生成する複数のプロンプト戦略をサポートする。
論文 参考訳(メタデータ) (2025-09-03T06:42:40Z) - Open-Source Agentic Hybrid RAG Framework for Scientific Literature Review [2.092154729589438]
本稿では,ハイブリッドRAGパイプラインを自律エージェント内にカプセル化するエージェントアプローチを提案する。
当社のパイプラインでは,PubMedやarXiv,Google Scholar APIから,バイオロジカルなオープンアクセスデータを収集しています。
Llama-3.3-70B エージェントが GraphRAG (クエリを Cypher for KG に変換する) または VectorRAG (スパースと高密度検索を組み合わせて再ランク付けする) を選択する
論文 参考訳(メタデータ) (2025-07-30T18:54:15Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - LLM-BABYBENCH: Understanding and Evaluating Grounded Planning and Reasoning in LLMs [2.1164936096078515]
$textbfLLM-BabyBench$は、対話環境の制約の中で計画と推論を行う大規模言語モデルの能力を評価するためのベンチマークスイートである。
このスイートは、手続き的に生成されたBabyAIグリッド世界のテキスト適応に基づいて構築され、LLMを地上知能の3つの基本的な側面に基づいて評価する。
論文 参考訳(メタデータ) (2025-05-17T20:23:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。