論文の概要: Optimizing Large Language Models for ESG Activity Detection in Financial Texts
- arxiv url: http://arxiv.org/abs/2502.21112v1
- Date: Fri, 28 Feb 2025 14:52:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:44:33.950893
- Title: Optimizing Large Language Models for ESG Activity Detection in Financial Texts
- Title(参考訳): 財務文書におけるESG活動検出のための大規模言語モデルの最適化
- Authors: Mattia Birti, Francesco Osborne, Andrea Maurino,
- Abstract要約: 本稿では,環境活動に関連するテキストを識別する次世代大規模言語モデルについて検討する。
ESG-ActivitiesはEUのESG分類に従って分類された1,325のラベル付きテキストセグメントを含むベンチマークデータセットである。
実験の結果,ESG-Activitiesの微調整は分類精度を著しく向上させることがわかった。
- 参考スコア(独自算出の注目度): 0.7373617024876725
- License:
- Abstract: The integration of Environmental, Social, and Governance (ESG) factors into corporate decision-making is a fundamental aspect of sustainable finance. However, ensuring that business practices align with evolving regulatory frameworks remains a persistent challenge. AI-driven solutions for automatically assessing the alignment of sustainability reports and non-financial disclosures with specific ESG activities could greatly support this process. Yet, this task remains complex due to the limitations of general-purpose Large Language Models (LLMs) in domain-specific contexts and the scarcity of structured, high-quality datasets. In this paper, we investigate the ability of current-generation LLMs to identify text related to environmental activities. Furthermore, we demonstrate that their performance can be significantly enhanced through fine-tuning on a combination of original and synthetically generated data. To this end, we introduce ESG-Activities, a benchmark dataset containing 1,325 labelled text segments classified according to the EU ESG taxonomy. Our experimental results show that fine-tuning on ESG-Activities significantly enhances classification accuracy, with open models such as Llama 7B and Gemma 7B outperforming large proprietary solutions in specific configurations. These findings have important implications for financial analysts, policymakers, and AI researchers seeking to enhance ESG transparency and compliance through advanced natural language processing techniques.
- Abstract(参考訳): 環境・社会・ガバナンス(ESG)要素の企業意思決定への統合は、持続可能な金融の基本的な側面である。
しかしながら、ビジネスプラクティスが規制フレームワークの進化に合わせていることは、依然として永続的な課題である。
持続可能性レポートと特定のESGアクティビティとの非財務情報開示のアライメントを自動的に評価するAI駆動ソリューションは、このプロセスを大いに支持することができる。
しかし、ドメイン固有のコンテキストにおける汎用大規模言語モデル(LLM)の制限と、構造化された高品質データセットの不足のため、このタスクは依然として複雑である。
本稿では,環境活動に関連するテキストを識別する次世代LCMについて検討する。
さらに,元のデータと合成データの組み合わせを微調整することで,それらの性能を著しく向上させることができることを示した。
この目的のために,EU ESG分類に従って分類された1,325のラベル付きテキストセグメントを含むベンチマークデータセットであるESG-Activitiesを紹介する。
Llama 7B や Gemma 7B などのオープンモデルでは,ESG-Activities の微調整により分類精度が著しく向上することが示された。
これらの発見は、高度な自然言語処理技術を通じてESGの透明性とコンプライアンスを強化することを目指す金融アナリスト、政策立案者、AI研究者にとって重要な意味を持つ。
関連論文リスト
- ESGSenticNet: A Neurosymbolic Knowledge Base for Corporate Sustainability Analysis [26.738671295538396]
本稿では,持続可能性分析の知識基盤であるESGSenticNetを紹介する。
ESGSenticNetは、特殊概念解析、GPT-4o推論、および半教師付きラベル伝搬を統合するニューロシンボリックフレームワークから構築されている。
ESGSenticNetは、語彙的手法としてデプロイされると、より効果的に関連性があり実行可能なサステナビリティ情報をキャプチャする。
論文 参考訳(メタデータ) (2025-01-27T01:21:12Z) - On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.72892401927283]
さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文 参考訳(メタデータ) (2024-09-30T03:58:43Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Fine-Tuning Large Vision-Language Models as Decision-Making Agents via Reinforcement Learning [79.38140606606126]
強化学習(RL)を用いた視覚言語モデル(VLM)を微調整するアルゴリズムフレームワークを提案する。
我々のフレームワークはタスク記述を提供し、次にVLMにチェーン・オブ・シント(CoT)推論を生成するよう促す。
提案手法は,VLMエージェントの様々なタスクにおける意思決定能力を向上させる。
論文 参考訳(メタデータ) (2024-05-16T17:50:19Z) - LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named
Entity Recognition [67.96794382040547]
$LLM-DA$は、数発のNERタスクのために、大きな言語モデル(LLM)に基づいた、新しいデータ拡張テクニックである。
提案手法では,14のコンテキスト書き換え戦略を採用し,同一タイプのエンティティ置換を設計し,ロバスト性を高めるためにノイズ注入を導入する。
論文 参考訳(メタデータ) (2024-02-22T14:19:56Z) - AI in ESG for Financial Institutions: An Industrial Survey [4.893954917947095]
本稿では,ESGフレームワークの活性化におけるAIの必要性と影響を明らかにするために,産業環境を調査した。
調査では、分析能力、リスク評価、顧客エンゲージメント、報告精度など、ESGの主要な3つの柱にまたがるAIアプリケーションを分類した。
この論文は、ESG関連の銀行プロセスにおけるAI展開の倫理的側面を強調し、責任と持続可能なAIの衝動についても論じている。
論文 参考訳(メタデータ) (2024-02-03T02:14:47Z) - ESGReveal: An LLM-based approach for extracting structured data from ESG
reports [5.467389155759699]
ESGRevealは企業報告から環境・社会・ガバナンス(ESG)データを効率的に抽出・分析するための革新的な手法である。
このアプローチは、検索拡張生成(RAG)技術で強化されたLarge Language Models (LLM)を利用する。
この効果は、2022年に香港証券取引所に上場した様々な分野の166社のESGレポートを用いて評価された。
論文 参考訳(メタデータ) (2023-12-25T06:44:32Z) - Glitter or Gold? Deriving Structured Insights from Sustainability
Reports via Large Language Models [16.231171704561714]
本研究では,企業のサステナビリティレポートからESGに関する構造化された洞察を抽出するために,情報抽出(IE)手法を用いる。
次に、グラフに基づく表現を活用して、抽出された洞察に関する統計的分析を行う。
論文 参考訳(メタデータ) (2023-10-09T11:34:41Z) - FinGPT: Instruction Tuning Benchmark for Open-Source Large Language
Models in Financial Datasets [9.714447724811842]
本稿では,オープンソースの大規模言語モデルに対して,インストラクションチューニングパラダイムに固有のアプローチを導入する。
私たちは、オープンソースのモデルの相互運用性に乗じて、シームレスで透過的な統合を確保します。
本稿では,エンドツーエンドのトレーニングとテストのためのベンチマーク手法を提案し,費用対効果を生かした。
論文 参考訳(メタデータ) (2023-10-07T12:52:58Z) - Improving Open Information Extraction with Large Language Models: A
Study on Demonstration Uncertainty [52.72790059506241]
オープン情報抽出(OIE)タスクは、構造化されていないテキストから構造化された事実を抽出することを目的としている。
一般的なタスク解決手段としてChatGPTのような大きな言語モデル(LLM)の可能性にもかかわらず、OIEタスクの最先端(教師付き)メソッドは遅れている。
論文 参考訳(メタデータ) (2023-09-07T01:35:24Z) - Does Synthetic Data Generation of LLMs Help Clinical Text Mining? [51.205078179427645]
臨床テキストマイニングにおけるOpenAIのChatGPTの可能性を検討する。
本稿では,高品質な合成データを大量に生成する新たな学習パラダイムを提案する。
提案手法により,下流タスクの性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-03-08T03:56:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。