論文の概要: ESGReveal: An LLM-based approach for extracting structured data from ESG
reports
- arxiv url: http://arxiv.org/abs/2312.17264v1
- Date: Mon, 25 Dec 2023 06:44:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 12:51:34.945160
- Title: ESGReveal: An LLM-based approach for extracting structured data from ESG
reports
- Title(参考訳): ESGReveal:ESGレポートから構造化データを抽出するためのLLMベースのアプローチ
- Authors: Yi Zou, Mengying Shi, Zhongjie Chen, Zhu Deng, ZongXiong Lei, Zihan
Zeng, Shiming Yang, HongXiang Tong, Lei Xiao, Wenwen Zhou
- Abstract要約: ESGRevealは企業報告から環境・社会・ガバナンス(ESG)データを効率的に抽出・分析するための革新的な手法である。
このアプローチは、検索拡張生成(RAG)技術で強化されたLarge Language Models (LLM)を利用する。
この効果は、2022年に香港証券取引所に上場した様々な分野の166社のESGレポートを用いて評価された。
- 参考スコア(独自算出の注目度): 5.467389155759699
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: ESGReveal is an innovative method proposed for efficiently extracting and
analyzing Environmental, Social, and Governance (ESG) data from corporate
reports, catering to the critical need for reliable ESG information retrieval.
This approach utilizes Large Language Models (LLM) enhanced with Retrieval
Augmented Generation (RAG) techniques. The ESGReveal system includes an ESG
metadata module for targeted queries, a preprocessing module for assembling
databases, and an LLM agent for data extraction. Its efficacy was appraised
using ESG reports from 166 companies across various sectors listed on the Hong
Kong Stock Exchange in 2022, ensuring comprehensive industry and market
capitalization representation. Utilizing ESGReveal unearthed significant
insights into ESG reporting with GPT-4, demonstrating an accuracy of 76.9% in
data extraction and 83.7% in disclosure analysis, which is an improvement over
baseline models. This highlights the framework's capacity to refine ESG data
analysis precision. Moreover, it revealed a demand for reinforced ESG
disclosures, with environmental and social data disclosures standing at 69.5%
and 57.2%, respectively, suggesting a pursuit for more corporate transparency.
While current iterations of ESGReveal do not process pictorial information, a
functionality intended for future enhancement, the study calls for continued
research to further develop and compare the analytical capabilities of various
LLMs. In summary, ESGReveal is a stride forward in ESG data processing,
offering stakeholders a sophisticated tool to better evaluate and advance
corporate sustainability efforts. Its evolution is promising in promoting
transparency in corporate reporting and aligning with broader sustainable
development aims.
- Abstract(参考訳): esgrevealは、企業報告から環境・社会・ガバナンス(esg)データを効率的に抽出・分析するための革新的な手法であり、信頼性の高いesg情報検索の必要性に資する。
このアプローチは、検索拡張生成(RAG)技術で強化されたLarge Language Models (LLM)を利用する。
ESGRevealシステムは、ターゲットクエリのためのESGメタデータモジュール、データベースを組み立てる前処理モジュール、データ抽出のためのLLMエージェントを含む。
その効果は、2022年に香港証券取引所に上場した166社のesgレポートを用いて評価され、包括的産業と市場資本の表現が保証された。
ESGRevealを利用することで、GPT-4によるESGレポートに関する重要な洞察が得られ、データ抽出の76.9%、開示分析の83.7%が得られた。
これはesgデータ分析精度を洗練するフレームワークの能力を強調している。
さらに、環境および社会データの開示がそれぞれ69.5%、57.2%と強化ESG開示の需要が明らかにされ、企業透明性の追求が示唆された。
ESGRevealの現在のイテレーションでは、将来の拡張を意図した機能である画像情報を処理していないが、研究は、様々なLLMの分析能力をさらに発展させ比較することを求めている。
まとめると、ESGRevealはESGデータ処理の進歩であり、利害関係者に企業サステナビリティの取り組みをよりよく評価し前進させるための洗練されたツールを提供する。
その進化は、企業報告の透明性を促進し、より広範な持続可能な開発目標に合わせることに有望である。
関連論文リスト
- Trustworthiness in Retrieval-Augmented Generation Systems: A Survey [59.26328612791924]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の開発において、急速に重要なパラダイムへと成長してきた。
本稿では,RAGシステムの信頼性を,事実性,堅牢性,公正性,透明性,説明責任,プライバシの6つの面で評価する統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-16T09:06:44Z) - DSBench: How Far Are Data Science Agents to Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - Leveraging Natural Language and Item Response Theory Models for ESG Scoring [0.0]
この研究はブラジルの大手石油会社ペトロブラスに関連するポルトガルのニュース記事の包括的データセットを利用している。
データは、高度なNLP法を用いてESG関連感情に対してフィルタリングされ分類される。
その後、ラッシュモデルを用いてこれらのESG測度の心理測定特性を評価する。
論文 参考訳(メタデータ) (2024-07-29T19:02:51Z) - InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling [66.3072381478251]
Reward Hacking(報酬の過度な最適化)は依然として重要な課題だ。
本稿では,報奨モデル,すなわちInfoRMのためのフレームワークを提案する。
InfoRMの過度な最適化検出機構は、有効であるだけでなく、幅広いデータセットにわたって堅牢であることを示す。
論文 参考訳(メタデータ) (2024-02-14T17:49:07Z) - Glitter or Gold? Deriving Structured Insights from Sustainability
Reports via Large Language Models [16.231171704561714]
本研究では,企業のサステナビリティレポートからESGに関する構造化された洞察を抽出するために,情報抽出(IE)手法を用いる。
次に、グラフに基づく表現を活用して、抽出された洞察に関する統計的分析を行う。
論文 参考訳(メタデータ) (2023-10-09T11:34:41Z) - Creating a Systematic ESG (Environmental Social Governance) Scoring
System Using Social Network Analysis and Machine Learning for More
Sustainable Company Practices [0.0]
本研究の目的は,社会的な感情を取り入れることで,より優れたガイダンスとより体系化されたスコアを提供するデータ駆動型ESG評価システムの構築である。
PythonのWebスクレイパーは、Wikipedia、Twitter、LinkedIn、Google NewsからS&P 500企業のデータを収集するために開発された。
機械学習アルゴリズムは、予測能力をテストするために、S&P Global ESG Ratingsにトレーニングされ、校正された。
論文 参考訳(メタデータ) (2023-09-07T20:03:45Z) - Leveraging BERT Language Models for Multi-Lingual ESG Issue
Identification [0.30254881201174333]
投資家は投資選択におけるESG基準の重要性をますます認識している。
ML-ESG(Multi-Lingual ESG Issue Identification)タスクは、ニュース文書を35の異なるESGイシューラベルに分類する。
本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。
論文 参考訳(メタデータ) (2023-09-05T12:48:21Z) - Predicting Companies' ESG Ratings from News Articles Using Multivariate
Timeseries Analysis [17.332692582748408]
我々は,多変量時系列構築と深層学習技術を組み合わせて,ニュース記事からESG評価を予測するモデルを構築した。
約3000の米国企業のニュースデータセットとそのレーティングも作成され、トレーニング用にリリースされている。
提案手法は,手動によるESG評価の判定や分析を支援するために,最先端技術よりも正確な結果を提供する。
論文 参考訳(メタデータ) (2022-11-13T11:23:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。