論文の概要: Glitter or Gold? Deriving Structured Insights from Sustainability
Reports via Large Language Models
- arxiv url: http://arxiv.org/abs/2310.05628v1
- Date: Mon, 9 Oct 2023 11:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 05:19:38.641264
- Title: Glitter or Gold? Deriving Structured Insights from Sustainability
Reports via Large Language Models
- Title(参考訳): GlitterかGoldか?
大規模言語モデルによるサステナビリティレポートからの構造化された洞察の導出
- Authors: Marco Bronzini, Carlo Nicolini, Bruno Lepri, Andrea Passerini, Jacopo
Staiano
- Abstract要約: 情報抽出(IE)技術を用いて,サステナビリティレポートから意味的に構造化された情報を抽出する。
次に、グラフに基づく表現を用いて有意な統計的、類似性、相関分析を生成する。
- 参考スコア(独自算出の注目度): 16.231171704561714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the last decade, several regulatory bodies have started requiring the
disclosure of non-financial information from publicly listed companies, in
light of the investors' increasing attention to Environmental, Social, and
Governance (ESG) issues. Such information is publicly released in a variety of
non-structured and multi-modal documentation. Hence, it is not straightforward
to aggregate and consolidate such data in a cohesive framework to further
derive insights about sustainability practices across companies and markets.
Thus, it is natural to resort to Information Extraction (IE) techniques to
provide concise, informative and actionable data to the stakeholders. Moving
beyond traditional text processing techniques, in this work we leverage Large
Language Models (LLMs), along with prominent approaches such as Retrieved
Augmented Generation and in-context learning, to extract semantically
structured information from sustainability reports. We then adopt graph-based
representations to generate meaningful statistical, similarity and correlation
analyses concerning the obtained findings, highlighting the prominent
sustainability actions undertaken across industries and discussing emerging
similarity and disclosing patterns at company, sector and region levels.
Lastly, we investigate which factual aspects impact the most on companies' ESG
scores using our findings and other company information.
- Abstract(参考訳): 過去10年間で、いくつかの規制機関が、環境・社会・ガバナンス(esg)問題に対する投資家の関心の高まりを踏まえて、上場企業からの非金融情報の開示を要求し始めている。
このような情報は、さまざまな非構造化およびマルチモーダルドキュメントで公開されている。
したがって、企業や市場をまたがる持続可能性プラクティスに関する洞察をさらに導き出すため、結束した枠組みでこれらのデータを集約して統合するのは簡単ではない。
したがって、情報抽出(IE)技術を利用して、ステークホルダーに簡潔で情報的かつ実用的なデータを提供するのは自然なことです。
従来のテキスト処理技術を超えて、この作業では、Retrieved Augmented GenerationやIn-context Learningといった顕著なアプローチとともに、Large Language Models(LLM)を活用して、持続可能性レポートから意味的に構造化された情報を抽出します。
得られた知見について有意義な統計,類似性,相関分析をグラフベース表現に適用し,業界間における顕著な持続可能性行動に注目し,企業,部門,地域レベルでの類似性とパターンの開示について論じた。
最後に,その事実が企業のESGスコアに与える影響を,我々の発見やその他の企業情報を用いて調査する。
関連論文リスト
- Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey [92.36487127683053]
Retrieval-Augmented Generation (RAG)は、AIGC(AIGC)の課題に対処するために設計された高度な技術である。
RAGは信頼性と最新の外部知識を提供し、幻覚を減らし、幅広いタスクで関連するコンテキストを保証する。
RAGの成功と可能性にもかかわらず、最近の研究により、RAGパラダイムはプライバシーの懸念、敵対的攻撃、説明責任の問題など、新たなリスクももたらしていることが示されている。
論文 参考訳(メタデータ) (2025-02-08T06:50:47Z) - Trustworthiness in Retrieval-Augmented Generation Systems: A Survey [59.26328612791924]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の開発において、急速に重要なパラダイムへと成長してきた。
本稿では,RAGシステムの信頼性を,事実性,堅牢性,公正性,透明性,説明責任,プライバシの6つの面で評価する統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-16T09:06:44Z) - Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [46.55831783809377]
大規模言語モデル(LLM)の幻覚を緩和するための効果的なアプローチとして,検索拡張世代(RAG)がますます認識されている。
PruningRAGはマルチグラニュラリティ・プルーニング・ストラテジーを用いて,関連コンテキストをより効果的に統合し,誤った情報に対するネガティブな影響を軽減するためのプラグアンドプレイRAGフレームワークである。
論文 参考訳(メタデータ) (2024-09-03T03:31:37Z) - ESGReveal: An LLM-based approach for extracting structured data from ESG
reports [5.467389155759699]
ESGRevealは企業報告から環境・社会・ガバナンス(ESG)データを効率的に抽出・分析するための革新的な手法である。
このアプローチは、検索拡張生成(RAG)技術で強化されたLarge Language Models (LLM)を利用する。
この効果は、2022年に香港証券取引所に上場した様々な分野の166社のESGレポートを用いて評価された。
論文 参考訳(メタデータ) (2023-12-25T06:44:32Z) - Modeling the Evolutionary Trends in Corporate ESG Reporting: A Study based on Knowledge Management Model [0.08999666725996973]
テク業界の企業1114件のESGレポートを分析し,テキストマイニングによるESGトピックの進化傾向を分析した。
進化の過程において,低環境,中程度のガバナンス,高い社会的特徴に対する均質化効果を発見した。
その結果,ESGレポートでは,企業が産業上の卓越性や専門性にはあまり貢献していないことが示唆された。
論文 参考訳(メタデータ) (2023-09-13T14:54:51Z) - Paradigm Shift in Sustainability Disclosure Analysis: Empowering
Stakeholders with CHATREPORT, a Language Model-Based Tool [10.653984116770234]
本稿では,企業サステナビリティレポートの分析を自動化するために,専門知識を持つ大規模言語モデル(LLM)を強化する新たなアプローチを提案する。
当社はCHATREPORTを認定し、企業における気候変動リスクの開示を評価するための第1のユースケースに適用する。
論文 参考訳(メタデータ) (2023-06-27T14:46:47Z) - Sentiment Analysis in the Era of Large Language Models: A Reality Check [69.97942065617664]
本稿では,大規模言語モデル(LLM)の様々な感情分析タスクの実行能力について検討する。
26のデータセット上の13のタスクのパフォーマンスを評価し、ドメイン固有のデータセットに基づいて訓練された小言語モデル(SLM)と比較した。
論文 参考訳(メタデータ) (2023-05-24T10:45:25Z) - Predicting Companies' ESG Ratings from News Articles Using Multivariate
Timeseries Analysis [17.332692582748408]
我々は,多変量時系列構築と深層学習技術を組み合わせて,ニュース記事からESG評価を予測するモデルを構築した。
約3000の米国企業のニュースデータセットとそのレーティングも作成され、トレーニング用にリリースされている。
提案手法は,手動によるESG評価の判定や分析を支援するために,最先端技術よりも正確な結果を提供する。
論文 参考訳(メタデータ) (2022-11-13T11:23:02Z) - GENEVA: Benchmarking Generalizability for Event Argument Extraction with
Hundreds of Event Types and Argument Roles [77.05288144035056]
Event Argument extract (EAE)は、新しいイベントやドメインに対応するためのモデルの一般化性の改善に重点を置いている。
ACEやEREといった標準的なベンチマークデータセットは、40のイベントタイプと25のエンティティ中心の引数ロールをカバーする。
論文 参考訳(メタデータ) (2022-05-25T05:46:28Z) - Survey of Aspect-based Sentiment Analysis Datasets [55.61047894397937]
アスペクトベースの感情分析(ABSA)は、ユーザ生成レビューの分析を必要とする自然言語処理の問題である。
ABSAの多くの散在したコーパスは、研究者が特定のABSAサブタスクに適したコーパスを素早く特定することを困難にしている。
本研究では,自律型ABSAシステムの学習・評価に使用できるコーパスデータベースを提案する。
論文 参考訳(メタデータ) (2022-04-11T16:23:36Z) - Heterogeneous Ensemble for ESG Ratings Prediction [1.9659095632676094]
投資家は環境、社会、ガバナンスの側面に沿って評価を発行する専門格付け機関に頼っている。
評価機関は、すべての会社が提供するものではなく、サステナビリティレポートの主観評価に基づく分析を行っている。
基礎データを用いてESG評価の予測を行うヘテロジニアスアンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2021-09-21T10:42:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。