論文の概要: Nano-ESG: Extracting Corporate Sustainability Information from News Articles
- arxiv url: http://arxiv.org/abs/2412.15093v1
- Date: Thu, 19 Dec 2024 17:43:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:29:19.103450
- Title: Nano-ESG: Extracting Corporate Sustainability Information from News Articles
- Title(参考訳): Nano-ESG:ニュース記事から企業サステナビリティ情報を抽出する
- Authors: Fabian Billert, Stefan Conrad,
- Abstract要約: 我々は、2023年1月から2024年9月までにドイツの大手企業向けに収集された、84万件以上のニュース記事からなる新しいデータセットを提示する。
自然言語処理を併用することにより,まず関連項目を識別し,それらを要約し,持続可能性に関する感情や側面を抽出する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Determining the sustainability impact of companies is a highly complex subject which has garnered more and more attention over the past few years. Today, investors largely rely on sustainability-ratings from established rating-providers in order to analyze how responsibly a company acts. However, those ratings have recently been criticized for being hard to understand and nearly impossible to reproduce. An independent way to find out about the sustainability practices of companies lies in the rich landscape of news article data. In this paper, we explore a different approach to identify key opportunities and challenges of companies in the sustainability domain. We present a novel dataset of more than 840,000 news articles which were gathered for major German companies between January 2023 and September 2024. By applying a mixture of Natural Language Processing techniques, we first identify relevant articles, before summarizing them and extracting their sustainability-related sentiment and aspect using Large Language Models (LLMs). Furthermore, we conduct an evaluation of the obtained data and determine that the LLM-produced answers are accurate. We release both datasets at https://github.com/Bailefan/Nano-ESG.
- Abstract(参考訳): 企業の持続可能性への影響を決定することは、ここ数年でますます注目を集めている非常に複雑な課題である。
今日、投資家は企業がどのように振る舞うかを分析するために、既存の格付け会社からの持続可能性評価に大きく依存している。
しかし、これらの評価は理解が困難であり、ほぼ再現不可能であるとして最近批判されている。
企業のサステナビリティプラクティスを知るための独立した方法は、ニュース記事データのリッチな景観にあります。
本稿では,サステナビリティ分野の企業にとって重要な機会と課題を特定するための,異なるアプローチについて検討する。
我々は、2023年1月から2024年9月までにドイツの大手企業向けに収集された、84万件以上のニュース記事からなる新しいデータセットを提示する。
自然言語処理を併用することにより,まず関連項目を識別し,それらを要約し,その持続可能性に関する感情や側面をLarge Language Models (LLMs) を用いて抽出する。
さらに、得られたデータの評価を行い、LLMが生成した回答が正確であることを判断する。
どちらのデータセットもhttps://github.com/Bailefan/Nano-ESGでリリースしています。
関連論文リスト
- Glitter or Gold? Deriving Structured Insights from Sustainability
Reports via Large Language Models [16.231171704561714]
本研究では,企業のサステナビリティレポートからESGに関する構造化された洞察を抽出するために,情報抽出(IE)手法を用いる。
次に、グラフに基づく表現を活用して、抽出された洞察に関する統計的分析を行う。
論文 参考訳(メタデータ) (2023-10-09T11:34:41Z) - CSPRD: A Financial Policy Retrieval Dataset for Chinese Stock Market [61.59326951366202]
我々は、中国株式政策検索データセット(CSPRD)を導入して、新たな課題である政策検索を提案する。
CSPRDは、中国の政策コーパスの10k以上の項目から、経験豊富な専門家によってラベル付けされた700以上のパスを提供する。
我々の最高のパフォーマンスベースラインは56.1% MRR@10、28.5% NDCG@10、37.5% Recall@10、80.6% Precision@10である。
論文 参考訳(メタデータ) (2023-09-08T15:40:54Z) - CHATREPORT: Democratizing Sustainability Disclosure Analysis through
LLM-based Tools [10.653984116770234]
ChatReportは、企業サステナビリティレポートの分析を自動化するLLMベースの新しいシステムである。
提案手法,注釈付きデータセット,および1015件のレポートを公開して分析する。
論文 参考訳(メタデータ) (2023-07-28T18:58:16Z) - L-Eval: Instituting Standardized Evaluation for Long Context Language
Models [91.05820785008527]
長い文脈言語モデル(LCLM)のより標準化された評価を行うためにL-Evalを提案する。
20のサブタスク、508の長いドキュメント、2000以上の人間ラベルのクエリ応答対を含む新しい評価スイートを構築した。
その結果、一般的なn-gramマッチングの指標は人間の判断とよく相関しないことがわかった。
論文 参考訳(メタデータ) (2023-07-20T17:59:41Z) - Paradigm Shift in Sustainability Disclosure Analysis: Empowering
Stakeholders with CHATREPORT, a Language Model-Based Tool [10.653984116770234]
本稿では,企業サステナビリティレポートの分析を自動化するために,専門知識を持つ大規模言語モデル(LLM)を強化する新たなアプローチを提案する。
当社はCHATREPORTを認定し、企業における気候変動リスクの開示を評価するための第1のユースケースに適用する。
論文 参考訳(メタデータ) (2023-06-27T14:46:47Z) - Sentiment Analysis in the Era of Large Language Models: A Reality Check [69.97942065617664]
本稿では,大規模言語モデル(LLM)の様々な感情分析タスクの実行能力について検討する。
26のデータセット上の13のタスクのパフォーマンスを評価し、ドメイン固有のデータセットに基づいて訓練された小言語モデル(SLM)と比較した。
論文 参考訳(メタデータ) (2023-05-24T10:45:25Z) - sustain.AI: a Recommender System to analyze Sustainability Reports [0.2479153065703935]
sustainAIは、監査人や金融投資家を支援するインテリジェントでコンテキスト対応のレコメンデーションシステムである。
我々は,ドイツの新しいサステナビリティレポートデータセットを2つ評価し,高いレコメンデーション性能を継続的に達成した。
論文 参考訳(メタデータ) (2023-05-15T15:16:19Z) - MER 2023: Multi-label Learning, Modality Robustness, and Semi-Supervised
Learning [90.17500229142755]
第1回マルチモーダル感情認識チャレンジ(MER 2023)は、ACMマルチメディアで成功した。
本稿では、この課題の背景にある動機を紹介し、ベンチマークデータセットを説明し、参加者に関する統計情報を提供する。
この高品質なデータセットは、特に中国の研究コミュニティにとって、マルチモーダルな感情認識の新しいベンチマークになり得ると考えています。
論文 参考訳(メタデータ) (2023-04-18T13:23:42Z) - Predicting Companies' ESG Ratings from News Articles Using Multivariate
Timeseries Analysis [17.332692582748408]
我々は,多変量時系列構築と深層学習技術を組み合わせて,ニュース記事からESG評価を予測するモデルを構築した。
約3000の米国企業のニュースデータセットとそのレーティングも作成され、トレーニング用にリリースされている。
提案手法は,手動によるESG評価の判定や分析を支援するために,最先端技術よりも正確な結果を提供する。
論文 参考訳(メタデータ) (2022-11-13T11:23:02Z) - GreenDB -- A Dataset and Benchmark for Extraction of Sustainability
Information of Consumer Goods [58.31888171187044]
毎週、ヨーロッパのオンラインショップから商品を収集するデータベースであるGreenDBを提示する。
製品サステナビリティのプロキシとして、専門家が評価するサステナビリティラベルに依存している。
本稿では,データを用いてトレーニングしたMLモデルを用いて,製品のサステナビリティラベルを確実に予測できることを示す。
論文 参考訳(メタデータ) (2022-07-21T19:59:42Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。