論文の概要: Environmental, Social and Governance Sentiment Analysis on Slovene News: A Novel Dataset and Models
- arxiv url: http://arxiv.org/abs/2604.06826v1
- Date: Wed, 08 Apr 2026 08:42:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.432607
- Title: Environmental, Social and Governance Sentiment Analysis on Slovene News: A Novel Dataset and Models
- Title(参考訳): スロベニアのニュースにおける環境・社会・ガバナンスの感性分析:新しいデータセットとモデル
- Authors: Paula Dodig, Boshko Koloski, Katarina Sitar Šuštar, Senja Pollak, Matthew Purver,
- Abstract要約: 我々は、Slovene ESG感情データセットと、自動ESG感情検出のための一連のモデルを紹介する。
このデータセットは、MaCoCu Sloveneニュースコレクションから派生したもので、大きな言語モデル(LLM)によるフィルタリングと、企業関連ESGコンテンツの人間のアノテーションを組み合わせる。
- 参考スコア(独自算出の注目度): 7.1882115136129245
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Environmental, Social, and Governance (ESG) considerations are increasingly integral to assessing corporate performance, reputation, and long-term sustainability. Yet, reliable ESG ratings remain limited for smaller companies and emerging markets. We introduce the first publicly available Slovene ESG sentiment dataset and a suite of models for automatic ESG sentiment detection. The dataset, derived from the MaCoCu Slovene news collection, combines large language model (LLM)-assisted filtering with human annotation of company-related ESG content. We evaluate the performance of monolingual (SloBERTa) and multilingual (XLM-R) models, embedding-based classifiers (TabPFN), hierarchical ensemble architectures, and large language models. Results show that LLMs achieve the strongest performance on Environmental (Gemma3-27B, F1-macro: 0.61) and Social aspects (gpt-oss 20B, F1-macro: 0.45), while fine-tuned SloBERTa is the best model on Governance classification (F1-macro: 0.54). We then show in a small case study how the best-preforming classifier (gpt-oss) can be applied to investigate ESG aspects for selected companies across a long time frame.
- Abstract(参考訳): 環境、社会、ガバナンス(ESG)の考察は、企業業績、評価、長期持続可能性を評価する上でますます不可欠になっている。
しかし、ESGの評価は依然として小規模企業や新興市場に限定されている。
我々は、Slovene ESG感情データセットと、自動ESG感情検出のための一連のモデルを紹介する。
このデータセットは、MaCoCu Sloveneニュースコレクションから派生したもので、大きな言語モデル(LLM)によるフィルタリングと、企業関連ESGコンテンツの人間のアノテーションを組み合わせる。
我々は,モノリンガル(SloBERTa)とマルチリンガル(XLM-R)モデル,埋め込み型分類器(TabPFN),階層型アンサンブルアーキテクチャ,大規模言語モデルの性能を評価する。
その結果, LLM は環境(Gemma3-27B, F1-macro: 0.61) と社会的側面(gpt-oss 20B, F1-macro: 0.45) で最高の性能を示し, SloBERTa は分類の最良のモデルである(F1-macro: 0.54)。
次に, 長期にわたる選択企業におけるESGの側面を調査するために, 最適予測分類器(gpt-oss)をいかに適用できるかを, 小ケーススタディで示す。
関連論文リスト
- EulerESG: Automating ESG Disclosure Analysis with LLMs [18.29247438372126]
ESG開示分析を自動化するLLM方式であるbftextEulerESGを提案する。
我々は,EulerESGが高忠実度で標準整列距離表を自動生成できることを示す。
論文 参考訳(メタデータ) (2025-11-18T12:35:44Z) - ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge [40.49917730563565]
ESGeniusは、環境、社会、ガバナンス(ESG)における大規模言語モデル(LLM)の熟練度の評価と向上のための総合的なベンチマークである。
ESGenius-QA (i) ESGenius-QA (i) ESGenius-QA (i) esGenius-QA (i) esGenius-QA (i) esGenius-QA (i) esGenius-QA (i) esGenius-QA (i) esGenius-QA (i) esGenius-Corpus (i) ESGenius-Corpus (i) ESGenius-Corpusは231の基本的なフレームワーク、標準、レポート、レコメンデーションドキュメントを、7つの権威あるソースから収集した。
論文 参考訳(メタデータ) (2025-06-02T13:19:09Z) - SCAN: Structured Capability Assessment and Navigation for LLMs [54.54085382131134]
textbfSCAN (Structured Capability Assessment and Navigation) は、大規模言語モデルの詳細な特徴付けを可能にする実用的なフレームワークである。
SCANには4つの重要なコンポーネントが含まれている。
TaxBuilder – クエリから機能表示タグを抽出して階層的な分類構造を構築する。
RealMixは、各機能タグに対する十分な評価データを保証するクエリ合成とフィルタリングのメカニズムである。
PC$2$ベースのLCM-as-a-Judge法は従来のLCM-as-a-Judge法と比較して大幅に精度が向上する
論文 参考訳(メタデータ) (2025-05-10T16:52:40Z) - Evaluating the performance of state-of-the-art esg domain-specific pre-trained large language models in text classification against existing models and traditional machine learning techniques [0.0]
本研究では,テキスト開示における環境・社会・ガバナンス情報(ESG)の分類について検討する。
本研究の目的は,E,S,G関連コンテンツをそれぞれ正確に識別・分類できるバイナリ分類モデルを開発し,評価することである。
この研究の動機は、投資決定におけるESGの考慮と企業説明責任の増大に起因している。
論文 参考訳(メタデータ) (2024-09-30T20:08:32Z) - LangSuitE: Planning, Controlling and Interacting with Large Language Models in Embodied Text Environments [70.91258869156353]
テキストエンボディの世界における6つの代表的具体的タスクを特徴とする多目的・シミュレーション不要なテストベッドであるLangSuitEを紹介する。
以前のLLMベースのテストベッドと比較すると、LangSuitEは複数のシミュレーションエンジンを使わずに、多様な環境への適応性を提供する。
具体化された状態の履歴情報を要約した新しいチェーン・オブ・ソート(CoT)スキーマであるEmMemを考案する。
論文 参考訳(メタデータ) (2024-06-24T03:36:29Z) - Leveraging BERT Language Models for Multi-Lingual ESG Issue
Identification [0.30254881201174333]
投資家は投資選択におけるESG基準の重要性をますます認識している。
ML-ESG(Multi-Lingual ESG Issue Identification)タスクは、ニュース文書を35の異なるESGイシューラベルに分類する。
本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。
論文 参考訳(メタデータ) (2023-09-05T12:48:21Z) - GCoNet+: A Stronger Group Collaborative Co-Salient Object Detector [156.43671738038657]
本稿では,GCoNet+と呼ばれる新しいグループ協調学習ネットワークを提案する。
GCoNet+は自然界における共存対象を効果的かつ効率的に識別することができる。
論文 参考訳(メタデータ) (2022-05-30T23:49:19Z) - The GEM Benchmark: Natural Language Generation, its Evaluation and
Metrics [66.96150429230035]
我々は、自然言語生成(NLG)のための生きたベンチマークであるGEM、その評価、およびメトリクスを紹介する。
ベンチマークの定期的なアップデートにより、NLGの研究はより多言語化され、モデルとともに課題を進化させる。
論文 参考訳(メタデータ) (2021-02-02T18:42:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。