論文の概要: Leveraging BERT Language Models for Multi-Lingual ESG Issue
Identification
- arxiv url: http://arxiv.org/abs/2309.02189v1
- Date: Tue, 5 Sep 2023 12:48:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 14:56:20.911266
- Title: Leveraging BERT Language Models for Multi-Lingual ESG Issue
Identification
- Title(参考訳): 多言語ESG問題同定のためのBERT言語モデルの活用
- Authors: Elvys Linhares Pontes, Mohamed Benjannet, Lam Kim Ming
- Abstract要約: 投資家は投資選択におけるESG基準の重要性をますます認識している。
ML-ESG(Multi-Lingual ESG Issue Identification)タスクは、ニュース文書を35の異なるESGイシューラベルに分類する。
本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。
- 参考スコア(独自算出の注目度): 0.30254881201174333
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Environmental, Social, and Governance (ESG) has been used as a metric to
measure the negative impacts and enhance positive outcomes of companies in
areas such as the environment, society, and governance. Recently, investors
have increasingly recognized the significance of ESG criteria in their
investment choices, leading businesses to integrate ESG principles into their
operations and strategies. The Multi-Lingual ESG Issue Identification (ML-ESG)
shared task encompasses the classification of news documents into 35 distinct
ESG issue labels. In this study, we explored multiple strategies harnessing
BERT language models to achieve accurate classification of news documents
across these labels. Our analysis revealed that the RoBERTa classifier emerged
as one of the most successful approaches, securing the second-place position
for the English test dataset, and sharing the fifth-place position for the
French test dataset. Furthermore, our SVM-based binary model tailored for the
Chinese language exhibited exceptional performance, earning the second-place
rank on the test dataset.
- Abstract(参考訳): 環境、社会、ガバナンス(ESG)は、環境、社会、ガバナンスといった分野における企業の負の影響を測定し、ポジティブな結果を高めるための指標として使われてきた。
近年、投資家は投資選択におけるESG基準の重要性をますます認識し、ビジネスがESG原則を運用戦略に組み込むようになっている。
多言語ESG課題識別(ML-ESG: Multi-Lingual ESG Issue Identification)は、ニュース文書を35の異なるESG課題ラベルに分類するタスクである。
本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。
分析の結果,RoBERTa分類器は最も成功した手法の1つであり,英語テストデータセットでは第2位,フランス語テストデータセットでは第5位であった。
さらに、中国語に適したSVMベースのバイナリモデルでは、例外的な性能を示し、テストデータセットで2位となった。
関連論文リスト
- Enhancing ESG Impact Type Identification through Early Fusion and
Multilingual Models [4.97890110201934]
本稿では,アンサンブル学習技術を活用し,早期・後期の融合アプローチを活かした包括的システムを提案する。
提案手法では,mBERT,FrauBERT-base,ALBERT-base-v2,Latent Semantic Analysis (LSA) とTerm Frequency-Inverse Document Frequency (TF-IDF) の4つの異なるモデルを用いている。
LSA、TF-IDF、mBERT、FrauBERT-base、ALBERT-base-v2を統合した初期の融合アンサンブルアプローチは、より広範な実験によって実現されている。
論文 参考訳(メタデータ) (2024-02-16T15:54:24Z) - Towards More Practical Group Activity Detection: A New Benchmark and
Model [67.06883389517986]
グループアクティビティ検出(グループアクティビティ検出、英: Group Activity Detection、GAD)は、ビデオにおいて、各グループのメンバを特定し、同時にグループのアクティビティを分類するタスクである。
Caf'eと呼ばれる新しいデータセットを提示し、より実用的な評価シナリオとメトリクスを提示します。
また、未知数のグループと潜在グループメンバーを効率的に効率的に扱う新しいGADモデルを提案する。
論文 参考訳(メタデータ) (2023-12-05T16:48:17Z) - Glitter or Gold? Deriving Structured Insights from Sustainability
Reports via Large Language Models [16.231171704561714]
本研究では,企業のサステナビリティレポートからESGに関する構造化された洞察を抽出するために,情報抽出(IE)手法を用いる。
次に、グラフに基づく表現を活用して、抽出された洞察に関する統計的分析を行う。
論文 参考訳(メタデータ) (2023-10-09T11:34:41Z) - EaSyGuide : ESG Issue Identification Framework leveraging Abilities of
Generative Large Language Models [5.388543737855513]
本稿では,多言語環境・社会・コーポレートガバナンス問題識別(ML-ESG)におけるFinNLP-2023共有課題への参加について述べる。
課題は、MSCI ESG評価ガイドラインで定義された35のESGキーイシューに基づいて、ニュース記事の分類を行うことである。
我々のアプローチは、ゼロショットとGPT3Mix拡張技術とともに、CerebrasGPT、OPT、Pythiaモデルを採用した英語とフランス語のサブタスクに焦点を当てている。
論文 参考訳(メタデータ) (2023-06-11T12:25:02Z) - Predicting Companies' ESG Ratings from News Articles Using Multivariate
Timeseries Analysis [17.332692582748408]
我々は,多変量時系列構築と深層学習技術を組み合わせて,ニュース記事からESG評価を予測するモデルを構築した。
約3000の米国企業のニュースデータセットとそのレーティングも作成され、トレーニング用にリリースされている。
提案手法は,手動によるESG評価の判定や分析を支援するために,最先端技術よりも正確な結果を提供する。
論文 参考訳(メタデータ) (2022-11-13T11:23:02Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - ESGBERT: Language Model to Help with Classification Tasks Related to
Companies Environmental, Social, and Governance Practices [0.0]
環境、社会、ガバナンス(ESG)といった非金融要因が投資家から注目を集めている。
ESGテキストの分類タスクには高度なNLP技術が必要である。
本研究では,ESG 固有のテキストを用いて事前学習した BERT の重み付けを微調整し,さらに分類タスクのためのモデルを微調整することによってこれを行う。
論文 参考訳(メタデータ) (2022-03-31T04:22:44Z) - A Unified Strategy for Multilingual Grammatical Error Correction with
Pre-trained Cross-Lingual Language Model [100.67378875773495]
本稿では,多言語文法的誤り訂正のための汎用的かつ言語に依存しない戦略を提案する。
我々の手法は言語固有の操作を使わずに多様な並列GECデータを生成する。
NLPCC 2018 Task 2のデータセット(中国語)で最先端の結果を達成し、Falko-Merlin(ドイツ語)とRULEC-GEC(ロシア語)の競合性能を得る。
論文 参考訳(メタデータ) (2022-01-26T02:10:32Z) - CUGE: A Chinese Language Understanding and Generation Evaluation
Benchmark [144.05723617401674]
汎用言語インテリジェンス評価は、自然言語処理の長年の目標である。
汎用言語インテリジェンス評価には,ベンチマーク自体が包括的で体系的なものである必要がある,と我々は主張する。
以下に示す機能を備えた中国語理解・生成評価ベンチマークであるCUGEを提案する。
論文 参考訳(メタデータ) (2021-12-27T11:08:58Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。