論文の概要: Leveraging BERT Language Models for Multi-Lingual ESG Issue
Identification
- arxiv url: http://arxiv.org/abs/2309.02189v1
- Date: Tue, 5 Sep 2023 12:48:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 14:56:20.911266
- Title: Leveraging BERT Language Models for Multi-Lingual ESG Issue
Identification
- Title(参考訳): 多言語ESG問題同定のためのBERT言語モデルの活用
- Authors: Elvys Linhares Pontes, Mohamed Benjannet, Lam Kim Ming
- Abstract要約: 投資家は投資選択におけるESG基準の重要性をますます認識している。
ML-ESG(Multi-Lingual ESG Issue Identification)タスクは、ニュース文書を35の異なるESGイシューラベルに分類する。
本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。
- 参考スコア(独自算出の注目度): 0.30254881201174333
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Environmental, Social, and Governance (ESG) has been used as a metric to
measure the negative impacts and enhance positive outcomes of companies in
areas such as the environment, society, and governance. Recently, investors
have increasingly recognized the significance of ESG criteria in their
investment choices, leading businesses to integrate ESG principles into their
operations and strategies. The Multi-Lingual ESG Issue Identification (ML-ESG)
shared task encompasses the classification of news documents into 35 distinct
ESG issue labels. In this study, we explored multiple strategies harnessing
BERT language models to achieve accurate classification of news documents
across these labels. Our analysis revealed that the RoBERTa classifier emerged
as one of the most successful approaches, securing the second-place position
for the English test dataset, and sharing the fifth-place position for the
French test dataset. Furthermore, our SVM-based binary model tailored for the
Chinese language exhibited exceptional performance, earning the second-place
rank on the test dataset.
- Abstract(参考訳): 環境、社会、ガバナンス(ESG)は、環境、社会、ガバナンスといった分野における企業の負の影響を測定し、ポジティブな結果を高めるための指標として使われてきた。
近年、投資家は投資選択におけるESG基準の重要性をますます認識し、ビジネスがESG原則を運用戦略に組み込むようになっている。
多言語ESG課題識別(ML-ESG: Multi-Lingual ESG Issue Identification)は、ニュース文書を35の異なるESG課題ラベルに分類するタスクである。
本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。
分析の結果,RoBERTa分類器は最も成功した手法の1つであり,英語テストデータセットでは第2位,フランス語テストデータセットでは第5位であった。
さらに、中国語に適したSVMベースのバイナリモデルでは、例外的な性能を示し、テストデータセットで2位となった。
関連論文リスト
- Evaluating the performance of state-of-the-art esg domain-specific pre-trained large language models in text classification against existing models and traditional machine learning techniques [0.0]
本研究では,テキスト開示における環境・社会・ガバナンス情報(ESG)の分類について検討する。
本研究の目的は,E,S,G関連コンテンツをそれぞれ正確に識別・分類できるバイナリ分類モデルを開発し,評価することである。
この研究の動機は、投資決定におけるESGの考慮と企業説明責任の増大に起因している。
論文 参考訳(メタデータ) (2024-09-30T20:08:32Z) - ESG-FTSE: A corpus of news articles with ESG relevance labels and use cases [1.3937696730884712]
環境・社会・ガバナンス(ESG)関連アノテーションによるニュース記事からなる最初のコーパスであるESG-FTSEについて述べる。
これにより、投資の資格を社会的責任として評価するESGスコアが上昇した。
量的手法はESGのスコアを改善するために適用することができ、そのため、責任ある投資を行うことができる。
論文 参考訳(メタデータ) (2024-05-30T16:19:02Z) - Enhancing ESG Impact Type Identification through Early Fusion and
Multilingual Models [4.97890110201934]
本稿では,アンサンブル学習技術を活用し,早期・後期の融合アプローチを活かした包括的システムを提案する。
提案手法では,mBERT,FrauBERT-base,ALBERT-base-v2,Latent Semantic Analysis (LSA) とTerm Frequency-Inverse Document Frequency (TF-IDF) の4つの異なるモデルを用いている。
LSA、TF-IDF、mBERT、FrauBERT-base、ALBERT-base-v2を統合した初期の融合アンサンブルアプローチは、より広範な実験によって実現されている。
論文 参考訳(メタデータ) (2024-02-16T15:54:24Z) - EaSyGuide : ESG Issue Identification Framework leveraging Abilities of
Generative Large Language Models [5.388543737855513]
本稿では,多言語環境・社会・コーポレートガバナンス問題識別(ML-ESG)におけるFinNLP-2023共有課題への参加について述べる。
課題は、MSCI ESG評価ガイドラインで定義された35のESGキーイシューに基づいて、ニュース記事の分類を行うことである。
我々のアプローチは、ゼロショットとGPT3Mix拡張技術とともに、CerebrasGPT、OPT、Pythiaモデルを採用した英語とフランス語のサブタスクに焦点を当てている。
論文 参考訳(メタデータ) (2023-06-11T12:25:02Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - ESGBERT: Language Model to Help with Classification Tasks Related to
Companies Environmental, Social, and Governance Practices [0.0]
環境、社会、ガバナンス(ESG)といった非金融要因が投資家から注目を集めている。
ESGテキストの分類タスクには高度なNLP技術が必要である。
本研究では,ESG 固有のテキストを用いて事前学習した BERT の重み付けを微調整し,さらに分類タスクのためのモデルを微調整することによってこれを行う。
論文 参考訳(メタデータ) (2022-03-31T04:22:44Z) - A Unified Strategy for Multilingual Grammatical Error Correction with
Pre-trained Cross-Lingual Language Model [100.67378875773495]
本稿では,多言語文法的誤り訂正のための汎用的かつ言語に依存しない戦略を提案する。
我々の手法は言語固有の操作を使わずに多様な並列GECデータを生成する。
NLPCC 2018 Task 2のデータセット(中国語)で最先端の結果を達成し、Falko-Merlin(ドイツ語)とRULEC-GEC(ロシア語)の競合性能を得る。
論文 参考訳(メタデータ) (2022-01-26T02:10:32Z) - CUGE: A Chinese Language Understanding and Generation Evaluation
Benchmark [144.05723617401674]
汎用言語インテリジェンス評価は、自然言語処理の長年の目標である。
汎用言語インテリジェンス評価には,ベンチマーク自体が包括的で体系的なものである必要がある,と我々は主張する。
以下に示す機能を備えた中国語理解・生成評価ベンチマークであるCUGEを提案する。
論文 参考訳(メタデータ) (2021-12-27T11:08:58Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。