Fugu-MT 論文翻訳(概要): Leveraging BERT Language Models for Multi-Lingual ESG Issue Identification

論文の概要: Leveraging BERT Language Models for Multi-Lingual ESG Issue Identification

arxiv url: http://arxiv.org/abs/2309.02189v1
Date: Tue, 5 Sep 2023 12:48:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-06 14:56:20.911266
Title: Leveraging BERT Language Models for Multi-Lingual ESG Issue Identification
Title（参考訳）: 多言語ESG問題同定のためのBERT言語モデルの活用
Authors: Elvys Linhares Pontes, Mohamed Benjannet, Lam Kim Ming
Abstract要約: 投資家は投資選択におけるESG基準の重要性をますます認識している。 ML-ESG(Multi-Lingual ESG Issue Identification)タスクは、ニュース文書を35の異なるESGイシューラベルに分類する。本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。
参考スコア（独自算出の注目度）: 0.30254881201174333
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Environmental, Social, and Governance (ESG) has been used as a metric to measure the negative impacts and enhance positive outcomes of companies in areas such as the environment, society, and governance. Recently, investors have increasingly recognized the significance of ESG criteria in their investment choices, leading businesses to integrate ESG principles into their operations and strategies. The Multi-Lingual ESG Issue Identification (ML-ESG) shared task encompasses the classification of news documents into 35 distinct ESG issue labels. In this study, we explored multiple strategies harnessing BERT language models to achieve accurate classification of news documents across these labels. Our analysis revealed that the RoBERTa classifier emerged as one of the most successful approaches, securing the second-place position for the English test dataset, and sharing the fifth-place position for the French test dataset. Furthermore, our SVM-based binary model tailored for the Chinese language exhibited exceptional performance, earning the second-place rank on the test dataset.
Abstract（参考訳）: 環境、社会、ガバナンス(ESG)は、環境、社会、ガバナンスといった分野における企業の負の影響を測定し、ポジティブな結果を高めるための指標として使われてきた。近年、投資家は投資選択におけるESG基準の重要性をますます認識し、ビジネスがESG原則を運用戦略に組み込むようになっている。多言語ESG課題識別(ML-ESG: Multi-Lingual ESG Issue Identification)は、ニュース文書を35の異なるESG課題ラベルに分類するタスクである。本研究では,BERT言語モデルを用いた複数の手法を探索し,これらのラベル間のニュース文書の正確な分類を実現する。分析の結果,RoBERTa分類器は最も成功した手法の1つであり,英語テストデータセットでは第2位,フランス語テストデータセットでは第5位であった。さらに、中国語に適したSVMベースのバイナリモデルでは、例外的な性能を示し、テストデータセットで2位となった。

関連論文リスト

Expanding LLM Agent Boundaries with Strategy-Guided Exploration [51.98616048282804]
強化学習(RL)は、コンピュータ使用、ツール呼び出し、コーディングなどのタスクのエージェントとして、大規模言語モデル(LLM)の訓練後において顕著な成功を収めた。我々は,低レベルな行動から高レベルな言語戦略に移行するための戦略ガイド探索(SGE)を提案する。
論文参考訳（メタデータ） (2026-03-02T16:28:39Z)
FORGE: Forming Semantic Identifiers for Generative Retrieval in Industrial Datasets [64.51403245281547]
FORGEは、産業データセットを使ったジェネレーティブrEtrievalにおけるFOrmingセマンティック識別のベンチマークである。現実世界のアプリケーションでは、オンラインコンバージェンスを半減するオフライン事前トレーニングスキーマが導入されている。
論文参考訳（メタデータ） (2025-09-25T08:44:22Z)
Benchmarking Multimodal Understanding and Complex Reasoning for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。 MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。 MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文参考訳（メタデータ） (2025-07-25T03:58:07Z)
ESGenius: Benchmarking LLMs on Environmental, Social, and Governance (ESG) and Sustainability Knowledge [53.18163869901266]
ESGeniusは、環境・社会・ガバナンス(ESG)における大規模言語モデル(LLM)の熟練度の評価と向上のためのベンチマークである。 ESGeniusはESGenius-QAとESGenius-Corpusの2つの重要なコンポーネントから構成される。
論文参考訳（メタデータ） (2025-06-02T13:19:09Z)
Multilingual Retrieval-Augmented Generation for Knowledge-Intensive Task [73.35882908048423]
Retrieval-augmented Generation (RAG) は現代のNLPの基盤となっている。本稿では,複数言語にまたがるRAGの有効性について,複数言語にまたがるオープンドメイン問合せに対する新しいアプローチを提案する。
論文参考訳（メタデータ） (2025-04-04T17:35:43Z)
Evaluating the performance of state-of-the-art esg domain-specific pre-trained large language models in text classification against existing models and traditional machine learning techniques [0.0]
本研究では,テキスト開示における環境・社会・ガバナンス情報(ESG)の分類について検討する。本研究の目的は,E,S,G関連コンテンツをそれぞれ正確に識別・分類できるバイナリ分類モデルを開発し,評価することである。この研究の動機は、投資決定におけるESGの考慮と企業説明責任の増大に起因している。
論文参考訳（メタデータ） (2024-09-30T20:08:32Z)
ESG-FTSE: A corpus of news articles with ESG relevance labels and use cases [1.3937696730884712]
環境・社会・ガバナンス(ESG)関連アノテーションによるニュース記事からなる最初のコーパスであるESG-FTSEについて述べる。これにより、投資の資格を社会的責任として評価するESGスコアが上昇した。量的手法はESGのスコアを改善するために適用することができ、そのため、責任ある投資を行うことができる。
論文参考訳（メタデータ） (2024-05-30T16:19:02Z)
Enhancing ESG Impact Type Identification through Early Fusion and Multilingual Models [4.97890110201934]
本稿では,アンサンブル学習技術を活用し,早期・後期の融合アプローチを活かした包括的システムを提案する。提案手法では,mBERT,FrauBERT-base,ALBERT-base-v2,Latent Semantic Analysis (LSA) とTerm Frequency-Inverse Document Frequency (TF-IDF) の4つの異なるモデルを用いている。 LSA、TF-IDF、mBERT、FrauBERT-base、ALBERT-base-v2を統合した初期の融合アンサンブルアプローチは、より広範な実験によって実現されている。
論文参考訳（メタデータ） (2024-02-16T15:54:24Z)
EaSyGuide : ESG Issue Identification Framework leveraging Abilities of Generative Large Language Models [5.388543737855513]
本稿では,多言語環境・社会・コーポレートガバナンス問題識別(ML-ESG)におけるFinNLP-2023共有課題への参加について述べる。課題は、MSCI ESG評価ガイドラインで定義された35のESGキーイシューに基づいて、ニュース記事の分類を行うことである。我々のアプローチは、ゼロショットとGPT3Mix拡張技術とともに、CerebrasGPT、OPT、Pythiaモデルを採用した英語とフランス語のサブタスクに焦点を当てている。
論文参考訳（メタデータ） (2023-06-11T12:25:02Z)
IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文参考訳（メタデータ） (2023-04-20T20:30:34Z)
Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文参考訳（メタデータ） (2022-04-10T21:46:52Z)
ESGBERT: Language Model to Help with Classification Tasks Related to Companies Environmental, Social, and Governance Practices [0.0]
環境、社会、ガバナンス(ESG)といった非金融要因が投資家から注目を集めている。 ESGテキストの分類タスクには高度なNLP技術が必要である。本研究では,ESG 固有のテキストを用いて事前学習した BERT の重み付けを微調整し,さらに分類タスクのためのモデルを微調整することによってこれを行う。
論文参考訳（メタデータ） (2022-03-31T04:22:44Z)
A Unified Strategy for Multilingual Grammatical Error Correction with Pre-trained Cross-Lingual Language Model [100.67378875773495]
本稿では,多言語文法的誤り訂正のための汎用的かつ言語に依存しない戦略を提案する。我々の手法は言語固有の操作を使わずに多様な並列GECデータを生成する。 NLPCC 2018 Task 2のデータセット(中国語)で最先端の結果を達成し、Falko-Merlin(ドイツ語)とRULEC-GEC(ロシア語)の競合性能を得る。
論文参考訳（メタデータ） (2022-01-26T02:10:32Z)
CUGE: A Chinese Language Understanding and Generation Evaluation Benchmark [144.05723617401674]
汎用言語インテリジェンス評価は、自然言語処理の長年の目標である。汎用言語インテリジェンス評価には,ベンチマーク自体が包括的で体系的なものである必要がある,と我々は主張する。以下に示す機能を備えた中国語理解・生成評価ベンチマークであるCUGEを提案する。
論文参考訳（メタデータ） (2021-12-27T11:08:58Z)
Guiding Generative Language Models for Data Augmentation in Few-Shot Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文参考訳（メタデータ） (2021-11-17T12:10:03Z)
DAGA: Data Augmentation with a Generation Approach for Low-resource Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文参考訳（メタデータ） (2020-11-03T07:49:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。