論文の概要: Polarity Detection of Sustainable Detection Goals in News Text
- arxiv url: http://arxiv.org/abs/2509.19833v2
- Date: Thu, 25 Sep 2025 08:37:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 14:16:56.118294
- Title: Polarity Detection of Sustainable Detection Goals in News Text
- Title(参考訳): ニューステキスト中の持続的検出ゴールの極性検出
- Authors: Andrea Cadeddu, Alessandro Chessa, Vincenzo De Leo, Gianni Fenu, Francesco Osborne, Diego Reforgiato Recupero, Angelo Salatino, Luca Secchi,
- Abstract要約: 国連の持続可能な開発目標は、社会的、環境的、経済的課題に対処するための世界的な枠組みを提供する。
自然言語処理(NLP)と大規模言語モデル(LLM)の最近の進歩は、特定のSDGに基づいてテキストデータの自動分類を容易にする。
本稿では,テキストセグメントが特定のSDGに向かって進行を示すか,あるいはその進展を達成する意図を伝達するかを評価するSDG極性検出の新しいタスクを提案する。
本研究は、持続可能性モニタリングのための方法論ツールキットを進歩させ、効率的で高性能な極性検出システムの開発に関する実用的な知見を提供する。
- 参考スコア(独自算出の注目度): 38.03224707532651
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The United Nations' Sustainable Development Goals (SDGs) provide a globally recognised framework for addressing critical societal, environmental, and economic challenges. Recent developments in natural language processing (NLP) and large language models (LLMs) have facilitated the automatic classification of textual data according to their relevance to specific SDGs. Nevertheless, in many applications, it is equally important to determine the directionality of this relevance; that is, to assess whether the described impact is positive, neutral, or negative. To tackle this challenge, we propose the novel task of SDG polarity detection, which assesses whether a text segment indicates progress toward a specific SDG or conveys an intention to achieve such progress. To support research in this area, we introduce SDG-POD, a benchmark dataset designed specifically for this task, combining original and synthetically generated data. We perform a comprehensive evaluation using six state-of-the-art large LLMs, considering both zero-shot and fine-tuned configurations. Our results suggest that the task remains challenging for the current generation of LLMs. Nevertheless, some fine-tuned models, particularly QWQ-32B, achieve good performance, especially on specific Sustainable Development Goals such as SDG-9 (Industry, Innovation and Infrastructure), SDG-12 (Responsible Consumption and Production), and SDG-15 (Life on Land). Furthermore, we demonstrate that augmenting the fine-tuning dataset with synthetically generated examples yields improved model performance on this task. This result highlights the effectiveness of data enrichment techniques in addressing the challenges of this resource-constrained domain. This work advances the methodological toolkit for sustainability monitoring and provides actionable insights into the development of efficient, high-performing polarity detection systems.
- Abstract(参考訳): 国連の持続可能な開発目標(SDG)は、社会、環境、経済的課題に対処するための世界的な枠組みを提供する。
自然言語処理(NLP)と大規模言語モデル(LLM)の最近の進歩は、特定のSDGとの関連性に応じてテキストデータの自動分類を容易にする。
しかしながら、多くの応用において、この関係の方向性を決定することは同様に重要であり、すなわち、記述された影響が正か中立か負かを評価することである。
この課題に対処するために,テキストセグメントが特定のSDGに向かって進行を示すか,あるいはそのような進展を達成する意図を伝達するかを評価するSDG極性検出の新しいタスクを提案する。
この領域の研究を支援するために,SDG-POD(SDG-POD)を導入した。
ゼロショット構成と微調整構成の両方を考慮し、6つの最先端大型LCMを用いて包括的評価を行う。
以上の結果から,現在のLLMでは課題が残されていることが示唆された。
しかしながら、いくつかの細調整されたモデル、特にQWQ-32Bは、特にSDG-9(産業、革新、インフラ)、SDG-12(責任ある消費と生産)、SDG-15(土地での生活)のような特定の持続可能な開発目標において、優れた性能を達成している。
さらに, 合成サンプルを用いた微調整データセットの強化により, このタスクにおけるモデル性能が向上することが実証された。
この結果は、このリソース制約されたドメインの課題に対処する上で、データエンリッチメント技術の有効性を強調している。
本研究は、持続可能性モニタリングのための方法論ツールキットを進歩させ、効率的で高性能な極性検出システムの開発に関する実用的な知見を提供する。
関連論文リスト
- NatureGAIA: Pushing the Frontiers of GUI Agents with a Challenging Benchmark and High-Quality Trajectory Dataset [16.676904484703]
本稿ではCausal Pathwaysの原理に基づく新しいベンチマークであるNaturalGAIAを紹介する。
このパラダイムは複雑なタスクを検証可能な一連の原子ステップに構造化し、厳密で完全に自動化され、再現可能な評価基準を保証する。
次に、このデータセットを用いて、Q2.5-VL-7Bモデル上でReinforcement FineTuning(RFT)を行う。
論文 参考訳(メタデータ) (2025-08-02T11:53:41Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Optimizing Large Language Models for ESG Activity Detection in Financial Texts [0.7373617024876725]
本稿では,環境活動に関連するテキストを識別する次世代大規模言語モデルについて検討する。
ESG-ActivitiesはEUのESG分類に従って分類された1,325のラベル付きテキストセグメントを含むベンチマークデータセットである。
実験の結果,ESG-Activitiesの微調整は分類精度を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2025-02-28T14:52:25Z) - LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named
Entity Recognition [67.96794382040547]
$LLM-DA$は、数発のNERタスクのために、大きな言語モデル(LLM)に基づいた、新しいデータ拡張テクニックである。
提案手法では,14のコンテキスト書き換え戦略を採用し,同一タイプのエンティティ置換を設計し,ロバスト性を高めるためにノイズ注入を導入する。
論文 参考訳(メタデータ) (2024-02-22T14:19:56Z) - Harnessing the Web and Knowledge Graphs for Automated Impact Investing
Scoring [2.4107880640624706]
持続可能な開発目標のフレームワークを作成するプロセスを自動化するための,データ駆動システムについて説明する。
本稿では,異なるWebソースからテキストのデータセットを収集・フィルタリングする新しい手法と,企業の集合に関連する知識グラフを提案する。
以上の結果から,我々の最高性能モデルでは,マイクロ平均F1スコア0.89でSDGスコアを正確に予測できることがわかった。
論文 参考訳(メタデータ) (2023-08-04T15:14:16Z) - SustainBench: Benchmarks for Monitoring the Sustainable Development
Goals with Machine Learning [63.192289553021816]
国連持続可能な開発目標の進展は、主要な環境・社会経済指標のデータ不足によって妨げられている。
近年の機械学習の進歩により、衛星やソーシャルメディアなど、豊富な、頻繁に更新され、グローバルに利用可能なデータを活用することが可能になった。
本稿では,7個のSDGにまたがる15個のベンチマークタスクの集合であるSustainBenchを紹介する。
論文 参考訳(メタデータ) (2021-11-08T18:59:04Z) - Natural language processing for achieving sustainable development: the
case of neural labelling to enhance community profiling [2.6734009991058794]
本研究は,NLPによるプロジェクトの持続可能性向上に寄与する可能性を示す。
我々は、先進国と対照的に、顕著なデータギャップが存在する発展途上国におけるコミュニティプロファイリングの事例に焦点を当てる。
極端に多クラスなマルチラベル分類問題である自動PV分類の課題を提案する。
論文 参考訳(メタデータ) (2020-04-27T16:51:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。