論文の概要: LLM-guided Semi-Supervised Approaches for Social Media Crisis Data Classification
- arxiv url: http://arxiv.org/abs/2605.08448v1
- Date: Fri, 08 May 2026 20:15:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.652784
- Title: LLM-guided Semi-Supervised Approaches for Social Media Crisis Data Classification
- Title(参考訳): ソーシャルメディア危機データ分類のためのLLM誘導半監督的アプローチ
- Authors: Jacob Ativo, Bharaneeshwar Balasubramaniyam, Anh Tran, Khushboo Gupta, Hongmin Li, Doina Caragea, Cornelia Caragea,
- Abstract要約: 本稿では,大規模言語モデル(LLM)による危機関連つぶやき分類のための半教師付き学習の実証評価を行った。
以上の結果から,LG-CoTrainはリソース設定の低さにおいて,従来の半教師付きアプローチよりも優れていた。
コンパクトな半教師付きモデルは、場合によっては、ゼロショット設定で動作する非常に大きなLLMよりも優れている。
- 参考スコア(独自算出の注目度): 43.732252043913284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised learning approaches have been investigated as a means to enhance the analysis of social media data in disaster management contexts. In this work, we present the first empirical evaluation of large language model (LLM) guided semi-supervised learning for crisis related tweet classification. We compare two recent LLM assisted semi-supervised methods, VerifyMatch and LLM guided Co-Training ( LG-CoTrain), against established semi-supervised baselines. Our results show that LG-CoTrain significantly outperforms classical semi-supervised approaches in low resource settings with 5, 10 and 25 labeled examples per class, achieving the highest averaged Macro F1 across events. VerifyMatch achieves competitive performance while also demonstrating strong calibration properties. As the number of labeled examples increases, the performance gap narrows and Self Training emerges as a strong baseline. We further observe that compact semi-supervised models can, in some cases, outperform very large LLMs operating in zero-shot settings. This finding highlights the potential of transferring knowledge from LLMs into smaller and more deployable models through LLM guided semi-supervised learning, offering a practical pathway for real world disaster response applications. Our project repository on Github is here.
- Abstract(参考訳): 半教師付き学習アプローチは,災害管理におけるソーシャルメディアデータの分析を強化する手段として研究されている。
本研究では,大規模言語モデル(LLM)による危機関連ツイート分類のための半教師付き学習の実証評価を行った。
我々は,最近のLLM支援半教師付き手法であるVerifyMatchとLLMガイド付きコトレーニング(LG-CoTrain)を,既存の半教師付きベースラインと比較した。
以上の結果から,LG-CoTrainは,クラス毎の5,10,25のラベル付き例において,従来の半教師付きアプローチよりも有意に優れており,イベントごとの平均値であるマクロF1を達成できた。
VerifyMatchは、強力なキャリブレーション特性を示しながら、競争性能を達成する。
ラベル付きサンプルの数が増えるにつれて、パフォーマンスギャップが狭まり、セルフトレーニングが強力なベースラインとして現れます。
さらに、コンパクトな半教師付きモデルでは、ゼロショット設定で動作する非常に大きなLLMよりも優れた性能が得られることを観察する。
この発見は、LLMからより小型でデプロイ可能なモデルに、LLMガイド付き半教師付き学習を通じて知識を移行する可能性を強調し、現実の災害対応アプリケーションのための実践的な経路を提供する。
Githubのプロジェクトリポジトリはこちらです。
関連論文リスト
- Satori: Reinforcement Learning with Chain-of-Action-Thought Enhances LLM Reasoning via Autoregressive Search [57.28671084993782]
大規模言語モデル(LLM)は、様々な領域にまたがる顕著な推論能力を示している。
近年の研究では、テスト時間計算の増加はLLMの推論能力を高めることが示されている。
そこで我々は,1)COAT推論形式を内部化するための小規模な形式調整段階,2)強化学習を活用した大規模自己改善段階を提案する。
論文 参考訳(メタデータ) (2025-02-04T17:26:58Z) - When Do LLMs Help With Node Classification? A Comprehensive Analysis [21.120619437937382]
我々はLarge Language Models (LLMs) を用いたノード分類のための包括的でテストベッドを開発する。
10のホモ親和性データセット、4つのヘテロ親和性データセット、8つのLLMアルゴリズム、8つの古典的ベースライン、3つの学習パラダイムを含む。
その結果,(1) LLMに基づく手法は, 半教師付き環境では従来手法よりも優れているが, 教師付き環境では優位性が低い, という8つの知見が得られた。
論文 参考訳(メタデータ) (2025-02-02T15:56:05Z) - Unveiling the Secret Recipe: A Guide For Supervised Fine-Tuning Small LLMs [22.177654792824896]
コスト効率とアクセシビリティのために,小型言語モデル(3Bから7Bパラメータ)に焦点を当てた。
オープンソースで事前トレーニングされた4つのモデルに対して,さまざまなトレーニング構成と戦略について検討する。
i) 学習率の低いバッチサイズと組み合わせることで,MMLUやMTBench,Open LLM Leaderboardといったベンチマーク上でのモデルパフォーマンスが向上します。
論文 参考訳(メタデータ) (2024-12-17T21:16:59Z) - A Little Help Goes a Long Way: Efficient LLM Training by Leveraging Small LMs [74.35290684163718]
大規模言語モデル(LLM)開発における最大の課題は、その面倒な事前トレーニングコストである。
本稿では,小言語モデル(SLM)を活用して,LLMの事前学習効率と品質を改善するための有望なパラダイムについて検討する。
論文 参考訳(メタデータ) (2024-10-24T14:31:52Z) - Understanding Forgetting in LLM Supervised Fine-Tuning and Preference Learning - A Convex Optimization Perspective [55.66517396157806]
オープンソースLLMのポストトレーニングにおいて広く採用されているアプローチは、SFTとRLHF/DPOのシーケンシャルな実行である。
これはSFTとRLHF/DPOのトレードオフの点において最適である。
本稿では,理論収束保証と逐次後学習フレームワークの性能を実証的に向上させる,実践的な後学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-20T19:38:41Z) - On Learning to Summarize with Large Language Models as References [101.79795027550959]
大型言語モデル (LLM) は、一般的な要約データセットにおける元の参照要約よりも人間のアノテーションに好まれる。
より小さなテキスト要約モデルに対するLLM-as-reference学習設定について検討し,その性能が大幅に向上するかどうかを検討する。
論文 参考訳(メタデータ) (2023-05-23T16:56:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。