論文の概要: LingML: Linguistic-Informed Machine Learning for Enhanced Fake News Detection
- arxiv url: http://arxiv.org/abs/2405.04165v1
- Date: Tue, 7 May 2024 10:03:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-08 14:39:54.612152
- Title: LingML: Linguistic-Informed Machine Learning for Enhanced Fake News Detection
- Title(参考訳): LingML: Fakeニュース検出機能強化のための言語インフォームド機械学習
- Authors: Jasraj Singh, Fang Liu, Hong Xu, Bee Chin Ng, Wei Zhang,
- Abstract要約: 機械学習モデルは偽ニュースを特定するために使われてきたが、精度の制限、解釈可能性、一般化可能性といった問題では完璧ではない。
本稿では,言語入力によるMLベースのソリューションを強化し,偽ニュース検出のための言語インフォームドMLであるLingMLを提案する。
実験の結果,提案手法は非常に有効であることが示され,MLで使用される言語入力のみを用いて10回の試行中2回未満の誤りがあり,その知識は極めて説明しやすい。
- 参考スコア(独自算出の注目度): 7.831737787722193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Nowadays, Information spreads at an unprecedented pace in social media and discerning truth from misinformation and fake news has become an acute societal challenge. Machine learning (ML) models have been employed to identify fake news but are far from perfect with challenging problems like limited accuracy, interpretability, and generalizability. In this paper, we enhance ML-based solutions with linguistics input and we propose LingML, linguistic-informed ML, for fake news detection. We conducted an experimental study with a popular dataset on fake news during the pandemic. The experiment results show that our proposed solution is highly effective. There are fewer than two errors out of every ten attempts with only linguistic input used in ML and the knowledge is highly explainable. When linguistics input is integrated with advanced large-scale ML models for natural language processing, our solution outperforms existing ones with 1.8% average error rate. LingML creates a new path with linguistics to push the frontier of effective and efficient fake news detection. It also sheds light on real-world multi-disciplinary applications requiring both ML and domain expertise to achieve optimal performance.
- Abstract(参考訳): 今日では、ソーシャルメディアでは前例のないペースで情報が広まり、偽情報や偽ニュースから真実を識別することが、深刻な社会的課題となっている。
機械学習(ML)モデルは偽ニュースを特定するために使われてきたが、正確性や解釈可能性、一般化可能性といった難題には程遠い。
本稿では,言語入力によるMLベースのソリューションを強化し,偽ニュース検出のための言語インフォームドMLであるLingMLを提案する。
パンデミック時のフェイクニュースについて,人気データセットを用いて実験を行った。
実験の結果,提案手法は高い有効性を示した。
MLで使用される言語入力だけで10回の試行中2回未満のエラーがあり、その知識は極めて説明可能である。
自然言語処理のための高度な大規模MLモデルと言語入力を統合した場合、我々のソリューションは1.8%のエラー率で既存のモデルより優れている。
LingMLは言語学による新しいパスを作成し、効果的で効率的な偽ニュース検出のフロンティアを推し進める。
また、最適なパフォーマンスを達成するためにMLとドメインの専門知識の両方を必要とする実世界のマルチディシプリナアプリケーションにも光を当てています。
関連論文リスト
- Understanding and Mitigating Language Confusion in LLMs [76.96033035093204]
我々は,既存の英語および多言語プロンプトを用いた15の型的多様言語の評価を行った。
Llama Instruct と Mistral のモデルでは,言語的混乱の度合いが高いことがわかった。
言語混乱は,数発のプロンプト,多言語SFT,選好調整によって部分的に緩和できることがわかった。
論文 参考訳(メタデータ) (2024-06-28T17:03:51Z) - Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models [62.91524967852552]
大規模言語モデル(LLM)は、多言語コーパスの事前訓練のため、一般的に多言語である。
しかし、これらのモデルは言語間で対応する概念を関連付けることができ、効果的にクロスランガルなのでしょうか?
本研究は,言語横断的課題に関する6つの技術 LLM の評価を行った。
論文 参考訳(メタデータ) (2024-06-23T15:15:17Z) - Towards Truthful Multilingual Large Language Models: Benchmarking and Alignment Strategies [38.3269908062146]
多言語シナリオにおける真理性評価のためのベンチマークを構築する。
多数の言語にまたがるデータ割り当てを最適化するために,Fact-aware Multilingual Selective Synergy (FaMSS)を提案する。
論文 参考訳(メタデータ) (2024-06-20T15:59:07Z) - Verbalized Machine Learning: Revisiting Machine Learning with Language Models [63.10391314749408]
言語化機械学習(VML)の枠組みを紹介する。
VMLはパラメータ空間を人間の解釈可能な自然言語に制限する。
我々は,VMLの有効性を実証的に検証し,VMLがより強力な解釈可能性を実現するためのステップストーンとして機能することを期待する。
論文 参考訳(メタデータ) (2024-06-06T17:59:56Z) - LERT: A Linguistically-motivated Pre-trained Language Model [67.65651497173998]
本稿では,3種類の言語特徴を学習する事前学習型言語モデルLERTを提案する。
我々は,中国における10のNLUタスクについて広範な実験を行い,LERTが大きな改善をもたらすことを示す実験結果を得た。
論文 参考訳(メタデータ) (2022-11-10T05:09:16Z) - Adapters for Enhanced Modeling of Multilingual Knowledge and Text [54.02078328453149]
言語モデルは多言語言語モデル(MLLM)に拡張された。
知識グラフは、注意深いキュレーションを必要とし、少数の高リソース言語でのみ利用可能である、明示的な三重形式で事実を含む。
我々は,MLLMを多言語知識グラフ(MLKG)からの知識で拡張し,言語や知識グラフのタスクに多くの言語で取り組むことを提案する。
論文 参考訳(メタデータ) (2022-10-24T21:33:42Z) - Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake
News Detection [7.29381091750894]
偽ニュース検出のためのトランスフォーマーに基づく言語モデルの微調整手法を提案する。
まず、個々のモデルのトークン語彙を専門用語の実際の意味論のために拡張する。
最後に、普遍言語モデルRoBERTaとドメイン固有モデルCT-BERTによって抽出された予測特徴を、複数の層認識によって融合させ、微細で高レベルな特定の表現を統合する。
論文 参考訳(メタデータ) (2021-01-14T09:05:42Z) - FILTER: An Enhanced Fusion Method for Cross-lingual Language
Understanding [85.29270319872597]
我々は,XLMファインタニングの入力として言語間データを利用する拡張融合法を提案する。
推論中は、ターゲット言語で入力されたテキストとソース言語の翻訳に基づいて予測を行う。
この問題に対処するため,対象言語における翻訳テキストのための自動生成ソフト擬似ラベルに基づくモデル学習のためのKL分割自己学習損失を提案する。
論文 参考訳(メタデータ) (2020-09-10T22:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。