論文の概要: Semi-Supervised Multi-aspect Detection of Misinformation using
Hierarchical Joint Decomposition
- arxiv url: http://arxiv.org/abs/2005.04310v2
- Date: Thu, 3 Jun 2021 22:30:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 12:14:50.116507
- Title: Semi-Supervised Multi-aspect Detection of Misinformation using
Hierarchical Joint Decomposition
- Title(参考訳): 階層的関節分解による誤情報の半監督的マルチアスペクト検出
- Authors: Sara Abdali, Neil Shah, Evangelos E. Papalexakis
- Abstract要約: 本稿では,ニュース記事の特徴となる多種多様なリソースをタップすることで,ラベルの欠如を補う方法について検討する。
我々は,Twitter と Politifact のデータセットでそれぞれ 74% と 81% の F1 スコアで最先端の手法より優れた2レベル分解パイプラインを提案する。
- 参考スコア(独自算出の注目度): 16.15268644442174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distinguishing between misinformation and real information is one of the most
challenging problems in today's interconnected world. The vast majority of the
state-of-the-art in detecting misinformation is fully supervised, requiring a
large number of high-quality human annotations. However, the availability of
such annotations cannot be taken for granted, since it is very costly,
time-consuming, and challenging to do so in a way that keeps up with the
proliferation of misinformation. In this work, we are interested in exploring
scenarios where the number of annotations is limited. In such scenarios, we
investigate how tapping on a diverse number of resources that characterize a
news article, henceforth referred to as "aspects" can compensate for the lack
of labels. In particular, our contributions in this paper are twofold: 1) We
propose the use of three different aspects: article content, context of social
sharing behaviors, and host website/domain features, and 2) We introduce a
principled tensor based embedding framework that combines all those aspects
effectively. We propose HiJoD a 2-level decomposition pipeline which not only
outperforms state-of-the-art methods with F1-scores of 74% and 81% on Twitter
and Politifact datasets respectively but also is an order of magnitude faster
than similar ensemble approaches.
- Abstract(参考訳): 誤った情報と実際の情報の区別は、今日の相互接続された世界で最も困難な問題の1つです。
誤情報を検知する技術の大部分は完全に監督されており、高品質な人間のアノテーションを必要とする。
しかし,誤情報の拡散に追随するような方法で,非常に費用がかかり,時間を要するため,このようなアノテーションの利用は当然のことだとは言い難い。
この作業では、アノテーションの数に制限があるシナリオを探ることに興味があります。
このようなシナリオでは,ニュース記事の特徴となる多種多様なリソースをタップすることで,ラベルの欠如を補うことができるかを検討する。
特に、この論文への私たちの貢献は2つあります。
1) 記事の内容, ソーシャル共有行動のコンテキスト, ホストサイト/ドメイン機能, の3つの異なる側面の利用を提案する。
2)これらすべての側面を効果的に結合する原則付きテンソルベースの埋め込みフレームワークを導入する。
本稿では,twitter と politifact のデータセット上で f1-score をそれぞれ 74% と 81% の f1-score で最先端のメソッドを上回っているだけでなく,類似のアンサンブルアプローチよりも桁違いに高速である2段階の分解パイプラインを提案する。
関連論文リスト
- Improving Long Context Document-Level Machine Translation [51.359400776242786]
翻訳の一貫性と凝集性を改善するために、ニューラルネットワーク翻訳(NMT)のための文書レベルのコンテキストが不可欠である。
文書レベルのNMTに関する多くの著作が出版されているが、ほとんどの作品では局所的な文脈に制限されている。
本稿では、メモリ消費を同時に低減しつつ、シーケンスの最も関連性の高い部分に注意を集中させる制約付注意変種を提案する。
論文 参考訳(メタデータ) (2023-06-08T13:28:48Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Topic Segmentation Model Focusing on Local Context [1.9871897882042773]
本稿では,2つの入力文を個別に処理し,適切な量の情報を得るためのシマセ文埋め込み層を提案する。
また、同じトピック予測(STP)、トピック分類(TC)、Next Sentence Prediction(NSP)といったマルチタスク学習手法も採用している。
論文 参考訳(メタデータ) (2023-01-05T06:57:42Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - Consistency and Coherence from Points of Contextual Similarity [0.0]
近年,事実整合性に特化して提案されているESTIME測度は,人間の専門家のスコアと高い相関性が得られる。
これは現在の要約方式には問題はないが、将来の要約システムには障害となる可能性がある。
論文 参考訳(メタデータ) (2021-12-22T03:04:20Z) - Few-shot Partial Multi-view Learning [103.33865779721458]
本稿では,複数ショット部分的多視点学習という新しい課題を提案する。
それは、低データ体制におけるビューミス問題によるネガティブな影響を克服することに焦点を当てている。
提案手法を評価するため,広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-05-05T13:34:43Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - An Attention-Based Deep Learning Model for Multiple Pedestrian
Attributes Recognition [4.6898263272139795]
本稿では,監視映像における歩行者の自動特徴付け問題に対する新しい解決策を提供する。
本稿では,より包括的な特徴表現を抽出するために,要素ワイド乗算層を用いたマルチタスクディープモデルを提案する。
実験は,2つのよく知られたデータセット (RAP と PETA) を用いて実施し,提案手法の最先端性に着目した。
論文 参考訳(メタデータ) (2020-04-02T16:21:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。