論文の概要: Check_square at CheckThat! 2020: Claim Detection in Social Media via
Fusion of Transformer and Syntactic Features
- arxiv url: http://arxiv.org/abs/2007.10534v2
- Date: Sun, 20 Sep 2020 23:51:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 05:24:11.374944
- Title: Check_square at CheckThat! 2020: Claim Detection in Social Media via
Fusion of Transformer and Syntactic Features
- Title(参考訳): Check_square at CheckThat!
2020年:トランスフォーマーと構文特徴の融合によるソーシャルメディアにおけるクレーム検出
- Authors: Gullal S. Cheema, Sherzod Hakimov, Ralph Ewerth
- Abstract要約: 私たちは、クレームのファクトチェックを自動化するのに役立つファクトチェックエコシステムの一部である2つの問題を解決することに重点を置いています。
最初の問題であるクレームチェックの信頼性予測では、構文的特徴とディープトランスフォーマーの双方向表現(BERT)埋め込みの融合について検討する。
2つ目の問題であるクレーム検索では、セマンティックテキストの類似性を訓練したシームズ・ネットワーク・トランスフォーマー・モデル(文変換器)から事前学習した埋め込みを探索する。
- 参考スコア(独自算出の注目度): 9.66022279280394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this digital age of news consumption, a news reader has the ability to
react, express and share opinions with others in a highly interactive and fast
manner. As a consequence, fake news has made its way into our daily life
because of very limited capacity to verify news on the Internet by large
companies as well as individuals. In this paper, we focus on solving two
problems which are part of the fact-checking ecosystem that can help to
automate fact-checking of claims in an ever increasing stream of content on
social media. For the first problem, claim check-worthiness prediction, we
explore the fusion of syntactic features and deep transformer Bidirectional
Encoder Representations from Transformers (BERT) embeddings, to classify
check-worthiness of a tweet, i.e. whether it includes a claim or not. We
conduct a detailed feature analysis and present our best performing models for
English and Arabic tweets. For the second problem, claim retrieval, we explore
the pre-trained embeddings from a Siamese network transformer model
(sentence-transformers) specifically trained for semantic textual similarity,
and perform KD-search to retrieve verified claims with respect to a query
tweet.
- Abstract(参考訳): ニュース消費のデジタル時代において、ニュース読者は、高度にインタラクティブで迅速な方法で、他人と意見を反応し、表現し、共有する能力を持つ。
その結果、偽ニュースは、大企業や個人によるインターネット上のニュースの検証能力が非常に限られているため、私たちの日常生活に浸透した。
本稿では,ソーシャルメディア上のコンテンツストリームにおけるクレームの事実チェックの自動化を支援するファクトチェックエコシステムの一部である2つの問題を解決することに焦点を当てる。
まず,クレームチェック適性予測という問題に対して,トランスフォーマー(bert)埋め込みによる構文特徴と深いトランスフォーマー双方向エンコーダ表現の融合について検討し,クレームを含むか否かを分類する。
詳細な特徴分析を行い、英語とアラビア語のつぶやきのベストパフォーマンスモデルを提示する。
第2の課題であるクレーム検索について,セマンティクスのテキスト的類似性を専門に訓練したシャムネットワークトランスフォーマタ(sentence-transformers)から事前学習された埋め込みを探索し,クエリのツイートに対して検証されたクレームを検索するためにkd-searchを行う。
関連論文リスト
- Adapting Fake News Detection to the Era of Large Language Models [48.5847914481222]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。
我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文 参考訳(メタデータ) (2023-11-02T08:39:45Z) - ManiTweet: A New Benchmark for Identifying Manipulation of News on Social Media [74.93847489218008]
ソーシャルメディア上でのニュースの操作を識別し,ソーシャルメディア投稿の操作を検出し,操作された情報や挿入された情報を特定することを目的とした,新しいタスクを提案する。
この課題を研究するために,データ収集スキーマを提案し,3.6K対のツイートとそれに対応する記事からなるManiTweetと呼ばれるデータセットをキュレートした。
我々の分析では、このタスクは非常に難しいことを示し、大きな言語モデル(LLM)は不満足なパフォーマンスをもたらす。
論文 参考訳(メタデータ) (2023-05-23T16:40:07Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - Multiverse: Multilingual Evidence for Fake News Detection [71.51905606492376]
Multiverseは、偽ニュースの検出に使用できる多言語エビデンスに基づく新機能である。
偽ニュース検出機能としての言語間証拠の使用仮説を確認した。
論文 参考訳(メタデータ) (2022-11-25T18:24:17Z) - Detecting COVID-19 Conspiracy Theories with Transformers and TF-IDF [2.3202611780303553]
我々はMediaEvalベンチマーク2021において,3つのフェイクニュース検出タスクの手法と結果を示す。
事前学習した変圧器は最高の検証結果が得られるが、スマートデザインのランダムトレーニングされた変圧器は、事前学習した変圧器に近い精度に達するように訓練することもできる。
論文 参考訳(メタデータ) (2022-05-01T01:48:48Z) - Applying Automatic Text Summarization for Fake News Detection [4.2177790395417745]
フェイクニュースの配信は新しいものではなく、急速に増加している問題だ。
本稿ではトランスフォーマーに基づく言語モデルのパワーを組み合わせた問題に対するアプローチを提案する。
我々のフレームワークであるCMTR-BERTは、複数のテキスト表現を組み合わせることで、コンテキスト情報の取り込みを可能にする。
論文 参考訳(メタデータ) (2022-04-04T21:00:55Z) - FR-Detect: A Multi-Modal Framework for Early Fake News Detection on
Social Media Using Publishers Features [0.0]
ニュース分野におけるこれらのメディアの優位性にもかかわらず、制御と検証機構の欠如がフェイクニュースの普及につながっている。
早期検出機能を備えたユーザ関連・コンテンツ関連機能を用いた高精度なマルチモーダルフレームワークFR-Detectを提案する。
実験によると、パブリッシャーの機能はコンテンツベースのモデルの性能を最大13%改善し、精度とF1スコアを29%向上させることができる。
論文 参考訳(メタデータ) (2021-09-10T12:39:00Z) - Hostility Detection and Covid-19 Fake News Detection in Social Media [1.3499391168620467]
我々は,Hindi BERTとHindi FastTextモデルを用いて,乱用言語検出と特徴抽出を併用したモデルを構築した。
また、英語のツイートでCovid-19に関連する偽ニュースを識別するためのモデルを構築しています。
論文 参考訳(メタデータ) (2021-01-15T03:24:36Z) - Two Stage Transformer Model for COVID-19 Fake News Detection and Fact
Checking [0.3441021278275805]
我々は、自然言語処理のための機械学習モデルの状態を用いて、新型コロナウイルスの偽ニュース検出のための2段階の自動パイプラインを開発する。
最初のモデルは、新型コロナウイルス(COVID-19)の特定のクレームに関するユーザーのクレームに関する最も関連性の高い事実を検索する、新しい事実チェックアルゴリズムを活用する。
第2のモデルは、クレームと、手動でキュレートされたCOVID-19データセットから取得した真事実の間のテキストの関連性を計算することによって、クレームの真理レベルを検証する。
論文 参考訳(メタデータ) (2020-11-26T11:50:45Z) - Causal Understanding of Fake News Dissemination on Social Media [50.4854427067898]
我々は、ユーザーがフェイクニュースを共有するのに、ユーザー属性が何をもたらすかを理解することが重要だと論じている。
偽ニュース拡散において、共同創設者は、本質的にユーザー属性やオンライン活動に関連する偽ニュース共有行動によって特徴づけられる。
本稿では,偽ニュース拡散における選択バイアスを軽減するための原則的アプローチを提案する。
論文 参考訳(メタデータ) (2020-10-20T19:37:04Z) - Machine Learning Explanations to Prevent Overtrust in Fake News
Detection [64.46876057393703]
本研究では、ニュースレビュープラットフォームに組み込んだ説明可能なAIアシスタントが、フェイクニュースの拡散と戦う効果について検討する。
我々は、ニュースレビューと共有インターフェースを設計し、ニュース記事のデータセットを作成し、4つの解釈可能なフェイクニュース検出アルゴリズムを訓練する。
説明可能なAIシステムについてより深く理解するために、説明プロセスにおけるユーザエンゲージメント、メンタルモデル、信頼、パフォーマンス対策の相互作用について議論する。
論文 参考訳(メタデータ) (2020-07-24T05:42:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。