論文の概要: Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else?
- arxiv url: http://arxiv.org/abs/2111.05139v1
- Date: Tue, 9 Nov 2021 13:30:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-10 14:37:25.196590
- Title: Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else?
- Title(参考訳): 人間の身近な偽情報検出:スタンス、センチメント、あるいは何か便利なもの?
- Authors: Alexander Michael Daniel
- Abstract要約: 政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
- 参考スコア(独自算出の注目度): 93.91375268580806
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Both politics and pandemics have recently provided ample motivation for the
development of machine learning-enabled disinformation (a.k.a. fake news)
detection algorithms. Existing literature has focused primarily on the
fully-automated case, but the resulting techniques cannot reliably detect
disinformation on the varied topics, sources, and time scales required for
military applications. By leveraging an already-available analyst as a
human-in-the-loop, however, the canonical machine learning techniques of
sentiment analysis, aspect-based sentiment analysis, and stance detection
become plausible methods to use for a partially-automated disinformation
detection system. This paper aims to determine which of these techniques is
best suited for this purpose and how each technique might best be used towards
this end. Training datasets of the same size and nearly identical neural
architectures (a BERT transformer as a word embedder with a single feed-forward
layer thereafter) are used for each approach, which are then tested on
sentiment- and stance-specific datasets to establish a baseline of how well
each method can be used to do the other tasks. Four different datasets relating
to COVID-19 disinformation are used to test the ability of each technique to
detect disinformation on a topic that did not appear in the training data set.
Quantitative and qualitative results from these tests are then used to provide
insight into how best to employ these techniques in practice.
- Abstract(参考訳): 政治もパンデミックも最近、機械学習を利用した偽情報検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールの偽情報を確実に検出することはできない。
しかし、既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベース感情分析、スタンス検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するための有効な方法となった。
本研究の目的は,これらの技術がどの技術に最適か,また,どの技術が目的に最適かを決定することである。
同じ大きさのデータセットとほぼ同一のニューラルアーキテクチャ(後に単一のフィードフォワード層を持つ単語埋め込み器としてのbertトランスフォーマー)は、それぞれのアプローチで使用され、センチメントとスタンス特有のデータセット上でテストされ、各メソッドが他のタスクにどれだけうまく使えるかのベースラインを確立する。
トレーニングデータセットに表示されていないトピック上の偽情報を検出する各テクニックの能力をテストするために、COVID-19の偽情報に関連する4つの異なるデータセットが使用される。
これらのテストから得られた定量的で質的な結果は、これらのテクニックを実際にどのように使うのが最適かを洞察するために使用される。
関連論文リスト
- Multi-Dimensional Ability Diagnosis for Machine Learning Algorithms [88.93372675846123]
本稿では,機械学習アルゴリズム評価のためのタスク非依存評価フレームワークCamillaを提案する。
認識診断の仮定とニューラルネットワークを用いて、各サンプルのアルゴリズム、サンプル、スキル間の複雑な相互作用を学習する。
我々の実験では、カミラはメートル法信頼性、ランクの整合性、ランクの安定性で最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-07-14T03:15:56Z) - Algorithmic failure as a humanities methodology: machine learning's
mispredictions identify rich cases for qualitative analysis [0.0]
私は単純な機械学習アルゴリズムを訓練し、架空のキャラクターの情報だけを使ってアクションがアクティブか受動的かを予測する。
この結果は、失敗予測は質的分析のリッチケースを特定するために生産的に使用できるという、Munkらの理論を支持する。
さらに、この手法がどのような種類のデータに役立ち、どの種類の機械学習が最も生成性が高いかを理解するために、さらなる研究が必要である。
論文 参考訳(メタデータ) (2023-05-19T13:24:32Z) - A Deep Learning Anomaly Detection Method in Textual Data [0.45687771576879593]
本稿では,従来の機械学習アルゴリズムと組み合わせたディープラーニングとトランスフォーマーアーキテクチャを提案する。
我々は、異常を予測するために、文変換器、オート、ロジスティック回帰、距離計算など、複数の機械学習手法を使用した。
論文 参考訳(メタデータ) (2022-11-25T05:18:13Z) - Panning for gold: Lessons learned from the platform-agnostic automated
detection of political content in textual data [48.7576911714538]
異なるプラットフォーム間で政治的コンテンツを検出するために、これらの技術がどのように使用できるかについて議論する。
辞書,教師付き機械学習,ニューラルネットワークに依存する3つの検出手法のパフォーマンスを比較した。
この結果から,ニューラルネットワークと機械学習に基づくモデルによって達成されるノイズの少ないデータに対して,事前処理がモデル性能に与える影響が限定された。
論文 参考訳(メタデータ) (2022-07-01T15:23:23Z) - Finding Facial Forgery Artifacts with Parts-Based Detectors [73.08584805913813]
顔の個々の部分に焦点を絞った一連の偽造検知システムを設計する。
これらの検出器を用いて、FaceForensics++、Celeb-DF、Facebook Deepfake Detection Challengeデータセットの詳細な実験分析を行う。
論文 参考訳(メタデータ) (2021-09-21T16:18:45Z) - Technological Approaches to Detecting Online Disinformation and
Manipulation [0.0]
プロパガンダや偽情報をオンライン環境に移すことは、過去10年間にデジタル情報チャンネルがニュースソースとして急速に普及したという事実により可能である。
本章では, 計算機支援による偽情報検出手法の概要について述べる。
論文 参考訳(メタデータ) (2021-08-26T09:28:50Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Scaling Systematic Literature Reviews with Machine Learning Pipelines [57.82662094602138]
体系的なレビューは、科学的文書からデータを抽出する。
これらの側面をそれぞれ自動化するパイプラインを構築し、多くの人間時間対システム品質トレードオフを実験します。
人間の専門的アノテーションの2週間だけで、パイプラインシステム全体の驚くほどの精度と一般性が得られることが分かりました。
論文 参考訳(メタデータ) (2020-10-09T16:19:42Z) - A Review of Meta-level Learning in the Context of Multi-component,
Multi-level Evolving Prediction Systems [6.810856082577402]
データから有用なパターンを抽出する自動的あるいは半自動的な方法の調査の必要性が高まっている。
与えられた問題に対する学習方法の最も適切なマッピングを見つけるには、深い専門家の知識と広範な計算資源が必要である。
データセットに最適な学習アルゴリズムをアドバイスできるインテリジェントなレコメンデーションエンジンが必要だ。
論文 参考訳(メタデータ) (2020-07-17T14:14:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。