論文の概要: Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation
- arxiv url: http://arxiv.org/abs/2112.08594v1
- Date: Thu, 16 Dec 2021 03:37:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 14:31:19.191942
- Title: Twitter-COMMs: Detecting Climate, COVID, and Military Multimodal
Misinformation
- Title(参考訳): twitter-comms: 気候、新型コロナウイルス、軍用マルチモーダル情報の検知
- Authors: Giscard Biamby, Grace Luo, Trevor Darrell, Anna Rohrbach
- Abstract要約: 本稿では,DARPAセマンティック・フォレスティクス(SemaFor)プログラムにおける画像テキスト不整合検出へのアプローチについて述べる。
Twitter-COMMsは大規模マルチモーダルデータセットで、884万のツイートが気候変動、新型コロナウイルス、軍用車両のトピックに関連する。
我々は、最先端のCLIPモデルに基づいて、自動生成されたランダムとハードのネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガネガ
- 参考スコア(独自算出の注目度): 83.2079454464572
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting out-of-context media, such as "miscaptioned" images on Twitter,
often requires detecting inconsistencies between the two modalities. This paper
describes our approach to the Image-Text Inconsistency Detection challenge of
the DARPA Semantic Forensics (SemaFor) Program. First, we collect
Twitter-COMMs, a large-scale multimodal dataset with 884k tweets relevant to
the topics of Climate Change, COVID-19, and Military Vehicles. We train our
approach, based on the state-of-the-art CLIP model, leveraging automatically
generated random and hard negatives. Our method is then tested on a hidden
human-generated evaluation set. We achieve the best result on the program
leaderboard, with 11% detection improvement in a high precision regime over a
zero-shot CLIP baseline.
- Abstract(参考訳): Twitterで「ミスキャプション」画像などの文脈外メディアを検出するには、2つのモダリティ間の矛盾を検出する必要があることが多い。
本稿では,darpa semantic forensics (semafor) プログラムにおける画像テキスト不整合検出への取り組みについて述べる。
まず、気候変動、COVID-19、軍用車両のトピックに関連する884万のツイートを含む大規模なマルチモーダルデータセットであるTwitter-COMMsを収集します。
私たちは、最先端のクリップモデルに基づいて、自動生成したランダムとハードのネガティブを活用して、このアプローチをトレーニングします。
提案手法は, 隠れた人間生成評価セット上でテストされる。
ゼロショットCLIPベースラインよりも高精度なシステムで11%の精度で検出精度が向上し,プログラムリーダボード上で最高の結果が得られた。
関連論文リスト
- Fraunhofer SIT at CheckThat! 2023: Mixing Single-Modal Classifiers to
Estimate the Check-Worthiness of Multi-Modal Tweets [0.0]
本稿では,マルチモーダルつぶやきのチェックしやすさを検知する新しい手法を提案する。
これは2つの分類器を利用し、それぞれが単一のモダリティで訓練される。
画像データについては,OCR解析による埋め込みテキストの抽出が最良であることが示されている。
論文 参考訳(メタデータ) (2023-07-02T16:35:54Z) - It's Just a Matter of Time: Detecting Depression with Time-Enriched
Multimodal Transformers [24.776445591293186]
本稿では,ソーシャルメディア投稿からうつ病を検出するための柔軟な時間拡張型マルチモーダルトランスフォーマーアーキテクチャを提案する。
我々のモデルはユーザーレベルで直接動作し、時間2vecの位置埋め込みを用いて、投稿間の相対時間で拡張する。
EmoBERTaとCLIPの埋め込みを用いた手法は、2つのマルチモーダルデータセット上の他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-01-13T09:40:19Z) - Machine Learning-based Automatic Annotation and Detection of COVID-19
Fake News [8.020736472947581]
新型コロナウイルス(COVID-19)は世界のあらゆる地域に影響を与えるが、感染の誤報はウイルスよりも速く移動した。
既存の作業は、拡散の触媒として働くボットの存在を無視する。
そこで本稿では,Twitterデータセット上で事実確認文をラベル付けする手法を提案する。
論文 参考訳(メタデータ) (2022-09-07T13:55:59Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - SODA10M: Towards Large-Scale Object Detection Benchmark for Autonomous
Driving [94.11868795445798]
我々は,SODA10Mという名の自律走行用大規模物体検出ベンチマークをリリースし,1000万枚の未ラベル画像と6つの代表対象カテゴリをラベル付けした20K画像を含む。
多様性を向上させるために、画像は32の異なる都市で、1フレームあたり10秒毎に異なる気象条件、期間、場所のシーンで収集される。
我々は、既存の教師付き最先端検出モデル、一般的な自己監督型および半教師付きアプローチ、および将来のモデルの開発方法に関するいくつかの知見について、広範な実験と詳細な分析を行った。
論文 参考訳(メタデータ) (2021-06-21T13:55:57Z) - Holistic Image Manipulation Detection using Pixel Co-occurrence Matrices [16.224649756613655]
digital image forensicsは、デジタル操作された画像を検出することを目的としている。
文献におけるほとんどの検出方法は、特定の種類の操作を検出することに焦点を当てている。
本稿では,画素共起行列と深層学習を組み合わせることで,改ざん画像を検出する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-04-12T17:54:42Z) - Combining exogenous and endogenous signals with a semi-supervised
co-attention network for early detection of COVID-19 fake tweets [14.771202995527315]
新型コロナウイルス(COVID-19)の間、誤報のあるツイートは早期に警告され、中立化され、被害を軽減する必要がある。
偽ニュースを早期に検出する既存の方法のほとんどは、大きなラベル付きツイートに十分な伝搬情報を持っていると仮定している。
我々は、ツイートに関連する内因性および内因性信号を活用する新しい早期検出モデルENDEMICを提案する。
論文 参考訳(メタデータ) (2021-04-12T10:01:44Z) - Quasi-Dense Similarity Learning for Multiple Object Tracking [82.93471035675299]
本稿では, コントラスト学習のための画像に対して, 数百の領域提案を高密度にサンプリングする準高次類似性学習を提案する。
この類似性学習と既存の検出手法を直接組み合わせてQuasi-Dense Tracking(QDTrack)を構築することができる。
論文 参考訳(メタデータ) (2020-06-11T17:57:12Z) - SCAN: Learning to Classify Images without Labels [73.69513783788622]
機能学習とクラスタリングを分離する2段階のアプローチを提唱する。
表現学習からの自己教師型タスクを用いて意味論的意味のある特徴を得る。
我々は、ImageNet上で有望な結果を得、低データ体制下では、いくつかの半教師付き学習方法より優れています。
論文 参考訳(メタデータ) (2020-05-25T18:12:33Z) - Tracking Road Users using Constraint Programming [79.32806233778511]
本稿では,マルチオブジェクトトラッキング(MOT)問題のトラッキング・バイ・検出パラダイムに見られるデータアソシエーションフェーズに対する制約プログラミング(CP)アプローチを提案する。
提案手法は車両追跡データを用いてテストし,UA-DETRACベンチマークの上位手法よりも優れた結果を得た。
論文 参考訳(メタデータ) (2020-03-10T00:04:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。