論文の概要: F2IND-IT! -- Multimodal Fuzzy Fake Indian News Detection using Images and Text
- arxiv url: http://arxiv.org/abs/2605.17115v1
- Date: Sat, 16 May 2026 18:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.687915
- Title: F2IND-IT! -- Multimodal Fuzzy Fake Indian News Detection using Images and Text
- Title(参考訳): F2IND-IT! --画像とテキストを用いた多モードファジィフェイクインドニュース検出
- Authors: Kushal Trivedi, Murtuza Shaikh, Khushi Singh, Jeevaraj S.,
- Abstract要約: 本稿では,インドメディア上での偽ニュース検出の強化を目的とした,視覚とテキストのモダリティを組み合わせた新しいフレームワークを提案する。
このアーキテクチャは、ResNet-50 Convolutional Neural Networkを用いて、ニュース画像から視覚的特徴を抽出し、DistilBERTエンコーダを使用してテキストセマンティック埋め込みを得るとともに、適応型ニューロファジィ推論システム(ANFIS)を用いてファジィ信頼性スコアを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biased manipulation of facts across regional and national media outlets complicates misinformation detection in diverse landscapes like India. This paper introduces a novel multimodal framework combining visual and textual modalities for enhanced fake news detection on Indian media. The architecture utilizes a ResNet-50 Convolutional Neural Network to extract visual features from news images, a DistilBERT encoder to obtain textual semantic embeddings, and an Adaptive Neuro-Fuzzy Inference System (ANFIS) to generate a fuzzy reliability score. A lightweight attention-based fusion module assigns learnable weights to each modality prior to classification. Evaluated on the IFND dataset, the proposed model is validated through an in-depth comparative analysis against previous research. Experimental results demonstrate superior performance across accuracy, precision, recall, and $F_1$-scores, confirming the efficacy of the architecture.
- Abstract(参考訳): 地方メディアや全国メディアの事実のバイアスによる操作は、インドのような多様な風景における誤情報検出を複雑にしている。
本稿では,インドメディア上での偽ニュース検出のための視覚的・テキスト的モダリティを組み合わせた新しいマルチモーダルフレームワークを提案する。
このアーキテクチャは、ResNet-50 Convolutional Neural Networkを用いて、ニュース画像から視覚的特徴を抽出し、DistilBERTエンコーダを使用してテキストセマンティック埋め込みを得るとともに、適応型ニューロファジィ推論システム(ANFIS)を用いてファジィ信頼性スコアを生成する。
軽量の注意に基づく融合モジュールは、分類の前に各モードに学習可能な重みを割り当てる。
IFNDデータセットから評価し,従来の研究との比較分析により,提案モデルの有効性を検証した。
実験の結果、精度、精度、リコール、および$F_1$-scoresで優れた性能を示し、アーキテクチャの有効性を確認した。
関連論文リスト
- Mind the Way You Select Negative Texts: Pursuing the Distance Consistency in OOD Detection with VLMs [80.03370593724422]
Out-of-Distribution (OOD) は未知のクラスからサンプルを識別する。
現在の手法では、否定的なテキストとIDラベルを比較するなど、OOD検出中にモード内距離を組み込むことが多い。
テキストおよび視覚的視点から一貫したモーダル距離拡張を体系的に利用するフレームワークであるInterNegを提案する。
論文 参考訳(メタデータ) (2026-03-03T05:44:47Z) - Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:12:26Z) - Multimodal Fake News Detection: MFND Dataset and Shallow-Deep Multitask Learning [22.494473679788396]
マルチモーダルニュースには豊富な情報が含まれており、ディープフェイク・モデリング・アタックの影響を受けやすい。
最新の画像とテキスト生成手法に対抗するために,新しいマルチモーダルフェイクニュース検出データセット(MFND)を提案する。
MFNDには11の操作されたタイプがあり、高度に認証された偽ニュースを検出し、ローカライズするように設計されている。
論文 参考訳(メタデータ) (2025-05-11T00:26:13Z) - A Multimodal Adaptive Graph-based Intelligent Classification Model for Fake News [1.537737222790121]
偽ニュース検出のためのマルチモーダル適応グラフに基づくインテリジェント分類(MAGIC)を導入する。
ソフトマックス関数によるマルチモーダル入力を分類する前に,適応型グラフアテンションネットワークを用いて包括的情報相互作用グラフを構築した。
MAGICは2つの偽ニュースデータセット、すなわちFakeddit(英語)とMultimodal Fake News Detection(中国語)で訓練され、それぞれ98.8%と86.3%の精度を達成した。
論文 参考訳(メタデータ) (2024-11-09T07:19:19Z) - Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。
我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文 参考訳(メタデータ) (2023-04-02T10:25:09Z) - Multimodal Fake News Detection with Adaptive Unimodal Representation
Aggregation [28.564442206829625]
AURAは、適応的な一助表現アグリゲーションを備えたマルチモーダルフェイクニュース検出ネットワークである。
我々は,一様および多様の表現に従って,粗いレベルの偽ニュース検出とクロスモーダルな共存学習を行う。
WeiboとGossipcopの実験は、AURAがいくつかの最先端のFNDスキームに勝つことを証明している。
論文 参考訳(メタデータ) (2022-06-12T14:06:55Z) - FiLMing Multimodal Sarcasm Detection with Attention [0.7340017786387767]
サルカスムの検出は、意図された意味がその表面的な意味によって示されるものと異なる自然言語表現を特定する。
本稿では,入力テキストと画像属性のコンテキスト不整合を組み込むために,RoBERTaモデルとコアテンション層を用いた新しいアーキテクチャを提案する。
提案手法は,Twitterのマルチモーダル検出データセットの6.14%のF1スコアにおいて,既存の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-09T06:33:29Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Informative Dropout for Robust Representation Learning: A Shape-bias
Perspective [84.30946377024297]
Informative Dropout (InfoDrop) と呼ばれる軽量モデル非依存の手法を提案し, 解釈性の向上とテクスチャバイアスの低減を図る。
具体的には、画像中の局所的な自己情報に基づいて形状からテクスチャを識別し、Dropoutのようなアルゴリズムを用いて局所的なテクスチャからのモデル出力をデコレーションする。
論文 参考訳(メタデータ) (2020-08-10T16:52:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。