Fugu-MT 論文翻訳(概要): Detection of Hate and Threat in Digital Forensics: A Case-Driven Multimodal Approach

論文の概要: Detection of Hate and Threat in Digital Forensics: A Case-Driven Multimodal Approach

arxiv url: http://arxiv.org/abs/2604.08609v1
Date: Wed, 08 Apr 2026 21:50:02 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-13 17:57:53.485949
Title: Detection of Hate and Threat in Digital Forensics: A Case-Driven Multimodal Approach
Title（参考訳）: デジタル鑑識における憎悪と脅威の検出--ケース駆動型マルチモーダルアプローチ
Authors: Ponkoj Chandra Shill,
Abstract要約: 本稿では,法医学的分析におけるヘイトと脅威検出のためのケース駆動型マルチモーダルアプローチを提案する。提案フレームワークは,埋め込みテキストと関連するコンテキストテキストと画像のみのエビデンスとを区別し,テキストエビデンスの存在と情報源を明確に決定する。証拠の可用性を推論することで、アプローチは法医学的な意思決定を反映し、明らかなトレーサビリティを改善し、不正なモダリティの仮定を避ける。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Digital forensic investigations increasingly rely on heterogeneous evidence such as images, scanned documents, and contextual reports. These artifacts may contain explicit or implicit expressions of harm, hate, threat, violence, or intimidation, yet existing automated approaches often assume clean text input or apply vision models without forensic justification. This paper presents a case-driven multimodal approach for hate and threat detection in forensic analysis. The proposed framework explicitly determines the presence and source of textual evidence, distinguishing between embedded text, associated contextual text, and image-only evidence. Based on the identified evidence configuration, the framework selectively applies text analysis, multimodal fusion, or image-only semantic reasoning using vision language models with vision transformer backbones (ViT). By conditioning inference on evidence availability, the approach mirrors forensic decision-making, improves evidentiary traceability, and avoids unjustified modality assumptions. Experimental evaluation on forensic-style image evidence demonstrates consistent and interpretable behavior across heterogeneous evidence scenarios.
Abstract（参考訳）: デジタル法医学的な調査は、画像、スキャンされた文書、文脈報告などの異質な証拠にますます依存している。これらのアーティファクトには、害、憎悪、脅し、暴力、脅迫の明示的あるいは暗黙的な表現が含まれているが、既存の自動化されたアプローチでは、法医学的な正当化なしにクリーンテキスト入力や視覚モデルを適用することが多い。本稿では,法医学的分析におけるヘイトと脅威検出のためのケース駆動型マルチモーダルアプローチを提案する。提案フレームワークは,埋め込みテキストと関連するコンテキストテキストと画像のみのエビデンスとを区別し,テキストエビデンスの存在と発生源を明確に決定する。このフレームワークは、識別されたエビデンス構成に基づいて、視覚トランスフォーマーバックボーン(ViT)を用いた視覚言語モデルを用いて、テキスト分析、マルチモーダル融合、画像のみの意味推論を選択的に適用する。証拠の可用性を推論することで、アプローチは法医学的な意思決定を反映し、明らかなトレーサビリティを改善し、不正なモダリティの仮定を避ける。法医学的なイメージエビデンスに関する実験的評価は、不均一なエビデンスシナリオ間で一貫した、解釈可能な振る舞いを示す。

関連論文リスト

DIVER: Dynamic Iterative Visual Evidence Reasoning for Multimodal Fake News Detection [6.225860651499494]
多モーダル偽ニュース検出は、敵対的誤報の軽減に不可欠である。進化的,エビデンス駆動推論パラダイムに基づくフレームワークであるDIVER(Dynamic Iterative Visual Evidence Reasoning)を提案する。 Weibo、Weibo21、GossipCopの実験では、DIVERは最先端のベースラインを平均2.72%上回っている。
論文参考訳（メタデータ） (2026-01-12T04:01:33Z)
Analyzing Reasoning Consistency in Large Multimodal Models under Cross-Modal Conflicts [74.47786985522762]
テキスト慣性(textual inertia)と呼ばれる重要な障害モードを特定し、矛盾する視覚的証拠を無視しながら、モデルは間違ったテキストに盲目的に固執する傾向がある。本稿では,多種多様なLMMの推論連鎖に摂動を構造的に注入するLogicGraph摂動プロトコルを提案する。その結果,10%未満の症例で自己修正が成功し,主に視覚的テキスト誤りの伝播に寄与することが判明した。
論文参考訳（メタデータ） (2026-01-07T16:39:34Z)
REVEAL: Reasoning-enhanced Forensic Evidence Analysis for Explainable AI-generated Image Detection [30.963994372913092]
我々は、AI生成画像検出のための最初の推論強化マルチモーダルベンチマークである textbfREVEAL-Bench を紹介する。筆者らのフレームワークは,検出を専門家による新しい強化学習と統合する。 REVEALは検出精度、説明忠実度、堅牢なクロスモデル一般化を著しく向上させる。
論文参考訳（メタデータ） (2025-11-28T13:11:08Z)
From Evidence to Verdict: An Agent-Based Forensic Framework for AI-Generated Image Detection [19.240335260177382]
AIFo(Agent-based Image Forensics)は、マルチエージェントコラボレーションによる人間の法医学的調査をエミュレートする、トレーニング不要のフレームワークである。従来の手法とは異なり,本フレームワークでは,リバース画像検索,メタデータ抽出,事前学習型分類器,VLM解析など,一連の法医学的ツールを用いている。我々の総合的な評価は6000のイメージに及び、現代の生成プラットフォームや多様なオンラインソースの画像を含む現実世界のシナリオに挑戦する。
論文参考訳（メタデータ） (2025-10-31T18:36:49Z)
Propose and Rectify: A Forensics-Driven MLLM Framework for Image Manipulation Localization [49.71303998618939]
本稿では,意味論的推論と法科学的な分析を橋渡しするPropose-Rectifyフレームワークを提案する。提案手法は,具体的技術実証により,初期セマンティックな提案が体系的に検証され,拡張されることを保証し,包括的検出精度と局所化精度を実現する。
論文参考訳（メタデータ） (2025-08-25T12:43:53Z)
A Principled Design of Image Representation: Towards Forensic Tasks [75.40968680537544]
本稿では, 理論, 実装, 応用の観点から, 法科学指向の画像表現を別の問題として検討する。理論レベルでは、Dense Invariant Representation (DIR)と呼ばれる、数学的保証を伴う安定した記述を特徴とする、新しい法医学の表現フレームワークを提案する。本稿では, ドメインパターンの検出とマッチング実験について, 最先端の記述子との比較結果を提供する。
論文参考訳（メタデータ） (2022-03-02T07:46:52Z)
Open-Domain, Content-based, Multi-modal Fact-checking of Out-of-Context Images via Online Resources [70.68526820807402]
実際のイメージは、コンテキストや要素を誤って表現することによって、他の物語をサポートするために再目的化される。私たちのゴールは、画像とコンテキストのペアリングを事実チェックすることで、この時間を要する、推論集約的なプロセスを自動化する検査可能な方法です。私たちの研究は、オープンドメイン、コンテンツベース、マルチモーダルなファクトチェックのための最初のステップとベンチマークを提供します。
論文参考訳（メタデータ） (2021-11-30T19:36:20Z)
Exploiting Multi-Object Relationships for Detecting Adversarial Attacks in Complex Scenes [51.65308857232767]
ディープニューラルネットワーク(DNN)をデプロイするビジョンシステムは、敵の例に弱いことが知られている。近年の研究では、入力データの固有成分のチェックは、敵攻撃を検出するための有望な方法であることが示された。言語モデルを用いてコンテキスト整合性チェックを行う新しい手法を開発した。
論文参考訳（メタデータ） (2021-08-19T00:52:10Z)
MEG: Multi-Evidence GNN for Multimodal Semantic Forensics [28.12652559292884]
フェイクニュースは、画像、テキスト、位置などのモダリティを横断するセマンティックな操作を伴うことが多い。近年の研究では、画像の再利用という問題に焦点が当てられている。マルチモーダル・セマンティック・フォサイシクスのための新しいグラフニューラルネットワークモデルを提案する。
論文参考訳（メタデータ） (2020-11-23T09:01:28Z)
A Survey of Machine Learning Techniques in Adversarial Image Forensics [45.219116050446786]
画像鑑定は刑事捜査と民事訴訟において重要な役割を果たしている。機械学習のアプローチは画像法医学にも活用されている。本稿では,機械学習に基づくバイナリ操作検出器の堅牢性向上に有効な手法について検討する。
論文参考訳（メタデータ） (2020-10-19T17:16:38Z)
Evidence-Aware Inferential Text Generation with Vector Quantised Variational AutoEncoder [104.25716317141321]
本稿では,大規模なテキストコーパスからイベントの証拠を自動的に発見し,その証拠を利用して推論テキストの生成を導く手法を提案する。このアプローチは、Event2MindとATOMICの両方のデータセットで最先端のパフォーマンスを提供します。
論文参考訳（メタデータ） (2020-06-15T02:59:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。