論文の概要: Lightweight Stylistic Consistency Profiling: Robust Detection of LLM-Generated Textual Content for Multimedia Moderation
- arxiv url: http://arxiv.org/abs/2605.05950v1
- Date: Thu, 07 May 2026 09:58:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.679089
- Title: Lightweight Stylistic Consistency Profiling: Robust Detection of LLM-Generated Textual Content for Multimedia Moderation
- Title(参考訳): 軽量スティリスティック整合性プロファイリング:マルチメディアモデレーションのためのLCM生成テキストコンテンツのロバスト検出
- Authors: Siyuan Li, Aodu Wulianghai, Xi Lin, Xibin Yuan, Qinghua Mao, Guangyan Li, Xiang Chen, Jun Wu, Jianhua Li,
- Abstract要約: コンテンツ作成におけるLarge Language Models (LLMs) は、マルチメディアモデレーションにとって重要なタスクとして、人書きのテキストコンテンツを区別する。
既存の検出器は統計的な手がかりやモデル固有のものに依存しており、言い換えや敵の操作に弱い。
LLM生成したテキストコンテンツを頑健に検出するための軽量なスタイリスティック整合性プロファイリング法LiLi SCPを提案する。
- 参考スコア(独自算出の注目度): 17.622520491018438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increasing prevalence of Large Language Models (LLMs) in content creation has made distinguishing human-written textual content from LLM-generated counterparts a critical task for multimedia moderation. Existing detectors often rely on statistical cues or model-specific heuristics, making them vulnerable to paraphrasing and adversarial manipulations, and consequently limiting their robustness and interpretability. In this work, we proposeLiSCP , a novel lightweight stylistic consistency profiling method for robust detection of LLM-generated textual content, focusing on feature stability under adversarial manipulation. Our approach constructs a consistency profile that combines discrete stylistic features with continuous semantic signals, leveraging stylistic stability across multimodal-guided paraphrased text variants. Experiments spanning real-world multimedia news and movie datasets and conventional text domains demonstrate that LiSCP achieves superior performance on in-domain detection and outperforms existing approaches by up to 11.79% in cross-domain settings. Additionally,it demonstrates notable robustness under adversarial scenarios, including adversarial attacks and hybrid human-AI settings.
- Abstract(参考訳): コンテンツ作成におけるLarge Language Models (LLMs) の普及により, LLM 生成したテキストコンテンツと人間によるテキストコンテンツとを区別することが, マルチメディアモデレーションにとって重要な課題となっている。
既存の検出器は、しばしば統計的な手がかりやモデル固有のヒューリスティックに依存しており、パラフレージングや敵対的な操作に対して脆弱であり、その結果、その頑丈さと解釈可能性を制限する。
本研究では,LLM生成したテキストコンテンツを頑健に検出する軽量なスタイリスティックな整合性プロファイリング手法LiSCPを提案する。
提案手法は,マルチモーダル誘導パラフレーズ付きテキスト変種間のスタイリスティックな安定性を利用して,離散的なスタイリスティックな特徴と連続的なセマンティックな信号を組み合わせた一貫性プロファイルを構築する。
実世界のマルチメディアニュースや映画データセットや従来のテキストドメインにまたがる実験では、LiSCPはドメイン内検出において優れた性能を発揮し、ドメイン間設定において最大11.79%の精度で既存のアプローチより優れていることが示されている。
さらに、敵のシナリオでは、敵の攻撃やハイブリッドなヒューマンAI設定など、顕著な堅牢性を示す。
関連論文リスト
- Multi-Paradigm Collaborative Adversarial Attack Against Multi-Modal Large Language Models [67.45032003041399]
本稿では,MLLMに対する敵例の転送可能性を高めるために,MPCAttack(Multi-Paradigm Collaborative Attack)フレームワークを提案する。
MPCOは異なるパラダイム表現の重要性を適応的にバランスさせ、グローバルな最適化を導く。
我々のソリューションは、オープンソースおよびクローズドソースMLLMに対する標的および未ターゲットの攻撃において、常に最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2026-03-05T06:01:26Z) - StyleDecipher: Robust and Explainable Detection of LLM-Generated Texts with Stylistic Analysis [18.44456241158174]
StyleDecipherは堅牢で説明可能な検出フレームワークである。
組み合わせた特徴抽出器を用いてテキスト検出を再検討し、構造的差異を定量化する。
常に最先端のドメイン内精度を達成する。
論文 参考訳(メタデータ) (2025-10-14T15:07:27Z) - UniAlignment: Semantic Alignment for Unified Image Generation, Understanding, Manipulation and Perception [54.53657134205492]
UniAlignmentは単一の拡散変換器内での統一されたマルチモーダル生成フレームワークである。
固有モード意味アライメントとクロスモーダル意味アライメントの両方を組み込むことで、モデルのクロスモーダル一貫性と命令追従ロバスト性を高める。
本稿では、複雑なテキスト命令下でのマルチモーダルなセマンティック一貫性を評価するために設計された新しいベンチマークであるSemGen-Benchを紹介する。
論文 参考訳(メタデータ) (2025-09-28T09:11:30Z) - Explaining multimodal LLMs via intra-modal token interactions [55.27436637894534]
MLLM(Multimodal Large Language Models)は、様々な視覚言語タスクにおいて顕著な成功を収めているが、その内部決定機構は十分に理解されていない。
モーダル内相互作用を利用した解釈可能性の向上を提案する。
論文 参考訳(メタデータ) (2025-09-26T14:39:13Z) - Beyond Spurious Signals: Debiasing Multimodal Large Language Models via Counterfactual Inference and Adaptive Expert Routing [10.66971486730557]
MLLM(Multimodal Large Language Models)は、視覚情報とテキスト情報を統合する能力を示すが、しばしば素早い相関に頼っている。
本稿では,MLLMの表層相関バイアスに対する批判的課題を,新たな因果媒介に基づく脱バイアスフレームワークを通じて解決する。
論文 参考訳(メタデータ) (2025-09-18T19:01:11Z) - ContextGuard-LVLM: Enhancing News Veracity through Fine-grained Cross-modal Contextual Consistency Verification [2.012425476229879]
伝統的なアプローチは、細粒度のクロスモーダルなコンテキスト整合性の問題に対処するのに不足している。
先進的な視覚言語大モデルに基づく新しいフレームワークであるContextGuard-LVLMを提案する。
我々のモデルは、強化されたあるいは敵対的な学習パラダイムによって一意に強化されている。
論文 参考訳(メタデータ) (2025-08-08T18:10:24Z) - Adversarial Text Generation with Dynamic Contextual Perturbation [0.0]
自然言語処理(NLP)モデルに対する敵対的な攻撃は、入力テキストに微妙な摂動を導入することで脆弱性を露呈する。
動的文脈摂動(DCP)という新たなテキスト攻撃手法を提案する。
DCPは、文、段落、文書にまたがる文脈対応の摂動を生成し、意味的忠実さと流布性を確保する。
論文 参考訳(メタデータ) (2025-06-10T18:02:37Z) - Optimizing Speech Multi-View Feature Fusion through Conditional Computation [51.23624575321469]
自己教師付き学習(SSL)機能は、軽量で多目的な多視点音声表現を提供する。
SSLは、FBanksのような従来のスペクトル機能とアップデートの方向で競合する。
本稿では,条件計算に基づく新しい一般化された特徴融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-14T12:12:06Z) - ViLBias: Detecting and Reasoning about Bias in Multimodal Content [6.710013984078675]
ViLBiasは、マルチモーダルニュースにおけるバイアスの検出と推論のためのフレームワークである。
データセットは40,945のテキストペアで構成されている。
その結果,テキストによる画像の検出精度は3~5%向上した。
論文 参考訳(メタデータ) (2024-12-22T15:05:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。