論文の概要: Detecting Corporate AI-Washing via Cross-Modal Semantic Inconsistency Learning
- arxiv url: http://arxiv.org/abs/2604.09644v1
- Date: Tue, 24 Mar 2026 01:30:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.592081
- Title: Detecting Corporate AI-Washing via Cross-Modal Semantic Inconsistency Learning
- Title(参考訳): クロスモーダルなセマンティック不整合学習による企業AIウォッシングの検出
- Authors: Zhanjie Wen, Jingqiao Guo,
- Abstract要約: 本稿では,AI洗浄検出を再定義するフレームワークであるAWASHについて,モーダルなクレームエビデンス推論として紹介する。
本稿では,クレーム・エビデンス関連推論のための構造化自然言語推論モジュールであるトリモーダルエンコーダを統合する,CMID(Cross-Modal Inconsistency Detection)ネットワークを提案する。
CMIDはF1スコアが0.882、AUC-ROCが0.921であり、テキストのみのベースラインが17.4ポイント、最新のマルチモーダル・コンペティターが11.3ポイントを上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Corporate AI-washing-the strategic misrepresentation of AI capabilities via exaggerated or fabricated cross-channel disclosures-has emerged as a systemic threat to capital market information integrity with the widespread adoption of generative AI. Existing detection methods rely on single-modal text frequency analysis, suffering from vulnerability to adversarial reformulation and cross-channel obfuscation. This paper presents AWASH, a multimodal framework that redefines AI-washing detection as cross-modal claim-evidence reasoning (instead of surface-level similarity measurement), built on AW-Bench-the first large-scale trimodal benchmark for this task, including 88412 aligned annual report text, disclosure image, and earnings call video triplets from 4892 A-share listed firms during 2019Q1-2025Q2. We propose the Cross-Modal Inconsistency Detection (CMID) network, integrating a tri-modal encoder, a structured natural language inference module for claim-evidence entailment reasoning, and an operational grounding layer that cross-validates AI claims against verifiable physical evidence (patent filing trajectories, AI-specific talent recruitment, compute infrastructure proxies). Evaluated against six competitive baselines, CMID achieves an F1 score of 0.882 and an AUC-ROC of 0.921, outperforming the strongest text-only baseline by 17.4 percentage points and the latest multimodal competitor by 11.3 percentage points. A pre-registered user study with 14 regulatory analysts verifies that CMID-generated evidence reports cut case review time by 43% while increasing true positive detection rates by 28%. These findings confirm the technical superiority and practical applicability of structured multimodal reasoning for large-scale corporate disclosure surveillance.
- Abstract(参考訳): 企業AI洗浄 - 誇張または偽造されたクロスチャネル開示によるAI能力の戦略的誤った表現 - は、ジェネレーティブAIの普及とともに、資本市場情報の整合性に対する体系的な脅威として出現した。
既存の検出方法は単一モードのテキスト周波数解析に依存しており、敵の改定やチャネル間難読化の脆弱性に悩まされている。
本稿では,2019Q1-2025Q2におけるA-Share上場企業4892社からの88412件の年次報告テキスト,開示画像,収支報告ビデオトリプルを含む,AW-BenchによるAI洗浄検出をクロスモーダルなクレームエビデンス推論(表面レベルの類似度測定ではなく)として再定義するマルチモーダルフレームワークであるAWASHについて述べる。
本稿では,3モーダルエンコーダとクレームエビデンス推論のための構造化自然言語推論モジュールと,検証可能な物理的証拠(特許出願トラジェクトリ,AI固有の人材募集,計算インフラプロキシ)に対するAIの主張を相互に検証する運用基盤層とを統合して,CMID(Cross-Modal Inconsistency Detection)ネットワークを提案する。
CMIDは6つの競争基準に対して評価され、F1スコアが0.882、AUC-ROCが0.921となり、テキストのみのベースラインが17.4ポイント、最新のマルチモーダル・コンペティターが11.3ポイントを上回った。
14の規制アナリストによる事前登録されたユーザスタディでは、CMIDが生成した証拠がケースレビュー時間を43%削減し、真の陽性検出率を28%向上させたことが確認されている。
これらの結果から,大規模企業情報開示監視における構造化マルチモーダル推論の技術的優位性と実用性が確認された。
関連論文リスト
- Verify Before You Fix: Agentic Execution Grounding for Trustworthy Cross-Language Code Analysis [0.0]
ソフトウェア脆弱性分析のための言語横断的な脆弱性ライフサイクルフレームワークを構築します。
89.84-92.02%の言語内検出精度,74.43-80.12%のゼロショット言語F1。
これらの結果は,LLM駆動型エージェントAIのための原理的かつ実用的に展開可能なメカニズムであることを示す。
論文 参考訳(メタデータ) (2026-04-12T20:22:23Z) - Claw-Eval: Toward Trustworthy Evaluation of Autonomous Agents [66.97968363332465]
エージェントベンチマークの3つのギャップに対処するエンドツーエンド評価スイートであるClaw-Evalを紹介した。
Claw-Evalは3つのグループにまたがる9つのカテゴリにまたがる300の人間検証タスクで構成されている。
すべてのエージェントアクションは、3つの独立したエビデンスチャネルを通じて記録される。
論文 参考訳(メタデータ) (2026-04-07T17:43:18Z) - ReasoningBomb: A Stealthy Denial-of-Service Attack by Inducing Pathologically Long Reasoning in Large Reasoning Models [67.15960154375131]
大規模推論モデル(LRM)は、多段階推論トレースを明示した大規模言語モデルを拡張する。
この能力は、推論の高い計算コストを生かした、新しいタイプのプロンプト誘発推論時間拒否攻撃(PI-DoS)を導入している。
本稿では,強化学習に基づくPI-DoSフレームワークであるReasoningBombについて紹介する。
論文 参考訳(メタデータ) (2026-01-29T18:53:01Z) - MIRAGE: Agentic Framework for Multimodal Misinformation Detection with Web-Grounded Reasoning [0.6475163438744868]
我々は、マルチモーダル検証を4つのシーケンシャルモジュールに分解する推論時モデルプラガブルエージェントフレームワークであるMIRAGEを提案する。
視覚的妥当性評価は、AI生成した画像を検出し、クロスモーダルな一貫性分析は、Webエビデンスにおけるアウト・オブ・コンテクストの再利用、検索強化された事実チェックの根拠を特定する。
MIRAGEは、ターゲットとするWeb検索、構造化された出力、引用リンクされた有理数を用いた視覚言語モデル推論をオーケストレーションする。
論文 参考訳(メタデータ) (2025-10-20T14:40:26Z) - FaithCoT-Bench: Benchmarking Instance-Level Faithfulness of Chain-of-Thought Reasoning [62.452350134196934]
FaithCoT-Benchは、インスタンスレベルのCoT不信検出のための統一ベンチマークである。
我々の枠組みは差別的な決定問題として不誠実検出を定式化している。
FaithCoT-Bench は LLM のより解釈可能で信頼性の高い推論に向けた将来の研究の基盤となる。
論文 参考訳(メタデータ) (2025-10-05T05:16:54Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Lie Detector: Unified Backdoor Detection via Cross-Examination Framework [68.45399098884364]
半正直な設定で一貫したバックドア検出フレームワークを提案する。
本手法は,SoTAベースラインよりも5.4%,1.6%,11.9%の精度で検出性能が向上する。
特に、マルチモーダルな大規模言語モデルにおいて、バックドアを効果的に検出するのは、これが初めてである。
論文 参考訳(メタデータ) (2025-03-21T06:12:06Z) - Structured Reasoning for Fairness: A Multi-Agent Approach to Bias Detection in Textual Data [0.0]
本稿では,各文を事実あるいは意見として切り離して識別するマルチエージェントフレームワークを提案する。
改良された検出精度と解釈可能な説明を組み合わせることで、現代の言語モデルにおける説明責任を促進する。
論文 参考訳(メタデータ) (2025-03-01T05:27:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。