論文の概要: M-ArtAgent: Evidence-Based Multimodal Agent for Implicit Art Influence Discovery
- arxiv url: http://arxiv.org/abs/2604.07468v1
- Date: Wed, 08 Apr 2026 18:07:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.495348
- Title: M-ArtAgent: Evidence-Based Multimodal Agent for Implicit Art Influence Discovery
- Title(参考訳): M-ArtAgent:Evidence-based Multimodal Agent for Implicit Art Influence Discovery
- Authors: Hanyi Liu, Zhonghao Jiu, Minghao Wang, Yuhang Xie, Heran Yang,
- Abstract要約: 意図しない芸術的影響は、視覚的にもっともらしいが、しばしば文書化されておらず、歴史的に制約された帰属問題を引き起こす。
本稿では,エビデンスに基づくマルチモーダルエージェントであるM-ArtAgentを紹介する。
- 参考スコア(独自算出の注目度): 4.034135913115427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Implicit artistic influence, although visually plausible, is often undocumented and thus poses a historically constrained attribution problem: resemblance is necessary but not sufficient evidence. Most prior systems reduce influence discovery to embedding similarity or label-driven graph completion, while recent multimodal large language models (LLMs) remain vulnerable to temporal inconsistency and unverified attributions. This paper introduces M-ArtAgent, an evidence-based multimodal agent that reframes implicit influence discovery as probabilistic adjudication. It follows a four-phase protocol consisting of Investigation, Corroboration, Falsification, and Verdict governed by a Reasoning and Acting (ReAct)-style controller that assembles verifiable evidence chains from images and biographies, enforces art-historical axioms, and subjects each hypothesis to adversarial falsification via a prompt-isolated critic. Two theory-grounded operators, StyleComparator for Wolfflin formal analysis and ConceptRetriever for ICONCLASS-based iconographic grounding, ensure that intermediate claims are formally auditable. On the balanced WikiArt Influence Benchmark-100 (WIB-100) of 100 artists and 2,000 directed pairs, M-ArtAgent achieves 83.7% positive-class F1, 0.666 Matthews correlation coefficient (MCC), and 0.910 area under the receiver operating characteristic curve (ROC-AUC), with leakage-control and robustness checks confirming that the gains persist when explicit influence phrases are masked. By coupling multimodal perception with domain-constrained falsification, M-ArtAgent demonstrates that implicit influence analysis benefits from historically grounded adjudication rather than pattern matching alone.
- Abstract(参考訳): 意図しない芸術的影響は、視覚的にもっともらしいが、しばしば文書化されておらず、歴史的に制約された帰属問題を引き起こす:類似性は必要だが十分な証拠ではない。
従来のシステムのほとんどは、影響発見を類似性やラベル駆動のグラフ補完に還元する一方で、最近のマルチモーダルな大規模言語モデル(LLM)は、時間的矛盾や検証されていない属性に弱いままである。
本稿では,エビデンスに基づくマルチモーダルエージェントであるM-ArtAgentを紹介する。
このプロトコルは、画像や伝記から検証可能なエビデンスチェーンを組み立て、美術史的公理を強制し、各仮説を、即興の批評家を通じて敵のファルシフィケーション(falsification)に導く、推論と行為(Reasoning and Acting, ReAct)スタイルのコントローラによって統治される4段階のプロトコルである。
2つの理論基底演算子(StyleComparator for Wolfflin formal analysis)とConceptRetriever for ICONCLASS-based iconographic grounding)は、中間クレームが正式に監査可能であることを保証している。
100人のアーティストと2000人の有向ペアからなるWikiArt Influence Benchmark-100(WIB-100)では、M-ArtAgentは83.7%の正のクラスF1、0.666のマシューズ相関係数(MCC)、およびレシーバ操作特性曲線(ROC-AUC)下の0.910の領域を達成した。
M-ArtAgentは、マルチモーダル認識とドメイン制約のファルシフィケーションを結合することにより、暗黙の影響分析は、パターンマッチング単独ではなく、歴史的に根ざした偏見から恩恵を受けることを示した。
関連論文リスト
- AEGIS: From Clues to Verdicts -- Graph-Guided Deep Vulnerability Reasoning via Dialectics and Meta-Auditing [9.271196825503417]
大きな言語モデル(LLM)は、脆弱性検出にますます採用されているが、その推論は基本的には正しくない。
AEGISは、未解決の投機から、クローズドな事実ベース上の法医学的検証へ、検出をシフトする新しいマルチエージェントフレームワークである。
これは、主要なベースラインと比較して偽陽性率を最大54.40%削減し、1サンプルあたりの平均コストはタスク固有のトレーニングなしで0.09ドルである。
論文 参考訳(メタデータ) (2026-03-21T04:12:04Z) - Multi-Agent Debate: A Unified Agentic Framework for Tabular Anomaly Detection [7.807411603618987]
マルチエージェント議論フレームワーク(MAD)は、不一致を第一級信号として扱う。
MADは、大言語モデル(LLM)ベースの批評家によって強化された正規化された異常スコア、信頼性、構造化された証拠を生成する。
コンフォメーションキャリブレーションが議論されたスコアをラップして、交換可能性の下で偽陽性を制御する方法を示す。
論文 参考訳(メタデータ) (2026-02-15T17:44:32Z) - Gaming the Judge: Unfaithful Chain-of-Thought Can Undermine Agent Evaluation [76.5533899503582]
大規模言語モデル(LLM)は、エージェントのパフォーマンスを評価するために、ますます裁判官として使われている。
このパラダイムは、エージェントのチェーン・オブ・シークレット(CoT)推論が内部の推論と環境状態の両方を忠実に反映していることを暗黙的に仮定している。
我々は、操作された推論だけで、様々なWebタスクにまたがる800の軌跡に対して、最先端のVLM審査員の偽陽性率を最大90%向上させることができることを実証した。
論文 参考訳(メタデータ) (2026-01-21T06:07:43Z) - AgentIAD: Tool-Augmented Single-Agent for Industrial Anomaly Detection [9.208080780536504]
AgentIADは、多段階の視覚検査を可能にするツール駆動のフレームワークである。
AgentIADは、MMADの新しい最先端の97.62%の分類精度を達成する。
論文 参考訳(メタデータ) (2025-12-15T18:57:04Z) - Fair Deepfake Detectors Can Generalize [51.21167546843708]
共同設立者(データ分散とモデルキャパシティ)の制御により,公正な介入による一般化が向上することを示す。
この知見を応用して, 逆正当性重み付けとサブグループワイド特徴正規化を併用し, 新たなアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・インセンティブ・インターベンション・インベンション・インテクション(DAID)を提案する。
DAIDは、いくつかの最先端技術と比較して、公平性と一般化の両方において一貫して優れた性能を達成する
論文 参考訳(メタデータ) (2025-07-03T14:10:02Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - Malicious Agent Detection for Robust Multi-Agent Collaborative Perception [52.261231738242266]
多エージェント協調(MAC)知覚は、単エージェント認識よりも敵攻撃に対して脆弱である。
MAC知覚に特異的な反応防御であるMADE(Malicious Agent Detection)を提案する。
我々は、ベンチマーク3DデータセットV2X-simとリアルタイムデータセットDAIR-V2Xで包括的な評価を行う。
論文 参考訳(メタデータ) (2023-10-18T11:36:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。