論文の概要: Transparent and Controllable Recommendation Filtering via Multimodal Multi-Agent Collaboration
- arxiv url: http://arxiv.org/abs/2604.17459v1
- Date: Sun, 19 Apr 2026 14:19:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.537797
- Title: Transparent and Controllable Recommendation Filtering via Multimodal Multi-Agent Collaboration
- Title(参考訳): マルチモーダル多エージェント協調による透明かつ制御可能なレコメンデーションフィルタ
- Authors: Chi Zhang, Zhipeng Xu, Jiahao Liu, Dongsheng Li, Hansu Gu, Peng Zhang, Ning Gu, Tun Lu,
- Abstract要約: 我々は、エンドツーエンドのコラボレーション、マルチモーダル認識、マルチエージェントオーケストレーションを統合する新しいフレームワークを紹介します。
本システムでは,帰納的幻覚を除去するために,ファクトグラウンドの偏見パイプラインを用いている。
ダイナミックな2階層の嗜好グラフを構築し、明示的なループ内の人為的な修正を可能にする。
- 参考スコア(独自算出の注目度): 48.028080782524064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While personalized recommender systems excel at content discovery, they frequently expose users to undesirable or discomforting information, highlighting the critical need for user-centric filtering tools. Current methods leveraging Large Language Models (LLMs) struggle with two major bottlenecks: they lack multimodal awareness to identify visually inappropriate content, and they are highly prone to "over-association" -- incorrectly generalizing a user's specific dislike (e.g., anxiety-inducing marketing) to block benign, educational materials. These unconstrained hallucinations lead to a high volume of false positives, ultimately undermining user agency. To overcome these challenges, we introduce a novel framework that integrates end-to-cloud collaboration, multimodal perception, and multi-agent orchestration. Our system employs a fact-grounded adjudication pipeline to eliminate inferential hallucinations. Furthermore, it constructs a dynamic, two-tier preference graph that allows for explicit, human-in-the-loop modifications (via Delta-adjustments), explicitly preventing the algorithm from catastrophically forgetting fine-grained user intents. Evaluated on an adversarial dataset comprising 473 highly confusing samples, the proposed architecture effectively curbed over-association, decreasing the false positive rate by 74.3% and achieving nearly twice the F1-Score of traditional text-only baselines. Additionally, a 7-day longitudinal field study with 19 participants demonstrated robust intent alignment and enhanced governance efficiency. User feedback confirmed that the framework drastically improves algorithmic transparency, rebuilds user control, and alleviates the fear of missing out (FOMO), paving the way for transparent human-AI co-governance in personalized feeds.
- Abstract(参考訳): パーソナライズされたレコメンデータシステムはコンテンツ発見に長けているが、ユーザーを好ましくない、あるいは不快な情報にさらし、ユーザー中心のフィルタリングツールに対する重要なニーズを強調している。
視覚的に不適切なコンテンツを特定するためのマルチモーダルな認識が欠如しており、ユーザの特定の嫌悪(不安を引き起こすマーケティングなど)を誤って一般化して、良質な教育材料をブロックする「過剰な連想(over-asociation)」の傾向が高い。
これらの制約のない幻覚は、大量の偽陽性を引き起こし、最終的にはユーザーエージェンシーを損なう。
これらの課題を克服するために、エンドツーエンドのコラボレーション、マルチモーダル認識、マルチエージェントオーケストレーションを統合する新しいフレームワークを導入します。
本システムでは,帰納的幻覚を除去するために,ファクトグラウンドの偏見パイプラインを用いている。
さらに、デルタ調整(Delta-adjustments)を通じて)明示的なループ修正を可能にするダイナミックな2階層の選好グラフを構築し、そのアルゴリズムが破滅的にきめ細かなユーザ意図を忘れることを防ぐ。
473個の非常に混乱したサンプルからなる敵対的データセットで評価し、提案アーキテクチャは、過剰結合を効果的に抑制し、偽陽性率を74.3%減少させ、従来のテキストのみのベースラインのF1スコアの2倍近くを達成する。
さらに、19人の参加者による7日間の縦断調査では、強い意図の整合性を示し、ガバナンス効率を向上した。
ユーザからのフィードバックは、このフレームワークがアルゴリズムの透明性を大幅に改善し、ユーザコントロールを再構築し、欠席(FOMO)の恐れを軽減し、パーソナライズされたフィードにおける透明な人間とAIの共同統治の道を開くことを確認した。
関連論文リスト
- Verifiable Reasoning for LLM-based Generative Recommendation [106.7765000777685]
大規模言語モデル(LLM)における推論は、最近、生成的レコメンデーションの強化に強い可能性を示している。
本稿では,信頼性の高いフィードバックを提供するために,検証と推論をインターリーブする新しいTextbftextitreason-verify-recommendパラダイムを提案する。
4つの実世界のデータセットの実験は、VRecが効率を損なうことなく、推奨の有効性とスケーラビリティを大幅に向上することを示した。
論文 参考訳(メタデータ) (2026-03-08T16:55:45Z) - Plug-and-Play Clarifier: A Zero-Shot Multimodal Framework for Egocentric Intent Disambiguation [60.63465682731118]
エゴセントリックなAIエージェントのパフォーマンスは、基本的にマルチモーダルな意図のあいまいさによって制限される。
ゼロショットでモジュラーなフレームワークであるPlug-and-Play Clarifierを導入し、問題を個別に解決可能なサブタスクに分解する。
我々のフレームワークは,小言語モデルの意図的明確化性能を約30%向上させ,より大きな言語モデルとの競争力を高める。
論文 参考訳(メタデータ) (2025-11-12T04:28:14Z) - Beyond One-Size-Fits-All: Personalized Harmful Content Detection with In-Context Learning [4.559454504442884]
本稿では, 有害性, スパム, ネガティブ感情の検出を, バイナリ, マルチクラス, マルチラベル設定で統一するフレームワークを提案する。
このアプローチにより、軽量なパーソナライズが可能となり、ユーザーは、新しいカテゴリを簡単にブロックしたり、既存のカテゴリをブロックしたり、検出をセマンティックなバリエーションに拡張できる。
論文 参考訳(メタデータ) (2025-10-29T09:11:20Z) - DeLeaker: Dynamic Inference-Time Reweighting For Semantic Leakage Mitigation in Text-to-Image Models [55.30555646945055]
テキスト・ツー・イメージ(T2I)モデルはセマンティック・リークに対して脆弱である。
DeLeakerは、モデルのアテンションマップに直接介入することで、漏洩を緩和する軽量なアプローチである。
SLIMはセマンティックリークに特化した最初のデータセットである。
論文 参考訳(メタデータ) (2025-10-16T17:39:21Z) - H-NeiFi: Non-Invasive and Consensus-Efficient Multi-Agent Opinion Guidance [26.3381245787395]
既存のメソッドは、しばしばユーザービューを直接変更したり、グループ間の接続を強制する。
我々は階層的で非侵襲的な意見誘導フレームワークH-NeiFiを提案する。
実験の結果、H-NeiFiは専門家がいない場合でもコンセンサス速度を22.0%から30.7%増加させ、世界的な収束を維持していることがわかった。
論文 参考訳(メタデータ) (2025-07-11T09:56:33Z) - Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。
本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。
幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文 参考訳(メタデータ) (2025-05-02T04:01:31Z) - Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-09T04:20:15Z) - Negotiating the Shared Agency between Humans & AI in the Recommender System [1.4249472316161877]
本研究では,ユーザエージェンシーの強化を目的とした二重制御機構を提案する。
透明性とコントロールのレベルがユーザエクスペリエンスに与える影響を評価した。
論文 参考訳(メタデータ) (2024-03-23T19:23:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。