Fugu-MT 論文翻訳(概要): Superficial Success vs. Internal Breakdown: An Empirical Study of Generalization in Adaptive Multi-Agent Systems

論文の概要: Superficial Success vs. Internal Breakdown: An Empirical Study of Generalization in Adaptive Multi-Agent Systems

arxiv url: http://arxiv.org/abs/2604.18951v1
Date: Tue, 21 Apr 2026 01:02:16 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-22 22:41:49.556796
Title: Superficial Success vs. Internal Breakdown: An Empirical Study of Generalization in Adaptive Multi-Agent Systems
Title（参考訳）: 表面的成功と内部破壊--適応型マルチエージェントシステムにおける一般化の実証的研究
Authors: Namyoung So, Seokgyu Jang, Taeuk Kim,
Abstract要約: 適応型マルチエージェントシステムは、異なる領域にまたがって一般化できないことを示す。また, エージェント間相互作用が理想的なMAS挙動から分岐している間に, 適切な表面レベルの精度を実現することも見いだした。
参考スコア（独自算出の注目度）: 7.203993489201576
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Adaptive multi-agent systems (MAS) are increasingly adopted to tackle complex problems.However, the narrow task coverage of their optimization raises the question of whether they can function as general-purpose systems.To address this gap, we conduct an extensive empirical study of adaptive MAS, revealing two key findings: (1) topological overfitting -- they fail to generalize across different domains; and (2) illusory coordination -- they achieve reasonable surface-level accuracy while the underlying agent interactions diverge from ideal MAS behavior, raising concerns about their practical utility.These findings highlight the pressing need to prioritize generalization in MAS development and motivate evaluation protocols that extend beyond simple final-answer correctness.
Abstract（参考訳）: 適応型マルチエージェントシステム(MAS)は、複雑な問題に対処するためにますます採用されているが、それらの最適化の狭さは、汎用システムとして機能するかどうかという問題を提起している。このギャップに対処するため、我々は、(1)トポロジカルオーバーフィッティング(トポロジカルオーバーフィッティング) -- 異なるドメインにまたがる一般化に失敗したこと、(2)照明調整(イリューショニング) -- エージェントの相互作用が理想のMAS行動から分岐し、実用性への懸念が高まる一方で、適切な表面レベルの精度を達成し、MAS開発における一般化を優先し、単純な最終回答の正当性を超えたモチベーション評価プロトコルを追求する必要性が浮き彫りにされている。

関連論文リスト

Heterogeneous Consensus-Progressive Reasoning for Efficient Multi-Agent Debate [58.675713546748305]
マルチエージェント・ディベート(英: Multi-Agent Debate、MAD)は、複数のエージェントが推論および反復的批判サイクルの生成を通じて、反復的にソリューションを洗練する協調的なフレームワークである。本研究は,HCP-MADのための不均一なコンセンサス・プログレッシブ推論を導入する。 HCP-MADは3段階のプログレッシブ推論機構を用いて、様々なタスク複雑度にまたがる適応的なソリューションを開発する。
論文参考訳（メタデータ） (2026-04-03T06:58:59Z)
Experience as a Compass: Multi-agent RAG with Evolving Orchestration and Agent Prompts [22.323342919724492]
HERAは階層的なフレームワークで、マルチエージェントオーケストレーションとロール固有のエージェントプロンプトを共同で進化させる。 HERAは最近のベースラインよりも平均38.69%改善している。トポロジカル分析により、スパース探索がコンパクトで高ユーティリティなマルチエージェントネットワークを生み出す創発的な自己組織化が明らかになった。
論文参考訳（メタデータ） (2026-04-01T13:45:52Z)
Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (2026-02-03T15:32:09Z)
Is Softmax Loss All You Need? A Principled Analysis of Softmax-family Loss [91.61796429377041]
ソフトマックスの損失は、分類とランキングのタスクにおいて最も広く使用されるサロゲートの目標の1つである。本研究では,異なるサロゲートが分類とランキングの指標との整合性を達成するかどうかを考察し,それらの勾配ダイナミクスを分析して,異なる収束挙動を明らかにする。本研究は,大規模機械学習アプリケーションにおける損失選択の実践的ガイダンスとして,原則的基礎を確立した。
論文参考訳（メタデータ） (2026-01-30T09:24:52Z)
Curse of Knowledge: When Complex Evaluation Context Benefits yet Biases LLM Judges [72.3356133063925]
審査員としての大規模言語モデル(LLM)のパラダイムはスケーラブルなソリューションとして登場したが、以前の作業は主に単純な設定に焦点を当てていた。我々の詳細な分析は、評価信号の精度と妥当性を向上させるための重要な洞察を提供する。
論文参考訳（メタデータ） (2025-09-03T15:48:33Z)
AD-FM: Multimodal LLMs for Anomaly Detection via Multi-Stage Reasoning and Fine-Grained Reward Optimization [43.86757207244911]
2つのシナジスティックな革新を通して制限に対処する包括的フレームワークを提案する。まず、地域識別から集中検査までモデルをガイドする多段階議論的推論プロセスを導入する。第2に、分類精度と局所化監督を組み込んだ微粒化報酬機構を開発する。
論文参考訳（メタデータ） (2025-08-06T08:00:27Z)
Bayesian Cross-Modal Alignment Learning for Few-Shot Out-of-Distribution Generalization [47.64583975469164]
本稿では,この問題に対処するために,新しいクロスモーダルな画像テキストアライメント学習手法(Bayes-CAL)を提案する。 Bayes-CALは2次元分布シフトにおける最先端のOoD一般化性能を達成する。 CLIPのようなモデルと比較して、Bayes-CALは目に見えないクラスでより安定した一般化性能を得る。
論文参考訳（メタデータ） (2025-04-13T06:13:37Z)
Robust Analysis of Multi-Task Learning Efficiency: New Benchmarks on Light-Weighed Backbones and Effective Measurement of Multi-Task Learning Challenges by Feature Disentanglement [69.51496713076253]
本稿では,既存のMTL手法の効率性に焦点をあてる。バックボーンを小さくしたメソッドの大規模な実験と,MetaGraspNetデータセットを新しいテストグラウンドとして実施する。また,MTLにおける課題の新規かつ効率的な識別子として,特徴分散尺度を提案する。
論文参考訳（メタデータ） (2024-02-05T22:15:55Z)
Topology-aware Robust Optimization for Out-of-distribution Generalization [18.436575017126323]
アウト・オブ・ディストリビューション(OOD)の一般化は難しい機械学習問題であるが、多くの高スループットアプリケーションで非常に望ましい。本稿では,分散トポロジを原理的最適化フレームワークにシームレスに統合するトポロジ対応ロバスト最適化(TRO)を提案する。提案手法の有効性を理論的に実証し, 分類, 回帰, セマンティックセグメンテーションを含む幅広いタスクにおいて, 芸術の状態を著しく上回っていることを示す。
論文参考訳（メタデータ） (2023-07-26T03:48:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。