論文の概要: CoFlow: Coordinated Few-Step Flow for Offline Multi-Agent Decision Making
- arxiv url: http://arxiv.org/abs/2605.01457v1
- Date: Sat, 02 May 2026 14:12:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.783582
- Title: CoFlow: Coordinated Few-Step Flow for Offline Multi-Agent Decision Making
- Title(参考訳): CoFlow:オフラインマルチエージェント意思決定のための協調的なFew-Stepフロー
- Authors: Guowei Zou, Haitao Wang, Beiwen Zhang, Boning Zhang, Hejun Wu,
- Abstract要約: Coordinated few-step Flow (CoFlow)は、Coordinated Velocity Attention (CVA)とAdaptive Coordination Gatingを組み合わせたアーキテクチャである。
3つの独立コーディネートプローブは、利得がエージェント単位のコンパシティではなく、エージェント間コーディネートを通して流れていることを確認する。
CoFlowは、集中型と分散化された実行の両方の下で、1~3ステップで最先端のコーディネーション品質に達する。
- 参考スコア(独自算出の注目度): 2.770272813460748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative models have emerged as a major paradigm for offline multi-agent reinforcement learning (MARL), but existing approaches require many iterative sampling steps. Recent few-step accelerations either distill a joint teacher into independent students or apply averaged velocities independently per agent, suggesting that few-step inference requires sacrificing inter-agent coordination. We show this trade-off is not necessary: single-pass multi-agent generation can preserve coordination when the velocity field is natively joint-coupled. We propose Coordinated few-step Flow (CoFlow), an architecture that combines Coordinated Velocity Attention (CVA) with Adaptive Coordination Gating. A finite-difference consistency surrogate further replaces memory-prohibitive Jacobian-vector product backpropagation through the averaged velocity field with two stop-gradient forward passes. Across 60 configurations spanning MPE, MA-MuJoCo, and SMAC, CoFlow matches or surpasses Gaussian / value-based, transformer, diffusion, and prior flow baselines on episodic return. Three independent coordination probes confirm that the gains flow through inter-agent coordination rather than per-agent capacity. A denoising-step sweep shows that single-pass inference suffices on every configuration. CoFlow reaches state-of-the-art coordination quality in 1-3 denoising steps under both centralized and decentralized execution. Project page: https://github.com/Guowei-Zou/coflow.
- Abstract(参考訳): 生成モデルは、オフラインマルチエージェント強化学習(MARL)の主要なパラダイムとして登場したが、既存のアプローチでは、多くの反復的なサンプリングステップを必要とする。
最近の数段階の加速は、共同教師を独立した学生に蒸留するか、エージェントごとに独立して平均速度を適用するかのいずれかであり、少数の段階の推論はエージェント間の調整を犠牲にする必要があることを示唆している。
単一パスのマルチエージェント生成は、速度場がネイティブに結合されたときに協調を維持することができる。
本稿では,CVA(Coordinated Velocity Attention)とAdaptive Coordination Gatingを組み合わせたアーキテクチャであるCoordinated few-step Flow(CoFlow)を提案する。
有限差分整合サロゲートは、平均速度場を通るメモリ禁止ヤコビアンベクトル積のバックプロパゲーションを2つの停止勾配前方通過で置き換える。
MPE、MA-MuJoCo、SMACにまたがる60以上の構成で、CoFlowはガウス/値ベース、トランスフォーマー、拡散、およびエピソディックリターンに基づく以前のフローベースラインにマッチするか、超える。
3つの独立コーディネートプローブは、利得がエージェント単位のコンパシティではなく、エージェント間コーディネートを通して流れていることを確認する。
Denoising-step sweepは、シングルパス推論がすべての構成で十分であることを示している。
CoFlowは、集中型と分散化された実行の両方の下で、1~3ステップで最先端のコーディネーション品質に達する。
プロジェクトページ:https://github.com/Guowei-Zou/coflow.com
関連論文リスト
- FlowS: One-Step Motion Prediction via Local Transport Conditioning [3.883772843505009]
ローカルトランスポートコンディショニングは、安全クリティカルな自律性のために一段階の生成動作予測を実践する。
FlowSは75のアンサンブルを持つ最先端のSoft mAP (0.4804)とmAP (0.4703)を単一ステップ推論で調整する。
論文 参考訳(メタデータ) (2026-04-28T19:06:06Z) - WAM-Flow: Parallel Coarse-to-Fine Motion Planning via Discrete Flow Matching for Autonomous Driving [9.719456684859606]
本稿では,VLAモデルであるWAM-Flowを紹介し,Ego-trajectory Planningをトークン空間上の離散フローマッチングとして利用する。
WAM-Flowは完全に並列で双方向のデノゲーションを実行し、調整可能な計算精度トレードオフによる粗い微細化を可能にする。
これらの結果は、エンド・ツー・エンド・エンドの自律運転に期待できる新しいパラダイムとして離散フローマッチングが確立される。
論文 参考訳(メタデータ) (2025-12-05T19:36:46Z) - Optimal Control Meets Flow Matching: A Principled Route to Multi-Subject Fidelity [35.95129874095729]
テキスト・トゥ・イメージ(T2I)モデルは単一エンタリティ・プロンプトに優れるが、多目的記述に苦慮する。
マルチオブジェクト忠実度に向けてサンプリングダイナミクスを操るための原理的最適化可能な目的を持った最初の理論的枠組みを導入する。
論文 参考訳(メタデータ) (2025-10-02T17:59:58Z) - INSTINCT: Instance-Level Interaction Architecture for Query-Based Collaborative Perception [6.018757656052237]
協調認識システムは、マルチエージェントの知覚データを統合し、精度と安全性を向上させることで、単一車両の制限を克服する。
これまでの研究は、クエリベースのインスタンスレベルのインタラクションが帯域幅の要求と手作業による事前処理を減らすことを証明してきたが、協調認識におけるLiDARによる実装は未開発のままである。
InSTINCTは,(1)高品質なインスタンス特徴選択のための品質認識型フィルタリング機構,2)協調関連インスタンスと協調関連インスタンスを分離するデュアルブランチ検出ルーティングスキーム,3)クロスエージェントローカルインスタンスフュージョンモジュール,の3つのコアコンポーネントを特徴とする新しい協調認識フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-28T07:16:32Z) - Contrastive Flow Matching [61.60002028726023]
コントラストフローマッチング(Contrastive Flow Matching)は、全ての条件フローに対して一意性を明示するフローマッチング対象の拡張である。
提案手法は,任意のサンプル対からの予測フロー間の相違を最大化するための対照的な目的を与える。
比較フローマッチングによるトレーニングモデル(1)は最大9倍のトレーニング速度,(2)は最大5倍のノイズ除去ステップ,(3)FIDを最大8.9以下に向上させる。
論文 参考訳(メタデータ) (2025-06-05T17:59:58Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。
分散ポリシと集中型コントローラの両方として機能する。
実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。