論文の概要: GlobeDiff: State Diffusion Process for Partial Observability in Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2602.15776v1
- Date: Tue, 17 Feb 2026 18:05:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:18.154194
- Title: GlobeDiff: State Diffusion Process for Partial Observability in Multi-Agent Systems
- Title(参考訳): GlobeDiff:マルチエージェントシステムにおける部分観測可能性のための状態拡散過程
- Authors: Yiqin Yang, Xu Yang, Yuhua Jiang, Ni Mu, Hao Hu, Runpeng Xie, Ziyou Zhang, Siyuan Li, Yuan-Hua Ni, Qianchuan Zhao, Bo Xu,
- Abstract要約: 本稿では,局所観測に基づいてグローバルな状態を推定するためにGlobeDiffを提案する。
状態推論プロセスを多モード拡散プロセスとして定式化することにより、GlobeDiffは状態推定の曖昧さを克服する。
本稿では,一様分布と多モード分布の両方におけるGlobeDiffの推定誤差が有界であることを証明する。
- 参考スコア(独自算出の注目度): 29.9706117853928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the realm of multi-agent systems, the challenge of \emph{partial observability} is a critical barrier to effective coordination and decision-making. Existing approaches, such as belief state estimation and inter-agent communication, often fall short. Belief-based methods are limited by their focus on past experiences without fully leveraging global information, while communication methods often lack a robust model to effectively utilize the auxiliary information they provide. To solve this issue, we propose Global State Diffusion Algorithm~(GlobeDiff) to infer the global state based on the local observations. By formulating the state inference process as a multi-modal diffusion process, GlobeDiff overcomes ambiguities in state estimation while simultaneously inferring the global state with high fidelity. We prove that the estimation error of GlobeDiff under both unimodal and multi-modal distributions can be bounded. Extensive experimental results demonstrate that GlobeDiff achieves superior performance and is capable of accurately inferring the global state.
- Abstract(参考訳): マルチエージェントシステムにおいて、emph{partial observability}の課題は効果的な協調と意思決定にとって重要な障壁である。
信念状態推定やエージェント間コミュニケーションといった既存のアプローチは、しばしば不足する。
信念に基づく手法は、グローバル情報を完全に活用せずに過去の経験に焦点をあてることによって制限されるが、コミュニケーション手法は、それらが提供する補助情報を効果的に活用するための堅牢なモデルが欠如していることが多い。
この問題を解決するために,局所的な観測に基づいてグローバルな状態を推定するグローバルステート拡散アルゴリズム~(GlobeDiff)を提案する。
状態推論過程を多モード拡散過程として定式化することにより、GlobeDiffは状態推定におけるあいまいさを克服し、同時に大域状態を高い忠実度で推定する。
本稿では,一様分布と多モード分布の両方におけるGlobeDiffの推定誤差が有界であることを証明する。
大規模な実験結果から,GlobeDiffは優れた性能を示し,グローバルな状態を正確に推定できることがわかった。
関連論文リスト
- CLIP Meets Diffusion: A Synergistic Approach to Anomaly Detection [49.11819337853632]
異常検出は、異常の定義の曖昧さ、異常型の多様性、トレーニングデータの不足による複雑な問題である。
識別的基盤モデルと生成的基礎モデルの両方を活用するCLIPfusionを提案する。
本手法は, 異常検出の多面的課題に対処する上で, マルチモーダル・マルチモデル融合の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2025-06-13T13:30:15Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - Mind the Gap: Confidence Discrepancy Can Guide Federated Semi-Supervised Learning Across Pseudo-Mismatch [50.632535091877706]
Federated Semi-Supervised Learning (FSSL)は、ラベル付きデータに制限のあるクライアント間でラベル付きデータを活用して、強力な一般化能力を持つグローバルモデルをトレーニングすることを目的としている。
ほとんどのFSSL手法は擬似ラベルによる整合正則化に依存しており、局所的またはグローバルなモデルからの予測を監督信号としてハード擬似ラベルに変換する。
擬似ラベルの品質は、フェデレーション学習の本質的な側面であるデータ不均一性によって大きく劣化していることを示す。
論文 参考訳(メタデータ) (2025-03-17T14:41:51Z) - On Diffusion Models for Multi-Agent Partial Observability: Shared Attractors, Error Bounds, and Composite Flow [37.433470342139685]
拡散モデルを用いたDEC-POMDPにおける局所的な行動観測履歴からのグローバルな状態の再構築について検討する。
深層学習近似誤差では、固定点が真の状態から逸脱し、偏差はヤコビアンランクと負の相関を持つ。
論文 参考訳(メタデータ) (2024-10-17T18:23:33Z) - Beyond Local Views: Global State Inference with Diffusion Models for Cooperative Multi-Agent Reinforcement Learning [36.25611963252774]
拡散モデルによる状態推論(SIDIFF)は、画像の露光にインスパイアされている。
SIDIFFは、ローカルな観測のみに基づいて、元のグローバルステートを再構築する。
現在のマルチエージェント強化学習アルゴリズムに無理に組み込むことができる。
論文 参考訳(メタデータ) (2024-08-18T14:49:53Z) - GLOBE-CE: A Translation-Based Approach for Global Counterfactual
Explanations [10.276136171459731]
Global & Efficient Counterfactual Explanations (GLOBE-CE)は、現在の最先端技術に関連する信頼性とスケーラビリティの問題に取り組む柔軟なフレームワークである。
分類的特徴翻訳を数学的に解析し,その手法を応用した。
公開データセットとユーザスタディによる実験的評価は、GLOBE-CEが現在の最先端よりも大幅にパフォーマンスが向上していることを示している。
論文 参考訳(メタデータ) (2023-05-26T15:26:59Z) - Distributed Q-Learning with State Tracking for Multi-agent Networked
Control [61.63442612938345]
本稿では,LQR(Linear Quadratic Regulator)のマルチエージェントネットワークにおける分散Q-ラーニングについて検討する。
エージェントに最適なコントローラを設計するための状態追跡(ST)ベースのQ-ラーニングアルゴリズムを考案する。
論文 参考訳(メタデータ) (2020-12-22T22:03:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。