論文の概要: Rule-Based Conflict-Free Decision Framework in Swarm Confrontation
- arxiv url: http://arxiv.org/abs/2503.07077v1
- Date: Mon, 10 Mar 2025 09:00:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:49:40.175664
- Title: Rule-Based Conflict-Free Decision Framework in Swarm Confrontation
- Title(参考訳): Swarm Confrontationにおけるルールベースの競合フリー決定フレームワーク
- Authors: Zhaoqi Dong, Zhinan Wang, Quanqi Zheng, Bin Xu, Lei Chen, Jinhu Lv,
- Abstract要約: 本稿では,確率的有限状態マシン,深層畳み込みネットワーク,強化学習を統合した新しい意思決定フレームワークを提案する。
我々のフレームワークは、状態マシンの不安定性とJoDの問題を克服し、Swarmの対決における信頼性と適応性を確保します。
- 参考スコア(独自算出の注目度): 6.618327118416159
- License:
- Abstract: Traditional rule--based decision--making methods with interpretable advantage, such as finite state machine, suffer from the jitter or deadlock(JoD) problems in extremely dynamic scenarios. To realize agent swarm confrontation, decision conflicts causing many JoD problems are a key issue to be solved. Here, we propose a novel decision--making framework that integrates probabilistic finite state machine, deep convolutional networks, and reinforcement learning to implement interpretable intelligence into agents. Our framework overcomes state machine instability and JoD problems, ensuring reliable and adaptable decisions in swarm confrontation. The proposed approach demonstrates effective performance via enhanced human--like cooperation and competitive strategies in the rigorous evaluation of real experiments, outperforming other methods.
- Abstract(参考訳): 有限状態マシンのような解釈可能な優位性を持つ従来のルールベースの意思決定手法は、極めてダイナミックなシナリオにおいてジッタやデッドロック(JoD)問題に悩まされる。
エージェントのSwarm対決を実現するために、多くのJoD問題を引き起こす決定の衝突が解決すべき重要な問題である。
本稿では、確率的有限状態マシン、深層畳み込みネットワーク、強化学習を統合し、エージェントに解釈可能なインテリジェンスを実装する新しい意思決定フレームワークを提案する。このフレームワークは、状態マシンの不安定性とJoD問題を克服し、スワム対決における信頼性と適応性を確保する。本提案手法は、実実験の厳密な評価において、人間的な協力と競争戦略の強化による効果的なパフォーマンスを実証し、他の手法よりも優れている。
関連論文リスト
- Agentic LLM Framework for Adaptive Decision Discourse [2.4919169815423743]
本研究では,実世界のエージェント型大規模言語モデル(LLM)フレームワークを紹介する。
従来の意思決定支援ツールとは異なり、このフレームワークは対話、トレードオフ探索、エージェント間の相互作用によって生成される創発的なシナジーを強調している。
その結果、第1次探索がいかに堅牢で公平なレコメンデーションパスを育むかが明らかとなった。
論文 参考訳(メタデータ) (2025-02-16T03:46:37Z) - Sequential Manipulation Against Rank Aggregation: Theory and Algorithm [119.57122943187086]
脆弱なデータ収集プロセスに対するオンライン攻撃を活用します。
ゲーム理論の観点からは、対決シナリオは分布的に堅牢なゲームとして定式化される。
提案手法は,ランクアグリゲーション手法の結果を逐次的に操作する。
論文 参考訳(メタデータ) (2024-07-02T03:31:21Z) - Optimising Human-AI Collaboration by Learning Convincing Explanations [62.81395661556852]
本研究では,人間による意思決定によって安全を保ちながら協調的なシステムを構築する手法を提案する。
Ardentは、説明のための個人の好みに適応することで、効率的で効果的な意思決定を可能にする。
論文 参考訳(メタデータ) (2023-11-13T16:00:16Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - Hybrid Multi-agent Deep Reinforcement Learning for Autonomous Mobility
on Demand Systems [31.23491481430466]
本稿では,自律型モビリティ・オン・デマンドシステムの利益を最大化する運用者に対して,積極的要求の割当と拒否決定を行うというシーケンシャルな意思決定問題を考察する。
我々はマルコフ決定過程としてこの問題を定式化し、予測制御ポリシを得るために、マルチエージェントのソフトアクター・クリティカルと重み付きバイパートイトマッチングを組み合わせた新しい組み合わせを提案する。
論文 参考訳(メタデータ) (2022-12-14T16:19:51Z) - On the Complexity of Adversarial Decision Making [101.14158787665252]
決定推定係数は, 相手の意思決定に対する後悔度を低く抑えるのに必要であり, 十分であることを示す。
我々は、決定推定係数を他のよく知られた複雑性尺度の変種に結びつける新しい構造結果を提供する。
論文 参考訳(メタデータ) (2022-06-27T06:20:37Z) - Conceptualising Contestability: Perspectives on Contesting Algorithmic
Decisions [18.155121103400333]
オーストラリアが提案するAI倫理枠組みに反応して提出を行った人々や組織の視点を記述し分析する。」
以上の結果から, 競争性の性質は議論されているものの, 個人を保護する方法と見なされ, 人間の意思決定と競合性に類似していることが判明した。
論文 参考訳(メタデータ) (2021-02-23T05:13:18Z) - An Autonomous Negotiating Agent Framework with Reinforcement Learning
Based Strategies and Adaptive Strategy Switching Mechanism [3.4376560669160394]
本研究は,専門家選択の問題の解決と,我々の自律交渉エージェントフレームワークで相手の行動に適応することに焦点を当てる。
我々のフレームワークは、新しい戦略を含めるか、古い戦略を定期的により良い戦略で置き換えることを決定することで、自己改善機能を可能にするレビュアーコンポーネントを持っています。
論文 参考訳(メタデータ) (2021-02-06T14:38:03Z) - End-to-End Learning and Intervention in Games [60.41921763076017]
ゲームにおける学習と介入のための統一的なフレームワークを提供する。
明示的および暗黙的な区別に基づく2つのアプローチを提案する。
分析結果は、実世界のいくつかの問題を用いて検証される。
論文 参考訳(メタデータ) (2020-10-26T18:39:32Z) - Optimal Inspection and Maintenance Planning for Deteriorating Structural
Components through Dynamic Bayesian Networks and Markov Decision Processes [0.0]
部分的に観測可能なマルコフ決定過程(POMDPs)は、不確実な行動結果と観測下での最適制御のための数学的方法論を提供する。
本稿では, 有限地平線POMDPを構造的信頼性の文脈で開発するための定式化について述べる。
その結果,従来の問題設定においても,POMDPのコストは従来に比べて大幅に低減した。
論文 参考訳(メタデータ) (2020-09-09T20:03:42Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。