論文の概要: A model-based framework for learning transparent swarm behaviors
- arxiv url: http://arxiv.org/abs/2103.05343v1
- Date: Tue, 9 Mar 2021 10:45:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 14:50:49.693116
- Title: A model-based framework for learning transparent swarm behaviors
- Title(参考訳): 透過的なSwarm行動学習のためのモデルベースフレームワーク
- Authors: Mario Coppola, Jian Guo, Eberhard Gill, Guido C. H. E. de Croon
- Abstract要約: 本稿では,ロボット群に対する理解可能かつ検証可能な行動を設計するためのモデルベースフレームワークを提案する。
このフレームワークは4つのケーススタディでテストされ、アグリゲーションとフォージングタスクが特徴だ。
- 参考スコア(独自算出の注目度): 6.310689648471231
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a model-based framework to automatically and efficiently
design understandable and verifiable behaviors for swarms of robots. The
framework is based on the automatic extraction of two distinct models: 1) a
neural network model trained to estimate the relationship between the robots'
sensor readings and the global performance of the swarm, and 2) a probabilistic
state transition model that explicitly models the local state transitions
(i.e., transitions in observations from the perspective of a single robot in
the swarm) given a policy. The models can be trained from a data set of
simulated runs featuring random policies. The first model is used to
automatically extract a set of local states that are expected to maximize the
global performance. These local states are referred to as desired local states.
The second model is used to optimize a stochastic policy so as to increase the
probability that the robots in the swarm observe one of the desired local
states. Following these steps, the framework proposed in this paper can
efficiently lead to effective controllers. This is tested on four case studies,
featuring aggregation and foraging tasks. Importantly, thanks to the models,
the framework allows us to understand and inspect a swarm's behavior. To this
end, we propose verification checks to identify some potential issues that may
prevent the swarm from achieving the desired global objective. In addition, we
explore how the framework can be used in combination with a "standard"
evolutionary robotics strategy (i.e., where performance is measured via
simulation), or with online learning.
- Abstract(参考訳): 本稿では,ロボット群に対する理解可能かつ検証可能な行動を自動的に設計するモデルベースフレームワークを提案する。
このフレームワークは、2つの異なるモデルの自動抽出に基づいている: 1) ロボットのセンサ読み込みとスワムのグローバルパフォーマンスの関係を推定するために訓練されたニューラルネットワークモデル、2) ポリシーが与えられたとき、局所状態遷移を明示的にモデル化する確率的状態遷移モデル(すなわち、swarm内の1つのロボットの観点から観察中の遷移)である。
モデルは、ランダムポリシーを特徴とするシミュレーション実行のデータセットからトレーニングすることができる。
第1のモデルは、グローバルパフォーマンスを最大化することが期待される一連のローカル状態を自動的に抽出するために使用される。
これらの地方州は所望の地方州と呼ばれる。
第2のモデルは、群れ内のロボットが所望の局所状態の1つを観察する確率を高めるために確率的政策を最適化するために使用されます。
これらの手順に従って,本論文で提案するフレームワークは,効率的なコントローラの実現に有効である。
これは4つのケーススタディでテストされ、アグリゲーションとフォージングタスクが特徴である。
重要なことに、このフレームワークはモデルのおかげで、Swarmの振る舞いを理解し、検査することができます。
そこで本研究では,swarmが望ましいグローバル目標を達成するのを妨げる可能性のある問題を特定するための検証チェックを提案する。
さらに、このフレームワークが「標準的な」進化型ロボティクス戦略(例えば、シミュレーションによってパフォーマンスを計測する)やオンライン学習と組み合わせてどのように使用できるかを検討する。
関連論文リスト
- Fine-Tuning Generative Models as an Inference Method for Robotic Tasks [18.745665662647912]
ロボット作業における観察にニューラルネットワークモデルのサンプル生成を迅速に適応させる方法について検討する。
鍵となるアイデアは、観測された証拠と一致する生成サンプルにそれを適合させることで、モデルを素早く微調整することである。
本手法は自己回帰モデルと変分自己エンコーダの両方に適用可能であることを示す。
論文 参考訳(メタデータ) (2023-10-19T16:11:49Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - From system models to class models: An in-context learning paradigm [0.0]
本稿では,1段階の予測と複数段階のシミュレーションという2つの主要な課題に対処する,システム識別のための新しいパラダイムを提案する。
動的システムのクラスを表すメタモデルを学ぶ。
一段階の予測では、GPTのようなデコーダのみのアーキテクチャを使用し、シミュレーション問題ではエンコーダ-デコーダ構造を用いる。
論文 参考訳(メタデータ) (2023-08-25T13:50:17Z) - RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic
Control [140.48218261864153]
本研究では,インターネット規模のデータに基づいて学習した視覚言語モデルを,エンドツーエンドのロボット制御に直接組み込む方法について検討する。
提案手法は,インターネット規模のトレーニングから,RT-2による創発的能力の獲得を可能にした。
論文 参考訳(メタデータ) (2023-07-28T21:18:02Z) - Locally adaptive cellular automata for goal-oriented self-organization [14.059479351946386]
本稿では,スケーラブルで表現力のあるモデルを生成するための適応型セルオートマトンモデルを提案する。
本稿では,セルオートマトンとシステム状態の更新ルールを局所的に結合することで,適応を実現する方法を示す。
論文 参考訳(メタデータ) (2023-06-12T12:32:23Z) - STMT: A Spatial-Temporal Mesh Transformer for MoCap-Based Action Recognition [50.064502884594376]
本研究では、モーションキャプチャー(MoCap)シーケンスを用いた人間の行動認識の問題点について検討する。
メッシュシーケンスを直接モデル化する新しい時空間メッシュ変換器(STMT)を提案する。
提案手法は,スケルトンベースモデルやポイントクラウドベースモデルと比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-03-31T16:19:27Z) - TrafficBots: Towards World Models for Autonomous Driving Simulation and
Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。
動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。
オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文 参考訳(メタデータ) (2023-03-07T18:28:41Z) - IR-MCL: Implicit Representation-Based Online Global Localization [31.77645160411745]
本稿では,室内環境におけるロボットの姿勢を2次元LiDARデータを用いて推定する問題に対処する。
ニューラルネットワークを用いてシーンを暗黙的に表現するためのニューラルネットワーク占有場(NOF)を提案する。
本研究では,最先端手法のローカライズ性能を超越したアプローチを用いて,ロボットを高精度かつ効率的にローカライズできることを示す。
論文 参考訳(メタデータ) (2022-10-06T17:59:08Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - Learning Meta Face Recognition in Unseen Domains [74.69681594452125]
メタ顔認識(MFR)というメタラーニングを用いた新しい顔認識手法を提案する。
MFRは、メタ最適化目標を用いてソース/ターゲットドメインシフトを合成する。
一般化顔認識評価のためのベンチマークを2つ提案する。
論文 参考訳(メタデータ) (2020-03-17T14:10:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。