論文の概要: Learning Continuous Control Policies for Information-Theoretic Active
Perception
- arxiv url: http://arxiv.org/abs/2209.12427v2
- Date: Tue, 16 May 2023 19:11:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 20:56:06.697032
- Title: Learning Continuous Control Policies for Information-Theoretic Active
Perception
- Title(参考訳): 情報理論アクティブ知覚のための連続制御政策の学習
- Authors: Pengzhi Yang and Yuhan Liu and Shumon Koga and Arash Asgharivaskasi
and Nikolay Atanasov
- Abstract要約: ランドマーク状態とセンサ観測の相互情報を最大化する制御ポリシーを学習する問題に取り組む。
我々はカルマンフィルタを用いてランドマーク状態の部分的に観測可能な問題をマルコフ決定過程(MDP)に変換する。
- 参考スコア(独自算出の注目度): 24.297016904005257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a method for learning continuous control policies for
active landmark localization and exploration using an information-theoretic
cost. We consider a mobile robot detecting landmarks within a limited sensing
range, and tackle the problem of learning a control policy that maximizes the
mutual information between the landmark states and the sensor observations. We
employ a Kalman filter to convert the partially observable problem in the
landmark state to Markov decision process (MDP), a differentiable field of view
to shape the reward, and an attention-based neural network to represent the
control policy. The approach is further unified with active volumetric mapping
to promote exploration in addition to landmark localization. The performance is
demonstrated in several simulated landmark localization tasks in comparison
with benchmark methods.
- Abstract(参考訳): 本稿では,情報理論コストを用いたランドマーク化と探索のための連続制御ポリシーの学習手法を提案する。
本研究では,センサの限られた範囲内でランドマークを検出する移動ロボットについて検討し,ランドマーク状態とセンサ観測の相互情報を最大化する制御ポリシーの学習に挑戦する。
我々は、カルマンフィルタを用いて、ランドマーク状態における部分可観測問題をマルコフ決定プロセス(mdp)へ変換し、報酬を形作るための微分可能な視野と、制御ポリシーを表す注意に基づくニューラルネットワークを用いる。
このアプローチはさらにアクティブボリュームマッピングと統合され、ランドマークのローカライゼーションに加えて探索を促進する。
この性能は、ベンチマーク手法と比較して、いくつかの模擬ランドマークローカライゼーションタスクで実証される。
関連論文リスト
- Learning Where to Look: Self-supervised Viewpoint Selection for Active Localization using Geometrical Information [68.10033984296247]
本稿では, 位置決めの精度を高めるために, 視点選択の重要性を強調し, アクティブな位置決め領域について検討する。
私たちのコントリビューションは、リアルタイム操作用に設計されたシンプルなアーキテクチャ、自己教師付きデータトレーニング方法、および実世界のロボティクスアプリケーションに適した計画フレームワークにマップを一貫して統合する能力による、データ駆動型アプローチの使用に関するものです。
論文 参考訳(メタデータ) (2024-07-22T12:32:09Z) - Local Feature Matching Using Deep Learning: A Survey [19.322545965903608]
局所的な特徴マッチングは、画像検索、3D再構成、オブジェクト認識といった領域を含むコンピュータビジョンの領域において幅広い応用を享受する。
近年,深層学習モデルの導入により,局所的特徴マッチング手法の探究が盛んに行われている。
また,移動構造,リモートセンシング画像登録,医用画像登録などの多様な領域における局所的特徴マッチングの実践的応用についても検討した。
論文 参考訳(メタデータ) (2024-01-31T04:32:41Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - ROIFormer: Semantic-Aware Region of Interest Transformer for Efficient
Self-Supervised Monocular Depth Estimation [6.923035780685481]
幾何認識表現強調のための効率的な局所適応アダプティブアテンション手法を提案する。
意味情報からの幾何学的手がかりを利用して局所適応的境界ボックスを学習し、教師なし特徴集合を導出する。
提案手法は, 自己教師型単分子深度推定タスクにおける新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2022-12-12T06:38:35Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。
提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。
領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文 参考訳(メタデータ) (2022-02-09T18:56:41Z) - Active Visual Localization in Partially Calibrated Environments [35.48595012305253]
人間は、目立った視覚的な手がかりやランドマークに追われて地図を使わずに、自分自身をしっかりとローカライズすることができる。
この研究では、自律エージェントを同じ能力でエンドウイングすることを目指している。
このような能力はロボットアプリケーションにおいて重要であるが、エージェントが部分的に調整された環境に晒される場合、非常に困難である。
合成データと実データの両方で構成された屋内シーンデータセットACR-6を提案し、アクティブビジュアルローカリゼーションのための困難なシナリオをシミュレートします。
論文 参考訳(メタデータ) (2020-12-08T08:00:55Z) - Localized active learning of Gaussian process state space models [63.97366815968177]
多くの共通制御アプリケーションにおいて、優れた性能を達成するためには、グローバルに正確なモデルを必要としない。
本稿では,状態-作用空間の有界部分集合上の正確なモデルを得ることを目的としたガウス過程状態空間モデルに対する能動的学習戦略を提案する。
モデル予測制御を用いることで、探索中に収集した情報を統合し、探索戦略を適応的に改善する。
論文 参考訳(メタデータ) (2020-05-04T05:35:02Z) - InfoBot: Transfer and Exploration via the Information Bottleneck [105.28380750802019]
強化学習における中心的な課題は、報酬がわずかに分散されたタスクに対する効果的なポリシーを見つけることである。
我々は、事前の経験から意思決定状態について学ぶことを提案する。
この単純なメカニズムは、部分的に観察された状態であっても、決定状態を効果的に識別する。
論文 参考訳(メタデータ) (2019-01-30T15:33:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。