論文の概要: Active search and coverage using point-cloud reinforcement learning
- arxiv url: http://arxiv.org/abs/2312.11410v1
- Date: Mon, 18 Dec 2023 18:16:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 19:08:27.949090
- Title: Active search and coverage using point-cloud reinforcement learning
- Title(参考訳): ポイントクラウド強化学習によるアクティブ検索とカバレッジ
- Authors: Matthias Rosynski and Alexandru Pop and Lucian Busoniu
- Abstract要約: 本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。
RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。
また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
- 参考スコア(独自算出の注目度): 50.741409008225766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a problem in which the trajectory of a mobile 3D sensor must be
optimized so that certain objects are both found in the overall scene and
covered by the point cloud, as fast as possible. This problem is called target
search and coverage, and the paper provides an end-to-end deep reinforcement
learning (RL) solution to solve it. The deep neural network combines four
components: deep hierarchical feature learning occurs in the first stage,
followed by multi-head transformers in the second, max-pooling and merging with
bypassed information to preserve spatial relationships in the third, and a
distributional dueling network in the last stage. To evaluate the method, a
simulator is developed where cylinders must be found by a Kinect sensor. A
network architecture study shows that deep hierarchical feature learning works
for RL and that by using farthest point sampling (FPS) we can reduce the amount
of points and achieve not only a reduction of the network size but also better
results. We also show that multi-head attention for point-clouds helps to learn
the agent faster but converges to the same outcome. Finally, we compare RL
using the best network with a greedy baseline that maximizes immediate rewards
and requires for that purpose an oracle that predicts the next observation. We
decided RL achieves significantly better and more robust results than the
greedy strategy.
- Abstract(参考訳): 移動体3dセンサの軌道を最適化して、特定の物体が全体シーンに存在し、ポイントクラウドによってカバーされるようにしなくてはならない問題を考える。
この問題は対象探索とカバレッジと呼ばれ、本論文はそれを解くためにエンドツーエンドの深層強化学習(RL)ソリューションを提供する。
ディープニューラルネットワークは、第1段階での深層階層的特徴学習と、第2段階でのマルチヘッドトランスフォーマー、第3段階での空間的関係を維持するためにバイパスされた情報とマージされた最大プールと、最終段階での分散デュエルネットワークの4つのコンポーネントを組み合わせる。
この方法を評価するために、kinectセンサでシリンダーを探さなければならないシミュレータを開発した。
ネットワークアーキテクチャの研究では、RLの深い階層的特徴学習が有効であり、FPS(Fastthest Point sample)を用いることで、ポイントの量を削減し、ネットワークサイズを削減できるだけでなく、より良い結果が得られることが示されている。
また,ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化すると同時に,同じ結果に収束することを示す。
最後に、最適なネットワークを用いてRLを、即時報酬を最大化し、次の観測を予測できる託宣を要求する欲求ベースラインと比較する。
我々はRLが欲張り戦略よりもはるかに優れた、より堅牢な結果が得られると判断した。
関連論文リスト
- Optimizing Sensor Network Design for Multiple Coverage [0.9668407688201359]
本稿では,より効率的で堅牢なセンサネットワークを設計するgreedy (next-best-view)アルゴリズムの目的関数を提案する。
また、ほぼリアルタイムで計算を行うアルゴリズムを高速化するためのディープラーニングモデルも導入する。
論文 参考訳(メタデータ) (2024-05-15T05:13:20Z) - Multi-Correlation Siamese Transformer Network with Dense Connection for
3D Single Object Tracking [14.47355191520578]
ポイントクラウドベースの3Dオブジェクトトラッキングは、自動運転において重要なタスクである。
スパースLIDARポイントクラウドデータでテンプレートと検索ブランチの相関を効果的に学習することは依然として困難である。
本稿では,複数のステージを持つマルチ相関シームス変圧器ネットワークを提案し,各ステージの最後に特徴相関を行う。
論文 参考訳(メタデータ) (2023-12-18T09:33:49Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Provable Guarantees for Nonlinear Feature Learning in Three-Layer Neural
Networks [49.808194368781095]
3層ニューラルネットワークは,2層ネットワークよりも特徴学習能力が豊富であることを示す。
この研究は、特徴学習体制における2層ネットワーク上の3層ニューラルネットワークの証明可能なメリットを理解するための前進である。
論文 参考訳(メタデータ) (2023-05-11T17:19:30Z) - OFA$^2$: A Multi-Objective Perspective for the Once-for-All Neural
Architecture Search [79.36688444492405]
once-for-All(OFA)は、異なるリソース制約を持つデバイスのための効率的なアーキテクチャを探索する問題に対処するために設計された、ニューラルネットワーク検索(NAS)フレームワークである。
我々は,探索段階を多目的最適化問題として明示的に考えることにより,効率の追求を一歩進めることを目指している。
論文 参考訳(メタデータ) (2023-03-23T21:30:29Z) - Spatial Layout Consistency for 3D Semantic Segmentation [0.7614628596146599]
本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-02T03:24:21Z) - Improved Convergence Guarantees for Shallow Neural Networks [91.3755431537592]
勾配降下法により訓練された深度2ニューラルネットの収束度を世界最小とする。
我々のモデルには、二次損失関数による回帰、完全連結フィードフォワードアーキテクチャ、RelUアクティベーション、ガウスデータインスタンス、逆ラベルといった特徴がある。
彼らは、少なくとも我々のモデルでは、収束現象がNTK体制をはるかに超越していることを強く示唆している」。
論文 参考訳(メタデータ) (2022-12-05T14:47:52Z) - FatNet: A Feature-attentive Network for 3D Point Cloud Processing [1.502579291513768]
本稿では,グローバルポイントベースの機能とエッジベースの機能を組み合わせた,新たな機能指向ニューラルネットワーク層であるfat layerを提案する。
当社のアーキテクチャは,ModelNet40データセットで示すように,ポイントクラウド分類のタスクにおける最先端の成果を達成する。
論文 参考訳(メタデータ) (2021-04-07T23:13:56Z) - Decoupled and Memory-Reinforced Networks: Towards Effective Feature
Learning for One-Step Person Search [65.51181219410763]
歩行者検出と識別サブタスクを1つのネットワークで処理するワンステップ方式を開発しました。
現在のワンステップアプローチには2つの大きな課題があります。
本稿では,これらの問題を解決するために,分離メモリ強化ネットワーク(DMRNet)を提案する。
論文 参考訳(メタデータ) (2021-02-22T06:19:45Z) - Scan-based Semantic Segmentation of LiDAR Point Clouds: An Experimental
Study [2.6205925938720833]
最先端の手法では、深いニューラルネットワークを使用して、LiDARスキャンの各点のセマンティッククラスを予測する。
LiDAR測定を処理するための強力で効率的な方法は、2次元の画像のような投影を使うことである。
メモリの制約だけでなく、パフォーマンスの向上やランタイムの改善など、さまざまなテクニックを実証する。
論文 参考訳(メタデータ) (2020-04-06T11:08:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。