論文の概要: Just Cluster It: An Approach for Exploration in High-Dimensions using
Clustering and Pre-Trained Representations
- arxiv url: http://arxiv.org/abs/2402.03138v1
- Date: Mon, 5 Feb 2024 16:08:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 15:24:06.850627
- Title: Just Cluster It: An Approach for Exploration in High-Dimensions using
Clustering and Pre-Trained Representations
- Title(参考訳): Just Cluster It: クラスタリングと事前学習表現を用いた高次元探索のためのアプローチ
- Authors: Stefan Sylvius Wagner and Stefan Harmeling
- Abstract要約: 本稿では,3次元環境探索におけるクラスタリング表現の有効性について検討する。
本稿では,ランダムな表現と事前学習したDINO表現を用いて,状態をカウントするためのエピソードおよびグローバルクラスタリングを行う手法を提案する。
我々は,VizDoom と Habitat の環境に対するアプローチを評価し,この手法が他のよく知られた探索手法を上回ることを実証した。
- 参考スコア(独自算出の注目度): 1.6860963320038902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we adopt a representation-centric perspective on exploration in
reinforcement learning, viewing exploration fundamentally as a density
estimation problem. We investigate the effectiveness of clustering
representations for exploration in 3-D environments, based on the observation
that the importance of pixel changes between transitions is less pronounced in
3-D environments compared to 2-D environments, where pixel changes between
transitions are typically distinct and significant. We propose a method that
performs episodic and global clustering on random representations and on
pre-trained DINO representations to count states, i.e, estimate pseudo-counts.
Surprisingly, even random features can be clustered effectively to count states
in 3-D environments, however when these become visually more complex,
pre-trained DINO representations are more effective thanks to the pre-trained
inductive biases in the representations. Overall, this presents a pathway for
integrating pre-trained biases into exploration. We evaluate our approach on
the VizDoom and Habitat environments, demonstrating that our method surpasses
other well-known exploration methods in these settings.
- Abstract(参考訳): 本稿では,強化学習における探索に関する表現中心の視点を採用し,探索を基本的に密度推定問題として捉えた。
本研究では,3次元環境におけるクラスタリング表現の有効性について検討し,遷移間の画素変化の重要性は,遷移間の画素変化が典型的に相違し重要な2次元環境に比べて3次元環境において強調されないことを示した。
本稿では,乱数表現と事前学習されたディノ表現に対してエピソディックと大域的クラスタリングを行い,擬似数を推定する手法を提案する。
驚くべきことに、ランダムな特徴でさえ3次元環境の状態をカウントするために効果的にクラスタリングすることができるが、これらが視覚的に複雑になると、事前学習されたDINO表現は、事前学習された誘導バイアスによりより効果的になる。
全体として、これは事前訓練されたバイアスを探索に統合するための経路を示す。
我々は,VizDoom環境とHabitat環境に対するアプローチを評価し,この手法が他のよく知られた探索手法を上回ることを示す。
関連論文リスト
- RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - PARTNER: Level up the Polar Representation for LiDAR 3D Object Detection [81.16859686137435]
本稿では、極座標における新しい3次元物体検出器Partnerを紹介する。
提案手法は,ONCE検証セットにおいて3.68%,9.15%の差で従来の極性理論よりも優れていた。
論文 参考訳(メタデータ) (2023-08-08T01:59:20Z) - Learning to Explore Informative Trajectories and Samples for Embodied
Perception [24.006056116516618]
未知の実施課題に対する知覚モデルの一般化は不十分である。
探索政策を自己管理する3次元意味分布マップを構築した。
そこで本研究では, 意味的分布の不確実性に基づいて, トラジェクトリのハードサンプルを選択することを提案する。
実験により,本手法で微調整した知覚モデルは,他の探索政策で訓練したベースラインよりも優れていた。
論文 参考訳(メタデータ) (2023-03-20T08:20:04Z) - Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。
提案手法は,同数の視線シフトに対してF1スコアを2~3ポイント増加させる。
論文 参考訳(メタデータ) (2022-08-24T14:59:28Z) - Importance Sampling CAMs for Weakly-Supervised Segmentation [16.86352815414646]
クラスアクティベーションマップ(CAM)は、クラスアクティベーションマップ(CAM)を用いて、画像内のオブジェクトのローカライズとセグメント化に使用できる。
本研究では,CAM学習の改善に2つの貢献によって両問題にアプローチする。
PASCAL VOC 2012ベンチマークデータセットを用いて,これらの修正によって輪郭精度が著しく向上することを示す。
論文 参考訳(メタデータ) (2022-03-23T14:54:29Z) - Point-Level Region Contrast for Object Detection Pre-Training [147.47349344401806]
本稿では,物体検出作業のための自己教師付き事前学習手法である点レベル領域コントラストを提案する。
提案手法は,異なる領域から個々の点対を直接抽出することにより,コントラスト学習を行う。
領域ごとの集約表現と比較すると,入力領域の品質の変化に対して,我々のアプローチはより堅牢である。
論文 参考訳(メタデータ) (2022-02-09T18:56:41Z) - Sim2Real Object-Centric Keypoint Detection and Description [40.58367357980036]
キーポイントの検出と記述はコンピュータビジョンにおいて中心的な役割を果たす。
対象中心の定式化を提案し、各関心点が属する対象をさらに特定する必要がある。
我々はシミュレーションで訓練されたモデルを現実のアプリケーションに一般化できるsim2realコントラスト学習機構を開発した。
論文 参考訳(メタデータ) (2022-02-01T15:00:20Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。