論文の概要: The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search
- arxiv url: http://arxiv.org/abs/2603.08544v1
- Date: Mon, 09 Mar 2026 16:11:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:16.395945
- Title: The Neural Compass: Probabilistic Relative Feature Fields for Robotic Search
- Title(参考訳): ニューラルコンパス:ロボット検索のための確率的相対的特徴場
- Authors: Gabriele Somaschini, Adrian Röfer, Abhinav Valada,
- Abstract要約: 本稿では,事前学習された視覚言語モデルから得られた特徴量の相対分布を予測するために訓練された特徴場モデルProReFFを提案する。
本稿では,ProReFFが自然の場面で有意な相対的特徴分布を捉えていることを示す。
提案するエージェントは,最強のベースラインよりも20%効率が高く,最大80%の人的性能を達成できる。
- 参考スコア(独自算出の注目度): 16.604293152314995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object co-occurrences provide a key cue for finding objects successfully and efficiently in unfamiliar environments. Typically, one looks for cups in kitchens and views fridges as evidence of being in a kitchen. Such priors have also been exploited in artificial agents, but they are typically learned from explicitly labeled data or queried from language models. It is still unclear whether these relations can be learned implicitly from unlabeled observations alone. In this work, we address this problem and propose ProReFF, a feature field model trained to predict relative distributions of features obtained from pre-trained vision language models. In addition, we introduce a learning-based strategy that enables training from unlabeled and potentially contradictory data by aligning inconsistent observations into a coherent relative distribution. For the downstream object search task, we propose an agent that leverages predicted feature distributions as a semantic prior to guide exploration toward regions with a high likelihood of containing the object. We present extensive evaluations demonstrating that ProReFF captures meaningful relative feature distributions in natural scenes and provides insight into the impact of our proposed alignment step. We further evaluate the performance of our search agent in 100 challenges in the Matterport3D simulator, comparing with feature-based baselines and human participants. The proposed agent is 20% more efficient than the strongest baseline and achieves up to 80% of human performance.
- Abstract(参考訳): オブジェクトの共起は、不慣れな環境でオブジェクトを正しく効率的に見つけるための重要な手がかりを提供する。
通常、台所のカップを探し、冷蔵庫を台所にいる証拠とみなす。
このような先入観は人工エージェントにも利用されてきたが、典型的には明示的にラベル付けされたデータから学習されるか、言語モデルからクエリされる。
これらの関係が、ラベルなしの観測だけで暗黙的に学べるかどうかはまだ不明である。
本研究では,この問題に対処し,事前学習された視覚言語モデルから得られる特徴の相対分布を予測するために訓練された特徴場モデルProReFFを提案する。
さらに,不整合観測を一貫性のある相対分布に整合させることで,ラベルのない,潜在的に矛盾するデータからのトレーニングを可能にする学習ベースの戦略を導入する。
下流オブジェクト探索タスクでは、予測特徴分布を意味として活用し、対象を含む可能性の高い領域への探索を誘導するエージェントを提案する。
本稿では,ProReFFが自然の場面で有意な特徴分布を捉えることを実証し,提案するアライメントステップの影響について考察する。
そこで我々は,Matterport3Dシミュレータにおける100の課題において,検索エージェントの性能をさらに評価し,特徴に基づくベースラインと人間の参加者との比較を行った。
提案するエージェントは,最強のベースラインよりも20%効率が高く,最大80%の人的性能を達成できる。
関連論文リスト
- Revisiting Salient Object Detection from an Observer-Centric Perspective [48.99721284788945]
そこで我々は,視覚的手がかりだけでなく,その嗜好や意図など,観察者固有の要因を考慮し,有意な領域を予測できるオブザーバ中心の有意物体検出(OC-SOD)を提案する。
結果として、この定式化は本質的なあいまいさと人間の知覚の多様性を捉え、パーソナライズされ、文脈に合ったサリエンシの予測を可能にする。
論文 参考訳(メタデータ) (2026-02-06T03:53:01Z) - Stochastic Encodings for Active Feature Acquisition [100.47043816019888]
Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。
目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。
一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。
我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文 参考訳(メタデータ) (2025-08-03T23:48:46Z) - Gaussian Mixture Models for Affordance Learning using Bayesian Networks [50.18477618198277]
Affordancesはアクション、オブジェクト、エフェクト間の関係の基本的な記述である。
本稿では,世界を探究し,その感覚経験から自律的にこれらの余裕を学習するエンボディエージェントの問題にアプローチする。
論文 参考訳(メタデータ) (2024-02-08T22:05:45Z) - Intrinsic User-Centric Interpretability through Global Mixture of Experts [31.738009841932374]
InterpretCCは、人間の理解の容易さと忠実さの説明を最適化する、本質的に解釈可能なニューラルネットワークのファミリーである。
本報告では,InterpretCCの説明は,他の本質的な解釈可能なアプローチよりも,行動性や有用性が高いことを示す。
論文 参考訳(メタデータ) (2024-02-05T11:55:50Z) - Learning to Explore Informative Trajectories and Samples for Embodied
Perception [24.006056116516618]
未知の実施課題に対する知覚モデルの一般化は不十分である。
探索政策を自己管理する3次元意味分布マップを構築した。
そこで本研究では, 意味的分布の不確実性に基づいて, トラジェクトリのハードサンプルを選択することを提案する。
実験により,本手法で微調整した知覚モデルは,他の探索政策で訓練したベースラインよりも優れていた。
論文 参考訳(メタデータ) (2023-03-20T08:20:04Z) - Uncertainty in Contrastive Learning: On the Predictability of Downstream
Performance [7.411571833582691]
このような表現の不確実性は、単一のデータポイントに対して有意義な方法で定量化できるかどうかを考察する。
埋め込み空間におけるトレーニングデータの分布を直接推定することにより,この目標を達成することができることを示す。
論文 参考訳(メタデータ) (2022-07-19T15:44:59Z) - Masked prediction tasks: a parameter identifiability view [49.533046139235466]
マスク付きトークンの予測に広く用いられている自己教師型学習手法に着目する。
いくつかの予測タスクは識別可能性をもたらすが、他のタスクはそうではない。
論文 参考訳(メタデータ) (2022-02-18T17:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。