論文の概要: LINGO-Space: Language-Conditioned Incremental Grounding for Space
- arxiv url: http://arxiv.org/abs/2402.01183v1
- Date: Fri, 2 Feb 2024 06:58:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 23:56:51.448223
- Title: LINGO-Space: Language-Conditioned Incremental Grounding for Space
- Title(参考訳): lingO-Space: 言語による空間のインクリメンタルグラウンド
- Authors: Dohyun Kim, Nayoung Oh, Deokmin Hwang, Daehyung Park,
- Abstract要約: 本稿では,参照される空間の確率分布を正確に同定し,漸進的に更新する新しい確率的空間グラウンド手法(INGO-Space)を提案する。
評価の結果、極性分布を用いた推定により、20ドルのテーブルトップベンチマークテストにより、ロボットが位置をグラウンドできることがわかった。
- 参考スコア(独自算出の注目度): 3.442372522693844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We aim to solve the problem of spatially localizing composite instructions referring to space: space grounding. Compared to current instance grounding, space grounding is challenging due to the ill-posedness of identifying locations referred to by discrete expressions and the compositional ambiguity of referring expressions. Therefore, we propose a novel probabilistic space-grounding methodology (LINGO-Space) that accurately identifies a probabilistic distribution of space being referred to and incrementally updates it, given subsequent referring expressions leveraging configurable polar distributions. Our evaluations show that the estimation using polar distributions enables a robot to ground locations successfully through $20$ table-top manipulation benchmark tests. We also show that updating the distribution helps the grounding method accurately narrow the referring space. We finally demonstrate the robustness of the space grounding with simulated manipulation and real quadruped robot navigation tasks. Code and videos are available at https://lingo-space.github.io.
- Abstract(参考訳): 本研究では,空間を表す複合命令を空間的に局所化する問題である空間接地を実現することを目的とする。
現在の例の接地と比較して、空間接地は、離散表現によって参照される位置を特定できないことや、参照表現の組成のあいまいさにより困難である。
そこで本稿では,提案する空間の確率分布を正確に同定し,次から次へと更新する,新しい確率空間グラウンド手法(INGO-Space)を提案する。
評価の結果、極性分布を用いた推定により、20ドルのテーブルトップベンチマークテストにより、ロボットが位置をグラウンドできることがわかった。
また,分布の更新によって参照空間を正確に狭めることができることを示す。
最終的に、シミュレーション操作と実際の4重ロボットナビゲーションタスクによって、宇宙接地が頑丈であることを実証した。
コードとビデオはhttps://lingo-space.github.io.comで公開されている。
関連論文リスト
- GOI: Find 3D Gaussians of Interest with an Optimizable Open-vocabulary Semantic-space Hyperplane [53.388937705785025]
3Dオープンボキャブラリのシーン理解は、拡張現実とロボット応用の推進に不可欠である。
GOIは2次元視覚言語基礎モデルから3次元ガウススプラッティング(3DGS)に意味的特徴を統合するフレームワークである。
提案手法では,特徴空間内の超平面分割として特徴選択処理を扱い,クエリに関連性の高い特徴のみを保持する。
論文 参考訳(メタデータ) (2024-05-27T18:57:18Z) - Distribution-Aware Calibration for Object Detection with Noisy Bounding Boxes [58.2797274877934]
そこで我々はDISCO(Distribution-aware CalibratiOn)を提案する。
分類, 局所化, 解釈可能性を改善するために, 3つの分布認識技術を開発した。
論文 参考訳(メタデータ) (2023-08-23T09:20:05Z) - A Geometric Notion of Causal Probing [91.14470073637236]
言語モデルの表現空間では、動詞数のような概念に関するすべての情報が線形部分空間に符号化される。
理想線型概念部分空間を特徴づける内在的基準のセットを与える。
LEACEは概念情報の約半分を含む1次元の部分空間を返す。
論文 参考訳(メタデータ) (2023-07-27T17:57:57Z) - Deep Spatial Domain Generalization [8.102110157532556]
本研究では,空間データをグラフとして扱う空間グラフニューラルネットワークを開発し,各ノードに空間埋め込みを学習する。
提案手法は,テストフェーズ中に見つからない位置の空間埋め込みを推定し,下流タスクモデルのパラメータを目標位置に直接デコードする。
論文 参考訳(メタデータ) (2022-10-03T06:16:20Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Low-Rank Subspaces in GANs [101.48350547067628]
この研究は、GAN生成をより正確に制御できる低ランクな部分空間を導入している。
LowRankGAN は属性多様体の低次元表現を見つけることができる。
さまざまなデータセットでトレーニングされた最先端のGANモデル(StyleGAN2やBigGANなど)の実験は、私たちのLowRankGANの有効性を示しています。
論文 参考訳(メタデータ) (2021-06-08T16:16:32Z) - Spatial Language Understanding for Object Search in Partially Observed
Cityscale Environments [21.528770932332474]
空間言語観測空間を導入し、部分観測可能なマルコフ決定プロセス(POMDP)の枠組みの下でモデルを定式化する。
本稿では,言語提供者の参照の相対的フレーム(FoR)の環境コンテキストを予測する畳み込みニューラルネットワークモデルを提案する。
本稿では,FOR予測モデルとオブジェクト探索システムの一般化可能性を示す。
論文 参考訳(メタデータ) (2020-12-04T16:27:59Z) - Overlapping Spaces for Compact Graph Representations [17.919759296265]
グラフ、テキスト、画像などの構造化データを埋め込むために、様々な非自明な空間が人気を集めている。
製品空間の概念を一般化し、構成探索問題を持たない重なり合う空間を導入する。
論文 参考訳(メタデータ) (2020-07-05T20:55:47Z) - Trajectory annotation using sequences of spatial perception [0.0]
近い将来、より多くのマシンが人間の空間の近くでタスクを実行するようになる。
この作業は、この課題に対処するための基盤を構築します。
本稿では,ニューラルオートエンコーディングに基づく教師なし学習手法を提案する。
論文 参考訳(メタデータ) (2020-04-11T12:22:27Z) - Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-03-23T12:28:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。