論文の概要: Open-Set Semantic Uncertainty Aware Metric-Semantic Graph Matching
- arxiv url: http://arxiv.org/abs/2409.11555v1
- Date: Tue, 17 Sep 2024 20:53:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 19:49:52.788844
- Title: Open-Set Semantic Uncertainty Aware Metric-Semantic Graph Matching
- Title(参考訳): オープンセットセマンティック不確かさを意識したメトリセマンティックグラフマッチング
- Authors: Kurran Singh, John J. Leonard,
- Abstract要約: オープンセットオブジェクト検出のためのセマンティック不確実性のメトリクスを計算し、オブジェクトレベルの不確実性追跡フレームワークに組み込む。
提案手法は,頑健でオープンセット,マルチオブジェクト,セマンティック不確実性を考慮したループクロージャ検出のために,海洋環境におけるリアルタイムな使用を可能にする。
- 参考スコア(独自算出の注目度): 10.439907158831303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater object-level mapping requires incorporating visual foundation models to handle the uncommon and often previously unseen object classes encountered in marine scenarios. In this work, a metric of semantic uncertainty for open-set object detections produced by visual foundation models is calculated and then incorporated into an object-level uncertainty tracking framework. Object-level uncertainties and geometric relationships between objects are used to enable robust object-level loop closure detection for unknown object classes. The above loop closure detection problem is formulated as a graph-matching problem. While graph matching, in general, is NP-Complete, a solver for an equivalent formulation of the proposed graph matching problem as a graph editing problem is tested on multiple challenging underwater scenes. Results for this solver as well as three other solvers demonstrate that the proposed methods are feasible for real-time use in marine environments for the robust, open-set, multi-object, semantic-uncertainty-aware loop closure detection. Further experimental results on the KITTI dataset demonstrate that the method generalizes to large-scale terrestrial scenes.
- Abstract(参考訳): 水中のオブジェクトレベルのマッピングでは、海洋シナリオで遭遇した珍しい、以前は目に見えないオブジェクトクラスを扱うために、視覚的基盤モデルを組み込む必要がある。
本研究では,視覚基盤モデルにより生成されたオープンセットオブジェクト検出のための意味的不確実性尺度を算出し,対象レベルの不確実性追跡フレームワークに組み込む。
オブジェクト間のオブジェクトレベルの不確実性と幾何学的関係は、未知のオブジェクトクラスに対して堅牢なオブジェクトレベルのループクロージャ検出を可能にするために使用される。
上記のループ閉包検出問題をグラフマッチング問題として定式化する。
グラフマッチングは、一般にNP-Completeであるが、グラフ編集問題として提案されたグラフマッチング問題の等価な定式化のための解法は、複数の挑戦的な水中シーンでテストされる。
この解法と他の3つの解法により, 提案手法は, 海洋環境において, 頑健で, オープンな, マルチオブジェクト, セマンティック不確かさを意識したループ閉鎖検出のために, リアルタイムに使用することが可能であることを実証した。
KITTIデータセットのさらなる実験結果から,本手法が大規模地球環境に一般化されることが示されている。
関連論文リスト
- SAM-LAD: Segment Anything Model Meets Zero-Shot Logic Anomaly Detection [17.32019706857109]
視覚異常検出は、産業的欠陥検出や診断など、現実世界の応用において不可欠である。
我々は,任意のシーンにおける論理的異常検出のためのゼロショット・プラグイン・アンド・プレイフレームワークSAM-LADを提案する。
産業用データセットを含む様々なベンチマークを用いて,提案するSAM-LADを検証する。
論文 参考訳(メタデータ) (2024-06-02T06:08:26Z) - SemanticTopoLoop: Semantic Loop Closure With 3D Topological Graph Based
on Quadric-Level Object Map [0.8158530638728501]
ループクロージャはSLAMの重要なコンポーネントの1つです。
バッグ・オブ・ワード(英語版)モデルのような伝統的な外見に基づく手法は、しばしば局所的な2D特徴とトレーニングデータの量によって制限される。
論文 参考訳(メタデータ) (2023-11-06T02:30:30Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Spatial-Temporal Graph Enhanced DETR Towards Multi-Frame 3D Object Detection [54.041049052843604]
STEMDは,多フレーム3Dオブジェクト検出のためのDETRのようなパラダイムを改良した,新しいエンドツーエンドフレームワークである。
まず、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
最後に、ネットワークが正のクエリと、ベストマッチしない他の非常に類似したクエリを区別することが課題となる。
論文 参考訳(メタデータ) (2023-07-01T13:53:14Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文 参考訳(メタデータ) (2021-04-06T07:01:28Z) - Video Anomaly Detection by Estimating Likelihood of Representations [21.879366166261228]
ビデオ異常は、モーション表現、オブジェクトのローカライゼーション、アクション認識など、多くのサブタスクを解決するため、困難なタスクである。
伝統的に、この課題に対する解決策は、これらの特徴の空間的接続を無視しながら、ビデオフレームとその低次元特徴のマッピングに焦点を当ててきた。
最近のソリューションでは、K-Meansのようなハードクラスタリング技術を用いてこれらの空間的接続を分析することや、潜伏した特徴を一般的な理解にマップするためにニューラルネットワークを適用することに焦点を当てている。
潜在特徴空間における映像異常を解決するために,このタスクを密度推定問題に転送するための深い確率モデルを提案する。
論文 参考訳(メタデータ) (2020-12-02T19:16:22Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。