論文の概要: BPDA-GMM: Bayesian Probabilistic Data Association via Gaussian Mixture Models for Semantic SLAM
- arxiv url: http://arxiv.org/abs/2606.04618v1
- Date: Wed, 03 Jun 2026 08:53:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.639582
- Title: BPDA-GMM: Bayesian Probabilistic Data Association via Gaussian Mixture Models for Semantic SLAM
- Title(参考訳): BPDA-GMM:セマンティックSLAMのためのガウス混合モデルによるベイズ確率データアソシエーション
- Authors: Thanh Nguyen Canh, Haolan Zhang, Xiem HoangVan, Antonio Sgorbissa, Nak Young Chong,
- Abstract要約: オブジェクトレベルマップを増大させたセマンティックSLAMのためのオンラインベイズPDAフレームワークを提案する。
BPDA-GMMは、中国のレストランプロセス(CRP)アソシエーションモデルを誘導する前にディリクレプロセスを使用する。
シミュレーションと実際の屋内データセットを用いた実験では、軌跡精度の向上、意味マッピングの品質、知覚エイリアスに対する堅牢性、最先端のベースラインに対するエラーが示されている。
- 参考スコア(独自算出の注目度): 5.6001617185032595
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Probabilistic data association (PDA) improves semantic SLAM in perceptually aliased scenes, but existing methods often assume a fixed landmark set, recompute association weights as the map grows, or rely on hand-tuned null-hypothesis weights. To address these limitations, we propose \textbf{BPDA-GMM}, an online Bayesian PDA framework for semantic SLAM with a growing object-level map. BPDA-GMM uses a Dirichlet-process prior to induce a Chinese Restaurant Process (CRP) association model, where accumulated evidence favors existing landmarks, and the concentration parameter assigns probability mass to new landmarks. For each semantic detection, plausible candidates are selected by a joint semantic-geometric gate, CRP-weighted association probabilities are computed, and object landmarks are updated as semantic Gaussians in closed form. The resulting landmark set forms a Gaussian mixture model, and its dominant component is passed to the back-end as a max-mixture semantic factor. When association weights are inconclusive, an ambiguity-triggered $α$-divergence tempering step improves discrimination. Finally, a decoupled back-end zeroes the pose Jacobian of semantic factors, allowing noisy detections to refine landmarks without directly perturbing the trajectory. Experiments in simulation and on a real indoor dataset demonstrate improved trajectory accuracy, semantic mapping quality, and robustness to perceptual aliasing and classifier errors over state-of-the-art baselines. Code and video are publicly available at https://github.com/thanhnguyencanh/BPDA-SLAM.
- Abstract(参考訳): 確率的データアソシエーション(PDA)は、知覚的に認識されたシーンにおける意味的SLAMを改善するが、既存の手法では、マップが大きくなるにつれて関連量を再計算したり、手動のヌル-ヒポテシスの重みに依存することが多い。
これらの制約に対処するため、オブジェクトレベルマップの増大を伴う意味的SLAMのためのオンラインベイズPDAフレームワークである「textbf{BPDA-GMM}」を提案する。
BPDA-GMMは、中国のレストランプロセス(CRP)アソシエーションモデルを誘導する前にディリクレプロセスを使用し、蓄積された証拠は既存のランドマークを好んでおり、濃度パラメータは新しいランドマークに確率質量を割り当てる。
各意味検出において、有意な候補は、合同意味幾何学ゲートで選択され、CRP重み付き関連確率が計算され、オブジェクトランドマークは、閉じた形で意味ガウスとして更新される。
得られたランドマーク集合はガウス混合モデルを形成し、その支配的な成分は最大混合意味因子としてバックエンドに渡される。
相関重みが決定的でない場合、曖昧さに富んだ$α$-divergenceのテンパリングステップは差別を改善する。
最後に、切り離されたバックエンドは意味的因子のジャコビアンのポーズをゼロとし、ノイズ検出は軌道を直接乱すことなくランドマークを洗練させる。
シミュレーションおよび実際の屋内データセットにおける実験では、最先端のベースラインに対する知覚的エイリアスや分類器エラーに対する軌道精度、意味マッピング品質、堅牢性が改善された。
コードとビデオはhttps://github.com/thanhnguyencanh/BPDA-SLAM.comで公開されている。
関連論文リスト
- FedRG: Unleashing the Representation Geometry for Federated Learning with Noisy Clients [36.01783797965344]
フェデレートラーニング(FL)は、分散シナリオにノイズの多いアノテーションが存在するため、パフォーマンスの低下に悩まされる。
雑音ラベルを認識するための方法(textbfFederated under textbfRepresentation textbfGemometry)を提案する。
論文 参考訳(メタデータ) (2026-03-20T08:01:04Z) - Inverting Self-Organizing Maps: A Unified Activation-Based Framework [39.146761527401424]
我々は,SOMの活性化パターンを逆転させて,微妙な幾何学的条件下での正確な入力を復元できることを示す。
我々は,MUSIC (Manifold-Aware Unified SOM Inversion and Control) 更新ルールを導入する。
合成ガウス混合系, MNIST と Faces in the Wild を用いたアプローチを検証した。
論文 参考訳(メタデータ) (2026-01-20T11:02:54Z) - Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models [64.58262227709842]
ARISE(Attention-weighted Representation with Integrated Semantic Embeddings)が紹介される。
正確なクラスタリングのためにカテゴリデータのメトリック空間を補完するセマンティックアウェア表現を構築する。
8つのベンチマークデータセットの実験では、7つの代表的なデータセットよりも一貫した改善が示されている。
論文 参考訳(メタデータ) (2026-01-03T11:37:46Z) - CLIP-Clique: Graph-based Correspondence Matching Augmented by Vision Language Models for Object-based Global Localization [0.0]
オブジェクトマップ上のローカライズのための最も有望なアプローチの1つは、セマンティックグラフマッチングを使用することである。
従来の問題に対処するために、視覚言語モデルを用いた対応マッチングを強化する。
さらに、inlierはグラフ理論のアプローチを用いて決定的に推定される。
論文 参考訳(メタデータ) (2024-10-04T00:23:20Z) - A Diffusion Weighted Graph Framework for New Intent Discovery [25.364554033681515]
New Intent Discovery (NID)は、ラベルのないデータから、新しいインテントと既知のインテントの両方を認識することを目的としている。
従来の手法では、量と品質のバランスが取れないノイズの多い監視信号を生成する。
本稿では,データ固有の意味的類似性と構造的関連性の両方を捉えるために,DWGF(Diffusion Weighted Graph Framework)を提案する。
論文 参考訳(メタデータ) (2023-10-24T13:43:01Z) - Unsupervised Landmark Discovery Using Consistency Guided Bottleneck [63.624186864522315]
画像再構成に基づくパイプラインに一貫性のあるボトルネックを導入する。
本稿では,画像間のランドマーク対応を形成することによって,擬似スーパービジョンを得る手法を提案する。
この一貫性は、アダプティブ・ヒートマップの生成において発見されたランドマークの不確かさを変調する。
論文 参考訳(メタデータ) (2023-09-19T10:57:53Z) - Concrete Score Matching: Generalized Score Matching for Discrete Data [109.12439278055213]
コンクレトスコア(Concrete score)とは、個別の設定のためのスコア(ステイン)の一般化である。
コンクレトスコアマッチング(Concrete Score Matching)は、サンプルからこのようなスコアを学習するフレームワークである。
論文 参考訳(メタデータ) (2022-11-02T00:41:37Z) - Content Popularity Prediction Based on Quantized Federated Bayesian
Learning in Fog Radio Access Networks [76.16527095195893]
キャッシュ可能なフォグラジオアクセスネットワーク(F-RAN)におけるコンテンツ人気予測問題について検討する。
そこで本研究では,コンテンツ要求パターンをモデル化するためのガウス過程に基づく回帰器を提案する。
我々はベイズ学習を利用してモデルパラメータを訓練する。
論文 参考訳(メタデータ) (2022-06-23T03:05:12Z) - SimT: Handling Open-set Noise for Domain Adaptive Semantic Segmentation [58.61946589036262]
本稿では,ブラックボックスモデルを用いて,擬似ラベル付きターゲットデータのみにアクセス可能な実用的なドメイン適応(DA)セマンティックセマンティックセマンティクス問題について検討する。
ドメインギャップと2つのドメイン間のラベルシフトのため、擬似ラベル付きターゲットデータには、クローズドセットとオープンセットのラベルノイズが混在している。
DAセマンティックセグメンテーションにおける混合雑音分布をモデル化し、SimTの推定として問題を定式化するための単純なノイズ遷移行列(SimT)を提案する。
論文 参考訳(メタデータ) (2022-03-29T02:48:08Z) - SA-LOAM: Semantic-aided LiDAR SLAM with Loop Closure [12.970919078106634]
LOAM(SA-LOAM)をベースとしたループ閉鎖型セマンティック支援LiDAR SLAMを提案する。
局所化精度を改善し、ループ閉鎖を効果的に検出し、大規模シーンにおいてもグローバルな一貫したセマンティックマップを構築することができる。
論文 参考訳(メタデータ) (2021-06-22T03:14:20Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。