論文の概要: HBRB-BoW: A Retrained Bag-of-Words Vocabulary for ORB-SLAM via Hierarchical BRB-KMeans
- arxiv url: http://arxiv.org/abs/2603.04144v1
- Date: Wed, 04 Mar 2026 14:58:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.361073
- Title: HBRB-BoW: A Retrained Bag-of-Words Vocabulary for ORB-SLAM via Hierarchical BRB-KMeans
- Title(参考訳): HBRB-BoW:階層的BRB-KMeansによるORB-SLAMのための単語語彙の再学習
- Authors: Minjae Lee, Sang-Min Choi, Gun-Woo Kim, Suwon Lee,
- Abstract要約: 視覚的同時ローカライゼーションとマッピング(SLAM)では、視覚語彙の品質は、環境を表現し、位置を認識するシステムの能力に基礎を置いている。
本稿では,階層型バイナリ・トゥ・リアル・アンド・バック(HBRB)-BoWを提案する。
実験により,提案手法は従来の手法よりも識別的かつよく構造化された語彙が得られることが示された。
- 参考スコア(独自算出の注目度): 4.62057889157228
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In visual simultaneous localization and mapping (SLAM), the quality of the visual vocabulary is fundamental to the system's ability to represent environments and recognize locations. While ORB-SLAM is a widely used framework, its binary vocabulary, trained through the k-majority-based bag-of-words (BoW) approach, suffers from inherent precision loss. The inability of conventional binary clustering to represent subtle feature distributions leads to the degradation of visual words, a problem that is compounded as errors accumulate and propagate through the hierarchical tree structure. To address these structural deficiencies, this paper proposes hierarchical binary-to-real-and-back (HBRB)-BoW, a refined hierarchical binary vocabulary training algorithm. By integrating a global real-valued flow within the hierarchical clustering process, our method preserves high-fidelity descriptor information until the final binarization at the leaf nodes. Experimental results demonstrate that the proposed approach yields a more discriminative and well-structured vocabulary than traditional methods, significantly enhancing the representational integrity of the visual dictionary in complex environments. Furthermore, replacing the default ORB-SLAM vocabulary file with our HBRB-BoW file is expected to improve performance in loop closing and relocalization tasks.
- Abstract(参考訳): 視覚的同時ローカライゼーションとマッピング(SLAM)では、視覚語彙の品質は、環境を表現し、位置を認識するシステムの能力に基礎を置いている。
ORB-SLAMは広く使われているフレームワークであるが、そのバイナリ語彙はk-majority-based bag-of-words (BoW)アプローチによって訓練され、本質的に精度の低下に悩まされている。
従来のバイナリクラスタリングでは、微妙な特徴分布を表現できないため、視覚単語の劣化が生じ、エラーが蓄積され、階層木構造を通して伝播する。
このような構造的欠陥に対処するために,階層型バイナリ・トゥ・リアル・アンド・バック(HBRB)-BoWを提案する。
階層的クラスタリングプロセスにグローバルな実数値フローを統合することにより,葉ノードにおける最終二項化まで高忠実度記述子情報を保存する。
実験により,提案手法は従来の手法よりも識別的かつよく構造化された語彙となり,複雑な環境下での視覚辞書の表現的整合性を大幅に向上させることが示された。
さらに、デフォルトのORB-SLAM語彙ファイルをHBRB-BoWファイルに置き換えることにより、ループ閉鎖および再ローカライズタスクのパフォーマンスが向上することが期待される。
関連論文リスト
- Improving LLM Reasoning with Homophily-aware Structural and Semantic Text-Attributed Graph Compression [55.51959317490934]
大規模言語モデル(LLM)は、テキスト分散グラフ(TAG)理解において有望な能力を示している。
グラフは本来、構造情報や意味情報を豊富に含むものであり、それらの有効利用はLLMの推論性能の潜在的な利益を解放する可能性があると論じる。
グラフホモフィリーの活用を目的としたフレームワーク LLMs (HS2C) のホモフィリー対応構造とセマンティック圧縮を提案する。
論文 参考訳(メタデータ) (2026-01-13T03:35:18Z) - Hierarchical Semantic Tree Anchoring for CLIP-Based Class-Incremental Learning [11.82771798674077]
クラスインクリメンタルラーニング(Class-Incremental Learning, CIL)は、モデルが過去の知識を保ちながら、新しいクラスを継続的に学習することを可能にする。
しかし、現実世界の視覚的および言語的概念は本質的に階層的である。
本稿では,CILに階層的な情報を固定し,破滅的な忘れを抑えるHASTENを提案する。
論文 参考訳(メタデータ) (2025-11-19T17:14:47Z) - LIHE: Linguistic Instance-Split Hyperbolic-Euclidean Framework for Generalized Weakly-Supervised Referring Expression Comprehension [42.52759428579815]
既存のWeakly-Supervised Referring Expression (WREC) メソッドは、基本的に1対1のマッピング仮定によって制限される。
Weakly-Supervised Generalized Referring Expression Task (WGREC)を導入する。
本稿では,2段階で動作するLingguistic Instance-Split-Euclidean (LIHE) という新しいWGRECフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-15T04:06:57Z) - LLM-guided Hierarchical Retrieval [54.73080745446999]
LATTICEは階層的な検索フレームワークであり、LLMは対数探索の複雑さで大きなコーパスを推論し、ナビゲートすることができる。
LLM誘導探索における中心的な課題は、モデルの関連性判断がノイズが多く、文脈に依存し、階層性に気付かないことである。
我々のフレームワークは、推論集約型BRIGHTベンチマークで最先端のゼロショット性能を実現する。
論文 参考訳(メタデータ) (2025-10-15T07:05:17Z) - Cross-Layer Discrete Concept Discovery for Interpreting Language Models [13.842670153893977]
クロス層VQ-VAEは、ベクトル量子化を使用して層間の表現をマッピングするフレームワークである。
本手法は,量子化中のトップk温度に基づくサンプリングとEMAコードブック更新を一意に組み合わせる。
論文 参考訳(メタデータ) (2025-06-24T22:43:36Z) - Boosting KNNClassifier Performance with Opposition-Based Data Transformation [0.0]
従来の分類アルゴリズムの性能を高めるために,OBL(Opposition-Based Learning)に基づく新しいデータ変換フレームワークを提案する。
ここでは、OBLを利用して、トレーニングデータを強化し、決定境界形成を改善する合成反対サンプルを生成する。
論文 参考訳(メタデータ) (2025-04-22T21:03:31Z) - SHiNe: Semantic Hierarchy Nexus for Open-vocabulary Object Detection [31.464227593768324]
本稿ではセマンティック階層Nexus(SHiNe)について紹介する。
SHiNeは様々な語彙の粒度をまたいだ堅牢性を高め、+31.9%のmAP50と基底的真理階層を達成している。
SHiNeは無訓練で、市販のOvOD検出器とシームレスに統合できる。
論文 参考訳(メタデータ) (2024-05-16T12:42:06Z) - Open Knowledge Base Canonicalization with Multi-task Learning [18.053863554106307]
大規模なオープン知識ベース(OKB)は、Web検索のような世界規模のWeb上の多くの知識駆動アプリケーションに不可欠なものである。
OKBの名詞句と関係句は、しばしば冗長性と曖昧さに悩まされ、OKBの正準化の調査を要求する。
現在のソリューションは、高度なクラスタリングアルゴリズムを考案し、知識グラフ埋め込み(KGE)を使用して、標準化プロセスをさらに促進することでOKB標準化に対処している。
我々は、OKB標準化に取り組むためにマルチタスク学習フレームワーク、MulCanonを提案しました。
論文 参考訳(メタデータ) (2024-03-21T08:03:46Z) - Open-Vocabulary Segmentation with Semantic-Assisted Calibration [68.41025728960176]
オープンボキャブラリセグメンテーション(OVS)は,CLIPの文脈に先行して,語彙内およびドメインバイアスの埋め込み空間を校正することで研究される。
オープン語彙セグメンテーションベンチマークにおける最先端性能を実現するために,セマンティック・アシブ・キャリブレーション・ネットワーク(SCAN)を提案する。
論文 参考訳(メタデータ) (2023-12-07T07:00:09Z) - Towards Realistic Zero-Shot Classification via Self Structural Semantic
Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。
本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。
本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-24T17:56:46Z) - DetCLIP: Dictionary-Enriched Visual-Concept Paralleled Pre-training for
Open-world Detection [118.36746273425354]
本稿では,デザインされた概念辞書から知識の豊かさを生かして,オープンワールド検出のための並列視覚概念事前学習手法を提案する。
概念をそれらの記述で豊かにすることにより、オープンドメイン学習を促進するために、さまざまな概念間の関係を明確に構築する。
提案フレームワークは、例えばLVISデータセット上で、強力なゼロショット検出性能を示し、私たちのDetCLIP-TはGLIP-Tを9.9%向上させ、レアカテゴリで13.5%改善した。
論文 参考訳(メタデータ) (2022-09-20T02:01:01Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。