論文の概要: GARLIC: GAussian Representation LearnIng for spaCe partitioning
- arxiv url: http://arxiv.org/abs/2505.24608v1
- Date: Fri, 30 May 2025 13:55:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.982796
- Title: GARLIC: GAussian Representation LearnIng for spaCe partitioning
- Title(参考訳): GARLIC: spaCeパーティショニングのためのGAussian Representation LearnIng
- Authors: Panagiotis Rigas, Panagiotis Drivas, Charalambos Tzamos, Ioannis Chamodrakas, George Ioannakis, Leonidas J. Guibas, Ioannis Z. Emiris,
- Abstract要約: GARLICは、高次元ベクトル空間を効率的に学習するための(N)次元ガウスに基づく新しいインデックス構造である。
我々は,包摂性,割当信頼度,構造的・意味的整合性のバランスをとる情報理論的目的を用いてガウスパラメータを最適化する。
- 参考スコア(独自算出の注目度): 36.88213231559183
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce GARLIC (GAussian Representation LearnIng for spaCe partitioning), a novel indexing structure based on \(N\)-dimensional Gaussians for efficiently learning high-dimensional vector spaces. Our approach is inspired from Gaussian splatting techniques, typically used in 3D rendering, which we adapt for high-dimensional search and classification. We optimize Gaussian parameters using information-theoretic objectives that balance coverage, assignment confidence, and structural and semantic consistency. A key contribution is to progressively refine the representation through split and clone operations, handling hundreds of dimensions, thus handling varying data densities. GARLIC offers the fast building times of traditional space partitioning methods (e.g., under \(\sim5\) min build time for SIFT1M) while achieving \(\sim50\%\) Recall10@10 in low-candidate regimes. Experimental results on standard benchmarks demonstrate our method's consistency in (a) \(k\)-NN retrieval, outperforming methods, such as Faiss-IVF, in fast-recall by using about half their probes for the same Recall10@10 in Fashion-MNIST, and (b) in classification tasks, beating by \(\sim15\%\) accuracy other majority voting methods. Further, we show strong generalization capabilities, maintaining high accuracy even with downsampled training data: using just \(1\%\) of the training data returns \(\sim 45\%\) Recall@1, thus making GARLIC quite powerful for applications requiring both speed and accuracy.
- Abstract(参考訳): 高次元ベクトル空間を効率よく学習するための, \(N\)-次元ガウスアンに基づく新しいインデックス構造であるGARLIC(Gaussian Representation LearnIng for spaCe partitioning)を導入する。
我々のアプローチは、高次元の探索と分類に適応する3次元レンダリングで一般的に使用されるガウススプラッティング技術から着想を得ている。
我々は,包摂性,割当信頼度,構造的・意味的整合性のバランスをとる情報理論的目的を用いてガウスパラメータを最適化する。
キーとなるコントリビューションは、分割とクローン操作を通じて表現を段階的に洗練し、数百の次元を扱い、様々なデータ密度を扱うことである。
GARLICは従来の空間分割手法(例: SIFT1M の \(\sim5\) min ビルド時間)の高速な構築時間を提供し、低候補のレギュレーションで \(\sim50\%\) Recall10@10 を達成する。
標準ベンチマーク実験の結果は、我々の手法の一貫性を実証している。
(a)Fashion-MNISTで同じRecall10@10に対して、約半数のプローブを用いて高速リコールにおいて、Faiss-IVFのような高速リコールにおける(k\)-NN検索、性能向上手法
(b) 分類タスクでは, その他の多数決方法の精度で, ビートを行う。
さらに、トレーニングデータのたった1\%\ だけを使い、トレーニングデータの戻り値 \(\sim 45\%\) Recall@1 を用いることで、GARLIC をスピードと精度の両方を必要とするアプリケーションに非常に強力にする。
関連論文リスト
- ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - Decoupled Training for Long-Tailed Classification With Stochastic
Representations [15.990318581975435]
表現学習と学習の分離は,長期データを用いた分類に有効であることが示されている。
まず、ディープニューラルネットワークの一般化を改善するための最適化手法であるウェイト平均化(SWA)を適用し、長い尾の分類のためのより優れた一般化特徴抽出器を得る。
そこで我々は,SWA-Gaussian,Gaussian SWA,および自己蒸留戦略から得られた摂動表現に基づく新しい分類器再学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-19T05:35:09Z) - Rethinking Reconstruction Autoencoder-Based Out-of-Distribution
Detection [0.0]
リコンストラクションオートエンコーダに基づく手法は、入力再構成誤差を新規性対正規性の計量として用いることでこの問題に対処する。
本稿では, 意味的再構成, データの確実性分解, 正規化L2距離を導入し, 元の手法を大幅に改善する。
提案手法は,追加データや実装の困難さ,時間を要するパイプライン,さらには既知のクラスの分類精度を損なうことなく機能する。
論文 参考訳(メタデータ) (2022-03-04T09:04:55Z) - MIO : Mutual Information Optimization using Self-Supervised Binary Contrastive Learning [12.365801596593936]
我々は、事前学習タスクを二項分類問題としてモデル化し、暗黙的なコントラスト効果を誘導する。
既存の手法とは異なり、提案した損失関数は正対と負対の相互情報を最適化する。
提案手法は,ベンチマークデータセット上でのSOTA自己教師型コントラストフレームワークよりも優れている。
論文 参考訳(メタデータ) (2021-11-24T17:51:29Z) - ZARTS: On Zero-order Optimization for Neural Architecture Search [94.41017048659664]
微分可能なアーキテクチャサーチ (DARTS) は、NASの高効率性のため、一般的なワンショットパラダイムである。
この作業はゼロオーダーの最適化に変わり、上記の近似を強制せずに探索するための新しいNASスキームであるZARTSを提案する。
特に、12ベンチマークの結果は、DARTSの性能が低下するZARTSの顕著な堅牢性を検証する。
論文 参考訳(メタデータ) (2021-10-10T09:35:15Z) - Sample and Computation Redistribution for Efficient Face Detection [137.19388513633484]
トレーニングデータサンプリングと計算分布戦略は、効率的で正確な顔検出の鍵です。
scrfdf34は、最高の競合製品であるTinaFaceを3.86%(ハードセットでのAP)で上回り、GPU上でVGA解像度画像でmph3$times$より高速です。
論文 参考訳(メタデータ) (2021-05-10T23:51:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。