論文の概要: CodeMerge: Codebook-Guided Model Merging for Robust Test-Time Adaptation in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2505.16524v1
- Date: Thu, 22 May 2025 11:09:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.244207
- Title: CodeMerge: Codebook-Guided Model Merging for Robust Test-Time Adaptation in Autonomous Driving
- Title(参考訳): CodeMerge: 自律運転におけるロバストテスト時間適応のためのコードブックガイドモデルマージ
- Authors: Huitong Yang, Zhuoxiao Chen, Fengyi Zhang, Zi Huang, Yadan Luo,
- Abstract要約: 既存のテスト時間適応法は、不安定な最適化とシャープなミニマのために、3Dオブジェクト検出のような高分散タスクで失敗することが多い。
CodeMergeはスケーラブルなモデルマージフレームワークで、コンパクトな潜在空間で操作することでこれらの制限を回避します。
提案手法は,NuScenes-C と LiDAR による7.6% mAP 以上の検出において,エンドツーエンドの3D 検出 14.9% NDS を向上する。
- 参考スコア(独自算出の注目度): 28.022501313260648
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Maintaining robust 3D perception under dynamic and unpredictable test-time conditions remains a critical challenge for autonomous driving systems. Existing test-time adaptation (TTA) methods often fail in high-variance tasks like 3D object detection due to unstable optimization and sharp minima. While recent model merging strategies based on linear mode connectivity (LMC) offer improved stability by interpolating between fine-tuned checkpoints, they are computationally expensive, requiring repeated checkpoint access and multiple forward passes. In this paper, we introduce CodeMerge, a lightweight and scalable model merging framework that bypasses these limitations by operating in a compact latent space. Instead of loading full models, CodeMerge represents each checkpoint with a low-dimensional fingerprint derived from the source model's penultimate features and constructs a key-value codebook. We compute merging coefficients using ridge leverage scores on these fingerprints, enabling efficient model composition without compromising adaptation quality. Our method achieves strong performance across challenging benchmarks, improving end-to-end 3D detection 14.9% NDS on nuScenes-C and LiDAR-based detection by over 7.6% mAP on nuScenes-to-KITTI, while benefiting downstream tasks such as online mapping, motion prediction and planning even without training. Code and pretrained models are released in the supplementary material.
- Abstract(参考訳): 動的で予測不可能なテスト時間条件下での堅牢な3D認識を維持することは、自動運転システムにとって重要な課題である。
既存のテスト時間適応(TTA)手法は、不安定な最適化やシャープなミニマのために3次元オブジェクト検出のような高分散タスクで失敗することが多い。
線形モード接続(LMC)に基づく最近のモデルマージ戦略は、微調整されたチェックポイント間を補間することで安定性を向上させるが、それらは計算コストが高く、繰り返しチェックポイントアクセスと多重フォワードパスを必要とする。
本稿では,コンパクトでスケーラブルなモデルマージフレームワークであるCodeMergeを紹介する。
完全なモデルをロードする代わりに、CodeMergeはソースモデルの垂直な特徴から派生した低次元の指紋で各チェックポイントを表現し、キーバリューのコードブックを構築する。
我々はこれらの指紋におけるリッジレバレッジスコアを用いたマージ係数を計算し、適応品質を損なうことなく効率的なモデル合成を可能にする。
提案手法は,NuScenes-C と LiDAR による NDS を7.6% mAP 以上で検出し,オンラインマッピングや動き予測,トレーニングなしでの計画などの下流作業に有効である。
コードと事前訓練されたモデルは補足材料でリリースされる。
関連論文リスト
- Easy-Poly: A Easy Polyhedral Framework For 3D Multi-Object Tracking [23.40561503456164]
複数のオブジェクトカテゴリを対象としたリアルタイムフィルタベースの3DMOTフレームワークであるEasy-Polyを提案する。
結果は,Poly-MOTやFast-Polyといった最先端の手法よりも優れていることを示す。
これらの知見は、多様なシナリオにおけるEasy-Polyの適応性と堅牢性を強調している。
論文 参考訳(メタデータ) (2025-02-25T04:01:25Z) - MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection [38.6421466851974]
3次元検出器のための新しいオンラインテスト時間適応フレームワークを提案する。
これまでのテストバッチから長期的知識を活用することで、我々のアプローチは破滅的な忘れを軽減し、多様なシフトに効果的に適応します。
提案手法は,3つのデータセットと8種類の汚職に対して,既存のテスト時間適応戦略に対して厳格に検証した。
論文 参考訳(メタデータ) (2024-06-21T05:58:19Z) - Test-Time Model Adaptation with Only Forward Passes [68.11784295706995]
テストタイム適応は、トレーニング済みのモデルを、潜在的に分布シフトのある未確認テストサンプルに適応させるのに有効であることが証明されている。
テスト時間フォワード最適化適応法(FOA)を提案する。
FOAは量子化された8ビットのViTで動作し、32ビットのViTで勾配ベースのTENTより優れ、ImageNet-Cで最大24倍のメモリ削減を実現する。
論文 参考訳(メタデータ) (2024-04-02T05:34:33Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - MT3: Meta Test-Time Training for Self-Supervised Test-Time Adaption [69.76837484008033]
ディープラーニングの未解決の問題は、ニューラルネットワークがテスト時間中のドメインシフトに対処する能力である。
メタラーニング、自己監督、テストタイムトレーニングを組み合わせて、目に見えないテスト分布に適応する方法を学びます。
この手法はcifar-10による画像分類ベンチマークの最先端結果を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-30T09:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。