Fugu-MT 論文翻訳(概要): MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection

論文の概要: MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection

arxiv url: http://arxiv.org/abs/2406.14878v2
Date: Fri, 18 Oct 2024 01:40:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:33.964799
Title: MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection
Title（参考訳）: MOS:LiDARに基づく3次元物体検出におけるテスト時間適応のためのモデルシナジー
Authors: Zhuoxiao Chen, Junjie Meng, Mahsa Baktashmotlagh, Yonggang Zhang, Zi Huang, Yadan Luo,
Abstract要約: 3次元検出器のための新しいオンラインテスト時間適応フレームワークを提案する。これまでのテストバッチから長期的知識を活用することで、我々のアプローチは破滅的な忘れを軽減し、多様なシフトに効果的に適応します。提案手法は,3つのデータセットと8種類の汚職に対して,既存のテスト時間適応戦略に対して厳格に検証した。
参考スコア（独自算出の注目度）: 38.6421466851974
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: LiDAR-based 3D object detection is crucial for various applications but often experiences performance degradation in real-world deployments due to domain shifts. While most studies focus on cross-dataset shifts, such as changes in environments and object geometries, practical corruptions from sensor variations and weather conditions remain underexplored. In this work, we propose a novel online test-time adaptation framework for 3D detectors that effectively tackles these shifts, including a challenging cross-corruption scenario where cross-dataset shifts and corruptions co-occur. By leveraging long-term knowledge from previous test batches, our approach mitigates catastrophic forgetting and adapts effectively to diverse shifts. Specifically, we propose a Model Synergy (MOS) strategy that dynamically selects historical checkpoints with diverse knowledge and assembles them to best accommodate the current test batch. This assembly is directed by our proposed Synergy Weights (SW), which perform a weighted averaging of the selected checkpoints, minimizing redundancy in the composite model. The SWs are computed by evaluating the similarity of predicted bounding boxes on the test data and the independence of features between checkpoint pairs in the model bank. To maintain an efficient and informative model bank, we discard checkpoints with the lowest average SW scores, replacing them with newly updated models. Our method was rigorously tested against existing test-time adaptation strategies across three datasets and eight types of corruptions, demonstrating superior adaptability to dynamic scenes and conditions. Notably, it achieved a 67.3% improvement in a challenging cross-corruption scenario, offering a more comprehensive benchmark for adaptation. The source code will be made publicly available.
Abstract（参考訳）: LiDARベースの3Dオブジェクト検出は様々なアプリケーションに不可欠だが、ドメインシフトによる実際のデプロイメントのパフォーマンス低下を経験することが多い。ほとんどの研究は、環境やオブジェクトのジオメトリーの変化など、データセット間のシフトに焦点を当てているが、センサーの変動や気象条件による実際の腐敗は、まだ未調査のままである。本研究では,これらの変化に効果的に取り組む3D検出器のための新しいオンラインテスト時間適応フレームワークを提案する。これまでのテストバッチから長期的知識を活用することで、我々のアプローチは破滅的な忘れを軽減し、多様なシフトに効果的に適応します。具体的には,様々な知識を持つ履歴チェックポイントを動的に選択し,現在のテストバッチを最適に適合させるモデルシナジー(MOS)戦略を提案する。このアセンブリは,提案したSynergy Weights (SW) によって誘導され,選択したチェックポイントの重み付き平均化を行い,複合モデルにおける冗長性を最小化する。 SWは、テストデータ上の予測境界ボックスの類似性と、モデルバンク内のチェックポイントペア間の特徴の独立性を評価することにより計算される。効率的かつ情報的なモデルバンクを維持するため、チェックポイントを最低値のSWスコアで破棄し、新たに更新されたモデルに置き換える。提案手法は,3つのデータセットと8種類の汚職に対する既存のテスト時間適応戦略に対して厳格に検証し,動的シーンや条件に対する優れた適応性を示した。特に67.3%の改善が達成され、より包括的な適応ベンチマークが提供された。ソースコードは一般公開される予定だ。

関連論文リスト

CodeMerge: Codebook-Guided Model Merging for Robust Test-Time Adaptation in Autonomous Driving [28.022501313260648]
既存のテスト時間適応法は、不安定な最適化とシャープなミニマのために、3Dオブジェクト検出のような高分散タスクで失敗することが多い。 CodeMergeはスケーラブルなモデルマージフレームワークで、コンパクトな潜在空間で操作することでこれらの制限を回避します。提案手法は,NuScenes-C と LiDAR による7.6% mAP 以上の検出において,エンドツーエンドの3D 検出 14.9% NDS を向上する。
論文参考訳（メタデータ） (2025-05-22T11:09:15Z)
APCoTTA: Continual Test-Time Adaptation for Semantic Segmentation of Airborne LiDAR Point Clouds [14.348191795901101]
空中レーザースキャン(ALS)ポイントクラウドセグメンテーションは、大規模3Dシーン理解の基本的な課題である。 Continuous Test-Time Adaptation (CTTA)は、ソース予測モデルを適用して、未ラベルのターゲットドメインを進化させるソリューションを提供する。我々は,ALSポイントクラウドセマンティックセグメンテーションに適した最初のCTTA手法であるAPCoTTAを提案する。
論文参考訳（メタデータ） (2025-05-15T05:21:16Z)
SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。本稿では,DA手法の評価と,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの公平な評価を行うフレームワークを提案する。本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文参考訳（メタデータ） (2024-07-16T12:52:29Z)
Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。 RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文参考訳（メタデータ） (2024-07-11T14:58:49Z)
Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文参考訳（メタデータ） (2024-03-20T12:51:30Z)
What, How, and When Should Object Detectors Update in Continually Changing Test Domains? [34.13756022890991]
テストデータを推測しながらモデルをオンラインに適応させるテスト時適応アルゴリズムが提案されている。連続的に変化するテスト領域におけるオブジェクト検出のための新しいオンライン適応手法を提案する。提案手法は,広く使用されているベンチマークのベースラインを超え,最大4.9%,mAP7.9%の改善を実現している。
論文参考訳（メタデータ） (2023-12-12T07:13:08Z)
Exchanging Dual Encoder-Decoder: A New Strategy for Change Detection with Semantic Guidance and Spatial Localization [10.059696915598392]
セマンティックガイダンスと空間的ローカライゼーションを用いたバイナリ変更検出のための2つのエンコーダ・デコーダ構造を交換した新しい戦略を提案する。この戦略に基づいてバイナリ変更検出モデルを構築し、それを6つのデータセット上で18の最先端の変更検出手法と比較する。
論文参考訳（メタデータ） (2023-11-19T11:30:43Z)
Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文参考訳（メタデータ） (2023-07-16T04:34:11Z)
On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。 TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文参考訳（メタデータ） (2023-06-06T09:35:29Z)
Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文参考訳（メタデータ） (2022-04-06T06:39:40Z)
Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文参考訳（メタデータ） (2021-11-30T18:42:42Z)
When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。精度を向上させるために,2つの軽量モジュールを提案する。 DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。 QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文参考訳（メタデータ） (2021-05-27T13:51:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。