Fugu-MT 論文翻訳(概要): MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection

論文の概要: MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection

arxiv url: http://arxiv.org/abs/2406.14878v1
Date: Fri, 21 Jun 2024 05:58:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-24 14:42:51.099113
Title: MOS: Model Synergy for Test-Time Adaptation on LiDAR-Based 3D Object Detection
Title（参考訳）: MOS:LiDARに基づく3次元物体検出におけるテスト時間適応のためのモデルシナジー
Authors: Zhuoxiao Chen, Junjie Meng, Mahsa Baktashmotlagh, Zi Huang, Yadan Luo,
Abstract要約: MOS(Model Synergy)と呼ばれる3次元物体検出のための新しいオンライン適応フレームワークを提案する。 MOSは、履歴チェックポイントのバンクからテストバッチ毎に最適なスーパーモデルを動的に組み立てる。当社のアプローチは,複雑な"クロス破壊"シナリオにおいて67.3%のパフォーマンス向上を達成した。
参考スコア（独自算出の注目度）: 32.00747075802916
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: LiDAR-based 3D object detection is pivotal across many applications, yet the performance of such detection systems often degrades after deployment, especially when faced with unseen test point clouds originating from diverse locations or subjected to corruption. In this work, we introduce a new online adaptation framework for detectors named Model Synergy (MOS). Specifically, MOS dynamically assembles best-fit supermodels for each test batch from a bank of historical checkpoints, leveraging long-term knowledge to guide model updates without forgetting. The model assembly is directed by the proposed synergy weights (SW), employed for weighted averaging of the selected checkpoints to minimize redundancy in the composite supermodel. These weights are calculated by evaluating the similarity of predicted bounding boxes on test data and the feature independence among model pairs in the bank. To maintain an informative yet compact model bank, we pop out checkpoints with the lowest average SW scores and insert newly updated model weights. Our method was rigorously tested against prior test-time domain adaptation strategies on three datasets and under eight types of corruptions, demonstrating its superior adaptability to changing scenes and conditions. Remarkably, our approach achieved a 67.3% increase in performance in a complex "cross-corruption" scenario, which involves cross-dataset inconsistencies and real-world scene corruptions, providing a more realistic testbed of adaptation capabilities. The code is available at https://github.com/zhuoxiao-chen/MOS.
Abstract（参考訳）: LiDARベースの3Dオブジェクト検出は、多くのアプリケーションにおいて重要であるが、そのような検出システムの性能は、デプロイ後に劣化することが多い。本研究では,MOS(Model Synergy)と呼ばれる検出器のオンライン適応フレームワークを提案する。特に、MOSは、履歴チェックポイントのバンクからテストバッチ毎に最適なスーパーモデルを動的に組み立て、長期的知識を活用して、モデル更新を忘れずにガイドする。モデルアセンブリは、合成スーパーモデルにおける冗長性を最小化するために選択されたチェックポイントの重み付け平均化に使用される、提案された相乗重み(SW)によって誘導される。これらの重みは、テストデータ上の予測境界ボックスの類似度と、銀行内のモデルペア間の特徴独立性を評価することにより算出される。情報的かつコンパクトなモデルバンクを維持するため、最小のSWスコアを持つチェックポイントをポップアップし、新たに更新されたモデルウェイトを挿入する。提案手法は,3つのデータセットと8種類の汚職に対して,事前の試験時間領域適応戦略に対して厳格に検証し,シーンや条件の変化に対して優れた適応性を示した。興味深いことに、当社のアプローチは、クロスデータセットの不整合と現実のシーンの破損を含む複雑な"クロス破壊"シナリオで67.3%のパフォーマンス向上を実現し、適応機能のより現実的なテストベッドを提供する。コードはhttps://github.com/zhuoxiao-chen/MOSで公開されている。

関連論文リスト

CodeMerge: Codebook-Guided Model Merging for Robust Test-Time Adaptation in Autonomous Driving [28.022501313260648]
既存のテスト時間適応法は、不安定な最適化とシャープなミニマのために、3Dオブジェクト検出のような高分散タスクで失敗することが多い。 CodeMergeはスケーラブルなモデルマージフレームワークで、コンパクトな潜在空間で操作することでこれらの制限を回避します。提案手法は,NuScenes-C と LiDAR による7.6% mAP 以上の検出において,エンドツーエンドの3D 検出 14.9% NDS を向上する。
論文参考訳（メタデータ） (2025-05-22T11:09:15Z)
APCoTTA: Continual Test-Time Adaptation for Semantic Segmentation of Airborne LiDAR Point Clouds [14.348191795901101]
空中レーザースキャン(ALS)ポイントクラウドセグメンテーションは、大規模3Dシーン理解の基本的な課題である。 Continuous Test-Time Adaptation (CTTA)は、ソース予測モデルを適用して、未ラベルのターゲットドメインを進化させるソリューションを提供する。我々は,ALSポイントクラウドセマンティックセグメンテーションに適した最初のCTTA手法であるAPCoTTAを提案する。
論文参考訳（メタデータ） (2025-05-15T05:21:16Z)
Enhancing Test Time Adaptation with Few-shot Guidance [62.49199492255226]
深層ニューラルネットワークは、トレーニング(ソース)とテスト(ターゲット)データのドメインシフトに直面しながら、大きなパフォーマンス低下に直面することが多い。 TTA(Test Time Adaptation)法は,事前学習したソースモデルを用いて,配信外ストリーミングターゲットデータを処理する手法として提案されている。本稿では,Few-Shot Test Time Adaptation (FS-TTA) を開発した。
論文参考訳（メタデータ） (2024-09-02T15:50:48Z)
SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。本稿では,DA手法の評価と,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの公平な評価を行うフレームワークを提案する。本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文参考訳（メタデータ） (2024-07-16T12:52:29Z)
Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。 RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文参考訳（メタデータ） (2024-07-11T14:58:49Z)
Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments [67.83787474506073]
我々は,現在のLiDARに基づく3Dオブジェクト検出システムの限界に対処する。本稿では,3次元OVタスクに対する汎用textscFind n' Propagate アプローチを提案する。我々は、新しいオブジェクトクラスに対する平均精度(AP)を最大3.97倍に向上させる。
論文参考訳（メタデータ） (2024-03-20T12:51:30Z)
What, How, and When Should Object Detectors Update in Continually Changing Test Domains? [34.13756022890991]
テストデータを推測しながらモデルをオンラインに適応させるテスト時適応アルゴリズムが提案されている。連続的に変化するテスト領域におけるオブジェクト検出のための新しいオンライン適応手法を提案する。提案手法は,広く使用されているベンチマークのベースラインを超え,最大4.9%,mAP7.9%の改善を実現している。
論文参考訳（メタデータ） (2023-12-12T07:13:08Z)
Exchanging Dual Encoder-Decoder: A New Strategy for Change Detection with Semantic Guidance and Spatial Localization [10.059696915598392]
セマンティックガイダンスと空間的ローカライゼーションを用いたバイナリ変更検出のための2つのエンコーダ・デコーダ構造を交換した新しい戦略を提案する。この戦略に基づいてバイナリ変更検出モデルを構築し、それを6つのデータセット上で18の最先端の変更検出手法と比較する。
論文参考訳（メタデータ） (2023-11-19T11:30:43Z)
Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and Class-balanced Pseudo-Labeling [38.07637524378327]
ドメイン適応型3Dオブジェクト検出において,疑似ラベリング技術を用いた教師なしドメイン適応(DA)が重要なアプローチとして浮上している。既存のDAメソッドは、マルチクラスのトレーニング環境に適用した場合、パフォーマンスが大幅に低下する。本稿では,すべてのクラスを一度に検出する学習に適した新しいReDBフレームワークを提案する。
論文参考訳（メタデータ） (2023-07-16T04:34:11Z)
On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。 TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文参考訳（メタデータ） (2023-06-06T09:35:29Z)
Efficient Test-Time Model Adaptation without Forgetting [60.36499845014649]
テストタイム適応は、トレーニングとテストデータの間の潜在的な分散シフトに取り組むことを目指している。信頼性および非冗長なサンプルを同定するためのアクティブなサンプル選択基準を提案する。また、重要なモデルパラメータを劇的な変化から制約するFisher regularizerを導入します。
論文参考訳（メタデータ） (2022-04-06T06:39:40Z)
Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文参考訳（メタデータ） (2021-11-30T18:42:42Z)
When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。精度を向上させるために,2つの軽量モジュールを提案する。 DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。 QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文参考訳（メタデータ） (2021-05-27T13:51:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。