Fugu-MT 論文翻訳(概要): AdaCo: Overcoming Visual Foundation Model Noise in 3D Semantic Segmentation via Adaptive Label Correction

論文の概要: AdaCo: Overcoming Visual Foundation Model Noise in 3D Semantic Segmentation via Adaptive Label Correction

arxiv url: http://arxiv.org/abs/2412.18255v1
Date: Tue, 24 Dec 2024 08:12:31 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-25 19:23:17.714471
Title: AdaCo: Overcoming Visual Foundation Model Noise in 3D Semantic Segmentation via Adaptive Label Correction
Title（参考訳）: AdaCo:適応ラベル補正による3次元セマンティックセマンティックセグメンテーションにおけるビジュアルファンデーションモデルノイズの克服
Authors: Pufan Zou, Shijia Zhao, Weijie Huang, Qiming Xia, Chenglu Wen, Wei Li, Cheng Wang,
Abstract要約: 本稿では,3次元セマンティックセグメンテーションのためのラベルのない新しい学習手法であるAdaptive Label Correction(AdaCo)を提案する。 AdaCoにはCLGM(Cross-modal Label Generation Module)が組み込まれている。提案したAdaCoは,3次元セマンティックセグメンテーションタスクにおいて,ラベルなし学習ネットワークの性能制限を効果的に緩和することができる。
参考スコア（独自算出の注目度）: 14.51758173099208
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, Visual Foundation Models (VFMs) have shown a remarkable generalization performance in 3D perception tasks. However, their effectiveness in large-scale outdoor datasets remains constrained by the scarcity of accurate supervision signals, the extensive noise caused by variable outdoor conditions, and the abundance of unknown objects. In this work, we propose a novel label-free learning method, Adaptive Label Correction (AdaCo), for 3D semantic segmentation. AdaCo first introduces the Cross-modal Label Generation Module (CLGM), providing cross-modal supervision with the formidable interpretive capabilities of the VFMs. Subsequently, AdaCo incorporates the Adaptive Noise Corrector (ANC), updating and adjusting the noisy samples within this supervision iteratively during training. Moreover, we develop an Adaptive Robust Loss (ARL) function to modulate each sample's sensitivity to noisy supervision, preventing potential underfitting issues associated with robust loss. Our proposed AdaCo can effectively mitigate the performance limitations of label-free learning networks in 3D semantic segmentation tasks. Extensive experiments on two outdoor benchmark datasets highlight the superior performance of our method.
Abstract（参考訳）: 近年,視覚基礎モデル (VFM) は3次元知覚タスクにおいて顕著な一般化性能を示した。しかし, 大規模屋外データセットにおけるその有効性は, 正確な監視信号の不足, 変動する屋外条件による広範囲な騒音, 未知の物体の存在によって制限されている。本研究では,3次元セマンティックセグメンテーションのための新しいラベルなし学習手法であるAdaptive Label Correction(AdaCo)を提案する。 AdaCoはまずCLGM(Cross-modal Label Generation Module)を導入した。その後、AdaCoはAdaptive Noise Corrector (ANC)を導入し、トレーニング中にこの監督下でノイズの多いサンプルを反復的に更新・調整する。さらに,適応ロバスト損失 (ARL) 関数を開発し,各試料のノイズ管理に対する感度を調節し,ロバスト損失に伴う潜在的な不適合を防止した。提案したAdaCoは,3次元セマンティックセグメンテーションタスクにおいて,ラベルなし学習ネットワークの性能制限を効果的に緩和することができる。 2つの屋外ベンチマークデータセットに対する大規模な実験は、我々の手法の優れた性能を強調している。

関連論文リスト

Steering and Rectifying Latent Representation Manifolds in Frozen Multi-modal LLMs for Video Anomaly Detection [52.5174167737992]
ビデオ異常検出(VAD)は、ビデオ内の異常事象を特定することを目的としている。本稿では,MLLMに基づくVADを受動的に読み上げから内部表現を積極的に操り,修正するSteerVADを提案する。本手法は、トレーニングデータの1%しか必要としないチューニングフリーアプローチにおける最先端性能を実現する。
論文参考訳（メタデータ） (2026-02-27T13:48:50Z)
Staged Voxel-Level Deep Reinforcement Learning for 3D Medical Image Segmentation with Noisy Annotations [4.581671524490035]
本稿では,ノイズの多いアノテーションの下での堅牢な医用画像分割のためのエンドツーエンドのVoxel-Level Deep Reinforcement Learningフレームワークを提案する。このフレームワークは動的反復的な更新戦略を使用して,手作業による介入を必要とせずに,誤ったラベルの影響を自動的に緩和する。
論文参考訳（メタデータ） (2026-01-07T12:39:54Z)
Noise-Robust Tiny Object Localization with Flows [63.60972031108944]
フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文参考訳（メタデータ） (2026-01-02T09:16:55Z)
DANS-KGC: Diffusion Based Adaptive Negative Sampling for Knowledge Graph Completion [10.190273470704112]
本稿では,DANS-KGC(Diffusion-based Adaptive Negative Smpling for Knowledge Graph Completion)を提案する。 DANS-KGCは、DAM(Difficulty Assessment Module)、ANS(Adaptive Negative Smpling Module)、DTM(Dynamic Training Mechanism)の3つの重要なコンポーネントから構成されている。 DTMは、トレーニングを通して負のサンプルの硬さ分布を動的に調整することで学習を強化する。
論文参考訳（メタデータ） (2025-11-11T06:56:57Z)
TOAST: Task-Oriented Adaptive Semantic Transmission over Dynamic Wireless Environments [3.3107717550009865]
TOAST(Task-Oriented Adaptive Semantic Transmission)は、無線環境におけるマルチタスク最適化の課題を解決するために設計された統合フレームワークである。我々はマルコフ決定過程として適応的タスクバランスを定式化し、画像再構成の忠実度と意味分類の精度のトレードオフを動的に調整するために深層強化学習を用いる。モジュール固有のLow-Rank Adaptation(LoRA)機構を,Swin Transformerベースのジョイントソースチャネル符号化アーキテクチャ全体に統合する。
論文参考訳（メタデータ） (2025-06-27T04:36:30Z)
Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification [24.24793934981947]
擬似ラベルノイズ(PLN)を考慮した新しい学習パラダイムを提案する。 PLNはノイズオーバーフィット、エラー蓄積、ノイズの多いクラスタ対応の3つの主要な課題によって特徴づけられる。 UVI-ReIDのためのロバスト・デュナリティ学習フレームワーク(RoDE)を提案する。
論文参考訳（メタデータ） (2025-05-05T10:36:52Z)
A Language Anchor-Guided Method for Robust Noisy Domain Generalization [20.83580289888522]
アンカーアライメントとアダプティブウェイトリング(A3W)について紹介する。 A3Wは、自然言語処理(NLP)アンカーでガイドされたサンプル再重み付けを使用して、より代表的な特徴を抽出する。最先端の領域一般化法より一貫して優れている。
論文参考訳（メタデータ） (2025-03-21T15:20:28Z)
A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本研究では,ガウスプレートの拡散モデルであるSplatDiffusionを導入し,単一画像から3次元構造を生成する。既存の方法は決定論的フィードフォワード予測に依存しており、2Dデータからの3D推論の本質的な曖昧さを扱う能力を制限する。
論文参考訳（メタデータ） (2024-12-01T00:29:57Z)
Robust Tiny Object Detection in Aerial Images amidst Label Noise [50.257696872021164]
本研究は,ノイズラベル管理下での微小物体検出の問題に対処する。本稿では,DN-TOD(Denoising Tiny Object Detector)を提案する。本手法は,1段と2段の両方のオブジェクト検出パイプラインにシームレスに統合できる。
論文参考訳（メタデータ） (2024-01-16T02:14:33Z)
Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文参考訳（メタデータ） (2024-01-06T07:30:41Z)
Generalized Face Forgery Detection via Adaptive Learning for Pre-trained Vision Transformer [54.32283739486781]
適応学習パラダイムの下で,textbfForgery-aware textbfAdaptive textbfVision textbfTransformer(FA-ViT)を提案する。 FA-ViTは、クロスデータセット評価において、Celeb-DFおよびDFDCデータセット上で93.83%と78.32%のAUCスコアを達成する。
論文参考訳（メタデータ） (2023-09-20T06:51:11Z)
Augment and Criticize: Exploring Informative Samples for Semi-Supervised Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。 3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文参考訳（メタデータ） (2023-03-20T16:28:15Z)
Learning to Adapt to Unseen Abnormal Activities under Weak Supervision [43.40900198498228]
ビデオ中の弱教師付き異常検出のためのメタラーニングフレームワークを提案する。このフレームワークは,バイナリラベルの動画レベルのアノテーションが利用可能である場合にのみ,目に見えないような異常なアクティビティに効果的に対応できることを学習する。
論文参考訳（メタデータ） (2022-03-25T12:15:44Z)
Out-of-Domain Human Mesh Reconstruction via Dynamic Bilevel Online Adaptation [87.85851771425325]
我々は、人間のメッシュ再構成モデルをドメイン外ストリーミングビデオに適用する際の新しい問題を考える。オンライン適応によってこの問題に対処し、テスト中のモデルのバイアスを徐々に修正します。動的バイレベルオンライン適応アルゴリズム(DynaBOA)を提案する。
論文参考訳（メタデータ） (2021-11-07T07:23:24Z)
Guided Point Contrastive Learning for Semi-supervised Point Cloud Semantic Segmentation [90.2445084743881]
そこで本研究では,モデル性能を向上させるために,未ラベルの点群をトレーニングに採用するための半教師付き点群セマンティックセマンティックセマンティックセマンティクスを提案する。近年の自己監督型タスクのコントラスト損失に触発されて,特徴表現とモデル一般化能力を高めるためのガイド付きポイントコントラスト損失を提案する。
論文参考訳（メタデータ） (2021-10-15T16:38:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。