Fugu-MT 論文翻訳(概要): PAT: Pixel-wise Adaptive Training for Long-tailed Segmentation

論文の概要: PAT: Pixel-wise Adaptive Training for Long-tailed Segmentation

arxiv url: http://arxiv.org/abs/2404.05393v1
Date: Mon, 8 Apr 2024 10:52:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-09 18:32:03.688071
Title: PAT: Pixel-wise Adaptive Training for Long-tailed Segmentation
Title（参考訳）: PAT:ロングテールセグメンテーションのための画素ワイド適応トレーニング
Authors: Khoi Do, Duong Nguyen, Nguyen H. Tran, Viet Dung Nguyen,
Abstract要約: 長い尾のセグメンテーションに適した革新的なPixel-wise Adaptive Training (PAT)技術を提案する。 PATには,(1)クラスワイド勾配等級均質化,2)ピクセルワイドクラス固有損失適応(PCLA)の2つの重要な特徴がある。 PATは、NyUデータセットで現在の最先端を2.2%上回る、大幅なパフォーマンス向上を示している。
参考スコア（独自算出の注目度）: 4.384837621499638
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Beyond class frequency, we recognize the impact of class-wise relationships among various class-specific predictions and the imbalance in label masks on long-tailed segmentation learning. To address these challenges, we propose an innovative Pixel-wise Adaptive Training (PAT) technique tailored for long-tailed segmentation. PAT has two key features: 1) class-wise gradient magnitude homogenization, and 2) pixel-wise class-specific loss adaptation (PCLA). First, the class-wise gradient magnitude homogenization helps alleviate the imbalance among label masks by ensuring equal consideration of the class-wise impact on model updates. Second, PCLA tackles the detrimental impact of both rare classes within the long-tailed distribution and inaccurate predictions from previous training stages by encouraging learning classes with low prediction confidence and guarding against forgetting classes with high confidence. This combined approach fosters robust learning while preventing the model from forgetting previously learned knowledge. PAT exhibits significant performance improvements, surpassing the current state-of-the-art by 2.2% in the NyU dataset. Moreover, it enhances overall pixel-wise accuracy by 2.85% and intersection over union value by 2.07%, with a particularly notable declination of 0.39% in detecting rare classes compared to Balance Logits Variation, as demonstrated on the three popular datasets, i.e., OxfordPetIII, CityScape, and NYU.
Abstract（参考訳）: クラス頻度を超えて,様々なクラス固有予測におけるクラスワイド関係とラベルマスクの不均衡が長いセグメンテーション学習に与える影響を認識した。これらの課題に対処するために、長い尾のセグメンテーションに適した革新的なPixel-wise Adaptive Training (PAT)技術を提案する。 PATには2つの重要な特徴がある。 1) 等級勾配等級均質化, 等級勾配等級化 2) pixel-wise class-specific loss adaptation (PCLA)。第一に、クラスワイドグレードの等質化は、モデル更新に対するクラスワイドの影響を等しく考慮することで、ラベルマスク間の不均衡を軽減するのに役立つ。第2に、PCLAは、予測信頼度が低い学習クラスを奨励し、信頼度の高い授業を忘れないようにすることにより、長い尾の分布におけるレアクラスと、以前のトレーニング段階からの不正確な予測の両方の有害な影響に取り組む。この組み合わせアプローチは、モデルが以前に学んだ知識を忘れないようにしながら、堅牢な学習を促進する。 PATは、NyUデータセットで現在の最先端を2.2%上回る、大幅なパフォーマンス向上を示している。さらに、OxfordPetIII、CityScape、NYUの3つの一般的なデータセットで示されるように、全体のピクセル単位の精度を2.85%向上し、ユニオン値の交叉を2.07%向上させる。

関連論文リスト

ViRN: Variational Inference and Distribution Trilateration for Long-Tailed Continual Representation Learning [6.253882111488726]
ViRNは、変動推論と分布三元化を統合した、堅牢な長期学習のための新しいフレームワークである。音声(まれな音響イベント、アクセント)や画像タスクを含む6つの長い尾の分類ベンチマークで評価される。最先端の手法よりも平均精度が10.24%向上する。
論文参考訳（メタデータ） (2025-07-23T10:04:30Z)
Bayesian Learning-driven Prototypical Contrastive Loss for Class-Incremental Learning [42.14439854721613]
本稿では,クラス増分学習シナリオに特化して,ベイズ学習駆動型コントラスト損失(BLCL)を持つプロトタイプネットワークを提案する。提案手法は,ベイズ学習手法を用いて,クロスエントロピーとコントラスト損失関数のバランスを動的に適用する。
論文参考訳（メタデータ） (2024-05-17T19:49:02Z)
Better (pseudo-)labels for semi-supervised instance segmentation [21.703173564795353]
本稿では,教師モデルの訓練プロセスを強化するための2段階戦略を導入し,数発の学習における性能を大幅に向上させる。我々は,LVISデータセット上での最先端の教師付きベースライン性能に対して,平均精度(AP)が2.8%,レアクラスのAPが10.3%向上し,顕著な改善が見られた。
論文参考訳（メタデータ） (2024-03-18T11:23:02Z)
Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文参考訳（メタデータ） (2024-01-13T04:16:40Z)
Uncertainty-aware Sampling for Long-tailed Semi-supervised Learning [89.98353600316285]
擬似ラベルサンプリングのモデル化プロセスに不確実性を導入し、各クラスにおけるモデル性能が異なる訓練段階によって異なることを考慮した。このアプローチにより、モデルは異なる訓練段階における擬似ラベルの不確かさを認識でき、それによって異なるクラスの選択閾値を適応的に調整できる。 FixMatchのような他の手法と比較して、UDTSは自然シーン画像データセットの精度を少なくとも5.26%、1.75%、9.96%、1.28%向上させる。
論文参考訳（メタデータ） (2024-01-09T08:59:39Z)
Understanding the Detrimental Class-level Effects of Data Augmentation [63.1733767714073]
最適な平均精度を達成するには、ImageNetで最大20%の個々のクラスの精度を著しく損なうコストがかかる。本稿では,DAがクラスレベルの学習力学とどのように相互作用するかを理解するためのフレームワークを提案する。そこで本研究では, クラス条件拡張戦略により, 負の影響を受けるクラスの性能が向上することを示す。
論文参考訳（メタデータ） (2023-12-07T18:37:43Z)
Class Balanced Dynamic Acquisition for Domain Adaptive Semantic Segmentation using Active Learning [3.175227858236288]
ドメイン適応型アクティブラーニングは、ニューラルネットワークのラベル効率のトレーニングにおいて電荷を導いている。セマンティックセグメンテーションでは、最先端のモデルでは、不確実性と多様性の2つの基準を併用してトレーニングラベルを選択する。このような手法は、現在、より大規模なアクティブな学習予算のために、その性能を低下させるクラス不均衡の問題に悩まされている。
論文参考訳（メタデータ） (2023-11-23T18:35:26Z)
Uncertainty-guided Boundary Learning for Imbalanced Social Event Detection [64.4350027428928]
本研究では,不均衡なイベント検出タスクのための不確実性誘導型クラス不均衡学習フレームワークを提案する。我々のモデルは、ほとんど全てのクラス、特に不確実なクラスにおいて、社会イベントの表現と分類タスクを大幅に改善する。
論文参考訳（メタデータ） (2023-10-30T03:32:04Z)
Exploring Classification Equilibrium in Long-Tailed Object Detection [29.069986049436157]
そこで本研究では,各カテゴリの平均分類スコアを用いて,各カテゴリの分類精度を示す。 EBL (Equilibrium Loss) と Memory-augmented Feature Smpling (MFS) 法による分類のバランスをとる。尾クラスの検出性能を15.6 APで改善し、最新の長い尾を持つ物体検出器を1 AP以上で上回っている。
論文参考訳（メタデータ） (2021-08-17T08:39:04Z)
Semi-supervised Contrastive Learning with Similarity Co-calibration [72.38187308270135]
SsCL(Semi-supervised Contrastive Learning)と呼ばれる新しいトレーニング戦略を提案する。 ssclは、自己教師付き学習におけるよく知られたコントラスト損失と、半教師付き学習におけるクロスエントロピー損失を組み合わせる。 SsCLはより差別的な表現を生じさせ,ショット学習に有益であることを示す。
論文参考訳（メタデータ） (2021-05-16T09:13:56Z)
Robust Pre-Training by Adversarial Contrastive Learning [120.33706897927391]
近年の研究では、敵の訓練と統合されると、自己監督型事前訓練が最先端の堅牢性につながることが示されている。我々は,データ強化と対向的摂動の両面に整合した学習表現により,ロバストネスを意識した自己指導型事前学習を改善する。
論文参考訳（メタデータ） (2020-10-26T04:44:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。