論文の概要: Wrapped Cauchy Distributed Angular Softmax for Long-Tailed Visual
Recognition
- arxiv url: http://arxiv.org/abs/2305.18732v1
- Date: Tue, 30 May 2023 04:12:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 18:17:37.441361
- Title: Wrapped Cauchy Distributed Angular Softmax for Long-Tailed Visual
Recognition
- Title(参考訳): 長テール視覚認識のためのラッピングコーシー分散角ソフトマックス
- Authors: Boran Han
- Abstract要約: 本稿では,データワイドガウス型カーネルを特徴表現と重みの角度相関に組み込んだソフトマックス関数を提案する。
筆者らの理論的解析により, 包むコーシー分布は混合分布の近似においてガウス分布より優れていることが明らかになった。
実験により,これらのパラメータにおけるラベル認識の挙動を確認し,WCDASが他の最先端のソフトマックス法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Addressing imbalanced or long-tailed data is a major challenge in visual
recognition tasks due to disparities between training and testing distributions
and issues with data noise. We propose the Wrapped Cauchy Distributed Angular
Softmax (WCDAS), a novel softmax function that incorporates data-wise
Gaussian-based kernels into the angular correlation between feature
representations and classifier weights, effectively mitigating noise and sparse
sampling concerns. The class-wise distribution of angular representation
becomes a sum of these kernels. Our theoretical analysis reveals that the
wrapped Cauchy distribution excels the Gaussian distribution in approximating
mixed distributions. Additionally, WCDAS uses trainable concentration
parameters to dynamically adjust the compactness and margin of each class.
Empirical results confirm label-aware behavior in these parameters and
demonstrate WCDAS's superiority over other state-of-the-art softmax-based
methods in handling long-tailed visual recognition across multiple benchmark
datasets. The code is public available.
- Abstract(参考訳): 不均衡またはロングテールデータに対処することは、トレーニングとテスト分布の相違とデータノイズの問題のために、視覚認識タスクにおいて大きな課題である。
本稿では,データワイズガウス系カーネルを特徴表現と分類重みの角相関に組み込んだ新しいソフトマックス関数であるラッピングコーシー分散角ソフトマックス(wcdas)を提案する。
角表現のクラスワイド分布はこれらのカーネルの和となる。
理論解析により,包まれたコーシー分布は混合分布に近似するガウス分布に優れていることが明らかとなった。
さらに、WCDASはトレーニング可能な濃度パラメータを使用して、各クラスのコンパクト性とマージンを動的に調整する。
実験の結果、これらのパラメータのラベル認識挙動を確認し、WCDASが複数のベンチマークデータセットにわたって長い尾の視覚的認識を扱う場合、他の最先端のソフトマックス法よりも優れていることを示す。
コードは公開されている。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Deep Generative Sampling in the Dual Divergence Space: A Data-efficient & Interpretative Approach for Generative AI [29.13807697733638]
自然画像の生成的サンプリングにおける顕著な成果の上に構築する。
我々は、画像に似たサンプルを生成するという、画期的な挑戦を、潜在的に過度に野心的に提案する。
統計上の課題は、小さなサンプルサイズであり、時には数百人の被験者で構成されている。
論文 参考訳(メタデータ) (2024-04-10T22:35:06Z) - On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.13323375365494]
我々は,強い対数対数データの下での拡散に基づく生成モデルの収束挙動を理論的に保証する。
スコア推定に使用される関数のクラスは、スコア関数上のリプシッツネスの仮定を避けるために、リプシッツ連続関数からなる。
この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文 参考訳(メタデータ) (2023-11-22T18:40:45Z) - Attributes Grouping and Mining Hashing for Fine-Grained Image Retrieval [24.8065557159198]
微粒な画像検索のための属性グループとマイニングハッシュ(AGMH)を提案する。
AGMHはカテゴリ固有の視覚属性を複数の記述子にグループ化し、包括的特徴表現を生成する。
AGMHは、きめ細かいベンチマークデータセットの最先端メソッドに対して、一貫して最高のパフォーマンスを得る。
論文 参考訳(メタデータ) (2023-11-10T14:01:56Z) - The Lipschitz-Variance-Margin Tradeoff for Enhanced Randomized Smoothing [85.85160896547698]
ディープニューラルネットワークの現実的な応用は、ノイズの多い入力や敵攻撃に直面した場合、その不安定な予測によって妨げられる。
入力にノイズ注入を頼りに、認証された半径を持つ効率的な分類器を設計する方法を示す。
新たな認証手法により、ランダムな平滑化による事前学習モデルの使用が可能となり、ゼロショット方式で現在の認証半径を効果的に改善できる。
論文 参考訳(メタデータ) (2023-09-28T22:41:47Z) - Graph Out-of-Distribution Generalization with Controllable Data
Augmentation [51.17476258673232]
グラフニューラルネットワーク(GNN)は,グラフ特性の分類において異常な性能を示した。
トレーニングとテストデータの選択バイアスが原因で、分散偏差が広まっています。
仮想サンプルの分布偏差を測定するためのOODキャリブレーションを提案する。
論文 参考訳(メタデータ) (2023-08-16T13:10:27Z) - Do Bayesian Variational Autoencoders Know What They Don't Know? [0.6091702876917279]
OoD(Out-of-Distribution)入力を検出する問題は、ディープニューラルネットワークにとって最重要課題である。
入力の密度を推定できる深部生成モデルでさえ、信頼できない可能性があることが以前に示されている。
本稿では,マルコフ連鎖モンテカルロ,バックプロパゲーションによるベイズ勾配,およびウェイト平均ガウスの3つの推論手法について検討する。
論文 参考訳(メタデータ) (2022-12-29T11:48:01Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Multi-Class Data Description for Out-of-distribution Detection [25.853322158250435]
Deep-MCDDは、分布外(OOD)サンプルを検出するだけでなく、分布内(ID)サンプルを分類するのに効果的です。
ガウス微分分析の概念をディープニューラルネットワークに統合することにより,クラス条件分布を学習する深層学習目標を提案する。
論文 参考訳(メタデータ) (2021-04-02T08:41:51Z) - Variational Hyper-Encoding Networks [62.74164588885455]
ニューラルネットワークパラメータの分布を符号化するHyperVAEというフレームワークを提案する。
遅延符号の後部分布を予測し,行列ネットワークデコーダを用いて後部分布q(theta)を生成する。
論文 参考訳(メタデータ) (2020-05-18T06:46:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。