Fugu-MT 論文翻訳(概要): Wrapped Cauchy Distributed Angular Softmax for Long-Tailed Visual Recognition

論文の概要: Wrapped Cauchy Distributed Angular Softmax for Long-Tailed Visual Recognition

arxiv url: http://arxiv.org/abs/2305.18732v1
Date: Tue, 30 May 2023 04:12:24 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-31 18:17:37.441361
Title: Wrapped Cauchy Distributed Angular Softmax for Long-Tailed Visual Recognition
Title（参考訳）: 長テール視覚認識のためのラッピングコーシー分散角ソフトマックス
Authors: Boran Han
Abstract要約: 本稿では,データワイドガウス型カーネルを特徴表現と重みの角度相関に組み込んだソフトマックス関数を提案する。筆者らの理論的解析により, 包むコーシー分布は混合分布の近似においてガウス分布より優れていることが明らかになった。実験により,これらのパラメータにおけるラベル認識の挙動を確認し,WCDASが他の最先端のソフトマックス法よりも優れていることを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Addressing imbalanced or long-tailed data is a major challenge in visual recognition tasks due to disparities between training and testing distributions and issues with data noise. We propose the Wrapped Cauchy Distributed Angular Softmax (WCDAS), a novel softmax function that incorporates data-wise Gaussian-based kernels into the angular correlation between feature representations and classifier weights, effectively mitigating noise and sparse sampling concerns. The class-wise distribution of angular representation becomes a sum of these kernels. Our theoretical analysis reveals that the wrapped Cauchy distribution excels the Gaussian distribution in approximating mixed distributions. Additionally, WCDAS uses trainable concentration parameters to dynamically adjust the compactness and margin of each class. Empirical results confirm label-aware behavior in these parameters and demonstrate WCDAS's superiority over other state-of-the-art softmax-based methods in handling long-tailed visual recognition across multiple benchmark datasets. The code is public available.
Abstract（参考訳）: 不均衡またはロングテールデータに対処することは、トレーニングとテスト分布の相違とデータノイズの問題のために、視覚認識タスクにおいて大きな課題である。本稿では,データワイズガウス系カーネルを特徴表現と分類重みの角相関に組み込んだ新しいソフトマックス関数であるラッピングコーシー分散角ソフトマックス(wcdas)を提案する。角表現のクラスワイド分布はこれらのカーネルの和となる。理論解析により,包まれたコーシー分布は混合分布に近似するガウス分布に優れていることが明らかとなった。さらに、WCDASはトレーニング可能な濃度パラメータを使用して、各クラスのコンパクト性とマージンを動的に調整する。実験の結果、これらのパラメータのラベル認識挙動を確認し、WCDASが複数のベンチマークデータセットにわたって長い尾の視覚的認識を扱う場合、他の最先端のソフトマックス法よりも優れていることを示す。コードは公開されている。

関連論文リスト

Data-Aware Random Feature Kernel for Transformers [7.455696124254561]
事前訓練されたモデルでは、クエリとキーは典型的には異方的であり、これは等方的サンプリングスキームにおいて高いモンテカルロ分散を引き起こす。我々はDARKFormerを紹介した。DARKFormerはデータ対応のカーネル幾何を特徴とするデータ対応ランダム関数カーネルトランスである。ランダム機能効率とデータ認識カーネルを組み合わせることで、DARKFormerはリソース制約された設定においてカーネルベースの注意を喚起する。
論文参考訳（メタデータ） (2026-03-04T14:43:11Z)
Cross-Modal Retrieval with Cauchy-Schwarz Divergence [26.94915416778522]
クロスモーダル検索では、不均一なデータ型を堅牢にアライメントする必要がある。既存の手法の多くは、Kullback-Leiblerの発散のような分布アライメント技術に依存している。本稿では、トレーニング安定性と検索性能の両方を改善するハイパーパラメータフリー尺度であるCauchy-Schwarz(CS)の発散について紹介する。
論文参考訳（メタデータ） (2025-09-15T08:55:15Z)
Data-Dependent Smoothing for Protein Discovery with Walk-Jump Sampling [7.278972126771497]
拡散モデルは、ノイズ発生過程を反復的に逆転することを学ぶことによって、生成モデルの強力なクラスとして現れてきた。高品質なサンプルを生成する能力は、高次元画像データを超えてタンパク質のような他の複雑なドメインにまで拡張されている。本稿では,カーネル密度推定(KDE)を前処理ステップとして利用して,各データポイントに対するノイズスケール$sigma$を推定する,データ依存スムーシングウォーク・ジャンプフレームワークを提案する。局所的なデータ幾何をデノナイズプロセスに組み込むことで,タンパク質データの均一分布を考慮に入れた。
論文参考訳（メタデータ） (2025-09-02T08:17:59Z)
Rethinking Approximate Gaussian Inference in Classification [25.021782278452005]
分類タスクでは、ソフトマックス関数は予測確率を生成するためにユビキタスに使用される。本稿では,予測の正確な計算を可能にする学習目的の簡単な変更を提案する。提案手法は,大規模および小規模データセットに対するガウス推定法と組み合わせて評価する。
論文参考訳（メタデータ） (2025-02-05T17:03:49Z)
GHOST: Gaussian Hypothesis Open-Set Technique [10.426399605773083]
大規模認識手法の評価は通常、全体的な性能に重点を置いている。オープンセット認識(OSR)における公平性に対処し,クラスごとのパフォーマンスが劇的に変化することを示す。 Zスコア正規化をロジットに適用し、モデルの期待から逸脱する特徴量の影響を軽減する。
論文参考訳（メタデータ） (2025-02-05T16:56:14Z)
Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
本報告では,明示的な次元の一般スコアミスマッチ拡散サンプリング器を用いた最初の性能保証について述べる。その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文参考訳（メタデータ） (2024-10-17T16:42:12Z)
Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文参考訳（メタデータ） (2024-10-08T15:06:10Z)
Deep Generative Sampling in the Dual Divergence Space: A Data-efficient & Interpretative Approach for Generative AI [29.13807697733638]
自然画像の生成的サンプリングにおける顕著な成果の上に構築する。我々は、画像に似たサンプルを生成するという、画期的な挑戦を、潜在的に過度に野心的に提案する。統計上の課題は、小さなサンプルサイズであり、時には数百人の被験者で構成されている。
論文参考訳（メタデータ） (2024-04-10T22:35:06Z)
On diffusion-based generative models and their error bounds: The log-concave case with full convergence estimates [5.13323375365494]
我々は,強い対数対数データの下での拡散に基づく生成モデルの収束挙動を理論的に保証する。スコア推定に使用される関数のクラスは、スコア関数上のリプシッツネスの仮定を避けるために、リプシッツ連続関数からなる。この手法はサンプリングアルゴリズムにおいて最もよく知られた収束率をもたらす。
論文参考訳（メタデータ） (2023-11-22T18:40:45Z)
Attributes Grouping and Mining Hashing for Fine-Grained Image Retrieval [24.8065557159198]
微粒な画像検索のための属性グループとマイニングハッシュ(AGMH)を提案する。 AGMHはカテゴリ固有の視覚属性を複数の記述子にグループ化し、包括的特徴表現を生成する。 AGMHは、きめ細かいベンチマークデータセットの最先端メソッドに対して、一貫して最高のパフォーマンスを得る。
論文参考訳（メタデータ） (2023-11-10T14:01:56Z)
The Lipschitz-Variance-Margin Tradeoff for Enhanced Randomized Smoothing [85.85160896547698]
ディープニューラルネットワークの現実的な応用は、ノイズの多い入力や敵攻撃に直面した場合、その不安定な予測によって妨げられる。入力にノイズ注入を頼りに、認証された半径を持つ効率的な分類器を設計する方法を示す。新たな認証手法により、ランダムな平滑化による事前学習モデルの使用が可能となり、ゼロショット方式で現在の認証半径を効果的に改善できる。
論文参考訳（メタデータ） (2023-09-28T22:41:47Z)
Graph Out-of-Distribution Generalization with Controllable Data Augmentation [51.17476258673232]
グラフニューラルネットワーク(GNN)は,グラフ特性の分類において異常な性能を示した。トレーニングとテストデータの選択バイアスが原因で、分散偏差が広まっています。仮想サンプルの分布偏差を測定するためのOODキャリブレーションを提案する。
論文参考訳（メタデータ） (2023-08-16T13:10:27Z)
Do Bayesian Variational Autoencoders Know What They Don't Know? [0.6091702876917279]
OoD(Out-of-Distribution)入力を検出する問題は、ディープニューラルネットワークにとって最重要課題である。入力の密度を推定できる深部生成モデルでさえ、信頼できない可能性があることが以前に示されている。本稿では,マルコフ連鎖モンテカルロ,バックプロパゲーションによるベイズ勾配,およびウェイト平均ガウスの3つの推論手法について検討する。
論文参考訳（メタデータ） (2022-12-29T11:48:01Z)
Generalized Differentiable RANSAC [95.95627475224231]
$nabla$-RANSACは、ランダム化された堅牢な推定パイプライン全体を学ぶことができる、微分可能なRANSACである。 $nabla$-RANSACは、精度という点では最先端のシステムよりも優れているが、精度は低い。
論文参考訳（メタデータ） (2022-12-26T15:13:13Z)
A Robust and Flexible EM Algorithm for Mixtures of Elliptical Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文参考訳（メタデータ） (2022-01-28T10:01:37Z)
Multi-Class Data Description for Out-of-distribution Detection [25.853322158250435]
Deep-MCDDは、分布外(OOD)サンプルを検出するだけでなく、分布内(ID)サンプルを分類するのに効果的です。ガウス微分分析の概念をディープニューラルネットワークに統合することにより,クラス条件分布を学習する深層学習目標を提案する。
論文参考訳（メタデータ） (2021-04-02T08:41:51Z)
Variational Hyper-Encoding Networks [62.74164588885455]
ニューラルネットワークパラメータの分布を符号化するHyperVAEというフレームワークを提案する。遅延符号の後部分布を予測し,行列ネットワークデコーダを用いて後部分布q(theta)を生成する。
論文参考訳（メタデータ） (2020-05-18T06:46:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。