Fugu-MT 論文翻訳(概要): What and When to Learn: CURriculum Ranking Loss for Large-Scale Speaker Verification

論文の概要: What and When to Learn: CURriculum Ranking Loss for Large-Scale Speaker Verification

arxiv url: http://arxiv.org/abs/2603.24432v1
Date: Wed, 25 Mar 2026 15:41:21 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-26 21:06:11.368355
Title: What and When to Learn: CURriculum Ranking Loss for Large-Scale Speaker Verification
Title（参考訳）: 何といつ学ぶべきか:大規模話者検証のためのカリキュラムランキングの損失
Authors: Massa Baali, Sarthak Bisht, Rita Singh, Bhiksha Raj,
Abstract要約: Curryは適応的な損失であり、Sub-center ArcFace経由でオンラインのサンプルの難しさを見積もる。カレーはEERを86.8%減らし、サブセンターのArcFaceベースラインを60.0%減らした。
参考スコア（独自算出の注目度）: 60.36003327686732
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Speaker verification at large scale remains an open challenge as fixed-margin losses treat all samples equally regardless of quality. We hypothesize that mislabeled or degraded samples introduce noisy gradients that disrupt compact speaker manifolds. We propose Curry (CURriculum Ranking), an adaptive loss that estimates sample difficulty online via Sub-center ArcFace: confidence scores from dominant sub-center cosine similarity rank samples into easy, medium, and hard tiers using running batch statistics, without auxiliary annotations. Learnable weights guide the model from stable identity foundations through manifold refinement to boundary sharpening. To our knowledge, this is the largest-scale speaker verification system trained to date. Evaluated on VoxCeleb1-O, and SITW, Curry reduces EER by 86.8\% and 60.0\% over the Sub-center ArcFace baseline, establishing a new paradigm for robust speaker verification on imperfect large-scale data.
Abstract（参考訳）: 大規模な話者検証は、品質に関わらず全てのサンプルを平等に扱う固定マージン損失に対して、依然としてオープンな課題である。誤ラベルや劣化したサンプルは、コンパクトな話者多様体を妨害する雑音勾配をもたらすと仮定する。本稿では,Curry(Curriculum Ranking)を提案する。Curry(Curriculum Ranking)は,Curry(Curry,Curry,Curry,Curry,Curriculum Ranking,Curry,Curry,Curry,Curry,Curriculum Ranking,Curry,Curry,Curry,Curry,Curry,Curry,Curry,Curry,Curry,Curry,Curry,Curriculum Ranking,Curry,Curry,Curry,Curry,Curry,Curry,Curculum Ranking,Curry,Curry,Curry,Curry,Curry,Curry,Cur) 学習可能なウェイトは、モデルを安定なアイデンティティ基盤から多様体の洗練から境界のシャープニングまで導く。我々の知る限り、これはこれまでに訓練された最大規模の話者認証システムである。 VoxCeleb1-OとSITWで評価され、CurryはサブセンターのArcFaceベースライン上でEERを86.8\%、60.0\%削減し、不完全な大規模データに対する堅牢な話者検証のための新しいパラダイムを確立した。

関連論文リスト

CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。 ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文参考訳（メタデータ） (2025-10-02T02:14:33Z)
DASA: Difficulty-Aware Semantic Augmentation for Speaker Verification [55.306583814017046]
本稿では,話者認証のための難易度認識型セマンティック拡張(DASA)手法を提案する。 DASAは、話者埋め込み空間における多様なトレーニングサンプルを、無視できる余分な計算コストで生成する。最も良い結果は、CN-Celeb評価セット上でのEER測定値の14.6%の相対的な減少を達成する。
論文参考訳（メタデータ） (2023-10-18T17:07:05Z)
Learning from Noisy Labels with Coarse-to-Fine Sample Credibility Modeling [22.62790706276081]
ノイズの多いラベルでディープニューラルネットワーク(DNN)を訓練することは事実上難しい。従来の取り組みでは、統合されたデノナイジングフローで部分データや完全なデータを扱う傾向があります。本研究では,ノイズの多いデータを分割・分散的に処理するために,CREMAと呼ばれる粗大な頑健な学習手法を提案する。
論文参考訳（メタデータ） (2022-08-23T02:06:38Z)
Investigation of Different Calibration Methods for Deep Speaker Embedding based Verification Systems [66.61691401921296]
本稿では, ディープスピーカ埋込抽出器のスコアキャリブレーション法について検討する。この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
論文参考訳（メタデータ） (2022-03-28T21:22:22Z)
S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文参考訳（メタデータ） (2021-11-22T15:49:20Z)
A Speaker Verification Backend with Robust Performance across Conditions [28.64769660252556]
話者検証の標準的な方法は、ディープニューラルネットワークを用いた話者埋め込みを抽出することである。この方法は、キャリブレーションモデルのトレーニングに使用されるものと異なる条件でうまく動作しないシステムをもたらすことが知られている。本稿では,入力の条件に適応するために,時間などの情報を自動的に抽出するアダプティブキャリブレータを導入することで,標準バックエンドを変更することを提案する。
論文参考訳（メタデータ） (2021-02-02T21:27:52Z)
Salvage Reusable Samples from Noisy Data for Robust Learning [70.48919625304]
本稿では,Web画像を用いた深部FGモデルのトレーニングにおいて,ラベルノイズに対処するための再利用可能なサンプル選択と修正手法を提案する。私たちのキーとなるアイデアは、再利用可能なサンプルの追加と修正を行い、それらをクリーンな例とともに活用してネットワークを更新することです。
論文参考訳（メタデータ） (2020-08-06T02:07:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。