論文の概要: Analytic Incremental Learning For Sound Source Localization With Imbalance Rectification
- arxiv url: http://arxiv.org/abs/2601.18335v1
- Date: Mon, 26 Jan 2026 10:22:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.77242
- Title: Analytic Incremental Learning For Sound Source Localization With Imbalance Rectification
- Title(参考訳): 不均衡整流による音源定位の解析的インクリメンタル学習
- Authors: Zexia Fan, Yu Chen, Qiquan Zhang, Kainan Chen, Xinyuan Qian,
- Abstract要約: サウンドソースのローカライゼーション(SSL)は、コントロールされた設定において顕著な結果を示すが、実際のデプロイメントでは困難である。
これらの問題を緩和する2つの重要な革新を伴う統一されたフレームワークを提案する。
SSLRベンチマークでは、89.0%の精度、5.3の平均絶対誤差、1.6の後方転送ロバスト性を実現している。
- 参考スコア(独自算出の注目度): 15.161051314343105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sound source localization (SSL) demonstrates remarkable results in controlled settings but struggles in real-world deployment due to dual imbalance challenges: intra-task imbalance arising from long-tailed direction-of-arrival (DoA) distributions, and inter-task imbalance induced by cross-task skews and overlaps. These often lead to catastrophic forgetting, significantly degrading the localization accuracy. To mitigate these issues, we propose a unified framework with two key innovations. Specifically, we design a GCC-PHAT-based data augmentation (GDA) method that leverages peak characteristics to alleviate intra-task distribution skews. We also propose an Analytic dynamic imbalance rectifier (ADIR) with task-adaption regularization, which enables analytic updates that adapt to inter-task dynamics. On the SSLR benchmark, our proposal achieves state-of-the-art (SoTA) results of 89.0% accuracy, 5.3° mean absolute error, and 1.6 backward transfer, demonstrating robustness to evolving imbalances without exemplar storage.
- Abstract(参考訳): サウンドソースのローカライゼーション(SSL)は、制御された設定において顕著な結果を示すが、二重不均衡の問題による実世界の展開に苦慮している。
これらはしばしば破滅的な忘れ込みを招き、局所化の精度を著しく低下させる。
これらの問題を緩和するため、我々は2つの重要な革新を伴う統一されたフレームワークを提案する。
具体的には,ピーク特性を利用したGCC-PHATに基づくデータ拡張(GDA)法を設計し,タスク内分布スキューを緩和する。
また,タスク適応正則化を用いた解析動的不均衡整合器 (ADIR) を提案する。
SSLRベンチマークでは,89.0%の精度,5.3°の平均絶対誤差,1.6の後方転送を実現し,従来のストレージを使わずに不均衡を進化させる堅牢性を示す。
関連論文リスト
- Quantifying Multimodal Imbalance: A GMM-Guided Adaptive Loss for Audio-Visual Learning [12.236332735708473]
既存のソリューションは主に最適化やデータベースの戦略に重点を置いているが、マルチモーダル不均衡に固有の情報を活用することは滅多にない。
マルチモーダルインバランスのための新しい定量的分析フレームワークを提案し,サンプルレベルの適応損失関数を設計する。
論文 参考訳(メタデータ) (2025-10-20T15:42:43Z) - Dual-granularity Sinkhorn Distillation for Enhanced Learning from Long-tailed Noisy Data [67.25796812343454]
ディープラーニングのための実世界のデータセットは、クラス不均衡とラベルノイズの共起的な課題にしばしば悩まされる。
蒸留と相補的な知見の統合により二重強靭性を高める新しいフレームワークであるD-SINKを提案する。
ベンチマークデータセットの実験では、D-SINKはロバスト性を大幅に向上し、長い尾のノイズデータから学習する際の強い経験的性能を達成することが示された。
論文 参考訳(メタデータ) (2025-10-09T13:05:27Z) - Sycophancy Mitigation Through Reinforcement Learning with Uncertainty-Aware Adaptive Reasoning Trajectories [58.988535279557546]
適応推論トラジェクトリを用いたtextbf sycophancy Mitigation を提案する。
SMARTは,分布外の入力に対して強い性能を維持しながら,サイコファンティクスの挙動を著しく低下させることを示した。
論文 参考訳(メタデータ) (2025-09-20T17:09:14Z) - TOAST: Task-Oriented Adaptive Semantic Transmission over Dynamic Wireless Environments [3.3107717550009865]
TOAST(Task-Oriented Adaptive Semantic Transmission)は、無線環境におけるマルチタスク最適化の課題を解決するために設計された統合フレームワークである。
我々はマルコフ決定過程として適応的タスクバランスを定式化し、画像再構成の忠実度と意味分類の精度のトレードオフを動的に調整するために深層強化学習を用いる。
モジュール固有のLow-Rank Adaptation(LoRA)機構を,Swin Transformerベースのジョイントソースチャネル符号化アーキテクチャ全体に統合する。
論文 参考訳(メタデータ) (2025-06-27T04:36:30Z) - Reliable Few-shot Learning under Dual Noises [166.53173694689693]
そこで我々はDETA++(Denoized Task Adaptation)を提案する。
DETA++はメモリバンクを使用して、各インナータスククラスのクリーンなリージョンを格納し、精製する。
大規模な実験は、DETA++の有効性と柔軟性を示している。
論文 参考訳(メタデータ) (2025-06-19T14:05:57Z) - Controlled Data Rebalancing in Multi-Task Learning for Real-World Image Super-Resolution [51.79973519845773]
実世界の画像超解像(Real-SR)は、低解像度画像の複雑な劣化パターンのために難しい問題である。
本稿では,データヘテロジニアスなマルチタスク学習問題としてReal-SRの枠組みを改良したパラダイムを提案する。
論文 参考訳(メタデータ) (2025-06-05T21:40:21Z) - Error Distribution Smoothing:Advancing Low-Dimensional Imbalanced Regression [2.435853975142516]
実世界の回帰タスクでは、データセットは頻繁に不均衡な分布を示し、その特徴は、高複雑さ領域におけるデータの不足と低複雑さ領域における量の不足である。
データ密度のみに焦点をあてる従来の定義を超えて、問題の複雑さとデータポイントの密度の両方を考慮に入れた「不均衡回帰」という新しい概念を導入する。
本研究では,不均衡な回帰に対処するための解として誤り分布平滑化(EDS)を提案し,バランスと代表性を保ちながら,データセットから代表サブセットを効果的に選択し冗長性を低減する。
論文 参考訳(メタデータ) (2025-02-04T12:40:07Z) - Energy Score-based Pseudo-Label Filtering and Adaptive Loss for Imbalanced Semi-supervised SAR target recognition [1.2035771704626825]
既存の半教師付きSAR ATRアルゴリズムは、クラス不均衡の場合、認識精度が低い。
この研究は、動的エネルギースコアと適応損失を用いた非平衡半教師付きSAR目標認識手法を提供する。
論文 参考訳(メタデータ) (2024-11-06T14:45:16Z) - Causal Balancing for Domain Generalization [95.97046583437145]
そこで本研究では,観察されたトレーニング分布の領域特異的なスプリアス相関を低減するために,バランスの取れたミニバッチサンプリング戦略を提案する。
本研究では, 突発性源の同定可能性を保証するとともに, バランスの取れた, 突発性のない分布から, 提案手法が有効にサンプリング可能であることを示す。
論文 参考訳(メタデータ) (2022-06-10T17:59:11Z) - Towards Overcoming False Positives in Visual Relationship Detection [95.15011997876606]
視覚的関係検出(VRD)における偽陽性率の高い原因について検討する。
本稿では,偽陽性の影響を軽減する堅牢なVRDフレームワークとして,Spatially-Aware Balanced negative pRoposal sAmpling(SABRA)を提案する。
論文 参考訳(メタデータ) (2020-12-23T06:28:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。