論文の概要: Quantum-Inspired Genetic Algorithm for Robust Source Separation in Smart City Acoustics
- arxiv url: http://arxiv.org/abs/2504.07345v1
- Date: Thu, 10 Apr 2025 00:05:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:24:29.946229
- Title: Quantum-Inspired Genetic Algorithm for Robust Source Separation in Smart City Acoustics
- Title(参考訳): スマートシティ音響におけるロバスト音源分離のための量子インスピレーション型遺伝的アルゴリズム
- Authors: Minh K. Quan, Mayuri Wijayasundara, Sujeeva Setunge, Pubudu N. Pathirana,
- Abstract要約: 本稿では、ソース分離のための新しい量子インスパイアされた遺伝的アルゴリズム(p-QIGA)を提案する。
p-QIGAは、スマートシティの音響シーン分析を強化するために、量子情報理論からインスピレーションを得ている。
実験の結果,p-QIGAは最先端手法に匹敵する精度が得られた。
- 参考スコア(独自算出の注目度): 1.3045945456375774
- License:
- Abstract: The cacophony of urban sounds presents a significant challenge for smart city applications that rely on accurate acoustic scene analysis. Effectively analyzing these complex soundscapes, often characterized by overlapping sound sources, diverse acoustic events, and unpredictable noise levels, requires precise source separation. This task becomes more complicated when only limited training data is available. This paper introduces a novel Quantum-Inspired Genetic Algorithm (p-QIGA) for source separation, drawing inspiration from quantum information theory to enhance acoustic scene analysis in smart cities. By leveraging quantum superposition for efficient solution space exploration and entanglement to handle correlated sources, p-QIGA achieves robust separation even with limited data. These quantum-inspired concepts are integrated into a genetic algorithm framework to optimize source separation parameters. The effectiveness of our approach is demonstrated on two datasets: the TAU Urban Acoustic Scenes 2020 Mobile dataset, representing typical urban soundscapes, and the Silent Cities dataset, capturing quieter urban environments during the COVID-19 pandemic. Experimental results show that the p-QIGA achieves accuracy comparable to state-of-the-art methods while exhibiting superior resilience to noise and limited training data, achieving up to 8.2 dB signal-to-distortion ratio (SDR) in noisy environments and outperforming baseline methods by up to 2 dB with only 10% of the training data. This research highlights the potential of p-QIGA to advance acoustic signal processing in smart cities, particularly for noise pollution monitoring and acoustic surveillance.
- Abstract(参考訳): 都市音のカコフォニーは、正確な音響シーン分析に依存するスマートシティアプリケーションにとって重要な課題である。
これらの複雑なサウンドスケープを効果的に解析するには、しばしば重なり合う音源、多様な音響イベント、予測不可能なノイズレベルが特徴であり、正確な音源分離が必要である。
このタスクは、限られたトレーニングデータしか利用できない場合、さらに複雑になる。
本稿では,スマートシティにおける音響シーン分析を向上するために,量子情報理論からインスピレーションを得て,ソース分離のための新しい量子インスピレーション付き遺伝的アルゴリズム(p-QIGA)を提案する。
量子重ね合わせを利用して効率的な解空間探索と絡み合いを行い、相関したソースを扱うことにより、p-QIGAは限られたデータでも堅牢な分離を実現する。
これらの量子に着想を得た概念は、ソース分離パラメータを最適化する遺伝的アルゴリズムフレームワークに統合される。
提案手法の有効性は,都市音環境を表すTAU Urban Acoustic Scenes 2020 Mobileデータセットと,新型コロナウイルスのパンデミック時に静かな都市環境を捉えるSilent Citiesデータセットの2つのデータセットで実証された。
実験結果から,p-QIGAは,ノイズに対する優れたレジリエンスと限られたトレーニングデータを示し,ノイズの多い環境では最大8.2dBの信号-歪み比(SDR)を達成し,トレーニングデータの10%しか持たないベースライン法よりも2dBの精度を実現していることがわかった。
この研究は、スマートシティ、特に騒音汚染モニタリングや音響監視において、p-QIGAが音響信号処理を進歩させる可能性を強調している。
関連論文リスト
- A Lightweight and Real-Time Binaural Speech Enhancement Model with Spatial Cues Preservation [19.384404014248762]
バイノーラル音声強調は、聴覚装置から受信される雑音信号の音質と可聴性を改善することを目的としている。
既存の手法は、複雑な音響シーンにおいてノイズ低減(NR)と空間的手がかり(SCP)の精度と高い計算要求の妥協に悩まされることが多い。
本稿では、低周波帯域をフィルタし、残りを保ち、NRに優れた学習ベース軽量複合畳み込みネットワーク(LBCCN)を提案する。
論文 参考訳(メタデータ) (2024-09-19T03:52:50Z) - LoRaWAN Based Dynamic Noise Mapping with Machine Learning for Urban Noise Enforcement [8.010966370223985]
広域にわたる長期騒音レベルを示す静的騒音マップは、自治体にとって貴重な都市計画資産である。
過渡的な振る舞いを頻繁に訴える非交通ノイズ源は、通常静的マップによって無視される。
本稿では,低消費電力広帯域ネットワーク(LPWAN)ベースのモノのインターネット(IoT)インフラストラクチャを用いて収集したデータを用いた動的ノイズマッピング手法を提案する。
論文 参考訳(メタデータ) (2024-07-30T21:40:12Z) - AV-GS: Learning Material and Geometry Aware Priors for Novel View Acoustic Synthesis [62.33446681243413]
ビュー音響合成は、音源が3Dシーンで出力するモノのオーディオを考慮し、任意の視点でオーディオを描画することを目的としている。
既存の手法では、音声合成の条件として視覚的手がかりを利用するため、NeRFベースの暗黙モデルが提案されている。
本研究では,シーン環境全体を特徴付ける新しいオーディオ・ビジュアル・ガウス・スプレイティング(AV-GS)モデルを提案する。
AV-GSが実世界のRWASやシミュレーションベースのSoundSpacesデータセットの既存の代替品よりも優れていることを検証する。
論文 参考訳(メタデータ) (2024-06-13T08:34:12Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Combating Bilateral Edge Noise for Robust Link Prediction [56.43882298843564]
本稿では,RGIB(Robust Graph Information Bottleneck)という情報理論の原則を提案し,信頼性の高い監視信号を抽出し,表現の崩壊を回避する。
RGIB-SSLとRGIB-REPの2つのインスタンス化は、異なる手法の利点を活用するために検討されている。
6つのデータセットと3つのGNNの様々なノイズシナリオによる実験は、我々のRGIBインスタンスの有効性を検証する。
論文 参考訳(メタデータ) (2023-11-02T12:47:49Z) - Neural Acoustic Context Field: Rendering Realistic Room Impulse Response
With Neural Fields [61.07542274267568]
このレターでは、音声シーンをパラメータ化するためのNACFと呼ばれる新しいニューラルネットワークコンテキストフィールドアプローチを提案する。
RIRのユニークな性質により、時間相関モジュールとマルチスケールエネルギー崩壊基準を設計する。
実験の結果,NACFは既存のフィールドベース手法よりも顕著なマージンで優れていた。
論文 参考訳(メタデータ) (2023-09-27T19:50:50Z) - Self-Supervised Visual Acoustic Matching [63.492168778869726]
音響マッチングは、ターゲットの音響環境に録音されたかのように、音声クリップを再合成することを目的としている。
そこで本研究では,対象のシーン画像と音声のみを含む,視覚的音響マッチングのための自己教師型アプローチを提案する。
提案手法は,条件付きGANフレームワークと新しいメトリクスを用いて,室内音響をアンタングル化し,音をターゲット環境に再合成する方法を共同で学習する。
論文 参考訳(メタデータ) (2023-07-27T17:59:59Z) - Exploring the Noise Resilience of Successor Features and Predecessor
Features Algorithms in One and Two-Dimensional Environments [0.0]
本研究は,雑音環境下での逐次的特徴(SF)と先行的特徴(PF)アルゴリズムのダイナミクスを考察する。
SFは優れた適応性を示し、様々な騒音レベルにわたって堅牢な性能を維持した。
本研究は、計算神経科学と強化学習の橋渡し談話に寄与する。
論文 参考訳(メタデータ) (2023-04-14T02:06:22Z) - Improve Noise Tolerance of Robust Loss via Noise-Awareness [60.34670515595074]
本稿では,NARL-Adjuster(NARL-Adjuster for brevity)と呼ばれる,ハイパーパラメータ予測関数を適応的に学習するメタラーニング手法を提案する。
4つのSOTAロバストな損失関数を我々のアルゴリズムに統合し,提案手法の一般性および性能をノイズ耐性と性能の両面で検証した。
論文 参考訳(メタデータ) (2023-01-18T04:54:58Z) - Urban Rhapsody: Large-scale exploration of urban soundscapes [12.997538969557649]
騒音は都市環境の主要な品質問題の一つである。
環境騒音レベルを高時間分解能で監視するために、低コストのセンサーを配置することができる。
それらが生成するデータの量とデータの複雑さは、重要な分析上の課題を生じさせる。
本稿では,最先端の音声表現,機械学習,視覚分析を組み合わせたフレームワークであるUrban Rhapsodyを提案する。
論文 参考訳(メタデータ) (2022-05-25T22:02:36Z) - Using deep learning to understand and mitigate the qubit noise
environment [0.0]
本稿では,量子ビット上の時間力学測定から正確な雑音スペクトルを抽出する手法を提案する。
任意の浴槽に囲まれた任意のキュービットに付随する雑音スペクトルを抽出するニューラルネットワークに基づく手法を実証する。
この結果は、様々なキュービットプラットフォームに適用でき、キュービット性能を改善するためのフレームワークを提供する。
論文 参考訳(メタデータ) (2020-05-03T17:13:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。