論文の概要: Single-Channel Distance-Based Source Separation for Mobile GPU in Outdoor and Indoor Environments
- arxiv url: http://arxiv.org/abs/2501.03045v1
- Date: Mon, 06 Jan 2025 14:32:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:06:22.853514
- Title: Single-Channel Distance-Based Source Separation for Mobile GPU in Outdoor and Indoor Environments
- Title(参考訳): 屋外および屋内環境におけるモバイルGPUの単一チャネル距離に基づく音源分離
- Authors: Hanbin Bae, Byungjun Kang, Jiwon Kim, Jaeyong Hwang, Hosang Sung, Hoon-Young Cho,
- Abstract要約: 本研究では,屋外環境における距離ベースソース分離(DSS)の意義を強調する。
室内環境に着目した既存の研究とは異なり、提案モデルは屋外音源の特徴を捉えるように設計されている。
- 参考スコア(独自算出の注目度): 14.322119563398445
- License:
- Abstract: This study emphasizes the significance of exploring distance-based source separation (DSS) in outdoor environments. Unlike existing studies that primarily focus on indoor settings, the proposed model is designed to capture the unique characteristics of outdoor audio sources. It incorporates advanced techniques, including a two-stage conformer block, a linear relation-aware self-attention (RSA), and a TensorFlow Lite GPU delegate. While the linear RSA may not capture physical cues as explicitly as the quadratic RSA, the linear RSA enhances the model's context awareness, leading to improved performance on the DSS that requires an understanding of physical cues in outdoor and indoor environments. The experimental results demonstrated that the proposed model overcomes the limitations of existing approaches and considerably enhances energy efficiency and real-time inference speed on mobile devices.
- Abstract(参考訳): 本研究では,屋外環境における距離ベースソース分離(DSS)の意義を強調する。
室内環境に着目した既存の研究とは異なり、提案モデルは屋外音源の特徴を捉えるように設計されている。
2段コンフォーマーブロック、線形関係認識自己アテンション(RSA)、TensorFlow Lite GPUデリゲートなど、高度な技術が組み込まれている。
線形RSAは二次RSAのように物理的手がかりを明示的に捉えないかもしれないが、線形RSAはモデルのコンテキスト認識を高め、屋外および屋内環境における物理的手がかりの理解を必要とするDSSの性能を向上させる。
実験により,提案モデルが既存手法の限界を克服し,モバイルデバイス上でのエネルギー効率とリアルタイム推論速度を大幅に向上することを示した。
関連論文リスト
- Performance evaluation of SLAM-ASR: The Good, the Bad, the Ugly, and the Way Forward [10.914414815406275]
近年,音声基盤エンコーダと大規模言語モデル(LLM)の線形接続を訓練することで,このアーキテクチャが強力なASR機能を実現することが実証されている。
印象的な結果にもかかわらず、これらの単純なアプローチが様々なシナリオや発話条件で十分に堅牢であるかどうかは不明だ。
本稿では,SLAM-ASRアーキテクチャを多種多様な設定で効果的に活用する方法について考察した。
論文 参考訳(メタデータ) (2024-11-06T12:22:04Z) - Outdoor Environment Reconstruction with Deep Learning on Radio
Propagation Paths [5.030571576007511]
本稿では,屋外環境再建のための環境無線信号を利用した新しいアプローチを提案する。
無線周波数(RF)データを解析することにより,環境特性を推定し,屋外環境をデジタル的に再構築することを目的とする。
2つのDL駆動アプローチが評価され、交差対ユニオン(IoU)、ハウスドルフ距離、シャンファー距離などの指標を用いて性能が評価される。
論文 参考訳(メタデータ) (2024-02-27T09:11:10Z) - Physical-Layer Semantic-Aware Network for Zero-Shot Wireless Sensing [74.12670841657038]
デバイスレスワイヤレスセンシングは、幅広い没入型人間機械対話型アプリケーションをサポートする可能性から、近年、大きな関心を集めている。
無線信号におけるデータの均一性と分散センシングにおけるデータプライバシ規制は、広域ネットワークシステムにおける無線センシングの広範な適用を妨げる主要な課題であると考えられている。
そこで本研究では,ラベル付きデータを使わずに,一箇所ないし限られた箇所で構築されたモデルを直接他の場所に転送できるゼロショット無線センシングソリューションを提案する。
論文 参考訳(メタデータ) (2023-12-08T13:50:30Z) - Neural Acoustic Context Field: Rendering Realistic Room Impulse Response
With Neural Fields [61.07542274267568]
このレターでは、音声シーンをパラメータ化するためのNACFと呼ばれる新しいニューラルネットワークコンテキストフィールドアプローチを提案する。
RIRのユニークな性質により、時間相関モジュールとマルチスケールエネルギー崩壊基準を設計する。
実験の結果,NACFは既存のフィールドベース手法よりも顕著なマージンで優れていた。
論文 参考訳(メタデータ) (2023-09-27T19:50:50Z) - Machine Learning-based Positioning using Multivariate Time Series
Classification for Factory Environments [0.0]
最先端のソリューションは外部インフラストラクチャに大きく依存しており、潜在的なプライバシー侵害にさらされている。
機械学習(ML)の最近の進歩は、IoTデバイスのオンボードセンサーのデータのみに依存する、これらの制限に対処するソリューションを提供する。
本稿では,移動体をプライバシ関連工場環境に局在させるため,モーションセンサと環境センサを用いた機械学習による屋内位置決めシステムを提案する。
論文 参考訳(メタデータ) (2023-08-22T10:07:19Z) - Efficient Real-time Smoke Filtration with 3D LiDAR for Search and Rescue
with Autonomous Heterogeneous Robotic Systems [56.838297900091426]
スモークとダストは、搭載された知覚システムに依存するため、あらゆる移動ロボットプラットフォームの性能に影響を与える。
本稿では,重みと空間情報に基づく新しいモジュラー計算フィルタを提案する。
論文 参考訳(メタデータ) (2023-08-14T16:48:57Z) - Digital Twin-Enhanced Wireless Indoor Navigation: Achieving Efficient Environment Sensing with Zero-Shot Reinforcement Learning [21.79206567364126]
ミリ波通信は将来のモバイルネットワークにおいて重要な要素であり、複雑な環境での屋内ナビゲーションに最適である。
従来の物理学に基づく手法、例えば到着角(AoA)は複雑なシナリオでは不足することが多い。
本稿では,デジタル双生児が提供する身体的洞察を利用して,強化学習(RL)報酬関数を形作る物理情報強化学習(PIRL)手法を提案する。
論文 参考訳(メタデータ) (2023-06-11T20:33:22Z) - Algorithmic Hallucinations of Near-Surface Winds: Statistical
Downscaling with Generative Adversarial Networks to Convection-Permitting
Scales [0.0]
我々は、畳み込みニューラルネットワークに基づくジェネレーティブ・アドバイサル・ネットワーク(GAN)に焦点を当てる。
気象調査と予測モデルシミュレーションを模擬した高分解能(HR)表面風を生成するために,我々は低分解能(LR)入力にGANを条件付けている。
本研究は、コンピュータビジョン分野からの新しい周波数分離(FS)アプローチを実験することにより、現在のSRに基づく統計的ダウンスケーリングに基づいている。
論文 参考訳(メタデータ) (2023-02-17T06:29:12Z) - Exploiting Temporal Structures of Cyclostationary Signals for
Data-Driven Single-Channel Source Separation [98.95383921866096]
単一チャネルソース分離(SCSS)の問題点について検討する。
我々は、様々なアプリケーション領域に特に適するサイクロ定常信号に焦点を当てる。
本稿では,最小MSE推定器と競合するU-Netアーキテクチャを用いたディープラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T14:04:56Z) - Disentangled Representation Learning for RF Fingerprint Extraction under
Unknown Channel Statistics [77.13542705329328]
本稿では,まず,不整合表現学習(DRL)の枠組みを提案し,入力信号を逆学習によりデバイス関連成分とデバイス関連成分に分解する。
提案フレームワークにおける暗黙的なデータ拡張は、デバイス非関連チャネル統計の過度な適合を避けるために、RFF抽出器に正規化を課す。
実験により、DR-RFFと呼ばれる提案手法は、未知の複雑な伝播環境に対する一般化可能性の観点から従来の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-08-04T15:46:48Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。