論文の概要: SR2CNN: Zero-Shot Learning for Signal Recognition
- arxiv url: http://arxiv.org/abs/2004.04892v7
- Date: Wed, 7 Apr 2021 06:55:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 21:20:57.419516
- Title: SR2CNN: Zero-Shot Learning for Signal Recognition
- Title(参考訳): SR2CNN:信号認識のためのゼロショット学習
- Authors: Yihong Dong, Xiaohan Jiang, Huaji Zhou, Yun Lin and Qingjiang Shi
- Abstract要約: 本稿では,信号認識・再構成畳み込みニューラルネットワーク(SR2CNN)のZSLフレームワークを提案する。
提案したSR2CNNは、ある信号クラスにトレーニングデータがない場合でも、信号を識別することができる。
- 参考スコア(独自算出の注目度): 12.859965438791676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Signal recognition is one of significant and challenging tasks in the signal
processing and communications field. It is often a common situation that
there's no training data accessible for some signal classes to perform a
recognition task. Hence, as widely-used in image processing field, zero-shot
learning (ZSL) is also very important for signal recognition. Unfortunately,
ZSL regarding this field has hardly been studied due to inexplicable signal
semantics. This paper proposes a ZSL framework, signal recognition and
reconstruction convolutional neural networks (SR2CNN), to address relevant
problems in this situation. The key idea behind SR2CNN is to learn the
representation of signal semantic feature space by introducing a proper
combination of cross entropy loss, center loss and autoencoder loss, as well as
adopting a suitable distance metric space such that semantic features have
greater minimal inter-class distance than maximal intra-class distance. The
proposed SR2CNN can discriminate signals even if no training data is available
for some signal class. Moreover, SR2CNN can gradually improve itself in the aid
of signal detection, because of constantly refined class center vectors in
semantic feature space. These merits are all verified by extensive experiments.
- Abstract(参考訳): 信号認識は信号処理と通信分野において重要かつ困難なタスクの1つである。
一部の信号クラスが認識タスクを実行するためにアクセス可能なトレーニングデータがないのは、よくある状況です。
したがって、画像処理分野で広く使われているように、ゼロショット学習(ZSL)も信号認識において非常に重要である。
残念ながら、この分野に関するZSLの研究はほとんど行われていない。
本稿では,zslフレームワークであるsr2cnn(signal recognition and reconstruction convolutional neural networks)を提案する。
sr2cnnの背後にある重要なアイデアは、クロスエントロピー損失、センター損失、オートエンコーダ損失の適切な組み合わせを導入し、また、セマンティクス特徴が最大クラス間距離よりもクラス間距離が小さいような適切な距離距離距離空間を導入することで、信号意味論的特徴空間の表現を学ぶことである。
提案したSR2CNNは、ある信号クラスにトレーニングデータがない場合でも、信号を識別することができる。
さらに、SR2CNNは、意味的特徴空間における常に洗練されたクラス中心ベクトルのため、信号検出の支援により徐々に改善することができる。
これらのメリットはすべて、広範な実験によって検証される。
関連論文リスト
- Fill in the Gap! Combining Self-supervised Representation Learning with Neural Audio Synthesis for Speech Inpainting [14.402357651227003]
本稿では,音声信号の欠落部分を周囲の文脈から再構成する音声認識用SSLモデルについて検討する。
その目的のために、SSLエンコーダ、すなわち HuBERT とニューラルヴォコーダ、すなわち HiFiGAN を組み合わせてデコーダの役割を演じる。
論文 参考訳(メタデータ) (2024-05-30T14:41:39Z) - Transportation mode recognition based on low-rate acceleration and location signals with an attention-based multiple-instance learning network [4.864246405617091]
交通モード認識(TMR)はヒト活動認識(HAR)の重要な構成要素である
そこで本研究では,2種類の信号を有効かつロバストな分類器に組み合わせる手法を提案する。
両信号のサンプリングレートが非常に低いので, 電池消費を抑えることができる。
論文 参考訳(メタデータ) (2024-04-05T11:49:48Z) - SigFormer: Sparse Signal-Guided Transformer for Multi-Modal Human Action Segmentation [34.176963661707696]
信号誘導変換器(SigFormer)を導入し,高密度信号とスパース信号を組み合わせた。
スパース信号は離散的であるため、時間的作用境界に関する十分な情報がない。
SigFormerは、実産業環境からのマルチモーダルアクションセグメンテーションデータセットにおける最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2023-11-29T08:09:01Z) - Dual input neural networks for positional sound source localization [19.07039703121673]
本稿では、これらの2つのデータ型をニューラルネットワークでモデル化するための、単純かつ効果的な方法として、Dual Input Neural Networks(DI-NN)を紹介する。
難易度と現実性の異なるシナリオに基づいて提案したDI-NNをトレーニングし、評価し、代替アーキテクチャと比較する。
以上の結果から,DI-NNはLS法よりも5倍,CRNNより2倍低い位置推定誤差を達成できることがわかった。
論文 参考訳(メタデータ) (2023-08-08T09:59:56Z) - Multi-task Learning for Radar Signal Characterisation [48.265859815346985]
本稿では,マルチタスク学習(MTL)問題として,レーダ信号の分類と特徴化に取り組むためのアプローチを提案する。
本稿では,複数のレグレッションタスクと分類タスクを同時最適化するIQST(IQ Signal Transformer)を提案する。
合成レーダデータセット上で提案したMTLモデルの性能を示すとともに,レーダ信号の特徴付けのための一級ベンチマークも提供する。
論文 参考訳(メタデータ) (2023-06-19T12:01:28Z) - Neural Implicit Dictionary via Mixture-of-Expert Training [111.08941206369508]
ニューラルインシシット辞書(NID)を学習することで、データとトレーニング効率の両方を達成する汎用INRフレームワークを提案する。
我々のNIDは、所望の関数空間にまたがるように調整された座標ベースのImpworksのグループを組み立てる。
実験の結果,NIDは最大98%の入力データで2次元画像や3次元シーンの再現を2桁高速化できることがわかった。
論文 参考訳(メタデータ) (2022-07-08T05:07:19Z) - Meta-Learning Sparse Implicit Neural Representations [69.15490627853629]
入射神経表現は、一般的な信号を表す新しい道である。
現在のアプローチは、多数の信号やデータセットに対してスケールすることが難しい。
メタ学習型スパースニューラル表現は,高密度メタ学習モデルよりもはるかに少ない損失が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T18:02:53Z) - Sign Language Recognition via Skeleton-Aware Multi-Model Ensemble [71.97020373520922]
手話は一般的に、聴覚障害者やミュート人がコミュニケーションするために使われる。
孤立手話認識(SLR)のためのGlobal Ensemble Model(GEM)を用いた新しいマルチモーダルフレームワークを提案する。
提案するSAM-SLR-v2 フレームワークは極めて有効であり,最先端の性能を高いマージンで達成している。
論文 参考訳(メタデータ) (2021-10-12T16:57:18Z) - Multi-Modal Zero-Shot Sign Language Recognition [51.07720650677784]
マルチモーダルなゼロショット手話認識モデルを提案する。
C3DモデルとともにTransformerベースのモデルを使用して手の検出と深い特徴抽出を行う。
意味空間は、視覚的特徴をクラスラベルの言語的な埋め込みにマッピングするために使用される。
論文 参考訳(メタデータ) (2021-09-02T09:10:39Z) - Signal Transformer: Complex-valued Attention and Meta-Learning for
Signal Recognition [33.178794056273304]
本稿では,理論収束保証を伴う一般の非評価問題に対して,CAMEL(complex-valued Attentional MEta Learner)を提案する。
本報告では, 状態が小さい場合に, 提案したデータ認識実験の優位性を示す。
論文 参考訳(メタデータ) (2021-06-05T03:57:41Z) - A Compressive Sensing Approach for Federated Learning over Massive MIMO
Communication Systems [82.2513703281725]
フェデレートラーニング(Federated Learning)は、無線デバイスとのコラボレーションによって、中央サーバでグローバルモデルをトレーニングするための、プライバシ保護のアプローチである。
本稿では,大規模マルチインプット多出力通信システム上でのフェデレーション学習のための圧縮センシング手法を提案する。
論文 参考訳(メタデータ) (2020-03-18T05:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。