論文の概要: A Temporal-oriented Broadcast ResNet for COVID-19 Detection
- arxiv url: http://arxiv.org/abs/2203.17012v1
- Date: Thu, 31 Mar 2022 13:11:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-01 23:25:34.080093
- Title: A Temporal-oriented Broadcast ResNet for COVID-19 Detection
- Title(参考訳): COVID-19検出のための時間指向放送ResNet
- Authors: Xin Jing, Shuo Liu, Emilia Parada-Cabaleiro, Andreas
Triantafyllopoulos, Meishu Song, Zijiang Yang, Bj\"orn W. Schuller
- Abstract要約: モデルサイズを小さくして効率的な計算と高精度を実現するための時間指向放送残差学習手法を提案する。
The EfficientNet architecture, our novel network, named Temporal-oriented ResNet(TorNet)は,放送学習ブロックを構成する。
ABブロックにより、ネットワークは、リカレントニューラルネットワーク(RNN)よりもはるかに少ない計算で有用な音声時間的特徴と高レベルの埋め込みを効果的に得る。
- 参考スコア(独自算出の注目度): 11.306011762214272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting COVID-19 from audio signals, such as breathing and coughing, can be
used as a fast and efficient pre-testing method to reduce the virus
transmission. Due to the promising results of deep learning networks in
modelling time sequences, and since applications to rapidly identify COVID
in-the-wild should require low computational effort, we present a
temporal-oriented broadcasting residual learning method that achieves efficient
computation and high accuracy with a small model size. Based on the
EfficientNet architecture, our novel network, named Temporal-oriented
ResNet~(TorNet), constitutes of a broadcasting learning block, i.e. the
Alternating Broadcast (AB) Block, which contains several Broadcast Residual
Blocks (BC ResBlocks) and a convolution layer. With the AB Block, the network
obtains useful audio-temporal features and higher level embeddings effectively
with much less computation than Recurrent Neural Networks~(RNNs), typically
used to model temporal information. TorNet achieves 72.2% Unweighted Average
Recall (UAR) on the INTERPSEECH 2021 Computational Paralinguistics Challenge
COVID-19 cough Sub-Challenge, by this showing competitive results with a higher
computational efficiency than other state-of-the-art alternatives.
- Abstract(参考訳): 呼吸やせきなどの音声信号からcovid-19を検出することは、ウイルスの感染を減らすための迅速かつ効率的な事前検査方法として使用できる。
時間系列のモデリングにおけるディープラーニングネットワークの有望な結果と、急速に新型コロナウイルスの感染を識別するためのアプリケーションは、計算量が少なくなければならないため、モデルサイズを小さくして効率的な計算と高精度を実現する、時間指向のブロードキャスト残差学習手法を提案する。
The EfficientNet architecture, our novel network, called Temporal-oriented ResNet~(TorNet) consists of a broadcast learning block, which is the Alternating Broadcast (AB) Block which includes several Broadcast Residual Blocks (BC ResBlocks) and a convolution layer。
ABブロックでは、一般的に時間情報をモデル化するために使用されるリカレントニューラルネットワーク~(RNN)よりもはるかに少ない計算で、有用な音声時間的特徴と高レベルの埋め込みが得られる。
TorNetは、InterPSEECH 2021 Computational Paralinguistics Challenge COVID-19 cough Sub-Challengeで72.2%のUnweighted Average Recall(UAR)を達成した。
関連論文リスト
- Cascaded Temporal Updating Network for Efficient Video Super-Resolution [47.63267159007611]
リカレントベースのVSRネットワークにおけるキーコンポーネントはモデル効率に大きな影響を及ぼす。
本稿では,効率的なVSRのための時空間更新ネットワーク(CTUN)を提案する。
CTUNは,従来の方法に比べて効率と性能のトレードオフが良好である。
論文 参考訳(メタデータ) (2024-08-26T12:59:32Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Multi-Loss Convolutional Network with Time-Frequency Attention for
Speech Enhancement [16.701596804113553]
我々はDPCRNモジュールにおける自己注意を探求し、音声強調のためのMNTFA(Multi-Loss Convolutional Network with Time-Frequency Attention)と呼ばれるモデルの設計を行う。
DPRNNと比較して、軸方向の自己アテンションはメモリと計算の必要性を大幅に減らす。
本稿では,WavLMネットワークを用いた多分解能STFT損失とWavLM損失のジョイントトレーニング手法を提案する。
論文 参考訳(メタデータ) (2023-06-15T08:48:19Z) - Properties and Potential Applications of Random Functional-Linked Types
of Neural Networks [81.56822938033119]
ランダム関数リンクニューラルネットワーク(RFLNN)は、深い構造を学習する別の方法を提供する。
本稿では周波数領域の観点からRFLNNの特性について考察する。
本稿では,より優れた性能でBLSネットワークを生成する手法を提案し,ポゾン方程式を解くための効率的なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-04-03T13:25:22Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Deep Learning-Based Synchronization for Uplink NB-IoT [72.86843435313048]
狭帯域モノのインターネット(NB-IoT)における狭帯域物理ランダムアクセスチャネル(NPRACH)のデバイス検出と到着時刻推定のためのニューラルネットワーク(NN)に基づくアルゴリズムを提案する。
導入されたNNアーキテクチャは、残余の畳み込みネットワークと、5Gニューラジオ(5G NR)仕様のプリアンブル構造に関する知識を利用する。
論文 参考訳(メタデータ) (2022-05-22T12:16:43Z) - Oscillatory Fourier Neural Network: A Compact and Efficient Architecture
for Sequential Processing [16.69710555668727]
本稿では,コサイン活性化と時系列処理のための時間変化成分を有する新しいニューロンモデルを提案する。
提案したニューロンは、スペクトル領域に逐次入力を投影するための効率的なビルディングブロックを提供する。
IMDBデータセットの感情分析に提案されたモデルを適用すると、5時間以内のテスト精度は89.4%に達する。
論文 参考訳(メタデータ) (2021-09-14T19:08:07Z) - Broadcasted Residual Learning for Efficient Keyword Spotting [7.335747584353902]
モデルサイズと計算負荷を小さくして高精度な放送残差学習手法を提案する。
また,放送残差学習に基づく新しいネットワークアーキテクチャ,BC-Residual Network(BC-ResNet)を提案する。
BC-ResNetsは、Googleの音声コマンドデータセット v1 と v2 で、最先端の98.0% と98.7% のトップ-1 の精度をそれぞれ達成している。
論文 参考訳(メタデータ) (2021-06-08T06:55:39Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z) - Effect of Architectures and Training Methods on the Performance of
Learned Video Frame Prediction [10.404162481860634]
実験結果から,残差FCNNアーキテクチャは高いトレーニングとテスト(推論)計算の複雑さを犠牲にして,ピーク信号対雑音比(PSNR)の点で最善であることがわかった。
CRNNは、時間的手続きを通じて、ステートフルなトランケートされたバックプロパゲーションを使用して、安定かつ非常に効率的に訓練することができる。
論文 参考訳(メタデータ) (2020-08-13T20:45:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。