論文の概要: Channel-wise Gated Res2Net: Towards Robust Detection of Synthetic Speech
Attacks
- arxiv url: http://arxiv.org/abs/2107.08803v1
- Date: Mon, 19 Jul 2021 12:27:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-20 14:42:44.527555
- Title: Channel-wise Gated Res2Net: Towards Robust Detection of Synthetic Speech
Attacks
- Title(参考訳): チャネルワイドGated Res2Net:合成音声攻撃のロバスト検出に向けて
- Authors: Xu Li, Xixin Wu, Hui Lu, Xunying Liu, Helen Meng
- Abstract要約: 自動話者検証(ASV)における既存のアンチスプーフィングのアプローチは、未確認攻撃に対する一般化性に欠ける。
本稿では,チャネルワイズゲーティング機構を実現するためにRes2Netを改良した新しいCG-Res2Netを提案する。
- 参考スコア(独自算出の注目度): 67.7648985513978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing approaches for anti-spoofing in automatic speaker verification (ASV)
still lack generalizability to unseen attacks. The Res2Net approach designs a
residual-like connection between feature groups within one block, which
increases the possible receptive fields and improves the system's detection
generalizability. However, such a residual-like connection is performed by a
direct addition between feature groups without channel-wise priority. We argue
that the information across channels may not contribute to spoofing cues
equally, and the less relevant channels are expected to be suppressed before
adding onto the next feature group, so that the system can generalize better to
unseen attacks. This argument motivates the current work that presents a novel,
channel-wise gated Res2Net (CG-Res2Net), which modifies Res2Net to enable a
channel-wise gating mechanism in the connection between feature groups. This
gating mechanism dynamically selects channel-wise features based on the input,
to suppress the less relevant channels and enhance the detection
generalizability. Three gating mechanisms with different structures are
proposed and integrated into Res2Net. Experimental results conducted on
ASVspoof 2019 logical access (LA) demonstrate that the proposed CG-Res2Net
significantly outperforms Res2Net on both the overall LA evaluation set and
individual difficult unseen attacks, which also outperforms other
state-of-the-art single systems, depicting the effectiveness of our method.
- Abstract(参考訳): 自動話者検証(ASV)における既存のアンチスプーフィングのアプローチは、未確認攻撃に対する一般化性に欠ける。
Res2Netアプローチは、1ブロック内の特徴群間の残差のような接続を設計する。
しかし、そのような残差のような接続は、チャネルワイド優先のない特徴群間の直接追加によって実行される。
本論では,チャネル間の情報交換はスプーフィングキューに等しく寄与しない可能性があり,また,次の機能グループに付加する前に,関連性の低いチャネルを抑えることが期待できる。
この議論は、res2netを修飾し、特徴群間の接続においてチャネルワイズゲーティング機構を有効にする新しいチャネルワイズゲート型res2net(cg-res2net)を提示する現在の仕事の動機付けとなる。
このゲーティング機構は、入力に基づいてチャネルワイズ特徴を動的に選択し、少ないチャネルを抑え、検出一般化性を高める。
異なる構造を持つ3つのゲーティング機構が提案され、Res2Netに統合される。
asvspoof 2019 logical access (la) で行った実験の結果,提案するcg-res2netは,la評価セット全体のres2netと,他の最先端シングルシステムよりも優れており,本手法の有効性を示す。
関連論文リスト
- Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - Searching for Network Width with Bilaterally Coupled Network [75.43658047510334]
この問題に対処するため、BCNet(Bilaterally Coupled Network)と呼ばれる新しいスーパーネットを導入する。
BCNetでは、各チャネルは高度に訓練され、同じ量のネットワーク幅を担っているため、ネットワーク幅をより正確に評価することができる。
本稿では,Channel-Bench-Macroというマクロ構造に対するオープンソースのワイド・ベンチマークを提案し,ワイド・サーチ・アルゴリズムの比較を行った。
論文 参考訳(メタデータ) (2022-03-25T15:32:46Z) - PWG-IDS: An Intrusion Detection Model for Solving Class Imbalance in
IIoT Networks Using Generative Adversarial Networks [13.552023164115138]
本稿では,WWG-IDS(PWG-IDS)の予測手法を提案する。
We use LightGBM as the classification algorithm to detect attack traffic in IIoT network。
提案したPWG-IDSは、F1スコアが99%、F1スコアが89%の他のモデルよりも優れている。
論文 参考訳(メタデータ) (2021-10-06T02:34:50Z) - Group Fisher Pruning for Practical Network Compression [58.25776612812883]
本稿では,様々な複雑な構造に応用可能な汎用チャネルプルーニング手法を提案する。
我々は、単一チャネルと結合チャネルの重要性を評価するために、フィッシャー情報に基づく統一されたメトリクスを導出する。
提案手法は,結合チャネルを含む任意の構造をプルークするために利用できる。
論文 参考訳(メタデータ) (2021-08-02T08:21:44Z) - Deep Learning Based RIS Channel Extrapolation with Element-grouping [61.18715079535163]
我々は、受動的なRIS要素の膨大な数のために困難なタスクであるカスケードチャンネルの取得を検討します。
一つのグループの各要素が同じ反射係数を共有し、同じチャネル条件を持つと仮定した要素グループ化戦略を採用する。
要素グループ戦略によるチャネル干渉を分析し、2つのディープラーニングベースのネットワークをさらに設計します。
論文 参考訳(メタデータ) (2021-05-14T14:24:54Z) - Efficient Two-Stream Network for Violence Detection Using Separable
Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。
SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。
我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文 参考訳(メタデータ) (2021-02-21T12:01:48Z) - PRVNet: A Novel Partially-Regularized Variational Autoencoders for
Massive MIMO CSI Feedback [15.972209500908642]
ユーザ装置(UE)は、多重出力多重出力周波数分割二重化(MIMO-FDD)システムにおいて、ダウンリンクチャネル状態情報(CSI)を基地局に送信し、リンク状況を報告する。
本稿では,変分オートエンコーダ(VAE)にインスパイアされたニューラルネットワークアーキテクチャであるPRVNetを紹介し,基地局に送信する前にCSI行列を圧縮する。
論文 参考訳(メタデータ) (2020-11-09T04:07:45Z) - Replay and Synthetic Speech Detection with Res2net Architecture [85.20912636149552]
既存のリプレイと合成音声検出のアプローチは、スプーフィング攻撃に対する一般化性に欠けていた。
本研究では、Res2Netと呼ばれる新しいモデル構造を活用して、アンチスプーフィング対策の一般化性を改善することを提案する。
論文 参考訳(メタデータ) (2020-10-28T14:33:42Z) - Cascade Network with Guided Loss and Hybrid Attention for Two-view
Geometry [32.52184271700281]
本稿では,損失とFn値の直接負の相関関係を確立するためのガイド付き損失を提案する。
次に,特徴抽出のためのハイブリットアテンションブロックを提案する。
実験により,我々のネットワークは,ベンチマークデータセットの最先端性能を達成することが示された。
論文 参考訳(メタデータ) (2020-07-11T07:44:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。