論文の概要: Formal Verification of Long Short-Term Memory based Audio Classifiers: A
Star based Approach
- arxiv url: http://arxiv.org/abs/2311.12130v1
- Date: Thu, 16 Nov 2023 11:04:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 00:35:17.597381
- Title: Formal Verification of Long Short-Term Memory based Audio Classifiers: A
Star based Approach
- Title(参考訳): 長期短期記憶型音声分類器の形式的検証:スターベースアプローチ
- Authors: Neelanjana Pal (Institute for Software Integrated Systems, Vanderbilt
University,), Taylor T Johnson (Institute for Software Integrated Systems,
Vanderbilt University)
- Abstract要約: 本論文は,実世界の文脈におけるシーケンス音声分類分析の検証と検証を行う包括的ケーススタディとして機能する。
これは、特にノイズが出力分類の精度に与える影響を考慮して、正確で信頼性の高い予測を保証するための検証の必要性を強調させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Formally verifying audio classification systems is essential to ensure
accurate signal classification across real-world applications like
surveillance, automotive voice commands, and multimedia content management,
preventing potential errors with serious consequences. Drawing from recent
research, this study advances the utilization of star-set-based formal
verification, extended through reachability analysis, tailored explicitly for
Long Short-Term Memory architectures and their Convolutional variations within
the audio classification domain. By conceptualizing the classification process
as a sequence of set operations, the star set-based reachability approach
streamlines the exploration of potential operational states attainable by the
system. The paper serves as an encompassing case study, validating and
verifying sequence audio classification analytics within real-world contexts.
It accentuates the necessity for robustness verification to ensure precise and
dependable predictions, particularly in light of the impact of noise on the
accuracy of output classifications.
- Abstract(参考訳): 音声分類システムの形式的検証は、監視、自動車音声コマンド、マルチメディアコンテンツ管理といった現実世界のアプリケーション間での正確な信号分類を保証するために不可欠であり、重大な結果を招く可能性のあるエラーを防ぐ。
近年の研究では,Long Short-Term Memory アーキテクチャと音声分類領域における畳み込み変化に特化して,リーチビリティ解析を通じて拡張された星集合に基づく形式検証の利用を推し進めている。
分類過程を一連の集合演算として概念化することにより、星の集合に基づく到達可能性アプローチは、システムによって達成可能な潜在的操作状態の探索を合理化する。
本論文は、実世界の文脈におけるシーケンス音声分類分析の検証と検証を含むケーススタディとして機能する。
これは、特にノイズが出力分類の精度に与える影響を考慮して、正確で信頼できる予測を保証するための堅牢性検証の必要性を強調する。
関連論文リスト
- Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models [52.04189118767758]
一般化は、現在のオーディオディープフェイク検出器の主な問題である。
本稿では,オーディオディープフェイク検出のための大規模事前学習モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-05-03T15:27:11Z) - Audio Anti-Spoofing Detection: A Survey [7.3348524333159]
ディープラーニングは、Deepfakeとして知られるマルチメディアフェイクコンテンツを操作または作成できる洗練されたアルゴリズムを生み出した。
防汚対策の開発を促進するため, 防汚対策の音響的課題が編成されている。
本稿では,アルゴリズムアーキテクチャ,最適化手法,アプリケーション一般化性,評価指標,パフォーマンス比較,利用可能なデータセット,オープンソース可用性など,検出パイプライン内のすべてのコンポーネントについて,包括的なレビューを行う。
論文 参考訳(メタデータ) (2024-04-22T06:52:12Z) - Adaptive Fake Audio Detection with Low-Rank Model Squeezing [50.7916414913962]
ファインタニングのような従来の手法は計算集約的であり、既知の偽音声タイプの知識を損なう危険性がある。
本稿では,新たに登場したニセモノ音声タイプに特化して,低ランク適応行列をトレーニングするコンセプトを紹介する。
当社のアプローチには,ストレージメモリ要件の削減やエラー率の低下など,いくつかのメリットがあります。
論文 参考訳(メタデータ) (2023-06-08T06:06:42Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Investigation of Different Calibration Methods for Deep Speaker
Embedding based Verification Systems [66.61691401921296]
本稿では, ディープスピーカ埋込抽出器のスコアキャリブレーション法について検討する。
この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
論文 参考訳(メタデータ) (2022-03-28T21:22:22Z) - Open-set Short Utterance Forensic Speaker Verification using
Teacher-Student Network with Explicit Inductive Bias [59.788358876316295]
そこで本研究では,小規模の法定フィールドデータセット上での話者検証を改善するためのパイプラインソリューションを提案する。
大規模領域外データセットを活用することで,教師学習のための知識蒸留に基づく目的関数を提案する。
提案する目的関数は,短時間の発話における教師学生の学習性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2020-09-21T00:58:40Z) - Meta Transition Adaptation for Robust Deep Learning with Noisy Labels [61.8970957519509]
本研究では,新しいメタ遷移学習戦略を提案する。
具体的には、クリーンなラベル付きメタデータの小さなセットのサウンドガイダンスにより、ノイズ遷移行列と分類器パラメータを相互に改善することができる。
本手法は, 従来技術よりも頑健な性能で, 遷移行列をより正確に抽出することができる。
論文 参考訳(メタデータ) (2020-06-10T07:27:25Z) - Exploration of Audio Quality Assessment and Anomaly Localisation Using
Attention Models [37.60722440434528]
本稿では,双方向長期記憶とアテンション機構を併用し,音質評価のための新しいモデルを提案する。
前者は、録音から情報を学ぶ人間の聴覚知覚能力を模倣することであり、後者は、対象の特徴を強調することによって、所望の信号から干渉を更に識別することである。
提案手法を評価するため,様々な自然音を混合してTIMITデータセットを用いて拡張する。
論文 参考訳(メタデータ) (2020-05-16T17:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。