論文の概要: Formal Verification of Long Short-Term Memory based Audio Classifiers: A
Star based Approach
- arxiv url: http://arxiv.org/abs/2311.12130v1
- Date: Thu, 16 Nov 2023 11:04:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 00:35:17.597381
- Title: Formal Verification of Long Short-Term Memory based Audio Classifiers: A
Star based Approach
- Title(参考訳): 長期短期記憶型音声分類器の形式的検証:スターベースアプローチ
- Authors: Neelanjana Pal (Institute for Software Integrated Systems, Vanderbilt
University,), Taylor T Johnson (Institute for Software Integrated Systems,
Vanderbilt University)
- Abstract要約: 本論文は,実世界の文脈におけるシーケンス音声分類分析の検証と検証を行う包括的ケーススタディとして機能する。
これは、特にノイズが出力分類の精度に与える影響を考慮して、正確で信頼性の高い予測を保証するための検証の必要性を強調させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Formally verifying audio classification systems is essential to ensure
accurate signal classification across real-world applications like
surveillance, automotive voice commands, and multimedia content management,
preventing potential errors with serious consequences. Drawing from recent
research, this study advances the utilization of star-set-based formal
verification, extended through reachability analysis, tailored explicitly for
Long Short-Term Memory architectures and their Convolutional variations within
the audio classification domain. By conceptualizing the classification process
as a sequence of set operations, the star set-based reachability approach
streamlines the exploration of potential operational states attainable by the
system. The paper serves as an encompassing case study, validating and
verifying sequence audio classification analytics within real-world contexts.
It accentuates the necessity for robustness verification to ensure precise and
dependable predictions, particularly in light of the impact of noise on the
accuracy of output classifications.
- Abstract(参考訳): 音声分類システムの形式的検証は、監視、自動車音声コマンド、マルチメディアコンテンツ管理といった現実世界のアプリケーション間での正確な信号分類を保証するために不可欠であり、重大な結果を招く可能性のあるエラーを防ぐ。
近年の研究では,Long Short-Term Memory アーキテクチャと音声分類領域における畳み込み変化に特化して,リーチビリティ解析を通じて拡張された星集合に基づく形式検証の利用を推し進めている。
分類過程を一連の集合演算として概念化することにより、星の集合に基づく到達可能性アプローチは、システムによって達成可能な潜在的操作状態の探索を合理化する。
本論文は、実世界の文脈におけるシーケンス音声分類分析の検証と検証を含むケーススタディとして機能する。
これは、特にノイズが出力分類の精度に与える影響を考慮して、正確で信頼できる予測を保証するための堅牢性検証の必要性を強調する。
関連論文リスト
- Audio-based Kinship Verification Using Age Domain Conversion [39.4890403254022]
このタスクの主な課題は、異なる個人からのサンプル間の年齢差から生じる。
我々は、最適化されたCycleGAN-VC3ネットワークを利用して、年齢変換を行い、ドメイン内オーディオを生成する。
生成されたオーディオデータセットを使用して、さまざまな機能を抽出し、それをメトリック学習アーキテクチャに入力し、親族性を検証する。
論文 参考訳(メタデータ) (2024-10-14T22:08:57Z) - Heterogeneous sound classification with the Broad Sound Taxonomy and Dataset [6.91815289914328]
本稿では,異種音の自動分類手法について検討する。
手動のアノテーションによってデータセットを構築し、精度、クラスごとの多様な表現、実世界のシナリオにおける関連性を保証する。
実験結果から,音響情報や意味情報をエンコードした音声埋め込みは,分類作業において高い精度を実現することが示された。
論文 参考訳(メタデータ) (2024-10-01T18:09:02Z) - Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization [60.899082019130766]
本稿では、フレームレベル検出ネットワーク(FDN)と、音声の時間的偽造検出とローカライゼーションのための改良ネットワーク(PRN)を提案する。
FDNは、偽のフレーム間で情報的不整合の手がかりを抽出し、偽の領域を大まかに示すのに有用な識別的特徴を得る。
PRNは、FDNから派生した粗粒度の提案を洗練するために、信頼スコアと回帰オフセットを予測する責任がある。
論文 参考訳(メタデータ) (2024-07-23T15:07:52Z) - Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models [52.04189118767758]
一般化は、現在のオーディオディープフェイク検出器の主な問題である。
本稿では,オーディオディープフェイク検出のための大規模事前学習モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-05-03T15:27:11Z) - Adaptive Fake Audio Detection with Low-Rank Model Squeezing [50.7916414913962]
ファインタニングのような従来の手法は計算集約的であり、既知の偽音声タイプの知識を損なう危険性がある。
本稿では,新たに登場したニセモノ音声タイプに特化して,低ランク適応行列をトレーニングするコンセプトを紹介する。
当社のアプローチには,ストレージメモリ要件の削減やエラー率の低下など,いくつかのメリットがあります。
論文 参考訳(メタデータ) (2023-06-08T06:06:42Z) - ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。
まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。
最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文 参考訳(メタデータ) (2022-07-14T17:46:37Z) - Investigation of Different Calibration Methods for Deep Speaker
Embedding based Verification Systems [66.61691401921296]
本稿では, ディープスピーカ埋込抽出器のスコアキャリブレーション法について検討する。
この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
論文 参考訳(メタデータ) (2022-03-28T21:22:22Z) - Open-set Short Utterance Forensic Speaker Verification using
Teacher-Student Network with Explicit Inductive Bias [59.788358876316295]
そこで本研究では,小規模の法定フィールドデータセット上での話者検証を改善するためのパイプラインソリューションを提案する。
大規模領域外データセットを活用することで,教師学習のための知識蒸留に基づく目的関数を提案する。
提案する目的関数は,短時間の発話における教師学生の学習性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2020-09-21T00:58:40Z) - Exploration of Audio Quality Assessment and Anomaly Localisation Using
Attention Models [37.60722440434528]
本稿では,双方向長期記憶とアテンション機構を併用し,音質評価のための新しいモデルを提案する。
前者は、録音から情報を学ぶ人間の聴覚知覚能力を模倣することであり、後者は、対象の特徴を強調することによって、所望の信号から干渉を更に識別することである。
提案手法を評価するため,様々な自然音を混合してTIMITデータセットを用いて拡張する。
論文 参考訳(メタデータ) (2020-05-16T17:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。