Fugu-MT 論文翻訳(概要): Formal Verification of Long Short-Term Memory based Audio Classifiers: A Star based Approach

論文の概要: Formal Verification of Long Short-Term Memory based Audio Classifiers: A Star based Approach

arxiv url: http://arxiv.org/abs/2311.12130v1
Date: Thu, 16 Nov 2023 11:04:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-27 00:35:17.597381
Title: Formal Verification of Long Short-Term Memory based Audio Classifiers: A Star based Approach
Title（参考訳）: 長期短期記憶型音声分類器の形式的検証:スターベースアプローチ
Authors: Neelanjana Pal (Institute for Software Integrated Systems, Vanderbilt University,), Taylor T Johnson (Institute for Software Integrated Systems, Vanderbilt University)
Abstract要約: 本論文は,実世界の文脈におけるシーケンス音声分類分析の検証と検証を行う包括的ケーススタディとして機能する。これは、特にノイズが出力分類の精度に与える影響を考慮して、正確で信頼性の高い予測を保証するための検証の必要性を強調させる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Formally verifying audio classification systems is essential to ensure accurate signal classification across real-world applications like surveillance, automotive voice commands, and multimedia content management, preventing potential errors with serious consequences. Drawing from recent research, this study advances the utilization of star-set-based formal verification, extended through reachability analysis, tailored explicitly for Long Short-Term Memory architectures and their Convolutional variations within the audio classification domain. By conceptualizing the classification process as a sequence of set operations, the star set-based reachability approach streamlines the exploration of potential operational states attainable by the system. The paper serves as an encompassing case study, validating and verifying sequence audio classification analytics within real-world contexts. It accentuates the necessity for robustness verification to ensure precise and dependable predictions, particularly in light of the impact of noise on the accuracy of output classifications.
Abstract（参考訳）: 音声分類システムの形式的検証は、監視、自動車音声コマンド、マルチメディアコンテンツ管理といった現実世界のアプリケーション間での正確な信号分類を保証するために不可欠であり、重大な結果を招く可能性のあるエラーを防ぐ。近年の研究では,Long Short-Term Memory アーキテクチャと音声分類領域における畳み込み変化に特化して,リーチビリティ解析を通じて拡張された星集合に基づく形式検証の利用を推し進めている。分類過程を一連の集合演算として概念化することにより、星の集合に基づく到達可能性アプローチは、システムによって達成可能な潜在的操作状態の探索を合理化する。本論文は、実世界の文脈におけるシーケンス音声分類分析の検証と検証を含むケーススタディとして機能する。これは、特にノイズが出力分類の精度に与える影響を考慮して、正確で信頼できる予測を保証するための堅牢性検証の必要性を強調する。

関連論文リスト

AudioJudge: Understanding What Works in Large Audio Model Based Speech Evaluation [55.607230723223346]
本研究は,Large Audio Model (LAM) をAudioJudgeの裁判官として体系的に研究し,両課題に対処する統一評価フレームワークを提供することができるかどうかを検討する。本稿では、発音、発話速度、話者識別、音声品質、自動ベンチマークのためのシステムレベルの人間の嗜好シミュレーションなど、音声特徴検出タスクにまたがるAudioJudgeについて検討する。本稿では,多視点アンサンブルAudioJudgeを導入し,音声評価を語彙内容,音声品質,パラ言語特徴の専門判断者に分解し,人間の嗜好と最大0.91のスピアマン相関を達成させる手法を提案する。
論文参考訳（メタデータ） (2025-07-17T00:39:18Z)
Anomaly Detection and Localization for Speech Deepfakes via Feature Pyramid Matching [8.466707742593078]
音声ディープフェイク(英: Speech Deepfakes)は、ターゲット話者の声を模倣できる合成音声信号である。音声のディープフェイクを検出する既存の方法は教師あり学習に依存している。本稿では,音声深度検出を異常検出タスクとして再設定する,新しい解釈可能な一クラス検出フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-23T11:15:22Z)
A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。工業画像から抽出した55個の特徴を統計的手法を用いて解析した。これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文参考訳（メタデータ） (2024-12-11T22:12:21Z)
Audio-based Kinship Verification Using Age Domain Conversion [39.4890403254022]
このタスクの主な課題は、異なる個人からのサンプル間の年齢差から生じる。我々は、最適化されたCycleGAN-VC3ネットワークを利用して、年齢変換を行い、ドメイン内オーディオを生成する。生成されたオーディオデータセットを使用して、さまざまな機能を抽出し、それをメトリック学習アーキテクチャに入力し、親族性を検証する。
論文参考訳（メタデータ） (2024-10-14T22:08:57Z)
Heterogeneous sound classification with the Broad Sound Taxonomy and Dataset [6.91815289914328]
本稿では,異種音の自動分類手法について検討する。手動のアノテーションによってデータセットを構築し、精度、クラスごとの多様な表現、実世界のシナリオにおける関連性を保証する。実験結果から,音響情報や意味情報をエンコードした音声埋め込みは,分類作業において高い精度を実現することが示された。
論文参考訳（メタデータ） (2024-10-01T18:09:02Z)
Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization [60.899082019130766]
本稿では、フレームレベル検出ネットワーク(FDN)と、音声の時間的偽造検出とローカライゼーションのための改良ネットワーク(PRN)を提案する。 FDNは、偽のフレーム間で情報的不整合の手がかりを抽出し、偽の領域を大まかに示すのに有用な識別的特徴を得る。 PRNは、FDNから派生した粗粒度の提案を洗練するために、信頼スコアと回帰オフセットを予測する責任がある。
論文参考訳（メタデータ） (2024-07-23T15:07:52Z)
Training-Free Deepfake Voice Recognition by Leveraging Large-Scale Pre-Trained Models [52.04189118767758]
一般化は、現在のオーディオディープフェイク検出器の主な問題である。本稿では,オーディオディープフェイク検出のための大規模事前学習モデルの可能性について検討する。
論文参考訳（メタデータ） (2024-05-03T15:27:11Z)
Adaptive Fake Audio Detection with Low-Rank Model Squeezing [50.7916414913962]
ファインタニングのような従来の手法は計算集約的であり、既知の偽音声タイプの知識を損なう危険性がある。本稿では,新たに登場したニセモノ音声タイプに特化して,低ランク適応行列をトレーニングするコンセプトを紹介する。当社のアプローチには,ストレージメモリ要件の削減やエラー率の低下など,いくつかのメリットがあります。
論文参考訳（メタデータ） (2023-06-08T06:06:42Z)
ReAct: Temporal Action Detection with Relational Queries [84.76646044604055]
本研究は,アクションクエリを備えたエンコーダ・デコーダフレームワークを用いて,時間的行動検出(TAD)の進展を図ることを目的とする。まず,デコーダ内の関係注意機構を提案し,その関係に基づいてクエリ間の関心を誘導する。最後に、高品質なクエリを区別するために、推論時に各アクションクエリのローカライズ品質を予測することを提案する。
論文参考訳（メタデータ） (2022-07-14T17:46:37Z)
Investigation of Different Calibration Methods for Deep Speaker Embedding based Verification Systems [66.61691401921296]
本稿では, ディープスピーカ埋込抽出器のスコアキャリブレーション法について検討する。この研究のさらなる焦点は、スコア正規化がシステムの校正性能に与える影響を推定することである。
論文参考訳（メタデータ） (2022-03-28T21:22:22Z)
Open-set Short Utterance Forensic Speaker Verification using Teacher-Student Network with Explicit Inductive Bias [59.788358876316295]
そこで本研究では,小規模の法定フィールドデータセット上での話者検証を改善するためのパイプラインソリューションを提案する。大規模領域外データセットを活用することで,教師学習のための知識蒸留に基づく目的関数を提案する。提案する目的関数は,短時間の発話における教師学生の学習性能を効果的に向上できることを示す。
論文参考訳（メタデータ） (2020-09-21T00:58:40Z)
Exploration of Audio Quality Assessment and Anomaly Localisation Using Attention Models [37.60722440434528]
本稿では,双方向長期記憶とアテンション機構を併用し,音質評価のための新しいモデルを提案する。前者は、録音から情報を学ぶ人間の聴覚知覚能力を模倣することであり、後者は、対象の特徴を強調することによって、所望の信号から干渉を更に識別することである。提案手法を評価するため,様々な自然音を混合してTIMITデータセットを用いて拡張する。
論文参考訳（メタデータ） (2020-05-16T17:54:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。