論文の概要: WildSpoof Challenge Evaluation Plan
- arxiv url: http://arxiv.org/abs/2508.16858v1
- Date: Sat, 23 Aug 2025 01:08:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.216552
- Title: WildSpoof Challenge Evaluation Plan
- Title(参考訳): WildSpoofチャレンジ評価計画
- Authors: Yihan Wu, Jee-weon Jung, Hye-jin Shim, Xin Cheng, Xin Wang,
- Abstract要約: WildSpoof Challengeは、2つの間にある音声処理タスクにおいて、Wildデータの使用を促進することを目的としている。
本研究は,(1)音声合成のためのTTS(Text-to-Speech)と(2)音声検出のためのSASV(Spowing-robust Automatic Speaker Verification)の2つの並列トラックから構成される。
- 参考スコア(独自算出の注目度): 37.28299652969491
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The WildSpoof Challenge aims to advance the use of in-the-wild data in two intertwined speech processing tasks. It consists of two parallel tracks: (1) Text-to-Speech (TTS) synthesis for generating spoofed speech, and (2) Spoofing-robust Automatic Speaker Verification (SASV) for detecting spoofed speech. While the organizers coordinate both tracks and define the data protocols, participants treat them as separate and independent tasks. The primary objectives of the challenge are: (i) to promote the use of in-the-wild data for both TTS and SASV, moving beyond conventional clean and controlled datasets and considering real-world scenarios; and (ii) to encourage interdisciplinary collaboration between the spoofing generation (TTS) and spoofing detection (SASV) communities, thereby fostering the development of more integrated, robust, and realistic systems.
- Abstract(参考訳): WildSpoof Challengeは、2つの間にある音声処理タスクにおいて、Wildデータの使用を促進することを目的としている。
本研究は,(1)音声合成のためのTTS(Text-to-Speech)と(2)音声検出のためのSASV(Spowing-robust Automatic Speaker Verification)の2つの並列トラックから構成される。
オーガナイザがトラックをコーディネートし、データプロトコルを定義する一方で、参加者はそれらを独立したタスクとして扱う。
課題の主な目的は次のとおりである。
i) TTS と SASV の両用と,従来のクリーンでコントロールされたデータセットを超えて,現実のシナリオを考慮しながら,Wild 内データの利用を促進すること。
(II)スプーフィング世代(TTS)とスプーフィング検出コミュニティ(SASV)の学際的連携を促進することにより,より統合的で堅牢で現実的なシステムの開発を促進する。
関連論文リスト
- Developing a High-performance Framework for Speech Emotion Recognition in Naturalistic Conditions Challenge for Emotional Attribute Prediction [31.454914712837933]
自然条件下での音声感情認識(SER)は,音声処理コミュニティにとって重要な課題である。
本稿では,自然条件課題における感情認識(IS25-SER Challenge)における優れた(トップ1)パフォーマンスを実現する再現可能なフレームワークを提案する。
本システムは,マルチモーダル学習,マルチタスク学習,不均衡なデータ処理を通じて,上記の課題に対処するように設計されている。
論文 参考訳(メタデータ) (2025-06-12T17:38:06Z) - SpoofCeleb: Speech Deepfake Detection and SASV In The Wild [76.71096751337888]
SpoofCelebは、音声ディープフェイク検出(SDD)とスポフィングロバスト自動話者検証(SASV)のために設計されたデータセットである。
SpoofCelebは、1,251人のユニークな話者による250万以上の発話で構成され、自然界の状況下で収集されている。
論文 参考訳(メタデータ) (2024-09-18T23:17:02Z) - Double Mixture: Towards Continual Event Detection from Speech [60.33088725100812]
音声イベント検出は、セマンティックイベントと音響イベントの両方のタグ付けを含むマルチメディア検索に不可欠である。
本稿では, 音声イベント検出における主な課題として, 過去の出来事を忘れることなく新たな事象を連続的に統合すること, 音響イベントからの意味のゆがみについて述べる。
本稿では,適応性を向上し,忘れることを防止するために,音声の専門知識と堅牢な記憶機構を融合する新しい手法「ダブルミキチャー」を提案する。
論文 参考訳(メタデータ) (2024-04-20T06:32:00Z) - Towards single integrated spoofing-aware speaker verification embeddings [63.42889348690095]
本研究は,1つの統合スプーフィング対応話者検証埋め込みを開発することを目的とする。
単一のSASV埋め込みの劣った性能は、不十分なトレーニングデータから得られると分析する。
実験では、SASV2022チャレンジの評価プロトコルにおいて、SASV-EERが1.06%に達するという劇的な改善が示された。
論文 参考訳(メタデータ) (2023-05-30T14:15:39Z) - OPAL: Ontology-Aware Pretrained Language Model for End-to-End
Task-Oriented Dialogue [40.62090743056549]
本稿では、エンドツーエンドタスク指向対話(TOD)のためのオントロジー対応事前学習言語モデル(OPAL)を提案する。
チャット型対話モデルとは異なり、タスク指向対話モデルは少なくとも2つのタスク固有モジュールを満たす:対話状態トラッカー(DST)と応答生成器(RG)。
論文 参考訳(メタデータ) (2022-09-10T04:38:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。