論文の概要: The INTERSPEECH 2021 Computational Paralinguistics Challenge: COVID-19
Cough, COVID-19 Speech, Escalation & Primates
- arxiv url: http://arxiv.org/abs/2102.13468v1
- Date: Wed, 24 Feb 2021 21:39:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-01 13:59:57.991371
- Title: The INTERSPEECH 2021 Computational Paralinguistics Challenge: COVID-19
Cough, COVID-19 Speech, Escalation & Primates
- Title(参考訳): InterSPEECH 2021 Computational Paralinguistics Challenge: COVID-19 cough, COVID-19 Speech, Escalation & Primates
- Authors: Bj\"orn W. Schuller, Anton Batliner, Christian Bergler, Cecilia
Mascolo, Jing Han, Iulia Lefter, Heysem Kaya, Shahin Amiriparian, Alice
Baird, Lukas Stappen, Sandra Ottl, Maurice Gerczuk, Panagiotis Tzirakis,
Chlo\"e Brown, Jagmohan Chauhan, Andreas Grammenos, Apinan Hasthanasombat,
Dimitris Spathis, Tong Xia, Pietro Cicuta, Leon J. M. Rothkrantz, Joeri
Zwerts, Jelle Treep, Casper Kaandorp
- Abstract要約: INTERSPEECH 2021Computational Paralinguistics Challengeは、4つの異なる問題に初めて対処します。
新型コロナウイルス(covid-19)とcovid-19(covid-19)のスピーチサブチャリエンスでは、covid-19感染のバイナリ分類は、せき声とスピーチに基づいて行わなければならない。
Escalation SubChallengeでは、対話におけるエスカレーションのレベルを3方向評価します。
- 参考スコア(独自算出の注目度): 34.39118619224786
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The INTERSPEECH 2021 Computational Paralinguistics Challenge addresses four
different problems for the first time in a research competition under
well-defined conditions: In the COVID-19 Cough and COVID-19 Speech
Sub-Challenges, a binary classification on COVID-19 infection has to be made
based on coughing sounds and speech; in the Escalation SubChallenge, a
three-way assessment of the level of escalation in a dialogue is featured; and
in the Primates Sub-Challenge, four species vs background need to be
classified. We describe the Sub-Challenges, baseline feature extraction, and
classifiers based on the 'usual' COMPARE and BoAW features as well as deep
unsupervised representation learning using the AuDeep toolkit, and deep feature
extraction from pre-trained CNNs using the Deep Spectrum toolkit; in addition,
we add deep end-to-end sequential modelling, and partially linguistic analysis.
- Abstract(参考訳): The INTERSPEECH 2021 Computational Paralinguistics Challenge addresses four different problems for the first time in a research competition under well-defined conditions: In the COVID-19 Cough and COVID-19 Speech Sub-Challenges, a binary classification on COVID-19 infection has to be made based on coughing sounds and speech; in the Escalation SubChallenge, a three-way assessment of the level of escalation in a dialogue is featured; and in the Primates Sub-Challenge, four species vs background need to be classified.
我々は、AuDeepツールキットを用いた深層教師なし表現学習や、Deep Spectrumツールキットを用いた事前学習CNNからの深部特徴抽出に加えて、Deep-to-endシーケンシャルモデリングと部分言語解析を加えたサブチャンジ、ベースライン特徴抽出および分類器について述べる。
関連論文リスト
- System Description for the Displace Speaker Diarization Challenge 2023 [0.0]
本稿では,会話環境問題における話者と言語のダイアリゼーションの解決策について述べる(2023年)。
音声によるセグメンション発見にはVAD,これらのセグメントからの特徴抽出にはResnetアーキテクチャをベースとしたCNN,特徴クラスタリングにはスペクトルクラスタリングを併用した。
論文 参考訳(メタデータ) (2024-06-20T21:40:02Z) - AIR-Bench: Benchmarking Large Audio-Language Models via Generative Comprehension [95.8442896569132]
AIR-Benchは,Large Audio-Language Models (LALM) の様々な種類の音声信号を理解し,テキスト形式で人間と対話する能力を評価する最初のベンチマークである。
その結果, GPT-4による評価と人間による評価との間には高い一貫性が認められた。
論文 参考訳(メタデータ) (2024-02-12T15:41:22Z) - The ACM Multimedia 2023 Computational Paralinguistics Challenge: Emotion
Share & Requests [66.24715220997547]
ACM Multimedia 2023 Paralinguistics Challengeは、明確に定義された条件下で初めて2つの異なる問題に対処する。
Emotion Share Sub-Challengeでは、音声のレグレッションが発生し、Requests Sub-Challengeでは、リクエストと苦情を検出する必要がある。
本稿では,DeepSpectRumツールキットを用いて,事前学習したCNNのサブチャレンジ,ベースライン特徴抽出,および通常のComPaRE特徴に基づく分類器,auDeepツールキット,およびディープ特徴抽出について述べる。
論文 参考訳(メタデータ) (2023-04-28T14:42:55Z) - Low-complexity deep learning frameworks for acoustic scene
classification [64.22762153453175]
音響シーン分類(ASC)のための低複雑さ深層学習フレームワークを提案する。
提案するフレームワークは、フロントエンドのスペクトログラム抽出、オンラインデータ拡張、バックエンドの分類、予測される確率の後期融合の4つの主要なステップに分けることができる。
DCASE 2022 Task 1 Development データセットで実施した実験は,低複雑さの要求を十分に満たし,最も高い分類精度を 60.1% で達成した。
論文 参考訳(メタデータ) (2022-06-13T11:41:39Z) - The ACM Multimedia 2022 Computational Paralinguistics Challenge:
Vocalisations, Stuttering, Activity, & Mosquitoes [9.09787422797708]
ACM Multimedia 2022 Computational Paralinguistics Challengeは4つの異なる問題に対処する。
Vocalisations and Stuttering Sub-Challengesでは、人間の非言語的発声と音声に関する分類をする必要がある。
Activity Sub-Challengeは、スマートウォッチのセンサーデータから人間の活動を認識することを目的としている。
モスキトース・サブチェレンジでは、蚊を検出する必要がある。
論文 参考訳(メタデータ) (2022-05-13T17:51:45Z) - Evaluating the COVID-19 Identification ResNet (CIdeR) on the INTERSPEECH
COVID-19 from Audio Challenges [59.78485839636553]
CIdeRはエンド・ツー・エンドのディープラーニング・ニューラルネットワークで、個人が新型コロナウイルス陽性か新型コロナウイルス陰性かを分類するために設計された。
COVID-19 CoughとInterSPEECH 2021, ComParE, DiCOVAの両者によるCIdeRのバイナリ診断の可能性を示した。
論文 参考訳(メタデータ) (2021-07-30T10:59:08Z) - End-2-End COVID-19 Detection from Breath & Cough Audio [68.41471917650571]
クラウドソースのオーディオサンプルからエンドツーエンドのディープラーニングを使用してCOVID-19を診断する最初の試みを実証します。
本研究では, 人工深層ニューラルネットワークを用いて, 人工呼吸器から新型コロナを診断する新しいモデル戦略を提案する。
論文 参考訳(メタデータ) (2021-01-07T01:13:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。