論文の概要: Auto-KWS 2021 Challenge: Task, Datasets, and Baselines
- arxiv url: http://arxiv.org/abs/2104.00513v1
- Date: Wed, 31 Mar 2021 14:56:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 13:28:13.540857
- Title: Auto-KWS 2021 Challenge: Task, Datasets, and Baselines
- Title(参考訳): Auto-KWS 2021チャレンジ:タスク、データセット、ベースライン
- Authors: Jingsong Wang, Yuxuan He, Chunyu Zhao, Qijie Shao, Wei-Wei Tu, Tom Ko,
Hung-yi Lee, Lei Xie
- Abstract要約: Auto-KWS 2021チャレンジは、カスタマイズされたキーワードスポッティングタスクに機械学習を適用するプロセスを自動化するために、自動機械学習(AutoML)ソリューションを呼び出します。
この課題は、ターゲットデバイスが特定のキーワードで登録された話者によってのみ覚醒できる、カスタマイズされたキーワードスポッティングの問題に焦点を当てている。
- 参考スコア(独自算出の注目度): 63.82759886293636
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Auto-KWS 2021 challenge calls for automated machine learning (AutoML)
solutions to automate the process of applying machine learning to a customized
keyword spotting task. Compared with other keyword spotting tasks, Auto-KWS
challenge has the following three characteristics: 1) The challenge focuses on
the problem of customized keyword spotting, where the target device can only be
awakened by an enrolled speaker with his specified keyword. The speaker can use
any language and accent to define his keyword. 2) All dataset of the challenge
is recorded in realistic environment. It is to simulate different user
scenarios. 3) Auto-KWS is a "code competition", where participants need to
submit AutoML solutions, then the platform automatically runs the enrollment
and prediction steps with the submitted code.This challenge aims at promoting
the development of a more personalized and flexible keyword spotting system.
Two baseline systems are provided to all participants as references.
- Abstract(参考訳): auto-kws 2021は、カスタマイズされたキーワードスポッティングタスクに機械学習を適用するプロセスを自動化するために、自動機械学習(automl)ソリューションを要求する。
他のキーワードスポッティングタスクと比較して、Auto-KWSチャレンジには以下の3つの特徴がある: 1) ターゲットデバイスが特定のキーワードで登録された話者によってのみ起動できる、カスタマイズされたキーワードスポッティングの問題に焦点を当てる。
話者は任意の言語とアクセントを使ってキーワードを定義することができる。
2) 課題のすべてのデータセットは現実環境に記録される。
異なるユーザシナリオをシミュレートすることです。
3) Auto-KWSは、参加者がAutoMLソリューションを提出する必要がある「コードコンペティション」であり、プラットフォームが提出されたコードで登録と予測のステップを自動的に実行する。この課題は、よりパーソナライズされ柔軟なキーワードスポッティングシステムの開発を促進することを目的としている。
参加者全員に基準として2つのベースラインシステムを提供している。
関連論文リスト
- Responsible Task Automation: Empowering Large Language Models as
Responsible Task Automators [17.991044940694778]
大規模言語モデル(LLM)は、ユーザ命令に従ってタスクを自動補完する有望な可能性を示している。
大きな疑問が浮かび上がってくる。人間がタスクを自動化するのを助けるとき、機械はどうやって責任を持って振る舞うことができるのか?
我々は、責任あるタスク自動化(Responsible Task Automation, ResponsibleTA)を、LCMベースのコーディネータとタスク自動化の実行者との間の責任ある協調を促進するための基本的なフレームワークとして提示する。
論文 参考訳(メタデータ) (2023-06-02T02:42:58Z) - AutoML-GPT: Automatic Machine Learning with GPT [74.30699827690596]
本稿では,タスク指向のプロンプトを開発し,大規模言語モデル(LLM)を自動的に活用して学習パイプラインを自動化することを提案する。
本稿では,多様なAIモデルのブリッジとしてGPTを用いたAutoML-GPTを提案する。
このアプローチはコンピュータビジョン、自然言語処理、その他の課題領域において顕著な結果をもたらす。
論文 参考訳(メタデータ) (2023-05-04T02:09:43Z) - Personalized Keyword Spotting through Multi-task Learning [6.4423565043274795]
我々は、(1)ターゲットユーザバイアスドKWS(TB-KWS)と(2)ターゲットユーザのみKWS(TO-KWS)の2つの個別KWSタスクを設計する。
課題を解決するために,マルチタスク学習とタスク適応からなるマルチタスク学習(PK-MTL)によるパーソナライズされたキーワードスポッティングを提案する。
従来のシナリオとパーソナライズされたシナリオの枠組みを評価し,PK-MTLが誤警報率を大幅に低減できることを示す。
論文 参考訳(メタデータ) (2022-06-28T02:48:34Z) - The VoicePrivacy 2022 Challenge Evaluation Plan [46.807999940446294]
トレーニング、開発、評価のデータセットが提供される。
参加者は開発した匿名化システムを適用する。
結果はInterSPEECH 2022と共同で開催されるワークショップで発表される。
論文 参考訳(メタデータ) (2022-03-23T15:05:18Z) - Connecting Language and Vision for Natural Language-Based Vehicle
Retrieval [77.88818029640977]
本稿では,言語記述という新たなモダリティを,興味ある車両の探索に適用する。
言語と視覚を結びつけるために,トランスフォーマーに基づく言語モデルを用いて最先端の視覚モデルを共同で訓練することを提案する。
提案手法は第5回AIシティチャレンジで1位を獲得し、18.69%のMRRの精度で競争性能を得た。
論文 参考訳(メタデータ) (2021-05-31T11:42:03Z) - AutoSpeech 2020: The Second Automated Machine Learning Challenge for
Speech Classification [31.22181821515342]
AutoSpeechチャレンジでは、機械学習を音声処理タスクに適用するプロセスを自動化するために、自動機械学習(AutoML)ソリューションが求められている。
本稿では,課題プロトコル,データセット,評価基準,開始キット,ベースラインシステムについて概説する。
論文 参考訳(メタデータ) (2020-10-25T15:01:41Z) - ConvAI3: Generating Clarifying Questions for Open-Domain Dialogue
Systems (ClariQ) [64.60303062063663]
本論文では,対話システムに対する質問の明確化に関する課題について詳述する(ClariQ)。
このチャレンジは、2020年のSearch Oriented Conversational AI (SCAI) EMNLPワークショップで、ConvAI3(Conversational AI Challenge series)の一部として組織されている。
論文 参考訳(メタデータ) (2020-09-23T19:48:02Z) - The NTT DCASE2020 Challenge Task 6 system: Automated Audio Captioning
with Keywords and Sentence Length Estimation [49.41766997393417]
本報告では, 音響シーン・イベントの検出・分類に関わるシステムについて述べる。
本論文は,音声の自動字幕化における2つの不確定性,すなわち,単語選択不確定性と文長不確定性に焦点をあてる。
マルチタスク学習によりキーワードと文長を推定することにより,主字幕生成と部分不確定化を同時に解決する。
論文 参考訳(メタデータ) (2020-07-01T04:26:27Z) - A Baseline for the Commands For Autonomous Vehicles Challenge [7.430057056425165]
この課題は、最近の textttTalk2Car データセットに基づいている。
この文書は、参加者が競争を始めるのを助けるためにリリースしたモデルに関する技術的な概要を提供します。
論文 参考訳(メタデータ) (2020-04-20T13:35:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。