論文の概要: ICE-Talk: an Interface for a Controllable Expressive Talking Machine
- arxiv url: http://arxiv.org/abs/2008.11045v1
- Date: Tue, 25 Aug 2020 14:17:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 03:15:06.147227
- Title: ICE-Talk: an Interface for a Controllable Expressive Talking Machine
- Title(参考訳): ICE-Talk: 制御可能な表現型発話機のためのインタフェース
- Authors: No\'e Tits, Kevin El Haddad and Thierry Dutoit
- Abstract要約: ICE-TalkはオープンソースのWebベースのGUIで、テキストフィールドとクリック可能な2Dプロットを介して制御可能なパラメータを持つTSシステムを使用することができる。
これにより、制御可能なTSに対する潜在空間の研究が可能になる。
- 参考スコア(独自算出の注目度): 6.514358246805895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: ICE-Talk is an open source web-based GUI that allows the use of a TTS system
with controllable parameters via a text field and a clickable 2D plot. It
enables the study of latent spaces for controllable TTS. Moreover it is
implemented as a module that can be used as part of a Human-Agent interaction.
- Abstract(参考訳): ICE-TalkはオープンソースのWebベースのGUIで、テキストフィールドとクリック可能な2Dプロットを介して制御可能なパラメータを持つTSシステムを使用することができる。
制御可能なttの潜在空間の研究を可能にする。
さらに、人間とエージェントの相互作用の一部として使用できるモジュールとして実装されている。
関連論文リスト
- Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following [63.57467950456686]
画像にテキストのデコードとして意味パネルを導入する。
パネルは、入力テキストから解析された視覚概念をアレンジすることで得られる。
我々は,実用的なシステムを開発し,連続生成とチャットベースの編集の可能性を示す。
論文 参考訳(メタデータ) (2023-11-28T17:57:44Z) - Timed Actors and Their Formal Verification [0.21756081703275998]
Timed Rebecaは非同期メッセージパッシングによって通信するカプセル化されたコンポーネントで構成されるシステムをモデル化するために使用することができる。
本稿では,FTTS (Floating-Time Transition System) とTTS (Common Timed Transition System) の両方を,これらのモデルのセマンティクスとして用いる方法について説明する。
モデルチェックツールセットは、スケジューリング可能性分析、デッドロックとキューオーバーフローチェック、アサーションベースのTimed Rebecaモデルの検証をサポートする。
論文 参考訳(メタデータ) (2023-09-13T20:50:11Z) - System-Initiated Transitions from Chit-Chat to Task-Oriented Dialogues
with Transition Info Extractor and Transition Sentence Generator [4.714297769572548]
チャットから始まる対話シナリオについて検討するが、最終的にはタスク関連サービスに切り替える。
統合対話モデルは、チャットとタスク指向対話の両方に関わり得るが、対話モード遷移の間は主導権を握る。
論文 参考訳(メタデータ) (2023-08-06T12:25:22Z) - InternGPT: Solving Vision-Centric Tasks by Interacting with ChatGPT
Beyond Language [82.92236977726655]
InternGPTは textbfinteraction, textbfnonverbal, textbfchatbot の略である。
InternGPT(iGPT)という対話型視覚フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T17:58:34Z) - Can Current Task-oriented Dialogue Models Automate Real-world Scenarios
in the Wild? [48.79943762731801]
タスク指向対話(TOD)システムは、主にスロット充填ベースのTOD(SF-TOD)フレームワークに基づいている。
現在のTODベンチマークは、現実のシナリオをサロゲートするために限られており、現在のTODモデルは、シナリオをカバーするための長い道のりである、と我々は主張する。
WebTODでは、対話システムは、人間のエージェントが対話するWeb/モバイルインターフェースの理解方法を学ぶ。
論文 参考訳(メタデータ) (2022-12-20T18:18:41Z) - Adapitch: Adaption Multi-Speaker Text-to-Speech Conditioned on Pitch
Disentangling with Untranscribed Data [32.731900584216724]
Adapitch は、教師付きモジュールを非転写データで適応させるマルチスピーカ TTS 方式である。
我々は、テキストエンコーダとメルデコーダを非転写データで別々に訓練するために、2つの自己教師付きモジュールを設計する。
実験の結果、Adaptichはベースライン法よりもはるかに優れた品質を達成できた。
論文 参考訳(メタデータ) (2022-10-25T07:21:07Z) - ESPnet2-TTS: Extending the Edge of TTS Research [62.92178873052468]
ESPnet2-TTSは、E2E-TTS(E2E-TTS)ツールキットである。
新機能としては、オンザフライフレキシブルプリプロセッシング、ニューラルボコーダとのジョイントトレーニング、フルバンドE2Eテキスト・トゥ・ウェーブフォームモデリングのような拡張を備えた最先端のTSモデルなどがある。
論文 参考訳(メタデータ) (2021-10-15T03:27:45Z) - Discovering Dialog Structure Graph for Open-Domain Dialog Generation [51.29286279366361]
chitchat corporaの対話構造を無監督で発見します。
次に、下流システムでのダイアログ生成を容易にするために利用します。
本稿では,グラフニューラルネットワーク(DVAE-GNN)を用いた離散変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-12-31T10:58:37Z) - Conversation Learner -- A Machine Teaching Tool for Building Dialog
Managers for Task-Oriented Dialog Systems [57.082447660944965]
Conversation Learnerは、ダイアログマネージャを構築するための機械学習ツールである。
ダイアログ作成者が慣れ親しんだツールを使ってダイアログフローを作成し、ダイアログフローをパラメトリックモデルに変換することができる。
ユーザシステムダイアログをトレーニングデータとして活用することで、ダイアログ作成者が時間とともにダイアログマネージャを改善することができる。
論文 参考訳(メタデータ) (2020-04-09T00:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。