論文の概要: Fluent: An AI Augmented Writing Tool for People who Stutter
- arxiv url: http://arxiv.org/abs/2108.09918v1
- Date: Mon, 23 Aug 2021 04:08:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 16:07:39.806980
- Title: Fluent: An AI Augmented Writing Tool for People who Stutter
- Title(参考訳): Fluent: おしゃべりする人のためのAI強化の筆記ツール
- Authors: Bhavya Ghai, Klaus Mueller
- Abstract要約: スタブリング(PWS)を行う人々は、そのスタブリングを隠すために異なる戦略を採用するかもしれない。
一般的な戦略の1つは単語置換(英語版)であり、それは個人が単語を打つことを避け、代わりに代替語を使うものである。
本稿では,PWSのスクリプト記述を支援するAI拡張書記ツールであるFluentについて紹介する。
- 参考スコア(独自算出の注目度): 47.10916891482696
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stuttering is a speech disorder which impacts the personal and professional
lives of millions of people worldwide. To save themselves from stigma and
discrimination, people who stutter (PWS) may adopt different strategies to
conceal their stuttering. One of the common strategies is word substitution
where an individual avoids saying a word they might stutter on and use an
alternative instead. This process itself can cause stress and add more burden.
In this work, we present Fluent, an AI augmented writing tool which assists PWS
in writing scripts which they can speak more fluently. Fluent embodies a novel
active learning based method of identifying words an individual might struggle
pronouncing. Such words are highlighted in the interface. On hovering over any
such word, Fluent presents a set of alternative words which have similar
meaning but are easier to speak. The user is free to accept or ignore these
suggestions. Based on such user interaction (feedback), Fluent continuously
evolves its classifier to better suit the personalized needs of each user. We
evaluated our tool by measuring its ability to identify difficult words for 10
simulated users. We found that our tool can identify difficult words with a
mean accuracy of over 80% in under 20 interactions and it keeps improving with
more feedback. Our tool can be beneficial for certain important life situations
like giving a talk, presentation, etc. The source code for this tool has been
made publicly accessible at github.com/bhavyaghai/Fluent.
- Abstract(参考訳): 発声は、世界中の何百万人もの人々の個人的および専門的な生活に影響を与える言語障害である。
汚名や差別から身を守るために、異端者(pws)は異なる戦略を採り入れて混乱を隠そうとする。
一般的な戦略の1つは単語置換(英語版)であり、それは個人が単語を打つことを避け、代わりに代替語を使うものである。
このプロセス自体がストレスを引き起こし、負担を増加させます。
そこで本研究では,よりフルーレントに話すことができるスクリプト記述におけるpwを支援する,ai拡張ライティングツールであるfluentを提案する。
Fluentは、個人が発音に苦しむ可能性のある単語を識別する、新しいアクティブラーニングベースの方法である。
このような単語はインターフェイスでハイライトされる。
そのような単語の上にホバリングすると、Fluentは類似した意味を持つが話しやすい単語のセットを提示する。
ユーザーはこれらの提案を受け入れたり無視したりできる。
このようなユーザインタラクション(フィードバック)に基づいて、fluentは、各ユーザのパーソナライズされたニーズに合うように、その分類器を継続的に進化させます。
10名のシミュレートユーザを対象に,難解な単語を識別する能力を評価した。
20未満のインタラクションで平均80%以上の精度で難解な単語を識別できることが分かり、より多くのフィードバックを得て改善を続けました。
私たちのツールは、講演やプレゼンテーションなど、特定の重要な生活状況に役立ちます。
このツールのソースコードはgithub.com/bhavyaghai/Fluentで公開されている。
関連論文リスト
- Adversarial Training For Low-Resource Disfluency Correction [50.51901599433536]
ディフルエンシ補正(DC)のための逆学習型シーケンスタグ付けモデルを提案する。
提案手法の利点は,3つのインド語でDCに対して評価することで,合成された非流動データに大きく依存することを示す。
また,本手法は,音声障害によって導入されたASR文字の破面的不一致の除去にも有効である。
論文 参考訳(メタデータ) (2023-06-10T08:58:53Z) - DisfluencyFixer: A tool to enhance Language Learning through Speech To
Speech Disfluency Correction [50.51901599433536]
DisfluencyFixerは、英語とヒンディー語で音声から音声への拡散補正を行うツールである。
提案システムでは,入力音声からの拡散を除去し,出力として流速音声を返却する。
論文 参考訳(メタデータ) (2023-05-26T14:13:38Z) - SmartPhone: Exploring Keyword Mnemonic with Auto-generated Verbal and
Visual Cues [2.8047215329139976]
本稿では,キーワード・メニーモニックのための言語・視覚的手がかりの自動生成のためのエンドツーエンドパイプラインを提案する。
言語と視覚を自動生成するエンド・ツー・エンドのパイプラインである我々のアプローチは、覚えやすいキューを自動的に生成することができる。
論文 参考訳(メタデータ) (2023-05-11T20:58:10Z) - Stutter-TTS: Controlled Synthesis and Improved Recognition of Stuttered
Speech [20.2646788350211]
スタタリング(英: Stuttering)とは、音声の自然な流れが、音節、単語、フレーズのブロック、反復、延長によって中断される言語障害である。
本稿では,多種多様な発声音声を合成できるエンドツーエンドのニューラルテキスト・音声モデルであるStutter-TTSについて述べる。
論文 参考訳(メタデータ) (2022-11-04T23:45:31Z) - Detecting Dysfluencies in Stuttering Therapy Using wav2vec 2.0 [0.22940141855172028]
英語コーパスのスタブリング分類のための微調整wav2vec 2.0は、汎用的特徴の有効性を高める。
本稿では、Fluencybankとドイツのセラピー中心のKassel State of Fluencyデータセットについて評価する。
論文 参考訳(メタデータ) (2022-04-07T13:02:12Z) - KSoF: The Kassel State of Fluency Dataset -- A Therapy Centered Dataset
of Stuttering [58.91587609873915]
この研究で紹介されるKassel State of Fluency (KSoF)は、治療ベースのデータセットで、5500以上の散在するPWSのクリップを含んでいる。
オーディオは、Institut der Kasseler Stottertherapieのセラピーセッション中に録音された。
論文 参考訳(メタデータ) (2022-03-10T14:17:07Z) - Introducing the Talk Markup Language (TalkML):Adding a little social
intelligence to industrial speech interfaces [0.0]
自然言語の理解は、AI研究の最も残念な失敗の1つだ。
本稿では、他の分野からアイデアを取り入れて実装した方法について述べる。
論文 参考訳(メタデータ) (2021-05-24T14:25:35Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Interactive Re-Fitting as a Technique for Improving Word Embeddings [0.0]
我々は,単語の集合を互いに近づけることで,単語の埋め込み空間の一部を調整できるようにする。
提案手法では,単語埋め込みにおける潜在的なバイアスをユーザが操作する際,選択的な後処理をトリガーし,評価することができる。
論文 参考訳(メタデータ) (2020-09-30T21:54:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。