論文の概要: What makes a good pause? Investigating the turn-holding effects of
fillers
- arxiv url: http://arxiv.org/abs/2305.02101v1
- Date: Wed, 3 May 2023 13:15:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-04 14:43:44.715596
- Title: What makes a good pause? Investigating the turn-holding effects of
fillers
- Title(参考訳): 何が良い一時停止になるのか?
フィラーのターンホールディング効果の検討
- Authors: Bing'er Jiang, Erik Ekstedt, Gabriel Skantze
- Abstract要約: uh" や "um" のような充満した一時停止は、自発的なスピーチで頻繁に行われ、リスナーのターンホールディングキューとして機能する。
本稿では,最近提案されたVAPモデルを用いて,有意なターンホールド確率に対するポーズが与える影響を解析する。
以上の結果から,充填した一時停止はターンホールディング効果があるが,他のキューの冗長性のため,予想されるほど強くないと考えられる。
- 参考スコア(独自算出の注目度): 1.9229388624311594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Filled pauses (or fillers), such as "uh" and "um", are frequent in
spontaneous speech and can serve as a turn-holding cue for the listener,
indicating that the current speaker is not done yet. In this paper, we use the
recently proposed Voice Activity Projection (VAP) model, which is a deep
learning model trained to predict the dynamics of conversation, to analyse the
effects of filled pauses on the expected turn-hold probability. The results
show that, while filled pauses do indeed have a turn-holding effect, it is
perhaps not as strong as could be expected, probably due to the redundancy of
other cues. We also find that the prosodic properties and position of the
filler has a significant effect on the turn-hold probability. However, contrary
to what has been suggested in previous work, there is no difference between
"uh" and "um" in this regard.
- Abstract(参考訳): uh" や "um" のような充満したポーズ(またはフィラー)は、自発的なスピーチで頻繁に行われ、リスナーのターンホールディングキューとして機能し、現在の話者がまだ実行されていないことを示す。
本稿では,会話のダイナミクスを予測するために訓練された深層学習モデルであるVAP(Voice Activity Projection)モデルを用いて,想定されるターンホールド確率に対するポーズが与える影響を分析する。
その結果、充填された一時停止は実際にはターンホールディング効果を持つが、おそらく他の手がかりの冗長性のため、期待できるほど強くはないことが判明した。
また,フィラーの韻律的性質と位置がターンホールド確率に大きな影響を与えることがわかった。
しかしながら、先行研究で示唆されたものとは対照的に、この点において「uh」と「um」の間には差がない。
関連論文リスト
- On the Role of Context in Reading Time Prediction [50.87306355705826]
我々は,リアルタイム言語理解において,読者がコンテキストをどのように統合するかについて,新たな視点を提示する。
提案手法は,言語単位の処理作業が文脈内情報の内容のアフィン関数であることを示す素因的理論に基づいている。
論文 参考訳(メタデータ) (2024-09-12T15:52:22Z) - Existence Is Chaos: Enhancing 3D Human Motion Prediction with Uncertainty Consideration [27.28184416632815]
トレーニングデータにおける記録された動きは、所定の結果ではなく、将来の可能性の観測である可能性が示唆された。
不確実性を考慮した計算効率の良いエンコーダデコーダモデルを提案する。
論文 参考訳(メタデータ) (2024-03-21T03:34:18Z) - On the Effect of Anticipation on Reading Times [84.27103313675342]
我々は単語の文脈エントロピーとして予測を運用する。
単語の読解時間に対する文脈的エントロピーの影響を示す重要な証拠が得られた。
論文 参考訳(メタデータ) (2022-11-25T18:58:23Z) - Turn-Taking Prediction for Natural Conversational Speech [40.189938418201656]
一般的な会話的発話は、ターンテイクを伴う複数のクエリを含むことが多い。
障害としては、思考の一時停止、ためらうこと、単語の延長、ポーズの充満、繰り返し句などがある。
本稿では,エンド・ツー・エンド(E2E)音声認識器上に構築されたターンテイク予測器を提案する。
論文 参考訳(メタデータ) (2022-08-29T01:09:23Z) - Towards Disentangled Speech Representations [65.7834494783044]
本研究では, ASR と TTS の合同モデリングに基づく表現学習タスクを構築する。
本研究は,その部分の音声信号と,その部分の音声信号とをアンタングルする音声表現を学習することを目的とする。
我々は,これらの特性をトレーニング中に強化することにより,WERを平均24.5%向上させることを示す。
論文 参考訳(メタデータ) (2022-08-28T10:03:55Z) - PROMPT WAYWARDNESS: The Curious Case of Discretized Interpretation of
Continuous Prompts [99.03864962014431]
目標タスクの微調整連続プロンプトは、フルモデルの微調整に代わるコンパクトな代替品として登場した。
実際には、連続的なプロンプトによって解決されたタスクと、最も近い隣人との間の「方向」の挙動を観察する。
論文 参考訳(メタデータ) (2021-12-15T18:55:05Z) - Probing as Quantifying the Inductive Bias of Pre-trained Representations [99.93552997506438]
本稿では,特定のタスクに対する表現の帰納的バイアスを評価することを目的とした,探索のための新しいフレームワークを提案する。
トークン、アーク、文レベルの一連のタスクに我々のフレームワークを適用します。
論文 参考訳(メタデータ) (2021-10-15T22:01:16Z) - Panoptic Segmentation Forecasting [71.75275164959953]
我々の目標は、最近の観測結果から近い将来の予測を行うことです。
この予測能力、すなわち予測能力は、自律的なエージェントの成功に不可欠なものだと考えています。
そこで我々は,2成分モデルを構築した。一方のコンポーネントは,オードメトリーを予測して背景物の力学を学習し,他方のコンポーネントは検出された物の力学を予測する。
論文 参考訳(メタデータ) (2021-04-08T17:59:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。