Fugu-MT 論文翻訳(概要): Topics in the Study of the Pragmatic Functions of Phonetic Reduction in Dialog

論文の概要: Topics in the Study of the Pragmatic Functions of Phonetic Reduction in Dialog

arxiv url: http://arxiv.org/abs/2405.01376v1
Date: Thu, 2 May 2024 15:18:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-03 16:05:24.812150
Title: Topics in the Study of the Pragmatic Functions of Phonetic Reduction in Dialog
Title（参考訳）: 対話における音韻削減の実用的機能に関する研究
Authors: Nigel G. Ward, Carlos A. Ortega,
Abstract要約: 音声では調音精度の低下が一般的であるが,対話ではその音響特性や実用性はほとんど研究されていない。このテクニカルレポートには、そのジャーナルの記事から削除されたコンテンツが含まれています。
参考スコア（独自算出の注目度）: 2.2454981492294497
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Reduced articulatory precision is common in speech, but for dialog its acoustic properties and pragmatic functions have been little studied. We here try to remedy this gap. This technical report contains content that was omitted from the journal article (Ward et al. 2024, submitted). Specifically, we here report 1) lessons learned about annotating for perceived reduction, 2) the finding that, unlike in read speech, the correlates of reduction in dialog include high pitch, wide pitch range, and intensity, and 3) a baseline model for predicting reduction in dialog, using simple acoustic/prosodic features, that achieves correlations with human perceptions of 0.24 for English, and 0.17 for Spanish. We also provide examples of additional possible pragmatic functions of reduction in English, and various discussion, observations and speculations
Abstract（参考訳）: 音声では調音精度の低下が一般的であるが,対話ではその音響特性や実用性はほとんど研究されていない。私たちはこのギャップを埋めようとしている。本技術報告は、ジャーナル記事から削除された内容を含む(Ward et al 2024, submitted)。特に報告します 1)減音に対する注記に関する教訓。 2)読み上げ音声とは異なり、対話の減少の相関には高音域、広音域、強度が含まれており、 3) 音声・韻律的特徴を用いたダイアログの減少予測のためのベースラインモデルにより, 英語の0.24, スペイン語の0.17の人間の知覚と相関関係が得られた。また、英語の減量のための実用的な機能の追加例や、様々な議論、観察、憶測について述べる。

関連論文リスト

Aligning Spoken Dialogue Models from User Interactions [55.192134724622235]
本稿では,ユーザの対話からリアルタイム会話における音声対話モデルを改善するための新しい嗜好アライメントフレームワークを提案する。 AIフィードバックを付加した生のマルチターン音声会話から15万以上の好みペアのデータセットを作成する。本研究は, 自然なリアルタイム音声対話システムにおいて重要な, 様々な力学におけるバランスの整合性の重要性を浮き彫りにした。
論文参考訳（メタデータ） (2025-06-26T16:45:20Z)
Detecting Referring Expressions in Visually Grounded Dialogue with Autoregressive Language Models [3.8673630752805446]
本研究の目的は,言語文脈のみが言及の検出にどのような影響を及ぼすかを検討することである。我々は,事前訓練された大言語モデル (LLM) を用いて,会話の展開における参照スパンの比較的詳細なアノテーションを実行する。その結果,中程度サイズのLLM,比較的小さなデータセット,パラメータ効率の高い微調整を用いても,テキストのみのアプローチが有効であることが示唆された。
論文参考訳（メタデータ） (2025-06-26T14:14:20Z)
An Unsupervised Dialogue Topic Segmentation Model Based on Utterance Rewriting [3.5399864027190366]
本研究では,Utterance Rewriting(UR)技術と教師なし学習アルゴリズムを組み合わせた,教師なし対話トピックセグメンテーション手法を提案する。 The proposed Discourse Rewriting Topic Model (UR-DTS) is significantly improves the accuracy of topic segmentation。
論文参考訳（メタデータ） (2024-09-12T00:27:31Z)
Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue [71.15186328127409]
パラリンGPT(Paralin GPT) モデルは、シリアライズされたマルチタスクフレームワーク内の入力プロンプトとして、テキスト、音声埋め込み、およびパラ言語属性の会話コンテキストを取る。音声対話データセットとして,感情ラベルをパラ言語属性として含むSwitchboard-1コーパスを利用する。
論文参考訳（メタデータ） (2023-12-23T18:14:56Z)
Acoustic and linguistic representations for speech continuous emotion recognition in call center conversations [2.0653090022137697]
本稿では,AlloSat corpus へのトランスファー学習の一形態として,事前学習した音声表現の利用について検討する。実験により,事前学習した特徴を用いて得られた性能の大きな向上を確認した。驚いたことに、言語内容が満足度予測の主要な要因であることは明らかでした。
論文参考訳（メタデータ） (2023-10-06T10:22:51Z)
Improving Speaker Diarization using Semantic Information: Joint Pairwise Constraints Propagation [53.01238689626378]
本稿では,話者ダイアリゼーションシステムにおける意味情報を活用する新しい手法を提案する。音声言語理解モジュールを導入し、話者関連意味情報を抽出する。本稿では,これらの制約を話者ダイアリゼーションパイプラインに統合する新しい枠組みを提案する。
論文参考訳（メタデータ） (2023-09-19T09:13:30Z)
SCRAPS: Speech Contrastive Representations of Acoustic and Phonetic Spaces [10.895310812568084]
音声空間と音響空間の共有表現を学習するために,CLIPに基づくモデルを訓練する。その結果,提案手法は音素変化に敏感であることが示唆された。その結果,様々な下流アプリケーションにおいて,埋め込みが有用であることを示す実証的証拠を提供する。
論文参考訳（メタデータ） (2023-07-23T22:18:47Z)
DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文参考訳（メタデータ） (2023-06-15T10:41:23Z)
Question-Interlocutor Scope Realized Graph Modeling over Key Utterances for Dialogue Reading Comprehension [61.55950233402972]
本稿では,対話読解のためのキーワード抽出手法を提案する。複数の連続した発話によって形成された単位に対して予測を行い、より多くの回答を含む発話を実現する。発話のテキスト上に構築されたグラフとして,質問-対話者スコープ実現グラフ(QuISG)モデルを提案する。
論文参考訳（メタデータ） (2022-10-26T04:00:42Z)
Cross-lingual Low Resource Speaker Adaptation Using Phonological Features [2.8080708404213373]
我々は、異なる言語に共通する音韻的特徴のセットに基づいて、言語に依存しないマルチスピーカモデルを訓練する。対象話者データの32と8の発声で、対応する文献に匹敵する高い話者類似度スコアと自然性を得る。
論文参考訳（メタデータ） (2021-11-17T12:33:42Z)
On Negative Interference in Multilingual Models: Findings and A Meta-Learning Treatment [59.995385574274785]
従来の信念に反して、負の干渉は低リソース言語にも影響を及ぼすことを示す。メタ学習アルゴリズムは、より優れた言語間変換性を得、負の干渉を軽減する。
論文参考訳（メタデータ） (2020-10-06T20:48:58Z)
Topic Propagation in Conversational Search [0.0]
会話の文脈では、ユーザは、自然言語質問のシーケンスとして、多面的な情報を必要とすることを表現します。筆者らは,2019 TREC Conversational Assistant Track (CAsT) フレームワークを用いて, (i) トピック認識発話の書き直し, (ii) 書き直された発話の候補節の検索, (iii) ニューラルネットワークによる候補節の再ランク付けを行う。
論文参考訳（メタデータ） (2020-04-29T10:06:00Z)
Dialogue-Based Relation Extraction [53.2896545819799]
本稿では,人間による対話型関係抽出(RE)データセットDialogREを提案する。我々は,対話型タスクと従来のREタスクの類似点と相違点の分析に基づいて,提案課題において話者関連情報が重要な役割を担っていると論じる。実験結果から,ベストパフォーマンスモデルにおける話者認識の拡張が,標準設定と会話評価設定の両方において向上することが示された。
論文参考訳（メタデータ） (2020-04-17T03:51:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。