Fugu-MT 論文翻訳(概要): Infrequent Child-Directed Speech Is Bursty and May Draw Infant Vocalizations

論文の概要: Infrequent Child-Directed Speech Is Bursty and May Draw Infant Vocalizations

arxiv url: http://arxiv.org/abs/2603.23797v1
Date: Wed, 25 Mar 2026 00:10:43 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-26 21:06:11.063787
Title: Infrequent Child-Directed Speech Is Bursty and May Draw Infant Vocalizations
Title（参考訳）: 子どもの発話が不健康で、幼児の発声率も低かった
Authors: Margaret Cychosz, Adriana Weisleder,
Abstract要約: ボリビアの農村部とアメリカの都市部で撮影された幼児中心の音声録音について検討した。幼児は、指示された発話の期間に、音声のような発声を発生させる可能性が最も高い。ボリビアでは、幼児の発話のような発声は、成人よりも高齢者からの指示による発声の間に起こる可能性が高かった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Children in many parts of the world hear relatively little speech directed to them, yet still reach major language development milestones. What differs about the speech input that infants learn from when directed input is rare? Using longform, infant-centered audio recordings taken in rural Bolivia and the urban U.S., we examined temporal patterns of infants' speech input and their pre-linguistic vocal behavior. We find that child-directed speech in Bolivia, though less frequent, was just as temporally clustered as speech input in the U.S, arriving in concentrated bursts rather than spread across the day. In both communities, infants were most likely to produce speech-like vocalizations during periods of speech directed to them, with the probability of infants' speech-like vocalizations during target child-directed speech nearly double that during silence. In Bolivia, infants' speech-like vocalizations were also more likely to occur during bouts of directed speech from older children than from adults. Together, these findings suggest that the developmental impact of child-directed speech may depend not only on quantity, but on temporal concentration and source, with older children serving as an important source of input in some communities, including where adult speech to infants is less frequent.
Abstract（参考訳）: 世界中の多くの地域の子供たちは、彼らに向けられた比較的小さなスピーチを耳にしますが、依然として主要な言語開発マイルストーンに達しています。指示入力が稀なときから幼児が学習する音声入力との違いは何か? ボリビアの農村部とアメリカの都市部で撮影された長大な幼児中心音声記録を用いて,幼児の音声入力の時間的パターンと言語前発声行動について検討した。ボリビアでの子供指向のスピーチは、頻度は低いものの、アメリカにおける音声入力と同じくらい時間的にクラスタ化されており、一日中広まるのではなく集中的なバーストに到達していることがわかった。どちらのコミュニティにおいても、幼児は発話の時間帯に発話のような発声を発生させる可能性が最も高く、対象児の発話中に発声する確率は、沈黙時にほぼ2倍であった。ボリビアでは、幼児の発話のような発声は、成人よりも高齢者からの指示による発声の間に起こる可能性が高かった。これらの結果から, 子どもの発話の発達的影響は, 数量だけではなく, 時間的集中度や源泉にも大きく依存し, 乳幼児に対する成人の発話頻度が低い地域を含む地域社会において, 高齢者が重要な入力源として機能していることが示唆された。

関連論文リスト

CosyVoice 3: Towards In-the-wild Speech Generation via Scaling-up and Post-training [70.31925012315064]
野生におけるゼロショット多言語音声合成のための改良モデルであるCosyVoice 3を提案する。 CosyVoice 3の主な特徴は、韻律自然性を改善する新しい音声トークンである。データは1万時間から100万時間に拡張され、9つの言語と18の中国語方言を含んでいる。
論文参考訳（メタデータ） (2025-05-23T07:55:21Z)
Long-Form Speech Generation with Spoken Language Models [64.29591880693468]
テキストなしの音声言語モデルは、数十秒を超える可読な音声を生成するのに苦労する。我々は、長音の音声から学習し、サンプルする最初の音声言語モデルであるSpeechSSMを導出する。 SpeechSSMは線形時間列モデリングの最近の進歩を活用し、コヒーレンスと効率性において現在のトランスフォーマー音声LMを大幅に上回っている。
論文参考訳（メタデータ） (2024-12-24T18:56:46Z)
Improving Children's Speech Recognition by Fine-tuning Self-supervised Adult Speech Representations [2.2191297646252646]
幼児の音声認識は、包括的音声認識技術を構築する際には不可欠だが、ほとんど見過ごされる領域である。近年の自己教師型学習の進歩は、このデータ不足の問題を克服する新たな機会を生み出している。子どもの音声認識のためのモデルを構築するために,自己指導型成人音声表現を活用し,よく知られた幼児音声コーパスを3つ利用した。
論文参考訳（メタデータ） (2022-11-14T22:03:36Z)
Accented Speech Recognition under the Indian context [0.0]
アクセントは文化、感情、行動などを特定する上で不可欠な部分を形成します。人々はアクセントのために異なる方法でお互いを知覚することが多い。アクセントそのものは、ステータス、プライド、その他の感情的な情報を伝達するものであり、音声自体を通して捉えることができる。
論文参考訳（メタデータ） (2022-09-08T12:59:14Z)
Low-dimensional representation of infant and adult vocalization acoustics [2.1826796927092214]
本研究では, スペクトル特徴抽出と教師なし機械学習, 特にUniform Manifold Approximation (UMAP) を用いて, 乳幼児の2次元空間的表現と, 在宅録音から抽出した介護者の発声について検討した。例えば,乳児の2次元空間内における発声音の分散は3カ月から9か月に増加し,その後9か月から18カ月に減少した。
論文参考訳（メタデータ） (2022-04-25T17:58:13Z)
Perception Point: Identifying Critical Learning Periods in Speech for Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文参考訳（メタデータ） (2021-10-13T05:30:50Z)
Analysis of Disfluency in Children's Speech [25.68434431663045]
対象児26名(年齢5～8歳)の自覚的説明の非効率性を示す新しいデータセットを提案する。子どもたちは、拡散率とフィラー率が高く、鼻腔充填の停止を頻繁に使う傾向があり、平均すると修復よりも長い逆行性を示す。違いはあるものの、大人(スイッチボード)の音声書き起こしで訓練された自動不規則検出システムは、子どもの音声に対して合理的に良好に機能する。
論文参考訳（メタデータ） (2020-10-08T22:51:25Z)
Speaker Independent and Multilingual/Mixlingual Speech-Driven Talking Head Generation Using Phonetic Posteriorgrams [58.617181880383605]
そこで本研究では,音声後部グラフを用いた新しい手法を提案する。我々の手法は手作りの特徴を必要とせず、近年の手法に比べてノイズに強い。本モデルは,複数言語/混合言語音声を説得力のある入力としてサポートした最初のモデルである。
論文参考訳（メタデータ） (2020-06-20T16:32:43Z)
"Notic My Speech" -- Blending Speech Patterns With Multimedia [65.91370924641862]
音声認識と理解における視点依存と視覚的重要性の両方をモデル化するための視点時間的注意機構を提案する。提案手法は, ビセム誤差率において, 既存の作業よりも4.99%優れていた。モデルでは,多視点音声に対する理解と人間の知覚との間に強い相関関係があることが示されている。
論文参考訳（メタデータ） (2020-06-12T06:51:55Z)
Learning to Understand Child-directed and Adult-directed Speech [18.29692441616062]
人間の言語習得研究は、児童指向の音声が言語学習者に役立つことを示している。成人指向音声(ADS)と子ども指向音声(CDS)で訓練されたモデルのタスク性能の比較を行った。 CDSが学習の初期段階で有効であることを示す指標が得られたが、最終的には、ADSでトレーニングされたモデルは、同等のタスクパフォーマンスに達し、より一般化される。
論文参考訳（メタデータ） (2020-05-06T10:47:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。