論文の概要: Sigma-lognormal modeling of speech
- arxiv url: http://arxiv.org/abs/2401.17320v1
- Date: Sat, 27 Jan 2024 18:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-01 16:52:50.267590
- Title: Sigma-lognormal modeling of speech
- Title(参考訳): 音声のSigma-lognormal Modeling
- Authors: C. Carmona-Duarte, M.A.Ferrer, R. Plamondon, A. Gomez-Rodellar, P.
Gomez-Vilda
- Abstract要約: 本研究は, 音声キネマティクスを簡易に研究, 解析, 複雑化するのに使用できる音声キネマティクスに基づくモデルを提案する。
音声に関わる神経筋ネットワークのインパルス応答を記述するために, 人体運動のキネマティック理論とそれに関連するシグマ対数正規モデルを適用した。
VTR TIMIT データベースと (ドイツ語) Saarbrucken Voice Database を用いて、年齢の異なる人々を含む実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Human movement studies and analyses have been fundamental in many scientific
domains, ranging from neuroscience to education, pattern recognition to
robotics, health care to sports, and beyond. Previous speech motor models were
proposed to understand how speech movement is produced and how the resulting
speech varies when some parameters are changed. However, the inverse approach,
in which the muscular response parameters and the subject's age are derived
from real continuous speech, is not possible with such models. Instead, in the
handwriting field, the kinematic theory of rapid human movements and its
associated Sigma-lognormal model have been applied successfully to obtain the
muscular response parameters. This work presents a speech kinematics based
model that can be used to study, analyze, and reconstruct complex speech
kinematics in a simplified manner. A method based on the kinematic theory of
rapid human movements and its associated Sigma lognormal model are applied to
describe and to parameterize the asymptotic impulse response of the
neuromuscular networks involved in speech as a response to a neuromotor
command. The method used to carry out transformations from formants to a
movement observation is also presented. Experiments carried out with the
(English) VTR TIMIT database and the (German) Saarbrucken Voice Database,
including people of different ages, with and without laryngeal pathologies,
corroborate the link between the extracted parameters and aging, on the one
hand, and the proportion between the first and second formants required in
applying the kinematic theory of rapid human movements, on the other. The
results should drive innovative developments in the modeling and understanding
of speech kinematics.
- Abstract(参考訳): 人間の運動研究と分析は、神経科学から教育、パターン認識からロボティクス、医療からスポーツまで、多くの科学分野において基礎的存在である。
従来の音声運動モデルでは、音声の運動がどのように生成され、あるパラメータが変化した場合に、結果がどう変化するかを理解することが提案されている。
しかし, 実際の連続音声から筋反応パラメータと年齢を導出する逆アプローチは, そのようなモデルでは不可能である。
その代わり、手書きの分野において、急速人間の運動の運動論的理論とそれに伴うシグマ・ログノーマルモデルが、筋反応パラメータを得るためにうまく適用されている。
本研究は、複雑な音声キネマティクスを簡易に研究、分析、再構成するために使用できる音声キネマティクスに基づくモデルを提案する。
高速ヒト運動の運動論的理論とそれに伴うシグマ対数正規モデルに基づく方法を用いて、発話に関与する神経筋ネットワークの漸近的インパルス応答を、神経運動指令に対する応答として記述し、パラメータ化する。
ホルマントから運動観察への変換を行うための方法も提示する。
英語) vtr timit database と (ドイツ語) saarbrucken voice database (年齢の異なる人を含む、喉頭病理の有無に関わらず) を用いて実験を行い、抽出されたパラメーターと加齢との関係と、急速人間の運動のキネマティックな理論を適用するのに必要な第1と第2のフォルマント間の比率を相関させた。
この結果は、音声キネマティクスのモデリングと理解における革新的な発展を促す。
関連論文リスト
- MindBridge: A Cross-Subject Brain Decoding Framework [60.58552697067837]
脳の復号化は、獲得した脳信号から刺激を再構築することを目的としている。
現在、脳の復号化はモデルごとのオブジェクトごとのパラダイムに限られている。
我々は,1つのモデルのみを用いることで,オブジェクト間脳デコーディングを実現するMindBridgeを提案する。
論文 参考訳(メタデータ) (2024-04-11T15:46:42Z) - The bionic neural network for external simulation of human locomotor
system [2.6311880922890842]
本稿では,筋骨格モデルに基づく物理インフォームド深層学習法を提案し,関節運動と筋力を予測する。
この方法は、被験者固有のMSK生理学的パラメータを効果的に同定することができ、訓練された物理インフォームドフォワード力学は、正確な動きと筋力予測をもたらす。
論文 参考訳(メタデータ) (2023-09-11T23:02:56Z) - Persistent-Transient Duality: A Multi-mechanism Approach for Modeling
Human-Object Interaction [58.67761673662716]
人間は高度に適応可能で、異なるタスク、状況、状況を扱うために異なるモードを素早く切り替える。
人間と物体の相互作用(HOI)において、これらのモードは、(1)活動全体に対する大規模な一貫した計画、(2)タイムラインに沿って開始・終了する小規模の子どもの対話的行動の2つのメカニズムに起因していると考えられる。
本研究は、人間の動作を協調的に制御する2つの同時メカニズムをモデル化することを提案する。
論文 参考訳(メタデータ) (2023-07-24T12:21:33Z) - A Physics-Informed Low-Shot Learning For sEMG-Based Estimation of Muscle
Force and Joint Kinematics [4.878073267556235]
表面筋電図(sEMG)による筋力と関節キネマティクス推定はリアルタイム生体力学的解析に不可欠である。
ディープニューラルネットワーク(DNN)の最近の進歩は、完全に自動化され再現可能な方法で生体力学解析を改善する可能性を示している。
本稿では,筋力と関節キネマティクスのsEMGに基づく新しい物理インフォームドローショット学習法を提案する。
論文 参考訳(メタデータ) (2023-07-08T23:01:12Z) - Modelling Human Visual Motion Processing with Trainable Motion Energy
Sensing and a Self-attention Network [1.9458156037869137]
本稿では,生体とコンピュータの視覚モデルとのギャップを埋めることで,人間の動作知覚のイメージ計算可能なモデルを提案する。
このモデルアーキテクチャは、生体視覚システムにおける運動知覚のコア構造であるV1-MTの計算を捉えることを目的としている。
サイリコ神経生理学では、我々のモデルの単位応答は、運動プーリングやスピードチューニングに関する哺乳類の神経記録に類似していることが明らかになっている。
論文 参考訳(メタデータ) (2023-05-16T04:16:07Z) - Deep state-space modeling for explainable representation, analysis, and
generation of professional human poses [0.0]
本稿では,人間の動作を説明可能な表現にするための3つの新しい手法を紹介する。
トレーニングされたモデルは、専門家のフルボディのデキスタリティ分析に使用される。
論文 参考訳(メタデータ) (2023-04-13T08:13:10Z) - Skeleton2Humanoid: Animating Simulated Characters for
Physically-plausible Motion In-betweening [59.88594294676711]
現代の深層学習に基づく運動合成アプローチは、合成された運動の物理的妥当性をほとんど考慮していない。
テスト時に物理指向の動作補正を行うシステムSkeleton2Humanoid'を提案する。
挑戦的なLaFAN1データセットの実験は、物理的妥当性と精度の両方の観点から、我々のシステムが先行手法を著しく上回っていることを示している。
論文 参考訳(メタデータ) (2022-10-09T16:15:34Z) - Freeform Body Motion Generation from Speech [53.50388964591343]
音声から体の動きを生成することは、音声から体の動きへの非決定論的マッピングのために本質的に困難である。
2ストリームアーキテクチャを組み込んだ新しいフリーフォームモーション生成モデル(FreeMo)を提案する。
実験は、いくつかのベースラインに対して優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-03-04T13:03:22Z) - From Motion to Muscle [0.0]
筋活動は, 位置, 速度, 加速度などの運動特徴に基づいて人工的に生成できることを示す。
このモデルは、以前に訓練された運動に対して顕著な精度を達成し、これまで訓練されていない新しい運動に対して非常に高い精度を維持している。
論文 参考訳(メタデータ) (2022-01-27T13:30:17Z) - Model-based analysis of brain activity reveals the hierarchy of language
in 305 subjects [82.81964713263483]
言語の神経基盤を分解する一般的なアプローチは、個人間で異なる刺激に対する脳の反応を関連付けている。
そこで本研究では,自然刺激に曝露された被験者に対して,モデルに基づくアプローチが等価な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-12T15:30:21Z) - Continuous Learning and Adaptation with Membrane Potential and
Activation Threshold Homeostasis [91.3755431537592]
本稿では,MPATH(Membrane Potential and Activation Threshold Homeostasis)ニューロンモデルを提案する。
このモデルにより、ニューロンは入力が提示されたときに自動的に活性を調節することで動的平衡の形式を維持することができる。
実験は、モデルがその入力から適応し、継続的に学習する能力を示す。
論文 参考訳(メタデータ) (2021-04-22T04:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。