論文の概要: PyPhonPlan: Simulating phonetic planning with dynamic neural fields and task dynamics
- arxiv url: http://arxiv.org/abs/2603.16299v1
- Date: Tue, 17 Mar 2026 09:37:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.200027
- Title: PyPhonPlan: Simulating phonetic planning with dynamic neural fields and task dynamics
- Title(参考訳): PyPhonPlan: 動的ニューラルネットワークとタスクダイナミクスによる音声プランニングのシミュレーション
- Authors: Sam Kirkham,
- Abstract要約: PyPhonPlanは、音声プランニングの動的モデルを実装するためのPythonツールキットである。
プランニング、知覚、メモリフィールドを定義するコンポーネントや、フィールド間結合、ジェスチャー入力、およびフィールドアクティベーションプロファイルを使用して、トラクション変数のトラジェクトリを解決するコンポーネントを提供する。
- 参考スコア(独自算出の注目度): 0.4441866681085516
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce PyPhonPlan, a Python toolkit for implementing dynamical models of phonetic planning using coupled dynamic neural fields and task dynamic simulations. The toolkit provides modular components for defining planning, perception and memory fields, as well as between-field coupling, gestural inputs, and using field activation profiles to solve tract variable trajectories. We illustrate the toolkit's capabilities through an example application:~simulating production/perception loops with a coupled memory field, which demonstrates the framework's ability to model interactive speech dynamics using representations that are temporally-principled, neurally-grounded, and phonetically-rich. PyPhonPlan is released as open-source software and contains executable examples to promote reproducibility, extensibility, and cumulative computational development for speech communication research.
- Abstract(参考訳): 我々はPyPhonPlanを紹介した。PyPhonPlanは音韻計画の動的モデルを実装するためのPythonツールキットである。
このツールキットは、計画、知覚、記憶フィールドを定義するモジュールコンポーネントと、フィールド間カップリング、ジェスチャー入力、およびフィールドアクティベーションプロファイルを使用して、トラクション変数のトラジェクトリを解決する。
これは、時間的、神経的、音声的にリッチな表現を用いて対話型音声力学をモデル化するフレームワークの能力を実証するものである。
PyPhonPlanはオープンソースソフトウェアとしてリリースされ、音声通信研究のための再現性、拡張性、累積的な計算開発を促進する実行可能な例を含んでいる。
関連論文リスト
- Can We Predict the Next Question? A Collaborative Filtering Approach to Modeling User Behavior [16.241726074740082]
大規模言語モデル(LLM)は、言語理解と生成に優れ、高度な対話とレコメンデーションシステムの動力となっている。
本稿では,言語モデリングと行動シーケンスモデリングのギャップを埋めるために,協調フィルタリングによる質問予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-17T04:01:20Z) - EVLP:Learning Unified Embodied Vision-Language Planner with Reinforced Supervised Fine-Tuning [44.254412516852874]
現在の手法では、マルチモーダルプランニングに統一された生成フレームワークを採用できないため、マルチモーダルプランニングでは矛盾する。
提案手法は,動的事前学習と強化アライメントを取り入れた新しいトレーニングパイプラインにより,長期タスクのマルチモーダル計画を実現する。
論文 参考訳(メタデータ) (2025-11-03T10:24:49Z) - A Unified Modeling Framework for Automated Penetration Testing [7.670104854248101]
自動貫入テスト(AutoPT)への人工知能の統合は、インテリジェントエージェントのトレーニングのためのシミュレーションモデルの必要性を強調している。
シミュレーションモデリングのための統一フレームワークが利用可能であることには、認識されているギャップがある。
本稿では,文献の目的,ネットワークシミュレーションの複雑さ,技術的および戦術的操作の依存性,シナリオフィードバックと変動に基づく研究を分類するためにMDCPMを紹介する。
政策自動化に基づく新しいモデリングフレームワークであるAutoPT-Simを紹介し,すべての部分次元の組み合わせを包含する。
論文 参考訳(メタデータ) (2025-02-17T09:21:53Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Deep hybrid models: infer and plan in a dynamic world [0.0]
3つの特徴に基づいて離散的かつ連続的な処理を利用する能動的推論手法を提案する。
モデルが異なる条件下で提示された課題に対処できることが示される。
論文 参考訳(メタデータ) (2024-02-01T15:15:25Z) - MEIA: Multimodal Embodied Perception and Interaction in Unknown Environments [82.67236400004826]
本稿では,自然言語で表現されたハイレベルなタスクを実行可能なアクションのシーケンスに変換するための,MEIA(Multimodal Embodied Interactive Agent)を提案する。
MEMモジュールは、多様な要件とロボットの能力に基づいて、MEIAが実行可能なアクションプランを生成することを可能にする。
論文 参考訳(メタデータ) (2024-02-01T02:43:20Z) - Pixel State Value Network for Combined Prediction and Planning in
Interactive Environments [9.117828575880303]
本研究は,予測と計画を組み合わせた深層学習手法を提案する。
U-Netアーキテクチャを持つ条件付きGANは、2つの高解像度画像シーケンスを予測するために訓練される。
結果は、対立する目的の中で車線の変化のような複雑な状況において直感的な行動を示す。
論文 参考訳(メタデータ) (2023-10-11T17:57:13Z) - PDSketch: Integrated Planning Domain Programming and Learning [86.07442931141637]
我々は PDSketch という新しいドメイン定義言語を提案する。
これにより、ユーザーはトランジションモデルで柔軟にハイレベルな構造を定義できる。
移行モデルの詳細は、トレーニング可能なニューラルネットワークによって満たされる。
論文 参考訳(メタデータ) (2023-03-09T18:54:12Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。