論文の概要: Hybrid ASR for Resource-Constrained Robots: HMM - Deep Learning Fusion
- arxiv url: http://arxiv.org/abs/2309.07164v1
- Date: Mon, 11 Sep 2023 15:28:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-15 17:39:15.629167
- Title: Hybrid ASR for Resource-Constrained Robots: HMM - Deep Learning Fusion
- Title(参考訳): 資源拘束型ロボットのためのハイブリッドASR:HMM - 深層学習融合
- Authors: Anshul Ranjan, Kaushik Jegadeesan
- Abstract要約: 本稿では,資源制約型ロボットに特化して設計されたハイブリッド音声認識(ASR)システムを提案する。
提案手法は、隠れマルコフモデル(HMM)とディープラーニングモデルを組み合わせて、ソケットプログラミングを利用して処理タスクを効果的に分散する。
このアーキテクチャでは、HMMベースの処理がロボット内で行われ、別のPCがディープラーニングモデルを処理する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper presents a novel hybrid Automatic Speech Recognition (ASR) system
designed specifically for resource-constrained robots. The proposed approach
combines Hidden Markov Models (HMMs) with deep learning models and leverages
socket programming to distribute processing tasks effectively. In this
architecture, the HMM-based processing takes place within the robot, while a
separate PC handles the deep learning model. This synergy between HMMs and deep
learning enhances speech recognition accuracy significantly. We conducted
experiments across various robotic platforms, demonstrating real-time and
precise speech recognition capabilities. Notably, the system exhibits
adaptability to changing acoustic conditions and compatibility with low-power
hardware, making it highly effective in environments with limited computational
resources. This hybrid ASR paradigm opens up promising possibilities for
seamless human-robot interaction. In conclusion, our research introduces a
pioneering dimension to ASR techniques tailored for robotics. By employing
socket programming to distribute processing tasks across distinct devices and
strategically combining HMMs with deep learning models, our hybrid ASR system
showcases its potential to enable robots to comprehend and respond to spoken
language adeptly, even in environments with restricted computational resources.
This paradigm sets a innovative course for enhancing human-robot interaction
across a wide range of real-world scenarios.
- Abstract(参考訳): 本稿では,資源制約ロボットに特化したハイブリッド音声認識(ASR)システムを提案する。
提案手法は隠れマルコフモデル(hmms)とディープラーニングモデルを組み合わせたもので,ソケットプログラミングを利用して処理タスクを効果的に分散する。
このアーキテクチャでは、HMMベースの処理がロボット内で行われ、別のPCがディープラーニングモデルを処理する。
このHMMとディープラーニングの相乗効果は音声認識精度を大幅に向上させる。
様々なロボットプラットフォームで実験を行い,リアルタイムかつ高精度な音声認識性能を実証した。
特に、このシステムは音響条件の変更や低消費電力ハードウェアとの互換性に適応性を示し、計算資源の少ない環境では非常に効果的である。
このハイブリッドASRパラダイムは、シームレスな人間とロボットの相互作用の可能性を開く。
結論として,ロボット工学に適したASR技術に先駆的な次元を導入する。
ソケットプログラミングを用いて、異なるデバイス間で処理タスクを分散し、HMMとディープラーニングモデルとを戦略的に組み合わせることで、我々のハイブリッドAIRシステムは、制限された計算資源を持つ環境においても、ロボットが音声言語を十分理解し、応答できる可能性を示す。
このパラダイムは、現実世界の幅広いシナリオにおける人間とロボットの相互作用を強化する革新的なコースを定めている。
関連論文リスト
- Real-Time Multimodal Signal Processing for HRI in RoboCup: Understanding a Human Referee [1.7456666582626115]
本研究では、キーポイント抽出と分類によるジェスチャー認識のための2段階パイプラインと、効率的なwhi検出のための連続畳み込みニューラルネットワーク(CCNN)を実装した。
提案されたアプローチは、RoboCupのような競合する環境でのリアルタイムな人間とロボットのインタラクションを強化し、人間と協力できる自律システムの開発を前進させるためのツールを提供する。
論文 参考訳(メタデータ) (2024-11-26T11:39:43Z) - State-of-the-art in Robot Learning for Multi-Robot Collaboration: A Comprehensive Survey [2.686336957004475]
この基盤上に構築されたマルチロボットシステム(MRS)は劇的な進化を遂げている。
人工知能技術とロボットハードウェアの融合は、MSSに幅広い応用可能性をもたらしている。
本稿では,マルチロボット協調におけるロボット学習の現状について概説する。
論文 参考訳(メタデータ) (2024-08-03T21:22:08Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning via Generative Simulation [68.70755196744533]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Language to Rewards for Robotic Skill Synthesis [37.21434094015743]
我々は,大規模言語モデル(LLM)を利用して,様々なロボットタスクを最適化し,達成可能な報酬パラメータを定義する新しいパラダイムを提案する。
LLMが生成する中間インタフェースとして報酬を用いることで、ハイレベルな言語命令と修正のギャップを、低レベルなロボット動作に効果的に埋めることができる。
論文 参考訳(メタデータ) (2023-06-14T17:27:10Z) - SAGCI-System: Towards Sample-Efficient, Generalizable, Compositional,
and Incremental Robot Learning [41.19148076789516]
上記の4つの要件を満たすために,SAGCIシステムと呼ばれる体系的な学習フレームワークを導入する。
本システムはまず,ロボットの手首に搭載されたカメラによって収集された生点雲を入力とし,URDFに代表される周囲環境の初期モデリングを生成する。
そのロボットは、対話的な知覚を利用して環境と対話し、URDFのオンライン検証と修正を行う。
論文 参考訳(メタデータ) (2021-11-29T16:53:49Z) - Robot Skill Adaptation via Soft Actor-Critic Gaussian Mixture Models [29.34375999491465]
現実の世界で行動する自律的エージェントにとっての中核的な課題は、その騒々しい知覚とダイナミクスに対処するために、そのスキルのレパートリーを適応させることである。
ロングホライズンタスクにスキルの学習を拡大するためには、ロボットは学習し、その後、構造化された方法でスキルを洗練する必要がある。
SAC-GMMは,動的システムを通じてロボットのスキルを学習し,学習したスキルを自身の軌道分布空間に適応させる,新しいハイブリッドアプローチである。
論文 参考訳(メタデータ) (2021-11-25T15:36:11Z) - Human-Robot Collaboration and Machine Learning: A Systematic Review of
Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。
本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文 参考訳(メタデータ) (2021-10-14T15:14:33Z) - SAPIEN: A SimulAted Part-based Interactive ENvironment [77.4739790629284]
SAPIENは現実的で物理に富んだシミュレートされた環境であり、音声オブジェクトのための大規模なセットをホストしている。
部品検出と動作特性認識のための最先端の視覚アルゴリズムの評価を行い,ロボットインタラクションタスクの実証を行った。
論文 参考訳(メタデータ) (2020-03-19T00:11:34Z) - The Chef's Hat Simulation Environment for Reinforcement-Learning-Based
Agents [54.63186041942257]
本稿では,人間-ロボットインタラクションのシナリオで使用されるように設計されたChef's Hatカードゲームを実装する仮想シミュレーション環境を提案する。
本稿では,強化学習アルゴリズムにおける制御可能かつ再現可能なシナリオを提案する。
論文 参考訳(メタデータ) (2020-03-12T15:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。