論文の概要: Cross-Modality Embedding of Force and Language for Natural Human-Robot Communication
- arxiv url: http://arxiv.org/abs/2502.02772v1
- Date: Tue, 04 Feb 2025 23:32:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:24:16.258554
- Title: Cross-Modality Embedding of Force and Language for Natural Human-Robot Communication
- Title(参考訳): 自然な人間-ロボットコミュニケーションのための力と言語を交互に組み込む
- Authors: Ravi Tejwani, Karl Velazquez, John Payne, Paolo Bonato, Harry Asada,
- Abstract要約: 本稿では,単語や力のプロファイルを統一的に埋め込むための枠組みを提案する。
言語と物理的力プロファイルは全く異なると考えられるが、これら2つは統一された潜在空間に埋め込むことができる。
この潜伏空間では、力プロファイルと単語が互いに補足し、b)個々の効果を統合し、c)交換可能な方法で置換することができる。
- 参考スコア(独自算出の注目度): 2.1428585011874293
- License:
- Abstract: A method for cross-modality embedding of force profile and words is presented for synergistic coordination of verbal and haptic communication. When two people carry a large, heavy object together, they coordinate through verbal communication about the intended movements and physical forces applied to the object. This natural integration of verbal and physical cues enables effective coordination. Similarly, human-robot interaction could achieve this level of coordination by integrating verbal and haptic communication modalities. This paper presents a framework for embedding words and force profiles in a unified manner, so that the two communication modalities can be integrated and coordinated in a way that is effective and synergistic. Here, it will be shown that, although language and physical force profiles are deemed completely different, the two can be embedded in a unified latent space and proximity between the two can be quantified. In this latent space, a force profile and words can a) supplement each other, b) integrate the individual effects, and c) substitute in an exchangeable manner. First, the need for cross-modality embedding is addressed, and the basic architecture and key building block technologies are presented. Methods for data collection and implementation challenges will be addressed, followed by experimental results and discussions.
- Abstract(参考訳): 言語コミュニケーションと触覚コミュニケーションの相乗的協調のための力プロファイルと単語のクロスモーダル埋め込み法を提案する。
2人が大きな重い物体を一緒に運ぶと、意図した動きと物体に適用される物理的な力についての言葉によるコミュニケーションによって調整される。
この言語と身体の自然な統合は効果的な協調を可能にする。
同様に、人間とロボットの相互作用は、言語コミュニケーションと触覚コミュニケーションのモダリティを統合することで、このレベルの調整を実現することができる。
本稿では,単語と力プロファイルを統一的に埋め込む枠組みを提案し,この2つのコミュニケーションのモダリティを,効果的で相乗的な方法で統合・コーディネートできるようにする。
ここでは、言語と物理的力プロファイルは全く異なるとみなすが、両者は一体化された潜在空間に埋め込むことができ、両者間の近接を定量化できることを示す。
この潜伏空間では、力プロファイルと単語が可能である
互いに補う,補う.
b)個々の効果を統合し、
c) 交換可能な方法で代用すること
まず、モダリティ間埋め込みの必要性に対処し、基本アーキテクチャとキービルディングブロック技術を紹介する。
データ収集と実装の課題に対処し、実験結果と議論を行う。
関連論文リスト
- OOD-HOI: Text-Driven 3D Whole-Body Human-Object Interactions Generation Beyond Training Domains [66.62502882481373]
現在の方法では、身体と手の両方に焦点を合わせ、結束的で現実的な相互作用を生み出す能力を制限する傾向にある。
我々は,OOD-HOIというテキスト駆動型フレームワークを提案する。
提案手法は,初期相互作用ポーズを合成するための二重分岐相互拡散モデルと,予測された接触領域に基づく物理的精度向上のための接触誘導相互作用精製器と,ロバスト性向上のための意味的調整と変形を含む動的適応機構を統合した。
論文 参考訳(メタデータ) (2024-11-27T10:13:35Z) - Signaling and Social Learning in Swarms of Robots [0.0]
本稿では,ロボット群における協調性向上におけるコミュニケーションの役割について検討する。
クレジット代入問題に対処する上で,コミュニケーションが果たす役割を強調した。
論文 参考訳(メタデータ) (2024-11-18T14:42:15Z) - THOR: Text to Human-Object Interaction Diffusion via Relation Intervention [51.02435289160616]
我々は、リレーショナルインターベンション(THOR)を用いたテキスト誘導型ヒューマンオブジェクト相互作用拡散モデルを提案する。
各拡散段階において、テキスト誘導された人間と物体の動きを開始し、その後、人と物体の関係を利用して物体の動きに介入する。
テキスト記述をシームレスに統合するText2HOIデータセットであるText-BEHAVEを,現在最大規模で公開されている3D HOIデータセットに構築する。
論文 参考訳(メタデータ) (2024-03-17T13:17:25Z) - GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [72.96949760114575]
我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文 参考訳(メタデータ) (2024-03-17T03:52:52Z) - Pragmatic Goal-Oriented Communications under Semantic-Effectiveness Channel Errors [3.266331042379877]
近日中のAI支援6Gネットワークでは、セマンティック、プラグマティック、ゴール指向のコミュニケーション戦略の統合が必須となる。
本稿では,意味的および有効性の両レベルでの言語ミスマッチから生じる誤りを数学的にモデル化する手法を提案する。
本稿では,言語ミスマッチを補うメカニズムが提案される可能性を示し,ノイズの多い通信環境下での信頼性通信の実現可能性を高める。
論文 参考訳(メタデータ) (2024-01-19T16:43:47Z) - Decentralised Emergence of Robust and Adaptive Linguistic Conventions in
Populations of Autonomous Agents Grounded in Continuous Worlds [4.63732827131233]
本稿では,自律エージェントの集団が言語慣行を確立できる手法を提案する。
この慣習は、エージェントのペア間の局所的なコミュニケーションを通じて、分散的に現れる。
この手法により、住民はコミュニケーションに効果的で、一貫性があり、人間に解釈可能な言語慣習に収束できることを示す。
論文 参考訳(メタデータ) (2024-01-16T16:11:35Z) - Controllable Human-Object Interaction Synthesis [77.56877961681462]
本研究では,3次元シーンにおける同期物体の動きと人間の動きを生成するための制御可能な人間-物体相互作用合成(CHOIS)を提案する。
ここでは,高レベルな計画から効果的に抽出できるスタイルや意図を言語記述が通知し,シーン内の動きをグラウンド化する。
我々のモジュールは経路計画モジュールとシームレスに統合され、3D環境における長期的相互作用の生成を可能にします。
論文 参考訳(メタデータ) (2023-12-06T21:14:20Z) - Beyond Transmitting Bits: Context, Semantics, and Task-Oriented
Communications [88.68461721069433]
次世代システムは、メッセージセマンティクスを折り畳み、コミュニケーションの目標を設計に組み込むことによって、潜在的に豊かになる。
このチュートリアルは、初期適応、セマンティック・アウェア、タスク指向コミュニケーションから始まり、現在までの取り組みを要約する。
その焦点は、情報理論を利用して基礎を提供するアプローチと、意味論やタスク対応コミュニケーションにおける学習の重要な役割である。
論文 参考訳(メタデータ) (2022-07-19T16:00:57Z) - Interpretation of Emergent Communication in Heterogeneous Collaborative
Embodied Agents [83.52684405389445]
本稿では,コラボレーティブな多目的ナビゲーションタスクCoMONを紹介する。
この課題において、オラクルエージェントは、地図の形式で詳細な環境情報を有する。
視覚的に環境を知覚するナビゲーターエージェントと通信し、目標のシーケンスを見つけるのが任務である。
創発的コミュニケーションはエージェントの観察と3次元環境の空間構造に基礎を置くことができることを示す。
論文 参考訳(メタデータ) (2021-10-12T06:56:11Z) - Facilitating the Communication of Politeness through Fine-Grained
Paraphrasing [18.471262688125645]
我々は,言語を特定のコミュニケーション状況に適応させる上で,人々を支援するための第一歩を踏み出した。
事例研究として,実践的な意図の正確な伝達を容易にすることに焦点を当てた。
本稿では,あるコミュニケーション状況下での丁寧さを意図したレベルに導くパラフレーズを提案する手法を提案する。
論文 参考訳(メタデータ) (2020-11-30T19:00:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。