論文の概要: Perspective-corrected Spatial Referring Expression Generation for
Human-Robot Interaction
- arxiv url: http://arxiv.org/abs/2104.01558v1
- Date: Sun, 4 Apr 2021 08:00:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:26:54.406294
- Title: Perspective-corrected Spatial Referring Expression Generation for
Human-Robot Interaction
- Title(参考訳): 人間-ロボットインタラクションのための遠近補正空間参照表現生成
- Authors: Mingjiang Liu, Chengli Xiao, Chunlin Chen
- Abstract要約: ヒトとロボットの相互作用に対する新しい視点補正空間参照表現生成手法(PcSREG)を提案する。
表現生成のタスクは、多様な空間関係単位を生成するプロセスに簡略化される。
提案手法をロボットシステムに実装し,実験により,より効果的な空間参照表現を生成できることを示す。
- 参考スコア(独自算出の注目度): 5.0726912337429795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent robots designed to interact with humans in real scenarios need to
be able to refer to entities actively by natural language. In spatial referring
expression generation, the ambiguity is unavoidable due to the diversity of
reference frames, which will lead to an understanding gap between humans and
robots. To narrow this gap, in this paper, we propose a novel
perspective-corrected spatial referring expression generation (PcSREG) approach
for human-robot interaction by considering the selection of reference frames.
The task of referring expression generation is simplified into the process of
generating diverse spatial relation units. First, we pick out all landmarks in
these spatial relation units according to the entropy of preference and allow
its updating through a stack model. Then all possible referring expressions are
generated according to different reference frame strategies. Finally, we
evaluate every expression using a probabilistic referring expression resolution
model and find the best expression that satisfies both of the appropriateness
and effectiveness. We implement the proposed approach on a robot system and
empirical experiments show that our approach can generate more effective
spatial referring expressions for practical applications.
- Abstract(参考訳): 現実のシナリオで人間と対話するように設計されたインテリジェントロボットは、自然言語によって能動的に実体を参照できる必要がある。
空間的参照表現生成においては、参照フレームの多様性のため曖昧さは避けられないため、人間とロボットの間の理解のギャップが生じる。
本稿では,このギャップを狭めるために,参照フレームの選択を考慮し,人間とロボットのインタラクションのための視点補正型空間参照表現生成(pcsreg)手法を提案する。
表現生成のタスクは、多様な空間関係単位を生成するプロセスに簡略化される。
まず、これらの空間関係単位のすべてのランドマークを好みのエントロピーに従って選択し、スタックモデルによる更新を可能にする。
そして、すべての可能な参照表現は、異なる参照フレーム戦略に従って生成される。
最後に,すべての表現を確率的参照表現解決モデルを用いて評価し,適切性と有効性の両方を満たす最良の表現を見出す。
提案手法をロボットシステムに実装し,実証実験により,本手法によりより効果的な空間参照表現が実現可能であることを示す。
関連論文リスト
- Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Probabilistic Transformer: A Probabilistic Dependency Model for
Contextual Word Representation [52.270712965271656]
本稿では,文脈表現の新しいモデルを提案する。
モデルのグラフは変換器に似ており、依存関係と自己意識の対応性がある。
実験により,本モデルが小型・中型データセットのトランスフォーマーと競合することを示す。
論文 参考訳(メタデータ) (2023-11-26T06:56:02Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Visual Affordance Prediction for Guiding Robot Exploration [56.17795036091848]
我々は,ロボット探索を導くための視覚能力の学習手法を開発した。
VQ-VAEの潜伏埋め込み空間における条件分布の学習にはTransformerベースのモデルを用いる。
本稿では,ロボット操作における視覚的目標条件付きポリシー学習において,目標サンプリング分布として機能することで探索を導くために,トレーニングされた余裕モデルをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2023-05-28T17:53:09Z) - Data-driven emotional body language generation for social robotics [58.88028813371423]
社会ロボティクスでは、人間型ロボットに感情の身体的表現を生成する能力を与えることで、人間とロボットの相互作用とコラボレーションを改善することができる。
我々は、手作業で設計されたいくつかの身体表現から学習する深層学習データ駆動フレームワークを実装した。
評価実験の結果, 生成した表現の人間同型とアニマシーは手作りの表現と異なる認識が得られなかった。
論文 参考訳(メタデータ) (2022-05-02T09:21:39Z) - HARPS: An Online POMDP Framework for Human-Assisted Robotic Planning and
Sensing [1.3678064890824186]
HARPS(Human Assisted Robotic Planning and Sensing)フレームワークは、ロボットチームにおけるアクティブなセマンティックセンシングと計画のためのフレームワークである。
このアプローチにより、人間が不規則にモデル構造を強制し、不確実な環境で意味的なソフトデータの範囲を拡張することができる。
大規模部分構造環境におけるUAV対応ターゲット探索アプリケーションのシミュレーションは、時間と信念状態の推定において著しく改善されている。
論文 参考訳(メタデータ) (2021-10-20T00:41:57Z) - Unsupervised Lexical Acquisition of Relative Spatial Concepts Using
Spoken User Utterances [0.0]
フレキシブルな音声対話システムを持つロボットは、言語表現を取得できなければならない。
相対的な空間概念は私たちの日常生活で広く使われている。
ロボットが相対空間概念を学ぶとき、どの物体が参照対象であるかは明らかではない。
論文 参考訳(メタデータ) (2021-06-16T06:44:27Z) - Language Understanding for Field and Service Robots in a Priori Unknown
Environments [29.16936249846063]
本稿では,フィールドロボットとサービスロボットによる自然言語命令の解釈と実行を可能にする,新しい学習フレームワークを提案する。
自然言語の発話において、空間的、位相的、意味的な情報を暗黙的に推測する。
本研究では,この分布を確率論的言語基底モデルに組み込んで,ロボットの行動空間のシンボル表現上の分布を推定する。
論文 参考訳(メタデータ) (2021-05-21T15:13:05Z) - Spatial Language Understanding for Object Search in Partially Observed
Cityscale Environments [21.528770932332474]
空間言語観測空間を導入し、部分観測可能なマルコフ決定プロセス(POMDP)の枠組みの下でモデルを定式化する。
本稿では,言語提供者の参照の相対的フレーム(FoR)の環境コンテキストを予測する畳み込みニューラルネットワークモデルを提案する。
本稿では,FOR予測モデルとオブジェクト探索システムの一般化可能性を示す。
論文 参考訳(メタデータ) (2020-12-04T16:27:59Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - Toward Forgetting-Sensitive Referring Expression Generationfor
Integrated Robot Architectures [1.8456386856206592]
動作記憶の異なるモデルが、自然な人間のような参照表現を生成するのに、どのように差分効果があるかを示す。
本研究では,ロボットの認知アーキテクチャ内での記憶を忘れる作業記憶の候補モデル2つを計算し,それらが生成した参照表現の認知可能性に基づく差異をいかに生かしたかを示す。
論文 参考訳(メタデータ) (2020-07-16T22:20:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。