論文の概要: MQA: Answering the Question via Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2003.04641v3
- Date: Sun, 27 Jun 2021 13:44:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 20:43:31.782506
- Title: MQA: Answering the Question via Robotic Manipulation
- Title(参考訳): MQA: ロボット操作による質問への回答
- Authors: Yuhong Deng, Di Guo, Xiaofeng Guo, Naifu Zhang, Huaping Liu, Fuchun
Sun
- Abstract要約: そこで我々は,ロボットが与えられた質問に答えるために環境を変える操作を行う,新しいタスク, Manipulation Question Answering (MQA)を提案する。
QAモジュールでは、ロボットが環境と対話するための操作アクションを生成するために、ディープQネットワーク(DQN)モデルが設計されている。
本研究では,ロボットが容器内の物体を連続的に操作する状況について,質問への回答が見つかるまで考察する。
- 参考スコア(独自算出の注目度): 29.63598202578066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel task, Manipulation Question Answering
(MQA), where the robot performs manipulation actions to change the environment
in order to answer a given question. To solve this problem, a framework
consisting of a QA module and a manipulation module is proposed. For the QA
module, we adopt the method for the Visual Question Answering (VQA) task. For
the manipulation module, a Deep Q Network (DQN) model is designed to generate
manipulation actions for the robot to interact with the environment. We
consider the situation where the robot continuously manipulating objects inside
a bin until the answer to the question is found. Besides, a novel dataset that
contains a variety of object models, scenarios and corresponding
question-answer pairs is established in a simulation environment. Extensive
experiments have been conducted to validate the effectiveness of the proposed
framework.
- Abstract(参考訳): 本稿では,ロボットが与えられた質問に答えるために,ロボットが環境を変える操作行動を行う新しいタスクであるマニピュレーション質問応答(mqa)を提案する。
この問題を解決するために,QAモジュールと操作モジュールからなるフレームワークを提案する。
QAモジュールでは,視覚質問応答(VQA)タスクの手法を採用する。
操作モジュールには、ロボットが環境と対話するための操作アクションを生成するために、Deep Q Network(DQN)モデルが設計されている。
質問への回答が見つかるまで,ロボットがビン内のオブジェクトを継続的に操作する状況を考える。
さらに、シミュレーション環境において、さまざまなオブジェクトモデル、シナリオ、および対応する質問応答ペアを含む新しいデータセットを確立する。
提案手法の有効性を検証するため, 大規模な実験を行った。
関連論文リスト
- MATCH POLICY: A Simple Pipeline from Point Cloud Registration to Manipulation Policies [25.512068008948603]
MATCH POLICYは、高精度なピックと配置タスクを解決するパイプラインである。
アクション推論をポイントクラウド登録タスクに転送する。
非常に高いサンプル効率と、目に見えない構成への一般化性を実現する。
論文 参考訳(メタデータ) (2024-09-23T20:09:43Z) - Multi-LLM QA with Embodied Exploration [55.581423861790945]
未知環境における質問応答におけるマルチエンボディードLEMエクスプローラ(MELE)の利用について検討する。
複数のLSMベースのエージェントが独立して家庭用環境に関する質問を探索し、回答する。
各問合せに対して1つの最終回答を生成するために,異なるアグリゲーション手法を解析する。
論文 参考訳(メタデータ) (2024-06-16T12:46:40Z) - Map-based Modular Approach for Zero-shot Embodied Question Answering [9.234108543963568]
EQA(Embodied Question Answering)は、ロボットが新しい環境でナビゲートできる能力を評価するためのベンチマークタスクである。
本稿では,実世界のロボットが未知の環境を探索・地図化できるように,EQAに対するマップベースのモジュラーアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-26T13:10:59Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Learning Extrinsic Dexterity with Parameterized Manipulation Primitives [8.7221770019454]
我々は、オブジェクトのポーズを変えるために環境を利用する一連のアクションを学習する。
我々のアプローチは、オブジェクトとグリップと環境の間の相互作用を利用してオブジェクトの状態を制御することができる。
拘束されたテーブルトップワークスペースから様々な重量,形状,摩擦特性の箱状物体を選別する手法の評価を行った。
論文 参考訳(メタデータ) (2023-10-26T21:28:23Z) - Answering Ambiguous Questions via Iterative Prompting [84.3426020642704]
オープンドメインの質問応答では、質問のあいまいさのため、複数の妥当な回答が存在する可能性がある。
ひとつのアプローチは、すべての有効な回答を直接予測することですが、これは、妥当性と多様性のバランスに苦労する可能性があります。
本稿では,あいまいな疑問に答える既存手法の欠陥に対処するため,AmbigPromptを提案する。
論文 参考訳(メタデータ) (2023-07-08T04:32:17Z) - H-SAUR: Hypothesize, Simulate, Act, Update, and Repeat for Understanding
Object Articulations from Interactions [62.510951695174604]
The Hypothesize, Simulate, Act, Update, and Repeat (H-SAUR) is a probabilistic generative framework that generated hypotheses about objects articulate given input observed。
提案手法は,現在最先端のオブジェクト操作フレームワークよりも優れていることを示す。
我々は、学習に基づく視覚モデルから学習前の学習を統合することにより、H-SAURのテスト時間効率をさらに向上する。
論文 参考訳(メタデータ) (2022-10-22T18:39:33Z) - How to Build Robust FAQ Chatbot with Controllable Question Generator? [5.680871239968297]
本稿では, セマンティックグラフを用いて, 高い品質, 多様性, 制御可能なサンプルを生成する手法を提案する。
流動的でセマンティックに生成されたQAペアは、我々の通過検索モデルをうまく騙すことができる。
生成されたデータセットは、新しいターゲット領域へのQAモデルの一般化性を向上させる。
論文 参考訳(メタデータ) (2021-11-18T12:54:07Z) - Understanding Unnatural Questions Improves Reasoning over Text [54.235828149899625]
生テキストに対する複雑な質問応答(CQA)は難しい課題である。
効果的なCQAモデルを学ぶには、大量の人間が注釈付けしたデータが必要である。
我々は、自然の人間生成の質問を非自然の機械生成の質問に投影することで、高品質なプログラマ(パーザ)を学ぶという課題に対処する。
論文 参考訳(メタデータ) (2020-10-19T10:22:16Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。