論文の概要: Unsupervised Lexical Acquisition of Relative Spatial Concepts Using
Spoken User Utterances
- arxiv url: http://arxiv.org/abs/2106.08574v1
- Date: Wed, 16 Jun 2021 06:44:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-18 05:10:59.921925
- Title: Unsupervised Lexical Acquisition of Relative Spatial Concepts Using
Spoken User Utterances
- Title(参考訳): 音声ユーザ発話を用いた相対空間概念の教師なし語彙獲得
- Authors: Rikunari Sagara (1), Ryo Taguchi (1), Akira Taniguchi (2), Tadahiro
Taniguchi (2), Koosuke Hattori (3), Masahiro Hoguro (3), Taizo Umezaki (3)
((1) Nagoya Institute of Technology, (2) Ritsumeikan University, (3) Chubu
University)
- Abstract要約: フレキシブルな音声対話システムを持つロボットは、言語表現を取得できなければならない。
相対的な空間概念は私たちの日常生活で広く使われている。
ロボットが相対空間概念を学ぶとき、どの物体が参照対象であるかは明らかではない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes methods for unsupervised lexical acquisition for relative
spatial concepts using spoken user utterances. A robot with a flexible spoken
dialog system must be able to acquire linguistic representation and its meaning
specific to an environment through interactions with humans as children do.
Specifically, relative spatial concepts (e.g., front and right) are widely used
in our daily lives, however, it is not obvious which object is a reference
object when a robot learns relative spatial concepts. Therefore, we propose
methods by which a robot without prior knowledge of words can learn relative
spatial concepts. The methods are formulated using a probabilistic model to
estimate the proper reference objects and distributions representing concepts
simultaneously. The experimental results show that relative spatial concepts
and a phoneme sequence representing each concept can be learned under the
condition that the robot does not know which located object is the reference
object. Additionally, we show that two processes in the proposed method improve
the estimation accuracy of the concepts: generating candidate word sequences by
class n-gram and selecting word sequences using location information.
Furthermore, we show that clues to reference objects improve accuracy even
though the number of candidate reference objects increases.
- Abstract(参考訳): 本稿では,音声ユーザ発話を用いた相対空間概念の教師なし語彙獲得手法を提案する。
柔軟な対話システムを持つロボットは、子供のように人間との対話を通じて、環境に固有の言語表現とその意味を取得できなければならない。
特に、私たちの日常生活では、相対的な空間的概念(例えば、前面と右側)が広く使われているが、ロボットが相対的な空間的概念を学ぶとき、どの物体が参照対象であるかは明らかではない。
そこで本稿では,単語の事前知識のないロボットが相対空間概念を学習できる手法を提案する。
これらの手法は確率モデルを用いて定式化され、適切な参照オブジェクトと概念を表す分布を同時に推定する。
実験結果から,ロボットがどの位置の物体が参照対象であるかを知らない条件下で,相対空間概念と各概念を表す音素列を学習できることが示唆された。
さらに,提案手法では,n-gramクラスによる候補単語列の生成と,位置情報を用いた単語列の選択という,概念の精度向上を図る。
さらに,参照対象の候補数が増加しても,参照対象への手がかりが精度を向上させることを示す。
関連論文リスト
- Visual Affordance Prediction for Guiding Robot Exploration [56.17795036091848]
我々は,ロボット探索を導くための視覚能力の学習手法を開発した。
VQ-VAEの潜伏埋め込み空間における条件分布の学習にはTransformerベースのモデルを用いる。
本稿では,ロボット操作における視覚的目標条件付きポリシー学習において,目標サンプリング分布として機能することで探索を導くために,トレーニングされた余裕モデルをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2023-05-28T17:53:09Z) - ConceptBeam: Concept Driven Target Speech Extraction [69.85003619274295]
本研究では,ConceptBeamと呼ばれる意味情報に基づくターゲット音声抽出のための新しいフレームワークを提案する。
提案手法では,概念記述子を共有埋め込み空間にマッピングすることにより,概念を意味埋め込みとして符号化する。
我々は、モダリティに依存した情報、すなわち混合中の音声セグメント、および特定のモダリティに依存しない概念をブリッジするためにそれを使用する。
論文 参考訳(メタデータ) (2022-07-25T08:06:07Z) - Discovering Concepts in Learned Representations using Statistical
Inference and Interactive Visualization [0.76146285961466]
概念発見は、深層学習の専門家とモデルエンドユーザーの間のギャップを埋めるために重要である。
現在のアプローチには、手作りの概念データセットと、それを潜在空間方向に変換することが含まれる。
本研究では,複数の仮説テストに基づく意味ある概念のユーザ発見と,インタラクティブな可視化に関する2つのアプローチを提案する。
論文 参考訳(メタデータ) (2022-02-09T22:29:48Z) - LanguageRefer: Spatial-Language Model for 3D Visual Grounding [72.7618059299306]
3次元視覚的グラウンドリング問題に対する空間言語モデルを構築した。
本稿では,ReferIt3Dが提案する視覚言語データセットに対して,本モデルが競合的に動作することを示す。
論文 参考訳(メタデータ) (2021-07-07T18:55:03Z) - Understanding Synonymous Referring Expressions via Contrastive Features [105.36814858748285]
画像とオブジェクトインスタンスレベルでのコントラスト機能を学ぶためのエンドツーエンドのトレーニング可能なフレームワークを開発しています。
提案アルゴリズムをいくつかのベンチマークデータセットで評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-04-20T17:56:24Z) - Perspective-corrected Spatial Referring Expression Generation for
Human-Robot Interaction [5.0726912337429795]
ヒトとロボットの相互作用に対する新しい視点補正空間参照表現生成手法(PcSREG)を提案する。
表現生成のタスクは、多様な空間関係単位を生成するプロセスに簡略化される。
提案手法をロボットシステムに実装し,実験により,より効果的な空間参照表現を生成できることを示す。
論文 参考訳(メタデータ) (2021-04-04T08:00:02Z) - Spatial Language Understanding for Object Search in Partially Observed
Cityscale Environments [21.528770932332474]
空間言語観測空間を導入し、部分観測可能なマルコフ決定プロセス(POMDP)の枠組みの下でモデルを定式化する。
本稿では,言語提供者の参照の相対的フレーム(FoR)の環境コンテキストを予測する畳み込みニューラルネットワークモデルを提案する。
本稿では,FOR予測モデルとオブジェクト探索システムの一般化可能性を示す。
論文 参考訳(メタデータ) (2020-12-04T16:27:59Z) - SIRI: Spatial Relation Induced Network For Spatial Description
Resolution [64.38872296406211]
言語誘導型ローカライゼーションのための新しい関係誘導型ネットワーク(SIRI)を提案する。
提案手法は,80ピクセルの半径で測定した精度で,最先端手法よりも約24%優れていた。
提案手法は,Touchdownと同じ設定で収集した拡張データセットをうまく一般化する。
論文 参考訳(メタデータ) (2020-10-27T14:04:05Z) - Understanding Spatial Relations through Multiple Modalities [78.07328342973611]
オブジェクト間の空間的関係は、空間的前置詞として表されるか、移動、歩行、移動などの空間的動詞によって表される。
画像中の2つの実体間の暗黙的・明示的な空間的関係を推定するタスクを導入する。
本研究では、テキスト情報と視覚情報の両方を用いて空間関係を予測し、物体の位置情報と大きさ情報と画像埋め込みを利用するモデルを設計する。
論文 参考訳(メタデータ) (2020-07-19T01:35:08Z) - Spatial Concept-Based Navigation with Human Speech Instructions via
Probabilistic Inference on Bayesian Generative Model [8.851071399120542]
本研究の目的は,移動ロボットが人間の音声によるナビゲーション作業を行うことを可能にすることである。
音声指示下での経路軌道の空間確率分布として経路計画が定式化された。
提案手法の有効性をシミュレータや実環境において検証するために,取得した空間概念を用いた人間の指導に基づく経路計画法を実証した。
論文 参考訳(メタデータ) (2020-02-18T05:35:29Z) - Learning Object Placements For Relational Instructions by Hallucinating
Scene Representations [26.897316325189205]
単一入力画像から空間関係の集合に対する画素単位の物体配置確率を推定するための畳み込みニューラルネットワークを提案する。
本手法では,オブジェクトの画素関係確率や3次元モデルに対して,地上の真理データを必要としない。
実世界のデータと人間ロボット実験を用いて,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-01-23T12:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。