論文の概要: Disentangled Sequence Clustering for Human Intention Inference
- arxiv url: http://arxiv.org/abs/2101.09500v1
- Date: Sat, 23 Jan 2021 13:39:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-19 10:40:23.917734
- Title: Disentangled Sequence Clustering for Human Intention Inference
- Title(参考訳): 人間の意図推論のための不連続配列クラスタリング
- Authors: Mark Zolotas, Yiannis Demiris
- Abstract要約: Disentangled Sequence Clustering Variational Autoencoder (DiSCVAE)
Disentangled Sequence Clustering Variational Autoencoder (DiSCVAE)
- 参考スコア(独自算出の注目度): 40.46123013107865
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Equipping robots with the ability to infer human intent is a vital
precondition for effective collaboration. Most computational approaches towards
this objective employ probabilistic reasoning to recover a distribution of
"intent" conditioned on the robot's perceived sensory state. However, these
approaches typically assume task-specific notions of human intent (e.g.
labelled goals) are known a priori. To overcome this constraint, we propose the
Disentangled Sequence Clustering Variational Autoencoder (DiSCVAE), a
clustering framework that can be used to learn such a distribution of intent in
an unsupervised manner. The DiSCVAE leverages recent advances in unsupervised
learning to derive a disentangled latent representation of sequential data,
separating time-varying local features from time-invariant global aspects.
Though unlike previous frameworks for disentanglement, the proposed variant
also infers a discrete variable to form a latent mixture model and enable
clustering of global sequence concepts, e.g. intentions from observed human
behaviour. To evaluate the DiSCVAE, we first validate its capacity to discover
classes from unlabelled sequences using video datasets of bouncing digits and
2D animations. We then report results from a real-world human-robot interaction
experiment conducted on a robotic wheelchair. Our findings glean insights into
how the inferred discrete variable coincides with human intent and thus serves
to improve assistance in collaborative settings, such as shared control.
- Abstract(参考訳): ロボットに人間の意図を推測する能力を備えることは、効果的なコラボレーションにとって重要な前提条件である。
この目的へのほとんどの計算的アプローチは、ロボットの知覚状態に基づく「意図的」な条件の分布を回復するために確率論的推論を用いる。
しかしながら、これらのアプローチは通常、人間の意図(例えば、タスク固有の概念)を仮定する。
ラベル付きゴール)は先験として知られている。
この制約を克服するために,このような意図の分布を教師なしで学習できるクラスタリングフレームワークであるdisentangled sequence clustering variational autoencoder (discvae)を提案する。
DiSCVAEは、教師なし学習の最近の進歩を活用して、時系列データの非絡み合った潜在表現を導き、時間変化の局所的な特徴を時間不変のグローバルな側面から分離する。
従来のアンタングルメントのフレームワークとは異なり、提案された変種は離散変数を推論して潜在混合モデルを形成し、グローバルシーケンスの概念のクラスタリングを可能にする。
観察された人間の行動からの意図。
そこで本研究では,まず2dアニメーションを用いたビデオデータセットを用いて,ラベルなしシーケンスからクラスを探索する能力を検証する。
次に,ロボット車椅子を用いた実世界ロボットインタラクション実験の結果を報告する。
本研究は,推定された離散変数が人間の意図とどのように一致するかに関する知見を収集し,共有制御などの協調的な設定における支援の改善に寄与することを示す。
関連論文リスト
- Unified Dynamic Scanpath Predictors Outperform Individually Trained Neural Models [18.327960366321655]
本研究では,ビデオ中のスキャンパスを予測するために,ディープラーニングに基づくソーシャルキュー統合モデルを構築した。
我々は,自由視聴条件下で観察された動的な社会シーンの視線に対するアプローチを評価した。
結果は、すべての観察者のスキャンパスに基づいて訓練された単一の統一モデルが、個別に訓練されたモデルよりも同等以上のパフォーマンスを示すことを示している。
論文 参考訳(メタデータ) (2024-05-05T13:15:11Z) - Gaussian Mixture Models for Affordance Learning using Bayesian Networks [50.18477618198277]
Affordancesはアクション、オブジェクト、エフェクト間の関係の基本的な記述である。
本稿では,世界を探究し,その感覚経験から自律的にこれらの余裕を学習するエンボディエージェントの問題にアプローチする。
論文 参考訳(メタデータ) (2024-02-08T22:05:45Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Predicting Human Mobility via Self-supervised Disentanglement Learning [21.61423193132924]
本稿では,次のPOI予測問題に対処するため,SSDLと呼ばれる新しい解を提案する。
本研究では,人間の本質的な周期性と常に変化する意図の理解を高めるために,二つの現実的な軌道拡張手法を提案する。
4つの実世界のデータセットで実施された大規模な実験により、提案したSSDLは最先端のアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-11-17T16:17:22Z) - H-SAUR: Hypothesize, Simulate, Act, Update, and Repeat for Understanding
Object Articulations from Interactions [62.510951695174604]
The Hypothesize, Simulate, Act, Update, and Repeat (H-SAUR) is a probabilistic generative framework that generated hypotheses about objects articulate given input observed。
提案手法は,現在最先端のオブジェクト操作フレームワークよりも優れていることを示す。
我々は、学習に基づく視覚モデルから学習前の学習を統合することにより、H-SAURのテスト時間効率をさらに向上する。
論文 参考訳(メタデータ) (2022-10-22T18:39:33Z) - SCIM: Simultaneous Clustering, Inference, and Mapping for Open-World
Semantic Scene Understanding [34.19666841489646]
本研究では,ロボットが未知の環境を探索する際に,新しいセマンティッククラスを自律的に発見し,既知のクラスの精度を向上させる方法を示す。
セグメンテーションモデルを更新するための自己教師付き学習信号を生成するために,マッピングとクラスタリングのための一般的なフレームワークを開発する。
特に、デプロイ中にクラスタリングパラメータをどのように最適化するかを示し、複数の観測モダリティの融合が、以前の作業と比べて新しいオブジェクト発見を改善することを示す。
論文 参考訳(メタデータ) (2022-06-21T18:41:51Z) - Active Uncertainty Learning for Human-Robot Interaction: An Implicit
Dual Control Approach [5.05828899601167]
暗黙的な二重制御パラダイムに基づくループ内動作計画のための不確実性学習を実現するアルゴリズムを提案する。
提案手法は,動的プログラミングモデル予測制御問題のサンプリングに基づく近似に依拠する。
結果として得られたポリシーは、連続的およびカテゴリー的不確実性を持つ一般的な人間の予測モデルに対する二重制御効果を維持することが示されている。
論文 参考訳(メタデータ) (2022-02-15T20:40:06Z) - Hybrid Dynamic Contrast and Probability Distillation for Unsupervised
Person Re-Id [109.1730454118532]
非監督的人物再識別(Re-Id)は、リードワールドビデオ監視システムにおける実践的応用により注目されている。
本稿では,ハイブリッド動的クラスタコントラストと確率蒸留アルゴリズムを提案する。
教師なしRe-Id問題を局所-言語的ダイナミックコントラスト学習と自己教師付き確率蒸留の枠組みに統合する。
論文 参考訳(メタデータ) (2021-09-29T02:56:45Z) - Beyond Tracking: Using Deep Learning to Discover Novel Interactions in
Biological Swarms [3.441021278275805]
本稿では,システムレベルの状態を全体像から直接予測するディープ・ネットワーク・モデルを提案する。
結果の予測モデルは、人間の理解した予測モデルに基づいていないため、説明モジュールを使用する。
これは、行動生態学における人工知能の例である。
論文 参考訳(メタデータ) (2021-08-20T22:50:41Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。