論文の概要: Assisted Perception: Optimizing Observations to Communicate State
- arxiv url: http://arxiv.org/abs/2008.02840v1
- Date: Thu, 6 Aug 2020 19:08:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 07:03:22.285872
- Title: Assisted Perception: Optimizing Observations to Communicate State
- Title(参考訳): Assisted Perception: コミュニケーション状態に対する観測の最適化
- Authors: Siddharth Reddy, Sergey Levine, Anca D. Dragan
- Abstract要約: 我々は、ロボット遠隔操作や視覚障害のあるナビゲーションといったタスクにおいて、ユーザが世界の状態を見積もるのを支援することを目的としている。
ユーザによって処理された場合、より正確な内部状態推定につながる新しい観測結果を合成する。
- 参考スコア(独自算出の注目度): 112.40598205054994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We aim to help users estimate the state of the world in tasks like robotic
teleoperation and navigation with visual impairments, where users may have
systematic biases that lead to suboptimal behavior: they might struggle to
process observations from multiple sensors simultaneously, receive delayed
observations, or overestimate distances to obstacles. While we cannot directly
change the user's internal beliefs or their internal state estimation process,
our insight is that we can still assist them by modifying the user's
observations. Instead of showing the user their true observations, we
synthesize new observations that lead to more accurate internal state estimates
when processed by the user. We refer to this method as assistive state
estimation (ASE): an automated assistant uses the true observations to infer
the state of the world, then generates a modified observation for the user to
consume (e.g., through an augmented reality interface), and optimizes the
modification to induce the user's new beliefs to match the assistant's current
beliefs. We evaluate ASE in a user study with 12 participants who each perform
four tasks: two tasks with known user biases -- bandwidth-limited image
classification and a driving video game with observation delay -- and two with
unknown biases that our method has to learn -- guided 2D navigation and a lunar
lander teleoperation video game. A different assistance strategy emerges in
each domain, such as quickly revealing informative pixels to speed up image
classification, using a dynamics model to undo observation delay in driving,
identifying nearby landmarks for navigation, and exaggerating a visual
indicator of tilt in the lander game. The results show that ASE substantially
improves the task performance of users with bandwidth constraints, observation
delay, and other unknown biases.
- Abstract(参考訳): 我々は,ロボット遠隔操作や視覚障害のあるナビゲーションといったタスクにおいて,複数のセンサからの観測を同時に処理したり,遅延した観察を受信したり,障害物への過大な距離を見積もったりすることで,ユーザが最適動作につながる体系的なバイアスを経験する上で,世界の状態を推定することを支援することを目的としている。
ユーザの内的信念や内的状態推定プロセスを直接変更することはできないが,ユーザの観察を変更することで,ユーザを支援することができる,というのが私たちの見解だ。
ユーザの本当の観察を見せる代わりに,ユーザによって処理された内部状態をより正確に推定する新たな観測を合成する。
本手法を補助状態推定 (ASE) と呼ぶ: 自動化されたアシスタントは、真の観測を用いて世界の状態を推定し、ユーザが消費する(例えば拡張現実インターフェースを通じて)ように修正された観察を生成し、その修正を最適化して、アシスタントの現在の信念に合うように、ユーザの新しい信念を誘導する。
ユーザが既知のユーザのバイアスを持つ2つのタスク – 帯域制限の画像分類と観察遅延を持つ駆動型ビデオゲーム – と,我々の方法が学習しなければならない未知のバイアスを持つ2つのタスク – を2Dナビゲーションと月面着陸機遠隔操作ゲームでガイドした。
画像分類を高速化するために情報ピクセルを素早く明らかにする、ダイナミックスモデルを使用して運転中の観察遅延を解き放つ、ナビゲーションのための近くのランドマークを特定し、ランダーゲームにおける傾きの視覚的指標を誇張する、といった異なる支援戦略が各ドメインに現れる。
その結果,aseは帯域幅の制約や観測遅延,その他未知のバイアスにより,ユーザのタスク性能が大幅に向上することがわかった。
関連論文リスト
- Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - What User Behaviors Make the Differences During the Process of Visual
Analytics? [1.5285292154680246]
本研究では,ユーザ行動の包括的データ収集と時系列分類手法を用いた分析手法を提案する。
ユーザスタディでは,デスクトップと没入型2種類の可視化システムを用いて,多様な可視化タスクのユーザ行動を収集している。
この結果から,視覚分析の過程でユーザ行動の区別が可能であり,ユーザの身体行動とそれらが実行する可視化タスクとの間には強い関連性があることが判明した。
論文 参考訳(メタデータ) (2023-11-01T17:45:52Z) - Bootstrapping Adaptive Human-Machine Interfaces with Offline
Reinforcement Learning [82.91837418721182]
適応インターフェイスは、ユーザがシーケンシャルな意思決定タスクを実行するのに役立つ。
近年のヒューマン・イン・ザ・ループ・機械学習の進歩により、ユーザとの対話によってこのようなシステムが改善されている。
本稿では,生のコマンド信号をアクションにマッピングするインタフェースを訓練するための強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-07T16:52:27Z) - Revealing User Familiarity Bias in Task-Oriented Dialogue via Interactive Evaluation [17.41434948048325]
我々は,現実的なシナリオに対して,TODシステムがいかに脆弱であるかを明らかにするために,インタラクティブなユーザスタディを実施している。
我々の研究は、オープンゴール設定での会話がシステムの破滅的な失敗につながることを明らかにした。
我々は,システムの能力を超えても,システムがユーザの要求を処理するふりをする,新たな“予測”行動を発見した。
論文 参考訳(メタデータ) (2023-05-23T09:24:53Z) - HOOV: Hand Out-Of-View Tracking for Proprioceptive Interaction using
Inertial Sensing [25.34222794274071]
HOOVは、VRユーザーが視野外の物体と対話できる手首回りのセンシング手法である。
単一手首の慣性センサの信号に基づいて,HOOVはユーザの手の位置を3空間で連続的に推定する。
我々の新しいデータ駆動手法は,手の位置と軌道を,手振りの連続的な推定から予測する。
論文 参考訳(メタデータ) (2023-03-13T11:25:32Z) - First Contact: Unsupervised Human-Machine Co-Adaptation via Mutual
Information Maximization [112.40598205054994]
我々はこのアイデアを、インターフェースを最適化するための完全に教師なしの目的として定式化する。
タイピング,シミュレートされたロボットの制御,ゲームプレイなど,様々なキーボードとアイアイのインタフェースを運用しているユーザの540K例について,観察的研究を行った。
以上の結果から,我々の相互情報スコアは,様々な領域における真真正タスク完了メトリクスの予測値であることが示唆された。
論文 参考訳(メタデータ) (2022-05-24T21:57:18Z) - Adversarial Imitation Learning from Video using a State Observer [50.45370139579214]
我々は、状態オブザーバVGAIfO-SOを用いた観測から生成した視覚的逆効果という新しいアルゴリズムを導入する。
VGAIfO-SOは、新しい自己監督状態オブザーバを用いて、サンプルの非効率性に対処しようとする。
いくつかの連続制御環境において,VGAIfO-SOはビデオのみによる実演から学習において,他のifOアルゴリズムよりもサンプリング効率が高いことを示す。
論文 参考訳(メタデータ) (2022-02-01T06:46:48Z) - Deep Multi-Task Learning for Joint Localization, Perception, and
Prediction [68.50217234419922]
本稿では,ローカライズエラー下の最先端の自律性スタックで発生する問題について検討する。
我々は,認識,予測,局所化を共同で行うシステムの設計を行う。
本アーキテクチャでは,両タスク間の計算を再利用し,効率よくローカライズエラーを修正できる。
論文 参考訳(メタデータ) (2021-01-17T17:20:31Z) - Data-Driven Distributed State Estimation and Behavior Modeling in Sensor
Networks [5.817715558396024]
センサネットワークにおける状態推定と行動学習の同時学習の問題を定式化する。
本稿では,ガウス過程に基づくベイズフィルタ(GP-BayesFilters)をオンライン分散環境に拡張することで,シンプルで効果的な解を提案する。
提案手法の有効性は,マルチロボットプラットフォームから収集した合成データとデータの両方を用いて,未知の動作行動を持つ物体の追跡に評価される。
論文 参考訳(メタデータ) (2020-09-22T21:31:18Z) - Learning Navigation Costs from Demonstration in Partially Observable
Environments [24.457042947946025]
本稿では、未知の部分観測可能な環境における安全かつ効率的な自律ナビゲーションを実現するために、逆強化学習(IRL)に焦点を当てる。
本研究では, 確率的占有エンコーダと, 占有特性に繰り返し依存するコストエンコーダの2つの部分からなるコスト関数表現を開発する。
本モデルは,ロボットナビゲーションタスクにおけるベースラインIRLアルゴリズムの精度を上回り,トレーニングとテストタイム推論の効率を大幅に向上させる。
論文 参考訳(メタデータ) (2020-02-26T17:15:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。