Fugu-MT 論文翻訳(概要): The Un-Kidnappable Robot: Acoustic Localization of Sneaking People

論文の概要: The Un-Kidnappable Robot: Acoustic Localization of Sneaking People

arxiv url: http://arxiv.org/abs/2310.03743v2
Date: Thu, 9 May 2024 17:59:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-10 18:19:06.762003
Title: The Un-Kidnappable Robot: Acoustic Localization of Sneaking People
Title（参考訳）: 眠れないロボット:スニーカーの音像の定位化
Authors: Mengyu Yang, Patrick Grady, Samarth Brahmbhatt, Arun Balajee Vasudevan, Charles C. Kemp, James Hays,
Abstract要約: 室内で動く人々の360度RGBデータと組み合わせて、高品質な4チャンネルオーディオのロボットデータセットを収集する。音声のみを使用して、近くに動く人物と位置を予測できるモデルを訓練する。本手法をロボットに実装することにより,受動的音声センサのみを用いて,一人の人物が静かに動くことを追跡できる。
参考スコア（独自算出の注目度）: 25.494191141691616
License: http://creativecommons.org/licenses/by/4.0/
Abstract: How easy is it to sneak up on a robot? We examine whether we can detect people using only the incidental sounds they produce as they move, even when they try to be quiet. We collect a robotic dataset of high-quality 4-channel audio paired with 360 degree RGB data of people moving in different indoor settings. We train models that predict if there is a moving person nearby and their location using only audio. We implement our method on a robot, allowing it to track a single person moving quietly with only passive audio sensing. For demonstration videos, see our project page: https://sites.google.com/view/unkidnappable-robot
Abstract（参考訳）: ロボットに忍び寄るのは、どれくらい簡単か? 静かでいようとも、移動時に発生する偶発的な音のみを用いて人を検出することができるかどうかを検討する。室内で動く人々の360度RGBデータと組み合わせて、高品質な4チャンネルオーディオのロボットデータセットを収集する。音声のみを使用して、近くに動く人物と位置を予測できるモデルを訓練する。本手法をロボットに実装することにより,受動的音声センサのみを用いて,一人の人物が静かに動くことを追跡できる。デモビデオをご覧ください。 https://sites.google.com/view/unkidnappable-robot

関連論文リスト

ANAVI: Audio Noise Awareness using Visuals of Indoor environments for NAVIgation [26.460679530665487]
より静かなロボット経路計画のためのNAVIgationのための室内視覚を用いた騒音認識手法を提案する。我々は、模擬住宅の異なるリスナー場所で「インパルス」の音の大きさのデータを生成し、音響騒音予測器(ANP)を訓練する。動作音響とANPを統合し,車輪付きロボット(Hello Robot Stretch)と脚付きロボット(Unitree Go2)を用いて,これらのロボットが環境の騒音制約に適合するように実験を行った。
論文参考訳（メタデータ） (2024-10-24T17:19:53Z)
Generalizable Humanoid Manipulation with 3D Diffusion Policies [41.23383596258797]
我々は、ヒューマノイドロボットによる自律的な操作の問題を解決するために、現実世界のロボットシステムを構築している。本システムは主に,人型ロボットデータを取得するための全身ロボット遠隔操作システムと,高さ調整可能なカートと3D LiDARセンサを備えた25-DoFヒューマノイドロボットプラットフォームの統合である。 1つのシーンで収集されたデータのみを使用し、オンボードコンピューティングのみで、フルサイズのヒューマノイドロボットが様々な現実世界のシナリオで自律的にスキルを発揮できることが示される。
論文参考訳（メタデータ） (2024-10-14T17:59:00Z)
Imitation of human motion achieves natural head movements for humanoid robots in an active-speaker detection task [2.8220015774219567]
頭の動きは社会的人間と人間の相互作用に不可欠である。そこで本研究では,直型ヒューマノイドロボットの頭部運動生成に生成型AIパイプラインを用いた。その結果,会話中の話者を積極的に追跡しながら,人間の頭部の動きを自然に模倣することに成功した。
論文参考訳（メタデータ） (2024-07-16T17:08:40Z)
Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文参考訳（メタデータ） (2024-05-02T17:56:55Z)
Giving Robots a Hand: Learning Generalizable Manipulation with Eye-in-Hand Human Video Demonstrations [66.47064743686953]
眼内カメラは、視覚に基づくロボット操作において、より優れたサンプル効率と一般化を可能にすることを約束している。一方、人間がタスクを行うビデオは、ロボット遠隔操作の専門知識を欠いているため、収集コストがずっと安い。本研究では,広範にラベルのない人間ビデオによるロボット模倣データセットを拡張し,眼球運動ポリシーの一般化を大幅に促進する。
論文参考訳（メタデータ） (2023-07-12T07:04:53Z)
Learning Video-Conditioned Policies for Unseen Manipulation Tasks [83.2240629060453]
ビデオ条件付きポリシー学習は、以前は目に見えないタスクの人間のデモをロボット操作スキルにマッピングする。我々は,現在のシーン観察と対象課題のビデオから適切なアクションを生成するためのポリシーを学習する。われわれは,多タスクロボット操作環境の課題と,技術面における性能の面から,そのアプローチを検証した。
論文参考訳（メタデータ） (2023-05-10T16:25:42Z)
Open-World Object Manipulation using Pre-trained Vision-Language Models [72.87306011500084]
ロボットが人からの指示に従うためには、人間の語彙の豊かな意味情報を繋げなければならない。我々は、事前学習された視覚言語モデルを利用して、オブジェクト識別情報を抽出するシンプルなアプローチを開発する。実際の移動マニピュレータにおける様々な実験において、MOOはゼロショットを様々な新しいオブジェクトカテゴリや環境に一般化する。
論文参考訳（メタデータ） (2023-03-02T01:55:10Z)
Human-to-Robot Imitation in the Wild [50.49660984318492]
本研究では,第三者の視点からの学習を中心に,効率的なワンショットロボット学習アルゴリズムを提案する。実世界における20種類の操作タスクを含む,ワンショットの一般化と成功を示す。
論文参考訳（メタデータ） (2022-07-19T17:59:59Z)
Robot Sound Interpretation: Learning Visual-Audio Representations for Voice-Controlled Robots [0.0]
画像と音声コマンドを最小限の監督で関連付ける表現を学習する。この表現を用いて、強化学習を用いてロボットタスクを学習する本質的な報酬関数を生成する。提案手法は, 様々な音響タイプやロボット作業において, 従来の作業よりも優れていたことを示す。
論文参考訳（メタデータ） (2021-09-07T02:26:54Z)
Know Thyself: Transferable Visuomotor Control Through Robot-Awareness [22.405839096833937]
新しいロボットをスクラッチからトレーニングするためには、通常大量のロボット固有のデータを生成する必要がある。簡単なロボット「自己認識」を活用する「ロボット認識」ソリューションパラダイムを提案する。シミュレーションおよび実際のロボットにおけるテーブルトップ操作に関する実験により、これらのプラグインの改善により、ビジュモータコントローラの転送性が劇的に向上することを示した。
論文参考訳（メタデータ） (2021-07-19T17:56:04Z)
Self-supervised reinforcement learning for speaker localisation with the iCub humanoid robot [58.2026611111328]
人の顔を見ることは、ノイズの多い環境での音声のフィルタリングに人間が依存するメカニズムの1つである。スピーカーに目を向けるロボットを持つことは、挑戦的な環境でのASRのパフォーマンスに恩恵をもたらす可能性がある。本稿では,人間の初期発達に触発された自己指導型強化学習フレームワークを提案する。
論文参考訳（メタデータ） (2020-11-12T18:02:15Z)
I can attend a meeting too! Towards a human-like telepresence avatar robot to attend meeting on your behalf [8.512048419752047]
遠隔会議に参加することができるテレプレゼンスロボットに焦点をあてる。より優れた会議体験を実現するため、ロボットは話者をローカライズし、話者を視角の中央に持ってくる必要がある。本稿では,テレプレゼンス会議シナリオにおけるアテンションシフト方式の検討と実装について述べる。
論文参考訳（メタデータ） (2020-06-28T16:43:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。