論文の概要: Learning to Detect Touches on Cluttered Tables
- arxiv url: http://arxiv.org/abs/2304.04687v1
- Date: Mon, 10 Apr 2023 16:06:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 14:22:52.001349
- Title: Learning to Detect Touches on Cluttered Tables
- Title(参考訳): クラッタテーブル上での触覚検出の学習
- Authors: Norberto Adrian Goussies, Kenji Hata, Shruthi Prabhakara, Abhishek
Amit, Tony Aube, Carl Cepress, Diana Chang, Li-Te Cheng, Horia Stefan
Ciurdar, Mike Cleron, Chelsey Fleming, Ashwin Ganti, Divyansh Garg, Niloofar
Gheissari, Petra Luna Grutzik, David Hendon, Daniel Iglesia, Jin Kim, Stuart
Kyle, Chris LaRosa, Roman Lewkow, Peter F McDermott, Chris Melancon, Paru
Nackeeran, Neal Norwitz, Ali Rahimi, Brett Rampata, Carlos Sobrinho, George
Sung, Natalie Zauhar, Palash Nandy
- Abstract要約: 本稿では,リアルタイム,オンデバイス,学習ベースのタッチ検出アルゴリズムを提案する。
我々の研究プロトタイプは、テーブル上の手操作とオブジェクトを組み合わせた一連の体験を可能にします。
- 参考スコア(独自算出の注目度): 3.742593560995338
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel self-contained camera-projector tabletop system with a
lamp form-factor that brings digital intelligence to our tables. We propose a
real-time, on-device, learning-based touch detection algorithm that makes any
tabletop interactive. The top-down configuration and learning-based algorithm
makes our method robust to the presence of clutter, a main limitation of
existing camera-projector tabletop systems. Our research prototype enables a
set of experiences that combine hand interactions and objects present on the
table. A video can be found at https://youtu.be/hElC_c25Fg8.
- Abstract(参考訳): 本稿では,デジタルインテリジェンスをテーブルにもたらすランプフォームファクターを備えた,自己完結型カメラプロジェクタテーブルトップシステムを提案する。
テーブルトップをインタラクティブにするためのリアルタイム,オンデバイス,学習ベースのタッチ検出アルゴリズムを提案する。
トップダウン設定と学習に基づくアルゴリズムは,既存のカメラプロジェクタテーブルトップシステムの主要な制限であるclutterの存在に頑健である。
我々の研究プロトタイプは、テーブル上の手操作とオブジェクトを組み合わせた一連の体験を可能にします。
ビデオはhttps://youtu.be/hElC_c25Fg8で見ることができる。
関連論文リスト
- Object and Contact Point Tracking in Demonstrations Using 3D Gaussian Splatting [17.03927416536173]
本稿では,インタラクティブ・イミテーション・ラーニング(Interactive Imitation Learning, IIL)の手法を提案する。
このアプローチは現在のIILシステムを拡張し、ロボットにオブジェクトとの対話方法、特にドアや引き出しのような複雑な操作方法に関する詳細な知識を提供する。
論文 参考訳(メタデータ) (2024-11-05T23:28:57Z) - Detection, Recognition and Pose Estimation of Tabletop Objects [0.0]
このプロジェクトは、この技術の社会的な応用に焦点を当てている。
一般的なテーブルトップオブジェクトを検出して認識することができるニューラルネットワークモデルを開発した。
ディープラーニングモデルによって予測される特定のオブジェクトの向きは、変換行列の計算に使用できる。
これはピック・アンド・プレイス・ロボットに送って転送を行うことができる。
論文 参考訳(メタデータ) (2024-09-01T23:31:13Z) - Follow Anything: Open-set detection, tracking, and following in
real-time [89.83421771766682]
我々は,物体をリアルタイムで検出,追跡,追跡するロボットシステムを提案する。
私たちのアプローチは、何でも従う"(FAn)と呼ばれ、オープンな語彙とマルチモーダルモデルです。
FAnは軽量(6~8GB)グラフィックカードでラップトップにデプロイでき、毎秒6~20フレームのスループットを実現する。
論文 参考訳(メタデータ) (2023-08-10T17:57:06Z) - Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - Tactile-Filter: Interactive Tactile Perception for Part Mating [54.46221808805662]
人間は触覚と触覚に頼っている。
視覚ベースの触覚センサーは、様々なロボット認識や制御タスクに広く利用されている。
本稿では,視覚に基づく触覚センサを用いた対話的知覚手法を提案する。
論文 参考訳(メタデータ) (2023-03-10T16:27:37Z) - A Simple Baseline for Multi-Camera 3D Object Detection [94.63944826540491]
周囲のカメラで3Dオブジェクトを検出することは、自動運転にとって有望な方向だ。
マルチカメラオブジェクト検出のための簡易ベースラインであるSimMODを提案する。
我々は, nuScenes の3次元オブジェクト検出ベンチマークにおいて, SimMOD の有効性を示す広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-08-22T03:38:01Z) - A Differentiable Recipe for Learning Visual Non-Prehensile Planar
Manipulation [63.1610540170754]
視覚的非包括的平面操作の問題に焦点をあてる。
本稿では,ビデオデコードニューラルモデルと接触力学の先行情報を組み合わせた新しいアーキテクチャを提案する。
モジュラーで完全に差別化可能なアーキテクチャは、目に見えないオブジェクトやモーションの学習専用手法よりも優れていることが分かりました。
論文 参考訳(メタデータ) (2021-11-09T18:39:45Z) - Multi-Type-TD-TSR -- Extracting Tables from Document Images using a
Multi-stage Pipeline for Table Detection and Table Structure Recognition:
from OCR to Structured Table Representations [63.98463053292982]
テーブルの認識は、テーブル検出とテーブル構造認識という2つの主要なタスクから構成される。
最近の研究は、テーブル構造認識のタスクにトランスファーラーニングを併用したディープラーニングアプローチへの明確な傾向を示している。
本稿では,テーブル認識問題に対するエンドツーエンドのソリューションを提供するMulti-Type-TD-TSRというマルチステージパイプラインを提案する。
論文 参考訳(メタデータ) (2021-05-23T21:17:18Z) - MoreFusion: Multi-object Reasoning for 6D Pose Estimation from
Volumetric Fusion [19.034317851914725]
本稿では,複数の既知の物体の接触と隠蔽の正確なポーズを,リアルタイムな多視点視から推定するシステムを提案する。
提案手法は,1枚のRGB-Dビューからの3Dオブジェクトのポーズ提案を行い,カメラが移動すると,複数のビューからのポーズ推定と非パラメトリック占有情報を蓄積する。
提案手法の精度とロバスト性を2つのオブジェクトデータセット(YCB-Video)で実験的に検証する。
論文 参考訳(メタデータ) (2020-04-09T02:29:30Z) - A Robotic 3D Perception System for Operating Room Environment Awareness [3.830091185868436]
手術室(OR)のシーン理解とコンテキスト認識を可能にするダ・ヴィンチ手術システムのための3次元多視点認識システムについて述べる。
このアーキテクチャに基づいて、マルチビュー3Dシーンセマンティックセマンティックセグメンテーションアルゴリズムを作成する。
提案アーキテクチャは、登録エラー(3.3%pm1.4%のオブジェクトカメラ距離)を許容し、シーンセグメンテーション性能を安定的に向上させることができる。
論文 参考訳(メタデータ) (2020-03-20T20:27:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。