論文の概要: Integrative Object and Pose to Task Detection for an
Augmented-Reality-based Human Assistance System using Neural Networks
- arxiv url: http://arxiv.org/abs/2008.13419v1
- Date: Mon, 31 Aug 2020 08:24:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 07:27:34.663493
- Title: Integrative Object and Pose to Task Detection for an
Augmented-Reality-based Human Assistance System using Neural Networks
- Title(参考訳): ニューラルネットワークを用いた拡張現実型ヒューマンアシストシステムにおける統合オブジェクトとタスク検出
- Authors: Linh K\"astner, Leon Eversberg, Marina Mursa, Jens Lambrecht
- Abstract要約: 本稿では,作業者の複雑な手作業を支援するために,AugmentedRealityに基づくヒューマンアシストシステムを提案する。
具体的には、Augmented Realityとオブジェクトとアクション検出器を組み合わせて、より直感的で柔軟なものにします。
その結果、未訓練労働者のタスク完了までの時間が大幅に短縮され、エラー率も低下した。
- 参考スコア(独自算出の注目度): 3.0969191504482247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a result of an increasingly automatized and digitized industry, processes
are becoming more complex. Augmented Reality has shown considerable potential
in assisting workers with complex tasks by enhancing user understanding and
experience with spatial information. However, the acceptance and integration of
AR into industrial processes is still limited due to the lack of established
methods and tedious integration efforts. Meanwhile, deep neural networks have
achieved remarkable results in computer vision tasks and bear great prospects
to enrich Augmented Reality applications . In this paper, we propose an
Augmented-Reality-based human assistance system to assist workers in complex
manual tasks where we incorporate deep neural networks for computer vision
tasks. More specifically, we combine Augmented Reality with object and action
detectors to make workflows more intuitive and flexible. To evaluate our system
in terms of user acceptance and efficiency, we conducted several user studies.
We found a significant reduction in time to task completion in untrained
workers and a decrease in error rate. Furthermore, we investigated the users
learning curve with our assistance system.
- Abstract(参考訳): 自動化され、デジタル化される産業の結果として、プロセスはより複雑になっています。
Augmented Realityは、ユーザ理解と空間情報の体験を高めることで、複雑なタスクを労働者に支援する大きな可能性を示してきた。
しかし, 産業プロセスへのARの受容と統合は, 確立された手法の欠如や, 退屈な統合努力の欠如により, いまだに限られている。
一方、深層ニューラルネットワークはコンピュータビジョンタスクにおいて顕著な成果を上げており、拡張現実アプリケーションを強化する大きな可能性を持っている。
本稿では,コンピュータビジョンタスクにディープニューラルネットワークを組み込んだ複雑な手作業作業を支援する,拡張現実に基づく人力支援システムを提案する。
具体的には、拡張現実とオブジェクトとアクション検出を組み合わせることで、ワークフローをより直感的で柔軟にします。
ユーザ受け入れと効率性の観点からシステムを評価するため,いくつかのユーザ調査を行った。
未訓練作業者の作業完了までの時間が大幅に短縮され,エラー率の低下が確認された。
さらに,支援システムを用いた学習曲線の検討を行った。
関連論文リスト
- Selective Exploration and Information Gathering in Search and Rescue Using Hierarchical Learning Guided by Natural Language Input [5.522800137785975]
本稿では,大規模言語モデル(LLM)と階層的強化学習(HRL)フレームワークを連携させるシステムを提案する。
提案システムは,人間の利害関係者からの言語入力を実用的なRLインサイトへ翻訳し,検索戦略を調整するように設計されている。
LLMによる人為的情報の利用とHRLによるタスク実行の構造化により、長い地平線とスパース報酬を特徴とする環境におけるエージェントの学習効率と意思決定プロセスを大幅に改善する。
論文 参考訳(メタデータ) (2024-09-20T12:27:47Z) - Comprehensive Overview of Reward Engineering and Shaping in Advancing Reinforcement Learning Applications [0.0]
本稿では,強化学習アルゴリズムの効率性と有効性を高めるために,報酬工学と報酬形成の重要性を強調する。
強化学習の大幅な進歩にもかかわらず、いくつかの制限が続いた。
主要な課題の1つは、多くの現実世界のシナリオにおける報酬のまばらで遅れた性質である。
実世界の環境を正確にモデル化することの複雑さと強化学習アルゴリズムの計算要求は、依然としてかなりの障害である。
論文 参考訳(メタデータ) (2024-07-22T09:28:12Z) - Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。
これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。
これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文 参考訳(メタデータ) (2024-06-29T03:37:29Z) - Tactile Active Inference Reinforcement Learning for Efficient Robotic
Manipulation Skill Acquisition [10.072992621244042]
触覚能動推論強化学習(Tactile Active Inference Reinforcement Learning, Tactile-AIRL)と呼ばれるロボット操作におけるスキル学習手法を提案する。
強化学習(RL)の性能を高めるために,モデルに基づく手法と本質的な好奇心をRLプロセスに統合した能動推論を導入する。
本研究では,タスクをプッシュする非包括的オブジェクトにおいて,学習効率が著しく向上することが実証された。
論文 参考訳(メタデータ) (2023-11-19T10:19:22Z) - Computation-efficient Deep Learning for Computer Vision: A Survey [121.84121397440337]
ディープラーニングモデルは、さまざまな視覚的知覚タスクにおいて、人間レベルのパフォーマンスに到達または超えた。
ディープラーニングモデルは通常、重要な計算資源を必要とし、現実のシナリオでは非現実的な電力消費、遅延、または二酸化炭素排出量につながる。
新しい研究の焦点は計算効率のよいディープラーニングであり、推論時の計算コストを最小限に抑えつつ、良好な性能を達成することを目指している。
論文 参考訳(メタデータ) (2023-08-27T03:55:28Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - ASHA: Assistive Teleoperation via Human-in-the-Loop Reinforcement
Learning [91.58711082348293]
オンラインユーザからのフィードバックからシステムのパフォーマンスに関する強化学習は、この問題に対する自然な解決策である。
このアプローチでは、特にフィードバックが不足している場合には、ループ内の大量のトレーニングデータが必要になる傾向があります。
疎いユーザフィードバックから効率的に学習する階層型ソリューションを提案する。
論文 参考訳(メタデータ) (2022-02-05T02:01:19Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Cognitive architecture aided by working-memory for self-supervised
multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。
ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。
1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文 参考訳(メタデータ) (2021-03-16T13:50:24Z) - Building Robust Industrial Applicable Object Detection Models Using
Transfer Learning and Single Pass Deep Learning Architectures [1.1816942730023883]
我々は、オブジェクト検出のタスク専用の深層畳み込みニューラルネットワークが、産業指向のオブジェクト検出パイプラインをどのように改善するかを探求する。
地域提案や分類,確率推定をひとつの実行で統合したディープラーニングアーキテクチャを用いて,リアルタイムのパフォーマンス向上を目指す。
本稿では,これらのアルゴリズムを2つの産業関連アプリケーションに適用し,その1つはアイトラッキングデータにおけるプロモーションボードの検出と,もう1つは拡張現実広告のための倉庫製品のパッケージの検出と認識である。
論文 参考訳(メタデータ) (2020-07-09T09:50:45Z) - A Markerless Deep Learning-based 6 Degrees of Freedom PoseEstimation for
with Mobile Robots using RGB Data [3.4806267677524896]
本稿では,拡張現実デバイス上でリアルタイムな3Dオブジェクトローカライゼーションを実現するために,アートニューラルネットワークの状態をデプロイする手法を提案する。
本研究では,2次元入力のみを用いて物体の3次元ポーズを高速かつ正確に抽出する高速な2次元検出手法に着目する。
2D画像の6Dアノテーションとして,私たちの知る限り,最初のオープンソースツールであるアノテーションツールを開発した。
論文 参考訳(メタデータ) (2020-01-16T09:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。