論文の概要: Real-time single image depth perception in the wild with handheld
devices
- arxiv url: http://arxiv.org/abs/2006.05724v1
- Date: Wed, 10 Jun 2020 08:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 06:19:34.624805
- Title: Real-time single image depth perception in the wild with handheld
devices
- Title(参考訳): ハンドヘルドデバイスを用いた野生のリアルタイム単一画像奥行き知覚
- Authors: Filippo Aleotti, Giulio Zaccaroni, Luca Bartolomei, Matteo Poggi,
Fabio Tosi, Stefano Mattoccia
- Abstract要約: 主な2つの問題は、電球内のハンドヘルドデバイスからの深さ推定を制限している。
適切なネットワーク設計とトレーニング戦略を採用する上で,どちらも対処可能な方法を示す。
実時間深度認識型拡張現実とスマートフォンによる画像ぼやけに関する実験結果について報告する。
- 参考スコア(独自算出の注目度): 45.26484111468387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depth perception is paramount to tackle real-world problems, ranging from
autonomous driving to consumer applications. For the latter, depth estimation
from a single image represents the most versatile solution, since a standard
camera is available on almost any handheld device. Nonetheless, two main issues
limit its practical deployment: i) the low reliability when deployed
in-the-wild and ii) the demanding resource requirements to achieve real-time
performance, often not compatible with such devices. Therefore, in this paper,
we deeply investigate these issues showing how they are both addressable
adopting appropriate network design and training strategies -- also outlining
how to map the resulting networks on handheld devices to achieve real-time
performance. Our thorough evaluation highlights the ability of such fast
networks to generalize well to new environments, a crucial feature required to
tackle the extremely varied contexts faced in real applications. Indeed, to
further support this evidence, we report experimental results concerning
real-time depth-aware augmented reality and image blurring with smartphones
in-the-wild.
- Abstract(参考訳): 深度知覚は、自動運転から消費者アプリケーションまで、現実世界の問題に取り組む上で最も重要である。
後者では、標準カメラはほとんどのハンドヘルドデバイスで利用できるため、単一の画像からの深度推定が最も多用途なソリューションである。
それでも、主な問題は2つある。
一 被配備時の信頼性の低いもの
二 リアルタイムな性能を達成するために要求される資源要件であって、しばしばそのような装置と互換性がないこと。
そこで,本稿では,ネットワーク設計とトレーニング戦略の適切な適用方法と,ハンドヘルドデバイスにネットワークをマップしてリアルタイムのパフォーマンスを実現する方法について,これらの課題を深く検討する。
我々の徹底的な評価は、このような高速ネットワークが新しい環境にうまく適応できる能力を強調しており、これは実際のアプリケーションで直面する極めて多様な状況に対処するために必要な重要な機能である。
実際、この証拠をさらに裏付けるために、リアルタイムの奥行き認識拡張現実とスマートフォンによる画像のぼやけに関する実験結果を報告します。
関連論文リスト
- Agile gesture recognition for low-power applications: customisation for generalisation [41.728933551492275]
自動手ジェスチャー認識は、長い間AIコミュニティの焦点だった。
低消費電力センサデバイスで動作するジェスチャー認識技術への需要が高まっている。
本研究では,適応的およびアジャイル的誤り訂正を用いたパターン認識システムのための新しい手法を提示する。
論文 参考訳(メタデータ) (2024-03-12T19:34:18Z) - Unveiling the Depths: A Multi-Modal Fusion Framework for Challenging
Scenarios [103.72094710263656]
本稿では,学習に基づくフレームワークを用いて,支配的モダリティの奥行きを識別し,統合する手法を提案する。
本稿では,信頼度予測ネットワークを操り,潜在電位深度領域を特定する信頼マップを作成する新しい信頼損失を提案する。
得られた信頼度マップを用いて,最終深度をエンドツーエンドに融合するマルチモーダル融合ネットワークを提案する。
論文 参考訳(メタデータ) (2024-02-19T04:39:16Z) - A Comprehensive Study of Real-Time Object Detection Networks Across
Multiple Domains: A Survey [9.861721674777877]
ディープニューラルネットワークに基づくオブジェクト検出器は継続的に進化しており、様々な用途で使用されている。
安全クリティカルなアプリケーションは高い精度と信頼性を必要とするが、低遅延タスクにはリソースとエネルギー効率のネットワークが必要である。
既存のネットワークの基準ベンチマークは存在せず、新しいネットワークを設計するための標準評価ガイドラインも存在しない。
論文 参考訳(メタデータ) (2022-08-23T12:01:16Z) - Efficient High-Resolution Deep Learning: A Survey [90.76576712433595]
スマートフォン、衛星、医療機器などの現代の機器のカメラは、非常に高解像度の画像やビデオを撮影することができる。
このような高解像度データは、がん検出、自動道路ナビゲーション、天気予報、監視、農業プロセスの最適化、その他多くの応用のためのディープラーニングモデルによって処理される。
ディープラーニングモデルの直接入力として高解像度の画像とビデオを使用することで、パラメータの多さ、計算コスト、推論レイテンシ、GPUメモリ使用量など、多くの課題が生じる。
文献におけるいくつかの研究は、高解像度データの課題に対処し、ハードウェアの制限に従いながら精度とスピードを改善するために、より良い代替案を提案する。
論文 参考訳(メタデータ) (2022-07-26T17:13:53Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - Monitoring social distancing with single image depth estimation [39.79652626235862]
単一画像深度推定は、他の深度認識手法の代替となる可能性がある。
私たちのフレームワークは、純粋なCPUシステムでも、競争相手に対して合理的に高速かつコンパラブルに動作できます。
論文 参考訳(メタデータ) (2022-04-04T17:58:02Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z) - YOLOpeds: Efficient Real-Time Single-Shot Pedestrian Detection for Smart
Camera Applications [2.588973722689844]
この研究は、スマートカメラアプリケーションにおけるディープラーニングに基づく歩行者検出の効率的な展開のために、精度と速度の良好なトレードオフを達成するという課題に対処する。
分離可能な畳み込みに基づいて計算効率の良いアーキテクチャを導入し、層間密結合とマルチスケール機能融合を提案する。
全体として、YOLOpedsは、既存のディープラーニングモデルよりも86%の速度で、毎秒30フレーム以上のリアルタイム持続的な操作を提供する。
論文 参考訳(メタデータ) (2020-07-27T09:50:11Z) - Deploying Image Deblurring across Mobile Devices: A Perspective of
Quality and Latency [11.572636762286775]
携帯型ネットワークアーキテクチャを探索し、モバイルデバイス間で品質と品質のトレードオフを改善する。
本稿では,レイテンシと画質の両方について詳細な解析を行うための総合的な実験と比較を行った。
私たちの知る限りでは、この論文はモバイルデバイス全体にわたるイメージデブラリングタスクのすべてのデプロイ問題に対処する最初の論文です。
論文 参考訳(メタデータ) (2020-04-27T06:32:53Z) - DeFeat-Net: General Monocular Depth via Simultaneous Unsupervised
Representation Learning [65.94499390875046]
DeFeat-Netは、クロスドメインの高密度な特徴表現を同時に学習するアプローチである。
提案手法は, 誤差対策を全て10%程度減らすことで, 最先端技術よりも優れる。
論文 参考訳(メタデータ) (2020-03-30T13:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。