論文の概要: On the Issues of TrueDepth Sensor Data for Computer Vision Tasks Across
Different iPad Generations
- arxiv url: http://arxiv.org/abs/2201.10865v1
- Date: Wed, 26 Jan 2022 10:53:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-27 14:09:01.948758
- Title: On the Issues of TrueDepth Sensor Data for Computer Vision Tasks Across
Different iPad Generations
- Title(参考訳): iPad 世代間でのコンピュータビジョンタスクにおけるTrueDepth Sensor Data の課題
- Authors: Steffen Urban, Thomas Lindemeier, David Dobbelstein, Matthias Haenel
- Abstract要約: Appleは2017年にiPhone XでTrueDepthセンサーを導入した。
本稿では,iPhone,iPadの各世代を含む各種デバイスにおけるTrueDepthデータの信頼性について検討する。
テスト対象のiPadには、2つの異なる重要な問題があります。
- 参考スコア(独自算出の注目度): 0.9323529082566345
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In 2017 Apple introduced the TrueDepth sensor with the iPhone X release.
Although its primary use case is biometric face recognition, the exploitation
of accurate depth data for other computer vision tasks like segmentation,
portrait image generation and metric 3D reconstruction seems natural and lead
to the development of various applications. In this report, we investigate the
reliability of TrueDepth data - accessed through two different APIs - on
various devices including different iPhone and iPad generations and reveal two
different and significant issues on all tested iPads.
- Abstract(参考訳): 2017年、AppleはiPhone XでTrueDepthセンサーを導入した。
その主な用途は生体顔認証であるが、セグメンテーション、ポートレート画像生成、メートル法3D再構成といった他のコンピュータビジョンタスクに対する正確な深度データの利用は自然に見え、様々なアプリケーションの開発に繋がる。
本報告では,iphoneおよびipadの各世代を含む各種デバイスにおけるtruedepthデータの信頼性を調査し,すべてのテスト対象ipadにおける2つの異なる重要な問題を明らかにする。
関連論文リスト
- Digital Twin Tracking Dataset (DTTD): A New RGB+Depth 3D Dataset for
Longer-Range Object Tracking Applications [3.9776693020673677]
デジタルツイン(Digital twin)は、実際のオブジェクトをデジタルオブジェクトで拡張する問題である。
優れたデジタルツインシステムにおける重要なコンポーネントは、リアルタイムで正確な3Dオブジェクト追跡である。
この研究で、Digital Twin Tracking dataset(DTTD)と呼ばれる新しいRGB-Dデータセットを作成します。
論文 参考訳(メタデータ) (2023-02-12T20:06:07Z) - 3D Vision with Transformers: A Survey [114.86385193388439]
自然言語処理におけるトランスフォーマーアーキテクチャの成功は、コンピュータビジョン分野の注目を集めている。
本稿では,異なる3次元視覚タスクのための100以上のトランスフォーマー手法の体系的,徹底的なレビューを行う。
我々は3次元視覚におけるトランスフォーマー設計について議論し、様々な3次元表現でデータを処理できるようにする。
論文 参考訳(メタデータ) (2022-08-08T17:59:11Z) - Rope3D: TheRoadside Perception Dataset for Autonomous Driving and
Monocular 3D Object Detection Task [48.555440807415664]
道路沿いの知覚3Dデータセットに挑戦する最初のハイダイバーシティを提示する。
データセットは50Kイメージと、さまざまなシーンで1.5M以上の3Dオブジェクトで構成されている。
本稿では,様々なセンサや視点によって引き起こされるあいまいさを解決するために,幾何学的制約を活用することを提案する。
論文 参考訳(メタデータ) (2022-03-25T12:13:23Z) - Mobile Behavioral Biometrics for Passive Authentication [65.94403066225384]
本研究は, 単モーダルおよび多モーダルな行動的生体特性の比較分析を行った。
HuMIdbは、最大かつ最も包括的なモバイルユーザインタラクションデータベースである。
我々の実験では、最も識別可能な背景センサーは磁力計であり、タッチタスクではキーストロークで最良の結果が得られる。
論文 参考訳(メタデータ) (2022-03-14T17:05:59Z) - ARKitScenes -- A Diverse Real-World Dataset For 3D Indoor Scene
Understanding Using Mobile RGB-D Data [3.782277759568992]
Kinectのような商用深度センサーは、過去数年間でいくつかのRGB-Dデータセットのリリースを可能にした。
さらに最近では、AppleのiPadとiPhoneでLiDARセンサーがローンチされ、高品質のRGB-Dデータは、一般のデバイスで何百万人もの人にアクセスできるようになりました。
私たちはARKitScenesを紹介します。これは、現在広く利用可能な深度センサーでキャプチャされた最初のRGB-Dデータセットです。
論文 参考訳(メタデータ) (2021-11-17T04:27:01Z) - Facial Masks and Soft-Biometrics: Leveraging Face Recognition CNNs for
Age and Gender Prediction on Mobile Ocular Images [53.913598771836924]
スマートフォンで撮影した自撮り眼画像を使って年齢や性別を推定します。
ImageNet Challengeの文脈で提案された2つの既存の軽量CNNを適応させる。
一部のネットワークは顔認識のためにさらにトレーニングされており、非常に大規模なトレーニングデータベースが利用可能です。
論文 参考訳(メタデータ) (2021-03-31T01:48:29Z) - Deep Continuous Fusion for Multi-Sensor 3D Object Detection [103.5060007382646]
本稿では,LIDARとカメラを併用して高精度な位置検出を実現する3Dオブジェクト検出器を提案する。
我々は,連続畳み込みを利用して画像とlidar特徴マップを異なるレベルの解像度で融合する,エンドツーエンド学習可能なアーキテクチャを設計した。
論文 参考訳(メタデータ) (2020-12-20T18:43:41Z) - SensiX: A Platform for Collaborative Machine Learning on the Edge [69.1412199244903]
センサデータとセンサモデルの間に留まるパーソナルエッジプラットフォームであるSensiXを紹介する。
動作および音声に基づくマルチデバイスセンシングシステムの開発において,その有効性を示す。
評価の結果,SensiXは3mWのオーバヘッドを犠牲にして,全体の精度が7~13%向上し,環境のダイナミクスが最大30%向上することがわかった。
論文 参考訳(メタデータ) (2020-12-04T23:06:56Z) - Geometry-Aware Instance Segmentation with Disparity Maps [27.46005453288228]
ステレオカメラを利用するセンサフュージョンの新しい方向を探究する。
格差から得られる幾何学的情報は、同じまたは異なるクラスの重複するオブジェクトを分離するのに役立ちます。
マスク回帰は擬似ライダーと画像ベース表現を用いた2D,2.5D,3DROIに基づく。
論文 参考訳(メタデータ) (2020-06-14T05:03:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。