論文の概要: Deep Residual Network based food recognition for enhanced Augmented
Reality application
- arxiv url: http://arxiv.org/abs/2005.04292v2
- Date: Fri, 26 Jun 2020 17:47:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 13:10:43.399748
- Title: Deep Residual Network based food recognition for enhanced Augmented
Reality application
- Title(参考訳): 強化拡張現実アプリケーションのためのディープ残留ネットワークに基づく食品認識
- Authors: Siddarth S, Sainath G, Vignesh S
- Abstract要約: カメラ画像から現状の物体の特徴を検出できるシステムを用いて、拡張現実の応用を強化することができる。
本研究の目的は、より健康的な生活選択を促進するために、食事に関する栄養情報を提供することで、利用者を支援するために低レイテンシ支援ARを作成するのに最適なモデルを決定することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural network based learning approaches is widely utilized for image
classification or object detection based problems with remarkable outcomes.
Realtime Object state estimation of objects can be used to track and estimate
the features that the object of the current frame possesses without causing any
significant delay and misclassification. A system that can detect the features
of such objects in the present state from camera images can be used to enhance
the application of Augmented Reality for improving user experience and
delivering information in a much perceptual way. The focus behind this paper is
to determine the most suitable model to create a low-latency assistance AR to
aid users by providing them nutritional information about the food that they
consume in order to promote healthier life choices. Hence the dataset has been
collected and acquired in such a manner, and we conduct various tests in order
to identify the most suitable DNN in terms of performance and complexity and
establish a system that renders such information realtime to the user.
- Abstract(参考訳): 深層ニューラルネットワークに基づく学習手法は,画像分類や物体検出に広く利用されている。
オブジェクトのリアルタイムオブジェクト状態推定は、現在のフレームのオブジェクトが保持している特徴を、重大な遅延や誤分類を引き起こすことなく追跡し、推定するために使用することができる。
カメラ画像から現在の状態にある物体の特徴を検出できるシステムは、ユーザー体験を改善し、より知覚的な方法で情報を配信するために拡張現実の適用を強化するために使用できる。
本研究の目的は,利用者が消費する食品に関する栄養情報を提供し,より健康的な生活選択を促進することによる,低遅延支援arの作成に最も適したモデルを決定することである。
そのため、このような方法でデータセットを収集し、取得し、パフォーマンスと複雑さの観点から最も適したDNNを特定し、そのような情報をユーザにリアルタイムにレンダリングするシステムを確立するために様々なテストを行う。
関連論文リスト
- Descriptor: Face Detection Dataset for Programmable Threshold-Based Sparse-Vision [0.8271394038014485]
このデータセットは、Aff-Wild2で使用されるのと同じビデオから派生した顔検出タスクのための注釈付き、時間閾値ベースの視覚データセットである。
我々は,このリソースが時間差閾値に基づいて処理できるスマートセンサに基づく堅牢な視覚システムの開発を支援することを期待する。
論文 参考訳(メタデータ) (2024-10-01T03:42:03Z) - Augmented Commonsense Knowledge for Remote Object Grounding [67.30864498454805]
エージェントナビゲーションを改善するための時間的知識グラフとして,コモンセンス情報を活用するための拡張コモンセンス知識モデル(ACK)を提案する。
ACKは知識グラフ対応のクロスモーダルとコンセプトアグリゲーションモジュールで構成され、視覚的表現と視覚的テキストデータアライメントを強化する。
我々は、より正確な局所的な行動予測につながるコモンセンスに基づく意思決定プロセスのための新しいパイプラインを追加します。
論文 参考訳(メタデータ) (2024-06-03T12:12:33Z) - Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。
近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。
本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-01T17:32:26Z) - Evaluation of Environmental Conditions on Object Detection using Oriented Bounding Boxes for AR Applications [7.022872089444935]
拡張現実(AR)におけるシーン分析と物体認識の役割
性能と処理時間を改善するために,検出・認識深層ネットワークを備えた配向境界ボックスを用いた新しい手法が提案されている。
その結果, 提案手法は, 試験条件のほとんどにおいて, 平均精度が向上し, 小型物体の精度が向上する傾向が示唆された。
論文 参考訳(メタデータ) (2023-06-29T09:17:58Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - FoVolNet: Fast Volume Rendering using Foveated Deep Neural Networks [33.489890950757975]
FoVolNetはボリュームデータ可視化の性能を大幅に向上させる手法である。
我々は、焦点付近のボリュームを疎結合にサンプリングし、ディープニューラルネットワークを用いてフルフレームを再構築する、費用対効果の高いフェーベレートレンダリングパイプラインを開発した。
論文 参考訳(メタデータ) (2022-09-20T19:48:56Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Object-based Illumination Estimation with Rendering-aware Neural
Networks [56.01734918693844]
個々の物体とその局所画像領域のRGBD外観から高速環境光推定手法を提案する。
推定照明により、仮想オブジェクトは実際のシーンと一貫性のあるシェーディングでARシナリオでレンダリングできる。
論文 参考訳(メタデータ) (2020-08-06T08:23:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。