論文の概要: Dynamic Object Comprehension: A Framework For Evaluating Artificial
Visual Perception
- arxiv url: http://arxiv.org/abs/2202.08490v1
- Date: Thu, 17 Feb 2022 07:49:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-18 14:29:39.579366
- Title: Dynamic Object Comprehension: A Framework For Evaluating Artificial
Visual Perception
- Title(参考訳): Dynamic Object Comprehension: 人工的な視覚知覚を評価するフレームワーク
- Authors: Scott Y.L. Chin, Bradley R. Quinton
- Abstract要約: AugmentedとMixed Realityは、おそらくモバイルインターネットの後継として浮上している。
これらのシステムの主要な要件の1つは、物理世界と仮想世界の間の連続性を作成する能力である。
現在の評価基準はこれらの応用には不十分である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Augmented and Mixed Reality are emerging as likely successors to the mobile
internet. However, many technical challenges remain. One of the key
requirements of these systems is the ability to create a continuity between
physical and virtual worlds, with the user's visual perception as the primary
interface medium. Building this continuity requires the system to develop a
visual understanding of the physical world. While there has been significant
recent progress in computer vision and AI techniques such as image
classification and object detection, success in these areas has not yet led to
the visual perception required for these critical MR and AR applications. A
significant issue is that current evaluation criteria are insufficient for
these applications. To motivate and evaluate progress in this emerging area,
there is a need for new metrics. In this paper we outline limitations of
current evaluation criteria and propose new criteria.
- Abstract(参考訳): AugmentedとMixed Realityは、おそらくモバイルインターネットの後継として浮上している。
しかし、多くの技術的課題が残っている。
これらのシステムの重要な要件の1つは、物理的な世界と仮想世界の間の連続性を作り出す能力であり、ユーザの視覚知覚が主要なインターフェイス媒体である。
この連続性を構築するには、物理的な世界を視覚的に理解する必要がある。
コンピュータビジョンや画像分類やオブジェクト検出などのai技術は近年大きく進歩しているが、これらの領域での成功は、これらの重要なmrやarアプリケーションに必要な視覚認識にはまだ繋がっていない。
重要な問題は、これらのアプリケーションに現在の評価基準が不十分であることだ。
この新興分野の進歩を動機づけ、評価するには、新しいメトリクスが必要である。
本稿では,現在の評価基準の限界を概説し,新しい基準を提案する。
関連論文リスト
- Challenges for Monocular 6D Object Pose Estimation in Robotics [15.748415939460866]
ロボット工学とコンピュータビジョンの両方から、最近の出版物について統一された視点を提供する。
我々は,オクルージョン処理,新しいポーズ表現,カテゴリーレベルのポーズ推定の形式化と改善が依然として基本的な課題であることがわかった。
これらの問題に対処するためには、オントロジ的推論、変形可能性処理、シーンレベルの推論、現実的なデータセット、アルゴリズムの生態的フットプリントを改善する必要がある。
論文 参考訳(メタデータ) (2023-07-22T21:36:57Z) - Let's ViCE! Mimicking Human Cognitive Behavior in Image Generation
Evaluation [96.74302670358145]
生成/編集された画像と対応するプロンプト/インストラクションの整合性を評価するために,視覚概念評価(ViCE)の自動手法を提案する。
ViCEは、Large Language Models(LLM)とVisual Question Answering(VQA)の強みを統合パイプラインに統合し、品質評価において人間の認知プロセスを再現することを目指している。
論文 参考訳(メタデータ) (2023-07-18T16:33:30Z) - Fairness meets Cross-Domain Learning: a new perspective on Models and
Metrics [80.07271410743806]
クロスドメイン学習(CD)とモデルフェアネスの関係について検討する。
いくつかの人口集団にまたがる顔画像と医療画像のベンチマークと、分類とローカライゼーションタスクについて紹介する。
本研究は,3つの最先端フェアネスアルゴリズムとともに,14のCDアプローチをカバーし,前者が後者に勝ることを示す。
論文 参考訳(メタデータ) (2023-03-25T09:34:05Z) - Deep Learning for Event-based Vision: A Comprehensive Survey and
Benchmarks [88.44377206798484]
イベントカメラはバイオインスパイアされたセンサーで、ピクセルごとの強度の変化を非同期に捉える。
深層学習(DL)はこの新興分野に導入され、その可能性のマイニングに活発な研究努力にインスピレーションを与えている。
我々は、イベントベースのビジョンのためのDL技術の最新の開発に焦点をあてて、包括的で詳細な調査を初めて実施する。
論文 参考訳(メタデータ) (2023-02-17T14:19:28Z) - Universal Object Detection with Large Vision Model [79.06618136217142]
本研究は,大規模多領域普遍物体検出問題に焦点をあてる。
これらの課題に対処するために,ラベル処理,階層型設計,資源効率のよいモデルトレーニングを提案する。
本手法は,ロバスト・ビジョン・チャレンジ2022のオブジェクト検出トラックにおいて,優れた2位の地位を確保した。
論文 参考訳(メタデータ) (2022-12-19T12:40:13Z) - Visual Probing and Correction of Object Recognition Models with
Interactive user feedback [2.8101673772585736]
本稿では,オブジェクト認識モデルの不確かさを可視化し,ユーザフィードバックによる修正プロセスを提案する。
VAST 2020 Mini-Challenge 2が提供するデータに対するアプローチを実証します。
論文 参考訳(メタデータ) (2020-12-29T00:36:12Z) - Survey on the Analysis and Modeling of Visual Kinship: A Decade in the
Making [66.72253432908693]
親和性認識は多くの実践的応用において難しい問題である。
我々は、多くの人にその見解を刺激した公開リソースとデータ課題についてレビューする。
10周年記念には、さまざまなkinベースのタスクのためのデモコードが用意されている。
論文 参考訳(メタデータ) (2020-06-29T13:25:45Z) - An Exploration of Embodied Visual Exploration [97.21890864063872]
身体的コンピュータビジョンは、新しい非構造環境におけるロボットに対する知覚を考慮に入れている。
既存の視覚探索アルゴリズムの分類を提示し、それらをベンチマークするための標準フレームワークを作成する。
次に,提案フレームワークを用いた4つの最先端パラダイムの徹底的な実証的研究を行った。
論文 参考訳(メタデータ) (2020-01-07T17:40:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。