論文の概要: Fast and Accurate Camera Scene Detection on Smartphones
- arxiv url: http://arxiv.org/abs/2105.07869v1
- Date: Mon, 17 May 2021 14:06:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 14:55:06.542063
- Title: Fast and Accurate Camera Scene Detection on Smartphones
- Title(参考訳): スマートフォンの高速かつ高精度カメラシーン検出
- Authors: Angeline Pouget, Sidharth Ramesh, Maximilian Giang, Ramithan
Chandrapalan, Toni Tanner, Moritz Prussing, Radu Timofte, Andrey Ignatov
- Abstract要約: 本稿では,11K以上の手動クロール画像を含むカメラシーン検出データセット(CamSDD)を提案する。
本研究では,このデータセット上で上位3の99.5%の精度を示す,効率的かつNPU対応のCNNモデルを提案する。
- 参考スコア(独自算出の注目度): 51.424407411660376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI-powered automatic camera scene detection mode is nowadays available in
nearly any modern smartphone, though the problem of accurate scene prediction
has not yet been addressed by the research community. This paper for the first
time carefully defines this problem and proposes a novel Camera Scene Detection
Dataset (CamSDD) containing more than 11K manually crawled images belonging to
30 different scene categories. We propose an efficient and NPU-friendly CNN
model for this task that demonstrates a top-3 accuracy of 99.5% on this dataset
and achieves more than 200 FPS on the recent mobile SoCs. An additional
in-the-wild evaluation of the obtained solution is performed to analyze its
performance and limitation in the real-world scenarios. The dataset and
pre-trained models used in this paper are available on the project website.
- Abstract(参考訳): AIを利用した自動カメラシーン検出モードは、現在、ほぼすべての現代のスマートフォンで利用可能であるが、正確なシーン予測の問題はまだ研究コミュニティによって解決されていない。
本稿では,この問題を慎重に定義し,30の異なるシーンカテゴリに属する11K以上の手動クロール画像を含むカメラシーン検出データセット(CamSDD)を提案する。
本研究では,この課題に対する効率良くnpuフレンドリーなcnnモデルを提案し,99.5%のtop-3精度を示し,最近のモバイルsocで200fps以上を達成した。
実世界のシナリオにおけるその性能と限界を分析するために、得られたソリューションをさらに内部で評価する。
本論文で使用するデータセットと事前トレーニング済みモデルは,プロジェクトのwebサイトで公開されている。
関連論文リスト
- Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering [54.468355408388675]
カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築した。
カメラ選択を最適化するために,多様性に基づくサンプリングアルゴリズムを適用した。
IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが含まれています。
論文 参考訳(メタデータ) (2024-09-11T08:36:49Z) - Robust Frame-to-Frame Camera Rotation Estimation in Crowded Scenes [8.061773364318313]
本稿では,携帯型モノクロビデオから,混み合った現実世界のシーンにおけるカメラ回転推定手法を提案する。
我々は、17の動画シーケンスに対して、高精度で厳密に検証された地上真実を持つ新しいデータセットとベンチマークを提供する。
これは、混み合ったシーンに対する強力な新しいパフォーマンスポイントであり、コンピュータビジョンにとって重要な設定である。
論文 参考訳(メタデータ) (2023-09-15T17:44:07Z) - Efficient Single Object Detection on Image Patches with Early Exit
Enhanced High-Precision CNNs [0.0]
本稿では,RoboCup Standard Platform Leagueの文脈における移動ロボットを用いた物体検出手法を提案する。
この課題は、様々な照明条件と高速な動きによって引き起こされるぼやけた画像において、ダイナミックな物体を検出することである。
この課題に対処するために,計算に制約のあるロボットプラットフォーム用に設計された畳み込みニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-09-07T07:23:55Z) - CabiNet: Scaling Neural Collision Detection for Object Rearrangement
with Procedural Scene Generation [54.68738348071891]
私たちはまず、さまざまな日常環境において、650万以上の散らばったシーン(前よりも桁違いに多い)を生成します。
このデータから合成部分点雲をレンダリングし、それをCabiNetモデルアーキテクチャのトレーニングに使用します。
CabiNetは、オブジェクトとシーンポイントの雲を受け入れる衝突モデルである。
論文 参考訳(メタデータ) (2023-04-18T21:09:55Z) - Realistic Bokeh Effect Rendering on Mobile GPUs, Mobile AI & AIM 2022
challenge: Report [75.79829464552311]
この課題は、最新のスマートフォンモデルで実行できる効率的なエンドツーエンドのAIベースのレンダリングアプローチを開発することだった。
得られたモデルはKirin 9000のMali GPUで評価され、多くのディープラーニングオプティマスに対して優れた加速結果が得られた。
論文 参考訳(メタデータ) (2022-11-07T22:42:02Z) - BCOT: A Markerless High-Precision 3D Object Tracking Benchmark [15.8625561193144]
実動物体の正確な3次元ポーズを推定するためのマルチビュー手法を提案し, 両眼データを用いてモノクロテクスチャレス3次元物体追跡のための新しいベンチマークを構築した。
オブジェクト中心モデルに基づいて、すべてのビューにおいて形状再投影制約を最小化することにより、オブジェクトのポーズを協調的に最適化する。
新しいベンチマークデータセットには、20のテクスチャレスオブジェクト、22のシーン、404の動画シーケンス、126Kの画像が含まれています。
論文 参考訳(メタデータ) (2022-03-25T03:55:03Z) - Bridging the Gap between Events and Frames through Unsupervised Domain
Adaptation [57.22705137545853]
本稿では,ラベル付き画像とラベル付きイベントデータを用いてモデルを直接訓練するタスク転送手法を提案する。
生成イベントモデルを利用して、イベント機能をコンテンツとモーションに分割します。
われわれのアプローチは、イベントベースのニューラルネットワークのトレーニングのために、膨大な量の既存の画像データセットをアンロックする。
論文 参考訳(メタデータ) (2021-09-06T17:31:37Z) - Fast and Accurate Quantized Camera Scene Detection on Smartphones,
Mobile AI 2021 Challenge: Report [65.91472671013302]
我々は、量子化ディープラーニングベースのカメラシーン分類ソリューションを開発することを目的とした、最初のMobile AIチャレンジを紹介する。
提案されたソリューションは、すべての主要なモバイルAIアクセラレータと完全に互換性があり、最近のスマートフォンプラットフォームの大部分で100-200 FPS以上を実証することができる。
論文 参考訳(メタデータ) (2021-05-17T13:55:38Z) - CoordiNet: uncertainty-aware pose regressor for reliable vehicle
localization [3.4386226615580107]
ロボット工学および自動運転車応用のためのニューラルネットワークを用いた視覚カメラのローカライゼーションについて検討する。
私たちのソリューションは、単一の画像から直接カメラポーズを予測するCNNベースのアルゴリズムです。
提案手法は,29cmの中央値誤差を1.9kmループで達成し,信頼性の高い代替案であることを示す。
論文 参考訳(メタデータ) (2021-03-19T13:32:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。