論文の概要: Efficient data-driven encoding of scene motion using Eccentricity
- arxiv url: http://arxiv.org/abs/2103.02743v1
- Date: Wed, 3 Mar 2021 23:11:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-05 15:00:11.294852
- Title: Efficient data-driven encoding of scene motion using Eccentricity
- Title(参考訳): Eccentricityを用いたシーンモーションの効率的なデータ駆動エンコーディング
- Authors: Bruno Costa, Enrique Corona, Mostafa Parchami, Gint Puskorius, Dimitar
Filev
- Abstract要約: 本稿では,映像・映像ストリームから生成した静的マップを用いて動的視覚シーンを表現する新しい手法を提案する。
地図はピクセル単位で計算された2次元行列であり、偏心データ解析の概念に基づいている。
潜在的なアプリケーションのリストには、ビデオベースのアクティビティ認識、意図認識、オブジェクト追跡、ビデオ記述が含まれる。
- 参考スコア(独自算出の注目度): 0.993963191737888
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a novel approach of representing dynamic visual scenes
with static maps generated from video/image streams. Such representation allows
easy visual assessment of motion in dynamic environments. These maps are 2D
matrices calculated recursively, in a pixel-wise manner, that is based on the
recently introduced concept of Eccentricity data analysis. Eccentricity works
as a metric of a discrepancy between a particular pixel of an image and its
normality model, calculated in terms of mean and variance of past readings of
the same spatial region of the image. While Eccentricity maps carry temporal
information about the scene, actual images do not need to be stored nor
processed in batches. Rather, all the calculations are done recursively, based
on a small amount of statistical information stored in memory, thus resulting
in a very computationally efficient (processor- and memory-wise) method. The
list of potential applications includes video-based activity recognition,
intent recognition, object tracking, video description, and so on.
- Abstract(参考訳): 本稿では,映像・映像ストリームから生成した静的マップを用いて動的視覚シーンを表現する新しい手法を提案する。
このような表現は、動的環境における動きの視覚的評価を容易にする。
これらのマップは、最近導入されたEccentricityデータ分析の概念に基づいて、再帰的に計算された2D行列である。
偏心性は、画像の特定のピクセルとその正規性モデルとの差の計量として機能し、画像の同じ空間領域の過去の読み値の平均とばらつきによって計算される。
偏心マップはシーンに関する時間的情報を持っているが、実際の画像をバッチに保存したり処理したりする必要はない。
むしろ、全ての計算は、メモリに格納された少数の統計情報に基づいて再帰的に行われ、非常に計算効率のよい(プロセッサとメモリの)方法をもたらす。
潜在的なアプリケーションのリストには、ビデオベースのアクティビティ認識、意図認識、オブジェクト追跡、ビデオ記述などが含まれる。
関連論文リスト
- Deep scene-scale material estimation from multi-view indoor captures [9.232860902853048]
本稿では,物理的なレンダリングが可能なデジタルアセットを自動生成する学習ベースのアプローチを提案する。
提案手法は, 最寄りの解に比べて少ない時間で近似材料マップを生成する。
論文 参考訳(メタデータ) (2022-11-15T10:58:28Z) - Neural Groundplans: Persistent Neural Scene Representations from a
Single Image [90.04272671464238]
本稿では,シーンの2次元画像観察を永続的な3次元シーン表現にマッピングする手法を提案する。
本稿では,永続的でメモリ効率のよいシーン表現として,条件付きニューラルグラウンドプランを提案する。
論文 参考訳(メタデータ) (2022-07-22T17:41:24Z) - ImPosIng: Implicit Pose Encoding for Efficient Camera Pose Estimation [2.6808541153140077]
暗黙の詩。
(ImPosing)はイメージとカメラのポーズを2つの別々のニューラルネットワークで共通の潜在表現に埋め込む。
階層的な方法で潜在空間を通して候補を評価することにより、カメラの位置と向きを直接回帰するのではなく、洗練する。
論文 参考訳(メタデータ) (2022-05-05T13:33:25Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - A Novel Upsampling and Context Convolution for Image Semantic
Segmentation [0.966840768820136]
最近のセマンティックセグメンテーションの方法は、しばしば深い畳み込みニューラルネットワークを用いたエンコーダデコーダ構造を採用している。
ネットワーク内の画像の空間情報を効率的に保存するために,ガイドフィルタに基づく高密度アップサンプリング畳み込み法を提案する。
ADE20KとPascal-Contextのベンチマークデータセットでは,それぞれ82.86%,81.62%の画素精度を記録した。
論文 参考訳(メタデータ) (2021-03-20T06:16:42Z) - Event-based Motion Segmentation with Spatio-Temporal Graph Cuts [51.17064599766138]
イベントベースカメラで取得したオブジェクトを独立に識別する手法を開発した。
この方法は、予想される移動物体の数を事前に決定することなく、技術状態よりも同等以上の性能を発揮する。
論文 参考訳(メタデータ) (2020-12-16T04:06:02Z) - Cross-Descriptor Visual Localization and Mapping [81.16435356103133]
視覚のローカライゼーションとマッピングは、Mixed Realityとロボティクスシステムの大部分を支える重要な技術である。
特徴表現の連続的な更新を必要とする局所化とマッピングのための3つの新しいシナリオを提案する。
我々のデータ駆動型アプローチは特徴記述子型に非依存であり、計算要求が低く、記述アルゴリズムの数と線形にスケールする。
論文 参考訳(メタデータ) (2020-12-02T18:19:51Z) - Self-supervised Video Representation Learning by Uncovering
Spatio-temporal Statistics [74.6968179473212]
本稿では,自己指導型学習問題に対処する新しい前提課題を提案する。
最大運動の空間的位置や支配的な方向など,分割的・時間的統計的な要約を連続して計算する。
ビデオフレームを入力として与えられた統計的要約を得るために、ニューラルネットワークを構築して訓練する。
論文 参考訳(メタデータ) (2020-08-31T08:31:56Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。