論文の概要: NeuralMarker: A Framework for Learning General Marker Correspondence
- arxiv url: http://arxiv.org/abs/2209.08896v1
- Date: Mon, 19 Sep 2022 10:04:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 18:27:44.437986
- Title: NeuralMarker: A Framework for Learning General Marker Correspondence
- Title(参考訳): neuralmarker: 一般的なマーカー対応を学ぶためのフレームワーク
- Authors: Zhaoyang Huang, Xiaokun Pan, Weihong Pan, Weikang Bian, Yan Xu, Ka
Chun Cheung, Guofeng Zhang, Hongsheng Li
- Abstract要約: 本稿では,映画ポスターなどの一般的なマーカーから,そのようなマーカーを捉えた画像への対応性を推定する問題に取り組む。
本稿では,様々な課題条件下で高密度マーカー対応を推定するニューラルネットワークをトレーニングする新しいフレームワークであるNeuralMarkerを提案する。
我々は、NeuralMarkerが従来の手法を大幅に上回り、拡張現実(AR)やビデオ編集など、新しい興味深いアプリケーションを可能にしていることを示す。
- 参考スコア(独自算出の注目度): 25.822657926255573
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We tackle the problem of estimating correspondences from a general marker,
such as a movie poster, to an image that captures such a marker.
Conventionally, this problem is addressed by fitting a homography model based
on sparse feature matching. However, they are only able to handle plane-like
markers and the sparse features do not sufficiently utilize appearance
information. In this paper, we propose a novel framework NeuralMarker, training
a neural network estimating dense marker correspondences under various
challenging conditions, such as marker deformation, harsh lighting, etc.
Besides, we also propose a novel marker correspondence evaluation method
circumstancing annotations on real marker-image pairs and create a new
benchmark. We show that NeuralMarker significantly outperforms previous methods
and enables new interesting applications, including Augmented Reality (AR) and
video editing.
- Abstract(参考訳): 本稿では,映画ポスターなどの一般的なマーカーから,そのようなマーカーを捉えた画像への対応性を推定する問題に取り組む。
従来、この問題はスパース特徴マッチングに基づくホモグラフィーモデルを適用することで解決されている。
しかし、平面的なマーカーしか扱えないため、スパースの特徴は外観情報を十分に活用していない。
本稿では, マーカー変形, 過酷な照明など, 様々な困難な条件下で, 濃密なマーカー対応を推定するニューラルネットワークを訓練する新しいフレームワークであるNeuralMarkerを提案する。
また,実際のマーカーと画像のアノテーションを囲む新しいマーカー対応評価手法を提案し,新しいベンチマークを作成する。
NeuralMarkerは従来の手法よりも大幅に優れており、拡張現実(AR)やビデオ編集など、新しい興味深いアプリケーションを可能にする。
関連論文リスト
- Repurposing Stable Diffusion Attention for Training-Free Unsupervised Interactive Segmentation [1.878433493707693]
インタラクティブなポイントプロンプトベースの画像の最近の進歩は、高品質なセマンティックラベルを得るための手作業を大幅に削減する。
本稿では, 安定拡散の自己注意のみに基づく, 教師なし, トレーニング不要な新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-11-15T18:29:59Z) - New Efficient Visual OILU Markers [0.5120567378386615]
我々は、新しい効率的な視覚マーカーを開発するために基本的なパターンを利用する。
提案したマーカーは、ユニークな識別子の豊富なパネルを生成することができる。
取得および幾何学的歪みに対するマーカーの堅牢性を検証する。
論文 参考訳(メタデータ) (2024-04-12T13:55:05Z) - Guided Interpretable Facial Expression Recognition via Spatial Action Unit Cues [55.97779732051921]
オーキューを分類器学習に明示的に組み込むための新しい学習戦略が提案されている。
分類性能を劣化させることなく階層的解釈性を向上させることができることを示す。
論文 参考訳(メタデータ) (2024-02-01T02:13:49Z) - OsmLocator: locating overlapping scatter marks with a non-training
generative perspective [48.50108853199417]
重複するマークの配置には、テクスチャの欠如、文脈の少ない情報、ハロー形状、小さなサイズなど、多くの困難がある。
ここでは、クラスタリングに基づく再視覚化の最適化問題として、非学習的生成の観点から定式化する。
特に,異なるマーカーと様々な重なり合いの重なり合いを持つ何百もの散乱画像を含む2023というデータセットを構築し,提案手法を既存の手法と比較した。
論文 参考訳(メタデータ) (2023-12-18T12:39:48Z) - A Locality-based Neural Solver for Optical Motion Capture [37.28597049192196]
ノイズの多いマーカーデータから、マーカーと関節を異なるタイプのノードとして扱う異種グラフニューラルネットワークを提案する。
本手法は,隠蔽マーカー位置誤差の予測精度の観点から,最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-09-01T12:40:17Z) - MAPLE: Masked Pseudo-Labeling autoEncoder for Semi-supervised Point
Cloud Action Recognition [160.49403075559158]
本稿では,Pseudo-Labeling autoEncoder (textbfMAPLE) フレームワークを提案する。
特に、MAPLEのバックボーンとして、新規で効率的なtextbfDecoupled textbfspatial-textbftemporal TranstextbfFormer(textbfDestFormer)を設計する。
MAPLEは3つの公開ベンチマークにおいて優れた結果を得て、MSR-Action3の精度を8.08%向上させる。
論文 参考訳(メタデータ) (2022-09-01T12:32:40Z) - Learning Semantic Correspondence with Sparse Annotations [66.37298464505261]
密接な意味的対応を見つけることは、コンピュータビジョンの基本的な問題である。
本研究では,高密度な擬似ラベルを生成するための教師学習パラダイムを提案する。
また、擬似ラベルを識別するための2つの新しい戦略も開発している。
論文 参考訳(メタデータ) (2022-08-15T02:24:18Z) - DeepFormableTag: End-to-end Generation and Recognition of Deformable
Fiducial Markers [27.135078472097895]
既存の検出方法は、マーカーが理想的に平面面に印刷されていると仮定する。
フィデューシャルマーカー生成器は、大規模な情報を符号化する自由形式のカラーパターンのセットを作成する。
微分可能画像シミュレータは、変形マーカーを用いたフォトリアリスティックシーン画像のトレーニングデータセットを作成する。
訓練されたマーカー検出器は興味のある領域を探し、同時に複数のマーカーパターンを認識する。
論文 参考訳(メタデータ) (2022-06-16T09:29:26Z) - SparseAlign: A Super-Resolution Algorithm for Automatic Marker
Localization and Deformation Estimation in Cryo-Electron Tomography [0.17398560678845074]
格子フリー超解像法を単一分子局在顕微鏡の文脈で提案した。
提案手法はラベル付きマーカー位置を必要としないが,画像に基づく損失を用いてマーカーの前方投影と観測データとの比較を行う。
提案手法では,マーカーを自動的に検出し,ラベル付きマーカーデータなしで試料変形を確実に推定する。
論文 参考訳(メタデータ) (2022-01-21T14:03:32Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。