論文の概要: Out of Sight, Out of Mind: A Source-View-Wise Feature Aggregation for
Multi-View Image-Based Rendering
- arxiv url: http://arxiv.org/abs/2206.04906v1
- Date: Fri, 10 Jun 2022 07:06:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 15:28:02.057695
- Title: Out of Sight, Out of Mind: A Source-View-Wise Feature Aggregation for
Multi-View Image-Based Rendering
- Title(参考訳): Out of Sight, Out of Mind:マルチビュー画像ベースレンダリングのためのソースビューワイズ機能アグリゲーション
- Authors: Geonho Cha, Chaehun Shin, Sungroh Yoon, Dongyoon Wee
- Abstract要約: 本稿では,ソースビューワイドな特徴集約手法を提案し,コンセンサスをロバストな方法で把握する。
提案手法を,合成画像や実画像を含む様々なベンチマークデータセットで検証する。
- 参考スコア(独自算出の注目度): 26.866141260616793
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: To estimate the volume density and color of a 3D point in the multi-view
image-based rendering, a common approach is to inspect the consensus existence
among the given source image features, which is one of the informative cues for
the estimation procedure. To this end, most of the previous methods utilize
equally-weighted aggregation features. However, this could make it hard to
check the consensus existence when some outliers, which frequently occur by
occlusions, are included in the source image feature set. In this paper, we
propose a novel source-view-wise feature aggregation method, which facilitates
us to find out the consensus in a robust way by leveraging local structures in
the feature set. We first calculate the source-view-wise distance distribution
for each source feature for the proposed aggregation. After that, the distance
distribution is converted to several similarity distributions with the proposed
learnable similarity mapping functions. Finally, for each element in the
feature set, the aggregation features are extracted by calculating the weighted
means and variances, where the weights are derived from the similarity
distributions. In experiments, we validate the proposed method on various
benchmark datasets, including synthetic and real image scenes. The experimental
results demonstrate that incorporating the proposed features improves the
performance by a large margin, resulting in the state-of-the-art performance.
- Abstract(参考訳): 多視点画像ベースレンダリングにおける3次元点の体積密度と色を推定するために、推定手順における情報的手がかりの一つである所定のソース画像特徴間のコンセンサスの存在を検査することが一般的である。
この目的のために、以前の方法の多くは等しく重み付けされた集約機能を使用する。
しかし、これが原因画像の特徴セットにしばしば生じる異常値が含まれている場合、コンセンサスの存在を確認するのが難しくなる可能性がある。
本稿では,特徴集合内の局所構造を活用することで,コンセンサスを堅牢な方法で把握することのできる,新たなソースビューワイドな特徴集約手法を提案する。
まず,提案したアグリゲーションに対して,各ソース特徴に対するソースビューワイド距離分布を計算する。
その後、距離分布は、学習可能な類似度マッピング関数を持つ複数の類似度分布に変換される。
最後に、特徴集合の各要素について、類似度分布から重みが導出される重み付き手段とばらつきを算出して集約特徴を抽出する。
実験では,合成および実画像シーンを含む様々なベンチマークデータセットで提案手法を検証する。
実験の結果,提案手法を組み込むことで性能が大幅に向上し,最新の性能が得られた。
関連論文リスト
- Learning Spatial Similarity Distribution for Few-shot Object Counting [17.28147599627954]
Few-shot Object counting は、クエリイメージ内のオブジェクトの数を、与えられた模範画像と同じクラスに属するものとしてカウントすることを目的としている。
既存の手法では、2次元空間領域におけるクエリ画像と例間の類似性を計算し、回帰してカウント数を求める。
本稿では,空間的特徴の空間的構造を保存した少数のオブジェクトカウントのためのネットワーク学習型空間的類似度分布(SSD)を提案する。
論文 参考訳(メタデータ) (2024-05-20T04:15:59Z) - Rethinking Polyp Segmentation from an Out-of-Distribution Perspective [37.1338930936671]
マスク付き自己エンコーダ(再建作業で訓練された自己教師型視覚トランスフォーマー)を応用して,分布内表現を学習する。
種々の異常サンプルの潜伏分布と健常サンプルの統計値とを一致させるため,特徴空間の標準化を図り,アウト・オブ・ディストリビューションの再構築と推論を行った。
6つのベンチマークによる実験結果から,我々のモデルはセグメンテーション性能とデータセット間の一般化に優れていた。
論文 参考訳(メタデータ) (2023-06-13T14:13:16Z) - Explicit Correspondence Matching for Generalizable Neural Radiance
Fields [49.49773108695526]
本稿では,新たな未知のシナリオに一般化し,2つのソースビューで新規なビュー合成を行う新しいNeRF手法を提案する。
明瞭な対応マッチングは、異なるビュー上の3Dポイントの2次元投影でサンプリングされた画像特徴間のコサイン類似度と定量化される。
実験では,実験結果から得られたコサイン特徴の類似性と体積密度との間に強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-04-24T17:46:01Z) - Feature-based Image Matching for Identifying Individual K\=ak\=a [0.0]
本報告では、個々のk=ak=aを識別する新しい用途のための教師なし特徴ベース画像マッチングパイプラインについて検討する。
クラスタリングに類似性ネットワークを適用することで、個々の鳥を識別する現在の教師付きアプローチの弱点に対処する。
機能ベースの画像マッチングは、既存の教師付きアプローチに代わる実行可能な代替手段を提供するために、類似性ネットワークで使用できると結論付けている。
論文 参考訳(メタデータ) (2023-01-17T03:43:19Z) - Multiscale Analysis for Improving Texture Classification [62.226224120400026]
本稿では,テクスチャの異なる空間周波数帯域を別々に扱うために,ガウス・ラプラシアピラミッドを用いる。
バイオインスパイアされたテクスチャ記述子,情報理論測度,灰色レベルの共起行列特徴,ハリリック統計特徴から抽出した特徴を特徴ベクトルに集約した。
論文 参考訳(メタデータ) (2022-04-21T01:32:22Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Contextual Similarity Aggregation with Self-attention for Visual
Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。
提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文 参考訳(メタデータ) (2021-10-26T06:20:31Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Object-Centric Multi-View Aggregation [86.94544275235454]
本稿では,オブジェクトのスパースなビュー集合を集約して,半単純3次元表現を容積特徴格子の形で計算する手法を提案する。
我々のアプローチの鍵となるのは、カメラのポーズを明示することなく、ビューを持ち上げることができるオブジェクト中心の標準3D座標システムである。
画素から標準座標系への対称対応マッピングの計算により、未知の領域への情報伝達がより良くなることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:38:31Z) - Multi-Person Pose Estimation with Enhanced Feature Aggregation and
Selection [33.15192824888279]
複数人物のポーズ推定のためのEFASNet(Enhanced Feature Aggregation and Selection Network)を提案する。
我々の手法は、混み合った、散らばった、ぎこちないシーンをうまく扱える。
総合的な実験により、提案手法は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-20T08:33:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。