論文の概要: Facing the Void: Overcoming Missing Data in Multi-View Imagery
- arxiv url: http://arxiv.org/abs/2205.10592v1
- Date: Sat, 21 May 2022 13:21:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-05 15:43:43.620821
- Title: Facing the Void: Overcoming Missing Data in Multi-View Imagery
- Title(参考訳): Facing the Void:マルチビュー画像における欠落データ克服
- Authors: Gabriel Machado, Keiller Nogueira, Matheus Barros Pereira, Jefersson
Alex dos Santos
- Abstract要約: 本稿では,この問題に頑健な多視点画像分類のための新しい手法を提案する。
提案手法は,最先端の深層学習とメートル法学習に基づいて,他のアプリケーションやドメインに容易に適応し,活用することができる。
その結果,提案アルゴリズムは,最先端手法と比較して,多視点画像分類精度の向上を図っている。
- 参考スコア(独自算出の注目度): 0.783788180051711
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In some scenarios, a single input image may not be enough to allow the object
classification. In those cases, it is crucial to explore the complementary
information extracted from images presenting the same object from multiple
perspectives (or views) in order to enhance the general scene understanding
and, consequently, increase the performance. However, this task, commonly
called multi-view image classification, has a major challenge: missing data. In
this paper, we propose a novel technique for multi-view image classification
robust to this problem. The proposed method, based on state-of-the-art deep
learning-based approaches and metric learning, can be easily adapted and
exploited in other applications and domains. A systematic evaluation of the
proposed algorithm was conducted using two multi-view aerial-ground datasets
with very distinct properties. Results show that the proposed algorithm
provides improvements in multi-view image classification accuracy when compared
to state-of-the-art methods. Code available at
\url{https://github.com/Gabriellm2003/remote_sensing_missing_data}.
- Abstract(参考訳): いくつかのシナリオでは、単一の入力画像がオブジェクトの分類を可能にするのに十分ではないかもしれない。
これらの場合、複数の視点(またはビュー)から同一のオブジェクトを示す画像から抽出された補完的情報を探索し、一般的なシーン理解を深め、その結果、パフォーマンスを向上させることが不可欠である。
しかし、このタスクは一般的にマルチビュー画像分類と呼ばれ、欠落データという大きな課題がある。
本稿では,この問題に頑健なマルチビュー画像分類のための新しい手法を提案する。
最先端のディープラーニングアプローチとメトリック学習に基づく提案手法は,他のアプリケーションやドメインでも容易に適用・活用できる。
提案アルゴリズムの体系的評価は,異なる特性を持つ2つの多視点地上データセットを用いて行った。
その結果,提案アルゴリズムは,最先端手法と比較して,多視点画像分類精度の向上を図っている。
コードは \url{https://github.com/gabriellm2003/remote_sensing_missing_data}。
関連論文リスト
- Patch-Wise Self-Supervised Visual Representation Learning: A Fine-Grained Approach [4.9204263448542465]
本研究は、パッチレベルの識別を自己教師付き視覚表現学習に組み込むことにより、革新的できめ細かな次元を導入する。
それぞれのパッチは個別に拡張され、同じビュー内の他のパッチとは独立している。
我々は、拡張ビュー全体にわたって対応するパッチを見つけるための、単純で効果的なパッチマッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-28T09:35:30Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - Reliable Representations Learning for Incomplete Multi-View Partial Multi-Label Classification [78.15629210659516]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - Region-level Active Learning for Cluttered Scenes [60.93811392293329]
本稿では,従来の画像レベルのアプローチとオブジェクトレベルのアプローチを一般化した領域レベルのアプローチに仮定する新たな戦略を提案する。
その結果,本手法はラベル付けの労力を大幅に削減し,クラス不均衡や散らかったシーンを生かしたリアルなデータに対する希少なオブジェクト検索を改善することが示唆された。
論文 参考訳(メタデータ) (2021-08-20T14:02:38Z) - Unifying Remote Sensing Image Retrieval and Classification with Robust
Fine-tuning [3.6526118822907594]
新しい大規模トレーニングおよびテストデータセットであるSF300で、リモートセンシングイメージの検索と分類を統一することを目指しています。
本研究では,ImageNetの事前学習ベースラインと比較して,9つのデータセットの検索性能と分類性能を体系的に向上させることを示す。
論文 参考訳(メタデータ) (2021-02-26T11:01:30Z) - Multiple instance learning on deep features for weakly supervised object
detection with extreme domain shifts [1.9336815376402716]
近年,画像レベルのアノテーションのみを用いたオブジェクト検出 (WSOD) が注目されている。
事前学習した深部特徴に応用した単純な複数インスタンスアプローチは、非写真データセットに優れた性能をもたらすことを示す。
論文 参考訳(メタデータ) (2020-08-03T20:36:01Z) - Saliency-driven Class Impressions for Feature Visualization of Deep
Neural Networks [55.11806035788036]
分類に欠かせないと思われる特徴を視覚化することは有利である。
既存の可視化手法は,背景特徴と前景特徴の両方からなる高信頼画像を生成する。
本研究では,あるタスクにおいて最も重要であると考えられる識別的特徴を可視化するための,サリエンシ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-31T06:11:06Z) - One-Shot Image Classification by Learning to Restore Prototypes [11.448423413463916]
ワンショット画像分類は、カテゴリ毎に1つの画像しか持たないデータセット上で、イメージ分類器を訓練することを目的としている。
ワンショット学習では、既存のメトリック学習アプローチは、単一のトレーニングイメージがクラスを代表するものではない可能性があるため、パフォーマンスが低下する。
本稿では,RestoreNet で表される単純な回帰モデルを提案する。画像特徴のクラス変換を学習し,特徴空間のクラス中心に画像を移動させる。
論文 参考訳(メタデータ) (2020-05-04T02:11:30Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。