論文の概要: Fine-Grained Image Analysis with Deep Learning: A Survey
- arxiv url: http://arxiv.org/abs/2111.06119v1
- Date: Thu, 11 Nov 2021 09:43:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-12 21:17:42.503095
- Title: Fine-Grained Image Analysis with Deep Learning: A Survey
- Title(参考訳): ディープラーニングを用いたきめ細かい画像解析:サーベイ
- Authors: Xiu-Shen Wei and Yi-Zhe Song and Oisin Mac Aodha and Jianxin Wu and
Yuxin Peng and Jinhui Tang and Jian Yang and Serge Belongie
- Abstract要約: きめ細かい画像解析(FGIA)は、コンピュータビジョンとパターン認識における長年の根本的な問題である。
本稿では、FGIAの分野を再定義し、FGIAの2つの基礎研究領域、細粒度画像認識と細粒度画像検索を統合することで、FGIAの分野を広げようとしている。
- 参考スコア(独自算出の注目度): 146.22351342315233
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained image analysis (FGIA) is a longstanding and fundamental problem
in computer vision and pattern recognition, and underpins a diverse set of
real-world applications. The task of FGIA targets analyzing visual objects from
subordinate categories, e.g., species of birds or models of cars. The small
inter-class and large intra-class variation inherent to fine-grained image
analysis makes it a challenging problem. Capitalizing on advances in deep
learning, in recent years we have witnessed remarkable progress in deep
learning powered FGIA. In this paper we present a systematic survey of these
advances, where we attempt to re-define and broaden the field of FGIA by
consolidating two fundamental fine-grained research areas -- fine-grained image
recognition and fine-grained image retrieval. In addition, we also review other
key issues of FGIA, such as publicly available benchmark datasets and related
domain-specific applications. We conclude by highlighting several research
directions and open problems which need further exploration from the community.
- Abstract(参考訳): 細粒度画像解析(FGIA)は、コンピュータビジョンとパターン認識における長年の基本的な問題であり、様々な現実世界の応用の基盤となっている。
fgiaの目標は、鳥の種類や車のモデルなど、下位のカテゴリから視覚オブジェクトを分析することである。
細粒度画像解析に固有の小クラス間および大クラス内変動は課題となっている。
近年、深層学習の進歩に乗じて、深層学習によるFGIAの顕著な進歩を目の当たりにしてきた。
本稿では,これらの進歩を体系的に調査し,精細画像認識と細粒画像検索という2つの基礎的研究領域を統合し,fgiaの分野を再定義し,広めることを試みる。
さらに、FGIAの他の重要な問題、例えば、公開ベンチマークデータセットや関連するドメイン固有のアプリケーションについてもレビューする。
結論として,研究の方向性と,コミュニティからのさらなる探索を必要とするオープンな問題を強調する。
関連論文リスト
- A Survey on Evolutionary Computation for Computer Vision and Image
Analysis: Past, Present, and Future Trends [6.48586558584924]
異なるアプローチの貢献について議論することで、進化的コンピュータビジョン(ECV)をよりよく理解することを目的としている。
この研究分野に関連する応用、課題、課題、傾向についても論じ、まとめる。
論文 参考訳(メタデータ) (2022-09-14T03:35:25Z) - Deep Image Deblurring: A Survey [165.32391279761006]
低レベルのコンピュータビジョンにおいて、デブロアリングは古典的な問題であり、ぼやけた入力画像からシャープなイメージを復元することを目的としている。
近年のディープラーニングの進歩は、この問題の解決に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2022-01-26T01:31:30Z) - Mask-Guided Feature Extraction and Augmentation for Ultra-Fine-Grained
Visual Categorization [15.627971638835948]
超微細きめの視覚分類(Ultra-FGVC)問題も検討されている。
FGVCは、同じ種からオブジェクトを分類することを目的としており、Ultra-FGVCは、超微細な粒度で画像を分類するより難しい問題をターゲットにしている。
Ultra-FGVCの課題は主に2つの側面から成り立っている。
本稿では,画像の識別・情報領域を抽出するマスク誘導特徴抽出と特徴拡張手法を提案する。
論文 参考訳(メタデータ) (2021-09-16T06:57:05Z) - Automatic Gaze Analysis: A Survey of DeepLearning based Approaches [61.32686939754183]
視線分析はコンピュータビジョンとヒューマン・コンピュータ・インタラクションの分野で重要な研究課題である。
制約のない環境で視線方向を解釈するための重要な手がかりは何か、いくつかのオープンな質問がある。
我々は、これらの基本的な疑問に光を当てるために、様々な視線分析タスクと応用の進捗を概観する。
論文 参考訳(メタデータ) (2021-08-12T00:30:39Z) - How can we learn (more) from challenges? A statistical approach to
driving future algorithm development [1.0690055408831725]
本稿では,課題から学習し,腹腔鏡ビデオにおけるインスタンスセグメンテーションの具体的タスクをインスタンス化する統計フレームワークを提案する。
2,728枚の画像から51,542個のメタデータを抽出し,ロバスト・メディカル・インスツルメンツ・チャレンジ(ROBUST-MIS)の結果に適用した。
提案手法の開発は,従来の手法が失敗する傾向にあった画像の処理において,最先端の総合的性能と具体的な強みを有する深層学習モデルを得た。
論文 参考訳(メタデータ) (2021-06-17T08:12:37Z) - A Comprehensive Survey on Image Dehazing Based on Deep Learning [89.77554550654227]
ヘイズの存在は画像の品質を著しく低下させる。
研究者は、ヘイズ画像の品質を回復するために、画像デハージング(ID)のための様々なアルゴリズムを設計した。
ディープラーニング(DL)ベースのデハージング技術を要約した研究はほとんどない。
論文 参考訳(メタデータ) (2021-06-07T03:51:25Z) - Affect Analysis in-the-wild: Valence-Arousal, Expressions, Action Units
and a Unified Framework [83.21732533130846]
Aff-Wild と Aff-Wild2 の2つである。
これは、これらのデータベースで訓練された深層ニューラルネットワークの2つのクラスの設計を示す。
インパクト認識を共同で学び、効果的に一般化し、実行することができる新しいマルチタスクおよび全体主義のフレームワークが提示されます。
論文 参考訳(メタデータ) (2021-03-29T17:36:20Z) - A Survey on Heterogeneous Graph Embedding: Methods, Techniques,
Applications and Sources [79.48829365560788]
異種情報ネットワーク (heterogenous information network) としても知られるヘテロジニアスグラフ (HGs) は、現実のシナリオにおいてユビキタス化されている。
HG埋め込みは、下流タスクのための不均一な構造と意味を保ちながら、低次元空間での表現を学習することを目的としている。
論文 参考訳(メタデータ) (2020-11-30T15:03:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。