論文の概要: Facial Image Feature Analysis and its Specialization for Fréchet Distance and Neighborhoods
- arxiv url: http://arxiv.org/abs/2406.18430v1
- Date: Wed, 26 Jun 2024 15:27:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-27 13:00:05.271750
- Title: Facial Image Feature Analysis and its Specialization for Fréchet Distance and Neighborhoods
- Title(参考訳): 顔画像の特徴分析とフレシェ距離と周辺地域の特化
- Authors: Doruk Cetin, Benedikt Schesch, Petar Stamenkovic, Niko Benjamin Huber, Fabio Zünd, Majed El Helou,
- Abstract要約: 画像と画像データセット間の距離を評価することは、視覚に基づく研究の基本的な課題である。
批判にもかかわらず、最もユビキタスな方法はFr'echet Inception Distanceである。
本稿では,Fr'echet 距離と画像近傍の領域の特殊化に関する知見と知見を提供する。
- 参考スコア(独自算出の注目度): 8.359360389245268
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Assessing distances between images and image datasets is a fundamental task in vision-based research. It is a challenging open problem in the literature and despite the criticism it receives, the most ubiquitous method remains the Fr\'echet Inception Distance. The Inception network is trained on a specific labeled dataset, ImageNet, which has caused the core of its criticism in the most recent research. Improvements were shown by moving to self-supervision learning over ImageNet, leaving the training data domain as an open question. We make that last leap and provide the first analysis on domain-specific feature training and its effects on feature distance, on the widely-researched facial image domain. We provide our findings and insights on this domain specialization for Fr\'echet distance and image neighborhoods, supported by extensive experiments and in-depth user studies.
- Abstract(参考訳): 画像と画像データセット間の距離を評価することは、視覚に基づく研究の基本的な課題である。
文学における挑戦的なオープン問題であり、その批判にもかかわらず、最もユビキタスな手法は Fr\'echet Inception Distance である。
Inceptionネットワークは特定のラベル付きデータセットであるImageNetでトレーニングされている。
ImageNet上で自己超越学習に移行することで改善が示され、トレーニングデータドメインがオープンな問題として残された。
我々はこの最後の飛躍を行い、広く研究されている顔画像領域におけるドメイン固有の特徴訓練とその特徴距離への影響を初めて分析する。
我々は,Fr'echet 距離と画像近傍の領域専門化に関する知見と知見を提供する。
関連論文リスト
- Domain Generalization for In-Orbit 6D Pose Estimation [14.624172952608653]
宇宙船のポーズ推定ネットワークのための,エンドツーエンドのニューラルベースアーキテクチャを提案する。
提案手法はドメインギャップを効果的に閉鎖し,SPEED+データセット上で最先端の精度を実現する。
論文 参考訳(メタデータ) (2024-06-17T17:01:20Z) - Semi-Supervised Semantic Segmentation Based on Pseudo-Labels: A Survey [49.47197748663787]
本総説は, 半教師付きセマンティックセグメンテーション分野における擬似ラベル手法に関する最新の研究成果について, 包括的かつ組織的に概観することを目的としている。
さらに,医用およびリモートセンシング画像のセグメンテーションにおける擬似ラベル技術の適用について検討する。
論文 参考訳(メタデータ) (2024-03-04T10:18:38Z) - A Comprehensive Survey on Deep Neural Image Deblurring [0.76146285961466]
画像の劣化は、ぼやけを引き起こす画像の劣化要素を排除し、画像の品質を改善して、テクスチャとオブジェクトの可視化を改善する。
伝統的に、画像の劣化で優先される事前ベース最適化アプローチは、ディープニューラルネットワークが最近この分野で大きなブレークスルーをもたらした。
私たちは、デブロアリングアプリケーションで使用される最も一般的なディープニューラルネットワーク構造を概説し、その強みと斬新さを説明し、パフォーマンスメトリクスを要約し、広く使われているデータセットを紹介します。
論文 参考訳(メタデータ) (2023-10-07T07:29:42Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Deep Image Deblurring: A Survey [165.32391279761006]
低レベルのコンピュータビジョンにおいて、デブロアリングは古典的な問題であり、ぼやけた入力画像からシャープなイメージを復元することを目的としている。
近年のディープラーニングの進歩は、この問題の解決に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2022-01-26T01:31:30Z) - Fine-Grained Image Analysis with Deep Learning: A Survey [146.22351342315233]
きめ細かい画像解析(FGIA)は、コンピュータビジョンとパターン認識における長年の根本的な問題である。
本稿では、FGIAの分野を再定義し、FGIAの2つの基礎研究領域、細粒度画像認識と細粒度画像検索を統合することで、FGIAの分野を広げようとしている。
論文 参考訳(メタデータ) (2021-11-11T09:43:56Z) - Self-Supervised Learning of Remote Sensing Scene Representations Using
Contrastive Multiview Coding [0.0]
遠隔センシング画像分類における自己監督学習の適用可能性の分析を行う。
遠隔センシング画像分類の下流課題において,自己教師付き事前学習は自然シーン画像の教師付き事前学習よりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2021-04-14T18:25:43Z) - DoFE: Domain-oriented Feature Embedding for Generalizable Fundus Image
Segmentation on Unseen Datasets [96.92018649136217]
対象ドメインに対するCNNの一般化能力を向上させるために,新しいドメイン指向特徴埋め込み(DoFE)フレームワークを提案する。
私たちのDoFEフレームワークは、マルチソースドメインから学んだ追加のドメイン事前知識で、画像機能を動的に強化します。
本フレームワークは、未確認データセットのセグメンテーション結果を満足して生成し、他の領域の一般化やネットワークの正規化手法を超越する。
論文 参考訳(メタデータ) (2020-10-13T07:28:39Z) - City-Scale Visual Place Recognition with Deep Local Features Based on
Multi-Scale Ordered VLAD Pooling [5.274399407597545]
本稿では,コンテンツに基づく画像検索に基づいて,都市規模で位置認識を行うシステムを提案する。
まず,視覚的位置認識の包括的分析を行い,その課題を概観する。
次に,画像表現ベクトルに空間情報を埋め込むために,畳み込み型ニューラルネットワークアクティベーションを用いた単純なプーリング手法を提案する。
論文 参考訳(メタデータ) (2020-09-19T15:21:59Z) - Advances in Deep Learning for Hyperspectral Image Analysis--Addressing
Challenges Arising in Practical Imaging Scenarios [7.41157183358269]
我々は,強靭なハイパースペクトル画像解析にディープラーニングを活用するコミュニティの進歩を概観する。
課題は 地上の真実と データの高次元的な性質です
具体的には,画像解析における教師なし,半教師付き,アクティブな学習手法について検討する。
論文 参考訳(メタデータ) (2020-07-16T19:51:02Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。