論文の概要: Unsupervised Anomaly Appraisal of Cleft Faces Using a StyleGAN2-based
Model Adaptation Technique
- arxiv url: http://arxiv.org/abs/2211.06659v1
- Date: Sat, 12 Nov 2022 13:30:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 18:07:00.908382
- Title: Unsupervised Anomaly Appraisal of Cleft Faces Using a StyleGAN2-based
Model Adaptation Technique
- Title(参考訳): スタイルGAN2モデル適応法を用いた無教師下顔の異常評価
- Authors: Abdullah Hayajneh, Mohammad Shaqfeh, Erchin Serpedin, Mitchell A.
Stotland
- Abstract要約: 本稿では,人間の顔における先天性唇裂の異常を一貫して検出し,局所化し,評価する新しい機械学習フレームワークを提案する。
提案手法では, モデル適応を用いたStyleGAN2生成対向ネットワークを用いて, 口蓋裂に影響を及ぼした顔の正規化変換を行う。
提案したコンピュータモデルによる異常スコアは、人間の顔の違いのレーティングと密接に相関しており、ピアソンのrスコアは0.942であった。
- 参考スコア(独自算出の注目度): 5.224306534441244
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents a novel machine learning framework to consistently
detect, localize and rate congenital cleft lip anomalies in human faces. The
goal is to provide a universal, objective measure of facial differences and
reconstructive surgical outcomes that matches human judgments. The proposed
method employs the StyleGAN2 generative adversarial network with model
adaptation to produce normalized transformations of cleft-affected faces in
order to allow for subsequent measurement of deformity using a pixel-wise
subtraction approach. The complete pipeline of the proposed framework consists
of the following steps: image preprocessing, face normalization, color
transformation, morphological erosion, heat-map generation and abnormality
scoring. Heatmaps that finely discern anatomic anomalies are proposed by
exploiting the features of the considered framework. The proposed framework is
validated through computer simulations and surveys containing human ratings.
The anomaly scores yielded by the proposed computer model correlate closely
with the human ratings of facial differences, leading to 0.942 Pearson's r
score.
- Abstract(参考訳): 本稿では,人間の顔における先天性口唇異常を一貫して検出し,局所化し,評価する新しい機械学習フレームワークを提案する。
目標は、顔の違いを普遍的に客観的に測定し、人間の判断と一致する再建的な手術結果を提供することである。
提案手法では, モデル適応を用いたStyleGAN2生成逆数ネットワークを用いて, 顔の正常化を図り, 画素単位の減算手法を用いて変形度を連続的に測定する。
提案するフレームワークの完全なパイプラインは, 画像前処理, 顔の正規化, 色変換, 形態的侵食, 熱マップ生成, 異常点の3段階からなる。
このフレームワークの特徴を生かして、解剖学的異常を細かく識別するヒートマップが提案されている。
提案手法は,人間の評価を含むコンピュータシミュレーションと調査によって検証される。
提案したコンピュータモデルによる異常スコアは、人間の顔の違いのレーティングと密接に相関しており、ピアソンのrスコアは0.942であった。
関連論文リスト
- Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Forgery-aware Adaptive Transformer for Generalizable Synthetic Image
Detection [106.39544368711427]
本研究では,様々な生成手法から偽画像を検出することを目的とした,一般化可能な合成画像検出の課題について検討する。
本稿では,FatFormerという新しいフォージェリー適応トランスフォーマー手法を提案する。
提案手法は, 平均98%の精度でGANを観測し, 95%の精度で拡散モデルを解析した。
論文 参考訳(メタデータ) (2023-12-27T17:36:32Z) - Heterogeneous Face Frontalization via Domain Agnostic Learning [74.86585699909459]
本研究では, 視覚領域における正面視を, ポーズのバリエーションで合成できるドメイン非依存学習型生成逆数ネットワーク(DAL-GAN)を提案する。
DAL-GANは、補助分類器を備えたジェネレータと、より優れた合成のために局所的およびグローバルなテクスチャ識別をキャプチャする2つの識別器から構成される。
論文 参考訳(メタデータ) (2021-07-17T20:41:41Z) - Bridge the Gap Between Model-based and Model-free Human Reconstruction [10.818838437018682]
グラフ畳み込みニューラルネットワークによって構築された暗黙の面と明示的なメッシュモデルを同時に予測するエンド・ツー・エンドニューラルネットワークを提案する。
DeepHumanデータセットの実験は、我々のアプローチが効果的であることを示した。
論文 参考訳(メタデータ) (2021-06-11T11:13:42Z) - High Resolution Face Editing with Masked GAN Latent Code Optimization [0.0]
顔の編集はコンピュータビジョンコミュニティで人気のある研究トピックである。
最近の提案手法は、条件付きエンコーダデコーダであるGAN(Generative Adversarial Network)をエンドツーエンドでトレーニングするか、事前に訓練されたバニラGANジェネレータモデルの潜時空間での動作を定義するかのいずれかである。
空間的および意味的制約を伴ったGAN組み込み最適化手順を提案する。
論文 参考訳(メタデータ) (2021-03-20T08:39:41Z) - Bilateral Asymmetry Guided Counterfactual Generating Network for
Mammogram Classification [48.4619620405991]
画像レベルのラベルのみによるマンモグラムの良性や悪性の分類は,病変アノテーションが欠如しているため困難である。
画像に病変がなければ, 特徴がどのように振る舞うかという, 反現実的な問題を探ることができる。
我々は、対称的先行性に基づく反事実生成のための新しい理論的結果を得る。
論文 参考訳(メタデータ) (2020-09-30T03:15:30Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Appearance Consensus Driven Self-Supervised Human Mesh Recovery [67.20942777949793]
単眼画像から人間のポーズや形状を推定する自己教師付きメッシュ回復フレームワークを提案する。
標準モデルに基づく3次元ポーズ推定ベンチマークの最先端結果を得る。
その結果、色付きメッシュ予測により、ポーズや形状推定以外にも、さまざまな外観関連タスクにフレームワークの使用が開放される。
論文 参考訳(メタデータ) (2020-08-04T05:40:39Z) - Validation and generalization of pixel-wise relevance in convolutional
neural networks trained for face classification [0.0]
重要モデルのパラメータ間で、関連度がどう異なるかを示し、一般化する。
関連性に基づく画像マスキングにより、顔分類の関連マップは一般に安定であることが判明した。
モデル間の関係写像の詳細な解析により、選択パラメータの特定の利点を示す一般化における非対称性が明らかになった。
論文 参考訳(メタデータ) (2020-06-16T23:20:40Z) - Detection of Pitt-Hopkins Syndrome based on morphological facial
features [0.0]
本研究は、Pitt-Hopkins症候群(PTHS)と健康な個人を識別する自動手法について述べる。
健常者71名,健常者55名を対象に実験を行った。
論文 参考訳(メタデータ) (2020-03-18T14:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。