論文の概要: Encoding Structure-Texture Relation with P-Net for Anomaly Detection in
Retinal Images
- arxiv url: http://arxiv.org/abs/2008.03632v1
- Date: Sun, 9 Aug 2020 02:59:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 04:34:14.695848
- Title: Encoding Structure-Texture Relation with P-Net for Anomaly Detection in
Retinal Images
- Title(参考訳): 網膜画像における異常検出のためのp-netとの符号化構造-テキスト関係
- Authors: Kang Zhou, Yuting Xiao, Jianlong Yang, Jun Cheng, Wen Liu, Weixin Luo,
Zaiwang Gu, Jiang Liu, Shenghua Gao
- Abstract要約: 網膜画像における異常検出は、網膜疾患や疾患によって引き起こされる異常の同定を指す。
本稿では,画像テクスチャと構造の関係を利用して,異常検出のためのディープニューラルネットワークの設計を提案する。
- 参考スコア(独自算出の注目度): 42.700275429734205
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly detection in retinal image refers to the identification of
abnormality caused by various retinal diseases/lesions, by only leveraging
normal images in training phase. Normal images from healthy subjects often have
regular structures (e.g., the structured blood vessels in the fundus image, or
structured anatomy in optical coherence tomography image). On the contrary, the
diseases and lesions often destroy these structures. Motivated by this, we
propose to leverage the relation between the image texture and structure to
design a deep neural network for anomaly detection. Specifically, we first
extract the structure of the retinal images, then we combine both the structure
features and the last layer features extracted from original health image to
reconstruct the original input healthy image. The image feature provides the
texture information and guarantees the uniqueness of the image recovered from
the structure. In the end, we further utilize the reconstructed image to
extract the structure and measure the difference between structure extracted
from original and the reconstructed image. On the one hand, minimizing the
reconstruction difference behaves like a regularizer to guarantee that the
image is corrected reconstructed. On the other hand, such structure difference
can also be used as a metric for normality measurement. The whole network is
termed as P-Net because it has a ``P'' shape. Extensive experiments on RESC
dataset and iSee dataset validate the effectiveness of our approach for anomaly
detection in retinal images. Further, our method also generalizes well to novel
class discovery in retinal images and anomaly detection in real-world images.
- Abstract(参考訳): 網膜画像における異常検出は、トレーニング段階において正常な画像のみを活用することにより、様々な網膜疾患/疾患による異常の同定を指す。
健康な被験者の正常な画像は、しばしば規則的な構造を持つ(例えば、基底画像の血管構造、光コヒーレンス断層画像の解剖学的構造など)。
逆に、疾患や病変はしばしばこれらの構造を破壊する。
そこで本研究では,画像テクスチャと構造の関係を利用して,異常検出のためのディープニューラルネットワークの設計を提案する。
具体的には、まず網膜画像の構造を抽出し、次に、元の健康画像から抽出された構造特徴と最終層特徴の両方を組み合わせて、元の入力された健康画像の再構成を行う。
画像特徴はテクスチャ情報を提供し、構造から回収された画像の特異性を保証する。
最後に、再構成画像を利用して構造を抽出し、原画像から抽出した構造と再構成画像との差を測定する。
一方、再構成差の最小化は正則化器のように振舞い、画像の復元が保証される。
一方、そのような構造差は正規度測定の計量としても用いられる。
ネットワーク全体は ``P'' 形状であるため、P-Net と呼ばれる。
RESCデータセットとiSeeデータセットの大規模な実験により、網膜画像における異常検出に対するアプローチの有効性が検証された。
さらに,本手法は,網膜画像における新たなクラス発見や実世界画像における異常検出にもよく適用できる。
関連論文リスト
- Exploiting Structural Consistency of Chest Anatomy for Unsupervised
Anomaly Detection in Radiography Images [20.80801110403552]
簡易な空間認識メモリマトリックスによるX線画像からの異常検出(略してSimSID)を提案する。
トレーニング中、SimSIDは解剖学的構造を繰り返し発生する視覚パターンに分類することができ、推論では、テストイメージから異常を識別することができる。
我々のSimSIDは、ZhangLab、COVIDx、CheXpertベンチマークデータセット上の+8.0%、+5.0%、+9.9%のAUCスコアによる教師なし異常検出において、芸術の状態を超越している。
論文 参考訳(メタデータ) (2024-03-13T16:44:49Z) - MindDiffuser: Controlled Image Reconstruction from Human Brain Activity
with Semantic and Structural Diffusion [8.299415606889024]
我々はMindDiffuserと呼ばれる2段階の画像再構成モデルを提案する。
ステージ1では、fMRIからデコードされたVQ-VAE潜在表現とCLIPテキスト埋め込みが、安定拡散のイメージ・ツー・イメージのプロセスに置かれる。
ステージ2では、fMRIからデコードされた低レベルCLIP視覚特徴を監視情報として利用する。
論文 参考訳(メタデータ) (2023-03-24T16:41:42Z) - A Lightweight Reconstruction Network for Surface Defect Inspection [3.6823636353870954]
本稿では,再構成ネットワークに基づく教師なし欠陥検出アルゴリズムを提案する。
再構成ネットワークは、軽量な構造を持つ完全畳み込みオートエンコーダによって設計されている。
その結果,再構成ネットワークの非教師なし欠陥検出アルゴリズムは強い堅牢性と精度を有することがわかった。
論文 参考訳(メタデータ) (2022-12-25T08:59:15Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - Proxy-bridged Image Reconstruction Network for Anomaly Detection in
Medical Images [59.700111685673846]
医学画像における異常検出は、トレーニングセット内の正常画像のみを含む異常画像の識別を指す。
本稿では,医療画像の異常検出のための新しいプロキシブリッジ画像再構成ネットワーク(ProxyAno)を提案する。
論文 参考訳(メタデータ) (2021-10-05T00:40:43Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - On hallucinations in tomographic image reconstruction [3.486901561986149]
不正確な事前は、再建された画像に偽構造が幻覚される可能性がある。
深部ニューラルネットワークは画像再構成問題を正規化するために活発に研究されている。
論文 参考訳(メタデータ) (2020-12-01T17:14:28Z) - Retinal Image Segmentation with a Structure-Texture Demixing Network [62.69128827622726]
複雑な構造とテクスチャ情報は網膜画像に混在し、その情報の識別が困難である。
既存の手法はテクスチャと構造を共同で扱うため、偏りのあるモデルをテクスチャ認識に導くことができ、結果としてセグメンテーション性能は低下する。
本稿では,構造成分とテクスチャ成分を分離し,性能を大幅に向上させるセグメンテーション戦略を提案する。
論文 参考訳(メタデータ) (2020-07-15T12:19:03Z) - Structural-analogy from a Single Image Pair [118.61885732829117]
本稿では,1対の画像A,Bのみを用いて,ニューラルネットワークによる画像構造理解能力について検討する。
我々は、B の外観とスタイルを保持するが、A に対応する構造的配置を持つ画像を生成する。
提案手法は,画像AとBのみを利用した条件生成タスクにおいて,高品質な画像を生成するために利用できる。
論文 参考訳(メタデータ) (2020-04-05T14:51:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。