論文の概要: PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation
- arxiv url: http://arxiv.org/abs/2011.12640v1
- Date: Wed, 25 Nov 2020 11:03:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 03:05:31.051964
- Title: PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation
- Title(参考訳): PGL:3次元医用画像分割のための事前指導型局所自己教師型学習
- Authors: Yutong Xie, Jianpeng Zhang, Zehui Liao, Yong Xia, and Chunhua Shen
- Abstract要約: 本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
- 参考スコア(独自算出の注目度): 87.50205728818601
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: It has been widely recognized that the success of deep learning in image
segmentation relies overwhelmingly on a myriad amount of densely annotated
training data, which, however, are difficult to obtain due to the tremendous
labor and expertise required, particularly for annotating 3D medical images.
Although self-supervised learning (SSL) has shown great potential to address
this issue, most SSL approaches focus only on image-level global consistency,
but ignore the local consistency which plays a pivotal role in capturing
structural information for dense prediction tasks such as segmentation. In this
paper, we propose a PriorGuided Local (PGL) self-supervised model that learns
the region-wise local consistency in the latent feature space. Specifically, we
use the spatial transformations, which produce different augmented views of the
same image, as a prior to deduce the location relation between two views, which
is then used to align the feature maps of the same local region but being
extracted on two views. Next, we construct a local consistency loss to minimize
the voxel-wise discrepancy between the aligned feature maps. Thus, our PGL
model learns the distinctive representations of local regions, and hence is
able to retain structural information. This ability is conducive to downstream
segmentation tasks. We conducted an extensive evaluation on four public
computerized tomography (CT) datasets that cover 11 kinds of major human organs
and two tumors. The results indicate that using pre-trained PGL model to
initialize a downstream network leads to a substantial performance improvement
over both random initialization and the initialization with global
consistency-based models. Code and pre-trained weights will be made available
at: https://git.io/PGL.
- Abstract(参考訳): 画像セグメンテーションにおける深層学習の成功は、膨大な量の濃密な注釈付きトレーニングデータに大きく依存していると広く認識されているが、特に3次元医用画像に必要とされる膨大な労力と専門知識のため入手が困難である。
自己教師付き学習(SSL)はこの問題に対処する大きな可能性を示しているが、ほとんどのSSLアプローチは画像レベルのグローバルな一貫性にのみ焦点をあてているが、セグメンテーションのような密集した予測タスクのための構造情報を取得する上で重要な役割を果たす局所的な一貫性を無視している。
本稿では,潜在特徴空間における局所的な局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
具体的には、同じ画像の異なる拡張ビューを生成する空間変換を用いて、2つのビュー間の位置関係を推定し、同じローカル領域の特徴マップを2つのビューで抽出する。
次に,特徴写像間のボクセル的差を最小限に抑えるため,局所的な一貫性損失を構築する。
このように、我々のPGLモデルは、局所領域の独特な表現を学習し、したがって構造情報を保持できる。
この機能は下流のセグメンテーションタスクに役立ちます。
11種類のヒト主要臓器と2つの腫瘍をカバーする4つのctデータセットについて広範な評価を行った。
その結果、事前学習したPGLモデルを用いてダウンストリームネットワークを初期化すると、ランダム初期化とグローバル一貫性モデルによる初期化の両方よりも大幅に性能が向上することが示された。
コードと事前トレーニングされたウェイトは、以下の通りである。
関連論文リスト
- Locality Alignment Improves Vision-Language Models [55.275235524659905]
近年では視覚言語モデル (VLM) が普及しているが、その多くが基本的な空間推論の誤りに悩まされている。
局所性アライメント(Locality alignment)と呼ばれる,視覚障害者のための新しい学習段階を提案する。
局所性に整合したバックボーンは、様々なベンチマークでパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-10-14T21:01:01Z) - Keypoint-Augmented Self-Supervised Learning for Medical Image
Segmentation with Limited Annotation [21.203307064937142]
本稿では,短距離と長距離の両方の自己注意を保った表現を抽出するキーポイント拡張融合層を提案する。
特に,長距離空間の自己意識を学習する追加入力を組み込むことで,CNN機能マップを複数スケールで拡張する。
提案手法は,より堅牢な自己アテンションを生成することにより,既存のSSLメソッドよりも優れる。
論文 参考訳(メタデータ) (2023-10-02T22:31:30Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Conditioning Covert Geo-Location (CGL) Detection on Semantic Class
Information [5.660207256468971]
サハらによってCCGL(Covert Geo-Location)検出と呼ばれる潜在的な隠蔽物を特定するタスクが提案された。
セマンティッククラス情報を利用する試みは行われなかった。
本稿では,2つの目標を達成するためのマルチタスク学習に基づくアプローチを提案する。i) 意味クラス情報を持つ特徴の抽出;i) 共通エンコーダの堅牢なトレーニング。
論文 参考訳(メタデータ) (2022-11-27T07:21:59Z) - Keep Your Friends Close & Enemies Farther: Debiasing Contrastive
Learning with Spatial Priors in 3D Radiology Images [11.251405818285331]
本研究では,抽出した対応を利用して表現学習のためのより効果的な正負のサンプルを選択する3Dコントラストフレームワーク(Spade)を提案する。
最近の最先端のアプローチと比較して、Spadeは3つの下流セグメンテーションタスクにおいて顕著な改善を示している。
論文 参考訳(メタデータ) (2022-11-16T03:36:06Z) - PA-Seg: Learning from Point Annotations for 3D Medical Image
Segmentation using Contextual Regularization and Cross Knowledge Distillation [14.412073730567137]
本稿では,3次元医用画像の7点のみのセグメンテーションターゲットに注釈を付け,弱教師付き学習フレームワークPA-Segを設計する。
第1段階では、より監督的な信号を提供するために、シードポイントを拡張するために測地距離変換を用いる。
第2段階では、第1段階で事前学習されたモデルから得られた予測を擬似ラベルとして使用する。
論文 参考訳(メタデータ) (2022-08-11T07:00:33Z) - Learning Where to Learn in Cross-View Self-Supervised Learning [54.14989750044489]
自己教師付き学習(SSL)は大きな進歩を遂げ、教師付き学習との大きなギャップを狭めた。
現在の方法では、埋め込みにピクセルの統一的なアグリゲーションを採用する。
本稿では,特徴の空間情報を適応的に集約する学習方法であるLearning Where to Learn(LEWEL)を提案する。
論文 参考訳(メタデータ) (2022-03-28T17:02:42Z) - Contrastive Neighborhood Alignment [81.65103777329874]
本稿では,学習特徴のトポロジを維持するための多様体学習手法であるContrastive Neighborhood Alignment(CNA)を提案する。
対象モデルは、対照的な損失を用いて、ソース表現空間の局所構造を模倣することを目的としている。
CNAは3つのシナリオで説明される: 多様体学習、モデルが元のデータの局所的なトポロジーを次元還元された空間で維持する、モデル蒸留、小さな学生モデルがより大きな教師を模倣するために訓練される、レガシーモデル更新、より強力なモデルに置き換えられる、という3つのシナリオである。
論文 参考訳(メタデータ) (2022-01-06T04:58:31Z) - Self-Supervised Learning for Fine-Grained Visual Categorization [0.0]
細粒度視覚分類(FGVC)におけるSSLの有用性について検討する。
FGVCは、一般的なカテゴリ内で視覚的に類似したサブカテゴリのオブジェクトを区別することを目的としている。
我々のベースラインは、CUB-200-2011データセットの上位1の分類精度を86.36%で達成している。
論文 参考訳(メタデータ) (2021-05-18T19:16:05Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。