論文の概要: Segmentation of Macular Edema Datasets with Small Residual 3D U-Net
Architectures
- arxiv url: http://arxiv.org/abs/2005.04697v1
- Date: Sun, 10 May 2020 15:34:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 01:47:35.773852
- Title: Segmentation of Macular Edema Datasets with Small Residual 3D U-Net
Architectures
- Title(参考訳): 小残差3次元U-Netアーキテクチャによる黄斑浮腫データセットのセグメンテーション
- Authors: Jonathan Frawley, Chris G. Willcocks, Maged Habib, Caspar Geenen,
David H. Steel and Boguslaw Obara
- Abstract要約: 本稿では, 深部畳み込み型ニューラルネットワークの黄斑浮腫セグメンテーション問題への応用について検討する。
一般的な信念とは対照的に、このアプリケーション設定内のニューラルアーキテクチャは、大量のトレーニングサンプルを必要とせずに、目に見えないテストイメージ上での人間レベルのパフォーマンスに近いパフォーマンスを達成することができる。
- 参考スコア(独自算出の注目度): 5.881334886616738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper investigates the application of deep convolutional neural networks
with prohibitively small datasets to the problem of macular edema segmentation.
In particular, we investigate several different heavily regularized
architectures. We find that, contrary to popular belief, neural architectures
within this application setting are able to achieve close to human-level
performance on unseen test images without requiring large numbers of training
examples. Annotating these 3D datasets is difficult, with multiple criteria
required. It takes an experienced clinician two days to annotate a single 3D
image, whereas our trained model achieves similar performance in less than a
second. We found that an approach which uses targeted dataset augmentation,
alongside architectural simplification with an emphasis on residual design, has
acceptable generalization performance - despite relying on fewer than 15
training examples.
- Abstract(参考訳): 本稿では,暗黙的に小さなデータセットを持つ深層畳み込みニューラルネットワークの黄斑浮腫分節問題への応用について検討する。
特に,多種多様な規則化されたアーキテクチャについて検討する。
一般的な信念に反して、このアプリケーション設定のニューラルアーキテクチャは、多くのトレーニング例を必要とせずに、見えないテストイメージで人間レベルのパフォーマンスをほぼ達成できることが分かりました。
これらの3dデータセットのアノテートは困難であり、複数の基準が必要となる。
経験豊富な臨床医が1つの3dイメージに注釈を付けるのに2日かかりますが、トレーニングされたモデルは1秒足らずで同様のパフォーマンスを達成しています。
対象とするデータセット拡張を使用するアプローチと,アーキテクチャの単純化と残留設計を重視したアプローチは,15以上のトレーニングサンプルを頼らずに,一般化性能を許容できることが分かりました。
関連論文リスト
- GS-Pose: Category-Level Object Pose Estimation via Geometric and
Semantic Correspondence [5.500735640045456]
カテゴリーレベルのポーズ推定は、コンピュータビジョンやロボット工学における多くの潜在的な応用において難しい課題である。
本稿では,事前学習した基礎モデルから得られる幾何学的特徴と意味的特徴の両方を活用することを提案する。
これは、セマンティックな特徴がオブジェクトのテクスチャや外観に対して堅牢であるため、以前のメソッドよりもトレーニングするデータを大幅に少なくする。
論文 参考訳(メタデータ) (2023-11-23T02:35:38Z) - Multi-task Learning with 3D-Aware Regularization [55.97507478913053]
本稿では,画像エンコーダから抽出した特徴を共有3D特徴空間に投影することで,複数のタスクをインタフェースする構造化3D認識正規化器を提案する。
提案手法はアーキテクチャ非依存であり,従来のマルチタスクバックボーンにプラグインすることで,性能を向上できることを示す。
論文 参考訳(メタデータ) (2023-10-02T08:49:56Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Advancing 3D finger knuckle recognition via deep feature learning [51.871256510747465]
接触のない3Dフィンガーナックルパターンは、識別性、距離からの視認性、利便性、利便性により、効果的な生体認証として出現している。
近年、ディープニューラルネットワークの中間機能を複数のスケールで同時に組み込むディープ・フィーチャー・コラボレーティブ・ネットワークが開発されている。
本稿では,3次元指のナックル画像を表現するために,最小次元の識別特徴ベクトルを学習する可能性を検討することにより,本手法を推し進める。
論文 参考訳(メタデータ) (2023-01-07T20:55:16Z) - Learning 3D Human Pose Estimation from Dozens of Datasets using a
Geometry-Aware Autoencoder to Bridge Between Skeleton Formats [80.12253291709673]
本稿では,アフィン結合型オートエンコーダ(ACAE)法を提案する。
このアプローチは、28人の人間のポーズデータセットを使って1つのモデルを監督する、極端なマルチデータセット体制にスケールします。
論文 参考訳(メタデータ) (2022-12-29T22:22:49Z) - Learning Compositional Shape Priors for Few-Shot 3D Reconstruction [36.40776735291117]
複雑なエンコーダ・デコーダアーキテクチャが,カテゴリごとの大量のデータを利用することを示す。
データから直接クラス固有のグローバルな形状を学習する3つの方法を提案する。
人気のShapeNetデータセットの実験から,本手法はゼロショットベースラインを40%以上上回る性能を示した。
論文 参考訳(メタデータ) (2021-06-11T14:55:49Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - Bidirectional RNN-based Few Shot Learning for 3D Medical Image
Segmentation [11.873435088539459]
対象臓器アノテーションの限られたトレーニングサンプルを用いて, 正確な臓器分類を行うための3次元ショットセグメンテーションフレームワークを提案する。
U-Netのようなネットワークは、サポートデータの2次元スライスとクエリイメージの関係を学習することでセグメンテーションを予測するように設計されている。
異なる臓器のアノテーションを付加した3つの3次元CTデータセットを用いて,提案モデルの評価を行った。
論文 参考訳(メタデータ) (2020-11-19T01:44:55Z) - The Little W-Net That Could: State-of-the-Art Retinal Vessel
Segmentation with Minimalistic Models [19.089445797922316]
数桁のパラメータが桁違いに少ない標準U-Netのミニマリストバージョンが、現在のベストプラクティスの性能を近似していることを示す。
また,W-Netと呼ばれる単純な拡張も提案する。
また、Artery/Veinセグメンテーション問題にもアプローチを試行し、その結果を最先端技術に整合させる。
論文 参考訳(メタデータ) (2020-09-03T19:59:51Z) - Few-Shot Single-View 3-D Object Reconstruction with Compositional Priors [30.262308825799167]
複雑なエンコーダ・デコーダアーキテクチャは、標準ベンチマークにおいて、最寄りのベースラインと同様に動作することを示す。
本稿では,3次元再構成モデルに事前クラスを効率的に統合する3つの手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T04:53:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。