論文の概要: Combining Image- and Geometric-based Deep Learning for Shape Regression:
A Comparison to Pixel-level Methods for Segmentation in Chest X-Ray
- arxiv url: http://arxiv.org/abs/2401.07542v1
- Date: Mon, 15 Jan 2024 09:03:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 17:31:57.865016
- Title: Combining Image- and Geometric-based Deep Learning for Shape Regression:
A Comparison to Pixel-level Methods for Segmentation in Chest X-Ray
- Title(参考訳): 形状回帰のための画像と幾何学的深層学習の組み合わせ:胸部X線における画素レベルのセグメンテーション法との比較
- Authors: Ron Keuth, Mattias Heinrich
- Abstract要約: 本稿では,軽量なCNNバックボーンと幾何学的ニューラルネットワーク(Point Transformer)を組み合わせたハイブリッド手法を提案する。
我々は、nnU-Netを上位ベースラインとして含み、提案したメソッドよりも3.7倍のトレーニング可能なパラメータを持つ。
- 参考スコア(独自算出の注目度): 0.07143413923310668
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: When solving a segmentation task, shaped-base methods can be beneficial
compared to pixelwise classification due to geometric understanding of the
target object as shape, preventing the generation of anatomical implausible
predictions in particular for corrupted data. In this work, we propose a novel
hybrid method that combines a lightweight CNN backbone with a geometric neural
network (Point Transformer) for shape regression. Using the same CNN encoder,
the Point Transformer reaches segmentation quality on per with current
state-of-the-art convolutional decoders ($4\pm1.9$ vs $3.9\pm2.9$ error in mm
and $85\pm13$ vs $88\pm10$ Dice), but crucially, is more stable w.r.t image
distortion, starting to outperform them at a corruption level of 30%.
Furthermore, we include the nnU-Net as an upper baseline, which has $3.7\times$
more trainable parameters than our proposed method.
- Abstract(参考訳): セグメンテーションタスクを解く際には、対象物体の幾何学的理解による画素単位の分類に比べて、形状ベース法が有用であり、特に破損したデータに対する解剖学的不確実な予測の発生を防止することができる。
そこで本研究では,軽量なCNNバックボーンと幾何学的ニューラルネットワーク(Point Transformer)を組み合わせたハイブリッド手法を提案する。
同じcnnエンコーダを使用すると、ポイントトランスフォーマはperのセグメンテーション品質に到達し、現在のコンボリューションデコーダ($4\pm1.9$ vs $3.9\pm2.9$ error in mm and $85\pm13$ vs 8.8\pm10$ dice)が、最も重要なのはw.r.tイメージの歪みが30%の腐敗レベルを上回っていることだ。
さらに、nU-Netを上位ベースラインとして含み、提案手法よりも3.7\times$以上のトレーニング可能なパラメータを持つ。
関連論文リスト
- Equirectangular image construction method for standard CNNs for Semantic
Segmentation [5.5856758231015915]
視線画像を等角形に変換する手法を提案する。
球面中心投射と等距離円筒投射の逆変換を用いる。
実験により、正方形画像の効果的なセマンティックセグメンテーションのためのphiの最適値は標準CNNの6pi/16であることが示されている。
論文 参考訳(メタデータ) (2023-10-13T14:11:33Z) - GeoTransformer: Fast and Robust Point Cloud Registration with Geometric
Transformer [63.85771838683657]
点雲登録のための正確な対応を抽出する問題について検討する。
最近のキーポイントフリー法は、繰り返し可能なキーポイントの検出をバイパスすることで大きなポテンシャルを示している。
そこで我々は,Geometric Transformer (Geo Transformer) を略して提案し,ロバストなスーパーポイントマッチングのための幾何学的特徴を学習する。
論文 参考訳(メタデータ) (2023-07-25T02:36:04Z) - Self-Supervised Learning from Non-Object Centric Images with a Geometric
Transformation Sensitive Architecture [7.825153552141346]
本稿では幾何学的変換に敏感な幾何学的変換感性アーキテクチャを提案する。
本手法は, 回転予測や変換の異なる目標の利用により, 学生に敏感になるよう促す。
提案手法は,非対象中心画像を事前学習データとして用いる際の性能向上を示す。
論文 参考訳(メタデータ) (2023-04-17T06:32:37Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - VoGE: A Differentiable Volume Renderer using Gaussian Ellipsoids for
Analysis-by-Synthesis [62.47221232706105]
本稿では,ガウス再構成カーネルをボリュームプリミティブとして利用するVoGEを提案する。
本稿では,VoGEを用いて効率よくレンダリングを行うために,体積密度集約と粗大な描画戦略に関する近似クローズフォーム解を提案する。
VoGEは、オブジェクトポーズ推定、形状/テクスチャフィッティング、推論など、様々な視覚タスクに適用された場合、SoTAより優れている。
論文 参考訳(メタデータ) (2022-05-30T19:52:11Z) - Convolution-Free Medical Image Segmentation using Transformers [8.130670465411239]
近接する画像パッチ間の自己注意に基づく別の手法が,競争的あるいはよりよい結果が得られることを示す。
提案モデルにより,3つのデータセット上でのCNNの状態よりも優れたセグメンテーション精度が得られることを示す。
論文 参考訳(メタデータ) (2021-02-26T18:49:13Z) - A scaling hypothesis for projected entangled-pair states [0.0]
本稿では,強い相関関係を持つシステムに対して,射影絡み合ったペア状態(PEPS)でシミュレーションをスケールするための新しいパラダイムを提案する。
データポイントの崩壊を誘導するために有効相関長$chi$,$f(D,chi)=f(xi(D,chi))$,$D$の任意の値と環境結合次元$chi$を使用する。
本研究では, 臨界3次元二量体モデル, 3次元古典イジングモデル, 2次元量子ハイゼンベルクモデルに関する仮説を検証した。
論文 参考訳(メタデータ) (2021-02-05T12:48:01Z) - Masked Contrastive Representation Learning for Reinforcement Learning [202.8261654227565]
コントラスト学習を用いて個々のビデオフレームの原画素から高次特徴を抽出するCURLは,効率的なアルゴリズムである。
本稿では,連続した入力間の相関を考慮に入れたRLのための新しいアルゴリズム,マスク付きコントラスト表現学習を提案する。
DMControlスイートの16ドル環境中14ドル,Atari 2600 Gamesの26ドル環境中21ドル環境中26ドル環境中24ドルで,CURLに対する一貫した改善を実現している。
論文 参考訳(メタデータ) (2020-10-15T02:00:10Z) - Improving Network Slimming with Nonconvex Regularization [8.017631543721684]
畳み込みニューラルネットワーク(CNN)は、様々なコンピュータビジョンタスクの強力なモデルとなるために開発された。
最先端のCNNの多くは直接デプロイすることはできない。
CNNを圧縮する簡単な方法が提案されている。
論文 参考訳(メタデータ) (2020-10-03T01:04:02Z) - Geo-PIFu: Geometry and Pixel Aligned Implicit Functions for Single-view
Human Reconstruction [97.3274868990133]
Geo-PIFuは、着物の単色画像から3Dメッシュを復元する方法である。
提案手法は,クエリポイントの符号化と潜在ボクセル特徴を用いたグローバルな形状の制約を両立させることで,人間のメッシュの形状歪みの低減と,競合する手法と比較して表面の細部の改善を図っている。
論文 参考訳(メタデータ) (2020-06-15T01:11:48Z) - PUGeo-Net: A Geometry-centric Network for 3D Point Cloud Upsampling [103.09504572409449]
PUGeo-Netと呼ばれる新しいディープニューラルネットワークを用いた一様高密度点雲を生成する手法を提案する。
その幾何学中心の性質のおかげで、PUGeo-Netはシャープな特徴を持つCADモデルとリッチな幾何学的詳細を持つスキャンされたモデルの両方でうまく機能する。
論文 参考訳(メタデータ) (2020-02-24T14:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。