論文の概要: XBound-Former: Toward Cross-scale Boundary Modeling in Transformers
- arxiv url: http://arxiv.org/abs/2206.00806v1
- Date: Thu, 2 Jun 2022 00:24:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 13:25:17.483569
- Title: XBound-Former: Toward Cross-scale Boundary Modeling in Transformers
- Title(参考訳): XBound-Former: 変圧器のクロススケール境界モデリングに向けて
- Authors: Jiacheng Wang, Fei Chen, Yuxi Ma, Liansheng Wang, Zhaodong Fei,
Jianwei Shuai, Xiangdong Tang, Qichao Zhou, Jing Qin
- Abstract要約: そこで本研究では, 皮膚病変の分節変化と境界問題に対処するため, クロススケールな境界対応トランス (textbfXBound-Former) を提案する。
XBound-Formerは、純粋に注意に基づくネットワークであり、3つの特別に設計された学習者を通して境界知識をキャッチする。
我々は、ISIC-2016&PH$2とISIC-2018の2つの皮膚病変データセットでモデルを評価する。
- 参考スコア(独自算出の注目度): 11.979700468758313
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Skin lesion segmentation from dermoscopy images is of great significance in
the quantitative analysis of skin cancers, which is yet challenging even for
dermatologists due to the inherent issues, i.e., considerable size, shape and
color variation, and ambiguous boundaries. Recent vision transformers have
shown promising performance in handling the variation through global context
modeling. Still, they have not thoroughly solved the problem of ambiguous
boundaries as they ignore the complementary usage of the boundary knowledge and
global contexts. In this paper, we propose a novel cross-scale boundary-aware
transformer, \textbf{XBound-Former}, to simultaneously address the variation
and boundary problems of skin lesion segmentation. XBound-Former is a purely
attention-based network and catches boundary knowledge via three specially
designed learners. We evaluate the model on two skin lesion datasets,
ISIC-2016\&PH$^2$ and ISIC-2018, where our model consistently outperforms other
convolution- and transformer-based models, especially on the boundary-wise
metrics. We extensively verify the generalization ability of polyp lesion
segmentation that has similar characteristics, and our model can also yield
significant improvement compared to the latest models.
- Abstract(参考訳): 皮膚内視鏡像からの皮膚病変の分画は、皮膚がんの定量的解析において非常に重要であるが、皮膚科医にとっても、相当な大きさ、形状、色の変化、曖昧な境界が原因で困難である。
近年のビジョントランスフォーマーは,グローバルコンテキストモデリングによる変動処理において有望な性能を示した。
それでも、境界知識とグローバルコンテキストの相補的使用を無視するため、曖昧な境界の問題を完全には解決していない。
本稿では,皮膚病変の分節のばらつきと境界問題に同時に対処する,クロススケールな境界対応変換器 \textbf{XBound-Former} を提案する。
XBound-Formerは、純粋に注意に基づくネットワークであり、3人の特別に設計された学習者を通して境界知識をキャッチする。
我々は、ISIC-2016\&PH$^2$とISIC-2018の2つの皮膚病変データセットでモデルを評価する。
同様の特徴を有するポリープ病変セグメンテーションの一般化能力を広範囲に検証し,最新のモデルと比較して大きな改善をもたらす可能性がある。
関連論文リスト
- SkinMamba: A Precision Skin Lesion Segmentation Architecture with Cross-Scale Global State Modeling and Frequency Boundary Guidance [0.559239450391449]
皮膚病変のセグメンテーションは早期皮膚癌を同定するための重要な方法である。
我々は、SkinMambaと呼ばれるMambaとCNNをベースとしたハイブリッドアーキテクチャを提案する。
強力な長距離依存性モデリングとローカル機能抽出機能を提供しながら、線形複雑性を維持している。
論文 参考訳(メタデータ) (2024-09-17T05:02:38Z) - LSSF-Net: Lightweight Segmentation with Self-Awareness, Spatial Attention, and Focal Modulation [8.566930077350184]
本研究では,モバイル端末を用いた皮膚病変のセグメンテーションに特化して設計された,新しい軽量ネットワークを提案する。
ネットワークは、コンバータベースの焦点変調注意、自己認識型局所空間注意、分割チャネルシャッフルを組み込んだエンコーダデコーダアーキテクチャで構成されている。
経験的所見は、Jaccardの指標に顕著な、最先端のパフォーマンスを裏付けるものである。
論文 参考訳(メタデータ) (2024-09-03T03:06:32Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - LCAUnet: A skin lesion segmentation network with enhanced edge and body
fusion [4.819821513256158]
LCAUnetは、エッジとボディの特徴の融合による相補表現の能力を向上させるために提案されている。
公開データセットISIC 2017、ISIC 2018、PH2の実験では、LCAUnetが最先端の手法よりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-01T14:05:53Z) - Masked Pre-Training of Transformers for Histology Image Analysis [4.710921988115685]
デジタル病理学では、がん診断や予後予測などの応用に全スライド画像(WSI)が広く用いられている。
パッチ間の空間的関係を保ちながら、WSIの広い領域を符号化するための有望な方法として、ビジュアルトランスフォーマーモデルが登場した。
本稿では,この問題を解決するためにラベル付きデータを使わずにトランスフォーマーモデルをトレーニングするためのプレテキストタスクを提案する。
我々のモデルであるMaskHITは、トランスフォーマー出力を用いて、マスクしたパッチを再構築し、それらの位置と視覚的特徴に基づいて代表的組織学的特徴を学習する。
論文 参考訳(メタデータ) (2023-04-14T23:56:49Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z) - Improving Deep Facial Phenotyping for Ultra-rare Disorder Verification
Using Model Ensembles [52.77024349608834]
我々は、DCNNを最先端の顔認識手法であるiResNetとArcFaceに置き換える影響を分析する。
提案するアンサンブルモデルにより,目視と目視の両障害に対する最先端のパフォーマンスが達成される。
論文 参考訳(メタデータ) (2022-11-12T23:28:54Z) - Boundary-aware Transformers for Skin Lesion Segmentation [19.284634561363184]
自動皮膚病変分割の課題に対処する新しい境界対応トランス (BAT) を提案する。
具体的には,新たなバウンダリワイドアテンションゲート(BAG)をトランスフォーマに統合し,トランスフォーマを介してグローバルな長距離依存性を効果的にモデル化すると同時に,バウンダリワイド先行知識をフル活用することで,より局所的な詳細を捉える。
論文 参考訳(メタデータ) (2021-10-08T02:43:34Z) - DONet: Dual Objective Networks for Skin Lesion Segmentation [77.9806410198298]
本稿では,皮膚病変のセグメンテーションを改善するために,Dual Objective Networks (DONet) という,シンプルで効果的なフレームワークを提案する。
我々のDONetは2つの対称デコーダを採用し、異なる目標に近づくための異なる予測を生成する。
皮膚内視鏡画像における多種多様な病変のスケールと形状の課題に対処するために,再帰的コンテキスト符号化モジュール(RCEM)を提案する。
論文 参考訳(メタデータ) (2020-08-19T06:02:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。