論文の概要: InvNorm: Domain Generalization for Object Detection in Gastrointestinal
Endoscopy
- arxiv url: http://arxiv.org/abs/2205.02842v1
- Date: Thu, 5 May 2022 03:47:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 13:52:09.215830
- Title: InvNorm: Domain Generalization for Object Detection in Gastrointestinal
Endoscopy
- Title(参考訳): invnorm:消化器内視鏡における物体検出領域の一般化
- Authors: Weichen Fan, Yuanbo Yang, Kunpeng Qiu, Shuo Wang, and Yongxin Guo
- Abstract要約: 領域一般化は、特に消化器内視鏡画像解析において、コンピュータビジョンにおいて難しいトピックである。
本稿では,マルチドメインGIデータセットと,InvNormと呼ばれる軽量なプラグインブロックを提案する。
InvNormの有効性は、GI認識、GIオブジェクト検出、自然画像認識など、幅広いタスクで実証されている。
- 参考スコア(独自算出の注目度): 4.6492256713168025
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Domain Generalization is a challenging topic in computer vision, especially
in Gastrointestinal Endoscopy image analysis. Due to several device limitations
and ethical reasons, current open-source datasets are typically collected on a
limited number of patients using the same brand of sensors. Different brands of
devices and individual differences will significantly affect the model's
generalizability. Therefore, to address the generalization problem in
GI(Gastrointestinal) endoscopy, we propose a multi-domain GI dataset and a
light, plug-in block called InvNorm(Invertible Normalization), which could
achieve a better generalization performance in any structure. Previous
DG(Domain Generalization) methods fail to achieve invertible transformation,
which would lead to some misleading augmentation. Moreover, these models would
be more likely to lead to medical ethics issues. Our method utilizes
normalizing flow to achieve invertible and explainable style normalization to
address the problem. The effectiveness of InvNorm is demonstrated on a wide
range of tasks, including GI recognition, GI object detection, and natural
image recognition.
- Abstract(参考訳): ドメインの一般化はコンピュータビジョン、特に消化器内視鏡画像解析において難しい話題である。
いくつかのデバイス制限と倫理的理由により、現在のオープンソースデータセットは、通常、同じ種類のセンサーを使用する少数の患者で収集される。
デバイスブランドの違いと個人差は、モデルの汎用性に大きく影響します。
そこで,GI(Gastrointestinal)内視鏡における一般化問題に対処するために,多領域GIデータセットと,InvNorm(Invertible Normalization)と呼ばれる軽量プラグインブロックを提案する。
以前のDG(Domain Generalization)法は可逆変換を達成できないため、いくつかの誤解を招く。
さらに、これらのモデルは医療倫理問題につながる可能性が高い。
本手法では, フローの正規化を利用して可逆的かつ説明可能なスタイル正規化を行い, この問題に対処する。
InvNormの有効性は、GI認識、GIオブジェクト検出、自然画像認識など、幅広いタスクで実証されている。
関連論文リスト
- Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.5901368256326]
医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。
DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-19T07:28:33Z) - Disentangling Masked Autoencoders for Unsupervised Domain Generalization [57.56744870106124]
教師なしの領域一般化は急速に注目されているが、まだ十分に研究されていない。
Disentangled Masked Auto (DisMAE) は、本質的な特徴を忠実に示す不整合表現を発見することを目的としている。
DisMAEは、セマンティックで軽量な変分エンコーダを備えた非対称なデュアルブランチアーキテクチャを共同で訓練する。
論文 参考訳(メタデータ) (2024-07-10T11:11:36Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Generalizing Across Domains in Diabetic Retinopathy via Variational
Autoencoders [0.0]
糖尿病網膜症分類のための領域一般化は、モデルが網膜画像の適切な分類を可能にする。
本研究では, 変分オートエンコーダの固有容量を考察し, 基礎画像の潜伏空間を乱す方法について検討した。
論文 参考訳(メタデータ) (2023-09-20T13:29:22Z) - DGM-DR: Domain Generalization with Mutual Information Regularized
Diabetic Retinopathy Classification [40.35834579068518]
トレーニングとテストデータのドメインシフトは、一般的なディープラーニングモデルをトレーニングする上で大きな課題となる。
医用画像領域に事前訓練されたモデルとしてモデル目的関数を再確立するDG法を提案する。
提案手法は,従来の最先端技術よりも平均精度5.25%,標準偏差が低い。
論文 参考訳(メタデータ) (2023-09-18T11:17:13Z) - GastroVision: A Multi-class Endoscopy Image Dataset for Computer Aided
Gastrointestinal Disease Detection [6.231109933741383]
本データセットは, 解剖学的所見, 病理所見, ポリープ除去症例, 正常所見を含む。
経験豊富なGI内科医によって注釈され、検証された。
我々のデータセットは、GI病の検出と分類のためのAIベースのアルゴリズムの開発を促進することができると信じている。
論文 参考訳(メタデータ) (2023-07-16T19:36:03Z) - Domain Generalization with Adversarial Intensity Attack for Medical
Image Segmentation [27.49427483473792]
実世界のシナリオでは、トレーニング中に露出していない新しいドメインや異なるドメインのデータに遭遇することが一般的である。
ドメイン一般化(Domain Generalization, DG)は、モデルがこれまで見つからなかったドメインからのデータを扱うことを可能にする、有望な方向である。
本稿では,敵対的トレーニングを活用して無限のスタイルでトレーニングデータを生成する,AdverIN(Adversarial Intensity Attack)と呼ばれる新しいDG手法を提案する。
論文 参考訳(メタデータ) (2023-04-05T19:40:51Z) - When Neural Networks Fail to Generalize? A Model Sensitivity Perspective [82.36758565781153]
ドメイン一般化 (Domain Generalization, DG) は、異なる分布の下で見えないドメインでうまく機能するようにモデルを訓練することを目的としている。
本稿では,より現実的で,より困難なシナリオである単一領域一般化(Single-DG)について考察する。
我々は「モデル感度」と命名する一般化と強く相関するモデルの性質を経験的に確認する。
本稿では、高感度の周波数をターゲットとした拡張画像を生成するために、スペクトル逆データ拡張(SADA)の新たな戦略を提案する。
論文 参考訳(メタデータ) (2022-12-01T20:15:15Z) - AADG: Automatic Augmentation for Domain Generalization on Retinal Image
Segmentation [1.0452185327816181]
AADG(Automated Augmentation for Domain Generalization)と呼ばれるデータ操作に基づくドメイン一般化手法を提案する。
我々のAADGフレームワークは、新しいドメインを生成するデータ拡張ポリシーを効果的にサンプリングすることができる。
提案するAADGは,最先端の一般化性能を示し,既存手法より優れている。
論文 参考訳(メタデータ) (2022-07-27T02:26:01Z) - Single-domain Generalization in Medical Image Segmentation via Test-time
Adaptation from Shape Dictionary [64.5632303184502]
ドメインの一般化は通常、モデル学習のために複数のソースドメインからのデータを必要とする。
本稿では,1つのソースドメインのみで最悪のシナリオ下でモデルを学習し,異なる未確認対象ドメインに直接一般化する,重要な単一ドメインの一般化問題について考察する。
本稿では,領域間で不変なセグメンテーションのセグメンテーション先情報を抽出し,統合する医用画像セグメンテーションにおいて,この問題に対処する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-06-29T08:46:27Z) - What Can Be Transferred: Unsupervised Domain Adaptation for Endoscopic
Lesions Segmentation [51.7837386041158]
内視鏡的病変分割のための2つの相補的モジュールを含む新しい教師なしセマンティックトランスファーモデルを開発した。
特に、T_Dは、残留転写可能性を認識するボトルネックを介して、医療病変の伝達可能な視覚情報を翻訳する場所に焦点を当てている。
T_Fは、さまざまな病変のトランスファー可能なセマンティック機能を拡張し、自動的に非トランスファー可能な表現を無視する方法を強調している。
論文 参考訳(メタデータ) (2020-04-24T00:57:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。