論文の概要: eNCApsulate: NCA for Precision Diagnosis on Capsule Endoscopes
- arxiv url: http://arxiv.org/abs/2504.21562v1
- Date: Wed, 30 Apr 2025 12:06:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 19:00:40.384185
- Title: eNCApsulate: NCA for Precision Diagnosis on Capsule Endoscopes
- Title(参考訳): eNCApsulate: NCAによるカプセル内視鏡の精密診断
- Authors: Henry John Krumb, Anirban Mukhopadhyay,
- Abstract要約: ワイヤレスカプセル内視鏡(Wireless Capsule Endoscopy)は、従来の内視鏡に代わる痛みのない内視鏡である。
出血の検出や深さ推定といった技術は病理の局所化に役立つが、ディープラーニングモデルは通常カプセル上で直接走るには大きすぎる。
基礎モデルの出力を擬似基底真理として扱うことにより,大規模な基礎モデルをリーンNAAアーキテクチャに蒸留する。
次に、トレーニングされたNAAをESP32マイクロコントローラに移植し、カメラカプセルと同じくらい小さなハードウェア上で効率的な画像処理を可能にする。
- 参考スコア(独自算出の注目度): 1.3270838622986498
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Wireless Capsule Endoscopy is a non-invasive imaging method for the entire gastrointestinal tract, and is a pain-free alternative to traditional endoscopy. It generates extensive video data that requires significant review time, and localizing the capsule after ingestion is a challenge. Techniques like bleeding detection and depth estimation can help with localization of pathologies, but deep learning models are typically too large to run directly on the capsule. Neural Cellular Automata (NCA) for bleeding segmentation and depth estimation are trained on capsule endoscopic images. For monocular depth estimation, we distill a large foundation model into the lean NCA architecture, by treating the outputs of the foundation model as pseudo ground truth. We then port the trained NCA to the ESP32 microcontroller, enabling efficient image processing on hardware as small as a camera capsule. NCA are more accurate (Dice) than other portable segmentation models, while requiring more than 100x fewer parameters stored in memory than other small-scale models. The visual results of NCA depth estimation look convincing, and in some cases beat the realism and detail of the pseudo ground truth. Runtime optimizations on the ESP32-S3 accelerate the average inference speed significantly, by more than factor 3. With several algorithmic adjustments and distillation, it is possible to eNCApsulate NCA models into microcontrollers that fit into wireless capsule endoscopes. This is the first work that enables reliable bleeding segmentation and depth estimation on a miniaturized device, paving the way for precise diagnosis combined with visual odometry as a means of precise localization of the capsule -- on the capsule.
- Abstract(参考訳): ワイヤレスカプセル内視鏡は消化管全体に対する非侵襲的イメージング法であり、従来の内視鏡に代わる痛みのない方法である。
大規模なビデオデータを生成するため、かなりのレビュー時間が必要であり、カプセルを摂取した後にローカライズすることが課題である。
出血の検出や深さ推定といった技術は病理の局所化に役立つが、ディープラーニングモデルは通常カプセル上で直接走るには大きすぎる。
カプセル内視鏡画像から出血分画と深さ推定のためのニューラルセルオートマタ(NCA)を訓練した。
単分子深度推定では,基礎モデルの出力を擬似基底真理として扱うことにより,大きな基礎モデルをリーンNAAアーキテクチャに蒸留する。
次に、トレーニングされたNAAをESP32マイクロコントローラに移植し、カメラカプセルと同じくらい小さなハードウェア上で効率的な画像処理を可能にする。
NCAは、他のポータブルセグメンテーションモデルよりも正確な(Dice)が、他の小規模モデルよりも100倍以上のパラメータをメモリに格納する必要がある。
NCA深度推定の視覚的結果は説得力があり、場合によっては擬似基底真理の現実主義と詳細を破る。
ESP32-S3における実行時の最適化は、平均推論速度を3倍以上に向上させる。
いくつかのアルゴリズムによる調整と蒸留により、NCAモデルを無線カプセル内視鏡に適合するマイクロコントローラにeNCApsulateすることができる。
これは、カプセルの正確な位置決め方法として視覚計測と正確な診断の方法を組み込んだ小型装置で、信頼性の高い出血分画と深度推定を可能にする最初の研究である。
関連論文リスト
- Enhanced Anomaly Detection for Capsule Endoscopy Using Ensemble Learning Strategies [0.8824955686704116]
本研究は,ビデオカプセル内膜における異常検出タスクの課題に対処するためのアンサンブル戦略を導入する。
本稿では、異常検出フィールドから引き出された各種損失関数を用いて、各ネットワークをトレーニングする。
我々は、Kvasir-Capsuleで76.86%のAUCスコア、Galarデータセットで76.98%のAUCスコアを達成した。
論文 参考訳(メタデータ) (2025-04-08T13:39:39Z) - KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation [46.57880203321858]
カルマンフィルタを用いた線形変形型クロスアテンション(LDCA)モジュールを用いた血管セグメンテーションのための新しいネットワーク(KaLDeX)を提案する。
我々のアプローチは、カルマンフィルタ(KF)ベースの線形変形可能な畳み込み(LD)とクロスアテンション(CA)モジュールの2つの重要なコンポーネントに基づいている。
提案手法は,網膜基底画像データセット(DRIVE,CHASE_BD1,STARE)とOCTA-500データセットの3mm,6mmを用いて評価した。
論文 参考訳(メタデータ) (2024-10-28T16:00:42Z) - Enhancing Angular Resolution via Directionality Encoding and Geometric Constraints in Brain Diffusion Tensor Imaging [70.66500060987312]
拡散強調画像(DWI)は、水分子の拡散率に感応した磁気共鳴イメージング(MRI)の一種である。
本研究はDirGeo-DTIを提案する。DirGeo-DTIは、勾配方向の最小理論数(6)で得られたDWIの集合からでも、信頼できるDTIメトリクスを推定する深層学習に基づく手法である。
論文 参考訳(メタデータ) (2024-09-11T11:12:26Z) - Detection of Intracranial Hemorrhage for Trauma Patients [1.0074894923170512]
本稿では,Voxel-Complete IoU(VC-IoU)損失を新たに提案し,ネットワークが境界ボックスの3次元アスペクト比を学習できるようにする。
我々は、公開データセットを用いて脳出血の検出を広範囲に実験し、それをプライベートコホートで検証した。
論文 参考訳(メタデータ) (2024-08-20T12:03:59Z) - Weakly-supervised positional contrastive learning: application to
cirrhosis classification [45.63061034568991]
大規模な医療画像データセットは、低信頼で弱いラベルで安価に注釈を付けることができる。
組織学に基づく診断のような高信頼なラベルへのアクセスは稀で費用がかかる。
提案手法は,効率的な弱教師付き位置対応学習戦略 (WSP) を提案する。
論文 参考訳(メタデータ) (2023-07-10T15:02:13Z) - AttResDU-Net: Medical Image Segmentation Using Attention-based Residual
Double U-Net [0.0]
本稿では,既存の医用画像セグメンテーションネットワークを改善したアテンションベース残留Double U-Netアーキテクチャ(AttResDU-Net)を提案する。
CVC clinic-DB、ISIC 2018、2018 Data Science Bowlの3つのデータセットで実験を行い、それぞれ94.35%、91.68%、92.45%のDice Coefficientスコアを得た。
論文 参考訳(メタデータ) (2023-06-25T14:28:08Z) - Hepatic vessel segmentation based on 3Dswin-transformer with inductive
biased multi-head self-attention [46.46365941681487]
Indu BIased Multi-Head Attention Vessel Net という,堅牢なエンドツーエンドのコンテナセグメンテーションネットワークを提案する。
正確な肝血管のボクセルを見つけるために,パッチワイド埋め込みよりもボクセルワイド埋め込みを導入する。
一方,絶対位置埋め込みから帰納的バイアス付き相対的位置埋め込みを学習する帰納的バイアス付きマルチヘッド自己アテンションを提案する。
論文 参考訳(メタデータ) (2021-11-05T10:17:08Z) - NanoNet: Real-Time Polyp Segmentation in Video Capsule Endoscopy and
Colonoscopy [0.6125117548653111]
ビデオカプセル内視鏡と大腸内視鏡画像の分割のための新しいアーキテクチャであるNanoNetを提案する。
提案アーキテクチャはリアルタイム性能を実現し,他の複雑なアーキテクチャに比べて高いセグメンテーション精度を有する。
論文 参考訳(メタデータ) (2021-04-22T15:40:28Z) - Lesion2Vec: Deep Metric Learning for Few-Shot Multiple Lesions
Recognition in Wireless Capsule Endoscopy Video [0.0]
wireless capsule endoscopy (wce) は、消化管全体を非侵襲的に可視化することで、従来の内視鏡手術に革命をもたらした。
単一のビデオは最大8時間で3万から10万の画像を生成できる。
We propose a metric-based learning framework followed with a few-shot lesion recognition in WCE data。
論文 参考訳(メタデータ) (2021-01-11T23:58:56Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z) - Deep Q-Network-Driven Catheter Segmentation in 3D US by Hybrid
Constrained Semi-Supervised Learning and Dual-UNet [74.22397862400177]
本稿では,教師付き学習手法よりも少ないアノテーションを要求できる新しいカテーテルセグメンテーション手法を提案する。
提案手法では,Voxelレベルのアノテーションを避けるために,深層Q学習を事前局所化ステップとみなす。
検出されたカテーテルでは、パッチベースのDual-UNetを使用してカテーテルを3Dボリュームデータに分割する。
論文 参考訳(メタデータ) (2020-06-25T21:10:04Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。