論文の概要: BiSe-Unet: A Lightweight Dual-path U-Net with Attention-refined Context for Real-time Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2603.00119v1
- Date: Sun, 22 Feb 2026 19:24:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.0313
- Title: BiSe-Unet: A Lightweight Dual-path U-Net with Attention-refined Context for Real-time Medical Image Segmentation
- Title(参考訳): BiSe-Unet:リアルタイム医用画像分割のための意図的コンテキストを持つ軽量デュアルパスU-Net
- Authors: M Iffat Hossain, Laura Brattain,
- Abstract要約: 本稿では,2経路U-Netの軽量化を実現するBiSe-UNetについて紹介する。
BiSe-UNetは、Raspberry Pi 5上で30FPSを超えるリアルタイムスループットを維持しながら、競合するDiceとIoUのスコアを達成している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: During image-guided procedures, real-time image segmentation is often required. This demands lightweight AI models that can operate on resource-constrained devices. One important use case is endoscopy-guided colonoscopy, where polyps must be detected in real time. The Kvasir-Seg dataset, a publicly available benchmark for this task, contains 1,000 high-resolution endoscopic images of polyps with corresponding pixel-level segmentation masks. Achieving real-time inference speed for clinical deployment in constrained environments requires highly efficient and lightweight network architectures. However, many existing models remain too computationally intensive for embedded deployment. Lightweight architectures, although faster, often suffer from reduced spatial precision and weaker contextual understanding, leading to degraded boundary quality and reduced diagnostic reliability. To address these challenges, we introduce BiSe-UNet, a lightweight dual-path U-Net that integrates an attention-refined context path with a shallow spatial path for detailed feature preservation, followed by a depthwise separable decoder for efficient reconstruction. Evaluated on the Kvasir-Seg dataset, BiSe-UNet achieves competitive Dice and IoU scores while sustaining real-time throughput exceeding 30 FPS on Raspberry Pi 5, demonstrating its effectiveness for accurate, lightweight, and deployable medical image segmentation on edge hardware.
- Abstract(参考訳): 画像誘導プロシージャでは、リアルタイムな画像セグメンテーションがしばしば必要である。
これにより、リソース制約のあるデバイスで動作可能な軽量AIモデルが要求される。
内視鏡ガイド下大腸内視鏡検査では,ポリープをリアルタイムで検出する必要がある。
このタスクの公開ベンチマークであるKvasir-Segデータセットには、対応するピクセルレベルのセグメンテーションマスクを備えたポリプの高解像度内視鏡画像が1,000枚含まれている。
制約された環境における臨床展開のためのリアルタイム推論速度を達成するには、高度に効率的で軽量なネットワークアーキテクチャが必要である。
しかし、既存のモデルの多くは、組み込みデプロイメントには計算集約的すぎるままである。
軽量アーキテクチャは、より高速ではあるが、しばしば空間精度の低下とコンテキスト理解の弱さに悩まされ、境界品質の低下と診断信頼性の低下につながる。
これらの課題に対処するため,BiSe-UNetという軽量なデュアルパスU-Netを導入し,より詳細な特徴保存のための浅い空間経路と,より効率的な再構成のための奥行き分離可能なデコーダを提案する。
Kvasir-Segデータセットに基づいて評価されたBiSe-UNetは、競合するDiceとIoUスコアを達成しつつ、Raspberry Pi 5上で30FPSを超えるリアルタイムスループットを維持しながら、エッジハードウェア上での正確で軽量でデプロイ可能な医療画像セグメント化の有効性を実証する。
関連論文リスト
- Fast SAM2 with Text-Driven Token Pruning [52.8350457627401]
Segment Anything Model 2 (SAM2) では、視覚計算モデルがプロンプト駆動のビデオオブジェクトセグメンテーションにおいて大幅に進歩している。
SAM2パイプラインは、イメージエンコーダが生成するすべての視覚トークンを、ターゲットオブジェクトとの関係にかかわらず、下流の時間的推論モジュールを通じて伝達する。
本稿では,時間的伝播に先立ってトークン密度を選択的に低減し,推論効率を向上させるためのテキスト誘導型トークンプルーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-24T18:59:05Z) - Real-Time Bundle Adjustment for Ultra-High-Resolution UAV Imagery Using Adaptive Patch-Based Feature Tracking [1.9247157750972368]
ダウンサンプリングなしで全解像度UAV画像を直接操作する新しいリアルタイムBAフレームワークを提案する。
当社の軽量でオンボード互換のアプローチでは、各イメージをユーザ定義のパッチに分割し、フレーム間で追跡しています。
UAVナビゲーションシステムを用いて画像間の重なり合う関係をリアルタイムで決定する。
提案アルゴリズムは,DLR Modular Aerial Camera System へのシームレスな統合のために設計されている。
論文 参考訳(メタデータ) (2025-11-08T22:09:32Z) - Robust Real-Time Endoscopic Stereo Matching under Fuzzy Tissue Boundaries [8.217543444539652]
ロボットによる最小侵襲手術の自動化には,正確なシーン深度をリアルタイムに取得することが不可欠である。
既存のステレオマッチング法は、主に自然画像用に設計されており、ファジィ組織の境界のために内視鏡画像に苦しむことが多い。
内視鏡画像に適したリアルタイムステレオマッチング法である textbfRRESM を提案する。
論文 参考訳(メタデータ) (2025-03-02T05:06:52Z) - Light-weight Retinal Layer Segmentation with Global Reasoning [14.558920359236572]
OCT画像に適用可能な網膜層セグメンテーションのためのLightReSegを提案する。
提案手法は,現在の最先端技術であるTransUnetと比較して,セグメンテーション性能が向上する。
論文 参考訳(メタデータ) (2024-04-25T05:42:41Z) - CMUNeXt: An Efficient Medical Image Segmentation Network based on Large
Kernel and Skip Fusion [11.434576556863934]
CMUNeXtは、効率的な完全畳み込み軽量医療画像セグメンテーションネットワークである。
実際のシーンシナリオにおいて、迅速かつ正確な補助診断を可能にする。
論文 参考訳(メタデータ) (2023-08-02T15:54:00Z) - An Accelerated Pipeline for Multi-label Renal Pathology Image
Segmentation at the Whole Slide Image Level [3.4916828526000008]
繰り返し計算処理を削減し,GPUを用いて予測を高速化するために,Omni-Segパイプラインの強化版を提案する。
提案手法の革新的なコントリビューションは2つある: 1) エンドツーエンドのスライドワイドマルチタスクセグメンテーション用にDockerがリリースされ、(2) パイプラインをGPU上にデプロイして予測を高速化する。
論文 参考訳(メタデータ) (2023-05-23T23:07:53Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - The Unreasonable Effectiveness of Encoder-Decoder Networks for Retinal
Vessel Segmentation [3.351714665243138]
網膜画像における血管のセグメンテーションのためのエンコーダデコーダフレームワークを提案する。
3つの基礎画像データセットの実験は、このアプローチが最先端の結果を達成することを実証している。
VLightと呼ばれるこのフレームワークは、特定のトレーニングイメージへの過度な適合を回避し、さまざまなデータセットをまたがって適切に一般化されていることを示す。
論文 参考訳(メタデータ) (2020-11-25T11:10:37Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z) - Searching for Efficient Architecture for Instrument Segmentation in
Robotic Surgery [58.63306322525082]
ほとんどのアプリケーションは、高解像度の外科画像の正確なリアルタイムセグメンテーションに依存している。
我々は,高解像度画像のリアルタイム推論を行うために調整された,軽量で高効率なディープ残差アーキテクチャを設計する。
論文 参考訳(メタデータ) (2020-07-08T21:38:29Z) - Deep Q-Network-Driven Catheter Segmentation in 3D US by Hybrid
Constrained Semi-Supervised Learning and Dual-UNet [74.22397862400177]
本稿では,教師付き学習手法よりも少ないアノテーションを要求できる新しいカテーテルセグメンテーション手法を提案する。
提案手法では,Voxelレベルのアノテーションを避けるために,深層Q学習を事前局所化ステップとみなす。
検出されたカテーテルでは、パッチベースのDual-UNetを使用してカテーテルを3Dボリュームデータに分割する。
論文 参考訳(メタデータ) (2020-06-25T21:10:04Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。