Fugu-MT 論文翻訳(概要): Effect of Input Resolution on Retinal Vessel Segmentation Performance: An Empirical Study Across Five Datasets

論文の概要: Effect of Input Resolution on Retinal Vessel Segmentation Performance: An Empirical Study Across Five Datasets

arxiv url: http://arxiv.org/abs/2604.02977v1
Date: Fri, 03 Apr 2026 11:32:14 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-06 17:20:24.460418
Title: Effect of Input Resolution on Retinal Vessel Segmentation Performance: An Empirical Study Across Five Datasets
Title（参考訳）: 入力分解能が網膜血管セグメンテーション性能に及ぼす影響:5つのデータセット間の実証的研究
Authors: Amarnath R,
Abstract要約: 高解像度画像がダウンサンプリングされると、薄い容器はサブピクセル構造に縮小され、不可逆的な情報損失を引き起こす。薄型(半幅3ピクセル)、中型(3～7ピクセル)、厚型(7ピクセル)の血管検出を別々に評価する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Most deep learning pipelines for retinal vessel segmentation resize fundus images to satisfy GPU memory constraints and enable uniform batch processing. However, the impact of this resizing on thin vessel detection remains underexplored. When high resolution images are downsampled, thin vessels are reduced to subpixel structures, causing irreversible information loss even before the data enters the network. Standard volumetric metrics such as the Dice score do not capture this loss because thick vessel pixels dominate the evaluation. We investigated this effect by training a baseline UNet at multiple downsampling ratios across five fundus datasets (DRIVE, STARE, CHASE_DB1, HRF, and FIVES) with native widths ranging from 565 to 3504 pixels, keeping all other settings fixed. We introduce a width-stratified sensitivity metric that evaluates thin (half-width <3 pixels), medium (3 to 7 pixels), and thick (>7 pixels) vessel detection separately, using native resolution width estimates derived from a Euclidean distance transform. Results show that for high-resolution datasets (HRF, FIVES), thin vessel sensitivity improves monotonically as images are downsampled toward the encoder's effective operating range, peaking at processed widths between 256 and 876 pixels. For low-to-mid resolution datasets (DRIVE, STARE, CHASE_DB1), thin vessel sensitivity is highest at or near native resolution and degrades with any downsampling. Across all five datasets, aggressive downsampling reduced thin vessel sensitivity by up to 15.8 percentage points (DRIVE) while Dice remained relatively stable, confirming that Dice alone is insufficient for evaluating microvascular segmentation.
Abstract（参考訳）: 網膜血管セグメンテーションのためのほとんどのディープラーニングパイプラインは、GPUメモリの制約を満たすためにファンスイメージを再サイズし、一様バッチ処理を可能にする。しかし、このリサイズが細い容器検出に与える影響は未解明のままである。高解像度画像がダウンサンプリングされると、細い容器がサブピクセル構造に縮小され、データがネットワークに入る前にも不可逆的な情報が失われる。 Diceスコアのような標準的なボリュームメトリクスは、厚い血管ピクセルが評価を支配しているため、この損失を捉えない。この効果は,565から3504ピクセルのネイティブ幅を持つ5つのファンドスデータセット(DRIVE, STARE, CHASE_DB1, HRF, FIVES)に対して,複数のダウンサンプリング比率でベースラインUNetをトレーニングすることにより検証した。ユークリッド距離変換を用いて, 薄型(半幅<3ピクセル), 中型(3～7ピクセル), 肉厚(>7ピクセル)の血管検出を別々に評価した。その結果,高分解能データセット(HRF, FIVES)では,画像がエンコーダの有効操作範囲にダウンサンプリングされ,256から876ピクセルの処理幅でピークとなるため,細血管感度が単調に向上することがわかった。低中間分解能データセット(DRIVE、STARE、CHASE_DB1)では、細い容器感度はネイティブ解像度か近辺で最も高く、ダウンサンプリングなしで劣化する。 5つのデータセット全体で、攻撃的なダウンサンプリングにより、細血管の感度は最大15.8ポイント(DRIVE)まで低下し、一方Diceは比較的安定しており、Diceのみが微小血管のセグメンテーションを評価するには不十分であることを確認した。

関連論文リスト

HMS-VesselNet: Hierarchical Multi-Scale Attention Network with Topology-Preserving Loss for Retinal Vessel Segmentation [0.0]
HMS-VesselNetは階層的なマルチスケールネットワークで、異なる解像度で4つの並列ブランチにまたがるファンドイメージを処理する。 DRIVE、STARE、CHASE_DB1の68枚の画像を5倍のクロスバリデーションでテストし、平均Diceの88.72 +/- 0.67%、感度90.78 +/- 1.42%、AUCの98.25 +/- 0.21%を達成した。
論文参考訳（メタデータ） (2026-03-23T12:16:45Z)
No Dense Tensors Needed: Fully Sparse Object Detection on Event-Camera Voxel Grids [0.3823356975862005]
イベントカメラは、小型で高速で動くドローンを検出するのに適した、非同期で高ダイナミックなストリームを生成する。ほとんどの事象ベースの検出器はスパース事象ストリームを密度の高いテンソルに変換し、ニューロモルフィックセンシングの表現効率を放棄する。 SparseVoxelDetは,バックボーンの特徴抽出,ピラミッド融合,検出ヘッドがすべて占有されたボクセル位置のみで動作する,イベントカメラ用初の完全スパース物体検出器である。
論文参考訳（メタデータ） (2026-03-23T07:12:14Z)
Ultrafast Deep Learning-Based Scatter Estimation in Cone-Beam Computed Tomography [7.864992877255044]
散乱アーティファクトは、コーンビームCT(CBCT)スキャンの画質を大幅に劣化させる。深層学習に基づく手法はCBCT測定から散乱を推定する上で有望であることを示す。モバイルCBCTシステムやエッジデバイスへの展開は、ネットワークのメモリフットプリントが大きいため、依然として制限されている。
論文参考訳（メタデータ） (2025-09-10T20:07:56Z)
On the Generalizability of Iterative Patch Selection for Memory-Efficient High-Resolution Image Classification [0.0]
大きな画像を小さな領域または小さな領域で分類することは、計算とメモリの制約のために困難である。パッチ選択モジュールとしてIterative Patch Selection (IPS) を用いたメモリ効率の高いクロスアテンショントランスフォーマを用いた新しいテストベッドを用いて,これらの問題を探索する。
論文参考訳（メタデータ） (2024-12-15T16:25:30Z)
Robust Depth Enhancement via Polarization Prompt Fusion Tuning [112.88371907047396]
様々な深度センサによる不正確な深度測定を改善するために偏光イメージングを利用するフレームワークを提案する。まず、偏光データとセンサ深度マップから高密度で完全な深度マップを推定するために、ニューラルネットワークを訓練した学習ベースの戦略を採用する。大規模データセット上で事前学習したRGBモデルを有効に活用するためのPPFT(Polarization Prompt Fusion Tuning)戦略を提案する。
論文参考訳（メタデータ） (2024-04-05T17:55:33Z)
Towards Efficient and Accurate CT Segmentation via Edge-Preserving Probabilistic Downsampling [2.1465347972460367]
限られたリソースやネットワークトレーニングの迅速化を必要とするイメージやラベルのダウンサンプリングは、小さなオブジェクトと薄いバウンダリの損失につながる。これにより、セグメンテーションネットワークのイメージを正確に解釈し、詳細なラベルを予測する能力が損なわれ、元の解像度での処理と比較して性能が低下する。エッジ保存型確率ダウンサンプリング(EPD)という新しい手法を提案する。ローカルウィンドウ内のクラス不確実性を利用してソフトラベルを生成し、ウィンドウサイズがダウンサンプリング係数を規定する。
論文参考訳（メタデータ） (2024-04-05T10:01:31Z)
RGB-based Category-level Object Pose Estimation via Decoupled Metric Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文参考訳（メタデータ） (2023-09-19T02:20:26Z)
Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文参考訳（メタデータ） (2023-08-24T12:32:46Z)
SALISA: Saliency-based Input Sampling for Efficient Video Object Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。 SALISAは小物体の検出を著しく改善することを示す。
論文参考訳（メタデータ） (2022-04-05T17:59:51Z)
6DoF Object Pose Estimation via Differentiable Proxy Voting Loss [113.72905482334767]
我々は,投票手順における仮説選択を模倣した,微分可能な代行投票損失(DPVL)を開発する。 LINEMOD と Occlusion LINEMOD という,広く使用されているデータセットの実験により,DPVL がポーズ推定性能を大幅に向上することが示された。
論文参考訳（メタデータ） (2020-02-10T16:33:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。