論文の概要: ResNet-50 with Class Reweighting and Anatomy-Guided Temporal Decoding for Gastrointestinal Video Analysis
- arxiv url: http://arxiv.org/abs/2603.17784v1
- Date: Wed, 18 Mar 2026 14:46:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.761821
- Title: ResNet-50 with Class Reweighting and Anatomy-Guided Temporal Decoding for Gastrointestinal Video Analysis
- Title(参考訳): ResNet-50による消化管ビデオ解析
- Authors: Romil Imtiaz, Dimitris K. Iakovidis,
- Abstract要約: このシステムは5つの解剖学クラスと12の病理学クラスを含む17のラベルを336x336のフレームから予測する。
主な課題は、特に希少な病理病のラベルについて、深刻な階級不均衡であった。
この設計では、最終時間mAPをチャレンジテストセットで0.3801から0.4303に改善した。
- 参考スコア(独自算出の注目度): 3.716965622352967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We developed a multi-label gastrointestinal video analysis pipeline based on a ResNet-50 frame classifier followed by anatomy-guided temporal event decoding. The system predicts 17 labels, including 5 anatomy classes and 12 pathology classes, from frames resized to 336x336. A major challenge was severe class imbalance, particularly for rare pathology labels. To address this, we used clipped class-wise positive weighting in the training loss, which improved rare-class learning while maintaining stable optimization. At the temporal stage, we found that direct frame-to-event conversion produced fragmented mismatches with the official ground truth. The final submission therefore combined GT-style framewise event composition, anatomy vote smoothing, and anatomy-based pathology gating with a conservative hysteresis decoder. This design improved the final temporal mAP from 0.3801 to 0.4303 on the challenge test set.
- Abstract(参考訳): 我々はResNet-50フレーム分類器と解剖誘導時事象復号器を用いた多ラベル消化管ビデオ解析パイプラインを開発した。
このシステムは5つの解剖学クラスと12の病理学クラスを含む17のラベルを336x336のフレームから予測する。
主な課題は、特に希少な病理病のラベルについて、厳格な階級不均衡であった。
これを解決するために、私たちは訓練損失においてクリップされたクラスワイドの重み付けを使用し、安定した最適化を維持しながらレアクラスの学習を改善した。
時間的な段階では、直接フレーム・ツー・イベント変換は、公式な根拠の真実と断片化されたミスマッチを生み出した。
最終提出は、GTスタイルのイベント構成、解剖学的投票の平滑化、および保守的なヒステリシスデコーダを用いた解剖学に基づく病理学を組み合わした。
この設計では、最終時間mAPをチャレンジテストセットで0.3801から0.4303に改善した。
関連論文リスト
- Loss Design and Architecture Selection for Long-Tailed Multi-Label Chest X-Ray Classification [0.0]
長期分布クラスはマルチラベル胸部X線分類において重要な課題である。
我々は,CXR-LT 2026ベンチマークを用いて,損失関数,CNNバックボーンアーキテクチャ,後学習戦略の体系的評価を行った。
本実験は,遅延再重み付けによるLDAMが標準BCEと非対称な損失を常に上回っていることを示す。
論文 参考訳(メタデータ) (2026-03-02T17:33:00Z) - Neural Implicit Heart Coordinates: 3D cardiac shape reconstruction from sparse segmentations [14.200667111973729]
本稿では,一様心室座標に基づく暗黙座標系であるNIHC(Neural Implicit Heart Coordinates)を導入する。
提案手法は, NIHCを限られた数の2次元セグメンテーション(スパース取得)から直接予測し, それらを高分解能メッシュと高密度3次元セグメンテーションにデコードする。
5000個の心臓メッシュの大規模なデータセットでトレーニングされたこのモデルは、臨床輪郭の解剖学的に高い再現精度を達成する。
論文 参考訳(メタデータ) (2025-12-22T12:07:05Z) - Hierarchical Semantic Learning for Multi-Class Aorta Segmentation [7.05504780945516]
既存の手法は、しばしば階層的な解剖学的関係を見落としている。
階層型セマンティックラーニングに新しいフラクタルソフトマックスを活用するカリキュラム学習戦略を提案する。
人間の認知にインスパイアされた我々のアプローチは、複雑な構造を分解することで解剖学的制約を徐々に学習する。
論文 参考訳(メタデータ) (2025-11-18T06:46:07Z) - MedVSR: Medical Video Super-Resolution with Cross State-Space Propagation [63.38824041721275]
低解像度(LR)医療ビデオは、ビデオ超解像度(VSR)モデルに固有の課題を提示する。
本稿では,医療用VSRのためのフレームワークであるMedVSRを提案する。
MedVSRは既存のVSRモデルよりも性能と効率が優れていることを示す。
論文 参考訳(メタデータ) (2025-09-25T14:56:59Z) - KaLDeX: Kalman Filter based Linear Deformable Cross Attention for Retina Vessel Segmentation [46.57880203321858]
カルマンフィルタを用いた線形変形型クロスアテンション(LDCA)モジュールを用いた血管セグメンテーションのための新しいネットワーク(KaLDeX)を提案する。
我々のアプローチは、カルマンフィルタ(KF)ベースの線形変形可能な畳み込み(LD)とクロスアテンション(CA)モジュールの2つの重要なコンポーネントに基づいている。
提案手法は,網膜基底画像データセット(DRIVE,CHASE_BD1,STARE)とOCTA-500データセットの3mm,6mmを用いて評価した。
論文 参考訳(メタデータ) (2024-10-28T16:00:42Z) - Anatomy-guided Pathology Segmentation [56.883822515800205]
本研究では, 解剖学的特徴と病理学的情報を組み合わせた汎用的セグメンテーションモデルを構築し, 病理学的特徴のセグメンテーション精度を高めることを目的とする。
我々の解剖学・病理学交流(APEx)訓練では,ヒト解剖学の問合せ表現に結合特徴空間をデコードする問合せベースのセグメンテーション変換器を用いている。
これにより、FDG-PET-CTとChest X-Rayの病理分類タスクにおいて、強力なベースライン法に比べて最大3.3%のマージンで、ボード全体で最高の結果を報告できる。
論文 参考訳(メタデータ) (2024-07-08T11:44:15Z) - FLex: Joint Pose and Dynamic Radiance Fields Optimization for Stereo Endoscopic Videos [79.50191812646125]
内視鏡的シーンの再構築は、外科手術後の分析から教育訓練まで、様々な医療応用にとって重要な要素である。
変形組織の非常にダイナミックな環境下での移動内視鏡の挑戦的なセットアップに着目する。
複数重重なり合う4次元ニューラルラジアンスフィールド(NeRF)への暗黙的なシーン分離と、再構成とカメラのスクラッチからのポーズを協調的に最適化するプログレッシブ最適化手法を提案する。
これにより、使いやすさが向上し、5000フレーム以上の手術ビデオの処理に間に合うように復元能力を拡張できる。
論文 参考訳(メタデータ) (2024-03-18T19:13:02Z) - Advances in Kidney Biopsy Lesion Assessment through Dense Instance Segmentation [0.3926357402982764]
腎病理学者による病変スコアは半定量的であり、サーバ間の変動が高い。
DiffRegFormerは計算に優しいフレームワークで、3つの解剖学的クラスにわたる500以上のオブジェクトを効率的に認識できる。
我々の手法は従来の手法よりも優れており、平均精度は52.1%(検出)と46.8%(分離)である。
論文 参考訳(メタデータ) (2023-09-29T11:59:57Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - PS-DeVCEM: Pathology-sensitive deep learning model for video capsule
endoscopy based on weakly labeled data [0.0]
本稿では, ビデオカプセル内視鏡(VCE)データを用いて, フレームレベルの異常検出と大腸疾患の多ラベル分類を行うための, 病因性深層学習モデル(PS-DeVCEM)を提案する。
我々のモデルは注目に基づく深層マルチインスタンス学習によって駆動され、弱いラベル付きデータでエンドツーエンドに訓練されている。
トレーニング中にフレームアノテーション情報を使わずに、時間的にフレームを病状でローカライズする能力を示す。
論文 参考訳(メタデータ) (2020-11-22T15:33:37Z) - Weakly-supervised Learning For Catheter Segmentation in 3D Frustum
Ultrasound [74.22397862400177]
超音波を用いた新しいカテーテルセグメンテーション法を提案する。
提案手法は,1ボリュームあたり0.25秒の効率で最先端の性能を実現した。
論文 参考訳(メタデータ) (2020-10-19T13:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。