論文の概要: AgentPolyp: Accurate Polyp Segmentation via Image Enhancement Agent
- arxiv url: http://arxiv.org/abs/2504.10978v1
- Date: Tue, 15 Apr 2025 08:39:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:06:46.408993
- Title: AgentPolyp: Accurate Polyp Segmentation via Image Enhancement Agent
- Title(参考訳): AgentPolyp: 画像強調剤による正確なポリプセグメンテーション
- Authors: Pu Wang, Zhihua Zhang, Dianjie Lu, Guijuan Zhang, Youshan Zhang, Zhuoran Zheng,
- Abstract要約: AgentPolypはCLIPベースのセマンティックガイダンスと動的画像拡張をセグメンテーションのための軽量ニューラルネットワークに統合する新しいフレームワークである。
このフレームワークは、様々な拡張アルゴリズムとセグメンテーションネットワークのためのプラグインとプレイの拡張をサポートし、内視鏡デバイスのデプロイメント要件を満たしている。
- 参考スコア(独自算出の注目度): 29.891645824604684
- License:
- Abstract: Since human and environmental factors interfere, captured polyp images usually suffer from issues such as dim lighting, blur, and overexposure, which pose challenges for downstream polyp segmentation tasks. To address the challenges of noise-induced degradation in polyp images, we present AgentPolyp, a novel framework integrating CLIP-based semantic guidance and dynamic image enhancement with a lightweight neural network for segmentation. The agent first evaluates image quality using CLIP-driven semantic analysis (e.g., identifying ``low-contrast polyps with vascular textures") and adapts reinforcement learning strategies to dynamically apply multi-modal enhancement operations (e.g., denoising, contrast adjustment). A quality assessment feedback loop optimizes pixel-level enhancement and segmentation focus in a collaborative manner, ensuring robust preprocessing before neural network segmentation. This modular architecture supports plug-and-play extensions for various enhancement algorithms and segmentation networks, meeting deployment requirements for endoscopic devices.
- Abstract(参考訳): 人間と環境要因が干渉するため、キャプチャされたポリプ画像は、通常、薄暗い照明、ぼかし、露出過多といった問題に悩まされ、下流のポリプセグメンテーションタスクの課題を引き起こす。
ポリプ画像におけるノイズ誘起劣化の課題に対処するために,CLIPに基づくセマンティックガイダンスと動的画像強調をセグメンテーションのための軽量ニューラルネットワークと統合した新しいフレームワークであるAgentPolypを提案する。
このエージェントは、まず、CLIPによるセマンティック分析(例えば、低コントラストポリプと血管のテクスチャを識別する)を用いて画像品質を評価し、強化学習戦略を適用して、マルチモーダルエンハンスメント操作(例えば、デノイング、コントラスト調整)を動的に適用する。
品質評価フィードバックループは、ニューラルネットワークセグメンテーション前の堅牢な前処理を保証するために、画素レベルの強調とセグメンテーションの焦点を協調的に最適化する。
このモジュールアーキテクチャは、様々な拡張アルゴリズムとセグメンテーションネットワークのためのプラグインとプレイの拡張をサポートし、内視鏡デバイスのデプロイメント要件を満たす。
関連論文リスト
- Polyp-SES: Automatic Polyp Segmentation with Self-Enriched Semantic Model [7.424888086388194]
本稿では,既存手法の制約に対処するため,自己富化セマンティックモデルを用いたAutomatic Polypを提案する。
まず、入力画像から一連の特徴を抽出し、ハイレベルな特徴をデコードし、初期セグメンテーションマスクを生成する。
提案する自己富化セマンティックモジュールを用いて,潜在的なセマンティクスを検索し,さらにセマンティクスを付加することで,コンテキスト理解のモデルを支援する。
論文 参考訳(メタデータ) (2024-10-02T03:34:23Z) - ECC-PolypDet: Enhanced CenterNet with Contrastive Learning for Automatic
Polyp Detection [88.4359020192429]
既存の手法では、計算コストのかかるコンテキストアグリゲーションが伴うか、ポリープの事前モデリングが欠如しているため、難解なケースでは性能が低下する。
本稿では,2段階のトレーニングとエンドツーエンド推論フレームワークである Enhanced CenterNet with Contrastive Learning (ECC-PolypDet) を提案する。
Box-assisted Contrastive Learning (BCL) は, クラス内差を最小限に抑え, 前庭ポリープと背景のクラス間差を最大化するため, 隠れポリープを捕捉する。
微調整段階におけるIoU誘導サンプル再重み付けの導入
論文 参考訳(メタデータ) (2024-01-10T07:03:41Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Pyramid Pixel Context Adaption Network for Medical Image Classification with Supervised Contrastive Learning [9.391271552098878]
実用的で軽量なアーキテクチャユニットであるPraamid Pixel Context Adaption (PPCA) モジュールを提案する。
PPCAはマルチスケールの画素コンテキスト情報を利用して画素非依存の画素位置を補正する。
PPCANetは最先端の注目ネットワークや最近のディープニューラルネットワークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-03-03T13:36:55Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Adaptive Context Selection for Polyp Segmentation [99.9959901908053]
本稿では,ローカルコンテキストアテンション(LCA)モジュール,グローバルコンテキストモジュール(GCM)モジュール,適応選択モジュール(ASM)モジュールで構成される適応コンテキスト選択に基づくエンコーダデコーダフレームワークを提案する。
LCAモジュールは、エンコーダ層からデコーダ層へローカルなコンテキスト機能を提供する。
GCMは、グローバルなコンテキストの特徴をさらに探求し、デコーダ層に送信することを目的としている。ASMは、チャンネルワイドアテンションを通じて、コンテキスト特徴の適応的選択と集約に使用される。
論文 参考訳(メタデータ) (2023-01-12T04:06:44Z) - Enhanced U-Net: A Feature Enhancement Network for Polyp Segmentation [17.8181080354116]
大腸内視鏡画像におけるポリープ分割の精度向上のための特徴拡張ネットワークを提案する。
具体的には,semantic feature enhance module (sfem) を用いて意味情報の拡張を行う。
提案手法は5つの大腸内視鏡データを用いて評価し,他の最先端モデルと比較して優れた性能を示す。
論文 参考訳(メタデータ) (2021-05-03T16:46:26Z) - Max-Fusion U-Net for Multi-Modal Pathology Segmentation with Attention
and Dynamic Resampling [13.542898009730804]
関連するアルゴリズムの性能は、マルチモーダル情報の適切な融合によって大きく影響を受ける。
We present the Max-Fusion U-Net that achieve a improve pathology segmentation performance。
マルチシーケンスCMRデータセットを併用したMyoPS(Myocardial pathology segmentation)を用いて,本手法の評価を行った。
論文 参考訳(メタデータ) (2020-09-05T17:24:23Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。