論文の概要: Progressive Frequency-Aware Network for Laparoscopic Image Desmoking
- arxiv url: http://arxiv.org/abs/2312.12023v1
- Date: Tue, 19 Dec 2023 10:19:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 16:01:37.541743
- Title: Progressive Frequency-Aware Network for Laparoscopic Image Desmoking
- Title(参考訳): 腹腔鏡下デモーキング用プログレッシブ周波数認識ネットワーク
- Authors: Jiale Zhang and Wenfeng Huang, Xiangyun Liao, and Qiong Wang
- Abstract要約: 本稿では,CNNとTransformerの強みを組み合わせた腹腔鏡下画像喫煙のための軽量なGANフレームワークを提案する。
PFANは、限られたトレーニングデータであっても、腹腔鏡像を効率的に除去する。
提案手法は,PSNR,SSIM,CIEDE2000,およびCholec80データセットの視覚的品質において,最先端のアプローチよりも優れている。
- 参考スコア(独自算出の注目度): 8.988060012957497
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Laparoscopic surgery offers minimally invasive procedures with better patient
outcomes, but smoke presence challenges visibility and safety. Existing
learning-based methods demand large datasets and high computational resources.
We propose the Progressive Frequency-Aware Network (PFAN), a lightweight GAN
framework for laparoscopic image desmoking, combining the strengths of CNN and
Transformer for progressive information extraction in the frequency domain.
PFAN features CNN-based Multi-scale Bottleneck-Inverting (MBI) Blocks for
capturing local high-frequency information and Locally-Enhanced Axial Attention
Transformers (LAT) for efficiently handling global low-frequency information.
PFAN efficiently desmokes laparoscopic images even with limited training data.
Our method outperforms state-of-the-art approaches in PSNR, SSIM, CIEDE2000,
and visual quality on the Cholec80 dataset and retains only 629K parameters.
Our code and models are made publicly available at:
https://github.com/jlzcode/PFAN.
- Abstract(参考訳): 腹腔鏡下手術は、より優れた患者結果をもたらす最小限の侵襲的処置を提供するが、煙の存在は可視性と安全性に挑戦する。
既存の学習ベースの手法は大規模なデータセットと高い計算資源を必要とする。
本稿では,PFAN(Progressive Frequency-Aware Network)を提案し,CNNとTransformerの強みを組み合わせて周波数領域のプログレッシブ情報抽出を行う。
PFANは、ローカルな高周波情報を取得するためのCNNベースのMultiscale Bottleneck-Inverting (MBI)ブロックと、グローバルな低周波情報を効率的に扱うための局所強化軸アテンション変換器(LAT)を備えている。
pfanは限られたトレーニングデータでも効率的に腹腔鏡像をデモースする。
提案手法は,PSNR,SSIM,CIEDE2000の最先端手法とColec80データセットの視覚的品質に優れ,629Kパラメータしか保持しない。
私たちのコードとモデルは、https://github.com/jlzcode/PFAN.comで公開されています。
関連論文リスト
- A lightweight residual network for unsupervised deformable image registration [2.7309692684728617]
本稿では, 並列拡張畳み込みブロックを組み込んだ残差U-Netを提案する。
本手法は患者間およびアトラスに基づくデータセットを用いて評価する。
論文 参考訳(メタデータ) (2024-06-14T07:20:49Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - WATUNet: A Deep Neural Network for Segmentation of Volumetric Sweep
Imaging Ultrasound [1.2903292694072621]
ボリューム・スイープ・イメージング(VSI)は、訓練を受けていないオペレーターが高品質な超音波画像をキャプチャできる革新的な手法である。
本稿ではWavelet_Attention_UNet(WATUNet)と呼ばれる新しいセグメンテーションモデルを提案する。
このモデルでは、簡単な接続ではなく、ウェーブレットゲート(WG)とアテンションゲート(AG)をエンコーダとデコーダの間に組み込んで、上記の制限を克服する。
論文 参考訳(メタデータ) (2023-11-17T20:32:37Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - A Complementary Global and Local Knowledge Network for Ultrasound
denoising with Fine-grained Refinement [0.7424725048947504]
超音波イメージングは、一般的に臨床検査で使用される効果的で非侵襲的な診断ツールとして機能する。
既存のスペックルノイズ低減手法は、過剰な画像の平滑化を誘発するか、詳細情報を適切に保存することができない。
微細な精細化を伴う超音波診断のための補完的グローバル・ローカル知識ネットワークを提案する。
論文 参考訳(メタデータ) (2023-10-05T09:12:34Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Data Augmentation and CNN Classification For Automatic COVID-19
Diagnosis From CT-Scan Images On Small Dataset [0.0]
肺CT画像からのCOVID1-19自動診断フレームワークを提案する。
本論文では,複数のHounsfield Unit(HU)正規化ウィンドウを用いた一意かつ効果的なデータ拡張手法を提案する。
トレーニング・検証データセットでは,患者の分類精度は93.39%である。
論文 参考訳(メタデータ) (2021-08-16T15:23:00Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。