Fugu-MT 論文翻訳(概要): Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion

論文の概要: Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion

arxiv url: http://arxiv.org/abs/2501.01114v1
Date: Thu, 02 Jan 2025 07:21:28 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-05 16:54:32.186539
Title: Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion
Title（参考訳）: グラディエント・プロモーションによる汎用タスク駆動型医用画像品質向上
Authors: Dong Zhang, Kwang-Ting Cheng,
Abstract要約: 既存のタスク駆動IQEモデルでは、さまざまなレベルの視覚タスクが、画像特徴の要求に相反することがあるという、根本的な事実を見落としてしまう傾向があります。本稿では,医療画像のタスク駆動IQEのための一般化勾配促進(GradProm)トレーニング戦略を提案する。
参考スコア（独自算出の注目度）: 33.03871451803645
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Thanks to the recent achievements in task-driven image quality enhancement (IQE) models like ESTR, the image enhancement model and the visual recognition model can mutually enhance each other's quantitation while producing high-quality processed images that are perceivable by our human vision systems. However, existing task-driven IQE models tend to overlook an underlying fact -- different levels of vision tasks have varying and sometimes conflicting requirements of image features. To address this problem, this paper proposes a generalized gradient promotion (GradProm) training strategy for task-driven IQE of medical images. Specifically, we partition a task-driven IQE system into two sub-models, i.e., a mainstream model for image enhancement and an auxiliary model for visual recognition. During training, GradProm updates only parameters of the image enhancement model using gradients of the visual recognition model and the image enhancement model, but only when gradients of these two sub-models are aligned in the same direction, which is measured by their cosine similarity. In case gradients of these two sub-models are not in the same direction, GradProm only uses the gradient of the image enhancement model to update its parameters. Theoretically, we have proved that the optimization direction of the image enhancement model will not be biased by the auxiliary visual recognition model under the implementation of GradProm. Empirically, extensive experimental results on four public yet challenging medical image datasets demonstrated the superior performance of GradProm over existing state-of-the-art methods.
Abstract（参考訳）: ESTRのようなタスク駆動型画像品質向上(IQE)モデルの最近の成果により、画像強調モデルと視覚認識モデルは、人間の視覚システムによって認識される高品質な処理画像を生成しながら、相互に量子化を増強することができる。しかし、既存のタスク駆動IQEモデルでは、さまざまなレベルの視覚タスクが画像特徴の要求に相反することがあるため、基礎的な事実を見落としてしまう傾向があります。この問題に対処するために,医療画像のタスク駆動IQEのための一般化勾配促進(GradProm)トレーニング戦略を提案する。具体的には,タスク駆動型IQEシステムを2つのサブモデル,すなわち画像強調の主流モデルと視覚認識の補助モデルに分割する。トレーニング中、GradPromは、視覚認識モデルと画像強調モデルの勾配を用いた画像強調モデルのパラメータのみを更新するが、これら2つのサブモデルの勾配が同じ方向に配置されている場合にのみ、コサイン類似性によって測定される。これら2つのサブモデルの勾配が同じ方向ではない場合、GradPromはパラメータを更新するために画像拡張モデルの勾配のみを使用する。理論的には、GradPromの実装下では、画像強調モデルの最適化方向が補助的な視覚認識モデルに偏らないことが証明されている。 4つの公開かつ挑戦的な医療画像データセットに対する実験的実験の結果は、既存の最先端の手法よりもGradPromの優れたパフォーマンスを示した。

関連論文リスト

HiLLIE: Human-in-the-Loop Training for Low-Light Image Enhancement [17.6915952753551]
本稿では,教師なしLLIEモデル出力の視覚的品質を改善するための,ループ内LLIEトレーニングフレームワークを提案する。我々は、取得したラベルに符号化された人間の視覚的嗜好を学習するために、画像品質評価(IQA)モデルを用いる。提案手法は,各段階において少量のペア・ランキング・アノテーションしか必要とせず,改良された出力の人間の視覚的評価をシミュレートするIQAモデルの性能を継続的に改善する。
論文参考訳（メタデータ） (2025-05-04T14:44:37Z)
Boosting Generative Image Modeling via Joint Image-Feature Synthesis [10.32324138962724]
低レベル画像潜在者を共同でモデル化するために拡散モデルを活用することで、ギャップをシームレスに橋渡しする新しい生成画像モデリングフレームワークを提案する。我々の潜在セマンティック拡散アプローチは、純雑音からコヒーレントな画像-特徴対を生成することを学ぶ。複雑な蒸留目的の必要をなくすことで、我々の統一設計は訓練を単純化し、強力な新しい推論戦略である表現誘導を解き放つ。
論文参考訳（メタデータ） (2025-04-22T17:41:42Z)
UniVG: A Generalist Diffusion Model for Unified Image Generation and Editing [59.590505989071175]
テキスト・ツー・イメージ(T2I)拡散モデルでは、ユーザのプロンプトに従って視覚的に魅力的な画像を生成するという印象的な結果が示されている。我々は,一組の重みで多様な画像生成タスクをサポートする汎用拡散モデルUniVGを紹介する。
論文参考訳（メタデータ） (2025-03-16T21:11:25Z)
AniGaussian: Animatable Gaussian Avatar with Pose-guided Deformation [51.61117351997808]
SMPLポーズガイダンスを用いて動的ガウスアバターを拘束する革新的ポーズ誘導変形戦略を導入する。我々は、ガウスモデルの動的変換能力を高めるために、以前の研究から厳密な事前を取り入れた。既存の手法との比較により、AniGaussianは定性的結果と定量的指標の両方において優れた性能を示す。
論文参考訳（メタデータ） (2025-02-24T06:53:37Z)
EditAR: Unified Conditional Generation with Autoregressive Models [58.093860528672735]
本稿では,条件付き画像生成タスクのための単一の統合自己回帰フレームワークであるEditARを提案する。このモデルは、画像と命令の両方を入力として取り、バニラの次のパラダイムで編集された画像トークンを予測する。確立されたベンチマークにおいて,様々なタスクにまたがる実効性を評価し,様々なタスク固有の手法に対する競争性能を示す。
論文参考訳（メタデータ） (2025-01-08T18:59:35Z)
Fine Tuning Text-to-Image Diffusion Models for Correcting Anomalous Images [0.0]
本研究では,DreamBooth法を用いて安定拡散3モデルを微調整することにより,このような問題を緩和する手法を提案する。 SSIM(Structure similarity Index)、Pak Signal-to-Noise Ratio(PSNR)、Frechet Inception Distance(FID)など、視覚的評価の精度向上を示す。
論文参考訳（メタデータ） (2024-09-23T00:51:47Z)
DP-IQA: Utilizing Diffusion Prior for Blind Image Quality Assessment in the Wild [54.139923409101044]
野生のブラインド画像品質評価(IQA)は重大な課題を呈している。大規模なトレーニングデータの収集が困難であることを考えると、厳密な一般化モデルを開発するために限られたデータを活用することは、未解決の問題である。事前訓練されたテキスト・ツー・イメージ(T2I)拡散モデルの堅牢な画像認識能力により,新しいIQA法,拡散先行に基づくIQAを提案する。
論文参考訳（メタデータ） (2024-05-30T12:32:35Z)
Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文参考訳（メタデータ） (2024-05-29T06:09:34Z)
When No-Reference Image Quality Models Meet MAP Estimation in Diffusion Latents [92.45867913876691]
非参照画像品質評価(NR-IQA)モデルは、知覚された画像品質を効果的に定量化することができる。 NR-IQAモデルは、画像強調のための最大後部推定(MAP)フレームワークにプラグイン可能であることを示す。
論文参考訳（メタデータ） (2024-03-11T03:35:41Z)
ALL-E: Aesthetics-guided Low-light Image Enhancement [45.40896781156727]
我々は、新しいパラダイム、すなわち美学誘導低光画像強調(ALL-E)を提案する。 LLEに美的嗜好を導入し、美的報酬を伴う強化学習フレームワークでのトレーニングを動機付けている。様々なベンチマークの結果は、最先端手法よりもall-Eの方が優れていることを示している。
論文参考訳（メタデータ） (2023-04-28T03:34:10Z)
IRGen: Generative Modeling for Image Retrieval [82.62022344988993]
本稿では,画像検索を生成モデルの一種として再フレーミングする新しい手法を提案する。我々は、イメージを意味単位の簡潔なシーケンスに変換するという技術的課題に対処するため、IRGenと呼ばれるモデルを開発した。本モデルは,広範に使用されている3つの画像検索ベンチマークと200万件のデータセットに対して,最先端の性能を実現する。
論文参考訳（メタデータ） (2023-03-17T17:07:36Z)
High-resolution semantically-consistent image-to-image translation [0.0]
本稿では,スタイル変換フェーズにおける画像のセマンティック一貫性と画素単位の品質を保った教師なし領域適応モデルを提案する。提案モデルでは,SemI2Iモデルと比較してかなりの性能向上を示し,最先端のCyCADAモデルと同様の結果を得た。
論文参考訳（メタデータ） (2022-09-13T19:08:30Z)
A Generic Approach for Enhancing GANs by Regularized Latent Optimization [79.00740660219256]
本稿では,事前学習したGANを効果的かつシームレスに拡張できる,エミュレーティブモデル推論と呼ばれる汎用フレームワークを提案する。我々の基本的な考え方は、ワッサーシュタイン勾配流法を用いて与えられた要求に対する最適潜時分布を効率的に推算することである。
論文参考訳（メタデータ） (2021-12-07T05:22:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。