論文の概要: PrefPaint: Enhancing Image Inpainting through Expert Human Feedback
- arxiv url: http://arxiv.org/abs/2506.21834v1
- Date: Fri, 27 Jun 2025 00:47:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:23.040065
- Title: PrefPaint: Enhancing Image Inpainting through Expert Human Feedback
- Title(参考訳): PrefPaint: 専門家のフィードバックを通じて画像のインペインティングを強化する
- Authors: Duy-Bao Bui, Hoang-Khang Nguyen, Trung-Nghia Le,
- Abstract要約: 医療画像の塗布は不正確な画像を生成することができ、医療診断や治療に重大な誤りをもたらす。
安定拡散塗装のトレーニングプロセスに人間のフィードバックを取り入れたアプローチであるPrefPaintを提案する。
さらに,Web ベースのインタフェースにより,トレーニング,微調整,推論を効率化する。
- 参考スコア(独自算出の注目度): 4.618814297494939
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Inpainting, the process of filling missing or corrupted image parts, has broad applications, including medical imaging. However, in specialized fields like medical polyps imaging, where accuracy and reliability are critical, inpainting models can generate inaccurate images, leading to significant errors in medical diagnosis and treatment. To ensure reliability, medical images should be annotated by experts like oncologists for effective model training. We propose PrefPaint, an approach that incorporates human feedback into the training process of Stable Diffusion Inpainting, bypassing the need for computationally expensive reward models. In addition, we develop a web-based interface streamlines training, fine-tuning, and inference. This interactive interface provides a smooth and intuitive user experience, making it easier to offer feedback and manage the fine-tuning process. User study on various domains shows that PrefPaint outperforms existing methods, reducing visual inconsistencies and improving image rendering, particularly in medical contexts, where our model generates more realistic polyps images.
- Abstract(参考訳): Inpaintingは、欠落した画像部品や破損した画像部品を埋めるプロセスであり、医療画像など幅広い用途がある。
しかし、精度と信頼性が重要な医療ポリープ画像のような特殊な分野では、塗装モデルは不正確な画像を生成することができ、医療診断や治療に重大な誤りをもたらす。
信頼性を確保するためには、効果的なモデルトレーニングのために、腫瘍学者のような専門家が医療画像に注釈を付ける必要がある。
我々は,人間のフィードバックを安定拡散塗装のトレーニングプロセスに組み込むアプローチであるPrefPaintを提案し,計算コストのかかる報酬モデルの必要性を回避した。
さらに,Web ベースのインタフェースにより,トレーニング,微調整,推論を効率化する。
このインタラクティブインターフェースはスムーズで直感的なユーザエクスペリエンスを提供し、フィードバックの提供と微調整プロセスの管理を容易にする。
様々な領域のユーザスタディにより、PrefPaintは既存の手法よりも優れており、視覚的不整合を低減し、画像レンダリングを改善する。
関連論文リスト
- Knowledge-Guided Prompt Learning for Deepfake Facial Image Detection [54.26588902144298]
ディープフェイク顔画像検出のための知識誘導型プロンプト学習法を提案する。
具体的には、学習可能なプロンプトの最適化を導くための専門家知識として、大規模言語モデルから偽造関連プロンプトを抽出する。
提案手法は最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2025-01-01T02:18:18Z) - PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.72779589895124]
画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。
我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。
画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-29T11:49:39Z) - MedMAE: A Self-Supervised Backbone for Medical Imaging Tasks [3.1296917941367686]
本稿では,Masked Autoencoderと呼ばれる自己教師付き学習技術を用いて,医療画像の大規模未ラベルデータセットとバックボーンを事前訓練する。
このバックボーンは、様々な種類の医療画像の視覚的表現を学ぶために訓練されるため、あらゆる医療画像タスクの事前訓練されたモデルとして使用することができる。
論文 参考訳(メタデータ) (2024-07-20T07:29:04Z) - Optimised ProPainter for Video Diminished Reality Inpainting [11.041287549641547]
医用画像の専門的要求を満たすため,ProPainter法から最適化した精細な映像塗装技術を導入する。
我々の拡張アルゴリズムは、最適化されたパラメータと前処理を特徴とするゼロショットProPainterを用いて、手術用ビデオシーケンスをインペイントする複雑なタスクを積極的に管理する。
閉鎖領域の時間的一貫性と詳細に富んだ再構築を図り、手術現場のより明確な視認を促進することを目的としている。
論文 参考訳(メタデータ) (2024-06-04T13:00:22Z) - INCLG: Inpainting for Non-Cleft Lip Generation with a Multi-Task Image
Processing Network [18.141737818156265]
我々は,口唇画像の訓練を必要とせず,画像の塗り絵を用いたソフトウェア・フレームワークを設計する。
顔画像と顔のランドマークの両方を予測できる新しいマルチタスクアーキテクチャを実装した。
ソフトウェアはPyTorchで実装されており、予測速度の速いコンシューマレベルのカラー画像で使用することができる。
論文 参考訳(メタデータ) (2023-05-17T21:53:11Z) - Perceptual Artifacts Localization for Inpainting [60.5659086595901]
そこで本研究では,知覚的アーティファクトの自動セグメンテーションの学習タスクを提案する。
データセット上で高度なセグメンテーションネットワークをトレーニングし、インペイントされた画像内のインペイントされたアーティファクトを確実にローカライズする。
また, 対象領域と対象領域全体との比率である知覚人工物比 (PAR) という新しい評価指標を提案する。
論文 参考訳(メタデータ) (2022-08-05T18:50:51Z) - Generative Adversarial U-Net for Domain-free Medical Image Augmentation [49.72048151146307]
注釈付き医用画像の不足は、医用画像コンピューティングの分野における最大の課題の1つだ。
本稿では,生成逆U-Netという新しい生成手法を提案する。
当社の新しいモデルは、ドメインフリーで、さまざまな医療画像に汎用性があります。
論文 参考訳(メタデータ) (2021-01-12T23:02:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。