Fugu-MT 論文翻訳(概要): A Survey on Personalized Content Synthesis with Diffusion Models

論文の概要: A Survey on Personalized Content Synthesis with Diffusion Models

arxiv url: http://arxiv.org/abs/2405.05538v1
Date: Thu, 9 May 2024 04:36:04 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-10 14:12:43.932844
Title: A Survey on Personalized Content Synthesis with Diffusion Models
Title（参考訳）: 拡散モデルを用いたパーソナライズドコンテンツ合成に関する研究
Authors: Xulu Zhang, Xiao-Yong Wei, Wengyu Zhang, Jinlin Wu, Zhaoxiang Zhang, Zhen Lei, Qing Li,
Abstract要約: PCSは、特定のユーザ定義のプロンプトに対する関心の主題をカスタマイズすることを目的としている。過去2年間で150以上の方法が提案されている。本稿では,PCSの拡散モデルに着目した包括的調査を行う。
参考スコア（独自算出の注目度）: 57.01364199734464
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advancements in generative models have significantly impacted content creation, leading to the emergence of Personalized Content Synthesis (PCS). With a small set of user-provided examples, PCS aims to customize the subject of interest to specific user-defined prompts. Over the past two years, more than 150 methods have been proposed. However, existing surveys mainly focus on text-to-image generation, with few providing up-to-date summaries on PCS. This paper offers a comprehensive survey of PCS, with a particular focus on the diffusion models. Specifically, we introduce the generic frameworks of PCS research, which can be broadly classified into optimization-based and learning-based approaches. We further categorize and analyze these methodologies, discussing their strengths, limitations, and key techniques. Additionally, we delve into specialized tasks within the field, such as personalized object generation, face synthesis, and style personalization, highlighting their unique challenges and innovations. Despite encouraging progress, we also present an analysis of the challenges such as overfitting and the trade-off between subject fidelity and text alignment. Through this detailed overview and analysis, we propose future directions to advance the development of PCS.
Abstract（参考訳）: 生成モデルの最近の進歩は、コンテンツ生成に大きな影響を与え、パーソナライズド・コンテント・シンセサイザー(PCS)の出現につながった。ユーザが提供するサンプルの小さなセットで、PCSは特定のユーザ定義のプロンプトに対象をカスタマイズすることを目的としている。過去2年間で150以上の方法が提案されている。しかし、既存の調査は主にテキスト・ツー・イメージ・ジェネレーションに重点を置いており、PCSに最新の要約を提供するものは少ない。本稿では,PCSの拡散モデルに着目した包括的調査を行う。具体的には,PCS研究の一般的なフレームワークを紹介し,最適化に基づくアプローチと学習に基づくアプローチに大きく分類することができる。さらに、これらの方法論を分類し、分析し、その強み、限界、そして重要な技術について議論する。さらに、私たちは、パーソナライズされたオブジェクト生成、顔合成、スタイルのパーソナライゼーションなど、フィールド内の特別なタスクを探求し、それらの固有の課題とイノベーションを強調します。進歩を奨励しているにもかかわらず、本研究では、過剰適合や、主観的忠実度とテキストアライメントのトレードオフといった課題についても分析する。この詳細な概要と分析を通して,PCSの開発を進めるための今後の方向性を提案する。

関連論文リスト

Personalized Generation In Large Model Era: A Survey [90.7579254803302]
大規模モデルの時代には、コンテンツ生成は徐々にパーソナライズドジェネレーション(PGen)へとシフトしている。本報告では,PGen に関する総合的な調査を行い,この急速に成長する分野における既存研究について考察する。複数のモダリティにまたがるPGen研究をブリッジすることで、この調査は知識共有と学際的コラボレーションを促進する貴重な情報源となる。
論文参考訳（メタデータ） (2025-03-04T13:34:19Z)
Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文参考訳（メタデータ） (2024-09-27T06:31:03Z)
Civiverse: A Dataset for Analyzing User Engagement with Open-Source Text-to-Image Models [0.7209758868768352]
我々は、何百万もの画像と関連するメタデータを含むCiviverseプロンプトデータセットを解析する。本稿では,テキストプロンプトのセマンティックな特徴について,プロンプト解析に着目する。本研究は, 意味的コンテンツの均質化に焦点をあてた上で, 明示的コンテンツの生成を優先する傾向を示した。
論文参考訳（メタデータ） (2024-08-10T21:41:03Z)
Self-Supervised Learning for Text Recognition: A Critical Survey [11.599791967838481]
テキスト認識(英語: Text Recognition, TR)とは、画像からテキスト情報を取得することに焦点を当てた研究領域である。ディープニューラルネットワーク(DNN)のトレーニングにラベルなしデータの大規模なデータセットを活用することで、自己監視学習(SSL)が注目されている。本稿では,TR分野におけるSSLの利用を集約し,その技術の現状を概観する。
論文参考訳（メタデータ） (2024-07-29T11:11:17Z)
Privacy Preserving Prompt Engineering: A Survey [14.402638881376419]
事前学習された言語モデル(PLM)は、広範囲の自然言語処理(NLP)タスクを解くのに非常に有能である。その結果、これらのモデルのサイズは近年顕著に拡大している。プライバシーに関する懸念は、広く使われている中で大きな障害となっている。
論文参考訳（メタデータ） (2024-04-09T04:11:25Z)
User Modeling and User Profiling: A Comprehensive Survey [0.0]
本稿では,ユーザモデリングとプロファイリング研究の現状,進化,今後の方向性について調査する。我々は、初期のステレオタイプモデルから最新のディープラーニング技術までの開発をトレースする、歴史的概要を提供する。また、プライバシ保護技術に対する重要なニーズと、ユーザモデリングアプローチにおける説明可能性と公正性への推進にも対処する。
論文参考訳（メタデータ） (2024-02-15T02:06:06Z)
Recent Advances in Predictive Modeling with Electronic Health Records [71.19967863320647]
EHRデータを予測モデリングに利用すると、その特徴からいくつかの課題が生じる。深層学習は、医療を含む様々な応用においてその優位性を示している。
論文参考訳（メタデータ） (2024-02-02T00:31:01Z)
Fine-Grained Zero-Shot Learning: Advances, Challenges, and Prospects [84.36935309169567]
ゼロショット学習(ZSL)における微粒化解析の最近の進歩を概観する。まず、各カテゴリの詳細な分析を行い、既存の手法と手法の分類について述べる。次に、ベンチマークを要約し、公開データセット、モデル、実装、およびライブラリとしての詳細について説明する。
論文参考訳（メタデータ） (2024-01-31T11:51:24Z)
SoK: Privacy-Preserving Data Synthesis [72.92263073534899]
本稿では,プライバシ保護データ合成(PPDS)に注目し,その分野の総合的な概要,分析,議論を行う。 PPDSでは,統計的手法と深層学習(DL)に基づく手法の2つの顕著な研究を統一するマスターレシピを作成した。
論文参考訳（メタデータ） (2023-07-05T08:29:31Z)
Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文参考訳（メタデータ） (2023-06-20T14:21:58Z)
Few Shot Semantic Segmentation: a review of methodologies, benchmarks, and open challenges [5.0243930429558885]
Few-Shot Semanticはコンピュータビジョンの新しいタスクであり、いくつかの例で新しいセマンティッククラスをセグメンテーションできるモデルを設計することを目的としている。本稿では、Few-Shot Semanticの総合的な調査からなり、その進化を辿り、様々なモデル設計を探求する。
論文参考訳（メタデータ） (2023-04-12T13:07:37Z)
Recent Few-Shot Object Detection Algorithms: A Survey with Performance Comparison [54.357707168883024]
Few-Shot Object Detection (FSOD)は、人間の学習能力を模倣する。 FSODは、学習した汎用オブジェクトの知識を共通のヘビーテールから新しいロングテールオブジェクトクラスにインテリジェントに転送する。本稿では,問題定義,共通データセット,評価プロトコルなどを含むFSODの概要を紹介する。
論文参考訳（メタデータ） (2022-03-27T04:11:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。