論文の概要: BLK-Assist: A Methodological Framework for Artist-Led Co-Creation with Generative AI Models
- arxiv url: http://arxiv.org/abs/2604.03249v1
- Date: Tue, 10 Mar 2026 15:59:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-12 18:41:08.548354
- Title: BLK-Assist: A Methodological Framework for Artist-Led Co-Creation with Generative AI Models
- Title(参考訳): BLK-Assist: ジェネレーティブAIモデルを用いたアーティスト主導のコクリエーションのための方法論フレームワーク
- Authors: Daniel Grimes, Rachel M. Harrison,
- Abstract要約: BLK-Assistは、アーティスト固有の拡散モデルの微調整のためのモジュラーフレームワークである。
システムは、単一のプロのアーティストの独自コーパスでケーススタディとして実装される。
- 参考スコア(独自算出の注目度): 0.11458853556386796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents BLK-Assist, a modular framework for artist-specific fine-tuning of diffusion models using parameter-efficient methods. The system is implemented as a case study with a single professional artist's proprietary corpus and consists of three components: BLK-Conceptor (LoRA-adapted conceptual sketch generation), BLK-Stencil (LayerDiffuse-based transparency-preserving asset generation), and BLK-Upscale (hybrid Real-ESRGAN and texture-conditioned diffusion for high-resolution outputs). We document dataset composition, preprocessing, training configurations, and inference workflows to enable reproducibility with publicly available models to illustrate a privacy-preserving, consent-based approach to human-AI co-creation that maintains stylistic fidelity to the source corpus and can be adapted for other artists under similar constraints.
- Abstract(参考訳): 本稿では,パラメータ効率の手法を用いて,アーティスト固有の拡散モデルの微調整を行うためのモジュールフレームワークBLK-Assistを提案する。
BLK-Conceptor(LoRA対応の概念スケッチ生成)、BLK-Stencil(LayerDiffuseベースの透明性保存資産生成)、BLK-Upscale(ハイブリドリアルESRGANと高解像度出力のためのテクスチャ条件拡散)の3つのコンポーネントで構成される。
我々は、データセットの構成、前処理、トレーニング設定、推論ワークフローを文書化し、公開モデルとの再現性を実現し、同様の制約の下で、ソースコーパスへのスタイリスティックな忠実さを維持し、他のアーティストに適応できる、プライバシー保護、同意に基づく人間-AI共同創造のアプローチを説明する。
関連論文リスト
- Data-Efficient Brushstroke Generation with Diffusion Models for Oil Painting [60.15416769662556]
そこで本研究では,手書きサンプルの小さなセットから人型ブラシストローク生成を学習する問題について検討する。
Smooth Regularization (SmR) を用いた拡散型フレームワーク StrokeDiff を提案する。
学習したプリミティブをBézierベースの条件付けモジュールで制御可能であることを示す。
論文 参考訳(メタデータ) (2026-03-01T13:42:35Z) - BLIP3o-NEXT: Next Frontier of Native Image Generation [113.25832679864631]
本稿では,ネイティブ画像生成の次のフロンティアであるBLIP3シリーズにおいて,完全にオープンな基盤モデルBLIP3oを提案する。
BLIP3oは単一のアーキテクチャで画像生成と画像編集を統一し、強力な画像生成と画像編集機能を示す。
論文 参考訳(メタデータ) (2025-10-17T17:50:58Z) - Chord: Chain of Rendering Decomposition for PBR Material Estimation from Generated Texture Images [10.46170854352924]
PBR材料生成のための新しい2段階生成・推定フレームワークを提案する。
生成段階では、微調整拡散モデルがユーザ入力に合わせた色付けされたタイル状テクスチャ画像を合成する。
推定段階では,事前に抽出した表現を単一ステップの画像条件拡散モデルに変換することで,SVBRDFチャネルを逐次予測する連鎖分解方式を導入する。
論文 参考訳(メタデータ) (2025-09-12T04:03:07Z) - DreamLifting: A Plug-in Module Lifting MV Diffusion Models for 3D Asset Generation [28.051782483658396]
軽量ガウスアセットアダプタ(LGAA)は幾何学とPBRのモデリングを統合する新しいフレームワークである。
私たちのコード、トレーニング済みの重み、使用したデータセットは、プロジェクトのページから公開されます。
論文 参考訳(メタデータ) (2025-09-09T06:43:15Z) - HSTU-BLaIR: Lightweight Contrastive Text Embedding for Generative Recommender [8.466223794246261]
本稿では,軽量なコントラストテキスト埋め込みモデルで生成レコメンデータを増強するハイブリッドフレームワークHSTU-BLaIRを提案する。
HSTU-BLaIRをAmazon Reviews 2023データセットの3つのサブセットとSteamデータセットの2つのEコマースデータセットで評価した。
論文 参考訳(メタデータ) (2025-04-13T15:23:00Z) - Semi-supervised Medical Image Segmentation Method Based on Cross-pseudo
Labeling Leveraging Strong and Weak Data Augmentation Strategies [2.8246591681333024]
本稿では,Fixmatch の概念を革新的に取り入れた半教師付きモデル DFCPS を提案する。
整合性学習と自己学習を統合したクロス擬似スーパービジョンが導入された。
我々のモデルは、ラベルなしデータの比率が異なる4つの区分全てにおいて、常に優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-17T13:07:44Z) - Towards Aligned Layout Generation via Diffusion Model with Aesthetic Constraints [53.66698106829144]
広い範囲のレイアウト生成タスクを処理する統一モデルを提案する。
このモデルは連続拡散モデルに基づいている。
実験結果から,LACEは高品質なレイアウトを生成することがわかった。
論文 参考訳(メタデータ) (2024-02-07T11:12:41Z) - Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and
Latent Diffusion [50.59261592343479]
本稿では、潜伏拡散アーキテクチャの新しい探索であるKandinsky1を紹介する。
提案したモデルは、CLIPのイメージ埋め込みにテキスト埋め込みをマッピングするために別々に訓練されている。
また,テキスト・ツー・イメージ生成,画像融合,テキスト・画像融合,画像のバリエーション生成,テキスト・インペイント/アウトペイントなど,多様な生成モードをサポートするユーザフレンドリーなデモシステムも展開した。
論文 参考訳(メタデータ) (2023-10-05T12:29:41Z) - Improving Few-shot Image Generation by Structural Discrimination and
Textural Modulation [10.389698647141296]
画像生成の目的は、このカテゴリからいくつかの画像が与えられた場合、あるカテゴリに対して可塑性で多様な画像を生成することである。
既存のアプローチでは、異なる画像をグローバルに補間するか、事前に定義された係数で局所表現を融合する。
本稿では,内部局所表現に外部意味信号を注入する新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2023-08-30T16:10:21Z) - UniDiff: Advancing Vision-Language Models with Generative and
Discriminative Learning [86.91893533388628]
本稿では、画像テキストコントラスト学習(ITC)、テキスト条件付き画像合成学習(IS)、相互意味整合性モデリング(RSC)を統合した統合マルチモーダルモデルUniDiffを提案する。
UniDiffはマルチモーダル理解と生成タスクの両方において汎用性を示す。
論文 参考訳(メタデータ) (2023-06-01T15:39:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。