論文の概要: SketchAssist: A Practical Assistant for Semantic Edits and Precise Local Redrawing
- arxiv url: http://arxiv.org/abs/2512.14140v1
- Date: Tue, 16 Dec 2025 06:50:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.619428
- Title: SketchAssist: A Practical Assistant for Semantic Edits and Precise Local Redrawing
- Title(参考訳): SketchAssist: セマンティック編集と精密局所再描画のための実用的なアシスタント
- Authors: Han Zou, Yan Zhang, Ruiqi Yu, Cong Xie, Jie Huang, Zhenpeng Zhan,
- Abstract要約: そこで,SketchAssistを提案する。SketchAssistは,命令誘導のグローバル編集と行誘導のリージョン再描画を一体化することで,作成を加速するインタラクティブスケッチ描画アシスタントである。
このアシスタントを大規模に実現するために、(i)属性のないベーススケッチから属性付加シーケンスを構築する制御可能なデータ生成パイプラインを導入し、(ii)クロスシーケンスサンプリングによりマルチステップ編集チェーンを作成し、(iii)スタイル保存型属性削除モデルでスタイルカバレッジを拡張する。
- 参考スコア(独自算出の注目度): 13.733328072282049
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sketch editing is central to digital illustration, yet existing image editing systems struggle to preserve the sparse, style-sensitive structure of line art while supporting both high-level semantic changes and precise local redrawing. We present SketchAssist, an interactive sketch drawing assistant that accelerates creation by unifying instruction-guided global edits with line-guided region redrawing, while keeping unrelated regions and overall composition intact. To enable this assistant at scale, we introduce a controllable data generation pipeline that (i) constructs attribute-addition sequences from attribute-free base sketches, (ii) forms multi-step edit chains via cross-sequence sampling, and (iii) expands stylistic coverage with a style-preserving attribute-removal model applied to diverse sketches. Building on this data, SketchAssist employs a unified sketch editing framework with minimal changes to DiT-based editors. We repurpose the RGB channels to encode the inputs, enabling seamless switching between instruction-guided edits and line-guided redrawing within a single input interface. To further specialize behavior across modes, we integrate a task-guided mixture-of-experts into LoRA layers, routing by text and visual cues to improve semantic controllability, structural fidelity, and style preservation. Extensive experiments show state-of-the-art results on both tasks, with superior instruction adherence and style/structure preservation compared to recent baselines. Together, our dataset and SketchAssist provide a practical, controllable assistant for sketch creation and revision.
- Abstract(参考訳): スケッチ編集はデジタルイラストの中心であるが、既存の画像編集システムは、高いレベルのセマンティックな変化と正確な局所的再描画の両方をサポートしながら、ラインアートのスパースでスタイルに敏感な構造を維持するのに苦労している。
そこで,SketchAssistについて述べる。SketchAssistは,命令誘導のグローバル編集をライン誘導の領域再描画と統合し,無関係な領域と全体構成を維持しながら作成を加速するインタラクティブスケッチ描画アシスタントである。
このアシスタントを大規模に活用するために、制御可能なデータ生成パイプラインを導入する。
(i)属性のないベーススケッチから属性付加シーケンスを構築する。
(二)クロスシーケンスサンプリングによる多段階編集連鎖の形成、及び
(III)多彩なスケッチに適用したスタイル保存型属性除去モデルにより、スタイリスティックなカバー範囲を広げる。
このデータに基づいてSketchAssistは、DiTベースのエディタに最小限の変更を加えた統合スケッチ編集フレームワークを使用している。
入力をエンコードするためにRGBチャネルを再利用し、命令誘導編集と行誘導再描画をシームレスに切り替える。
モード間での動作をさらに専門化するために,タスク誘導型ミックス・オブ・エキスパートをLoRA層に統合し,テキストとビジュアルキューによるルーティングを行い,セマンティック制御性,構造的忠実性,スタイル保存を改善する。
広範囲な実験により, 両課題における最先端の成果が示され, 命令順守とスタイル・構造保存が近年のベースラインと比較して優れている。
私たちのデータセットとSketchAssistは、スケッチ作成とリビジョンのための実用的な制御可能なアシスタントを提供します。
関連論文リスト
- Follow-Your-Shape: Shape-Aware Image Editing via Trajectory-Guided Region Control [52.87568958372421]
Follow-Your-Shapeは、トレーニング不要でマスクなしのフレームワークで、オブジェクト形状の正確かつ制御可能な編集をサポートする。
インバージョンとデノナイジングパスのトークン単位の速度差を比較することで,TDM(Torjectory Divergence Map)を算出する。
本手法は、特に大規模な形状変更を必要とするタスクにおいて、優れた編集性と視覚的忠実性を実現する。
論文 参考訳(メタデータ) (2025-08-11T16:10:00Z) - StrokeFusion: Vector Sketch Generation via Joint Stroke-UDF Encoding and Latent Sequence Diffusion [13.862427684807486]
StrokeFusionはベクトルスケッチ生成のための2段階のフレームワークである。
デュアルモードのスケッチ機能学習ネットワークがあり、ストロークを高品質の潜伏空間にマッピングする。
これは、生成中のストローク位置、スケール、軌道を同時に調整するストロークレベルの潜在拡散モデルを利用する。
論文 参考訳(メタデータ) (2025-03-31T06:03:03Z) - Recovering Partially Corrupted Objects via Sketch-Guided Bidirectional Feature Interaction [16.03488741913531]
テキスト誘導拡散モデルはテキストプロンプトを通じて高レベルの意味指導を提供する。
これらはしばしば、部分的に破損した物体に正確なピクセルレベルの空間制御を欠いている。
本研究では,事前訓練された安定拡散モデルに基づくスケッチ誘導双方向特徴相互作用フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-10T08:34:31Z) - UIP2P: Unsupervised Instruction-based Image Editing via Edit Reversibility Constraint [87.20985852686785]
本研究では,教師なし指導に基づく画像編集手法を提案する。
本稿では,編集可逆性制約 (ERC) と呼ばれる新しい編集機構を導入することで,これらの課題に対処する。
これにより、地道に編集されたイメージの必要性を回避し、実際のイメージキャプチャペアまたはイメージキャプチャインストラクショントリプルからなるデータセットで、初めてトレーニングをアンロックすることが可能になります。
論文 参考訳(メタデータ) (2024-12-19T18:59:58Z) - Task-Oriented Diffusion Inversion for High-Fidelity Text-based Editing [60.730661748555214]
textbfTask-textbfOriented textbfDiffusion textbfInversion (textbfTODInv) は、特定の編集タスクに適した実際の画像を反転して編集する新しいフレームワークである。
ToDInvは相互最適化によってインバージョンと編集をシームレスに統合し、高い忠実さと正確な編集性を保証する。
論文 参考訳(メタデータ) (2024-08-23T22:16:34Z) - Sketchformer: Transformer-based Representation for Sketched Structure [12.448155157592895]
Sketchformerは、ベクトル形式で入力された自由ハンドスケッチを符号化するトランスフォーマーベースの表現である。
連続的およびトークン化された入力表現を探索するいくつかの変種を報告し、それらの性能を対比する。
我々の学習した埋め込みは辞書学習トークン化方式によって駆動され、分類および画像検索タスクにおける技術性能の状態を出力する。
論文 参考訳(メタデータ) (2020-02-24T17:11:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。