論文の概要: EasyCraft: A Robust and Efficient Framework for Automatic Avatar Crafting
- arxiv url: http://arxiv.org/abs/2503.01158v1
- Date: Mon, 03 Mar 2025 04:11:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:18:37.458226
- Title: EasyCraft: A Robust and Efficient Framework for Automatic Avatar Crafting
- Title(参考訳): EasyCraft: 自動アバタークラフトのためのロバストで効率的なフレームワーク
- Authors: Suzhen Wang, Weijie Chen, Wei Zhang, Minda Zhao, Lincheng Li, Rongsheng Zhang, Zhipeng Hu, Xin Yu,
- Abstract要約: EasyCraftは、文字作成を自動化するエンドツーエンドのフィードフォワードフレームワークである。
このアプローチでは,任意のスタイルの顔画像をクラフトパラメータに変換することができるトランスレータを採用している。
テキスト・ツー・イメージのテクニックを翻訳者と統合することで、EasyCraftは正確なテキストベースの文字作成を容易にする。
- 参考スコア(独自算出の注目度): 41.16175041906756
- License:
- Abstract: Character customization, or 'face crafting,' is a vital feature in role-playing games (RPGs), enhancing player engagement by enabling the creation of personalized avatars. Existing automated methods often struggle with generalizability across diverse game engines due to their reliance on the intermediate constraints of specific image domain and typically support only one type of input, either text or image. To overcome these challenges, we introduce EasyCraft, an innovative end-to-end feedforward framework that automates character crafting by uniquely supporting both text and image inputs. Our approach employs a translator capable of converting facial images of any style into crafting parameters. We first establish a unified feature distribution in the translator's image encoder through self-supervised learning on a large-scale dataset, enabling photos of any style to be embedded into a unified feature representation. Subsequently, we map this unified feature distribution to crafting parameters specific to a game engine, a process that can be easily adapted to most game engines and thus enhances EasyCraft's generalizability. By integrating text-to-image techniques with our translator, EasyCraft also facilitates precise, text-based character crafting. EasyCraft's ability to integrate diverse inputs significantly enhances the versatility and accuracy of avatar creation. Extensive experiments on two RPG games demonstrate the effectiveness of our method, achieving state-of-the-art results and facilitating adaptability across various avatar engines.
- Abstract(参考訳): キャラクターのカスタマイズはロールプレイングゲーム(RPG)において重要な特徴であり、パーソナライズされたアバターの作成を可能にすることでプレイヤーのエンゲージメントを高める。
既存の自動手法は、特定の画像領域の中間的な制約に依存しており、典型的にはテキストまたは画像の1種類の入力しかサポートしていないため、様々なゲームエンジン間の一般化性に苦しむことが多い。
これらの課題を克服するために,テキスト入力と画像入力の両方を一意にサポートすることによって文字作成を自動化する,革新的なエンドツーエンドフィードフォワードフレームワークであるEasyCraftを紹介した。
このアプローチでは,任意のスタイルの顔画像をクラフトパラメータに変換することができるトランスレータを採用している。
まず,大規模データセット上での自己教師型学習を通じて,翻訳者の画像エンコーダに統一された特徴分布を確立し,任意のスタイルの写真が統一された特徴表現に組み込めるようにした。
次に、この統合された特徴分布を、ゲームエンジンに特有のクラフトパラメータにマッピングし、ほとんどのゲームエンジンに容易に適応できるプロセスにより、EasyCraftの一般化性を高める。
テキスト・ツー・イメージのテクニックを翻訳者と統合することで、EasyCraftは正確なテキストベースの文字作成を容易にする。
多様な入力を統合するEasyCraftの能力は、アバター作成の汎用性と精度を大幅に向上させる。
2つのRPGゲームに対する大規模な実験により,本手法の有効性が実証され,最先端の結果が得られ,各種アバターエンジンの適応性も向上した。
関連論文リスト
- Make-It-Animatable: An Efficient Framework for Authoring Animation-Ready 3D Characters [86.13319549186959]
我々は3次元ヒューマノイドモデルを1秒未満でキャラクターアニメーションに対応させる新しいデータ駆動方式であるMake-It-Animatableを提案する。
我々のフレームワークは、高品質なブレンドウェイト、骨、ポーズトランスフォーメーションを生成します。
既存の手法と比較して,本手法は品質と速度の両方において著しく改善されている。
論文 参考訳(メタデータ) (2024-11-27T10:18:06Z) - DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation [22.599542105037443]
DisEnvisionerは、非関連情報をフィルタリングしながら、主観的特徴を効果的に抽出し、強化するための新しいアプローチである。
具体的には、被写体と他の無関係なコンポーネントの特徴を視覚的トークンに効果的に分離し、より正確なカスタマイズを可能にする。
提案手法は,命令応答(予測可能性),ID整合性,推論速度,画像の全体的な品質において,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-02T22:29:14Z) - PixWizard: Versatile Image-to-Image Visual Assistant with Open-Language Instructions [65.73013453373349]
PixWizardは、画像生成、操作、翻訳を自由言語命令に基づいて行うために設計されたイメージ・ツー・イメージのビジュアルアシスタントである。
我々は、様々な視覚タスクを統一された画像テキスト・画像生成フレームワークに取り組み、Omni Pixel-to-Pixel Instruction-Tuningデータセットをキュレートする。
我々の実験は、PixWizardが様々な解像度の画像に対して印象的な生成能力と理解能力を示すだけでなく、目に見えないタスクや人間の指示で有望な一般化能力を示すことを示した。
論文 参考訳(メタデータ) (2024-09-23T17:59:46Z) - PartCraft: Crafting Creative Objects by Parts [128.30514851911218]
本稿では、ユーザが「選択」できることによって、生成的視覚AIにおける創造的制御を促進する。
私たちは初めて、創造的な努力のために、視覚的概念をパーツごとに選択できるようにしました。
選択された視覚概念を正確にキャプチャするきめ細かい生成。
論文 参考訳(メタデータ) (2024-07-05T15:53:04Z) - MagicMirror: Fast and High-Quality Avatar Generation with a Constrained Search Space [25.24509617548819]
テキストプロンプトを利用した3次元アバター生成とパーソナライズのための新しいフレームワークを提案する。
主要なイノベーションは、フォトリアリスティックなアバター合成の課題を克服することを目的としている。
論文 参考訳(メタデータ) (2024-04-01T17:59:11Z) - Zero-Shot Text-to-Parameter Translation for Game Character Auto-Creation [48.62643177644139]
本稿では,ゼロショットテキスト駆動型ゲームキャラクタ自動生成を実現する新しいテキスト・ツー・パラメータ変換法(T2P)を提案する。
本手法では,参照写真や数百のパラメータを手作業で編集することなく,任意のテキスト記述による鮮やかなゲーム内キャラクタを作成できる。
論文 参考訳(メタデータ) (2023-03-02T14:37:17Z) - Plug-and-Play Diffusion Features for Text-Driven Image-to-Image
Translation [10.39028769374367]
本稿では,画像間翻訳の領域にテキスト・ツー・イメージ合成を取り入れた新しいフレームワークを提案する。
本手法は,事前学習したテキスト・画像拡散モデルのパワーを利用して,対象のテキストに適合する新たな画像を生成する。
論文 参考訳(メタデータ) (2022-11-22T20:39:18Z) - Learning-based pose edition for efficient and interactive design [55.41644538483948]
コンピュータ支援アニメーションアーティストでは、キャラクターのキーポーズは骨格を操作することで定義されている。
キャラクターのポーズは多くの不明確な制約を尊重しなければならないので、結果のリアリズムはアニメーターのスキルと知識に大きく依存する。
ポーズデザインのための効率的なツールを記述し、ユーザーが直感的にポーズを操作してキャラクターアニメーションを作成することができる。
論文 参考訳(メタデータ) (2021-07-01T12:15:02Z) - Fast and Robust Face-to-Parameter Translation for Game Character
Auto-Creation [0.0]
本稿では,プレイヤーの入力顔写真に基づいてゲーム内キャラクタを生成するゲームキャラクタ自動生成フレームワークを提案する。
提案手法は従来手法よりもロバスト性が高い。
論文 参考訳(メタデータ) (2020-08-17T07:45:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。