論文の概要: Moonworks Lunara Aesthetic II: An Image Variation Dataset
- arxiv url: http://arxiv.org/abs/2602.01666v2
- Date: Tue, 03 Feb 2026 17:45:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.853738
- Title: Moonworks Lunara Aesthetic II: An Image Variation Dataset
- Title(参考訳): Moonworks Lunara Aesthetic II:画像変化データセット
- Authors: Yan Wang, Partho Hassan, Samiha Sadeka, Nada Soliman, M M Sayeef Abdullah, Sabit Hassan,
- Abstract要約: 本稿では,現代画像生成・編集システムにおける文脈整合性の評価と学習を支援するデータセットLunara Aesthetic IIを紹介する。
このデータセットは、元来の芸術とMoonworksが作成した写真から派生した2,854枚のアンカーリンク式変奏器で構成されている。
Lunara Aesthetic IIは、画像生成とイメージ・ツー・イメージシステムにおいて、コンテキストの一般化、アイデンティティの保存、堅牢さのベンチマーク、微調整、分析を目的としている。
- 参考スコア(独自算出の注目度): 5.820233460850662
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Lunara Aesthetic II, a publicly released, ethically sourced image dataset designed to support controlled evaluation and learning of contextual consistency in modern image generation and editing systems. The dataset comprises 2,854 anchor-linked variation pairs derived from original art and photographs created by Moonworks. Each variation pair applies contextual transformations, such as illumination, weather, viewpoint, scene composition, color tone, or mood; while preserving a stable underlying identity. Lunara Aesthetic II operationalizes identity-preserving contextual variation as a supervision signal while also retaining Lunara's signature high aesthetic scores. Results show high identity stability, strong target attribute realization, and a robust aesthetic profile that exceeds large-scale web datasets. Released under the Apache 2.0 license, Lunara Aesthetic II is intended for benchmarking, fine-tuning, and analysis of contextual generalization, identity preservation, and edit robustness in image generation and image-to-image systems with interpretable, relational supervision. The dataset is publicly available at: https://huggingface.co/datasets/moonworks/lunara-aesthetic-image-variations.
- Abstract(参考訳): 本稿では、現代の画像生成・編集システムにおける文脈整合性の評価と学習を支援するために設計された、公にリリースされた倫理的な画像データセットであるLunara Aesthetic IIを紹介する。
このデータセットは、元来の芸術とMoonworksが作成した写真から派生した2,854枚のアンカーリンク式変奏器で構成されている。
それぞれのバリエーションペアは、照明、天気、視点、シーン構成、色調、ムードなどのコンテキスト変換を適用し、安定した基礎となるアイデンティティを保持する。
Lunara Aesthetic IIは、アイデンティティを保存する文脈変動を監視信号として運用し、Lunaraの高美的スコアも保持している。
その結果,高いアイデンティティ安定性,強力なターゲット属性の実現,大規模Webデータセットを超える堅牢な美的プロファイルが得られた。
Apache 2.0ライセンスでリリースされたLunara Aesthetic IIは、コンテキスト一般化のベンチマーク、微調整、分析、画像生成と画像から画像までのシステムの堅牢性、解釈可能でリレーショナルな監視を意図している。
データセットは、https://huggingface.co/datasets/moonworks/lunara-aesthetic-image-variations.comで公開されている。
関連論文リスト
- Moonworks Lunara Aesthetic Dataset [6.616467861837499]
データセットは、中東、北ヨーロッパ、東アジア、南アジアなど、様々な芸術様式にまたがっている。
全ての画像は、Moonworks Lunaraモデルを使って生成され、意図的に、異なる高品質の美的スタイルを具現化する。
論文 参考訳(メタデータ) (2026-01-12T19:11:41Z) - IC-Portrait: In-Context Matching for View-Consistent Personalized Portrait [51.18967854258571]
IC-Portraitは、パーソナライズされた肖像画生成のために個々のアイデンティティを正確にエンコードするように設計された新しいフレームワークである。
我々の重要な洞察は、事前学習された拡散モデルは、文脈内密対応マッチングのための高速学習者であるということである。
我々は,IC-Portraitが既存の最先端手法を定量的かつ質的に一貫的に上回っていることを示す。
論文 参考訳(メタデータ) (2025-01-28T18:59:03Z) - Data Augmentation via Latent Diffusion for Saliency Prediction [67.88936624546076]
残差予測モデルはラベル付きデータの限られた多様性と量によって制約される。
本研究では,実世界のシーンの複雑さと変動性を保ちながら,自然画像の編集を行うディープ・サリエンシ・予測のための新しいデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2024-09-11T14:36:24Z) - StableSemantics: A Synthetic Language-Vision Dataset of Semantic Representations in Naturalistic Images [5.529078451095096]
視覚シーンの意味を理解することはコンピュータビジョンの基本的な課題である。
テキストと画像のフレームワークの最近の進歩は、自然のシーン統計を暗黙的に捉えるモデルにつながっている。
提案するStableSemanticsは、224万件の人為的なプロンプト、処理された自然言語キャプション、200万以上の合成画像、そして個々の名詞のチャンクに対応する1000万のアテンションマップからなるデータセットである。
論文 参考訳(メタデータ) (2024-06-19T17:59:40Z) - When StyleGAN Meets Stable Diffusion: a $\mathscr{W}_+$ Adapter for
Personalized Image Generation [60.305112612629465]
テキストと画像の拡散モデルは、多種多様で高品質でフォトリアリスティックな画像を生成するのに優れている。
本稿では,拡散モデルのための拡張されたアイデンティティ保存とアンタングル化を実現するために,StyleGAN 埋め込み空間 $mathcalW_+$ の新たな利用法を提案する。
提案手法は,即時記述に適合するだけでなく,一般的なスタイルGAN編集方向に対応可能なパーソナライズされたテキスト・ツー・イメージ出力を生成する。
論文 参考訳(メタデータ) (2023-11-29T09:05:14Z) - Improving Generation and Evaluation of Visual Stories via Semantic
Consistency [72.00815192668193]
一連の自然言語キャプションが与えられた場合、エージェントはキャプションに対応する一連の画像を生成する必要がある。
それまでの作業では、このタスクで合成テキスト・画像モデルより優れた繰り返し生成モデルを導入してきた。
従来のモデリング手法には、デュアルラーニングフレームワークの追加など、いくつかの改善点を提示する。
論文 参考訳(メタデータ) (2021-05-20T20:42:42Z) - Enjoy Your Editing: Controllable GANs for Image Editing via Latent Space
Navigation [136.53288628437355]
コントロール可能なセマンティックイメージ編集により、ユーザーはクリック数回で画像属性全体を変更できる。
現在のアプローチでは、絡み合った属性編集、グローバルなイメージアイデンティティの変更、フォトリアリズムの低下に悩まされることが多い。
本稿では,主に定性評価に焦点を当てた先行研究とは異なり,制御可能な編集性能を測定するための定量的評価手法を提案する。
論文 参考訳(メタデータ) (2021-02-01T21:38:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。