論文の概要: Learning AND-OR Templates for Professional Photograph Parsing and Guidance
- arxiv url: http://arxiv.org/abs/2410.06124v1
- Date: Tue, 8 Oct 2024 15:27:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-01 11:00:50.279701
- Title: Learning AND-OR Templates for Professional Photograph Parsing and Guidance
- Title(参考訳): プロの写真解析と指導のための and-OR テンプレートの学習
- Authors: Xin Jin, Liaoruxing Zhang, Chenyu Fan, Wenbo Yuan,
- Abstract要約: 写真画像から階層的再構成可能な画像テンプレートを学習し、これらの画像に使用される「テンプレート」を学習し、特徴付ける。
実験結果から,学習したテンプレートが写真技術やスタイルをうまく記述できるのに対し,提案手法は画像の品質を人間のように評価できることがわかった。
- 参考スコア(独自算出の注目度): 5.906114868515906
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since the development of photography art, many so-called "templates" have been formed, namely visual styles summarized from a series of themed and stylized photography works. In this paper, we propose to analysize and and summarize these 'templates' in photography by learning composite templates of photography images. We present a framework for learning a hierarchical reconfigurable image template from photography images to learn and characterize the "templates" used in these photography images. Using this method, we measured the artistic quality of photography on the photos and conducted photography guidance. In addition, we also utilized the "templates" for guidance in several image generation tasks. Experimental results show that the learned templates can well describe the photography techniques and styles, whereas the proposed approach can assess the quality of photography images as human being does.
- Abstract(参考訳): 写真芸術の発展以来、多くのいわゆる「テンプレート」、すなわち一連のテーマ化された、様式化された写真作品から要約された視覚的なスタイルが形成された。
本稿では,写真画像の合成テンプレートを学習し,これらの「テンプレート」を写真で分析し,要約することを提案する。
本稿では、写真画像から階層的再構成可能な画像テンプレートを学習し、これらの画像に使用される「テンプレート」を学習し、特徴付けるためのフレームワークを提案する。
本手法を用いて,写真の芸術的品質を測定し,写真指導を行った。
また,複数の画像生成タスクにおいて,「テンプレート」を指導に利用した。
実験結果から,学習したテンプレートは写真技術やスタイルをうまく表現できるが,提案手法は画像の質を人間のように評価できることがわかった。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Measuring Style Similarity in Diffusion Models [118.22433042873136]
画像からスタイル記述子を理解し抽出するためのフレームワークを提案する。
我々のフレームワークは、スタイルが画像の主観的特性であるという洞察を用いてキュレートされた新しいデータセットで構成されている。
また、テキスト・ツー・イメージ・モデルのトレーニングデータセットで使用される画像に対して、生成した画像のスタイルに使用できるスタイル属性記述子を抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-04-01T17:58:30Z) - An Image-based Typology for Visualization [23.716718517642878]
本稿では,画像からの視覚表現の質的解析結果について述べる。
定義群を10種類に分類した。
我々は、6,833枚のタグ付き画像のデータセットと、ラベル付き画像の大規模な集合を探索および分析するために使用できるオンラインツールを提供する。
論文 参考訳(メタデータ) (2024-03-07T04:33:42Z) - Unsupervised Compositional Concepts Discovery with Text-to-Image
Generative Models [80.75258849913574]
本稿では、異なる画像の集合を考えると、各画像を表す生成概念を発見できるかという逆問題を考える。
本稿では,画像の集合から生成概念を抽出し,絵画やオブジェクト,キッチンシーンからの照明から異なる美術スタイルを分離し,イメージネット画像から得られる画像クラスを発見するための教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2023-06-08T17:02:15Z) - Subject-driven Text-to-Image Generation via Apprenticeship Learning [83.88256453081607]
本研究では,テキスト・トゥ・イメージ・ジェネレータのSuTIについて述べる。
SuTIは見習いの学習を利用しており、そこでは、多数の主題固有のエキスパートモデルによって生成されたデータから、単一の見習いモデルが学習される。
SuTIは、InstructPix2Pix、Textual Inversion、Imagic、Prompt2Prompt、Re-Imagen、DreamBoothといった既存のモデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2023-04-01T00:47:35Z) - Aesthetic Language Guidance Generation of Images Using Attribute
Comparison [68.01313297926109]
インテリジェントな機器やアルゴリズムの改善は、人間の主観的写真技術を置き換えることはできない。
ALG-TとALG-Iに画像の美的言語指導を分割した。
ALG-TとALG-Iは2種類の入力画像に対してそれぞれ美的言語指導を行う。
論文 参考訳(メタデータ) (2022-08-09T12:35:23Z) - ICC++: Explainable Image Retrieval for Art Historical Corpora using
Image Composition Canvas [19.80532568090711]
我々は,画像合成Canvas (ICC++) と呼ばれる新しい手法を提案し,類似の合成要素を持つ画像の比較と検索を行う。
ICC++は、Max Imdahl氏の仕事によって動機付けられた低レベルの機能(構成要素)を生成することに特化したICCよりも改善されている。
論文 参考訳(メタデータ) (2022-06-22T14:06:29Z) - Photozilla: A Large-Scale Photography Dataset and Visual Embedding for
20 Photography Styles [0.6308539010172307]
我々は,10種類の写真スタイルに属する990万枚以上の画像を含む大規模データセット「Photozilla」を紹介した。
データセットを使用して、3つの分類モデルをトレーニングし、イメージを関連するスタイルに自動的に分類する。
また,他の10種類の写真スタイルを識別するために,精度が68%以上であることが報告された。
論文 参考訳(メタデータ) (2021-06-21T18:45:06Z) - Learning Portrait Style Representations [34.59633886057044]
高レベル特性を取り入れたニューラルネットワークアーキテクチャによって学習されたスタイル表現について検討する。
美術史家によって注釈付けされた三重奏曲をスタイル類似性の監督として取り入れることで,学習スタイルの特徴の変化を見いだす。
また,計算解析用に用意された肖像画の大規模データセットを初めて提示する。
論文 参考訳(メタデータ) (2020-12-08T01:36:45Z) - SketchEmbedNet: Learning Novel Concepts by Imitating Drawings [125.45799722437478]
モデルを用いて画像のスケッチを作成することによって学習した画像表現の特性について検討する。
この生成型クラスに依存しないモデルでは,新規な例,クラス,さらには新規なデータセットからの画像の情報埋め込みが,数ショットで生成されることが示されている。
論文 参考訳(メタデータ) (2020-08-27T16:43:28Z) - Multiple Generative Adversarial Networks Analysis for Predicting
Photographers' Retouching [0.0]
本研究の目的は, 深層学習手法, より具体的には, 生成的敵ネットワーク(GAN)を用いてアーティストのリタッチを模倣する可能性を検討することである。
論文 参考訳(メタデータ) (2020-06-03T10:10:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。