論文の概要: Artificial Intelligence for Geometry-Based Feature Extraction, Analysis and Synthesis in Artistic Images: A Survey
- arxiv url: http://arxiv.org/abs/2412.01450v1
- Date: Mon, 02 Dec 2024 12:41:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:49:52.826007
- Title: Artificial Intelligence for Geometry-Based Feature Extraction, Analysis and Synthesis in Artistic Images: A Survey
- Title(参考訳): 幾何学的画像の特徴抽出・分析・合成のための人工知能:サーベイ
- Authors: Mridula Vijendran, Jingjing Deng, Shuang Chen, Edmond S. L. Ho, Hubert P. H. Shum,
- Abstract要約: このレビューは、幾何学的データをAIモデルに統合する大きなメリットを強調している。
高いクラス間のバリエーション、ドメインギャップ、コンテンツからのスタイルの分離といった課題に対処する。
- 参考スコア(独自算出の注目度): 11.442937932697175
- License:
- Abstract: Artificial Intelligence significantly enhances the visual art industry by analyzing, identifying and generating digitized artistic images. This review highlights the substantial benefits of integrating geometric data into AI models, addressing challenges such as high inter-class variations, domain gaps, and the separation of style from content by incorporating geometric information. Models not only improve AI-generated graphics synthesis quality, but also effectively distinguish between style and content, utilizing inherent model biases and shared data traits. We explore methods like geometric data extraction from artistic images, the impact on human perception, and its use in discriminative tasks. The review also discusses the potential for improving data quality through innovative annotation techniques and the use of geometric data to enhance model adaptability and output refinement. Overall, incorporating geometric guidance boosts model performance in classification and synthesis tasks, providing crucial insights for future AI applications in the visual arts domain.
- Abstract(参考訳): 人工知能は、デジタル化された芸術画像を分析し、識別し、生成することで、視覚芸術産業を著しく強化する。
このレビューでは、幾何学的データをAIモデルに統合することの実質的な利点、高いクラス間変動、ドメインギャップ、幾何学的情報を統合することでコンテンツからスタイルを分離するといった課題に対処することを強調している。
モデルはAI生成グラフィック合成の品質を改善するだけでなく、固有のモデルバイアスと共有データ特性を利用して、スタイルとコンテンツを効果的に区別する。
芸術的画像からの幾何学的データ抽出、人間の知覚への影響、識別タスクにおけるその利用などについて検討する。
また、革新的なアノテーション技術によるデータ品質向上の可能性や、モデル適応性と出力改善のための幾何データの利用についても論じる。
全体として、幾何学的ガイダンスを導入することで、分類と合成タスクにおけるモデルパフォーマンスが向上し、視覚芸術領域における将来のAIアプリケーションにとって重要な洞察を提供する。
関連論文リスト
- A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Advances in Diffusion Models for Image Data Augmentation: A Review of Methods, Models, Evaluation Metrics and Future Research Directions [6.2719115566879236]
拡散モデル(DM)は画像データ拡張のための強力なツールとして登場した。
DMは、基礎となるデータ分布を学習することで、現実的で多様な画像を生成する。
この分野における現在の課題と今後の研究方向性について論じる。
論文 参考訳(メタデータ) (2024-07-04T18:06:48Z) - Deep Ensemble Art Style Recognition [2.3369294168789203]
過去数十年間の膨大な量のアートワークのデジタル化は、抽象概念に関連する膨大な量のデータの分類、分析、管理の必要性を生み出した。
美術作品における様々な芸術的特徴の認識は、深層学習社会において注目されている。
本稿では,深層ネットワークを用いた美術スタイル認識の問題について考察する。
論文 参考訳(メタデータ) (2024-05-19T21:26:11Z) - YaART: Yet Another ART Rendering Technology [119.09155882164573]
そこで本研究では,ヒトの嗜好に適合する新しい生産段階のテキスト・ツー・イメージ拡散モデルYaARTを紹介した。
これらの選択がトレーニングプロセスの効率と生成された画像の品質にどのように影響するかを分析する。
高品質な画像の小さなデータセットでトレーニングされたモデルが、より大きなデータセットでトレーニングされたモデルとうまく競合できることを実証する。
論文 参考訳(メタデータ) (2024-04-08T16:51:19Z) - Towards In-Vehicle Multi-Task Facial Attribute Recognition:
Investigating Synthetic Data and Vision Foundation Models [8.54530542456452]
車両の乗客の顔の特徴を認識する複雑なマルチタスクモデルを訓練するための合成データセットの有用性について検討する。
我々の研究は直感に反する発見を明らかにし、特に特定のマルチタスクコンテキストにおいて、ViTよりもResNetの方が優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-10T04:17:54Z) - Harnessing Machine Learning for Discerning AI-Generated Synthetic Images [2.6227376966885476]
我々は、AI生成画像と実画像の識別に機械学習技術を用いる。
ResNet、VGGNet、DenseNetといった先進的なディープラーニングアーキテクチャを洗練し、適応しています。
実験結果は重要であり、最適化されたディープラーニングモデルが従来の手法より優れていることを示した。
論文 参考訳(メタデータ) (2024-01-14T20:00:37Z) - GM-NeRF: Learning Generalizable Model-based Neural Radiance Fields from
Multi-view Images [79.39247661907397]
本稿では,自由視点画像の合成に有効なフレームワークであるGeneralizable Model-based Neural Radiance Fieldsを提案する。
具体的には、多視点2D画像からの出現コードを幾何学的プロキシに登録するための幾何学誘導型アテンション機構を提案する。
論文 参考訳(メタデータ) (2023-03-24T03:32:02Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。