論文の概要: ProCrop: Learning Aesthetic Image Cropping from Professional Compositions
- arxiv url: http://arxiv.org/abs/2505.22490v1
- Date: Wed, 28 May 2025 15:38:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.702073
- Title: ProCrop: Learning Aesthetic Image Cropping from Professional Compositions
- Title(参考訳): ProCrop: プロのコンポジションから美的イメージクロップを学ぶ
- Authors: Ke Zhang, Tianyu Ding, Jiachen Jiang, Tianyi Chen, Ilya Zharkov, Vishal M. Patel, Luming Liang,
- Abstract要約: ProCropは、プロの写真を利用して収穫決定を導く検索方式である。
プロ画像のアウトペイントによって生成された242Kの弱い注釈付き画像の大規模データセットを提示する。
この合成対応データセット生成は、美学原理で導かれる多様な高品質な作物提案を提供する。
- 参考スコア(独自算出の注目度): 57.949730056500634
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Image cropping is crucial for enhancing the visual appeal and narrative impact of photographs, yet existing rule-based and data-driven approaches often lack diversity or require annotated training data. We introduce ProCrop, a retrieval-based method that leverages professional photography to guide cropping decisions. By fusing features from professional photographs with those of the query image, ProCrop learns from professional compositions, significantly boosting performance. Additionally, we present a large-scale dataset of 242K weakly-annotated images, generated by out-painting professional images and iteratively refining diverse crop proposals. This composition-aware dataset generation offers diverse high-quality crop proposals guided by aesthetic principles and becomes the largest publicly available dataset for image cropping. Extensive experiments show that ProCrop significantly outperforms existing methods in both supervised and weakly-supervised settings. Notably, when trained on the new dataset, our ProCrop surpasses previous weakly-supervised methods and even matches fully supervised approaches. Both the code and dataset will be made publicly available to advance research in image aesthetics and composition analysis.
- Abstract(参考訳): 画像トリミングは、写真の視覚的魅力と物語的影響を高めるために重要であるが、既存のルールベースおよびデータ駆動アプローチは、しばしば多様性を欠いているか、注釈付きトレーニングデータを必要とする。
本稿では,プロの写真を利用して収穫決定を導出する検索手法であるProCropを紹介する。
ProCropは、プロの写真とクエリ画像の特徴を融合させることで、プロのコンポジションから学び、パフォーマンスを大幅に向上させる。
さらに, プロ画像から得られた242Kの弱アノテート画像の大規模データセットと, 多様な作物提案を反復的に精錬する手法を提案する。
この合成対応データセット生成は、美学の原則で導かれる多様な高品質な作物の提案を提供し、画像の収穫のための最大公用データセットとなる。
大規模な実験により、ProCropは教師付き設定と弱教師付き設定の両方において、既存の手法を著しく上回っていることがわかった。
特に、新しいデータセットでトレーニングする場合、我々のProCropは従来の弱い教師付き手法を超越し、完全に教師付きアプローチにマッチします。
コードとデータセットの両方が公開され、画像美学と合成分析の研究が進められる。
関連論文リスト
- Photography Perspective Composition: Towards Aesthetic Perspective Recommendation [8.915832522709529]
伝統的な写真合成アプローチは2次元の収穫法によって支配されている。
プロの写真家は、しばしば3D再構成の形で視点調整を用いる。
従来の収穫法を超越した写真視点合成(PPC)を提案する。
論文 参考訳(メタデータ) (2025-05-27T03:04:48Z) - Cropper: Vision-Language Model for Image Cropping through In-Context Learning [54.34593968212081]
画像トリミングのための大規模視覚言語モデル(VLM)を効果的に活用する手法を提案する。
まず,画像トリミングのための効率的なプロンプト検索機構を提案する。
第2に、予測された作物を反復的に増強する反復的改良戦略を導入する。
提案手法は, 自由形態の収穫, 主観的な収穫, アスペクト比の収穫など, 広範囲にわたる収穫作業に適用可能である。
論文 参考訳(メタデータ) (2024-08-14T20:03:03Z) - Learning Subject-Aware Cropping by Outpainting Professional Photos [69.0772948657867]
本稿では,高品質な主観的作物を生産する要因を,プロのストックイメージから学習するための弱教師付きアプローチを提案する。
私たちの洞察は、ストックイメージのライブラリと、最新のトレーニング済みのテキスト-画像拡散モデルを組み合わせることです。
我々は、収穫された無作為のトレーニングペアの大規模なデータセットを自動的に生成して、収穫モデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2023-12-19T11:57:54Z) - Procedural Image Programs for Representation Learning [62.557911005179946]
我々は,2万プログラムからなる大規模なデータセットを用いて,多様な合成画像を生成する訓練を提案する。
これらのプログラムは短いコードスニペットであり、変更が容易で、高速に実行することができる。
提案したデータセットは、教師付きおよび教師なしの表現学習の両方に使用することができ、実際の画像と手続き的に生成された画像との事前学習のギャップを38%削減する。
論文 参考訳(メタデータ) (2022-11-29T17:34:22Z) - Camera View Adjustment Prediction for Improving Image Composition [14.541539156817045]
本稿では、撮影前にカメラビューの調整方法について、カメラマンに提案する深層学習に基づくアプローチを提案する。
写真が撮られる前に合成を最適化することで、撮影者がより良い写真を撮れるようになる。
論文 参考訳(メタデータ) (2021-04-15T17:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。