論文の概要: Carousel: A High-Resolution Dataset for Multi-Target Automatic Image Cropping
- arxiv url: http://arxiv.org/abs/2511.04680v1
- Date: Thu, 06 Nov 2025 18:59:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.583316
- Title: Carousel: A High-Resolution Dataset for Multi-Target Automatic Image Cropping
- Title(参考訳): Carousel:マルチターゲット自動イメージクロップのための高分解能データセット
- Authors: Rafe Loya, Andrew Hamara, Benjamin Estell, Benjamin Kilpatrick, Andrew C. Freeman,
- Abstract要約: 関連画像と人名ラベルのデータセットを277枚導入する。
画像分割アルゴリズムを前処理ステップとして用いた複数個のシングルクロップモデルの有効性を評価する。
- 参考スコア(独自算出の注目度): 0.16311150636417257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic image cropping is a method for maximizing the human-perceived quality of cropped regions in photographs. Although several works have proposed techniques for producing singular crops, little work has addressed the problem of producing multiple, distinct crops with aesthetic appeal. In this paper, we motivate the problem with a discussion on modern social media applications, introduce a dataset of 277 relevant images and human labels, and evaluate the efficacy of several single-crop models with an image partitioning algorithm as a pre-processing step. The dataset is available at https://github.com/RafeLoya/carousel.
- Abstract(参考訳): オートマチック・イメージ・トリミング(Automatic Image cropping)は、写真における収穫領域の人間の知覚品質を最大化する方法である。
いくつかの研究が特定の作物を生産する技術を提案しているが、複数の異なる作物を美的魅力をもって生産するという問題に対処する研究はほとんどない。
本稿では、現代のソーシャルメディアアプリケーションに関する議論の動機付けとして、277の関連画像と人名ラベルのデータセットを導入し、画像分割アルゴリズムによる複数のシングルクロップモデルの有効性を前処理のステップとして評価する。
データセットはhttps://github.com/RafeLoya/carousel.comで公開されている。
関連論文リスト
- Efficient Multi-Crop Saliency Partitioning for Automatic Image Cropping [0.6906005491572401]
固定アスペクト比クロッピングアルゴリズムを拡張し、線形時間で複数の非重複作物を効率的に抽出する。
本手法は,サリエンシマップ全体を再計算することなく,注意閾値を動的に調整し,選択した作物を考慮から除去する。
論文 参考訳(メタデータ) (2025-06-28T08:32:53Z) - Cropper: Vision-Language Model for Image Cropping through In-Context Learning [54.34593968212081]
画像トリミングのための大規模視覚言語モデル(VLM)を効果的に活用する手法を提案する。
まず,画像トリミングのための効率的なプロンプト検索機構を提案する。
第2に、予測された作物を反復的に増強する反復的改良戦略を導入する。
提案手法は, 自由形態の収穫, 主観的な収穫, アスペクト比の収穫など, 広範囲にわたる収穫作業に適用可能である。
論文 参考訳(メタデータ) (2024-08-14T20:03:03Z) - Learning Subject-Aware Cropping by Outpainting Professional Photos [69.0772948657867]
本稿では,高品質な主観的作物を生産する要因を,プロのストックイメージから学習するための弱教師付きアプローチを提案する。
私たちの洞察は、ストックイメージのライブラリと、最新のトレーニング済みのテキスト-画像拡散モデルを組み合わせることです。
我々は、収穫された無作為のトレーニングペアの大規模なデータセットを自動的に生成して、収穫モデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2023-12-19T11:57:54Z) - Cones 2: Customizable Image Synthesis with Multiple Subjects [50.54010141032032]
本研究では,特定の対象を効率的に表現する方法と,異なる対象を適切に構成する方法について検討する。
クロスアテンションマップ内のアクティベーションを修正することにより、レイアウトはイメージ内の異なる被写体の位置を指定して分離する。
論文 参考訳(メタデータ) (2023-05-30T18:00:06Z) - An Experience-based Direct Generation approach to Automatic Image
Cropping [0.0]
画像美学を明示的にモデル化することなく,画像を直接収穫する新しい手法を提案する。
我々のモデルは、経験豊富な編集者が収集した画像の大規模なデータセットに基づいて訓練されている。
我々の戦略は2つの関連するタスクにおいて既存の手法と競合するか、あるいは性能が良いことを示す。
論文 参考訳(メタデータ) (2022-12-30T06:25:27Z) - CropMix: Sampling a Rich Input Distribution via Multi-Scale Cropping [97.05377757299672]
そこで本研究では,元のデータセット分布からリッチな入力分布を生成するための簡単なCropMixを提案する。
CropMixは、分類タスクを実行するトレーニングレシピやニューラルネットワークアーキテクチャにシームレスに適用することができる。
CropMixは、より強力な表現に向けて、対照的な学習とマスクされた画像モデリングの両方に利益があることを示す。
論文 参考訳(メタデータ) (2022-05-31T16:57:28Z) - Deep Image Compositing [93.75358242750752]
ユーザ入力なしで高品質の画像合成を自動生成する手法を提案する。
ラプラシアン・ピラミッド・ブレンディングにインスパイアされ、フォアグラウンドや背景画像からの情報を効果的に融合させるために、密結合型多ストリーム融合ネットワークが提案されている。
実験により,提案手法は高品質な合成物を自動生成し,定性的かつ定量的に既存手法より優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-11-04T06:12:24Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z) - Multi-Image Summarization: Textual Summary from a Set of Cohesive Images [17.688344968462275]
本稿では,マルチイメージ要約の新しい課題を提案する。
入力画像のコヒーレントな集合から簡潔で記述的なテキスト要約を生成することを目的としている。
密度の高い平均画像特徴集約ネットワークにより、モデルは属性のコヒーレントなサブセットに集中することができる。
論文 参考訳(メタデータ) (2020-06-15T18:45:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。