論文の概要: Find Beauty in the Rare: Contrastive Composition Feature Clustering for
Nontrivial Cropping Box Regression
- arxiv url: http://arxiv.org/abs/2302.08662v1
- Date: Fri, 17 Feb 2023 02:48:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-20 16:07:01.490612
- Title: Find Beauty in the Rare: Contrastive Composition Feature Clustering for
Nontrivial Cropping Box Regression
- Title(参考訳): レアで美を見いだす:非自明なクロップボックス回帰のためのコントラスト構成特徴クラスタリング
- Authors: Zhiyu Pan, Yinpeng Chen, Jiale Zhang, Hao Lu, Zhiguo Cao, Weicai Zhong
- Abstract要約: コントラスト構成クラスタリング(Contrastive Composition Clustering, C2C)を提案する。
このようにして、複数の画像の一般的な構成パターンをよりよく要約することができ、特に稀なサンプルの恩恵を受けることができる。
- 参考スコア(独自算出の注目度): 36.46867441532592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic image cropping algorithms aim to recompose images like human-being
photographers by generating the cropping boxes with improved composition
quality. Cropping box regression approaches learn the beauty of composition
from annotated cropping boxes. However, the bias of annotations leads to
quasi-trivial recomposing results, which has an obvious tendency to the average
location of training samples. The crux of this predicament is that the task is
naively treated as a box regression problem, where rare samples might be
dominated by normal samples, and the composition patterns of rare samples are
not well exploited. Observing that similar composition patterns tend to be
shared by the cropping boundaries annotated nearly, we argue to find the beauty
of composition from the rare samples by clustering the samples with similar
cropping boundary annotations, ie, similar composition patterns. We propose a
novel Contrastive Composition Clustering (C2C) to regularize the composition
features by contrasting dynamically established similar and dissimilar pairs.
In this way, common composition patterns of multiple images can be better
summarized, which especially benefits the rare samples and endows our model
with better generalizability to render nontrivial results. Extensive
experimental results show the superiority of our model compared with prior
arts. We also illustrate the philosophy of our design with an interesting
analytical visualization.
- Abstract(参考訳): 自動撮像アルゴリズムは、合成品質を改善した収穫箱を生成することにより、人間のようなイメージを分解することを目的としている。
クロッピングボックス回帰アプローチは、注釈付きクロッピングボックスから構成の美しさを学ぶ。
しかしながら、アノテーションのバイアスは、トレーニングサンプルの平均位置に対する明らかな傾向を持つ、準自明な再構成結果をもたらす。
この前提の要点は、タスクが箱の回帰問題として自然に扱われることであり、希少なサンプルが正常なサンプルに支配される可能性があり、希少なサンプルの組成パターンがうまく活用されていないことである。
類似の組成パターンは, ほぼ注釈付けされた収穫境界によって共有される傾向にあり, 類似の収穫境界アノテーション, すなわち類似の組成パターンを用いて試料をクラスタリングすることによって, 希少試料からの組成の美しさを見いだすことができる。
動的に確立された類似および異種対を対比することにより構成特徴を規則化するコントラスト構成クラスタリング(C2C)を提案する。
このようにして、複数の画像の共通合成パターンをよりよく要約することができ、特に稀なサンプルの恩恵を受け、非自明な結果のレンダリングをより一般化できるモデルを提供する。
実験の結果,先行技術と比較して,モデルが優れていることがわかった。
興味深い分析的な視覚化によって、デザインの哲学も説明します。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Decompose-and-Compose: A Compositional Approach to Mitigating Spurious Correlation [2.273629240935727]
画像の要素を組み合わせることで相関シフトを改善するために,分解分解(DaC)を提案する。
経験的リスク最小化(Empirical Risk Minimization, ERM)で訓練されたモデルでは, 通常, 因果成分, あるいはラベルとの急激な相関性が高い成分のいずれかに高い関与が認められた。
トレーニング中に,グループラベルやスプリアスの特徴に関する情報を必要とせず,画像に介入してグループバランスを行う手法を提案する。
論文 参考訳(メタデータ) (2024-02-29T07:24:24Z) - Image Similarity using An Ensemble of Context-Sensitive Models [2.9490616593440317]
ラベル付きデータに基づく画像類似性モデルの構築と比較に,より直感的なアプローチを提案する。
画像空間(R,A,B)におけるスパースサンプリングの課題と,文脈に基づくデータを用いたモデルにおけるバイアスに対処する。
実験の結果,構築したアンサンブルモデルは,最高の文脈依存モデルよりも5%高い性能を示した。
論文 参考訳(メタデータ) (2024-01-15T20:23:05Z) - Synthetic Hard Negative Samples for Contrastive Learning [8.776888865665024]
本稿では,コントラスト学習のための新しい特徴レベル手法,すなわち合成硬質負のサンプルをサンプリングする手法を提案する。
負試料を混合し, アンカー試料と他の負試料とのコントラストを制御して, より硬い負試料を生成する。
提案手法は,画像データセットの分類性能を向上し,既存の手法に容易に組み込むことができる。
論文 参考訳(メタデータ) (2023-04-06T09:54:35Z) - CellMix: A General Instance Relationship based Method for Data
Augmentation Towards Pathology Image Classification [6.9596321268519326]
病理画像解析では、高品質な注釈付きサンプルの取得と維持は非常に労働集約的な作業である。
本稿では,新しい分散指向型インプレースシャッフル手法であるCellMixフレームワークを提案する。
病理画像分類タスクにおける実験は、7つの異なるデータセット上でのSOTA(State-of-the-art)性能を示す。
論文 参考訳(メタデータ) (2023-01-27T03:17:35Z) - An Experience-based Direct Generation approach to Automatic Image
Cropping [0.0]
画像美学を明示的にモデル化することなく,画像を直接収穫する新しい手法を提案する。
我々のモデルは、経験豊富な編集者が収集した画像の大規模なデータセットに基づいて訓練されている。
我々の戦略は2つの関連するタスクにおいて既存の手法と競合するか、あるいは性能が良いことを示す。
論文 参考訳(メタデータ) (2022-12-30T06:25:27Z) - Saliency Grafting: Innocuous Attribution-Guided Mixup with Calibrated
Label Mixing [104.630875328668]
ミックスアップスキームは、強化されたトレーニングサンプルを作成するために、サンプルのペアを混ぜることを提案する。
両世界のベストを捉えた、斬新だがシンプルなミックスアップ版を提示する。
論文 参考訳(メタデータ) (2021-12-16T11:27:48Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - Doubly Contrastive Deep Clustering [135.7001508427597]
本稿では、サンプルビューとクラスビューの両方でコントラスト損失を構築する新しい二重コントラストディープクラスタリング(DCDC)フレームワークを紹介します。
具体的には、サンプルビューに対して、元のサンプルとその拡張バージョンのクラス分布を正のサンプルペアとして設定する。
クラスビューでは、クラスのサンプル分布から正のペアと負のペアを構築します。
このように、2つのコントラスト損失は、サンプルとクラスレベルでのミニバッチサンプルのクラスタリング結果をうまく制限します。
論文 参考訳(メタデータ) (2021-03-09T15:15:32Z) - Unsupervised Landmark Learning from Unpaired Data [117.81440795184587]
教師なしランドマーク学習の最近の試みは、外観は似ているがポーズでは異なる合成画像対を活用する。
本稿では,2回スワッピング・リコンストラクション・ストラテジーを適用して最終監視を行うクロスイメージ・サイクル整合性フレームワークを提案する。
提案するフレームワークは,強いベースラインを大きなマージンで上回ることを示す。
論文 参考訳(メタデータ) (2020-06-29T13:57:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。