論文の概要: Pseudo-labelling and Meta Reweighting Learning for Image Aesthetic
Quality Assessment
- arxiv url: http://arxiv.org/abs/2201.02714v1
- Date: Sat, 8 Jan 2022 00:43:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-12 09:20:48.399844
- Title: Pseudo-labelling and Meta Reweighting Learning for Image Aesthetic
Quality Assessment
- Title(参考訳): 画像美的品質評価のための擬似ラベリングとメタリヘアリング学習
- Authors: Xin Jin, Hao Lou, Huang Heng, Xiaodong Li, Shuai Cui, Xiaokun Zhang,
Xiqiao Li
- Abstract要約: AMD-CRと呼ばれる分類と回帰を伴う新しい審美的混合データセットを提案する。
ネットワーク構造の構築において、入力画像のサイズに適応可能な美的適応ブロック(AAB)構造を構築する。
実験の結果, 従来のSROCC法に比べて0.1112の改善が認められた。
- 参考スコア(独自算出の注目度): 11.35091532313198
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the tasks of image aesthetic quality evaluation, it is difficult to reach
both the high score area and low score area due to the normal distribution of
aesthetic datasets. To reduce the error in labeling and solve the problem of
normal data distribution, we propose a new aesthetic mixed dataset with
classification and regression called AMD-CR, and we train a meta reweighting
network to reweight the loss of training data differently. In addition, we
provide a training strategy acccording to different stages, based on pseudo
labels of the binary classification task, and then we use it for aesthetic
training acccording to different stages in classification and regression tasks.
In the construction of the network structure, we construct an aesthetic
adaptive block (AAB) structure that can adapt to any size of the input images.
Besides, we also use the efficient channel attention (ECA) to strengthen the
feature extracting ability of each task. The experimental result shows that our
method improves 0.1112 compared with the conventional methods in SROCC. The
method can also help to find best aesthetic path planning for unmanned aerial
vehicles (UAV) and vehicles.
- Abstract(参考訳): 画像の美的品質評価のタスクでは、美的データセットの正規分布のため、高いスコア領域と低いスコア領域の両方に到達することは困難である。
ラベル付けにおける誤差を低減し, 正規データ分散の問題を解決するために, AMD-CRと呼ばれる分類と回帰を伴う新しい美的混合データセットを提案し, トレーニングデータの損失を異なる方法で強調するためにメタリウェイトネットワークを訓練する。
さらに,バイナリ分類タスクの擬似ラベルに基づいて,異なる段階に応じたトレーニング戦略を提供し,その上で,分類タスクと回帰タスクの異なる段階による美的トレーニングに使用する。
ネットワーク構造の構築において,入力画像の任意のサイズに適応可能な美的適応ブロック(aab)構造を構築する。
また,各タスクの特徴抽出能力を高めるために,効率的なチャネルアテンション(ECA)も活用する。
実験の結果, 従来のSROCC法に比べて0.1112の改善が認められた。
この方法は、無人航空機(uav)や車両の最適な美的経路計画を見つけるのにも役立つ。
関連論文リスト
- Enhancing pretraining efficiency for medical image segmentation via transferability metrics [0.0]
医用画像のセグメンテーションタスクでは、ラベル付きトレーニングデータの不足が大きな課題となっている。
本稿では,事前学習したモデルが対象データをいかに頑健に表現できるかを計測する,対照的な学習に基づく新しい伝達可能性指標を提案する。
論文 参考訳(メタデータ) (2024-10-24T12:11:52Z) - Bayesian Learning-driven Prototypical Contrastive Loss for Class-Incremental Learning [42.14439854721613]
本稿では,クラス増分学習シナリオに特化して,ベイズ学習駆動型コントラスト損失(BLCL)を持つプロトタイプネットワークを提案する。
提案手法は,ベイズ学習手法を用いて,クロスエントロピーとコントラスト損失関数のバランスを動的に適用する。
論文 参考訳(メタデータ) (2024-05-17T19:49:02Z) - Improving GAN Training via Feature Space Shrinkage [69.98365478398593]
本稿では,識別器の画像表現空間におけるトレーニングデータの領域を縮小するAdaptiveMixを提案する。
直接有界な特徴空間を考慮し, ハードサンプルを構築し, ハードサンプルと簡単なサンプル間の特徴距離を狭めることを提案する。
評価結果から,我々のAdaptiveMixはGANの訓練を容易にし,生成したサンプルの画像品質を効果的に向上させることができることが示された。
論文 参考訳(メタデータ) (2023-03-02T20:22:24Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Semi-weakly Supervised Contrastive Representation Learning for Retinal
Fundus Images [0.2538209532048867]
本稿では,半弱化アノテーションを用いた表現学習のための,半弱化教師付きコントラスト学習フレームワークを提案する。
SWCLの移動学習性能を7つの公立網膜眼底データセットで実証的に検証した。
論文 参考訳(メタデータ) (2021-08-04T15:50:09Z) - Unifying Remote Sensing Image Retrieval and Classification with Robust
Fine-tuning [3.6526118822907594]
新しい大規模トレーニングおよびテストデータセットであるSF300で、リモートセンシングイメージの検索と分類を統一することを目指しています。
本研究では,ImageNetの事前学習ベースラインと比較して,9つのデータセットの検索性能と分類性能を体系的に向上させることを示す。
論文 参考訳(メタデータ) (2021-02-26T11:01:30Z) - Mixed-Privacy Forgetting in Deep Networks [114.3840147070712]
大規模画像分類タスクにおいてトレーニングされたネットワークの重みからトレーニングサンプルのサブセットの影響を除去できることを示す。
そこで本研究では,混合プライバシー設定における「忘れ」という新しい概念を導入する。
提案手法は,モデル精度のトレードオフを伴わずに忘れることができることを示す。
論文 参考訳(メタデータ) (2020-12-24T19:34:56Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z) - Background Splitting: Finding Rare Classes in a Sea of Background [55.03789745276442]
我々は,少数の稀なカテゴリの画像分類のための,高精度な深層モデルの訓練という現実的な問題に焦点をあてる。
これらのシナリオでは、ほとんどの画像はデータセットの背景カテゴリに属します(データセットの95%は背景です)。
非バランスなデータセットをトレーニングするための標準的な微調整アプローチと最先端アプローチの両方が、この極端な不均衡の存在下で正確な深層モデルを生成していないことを実証する。
論文 参考訳(メタデータ) (2020-08-28T23:05:15Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z) - DeepEMD: Differentiable Earth Mover's Distance for Few-Shot Learning [122.51237307910878]
我々は,画像領域間の最適なマッチングの新しい視点から,少数ショット画像分類法を開発した。
我々は、高密度画像表現間の構造距離を計算するために、Earth Mover's Distance (EMD) を用いている。
定式化において重要な要素の重みを生成するために,我々は相互参照機構を設計する。
論文 参考訳(メタデータ) (2020-03-15T08:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。