論文の概要: Modeling Generalized Specialist Approach To Train Quality Resilient
Snapshot Ensemble
- arxiv url: http://arxiv.org/abs/2206.05853v1
- Date: Sun, 12 Jun 2022 22:40:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-15 02:54:57.591437
- Title: Modeling Generalized Specialist Approach To Train Quality Resilient
Snapshot Ensemble
- Title(参考訳): 汎用スペシャリストによる高品質なスナップショットアンサンブルの訓練
- Authors: Ghalib Ahmed Tahir, Chu Kiong Loo, Zongying Liu
- Abstract要約: この研究は、高品質な弾力性のあるアンサンブルを訓練するための一般化されたスペシャリストのアプローチをモデル化した。
アンサンブルのそれぞれのスナップショットは、いくつかの歪みレベルに関する専門知識を獲得し、他の品質歪みの浅いスキルを得た。
実世界の3つの食品とマレーシアの食品データベースを実験的に分析したところ、歪んだ画像に顕著な改善が見られた。
- 参考スコア(独自算出の注目度): 2.7716102039510564
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Convolutional neural networks (CNNs) apply well with food image recognition
due to the ability to learn discriminative visual features. Nevertheless,
recognizing distorted images is challenging for existing CNNs. Hence, the study
modelled a generalized specialist approach to train a quality resilient
ensemble. The approach aids the models in the ensemble framework retain general
skills of recognizing clean images and shallow skills of classifying noisy
images with one deep expertise area on a particular distortion. Subsequently, a
novel data augmentation random quality mixup (RQMixUp) is combined with
snapshot ensembling to train G-Specialist. During each training cycle of
G-Specialist, a model is fine-tuned on the synthetic images generated by
RQMixup, intermixing clean and distorted images of a particular distortion at a
randomly chosen level. Resultantly, each snapshot in the ensemble gained
expertise on several distortion levels, with shallow skills on other quality
distortions. Next, the filter outputs from diverse experts were fused for
higher accuracy. The learning process has no additional cost due to a single
training process to train experts, compatible with a wide range of supervised
CNNs for transfer learning. Finally, the experimental analysis on three
real-world food and a Malaysian food database showed significant improvement
for distorted images with competitive classification performance on pristine
food images.
- Abstract(参考訳): 畳み込みニューラルネットワーク(cnns)は、識別可能な視覚特徴を学習できるため、食品画像認識に好適である。
それでも、歪んだ画像を認識することは、既存のCNNにとって難しい。
したがって、この研究は品質回復性アンサンブルを訓練するための一般化された専門的なアプローチをモデル化した。
この手法により、アンサンブルフレームワークのモデルでは、クリーンな画像を認識する一般的なスキルと、特定の歪みに関する深い専門領域を持つノイズの多い画像を分類する浅いスキルが維持される。
その後、新しいデータ拡張ランダム品質ミックスアップ(RQMixUp)とスナップショットアンサンブルを組み合わせてG-スペシャリストを訓練する。
G-スペシャリストのトレーニングサイクル毎に、RQMixupによって生成された合成画像に基づいてモデルを微調整し、ランダムに選択された特定の歪みの画像と歪んだ画像を混在させる。
その結果、アンサンブルの各スナップショットは、他の品質歪みの浅いスキルとともに、いくつかの歪みレベルで専門知識を得た。
次に、さまざまな専門家によるフィルタ出力が高い精度で融合された。
学習プロセスには、専門家を訓練するための単一のトレーニングプロセスによる追加コストがなく、転送学習のための幅広い教師付きcnnと互換性がある。
最後に,3つの実世界の食品とマレーシアの食品データベースの実験的分析により,プリスタン食品画像に対する競合的分類性能を有する歪み画像に対して有意な改善が認められた。
関連論文リスト
- Alleviating Catastrophic Forgetting in Facial Expression Recognition with Emotion-Centered Models [49.3179290313959]
感情中心型生成的リプレイ (ECgr) は, 生成的対向ネットワークから合成画像を統合することで, この課題に対処する。
ECgrは、生成された画像の忠実性を保証するために品質保証アルゴリズムを組み込んでいる。
4つの多様な表情データセットに対する実験結果から,擬似リハーサル法により生成されたイメージを組み込むことで,ターゲットとするデータセットとソースデータセットのトレーニングが促進されることが示された。
論文 参考訳(メタデータ) (2024-04-18T15:28:34Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Twice Mixing: A Rank Learning based Quality Assessment Approach for
Underwater Image Enhancement [42.03072878219206]
水中画像強調(UIE)のためのランク学習誘導非参照品質評価法を提案する。
Twice Mixingと呼ばれるこの手法は、高品質な画像と低品質な画像とを混合することにより、中質な画像を生成することができるという観察によって動機付けられている。
我々は、合成データセットと実世界のデータセットの両方について広範な実験を行う。
論文 参考訳(メタデータ) (2021-02-01T07:13:39Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z) - SIR: Self-supervised Image Rectification via Seeing the Same Scene from
Multiple Different Lenses [82.56853587380168]
本稿では、異なるレンズからの同一シーンの歪み画像の補正結果が同一であるべきという重要な知見に基づいて、新しい自己監督画像補正法を提案する。
我々は、歪みパラメータから修正画像を生成し、再歪み画像を生成するために、微分可能なワープモジュールを利用する。
本手法は,教師付きベースライン法や代表的最先端手法と同等あるいはそれ以上の性能を実現する。
論文 参考訳(メタデータ) (2020-11-30T08:23:25Z) - LIRA: Lifelong Image Restoration from Unknown Blended Distortions [33.91806781681914]
そこで本研究では,ブレンド歪みに対する生涯画像復元問題を提案する。
まず,個別歪み除去タスクを専門とする複数の事前訓練されたエキスパートモデルを協調的に動作させるベースフォークジョイントモデルを設計する。
我々は、以前トレーニングされたモデルが新しいエキスパートブランチを組み込んで、新しい知識を継続的に蓄積する神経成長戦略を開発する。
論文 参考訳(メタデータ) (2020-08-19T03:35:45Z) - Uncertainty-Aware Blind Image Quality Assessment in the Laboratory and
Wild [98.48284827503409]
我々は,テキスト化BIQAモデルを開発し,それを合成的および現実的歪みの両方で訓練するアプローチを提案する。
我々は、多数の画像ペアに対してBIQAのためのディープニューラルネットワークを最適化するために、忠実度損失を用いる。
6つのIQAデータベースの実験は、実験室と野生動物における画像品質を盲目的に評価する学習手法の可能性を示唆している。
論文 参考訳(メタデータ) (2020-05-28T13:35:23Z) - Single Image Dehazing Using Ranking Convolutional Neural Network [43.9523642309301]
本稿では,単一画像復調のための新しいランクリング畳み込みニューラルネットワーク(Ranking-CNN)を提案する。
Ranking-CNNをよく設計された方法でトレーニングすることにより、巨大なヘイズ画像パッチから、強力なヘイズ関連機能を自動的に学習することができる。
提案手法は, 合成および実世界のベンチマーク画像において, 過去のデハージングアプローチよりも優れていた。
論文 参考訳(メタデータ) (2020-01-15T11:25:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。