論文の概要: Exploring Color Invariance through Image-Level Ensemble Learning
- arxiv url: http://arxiv.org/abs/2401.10512v1
- Date: Fri, 19 Jan 2024 06:04:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 16:43:08.615851
- Title: Exploring Color Invariance through Image-Level Ensemble Learning
- Title(参考訳): 画像レベルアンサンブル学習による色不変性の探索
- Authors: Yunpeng Gong and Jiaquan Li and Lifei Chen and Min Jiang
- Abstract要約: 本研究ではランダムカラー消去という学習戦略を紹介する。
元の画像構造を乱すことなく、トレーニングデータの部分的又は完全な色情報を選択的に消去する。
このアプローチは、過剰適合のリスクを軽減し、色の変化を処理するモデルの能力を強化する。
- 参考スコア(独自算出の注目度): 7.254270666779331
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the field of computer vision, the persistent presence of color bias,
resulting from fluctuations in real-world lighting and camera conditions,
presents a substantial challenge to the robustness of models. This issue is
particularly pronounced in complex wide-area surveillance scenarios, such as
person re-identification and industrial dust segmentation, where models often
experience a decline in performance due to overfitting on color information
during training, given the presence of environmental variations. Consequently,
there is a need to effectively adapt models to cope with the complexities of
camera conditions. To address this challenge, this study introduces a learning
strategy named Random Color Erasing, which draws inspiration from ensemble
learning. This strategy selectively erases partial or complete color
information in the training data without disrupting the original image
structure, thereby achieving a balanced weighting of color features and other
features within the neural network. This approach mitigates the risk of
overfitting and enhances the model's ability to handle color variation, thereby
improving its overall robustness. The approach we propose serves as an ensemble
learning strategy, characterized by robust interpretability. A comprehensive
analysis of this methodology is presented in this paper. Across various tasks
such as person re-identification and semantic segmentation, our approach
consistently improves strong baseline methods. Notably, in comparison to
existing methods that prioritize color robustness, our strategy significantly
enhances performance in cross-domain scenarios. The code available at
\url{https://github.com/layumi/Person\_reID\_baseline\_pytorch/blob/master/random\_erasing.py}
or \url{https://github.com/finger-monkey/Data-Augmentation}.
- Abstract(参考訳): コンピュータビジョンの分野では、現実世界の照明条件やカメラ条件の変動によって生じる色バイアスの持続的な存在は、モデルの堅牢性に重大な課題をもたらす。
この問題は、人の再識別や産業ダストセグメンテーションのような複雑な広域監視シナリオにおいて特に顕著であり、環境変動があるため、トレーニング中に色情報に過度に適合するため、モデルの性能が低下することがある。
したがって、カメラ条件の複雑さに対応するために、効果的にモデルを適用する必要がある。
そこで本研究では,無作為色消去という学習戦略を導入し,アンサンブル学習からインスピレーションを得た。
この戦略は、トレーニングデータの部分的又は完全な色情報を元の画像構造を損なうことなく選択的に消去し、ニューラルネットワーク内の色特徴その他の特徴のバランスの取れた重み付けを実現する。
このアプローチは過剰フィッティングのリスクを軽減し、モデルの色の変化を扱う能力を高め、全体的なロバスト性を改善する。
提案手法は,強固な解釈可能性によって特徴付けられるアンサンブル学習戦略として機能する。
本稿では,本手法の包括的解析について述べる。
人物再同定や意味セグメンテーションといった様々なタスクを通して、我々のアプローチは一貫して強力なベースラインメソッドを改善します。
特に、カラーロバスト性を優先する既存の方法と比較して、この戦略はクロスドメインシナリオのパフォーマンスを著しく向上させる。
コードは \url{https://github.com/layumi/Person\_reID\_baseline\_pytorch/blob/master/random\_erasing.py} または \url{https://github.com/finger-monkey/Data-Augmentation} で公開されている。
関連論文リスト
- Robust Network Learning via Inverse Scale Variational Sparsification [55.64935887249435]
時間連続な逆スケール空間の定式化において、逆スケールの変動スペーサー化フレームワークを導入する。
周波数ベースの手法とは異なり、我々の手法は小さな特徴を滑らかにすることでノイズを除去するだけでなく、ノイズを除去する。
各種騒音に対する頑健性の向上によるアプローチの有効性を示す。
論文 参考訳(メタデータ) (2024-09-27T03:17:35Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Color Equivariant Convolutional Networks [50.655443383582124]
CNNは、偶然に記録された条件によって導入された色の変化の間にデータ不均衡がある場合、苦労する。
カラースペクトル間の形状特徴共有を可能にする新しいディープラーニングビルディングブロックであるカラー等変畳み込み(CEConvs)を提案する。
CEConvsの利点は、様々なタスクに対するダウンストリーム性能と、列車-テストの分散シフトを含む色の変化に対するロバスト性の改善である。
論文 参考訳(メタデータ) (2023-10-30T09:18:49Z) - Consistency Regularisation in Varying Contexts and Feature Perturbations
for Semi-Supervised Semantic Segmentation of Histology Images [14.005379068469361]
この課題を軽減するために,一貫性に基づく半教師付き学習(SSL)アプローチを提案する。
SSLモデルは、コンテキストの変更や、限られたトレーニングデータのために一般化が不十分な特徴の摂動にも影響する可能性がある。
相互整合性トレーニングにより、エンコーダの特徴が異なる摂動に不変となり、予測信頼性が向上することを示す。
論文 参考訳(メタデータ) (2023-01-30T18:21:57Z) - ParaColorizer: Realistic Image Colorization using Parallel Generative
Networks [1.7778609937758327]
グレースケール画像のカラー化は、情報復元のためのAIの魅力的な応用である。
並列なGANベースのカラー化フレームワークを提案する。
マルチモーダル問題を評価するために一般的に使用される非知覚的評価指標の欠点を示す。
論文 参考訳(メタデータ) (2022-08-17T13:49:44Z) - "Just Drive": Colour Bias Mitigation for Semantic Segmentation in the
Context of Urban Driving [8.147652597876862]
畳み込みニューラルネットワークは、幾何学よりも色やテクスチャに頼っていることが示されている。
本稿では,都会の運転シーンにおけるセマンティックセグメンテーションモデルによって生じるバイアスを,反復的に訓練された未学習アルゴリズムを用いて緩和する。
論文 参考訳(メタデータ) (2021-12-02T10:56:19Z) - Digging Into Self-Supervised Learning of Feature Descriptors [14.47046413243358]
強力な機能記述子に繋がる一連の改善を提案する。
強負の採鉱において, 対面内からバッチ内への探索空間の増大が一貫した改善をもたらすことを示す。
合成ホモグラフィ変換,色強調,フォトリアリスティック画像スタイリングの組み合わせが有用であることを示す。
論文 参考訳(メタデータ) (2021-10-10T12:22:44Z) - Style Curriculum Learning for Robust Medical Image Segmentation [62.02435329931057]
深部セグメンテーションモデルは、トレーニングデータセットとテストデータセットの間の画像強度の分散シフトによって、しばしば劣化する。
本稿では,そのような分散シフトが存在する場合に,ロバストなセグメンテーションを確保するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-01T08:56:24Z) - Collaboration among Image and Object Level Features for Image
Colourisation [25.60139324272782]
画像のカラー化は不適切な問題であり、入力データムに存在するコンテキストとオブジェクトインスタンスに依存する複数の正しいソリューションがある。
従来のアプローチは、強力なユーザーインタラクションを必要とするか、画像レベル(コンテキスト)機能を学ぶために畳み込みニューラルネットワーク(CNN)の能力を利用して、この問題を攻撃しました。
コンボリューションによって得られる画像レベルの特徴とカプセルによってキャプチャされるオブジェクトレベルの特徴を分離する,UCapsNetという単一のネットワークを提案する。
そして,異なる層間の接続をスキップすることで,これらの分離要因間の協調を強制し,高品質で再現可能な画像彩色を実現する。
論文 参考訳(メタデータ) (2021-01-19T11:48:12Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Learning perturbation sets for robust machine learning [97.6757418136662]
我々は、潜在空間の制約領域上に設定された摂動を定義する条件生成器を用いる。
学習した摂動集合の質を定量的かつ質的に測定する。
我々は、学習した摂動集合を利用して、敵画像の破損や逆光の変動に対して経験的かつ確実に堅牢なモデルを訓練する。
論文 参考訳(メタデータ) (2020-07-16T16:39:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。