論文の概要: Geometric Data Augmentations to Mitigate Distribution Shifts in Pollen
Classification from Microscopic Images
- arxiv url: http://arxiv.org/abs/2311.11029v1
- Date: Sat, 18 Nov 2023 10:35:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 12:40:31.385012
- Title: Geometric Data Augmentations to Mitigate Distribution Shifts in Pollen
Classification from Microscopic Images
- Title(参考訳): 微視画像からの花粉分類における分布シフト緩和のための幾何学的データ拡張
- Authors: Nam Cao, Olga Saukh
- Abstract要約: 我々は、幾何学的特徴が正確な花粉の同定に非常に重要であるというドメイン知識を活用している。
本稿では,列車におけるモデル性能とテストデータセットとの精度ギャップを著しく狭めるために,新しい2つの幾何画像拡張手法を提案する。
- 参考スコア(独自算出の注目度): 4.545340728210854
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Distribution shifts are characterized by differences between the training and
test data distributions. They can significantly reduce the accuracy of machine
learning models deployed in real-world scenarios. This paper explores the
distribution shift problem when classifying pollen grains from microscopic
images collected in the wild with a low-cost camera sensor. We leverage the
domain knowledge that geometric features are highly important for accurate
pollen identification and introduce two novel geometric image augmentation
techniques to significantly narrow the accuracy gap between the model
performance on the train and test datasets. In particular, we show that
Tenengrad and ImageToSketch filters are highly effective to balance the shape
and texture information while leaving out unimportant details that may confuse
the model. Extensive evaluations on various model architectures demonstrate a
consistent improvement of the model generalization to field data of up to 14%
achieved by the geometric augmentation techniques when compared to a wide range
of standard image augmentations. The approach is validated through an ablation
study using pollen hydration tests to recover the shape of dry pollen grains.
The proposed geometric augmentations also receive the highest scores according
to the affinity and diversity measures from the literature.
- Abstract(参考訳): 分布シフトは、トレーニングとテストデータ分布の違いによって特徴づけられる。
現実世界のシナリオにデプロイされた機械学習モデルの精度を大幅に削減することができる。
本稿では,野生の微視的画像から花粉粒を低コストカメラセンサで分類する場合の分布シフト問題について検討する。
我々は, 正確な花粉識別において幾何学的特徴が極めて重要であるというドメイン知識を活用し, 列車におけるモデル性能と試験データセットとの精度ギャップを著しく狭めるために, 2つの新しい幾何学的画像増強手法を導入する。
特に,tenengradフィルタとimagetosketchフィルタは,形状情報とテクスチャ情報のバランスを保ちながら,モデルを混乱させる可能性のある重要でない詳細情報を残している。
様々なモデルアーキテクチャに対する広範囲な評価は、幅広い標準画像拡張と比較して、幾何拡大技術によって達成された最大14%のフィールドデータに対するモデルの一般化が一貫した改善を示している。
本手法は, 花粉水和試験を用いて乾燥花粉の形状を復元するアブレーション試験により検証した。
提案手法は,文献の親和性と多様性の指標により,最も高いスコアを得られる。
関連論文リスト
- Semi-Truths: A Large-Scale Dataset of AI-Augmented Images for Evaluating Robustness of AI-Generated Image detectors [62.63467652611788]
実画像27,600枚、223,400枚、AI拡張画像1,472,700枚を含むSEMI-TRUTHSを紹介する。
それぞれの画像には、検出器のロバスト性の標準化と目標評価のためのメタデータが添付されている。
以上の結果から,現状の検出器は摂動の種類や程度,データ分布,拡張方法に様々な感度を示すことが示唆された。
論文 参考訳(メタデータ) (2024-11-12T01:17:27Z) - Select-Mosaic: Data Augmentation Method for Dense Small Object Scenes [4.418515380386838]
モザイクデータ拡張技術は、トレーニングデータの多様性と複雑さを高めるために複数の画像を縫合する。
本稿では,詳細な領域選択戦略により改良されたSelect-Mosaicデータ拡張手法を提案する。
改良されたSelect-Mosaic法は、高密度小物体検出タスクの処理において優れた性能を示す。
論文 参考訳(メタデータ) (2024-06-08T09:22:08Z) - Varying Manifolds in Diffusion: From Time-varying Geometries to Visual Saliency [25.632973225129728]
前方拡散過程と逆生成過程が多様体上の一連の分布を構成する拡散モデルの幾何学的性質について検討する。
生成速度は画像成分の視覚的明瞭度などの直感的な視覚特性と高い相関性を示す。
本稿では,画像成分の生成速度を時間とともに推定し,生成曲線を導出する効率的かつ微分可能な手法を提案する。
論文 参考訳(メタデータ) (2024-06-07T07:32:41Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - Pre-processing training data improves accuracy and generalisability of
convolutional neural network based landscape semantic segmentation [2.8747398859585376]
オーストラリア,クイーンズランド州ウェット・トロピクスとアザートン・テーブルランズ上空の航空写真における土地利用土地被覆(LULC)の特徴のセマンティックセグメンテーションとCNN訓練のための様々なデータ準備方法を試行した。
これは、さまざまなトレーニングパッチ選択サンプリング戦略、パッチとバッチサイズ、データ拡張とスケーリングの試行とランキングによって実施された。
我々は、2018年のトレーニング画像上で5つのモデルを訓練し、2015年の試験画像に適用し、出力LULC分類により平均ユーザ精度0.84、生産精度0.87を達成した。
論文 参考訳(メタデータ) (2023-04-28T04:38:45Z) - Effective Data Augmentation With Diffusion Models [65.09758931804478]
我々は、事前訓練されたテキスト・画像拡散モデルによりパラメータ化された画像・画像変換によるデータ拡張の多様性の欠如に対処する。
本手法は,市販の拡散モデルを用いて画像のセマンティクスを編集し,いくつかのラベル付き例から新しい視覚概念に一般化する。
本手法は,実世界の雑草認識タスクと数ショット画像分類タスクにおいて評価し,テスト領域における精度の向上を観察する。
論文 参考訳(メタデータ) (2023-02-07T20:42:28Z) - Robustifying Deep Vision Models Through Shape Sensitization [19.118696557797957]
そこで本研究では,ネットワークの全体像を学習するためのインセンティブを明示的に付与する,シンプルで軽量な対向拡張手法を提案する。
我々の拡張は、ランダムに決定された混合比を用いて、シャッフルパッチで、ある画像から別の画像へのエッジマップを重畳する。
この拡張により,データセットやニューラルアーキテクチャの分類精度とロバストネスが大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-11-14T11:17:46Z) - Generative models-based data labeling for deep networks regression:
application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。
従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。
マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-09T09:06:51Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。