論文の概要: Intelligent Multi-View Test Time Augmentation
- arxiv url: http://arxiv.org/abs/2406.08593v1
- Date: Wed, 12 Jun 2024 18:59:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-14 22:17:23.731835
- Title: Intelligent Multi-View Test Time Augmentation
- Title(参考訳): インテリジェントなマルチビューテスト時間拡張
- Authors: Efe Ozturk, Mohit Prabhushankar, Ghassan AlRegib,
- Abstract要約: 本稿では、視点変動に対する画像分類モデルの堅牢性と精度を高めるために、インテリジェントなテスト時間拡張(TTA)アルゴリズムを提案する。
従来のTTA法とは違って,予測的不確実性指標に基づいて最適な拡張をインテリジェントに選択する。
本研究は,画像分類のロバスト性向上における適応的,不確実性を考慮したTTAの可能性を明らかにするものである。
- 参考スコア(独自算出の注目度): 14.11559987180237
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we introduce an intelligent Test Time Augmentation (TTA) algorithm designed to enhance the robustness and accuracy of image classification models against viewpoint variations. Unlike traditional TTA methods that indiscriminately apply augmentations, our approach intelligently selects optimal augmentations based on predictive uncertainty metrics. This selection is achieved via a two-stage process: the first stage identifies the optimal augmentation for each class by evaluating uncertainty levels, while the second stage implements an uncertainty threshold to determine when applying TTA would be advantageous. This methodological advancement ensures that augmentations contribute to classification more effectively than a uniform application across the dataset. Experimental validation across several datasets and neural network architectures validates our approach, yielding an average accuracy improvement of 1.73% over methods that use single-view images. This research underscores the potential of adaptive, uncertainty-aware TTA in improving the robustness of image classification in the presence of viewpoint variations, paving the way for further exploration into intelligent augmentation strategies.
- Abstract(参考訳): 本研究では、視点変動に対する画像分類モデルの堅牢性と精度を高めるために、インテリジェントなテスト時間拡張(TTA)アルゴリズムを提案する。
従来のTTA法とは違って,予測的不確実性指標に基づいて最適な拡張をインテリジェントに選択する。
この選択は2段階のプロセスによって達成される:第1段階は不確実性レベルを評価することによって各クラスに対する最適な拡張を識別し、第2段階は不確実性しきい値を実装して、TTAの適用が有利になるかどうかを決定する。
この方法論の進歩は、拡張がデータセット全体にわたる一様アプリケーションよりも効果的に分類に寄与することを保証する。
いくつかのデータセットとニューラルネットワークアーキテクチャにわたる実験的な検証は、我々のアプローチを検証し、単一ビューイメージを使用するメソッドよりも平均1.73%の精度向上を実現した。
本研究は,画像分類のロバスト性向上における適応的,不確実性を考慮したTTAの可能性を強調し,知的増強戦略のさらなる探求の道を開くものである。
関連論文リスト
- Confidence-aware Contrastive Learning for Selective Classification [20.573658672018066]
この研究は、選択分類のための一般化を提供し、特徴層を最適化することで選択分類の性能を向上させることを開示する。
この理論に触発されて、我々は初めて特徴レベルで選択的分類モデルを明確に改善することを提案し、新たに選択的分類のための信頼を意識したコントラスト学習手法であるCCL-SCを提案する。
論文 参考訳(メタデータ) (2024-06-07T08:43:53Z) - Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Approaching Test Time Augmentation in the Context of Uncertainty Calibration for Deep Neural Networks [2.112682368145474]
画像分類のための深部モデルの不確実性校正を改善するため,M-ATTAとV-ATTAという新しい手法を提案する。
ナ適応重み付けシステムを利用することで、M/V-ATTAはモデルの精度に影響を与えることなく不確実性校正を改善する。
論文 参考訳(メタデータ) (2023-04-11T10:01:39Z) - Variational Voxel Pseudo Image Tracking [127.46919555100543]
不確実性推定は、ロボット工学や自律運転といった重要な問題にとって重要なタスクである。
本稿では,3次元物体追跡のためのVoxel Pseudo Image Tracking (VPIT) の変分ニューラルネットワークによるバージョンを提案する。
論文 参考訳(メタデータ) (2023-02-12T13:34:50Z) - Selective classification using a robust meta-learning approach [28.460912135533988]
本稿では,補助ネットワークを用いて予測不確実性を捉えるインスタンス条件の再重み付け手法を提案する。
制御された実験において、このメタオブジェクトを通して様々な不確実性の概念を効果的に捉えていることを示す。
糖尿病網膜症では、最大3.4%/3.3%の精度でSOTAを上回り、選択的分類ではAUCが上昇する。
論文 参考訳(メタデータ) (2022-12-12T15:45:23Z) - Improved Text Classification via Test-Time Augmentation [2.493374942115722]
テスト時間拡張は画像分類モデルの性能を向上させるための確立された手法である。
本稿では,言語モデルによる精度向上を実現するための拡張ポリシーを提案する。
バイナリ分類タスクとデータセットによる実験は、テスト時間拡張が一貫した改善をもたらすことを示している。
論文 参考訳(メタデータ) (2022-06-27T19:57:27Z) - Entropy-based Active Learning for Object Detection with Progressive
Diversity Constraint [31.094612936162754]
アクティブラーニングは、コンピュータビジョンタスクにおける高アノテーションコストの問題を軽減するための有望な代替手段である。
本稿では,この問題に対処する新たなハイブリッドアプローチを提案し,ボトムアップ方式でインスタンスレベルの不確実性と多様性を共同で検討する。
論文 参考訳(メタデータ) (2022-04-17T09:51:12Z) - SelectAugment: Hierarchical Deterministic Sample Selection for Data
Augmentation [72.58308581812149]
そこで我々は,SelectAugmentと呼ばれる効果的な手法を提案し,決定論的かつオンラインに拡張するサンプルを選択する。
具体的には、各バッチにおいて、まず増分比率を決定し、次にこの比で各トレーニングサンプルを増分するかを決定する。
これにより、サンプルを増量する際のランダム性による負の効果を効果的に軽減し、DAの有効性を向上させることができる。
論文 参考訳(メタデータ) (2021-12-06T08:38:38Z) - MEMO: Test Time Robustness via Adaptation and Augmentation [131.28104376280197]
テスト時間ロバスト化の問題、すなわちモデルロバスト性を改善するためにテストインプットを用いて検討する。
最近の先行研究ではテスト時間適応法が提案されているが、それぞれ追加の仮定を導入している。
モデルが確率的で適応可能な任意のテスト環境で使用できるシンプルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-10-18T17:55:11Z) - Adaptive Gradient Method with Resilience and Momentum [120.83046824742455]
レジリエンスとモメンタム(AdaRem)を用いた適応勾配法を提案する。
AdaRemは、過去の1つのパラメータの変化方向が現在の勾配の方向と一致しているかどうかに応じてパラメータワイズ学習率を調整する。
本手法は,学習速度とテスト誤差の観点から,従来の適応学習率に基づくアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-10-21T14:49:00Z) - Uncertainty-Aware Few-Shot Image Classification [118.72423376789062]
ラベル付き限られたデータから新しいカテゴリを認識できる画像分類はほとんどない。
画像分類のための不確実性を考慮したFew-Shotフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-09T12:26:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。