論文の概要: Augmenting Prototype Network with TransMix for Few-shot Hyperspectral
Image Classification
- arxiv url: http://arxiv.org/abs/2401.11724v1
- Date: Mon, 22 Jan 2024 06:56:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 14:58:14.415775
- Title: Augmenting Prototype Network with TransMix for Few-shot Hyperspectral
Image Classification
- Title(参考訳): フルショットハイパースペクトル画像分類のためのTransMixを用いたプロトタイプネットワークの拡張
- Authors: Chun Liu, Longwei Yang, Dongmei Dong, Zheng Li, Wei Yang, Zhigang Han,
and Jiayao Wang
- Abstract要約: 我々は,数ショットハイパースペクトル画像分類(APNT)のためのTransMixによるプロトタイプネットワークの拡張を提案する。
プロトタイプネットワークをバックボーンとして、トランスフォーマーを特徴抽出器として採用し、画素間関係を学習する。
提案手法は,数発のハイパースペクトル画像分類において,技術性能とロバスト性の向上を実証した。
- 参考スコア(独自算出の注目度): 9.479240476603353
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot hyperspectral image classification aims to identify the classes of
each pixel in the images by only marking few of these pixels. And in order to
obtain the spatial-spectral joint features of each pixel, the fixed-size
patches centering around each pixel are often used for classification. However,
observing the classification results of existing methods, we found that
boundary patches corresponding to the pixels which are located at the boundary
of the objects in the hyperspectral images, are hard to classify. These
boundary patchs are mixed with multi-class spectral information. Inspired by
this, we propose to augment the prototype network with TransMix for few-shot
hyperspectrial image classification(APNT). While taking the prototype network
as the backbone, it adopts the transformer as feature extractor to learn the
pixel-to-pixel relation and pay different attentions to different pixels. At
the same time, instead of directly using the patches which are cut from the
hyperspectral images for training, it randomly mixs up two patches to imitate
the boundary patches and uses the synthetic patches to train the model, with
the aim to enlarge the number of hard training samples and enhance their
diversity. And by following the data agumentation technique TransMix, the
attention returned by the transformer is also used to mix up the labels of two
patches to generate better labels for synthetic patches. Compared with existing
methods, the proposed method has demonstrated sate of the art performance and
better robustness for few-shot hyperspectral image classification in our
experiments.
- Abstract(参考訳): 少数のハイパースペクトル画像分類は、画像中の各ピクセルのクラスを特定することを目的としている。
また、各画素の空間スペクトル継手特性を得るために、各画素を中心とした固定サイズパッチをしばしば分類に使用する。
しかし,既存手法の分類結果から,ハイパースペクトル画像の物体の境界に位置する画素に対応する境界パッチは,分類が困難であることが判明した。
これらの境界パッチはマルチクラススペクトル情報と混合される。
そこで我々は,数発の超特殊画像分類(APNT)のためのTransMixによるプロトタイプネットワークの拡張を提案する。
プロトタイプネットワークをバックボーンとしながら、トランスフォーマーを特徴抽出器として採用し、画素間関係を学習し、異なる画素に異なる注意を払う。
同時に、トレーニングのためにハイパースペクトルイメージからカットされたパッチを直接使用する代わりに、境界パッチを模倣するために2つのパッチをランダムに混合し、モデルトレーニングに合成パッチを使用する。
そして、データアグメンテーション技術であるtransmixに従うことで、トランスフォーマーが返す注意を、2つのパッチのラベルを混ぜ合わせることで、合成パッチのためのより良いラベルを生成する。
提案手法は,従来の手法と比較して,数発超スペクトル画像分類の精度とロバスト性が向上することを示した。
関連論文リスト
- A consensus-constrained parsimonious Gaussian mixture model for
clustering hyperspectral images [0.0]
食品エンジニアは、ハイパースペクトル画像を使用して、食品サンプルのタイプと品質を分類する。
これらの手法を訓練するには、各トレーニング画像の各ピクセルにラベルを付ける必要がある。
ハイパースペクトル画像に画素をラベル付けするために, コンセンサス制約付き擬似ガウス混合モデル (ccPGMM) を提案する。
論文 参考訳(メタデータ) (2024-03-05T22:23:43Z) - PatchCT: Aligning Patch Set and Label Set with Conditional Transport for
Multi-Label Image Classification [48.929583521641526]
マルチラベル画像分類は、与えられた画像から複数のラベルを識別することを目的とした予測タスクである。
本稿では,このギャップを埋める条件輸送理論を紹介する。
複数ラベルの分類をCT問題として定式化することで,画像とラベルの相互作用を効率的に活用できることがわかった。
論文 参考訳(メタデータ) (2023-07-18T08:37:37Z) - Cascaded Cross-Attention Networks for Data-Efficient Whole-Slide Image
Classification Using Transformers [0.11219061154635457]
全スライディングイメージングは、組織標本の高解像度画像のキャプチャとデジタル化を可能にする。
高解像度情報を効果的に活用するための候補としてトランスフォーマーアーキテクチャが提案されている。
本稿では,抽出されたパッチ数と線形にスケールするクロスアテンション機構に基づく新しいカスケード型クロスアテンションネットワーク(CCAN)を提案する。
論文 参考訳(メタデータ) (2023-05-11T16:42:24Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - Image Inpainting with Edge-guided Learnable Bidirectional Attention Maps [85.67745220834718]
不規則な穴の画像インペインティングを改善するためのエッジガイド学習可能な双方向注意マップ(Edge-LBAM)を紹介します。
当社のEdge-LBAMメソッドには、予測エッジによる構造認識マスク更新を含むデュアルプロシージャが含まれています。
広範な実験により,エッジlbamはコヒーレントな画像構造を生成し,色差やぼやけを防止できることがわかった。
論文 参考訳(メタデータ) (2021-04-25T07:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。