論文の概要: PixelHop++: A Small Successive-Subspace-Learning-Based (SSL-based) Model
for Image Classification
- arxiv url: http://arxiv.org/abs/2002.03141v1
- Date: Sat, 8 Feb 2020 11:08:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 22:38:20.295219
- Title: PixelHop++: A Small Successive-Subspace-Learning-Based (SSL-based) Model
for Image Classification
- Title(参考訳): PixelHop++:イメージ分類のための小さな継承サブスペース学習ベース(SSLベース)モデル
- Authors: Yueru Chen, Mozhdeh Rouhsedaghat, Suya You, Raghuveer Rao and C.-C.
Jay Kuo
- Abstract要約: 改良されたPixelHopメソッドを提案し、それをPixelHop++と呼ぶ。
PixelHop++では、モデルサイズと分類性能のフレキシブルなトレードオフを取り除き、粒度の学習モデルサイズを制御することができる。
- 参考スコア(独自算出の注目度): 30.49387075658641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The successive subspace learning (SSL) principle was developed and used to
design an interpretable learning model, known as the PixelHop method,for image
classification in our prior work. Here, we propose an improved PixelHop method
and call it PixelHop++. First, to make the PixelHop model size smaller, we
decouple a joint spatial-spectral input tensor to multiple spatial tensors (one
for each spectral component) under the spatial-spectral separability assumption
and perform the Saab transform in a channel-wise manner, called the
channel-wise (c/w) Saab transform.Second, by performing this operation from one
hop to another successively, we construct a channel-decomposed feature tree
whose leaf nodes contain features of one dimension (1D). Third, these 1D
features are ranked according to their cross-entropy values, which allows us to
select a subset of discriminant features for image classification. In
PixelHop++, one can control the learning model size of
fine-granularity,offering a flexible tradeoff between the model size and the
classification performance. We demonstrate the flexibility of PixelHop++ on
MNIST, Fashion MNIST, and CIFAR-10 three datasets.
- Abstract(参考訳): 逐次部分空間学習(ssl)原理は,画像分類のためのpixelhop法として知られる解釈可能な学習モデルの設計のために開発された。
本稿では,改良されたpixelhopメソッドを提案し,それをpixelhop++と呼ぶ。
まず、画素ホップモデルのサイズを小さくするために、空間スペクトル分離可能性仮定の下で複数の空間テンソル(各スペクトル成分に対して1つ)に結合的な空間スペクトル入力テンソルを分離し、チャネルワイズ(c/w)サーブ変換と呼ばれるチャネル回りの方法でサーブ変換を行う。
第3に、これらの1d特徴は相互エントロピー値に従ってランク付けされ、画像分類のための識別特徴のサブセットを選択できる。
PixelHop++では、モデルサイズと分類性能のフレキシブルなトレードオフを取り除き、粒度の学習モデルサイズを制御することができる。
MNIST、Fashion MNIST、CIFAR-10の3つのデータセット上でPixelHop++の柔軟性を示す。
関連論文リスト
- Bayesian Active Learning for Semantic Segmentation [9.617769135242973]
スパースピクセルレベルのアノテーションに基づくベイズ能動的学習フレームワークを提案する。
BalEntは、予測された限界化確率分布とピクセルラベルの間の情報をキャプチャする。
私たちは、Cityscapes、Camvid、ADE20K、VOC2012ベンチマークデータセットのために提案したアクティブラーニングフレームワークをトレーニングします。
論文 参考訳(メタデータ) (2024-08-03T07:26:10Z) - FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models [56.71672127740099]
我々は,閉鎖語彙データセットのトレーニングモデルによって伝統的に解決されるイメージセグメンテーションの課題に焦点をあてる。
我々は、ゼロショットのオープン語彙セグメンテーションのために、異なる、比較的小さなオープンソース基盤モデルを活用している。
当社のアプローチ(別名FreeSeg-Diff)は、トレーニングに依存しないもので、Pascal VOCとCOCOデータセットの両方で多くのトレーニングベースのアプローチより優れています。
論文 参考訳(メタデータ) (2024-03-29T10:38:25Z) - Differentiable Registration of Images and LiDAR Point Clouds with
VoxelPoint-to-Pixel Matching [58.10418136917358]
カメラからの2D画像とLiDARからの3Dポイントクラウドの間のクロスモダリティ登録は、コンピュータビジョンとロボットトレーニングにおいて重要な課題である。
ニューラルネットワークで学習した点パターンと画素パターンのマッチングによる2次元3次元対応の推定
我々は、異なる潜在画素空間を介して3次元特徴を表現するために、構造化されたモダリティマッチングソルバを学習する。
論文 参考訳(メタデータ) (2023-12-07T05:46:10Z) - Sketch-Guided Text-to-Image Diffusion Models [57.12095262189362]
本稿では,事前訓練されたテキスト-画像拡散モデルを示す普遍的なアプローチを提案する。
本手法では,タスク専用のモデルや専用エンコーダをトレーニングする必要はない。
我々は、スケッチ・ツー・イメージの翻訳タスクに特に焦点をあて、画像を生成する堅牢で表現力のある方法を明らかにする。
論文 参考訳(メタデータ) (2022-11-24T18:45:32Z) - Distilling Ensemble of Explanations for Weakly-Supervised Pre-Training
of Image Segmentation Models [54.49581189337848]
本稿では,分類データセットに基づく画像分割モデルのエンドツーエンド事前学習を可能にする手法を提案する。
提案手法は重み付きセグメンテーション学習法を利用して,重み付きセグメンテーションネットワークを事前訓練する。
実験の結果,ImageNetにソースデータセットとしてPSSLを伴って提案されたエンドツーエンドの事前トレーニング戦略が,さまざまなセグメンテーションモデルの性能向上に成功していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T13:02:32Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - E-PixelHop: An Enhanced PixelHop Method for Object Classification [29.062926577155885]
本研究では,E-PixelHopと呼ばれるオブジェクト分類のための拡張されたソリューションを提案する。
E-PixelHopは以下のステップで構成されている。
様々な受容場を持つホップごとにピクセルレベルの分類を行う。
各ホップからの画素レベル決定と各カラーサブスペースからの画素レベル決定とを融合して画像レベル決定を行う。
論文 参考訳(メタデータ) (2021-07-07T01:22:12Z) - AnomalyHop: An SSL-based Image Anomaly Localization Method [47.56319291471639]
AnomalyHopは、連続したサブスペース学習(SSL)フレームワークに基づく画像異常局在化方法です。
AnomalyHopは数学的に透明で、トレーニングが簡単で、推論速度が速くなります。
MVTec ADデータセットにおけるROC曲線(ROC-AUC)パフォーマンスの領域は95.9%であり、いくつかのベンチマーク方法の中で最も優れている。
論文 参考訳(メタデータ) (2021-05-08T23:17:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。