論文の概要: Feature Engineering is Not Dead: Reviving Classical Machine Learning with Entropy, HOG, and LBP Feature Fusion for Image Classification
- arxiv url: http://arxiv.org/abs/2507.13772v1
- Date: Fri, 18 Jul 2025 09:29:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:26.243855
- Title: Feature Engineering is Not Dead: Reviving Classical Machine Learning with Entropy, HOG, and LBP Feature Fusion for Image Classification
- Title(参考訳): 特徴工学は死んでいない:画像分類のためのエントロピー、HOG、LPP特徴融合による古典的機械学習の復活
- Authors: Abhijit Sen, Giridas Maiti, Bikram K. Parida, Bhanu P. Mishra, Mahima Arya, Denys I. Bondar,
- Abstract要約: 我々は、置換エントロピー(PE)を中心とした新しいアプローチにより、古典的機械学習に基づく画像分類を再考する。
PEを2次元画像に拡張し,マルチスケール・マルチ指向エントロピーに基づく特徴抽出手法を提案する。
この結果から,PEとHOGとLBPの融合は,計算コストが高く,解釈可能な限定的なディープラーニングモデルに対して,コンパクトで,解釈可能な,効果的な代替手段を提供することが示された。
- 参考スコア(独自算出の注目度): 0.13194391758295113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature engineering continues to play a critical role in image classification, particularly when interpretability and computational efficiency are prioritized over deep learning models with millions of parameters. In this study, we revisit classical machine learning based image classification through a novel approach centered on Permutation Entropy (PE), a robust and computationally lightweight measure traditionally used in time series analysis but rarely applied to image data. We extend PE to two-dimensional images and propose a multiscale, multi-orientation entropy-based feature extraction approach that characterizes spatial order and complexity along rows, columns, diagonals, anti-diagonals, and local patches of the image. To enhance the discriminatory power of the entropy features, we integrate two classic image descriptors: the Histogram of Oriented Gradients (HOG) to capture shape and edge structure, and Local Binary Patterns (LBP) to encode micro-texture of an image. The resulting hand-crafted feature set, comprising of 780 dimensions, is used to train Support Vector Machine (SVM) classifiers optimized through grid search. The proposed approach is evaluated on multiple benchmark datasets, including Fashion-MNIST, KMNIST, EMNIST, and CIFAR-10, where it delivers competitive classification performance without relying on deep architectures. Our results demonstrate that the fusion of PE with HOG and LBP provides a compact, interpretable, and effective alternative to computationally expensive and limited interpretable deep learning models. This shows a potential of entropy-based descriptors in image classification and contributes a lightweight and generalizable solution to interpretable machine learning in image classification and computer vision.
- Abstract(参考訳): 画像分類において、特に解釈可能性と計算効率が数百万のパラメータを持つディープラーニングモデルよりも優先される場合、特徴工学は重要な役割を担っている。
本研究では,従来時系列解析に用いられてきた頑健で計算的に軽量な手法であるPermutation Entropy (PE) を中心に,従来の機械学習による画像分類を再検討するが,画像データにはほとんど適用されない。
PEを2次元画像に拡張し、列、列、対角線、対角線、対角線、局所パッチに沿った空間秩序と複雑さを特徴付けるマルチスケールのエントロピーに基づく特徴抽出手法を提案する。
エントロピー特徴の識別能力を高めるために, 形状とエッジ構造を捉えるために向き付け勾配のヒストグラム (HOG) と, 画像の微小テクスチャをエンコードするローカルバイナリパターン (LBP) の2つの古典的画像記述子を統合する。
780次元からなる手作りの機能セットは、グリッドサーチによって最適化されたSVM(Support Vector Machine)分類器のトレーニングに使用される。
提案手法は、Fashion-MNIST、KMNIST、EMNIST、CIFAR-10を含む複数のベンチマークデータセットで評価され、深いアーキテクチャに依存することなく、競合する分類性能を提供する。
この結果から,PEとHOGとLBPの融合は,計算コストが高く,解釈可能な限定的なディープラーニングモデルに対して,コンパクトで,解釈可能な,効果的な代替手段を提供することが示された。
これは、画像分類におけるエントロピーベースの記述子の可能性を示し、画像分類とコンピュータビジョンにおける解釈可能な機械学習に対する軽量で一般化可能なソリューションに寄与する。
関連論文リスト
- Structural-Spectral Graph Convolution with Evidential Edge Learning for Hyperspectral Image Clustering [59.24638672786966]
ハイパースペクトル画像(HSI)クラスタリングは、アノテーションなしで同様のピクセルを同じクラスに割り当てる。
既存のグラフニューラルネットワーク(GNN)は、入力されたHSIのスペクトル情報を十分に活用できない。
グラフ構造化HSIスーパーピクセルに適した構造スペクトルグラフ畳み込み演算子(SSGCO)を提案する。
論文 参考訳(メタデータ) (2025-06-11T16:41:34Z) - Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。
VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。
これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文 参考訳(メタデータ) (2022-03-20T02:59:51Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Multi-Granularity Canonical Appearance Pooling for Remote Sensing Scene
Classification [0.34376560669160383]
リモートセンシングデータセットの潜在存在論的構造を自動的に捉えるために,新しいMG-CAP(Multi-Granularity Canonical Appearance Pooling)を提案する。
それぞれの特定の粒度に対して,事前定義された変換の集合から標準的外観を発見し,最大化に基づくシームズスタイルアーキテクチャを用いて対応するCNN特徴を学習する。
本稿では,GPUの固有値分解関数(EIG)を学習し,行列計算によるバックプロパゲーションを実証する安定解を提案する。
論文 参考訳(メタデータ) (2020-04-09T11:24:00Z) - Contextual Encoder-Decoder Network for Visual Saliency Prediction [42.047816176307066]
本稿では,大規模な画像分類タスクに基づいて事前学習した畳み込みニューラルネットワークに基づくアプローチを提案する。
得られた表現をグローバルなシーン情報と組み合わせて視覚的サリエンシを正確に予測する。
最先端技術と比較して、このネットワークは軽量な画像分類バックボーンに基づいている。
論文 参考訳(メタデータ) (2019-02-18T16:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。