論文の概要: A Hybrid Multilayer Extreme Learning Machine for Image Classification with an Application to Quadcopters
- arxiv url: http://arxiv.org/abs/2507.08047v1
- Date: Thu, 10 Jul 2025 07:02:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-14 18:03:54.122918
- Title: A Hybrid Multilayer Extreme Learning Machine for Image Classification with an Application to Quadcopters
- Title(参考訳): 画像分類用ハイブリッド多層エクストリーム学習機とクアッドコプターへの応用
- Authors: Rolando A. Hernandez-Hernandez, Adrian Rubio-Solis,
- Abstract要約: HML-ELM(Hybrid Multilayer Extreme Learning Machine)は、EMMベースのオートエンコーダ(ELM-AE)とインターバルタイプ2ファジィ論理理論に基づいている。
提案手法は,1)自己学習型特徴抽出と2)教師付き特徴分類の2段階からなる階層型EMM学習フレームワークである。
- 参考スコア(独自算出の注目度): 0.5452584641316627
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Multilayer Extreme Learning Machine (ML-ELM) and its variants have proven to be an effective technique for the classification of different natural signals such as audio, video, acoustic and images. In this paper, a Hybrid Multilayer Extreme Learning Machine (HML-ELM) that is based on ELM-based autoencoder (ELM-AE) and an Interval Type-2 fuzzy Logic theory is suggested for active image classification and applied to Unmanned Aerial Vehicles (UAVs). The proposed methodology is a hierarchical ELM learning framework that consists of two main phases: 1) self-taught feature extraction and 2) supervised feature classification. First, unsupervised multilayer feature encoding is achieved by stacking a number of ELM-AEs, in which input data is projected into a number of high-level representations. At the second phase, the final features are classified using a novel Simplified Interval Type-2 Fuzzy ELM (SIT2-FELM) with a fast output reduction layer based on the SC algorithm; an improved version of the algorithm Center of Sets Type Reducer without Sorting Requirement (COSTRWSR). To validate the efficiency of the HML-ELM, two types of experiments for the classification of images are suggested. First, the HML-ELM is applied to solve a number of benchmark problems for image classification. Secondly, a number of real experiments to the active classification and transport of four different objects between two predefined locations using a UAV is implemented. Experiments demonstrate that the proposed HML-ELM delivers a superior efficiency compared to other similar methodologies such as ML-ELM, Multilayer Fuzzy Extreme Learning Machine (ML-FELM) and ELM.
- Abstract(参考訳): マルチレイヤ・エクストリーム・ラーニング・マシン(ML-ELM)とその変種は、音声、ビデオ、音響、画像などの様々な自然信号の分類に有効な手法であることが証明されている。
本稿では,EMMベースのオートエンコーダ(ELM-AE)とインターバルタイプ2ファジィ論理理論に基づくハイブリッド多層エクストリーム学習マシン(HML-ELM)を,アクティブな画像分類のために提案し,無人航空機(UAV)に適用する。
提案手法は,2つの段階からなる階層型EMM学習フレームワークである。
1)自己学習の特徴抽出
2) 特徴分類の監督。
まず、複数のEMM-AEを積み重ね、入力データを複数のハイレベルな表現に投影することで、教師なしの多層特徴符号化を実現する。
第2フェーズでは、SCアルゴリズムに基づく高速出力低減層を備えたSimplified Interval Type-2 Fuzzy ELM (SIT2-FELM) と、Sorting Requirement (COSTRWSR) を含まないアルゴリズムCenter of Sets Type Reducerの改良版を用いて最終特徴を分類する。
HML-ELMの有効性を検証するために,2種類の画像分類実験を提案する。
まず,HML-ELMを用いて画像分類における多くのベンチマーク問題を解く。
第二に、UAVを用いた2つの事前定義された場所間の4つの異なる物体のアクティブな分類と輸送に関する多くの実実験が実施されている。
実験により,提案したHML-ELMは,ML-ELM,Multilayer Fuzzy Extreme Learning Machine (ML-FELM) やEMMといった類似の手法と比較して,優れた効率性が得られることが示された。
関連論文リスト
- AHDMIL: Asymmetric Hierarchical Distillation Multi-Instance Learning for Fast and Accurate Whole-Slide Image Classification [51.525891360380285]
AHDMILは非対称な階層的蒸留マルチインスタンス学習フレームワークである。
2段階のトレーニングプロセスを通じて、無関係なパッチを排除します。
分類性能と推論速度の両方において、従来の最先端手法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:47:16Z) - Automated Multi-level Preference for MLLMs [41.72392895643214]
「現在のマルチモーダル大言語モデル(MLLM)は幻覚に苦しむ」
有望な道の1つは、人間からのフィードバック(RLHF)からの強化学習を利用することである。
二項選好(上等、下等)の一般的な実践を再考し、多水準選好を採用する方が2つの利点があることを示す。
論文 参考訳(メタデータ) (2024-05-18T03:49:37Z) - Multiple-Input Auto-Encoder Guided Feature Selection for IoT Intrusion Detection Systems [30.16714420093091]
本稿ではまず,Multiple-Input Auto-Encoder (MIAE)と呼ばれる新しいニューラルネットワークアーキテクチャを紹介する。
MIAEは複数のサブエンコーダで構成されており、異なる特性を持つ異なるソースからの入力を処理できる。
より関連性の高い機能を排除し、保持するために、トレーニングプロセスにおいて重要/冗長でないものを取り除くために、我々はさらに機能選択層を設計し、組み込む。
この層は表現ベクトルにおける特徴の重要性を学習し、表現ベクトルから情報的特徴の選択を容易にする。
論文 参考訳(メタデータ) (2024-03-22T03:54:04Z) - Building Brain Tumor Segmentation Networks with User-Assisted Filter Estimation and Selection [42.62139206176152]
複数のFLIM実行から最も関連性の高いフィルタを推定・選択するためのユーザ支援手法であるMulti-Step (MS) FLIMを提案する。
MS-FLIMは第1の畳み込み層にのみ使用され、既にFLIMよりも改善されていることを示している。
We build a simple U-shaped encoder-decoder network, named sU-Net, for glioblastoma segmentation using T1Gd and FLAIR MRI scans。
論文 参考訳(メタデータ) (2024-03-19T14:11:26Z) - Automated Machine Learning for Multi-Label Classification [3.2634122554914002]
2つのアルゴリズムからなるシングルラベル分類タスクに対して,新しいAutoMLアプローチを考案する。
マルチラベル分類におけるAutoMLの課題複雑性を増大させるとともに,シングルラベル分類タスクにおける技術状態を形成するAutoMLアプローチがいかにスケールするかを検討する。
論文 参考訳(メタデータ) (2024-02-28T09:40:36Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Pre-training Language Model as a Multi-perspective Course Learner [103.17674402415582]
本研究では,サンプル効率のよい事前学習のためのマルチパースペクティブ・コース・ラーニング(MCL)手法を提案する。
本研究では,3つの自己超越コースが,「綱引き」力学の固有の欠陥を軽減するように設計されている。
本手法は,GLUEおよびSQuAD 2.0ベンチマークにおいて,ELECTRAの平均性能をそれぞれ2.8%,絶対点を3.2%向上させる。
論文 参考訳(メタデータ) (2023-05-06T09:02:10Z) - Multi-scale Transformer Network with Edge-aware Pre-training for
Cross-Modality MR Image Synthesis [52.41439725865149]
クロスモダリティ磁気共鳴(MR)画像合成は、与えられたモダリティから欠落するモダリティを生成するために用いられる。
既存の(教師付き学習)手法は、効果的な合成モデルを訓練するために、多くのペア化されたマルチモーダルデータを必要とすることが多い。
マルチスケールトランスフォーマーネットワーク(MT-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T11:40:40Z) - Kernel Extreme Learning Machine Optimized by the Sparrow Search
Algorithm for Hyperspectral Image Classification [16.51364033144792]
本稿では、マルチスケールトータル変分法(MSTV)を用いてスペクトルの特徴を抽出し、局所二分法パターン(LBP)を用いて空間的特徴を抽出し、超スペクトル像の融合特徴を得る。
カーネル・エクストリーム・ラーニング・マシン(KELM)のカーネルパラメータと正規化係数を最適化するために,高収束・大域探索機能を備えた新しいスワム・インテリジェンス最適化手法であるスパロウ・サーチ・アルゴリズム(SSA)を用いる。
実験の結果,MLS-KELMは他の一般的な分類法と比較して,分類性能と一般化能力が優れており,MLS-KELMは小サンプルにおいて強い堅牢性を示すことがわかった。
論文 参考訳(メタデータ) (2022-04-03T02:46:36Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Pruning Self-attentions into Convolutional Layers in Single Path [89.55361659622305]
ビジョントランスフォーマー(ViT)は、様々なコンピュータビジョンタスクに対して印象的なパフォーマンスを実現している。
トレーニング済みのViTを効率よく自動圧縮するSPViT(Single-Path Vision Transformer pruning)を提案する。
われわれのSPViTはDeiT-Bで52.0%のFLOPをトリミングできる。
論文 参考訳(メタデータ) (2021-11-23T11:35:54Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Online Multi-Object Tracking and Segmentation with GMPHD Filter and
Mask-based Affinity Fusion [79.87371506464454]
本稿では,インスタンス分割結果を入力として利用するMOTS法を提案する。
提案手法は,ガウス混合確率仮説密度 (GMPHD) フィルタ,階層型データアソシエーション (HDA) モデル,マスクベース親和性融合 (MAF) モデルに基づく。
2つの人気のあるMOTSデータセットの実験では、主要なモジュールがいくつかの改善点を示している。
論文 参考訳(メタデータ) (2020-08-31T21:06:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。