論文の概要: A Hybrid Swarm and Gravitation based feature selection algorithm for
Handwritten Indic Script Classification problem
- arxiv url: http://arxiv.org/abs/2005.04596v1
- Date: Sun, 10 May 2020 07:27:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 01:22:27.124682
- Title: A Hybrid Swarm and Gravitation based feature selection algorithm for
Handwritten Indic Script Classification problem
- Title(参考訳): 手書きインデックススクリプト分類問題に対するハイブリッドスワムと重力に基づく特徴選択アルゴリズム
- Authors: Ritam Guha, Manosij Ghosh, Pawan Kumar Singh, Ram Sarkar, Mita
Nasipuri
- Abstract要約: 我々はHybrid Swarm and Gravitation based FS (HSGFS)と呼ばれる新しいFSアルゴリズムを導入する。
このアルゴリズムは、DHT(Distance-Hough Transform)、HOG(Histogram of Oriented Gradients)、MLG(Modified log-Gabor)の3つの特徴ベクトル上で動作させる。
本手法の評価には,12のIndicスクリプトからなる手書きデータセットをブロック,テキスト行,単語レベルで作成した。
- 参考スコア(独自算出の注目度): 39.11055166524374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In any multi-script environment, handwritten script classification is of
paramount importance before the document images are fed to their respective
Optical Character Recognition (OCR) engines. Over the years, this complex
pattern classification problem has been solved by researchers proposing various
feature vectors mostly having large dimension, thereby increasing the
computation complexity of the whole classification model. Feature Selection
(FS) can serve as an intermediate step to reduce the size of the feature
vectors by restricting them only to the essential and relevant features. In our
paper, we have addressed this issue by introducing a new FS algorithm, called
Hybrid Swarm and Gravitation based FS (HSGFS). This algorithm is made to run on
3 feature vectors introduced in the literature recently - Distance-Hough
Transform (DHT), Histogram of Oriented Gradients (HOG) and Modified log-Gabor
(MLG) filter Transform. Three state-of-the-art classifiers namely, Multi-Layer
Perceptron (MLP), K-Nearest Neighbour (KNN) and Support Vector Machine (SVM)
are used for the handwritten script classification. Handwritten datasets,
prepared at block, text-line and word level, consisting of officially
recognized 12 Indic scripts are used for the evaluation of our method. An
average improvement in the range of 2-5 % is achieved in the classification
accuracies by utilizing only about 75-80 % of the original feature vectors on
all three datasets. The proposed methodology also shows better performance when
compared to some popularly used FS models.
- Abstract(参考訳): マルチスクリプト環境では、文書画像がそれぞれのocr(optical character recognition)エンジンに供給される前に手書き文字の分類が最重要となる。
長年にわたり、この複雑なパターン分類問題は、主に大きな次元を持つ様々な特徴ベクトルを提案する研究者によって解決されてきた。
機能選択(FS)は、必要な機能と関連する機能にのみ制限することにより、機能ベクトルのサイズを減らす中間ステップとして機能する。
本稿では,Hybrid Swarm and Gravitation based FS (HSGFS) と呼ばれる新しいFSアルゴリズムを導入することでこの問題に対処した。
このアルゴリズムは、最近文献に導入された3つの特徴ベクトル(距離ハフ変換(dht)、向き付け勾配のヒストグラム(hog)、修正log-gabor(mlg)フィルタ変換)で実行される。
3つの最先端の分類器、すなわちMulti-Layer Perceptron(MLP)、K-Nearest Neighbour(KNN)、Support Vector Machine(SVM)が手書きスクリプト分類に使用される。
本手法の評価には,12のIndicスクリプトからなる手書きデータセットをブロック,テキスト行,単語レベルで作成した。
3つのデータセットの原特徴ベクトルの75~80パーセントしか利用せず,分類精度において平均2~5%の改善が達成される。
提案手法は,一般的なFSモデルと比較して,優れた性能を示す。
関連論文リスト
- Leveraging Semantic Segmentation Masks with Embeddings for Fine-Grained Form Classification [0.0]
史料の効率的な分類は系譜学、法学、歴史学などの分野において重要である。
本稿では、ResNet、マスク付き画像変換器(Di)、埋め込みセグメンテーションなどのディープラーニングモデルを統合した表現型学習戦略を提案する。
論文 参考訳(メタデータ) (2024-05-23T04:28:50Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Tuning Traditional Language Processing Approaches for Pashto Text
Classification [0.0]
本研究の目的は,Pashto自動テキスト分類システムの構築である。
本研究は、統計的およびニューラルネットワーク機械学習技術の両方を含む複数のモデルを比較する。
本研究では,分類アルゴリズムとTFIDF特徴抽出法を用いて,平均試験精度94%を得た。
論文 参考訳(メタデータ) (2023-05-04T22:57:45Z) - Texture image analysis based on joint of multi directions GLCM and local
ternary patterns [0.0]
テクスチャ機能は、通勤視覚や機械学習問題において、多くの異なるアプリケーションで使用することができる。
2つのテクスチャ記述子、共起行列と局所三元パターンを組み合わせた新しい手法を提案する。
実験の結果,提案手法はいくつかの最先端手法と比較して高い分類率を示すことがわかった。
論文 参考訳(メタデータ) (2022-09-05T09:53:00Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Exploiting Local and Global Features in Transformer-based Extreme
Multi-label Text Classification [28.28186933768281]
本稿では,Transformerモデルが生成する局所的特徴とグローバル的特徴を組み合わせることで,分類器の予測能力を向上させる手法を提案する。
本実験は,提案モデルがベンチマークデータセットの最先端手法よりも優れているか,あるいは同等であることを示す。
論文 参考訳(メタデータ) (2022-04-02T19:55:23Z) - Generalized Funnelling: Ensemble Learning and Heterogeneous Document
Embeddings for Cross-Lingual Text Classification [78.83284164605473]
emphFunnelling (Fun)は、最近提案された言語間テキスト分類手法である。
Emph Generalized Funnelling (gFun) はFunの一般化である。
gFunは、Funや最先端のベースラインよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-09-17T23:33:04Z) - MultiGBS: A multi-layer graph approach to biomedical summarization [6.11737116137921]
本稿では,文書を多層グラフとしてモデル化し,テキストの複数の特徴を同時に処理可能にするドメイン固有手法を提案する。
教師なしの手法では,MultiRankアルゴリズムと概念数に基づいて,多層グラフから文を選択する。
提案するMultiGBSアルゴリズムはUMLSを採用し,SemRepやMetaMap,OGERといったさまざまなツールを用いて概念と関係を抽出する。
論文 参考訳(メタデータ) (2020-08-27T04:22:37Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。