論文の概要: Application of Hierarchical Temporal Memory Theory for Document
Categorization
- arxiv url: http://arxiv.org/abs/2112.14820v1
- Date: Wed, 29 Dec 2021 20:34:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 05:18:44.427995
- Title: Application of Hierarchical Temporal Memory Theory for Document
Categorization
- Title(参考訳): 階層的時間記憶理論の文書分類への応用
- Authors: Deven Shah, Pinak Ghate, Manali Paranjape, Amit Kumar
- Abstract要約: 本研究の目的は,HTM理論における空間プール学習アルゴリズムを用いた文書分類のための代替フレームワークを提供することである。
その結果、HTM理論は初期段階にあるものの、一般的な機械学習ベースの分類器のほとんどと同等に機能することが証明された。
- 参考スコア(独自算出の注目度): 4.506399699599753
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The current work intends to study the performance of the Hierarchical
Temporal Memory(HTM) theory for automated classification of text as well as
documents. HTM is a biologically inspired theory based on the working
principles of the human neocortex. The current study intends to provide an
alternative framework for document categorization using the Spatial Pooler
learning algorithm in the HTM Theory. As HTM accepts only a stream of binary
data as input, Latent Semantic Indexing(LSI) technique is used for extracting
the top features from the input and converting them into binary format. The
Spatial Pooler algorithm converts the binary input into sparse patterns with
similar input text having overlapping spatial patterns making it easy for
classifying the patterns into categories. The results obtained prove that HTM
theory, although is in its nascent stages, performs at par with most of the
popular machine learning based classifiers.
- Abstract(参考訳): 本研究は,テキストと文書の自動分類のための階層的時間記憶理論(HTM)の性能について検討することを目的としている。
HTMはヒト新皮質の作用原理に基づく生物学的に着想を得た理論である。
本研究は,HTM理論における空間プール学習アルゴリズムを用いた文書分類のための代替フレームワークの提供を目的とする。
HTMはバイナリデータのストリームのみを入力として受け入れるため、Latent Semantic Indexing(LSI)技術は入力から上位特徴を抽出しバイナリ形式に変換するために使用される。
空間プールアルゴリズムは、2進入力を重なり合う空間パターンを持つ類似の入力テキストでスパースパターンに変換し、パターンをカテゴリに分類しやすくする。
その結果、HTM理論は初期段階にあるものの、一般的な機械学習ベースの分類器のほとんどと同等に機能することが証明された。
関連論文リスト
- Quantum-inspired classification via efficient simulation of Helstrom measurement [0.3749861135832073]
ヘルストロム測定(HM)は、最小誤差で非直交量子状態を識別するための最適戦略として知られている。
本稿では,HMと状態忠実度の関係を利用して,任意のコピー数の効率的なシミュレーション手法を提案する。
本手法は,データコピー数に応じて分類性能が単調に向上しないことを示す。
論文 参考訳(メタデータ) (2024-03-22T15:59:21Z) - ConTextual Mask Auto-Encoder for Dense Passage Retrieval [49.49460769701308]
CoT-MAEは,高密度経路抽出のための簡易かつ効果的な生成前訓練法である。
文のセマンティクスを高密度ベクトルに圧縮する学習は、自己教師付きおよび文脈教師付きマスキングによる自動エンコーディングによって行われる。
我々は,大規模経路探索ベンチマークの実験を行い,強力なベースラインよりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2022-08-16T11:17:22Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z) - Linear Temporal Logic Modulo Theories over Finite Traces (Extended
Version) [72.38188258853155]
有限トレース(LTLf)上の線形時間論理について検討する。
命題の文字は任意の理論で解釈された一階述語式に置き換えられる。
Satisfiability Modulo Theories (LTLfMT) と呼ばれる結果の論理は半決定可能である。
論文 参考訳(メタデータ) (2022-04-28T17:57:33Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - HFT-ONLSTM: Hierarchical and Fine-Tuning Multi-label Text Classification [7.176984223240199]
階層型マルチラベルテキスト分類(HMTC)は,近縁なカテゴリの大規模集合よりも高精度である。
本稿では,HFT-ONLSTMと略される順序付きニューラルLSTMニューラルネットワークをベースとした階層的・微調整手法を提案し,より正確なレベル・バイ・レベルHMTCを提案する。
論文 参考訳(メタデータ) (2022-04-18T00:57:46Z) - Categorical Representation Learning and RG flow operators for
algorithmic classifiers [0.7519268719195278]
我々は、RG-flow categorifierと呼ばれる新しい自然言語処理アーキテクチャを構築し、RG categorifierを短くして、すべての層でデータ分類と生成を行う。
特に、インフルエンザウイルスの特定のゲノム配列にRG分類法を適用し、我々の技術が与えられたゲノム配列からどのように情報を抽出できるかを示す。
論文 参考訳(メタデータ) (2022-03-15T15:04:51Z) - Comparative Study of Long Document Classification [0.0]
我々は、標準的な機械学習アプローチを用いて、長い文書分類を再考する。
単純なNaive Bayesから6つの標準テキスト分類データセット上の複雑なBERTまで、さまざまなアプローチをベンチマークする。
論文 参考訳(メタデータ) (2021-11-01T04:51:51Z) - Improving Pretrained Models for Zero-shot Multi-label Text
Classification through Reinforced Label Hierarchy Reasoning [18.531022315325583]
ラベル階層の探索は、ゼロショットのマルチラベルテキスト分類問題に取り組むための有望なアプローチとなっている。
トレーニング中の階層内のラベル間の相互依存性を促進するために,RLHR(Reinforced Label Hierarchy Reasoning)アプローチを提案する。
論文 参考訳(メタデータ) (2021-04-04T19:14:09Z) - Train your classifier first: Cascade Neural Networks Training from upper
layers to lower layers [54.47911829539919]
我々は,高品質な分類器を探索するアルゴリズムとして見ることのできる,新しいトップダウン学習手法を開発した。
本研究では,自動音声認識(ASR)タスクと言語モデリングタスクについて検討した。
提案手法は,Wall Street Journal 上でのリカレントニューラルネットワーク ASR モデル,Switchboard 上での自己注意型 ASR モデル,WikiText-2 上での AWD-LSTM 言語モデルなど,一貫して改善されている。
論文 参考訳(メタデータ) (2021-02-09T08:19:49Z) - Revisiting LSTM Networks for Semi-Supervised Text Classification via
Mixed Objective Function [106.69643619725652]
我々は,単純なBiLSTMモデルであっても,クロスエントロピー損失でトレーニングした場合に,競争的な結果が得られるようなトレーニング戦略を開発する。
いくつかのベンチマークデータセット上で,テキスト分類タスクの最先端結果について報告する。
論文 参考訳(メタデータ) (2020-09-08T21:55:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。