論文の概要: Evolving Character-level Convolutional Neural Networks for Text
Classification
- arxiv url: http://arxiv.org/abs/2012.02223v1
- Date: Thu, 3 Dec 2020 19:27:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 15:06:22.499480
- Title: Evolving Character-level Convolutional Neural Networks for Text
Classification
- Title(参考訳): テキスト分類のためのキャラクタレベル畳み込みニューラルネットワークの進化
- Authors: Trevor Londt, Xiaoying Gao, Bing Xue, Peter Andreae
- Abstract要約: 文字レベルの畳み込みニューラルネットワーク(char-CNN)は、それらが分類する言語のセマンティック構造や構文構造に関する知識を必要としない。
テキスト分類作業に最適なChar-CNNアーキテクチャは確立されていない。
本稿では、遺伝的プログラミングに基づく新しいEDLアルゴリズムを用いて、シャル・CNNアーキテクチャの進化における最初の成果を示す。
- 参考スコア(独自算出の注目度): 2.996556029831847
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Character-level convolutional neural networks (char-CNN) require no knowledge
of the semantic or syntactic structure of the language they classify. This
property simplifies its implementation but reduces its classification accuracy.
Increasing the depth of char-CNN architectures does not result in breakthrough
accuracy improvements. Research has not established which char-CNN
architectures are optimal for text classification tasks. Manually designing and
training char-CNNs is an iterative and time-consuming process that requires
expert domain knowledge. Evolutionary deep learning (EDL) techniques, including
surrogate-based versions, have demonstrated success in automatically searching
for performant CNN architectures for image analysis tasks. Researchers have not
applied EDL techniques to search the architecture space of char-CNNs for text
classification tasks. This article demonstrates the first work in evolving
char-CNN architectures using a novel EDL algorithm based on genetic
programming, an indirect encoding and surrogate models, to search for
performant char-CNN architectures automatically. The algorithm is evaluated on
eight text classification datasets and benchmarked against five manually
designed CNN architecture and one long short-term memory (LSTM) architecture.
Experiment results indicate that the algorithm can evolve architectures that
outperform the LSTM in terms of classification accuracy and five of the
manually designed CNN architectures in terms of classification accuracy and
parameter count.
- Abstract(参考訳): 文字レベルの畳み込みニューラルネットワーク(char-CNN)は、それらが分類する言語のセマンティック構造や構文構造に関する知識を必要としない。
この特性は実装を単純化するが、分類精度は低下する。
char-cnnアーキテクチャの深さを増加しても、ブレークスルー精度は向上しない。
テキスト分類作業に最適なChar-CNNアーキテクチャは確立されていない。
char-cnnの手動設計とトレーニングは、専門家のドメイン知識を必要とする反復的かつ時間のかかるプロセスである。
シュロゲートベースのバージョンを含む進化的ディープラーニング(EDL)技術は、画像解析タスクの高性能CNNアーキテクチャの自動検索に成功している。
研究者は、テキスト分類タスクのためにchar-CNNのアーキテクチャ空間を探索するためにEDL技術を適用していない。
本稿では,遺伝子プログラミングに基づく新しいEDLアルゴリズム,間接符号化モデル,サロゲートモデルを用いたシャル・CNNアーキテクチャの進化における最初の成果を紹介する。
このアルゴリズムは8つのテキスト分類データセットで評価され、5つの手動設計のCNNアーキテクチャと1つの長期記憶(LSTM)アーキテクチャに対してベンチマークされる。
実験結果から,LSTMを分類精度で上回るアーキテクチャと,分類精度とパラメータ数で手作業で設計したCNNアーキテクチャの5つを改良できることが示された。
関連論文リスト
- XC-NAS: A New Cellular Encoding Approach for Neural Architecture Search
of Multi-path Convolutional Neural Networks [0.4915744683251149]
本稿では,画像とテキストの分類タスクにおいて,深さ,幅,複雑さの異なる新しいマルチパスCNNアーキテクチャを進化させるアルゴリズムを提案する。
代用モデルアプローチを用いることで、1日以内のGPUで高性能CNNアーキテクチャを進化させることができることを示す。
実験の結果,アルゴリズムは競争力が高く,いくつかの最先端手法を破り,画像領域とテキスト領域の両方に一般化可能であることがわかった。
論文 参考訳(メタデータ) (2023-12-12T22:03:11Z) - SA-CNN: Application to text categorization issues using simulated
annealing-based convolutional neural network optimization [0.0]
畳み込みニューラルネットワーク(CNN)は、ディープラーニングアルゴリズムの代表クラスである。
テキストCNNニューラルネットワークに基づくテキスト分類タスクのためのSA-CNNニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-13T14:27:34Z) - FlowNAS: Neural Architecture Search for Optical Flow Estimation [65.44079917247369]
本研究では,フロー推定タスクにおいて,より優れたエンコーダアーキテクチャを自動で見つけるために,FlowNASというニューラルアーキテクチャ探索手法を提案する。
実験の結果、スーパーネットワークから受け継いだ重み付きアーキテクチャは、KITTI上で4.67%のF1-allエラーを達成していることがわかった。
論文 参考訳(メタデータ) (2022-07-04T09:05:25Z) - Towards a General Purpose CNN for Long Range Dependencies in
$\mathrm{N}$D [49.57261544331683]
構造変化のない任意の解像度,次元,長さのタスクに対して,連続的な畳み込みカーネルを備えた単一CNNアーキテクチャを提案する。
1$mathrmD$)とビジュアルデータ(2$mathrmD$)の幅広いタスクに同じCCNNを適用することで、我々のアプローチの汎用性を示す。
私たちのCCNNは競争力があり、検討されたすべてのタスクで現在の最先端を上回ります。
論文 参考訳(メタデータ) (2022-06-07T15:48:02Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - Learning Interpretable Models Through Multi-Objective Neural
Architecture Search [0.9990687944474739]
本稿では,タスク性能と「イントロスペクタビリティ」の両方を最適化するフレームワークを提案する。
タスクエラーとイントロスペクタビリティを共同で最適化することは、エラー内で実行されるより不整合でデバッグ可能なアーキテクチャをもたらすことを実証する。
論文 参考訳(メタデータ) (2021-12-16T05:50:55Z) - A Novel Sleep Stage Classification Using CNN Generated by an Efficient
Neural Architecture Search with a New Data Processing Trick [4.365107026636095]
本稿では,畳み込みニューラルネットワーク(CNN)を用いた新しいデータ処理手法を用いて,効率的な5ステップの分類手法を提案する。
我々は、遺伝的アルゴリズム(GA)NASGを最大限に活用して、最高のCNNアーキテクチャを探索する。
我々は,データ処理トリックの収束性を検証するとともに,従来のCNNの性能をそのトリックの前後で比較する。
論文 参考訳(メタデータ) (2021-10-27T10:36:52Z) - Learning Structures for Deep Neural Networks [99.8331363309895]
我々は,情報理論に根ざし,計算神経科学に発達した効率的な符号化原理を採用することを提案する。
スパース符号化は出力信号のエントロピーを効果的に最大化できることを示す。
公開画像分類データセットを用いた実験により,提案アルゴリズムでスクラッチから学習した構造を用いて,最も優れた専門家設計構造に匹敵する分類精度が得られることを示した。
論文 参考訳(メタデータ) (2021-05-27T12:27:24Z) - Evolving Character-Level DenseNet Architectures using Genetic
Programming [1.5469452301122177]
DenseNetアーキテクチャがテキスト分類タスクに最適であるかは不明だ。
進化的ディープラーニングは、画像分類領域のためのCNNアーキテクチャを自動設計するために使われてきた。
本研究は, テキスト分類タスクにおいて, EDL を用いて char-DenseNet アーキテクチャを進化させる最初の試みを示す。
論文 参考訳(メタデータ) (2020-12-03T23:28:56Z) - Neural Architecture Search For LF-MMI Trained Time Delay Neural Networks [61.76338096980383]
TDNN(State-of-the-the-art Factored Time delay Neural Network)の2種類のハイパーパラメータを自動的に学習するために、さまざまなニューラルネットワークサーチ(NAS)技術が使用されている。
DARTSメソッドはアーキテクチャ選択とLF-MMI(格子のないMMI)TDNNトレーニングを統合する。
300時間のSwitchboardコーパスで行われた実験では、自動構成システムはベースラインLF-MMI TDNNシステムより一貫して優れていることが示唆された。
論文 参考訳(メタデータ) (2020-07-17T08:32:11Z) - A Semi-Supervised Assessor of Neural Architectures [157.76189339451565]
我々は、ニューラルネットワークの有意義な表現を見つけるためにオートエンコーダを用いる。
アーキテクチャの性能を予測するために、グラフ畳み込みニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-05-14T09:02:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。