論文の概要: Deep Learning for Technical Document Classification
- arxiv url: http://arxiv.org/abs/2106.14269v1
- Date: Sun, 27 Jun 2021 16:12:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 13:48:14.028053
- Title: Deep Learning for Technical Document Classification
- Title(参考訳): 技術文書分類のための深層学習
- Authors: Shuo Jiang, Jianxi Luo, Jie Hu, Christopher L. Magee
- Abstract要約: 本稿では,技術文書分類のためのマルチモーダル深層学習アーキテクチャTechDocについて述べる。
トレーニングされたモデルは、テキストと数字の両方で、数百万の現実世界の技術ドキュメントにスケールできる可能性がある。
- 参考スコア(独自算出の注目度): 6.787004826008753
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In large technology companies, the requirements for managing and organizing
technical documents created by engineers and managers in supporting relevant
decision making have increased dramatically in recent years, which has led to a
higher demand for more scalable, accurate, and automated document
classification. Prior studies have primarily focused on processing text for
classification and small-scale databases. This paper describes a novel
multimodal deep learning architecture, called TechDoc, for technical document
classification, which utilizes both natural language and descriptive images to
train hierarchical classifiers. The architecture synthesizes convolutional
neural networks and recurrent neural networks through an integrated training
process. We applied the architecture to a large multimodal technical document
database and trained the model for classifying documents based on the
hierarchical International Patent Classification system. Our results show that
the trained neural network presents a greater classification accuracy than
those using a single modality and several earlier text classification methods.
The trained model can potentially be scaled to millions of real-world technical
documents with both text and figures, which is useful for data and knowledge
management in large technology companies and organizations.
- Abstract(参考訳): 大企業では、関連する意思決定を支援するためにエンジニアやマネージャが作成した技術文書の管理と管理の要件が近年劇的に増加し、よりスケーラブルで正確で自動化された文書分類の需要が高まっている。
これまでの研究は主に、分類のためのテキストと小規模データベースの処理に重点を置いてきた。
本稿では,自然言語と記述画像の両方を用いて階層的分類を訓練する技術文書分類のための,新しいマルチモーダルディープラーニングアーキテクチャであるtechdocについて述べる。
このアーキテクチャは、統合トレーニングプロセスを通じて畳み込みニューラルネットワークと繰り返しニューラルネットワークを合成する。
我々は、このアーキテクチャを大規模マルチモーダル技術文書データベースに適用し、階層的国際特許分類システムに基づく文書分類モデルを訓練した。
その結果,トレーニングされたニューラルネットワークは,単一のモダリティといくつかの先行するテキスト分類手法を用いたものよりも高い分類精度を示すことがわかった。
トレーニングされたモデルは、テキストと数字の両方を使って、何百万という実世界の技術ドキュメントにスケールできる可能性がある。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - HDT: Hierarchical Document Transformer [70.2271469410557]
HDTは補助的なアンカートークンを導入し、アテンション機構をスパースなマルチレベル階層に再設計することでドキュメント構造を利用する。
文書の階層構造を考慮した新しいスパークアテンションカーネルを開発した。
論文 参考訳(メタデータ) (2024-07-11T09:28:04Z) - Incremental hierarchical text clustering methods: a review [49.32130498861987]
本研究の目的は,階層的および漸進的クラスタリング技術の解析である。
本研究の主な貢献は、文書クラスタリングのテキスト化を目的とした、2010年から2018年にかけて出版された研究で使用されるテクニックの組織化と比較である。
論文 参考訳(メタデータ) (2023-12-12T22:27:29Z) - Data Efficient Training of a U-Net Based Architecture for Structured
Documents Localization [0.0]
構造化文書のローカライズのためのエンコーダデコーダアーキテクチャのような新しいU-NetであるSDL-Netを提案する。
本手法では,SDL-Netのエンコーダを,各種文書クラスのサンプルを含む汎用データセット上で事前学習することができる。
論文 参考訳(メタデータ) (2023-10-02T07:05:19Z) - Text Classification: A Perspective of Deep Learning Methods [0.0679877553227375]
本稿では,テキスト分類作業に必要な重要なステップを含む,深層学習に基づくテキスト分類アルゴリズムを提案する。
論文の最後には、異なる深層学習テキスト分類法を比較し、要約する。
論文 参考訳(メタデータ) (2023-09-24T21:49:51Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - Hierarchical Metadata-Aware Document Categorization under Weak
Supervision [32.80303008934164]
タスクのための埋め込みベースの生成フレームワークであるHiMeCatを開発した。
本稿では,カテゴリ依存の同時モデリングが可能な新しい共同表現学習モジュールを提案する。
トレーニング文書を階層的に合成して,当初の小規模トレーニングセットを補完するデータ拡張モジュールを提案する。
論文 参考訳(メタデータ) (2020-10-26T13:07:56Z) - End to End Binarized Neural Networks for Text Classification [4.046236197219608]
目的分類タスクのためのエンドツーエンドのバイナライズニューラルネットワークアーキテクチャを提案する。
提案したアーキテクチャは、標準的な意図分類データセットにおける最先端の結果に匹敵する。
論文 参考訳(メタデータ) (2020-10-11T11:21:53Z) - Automated Search for Resource-Efficient Branched Multi-Task Networks [81.48051635183916]
我々は,多タスクニューラルネットワークにおける分岐構造を自動的に定義する,微分可能なニューラルネットワーク探索に根ざした原理的アプローチを提案する。
本手法は,限られた資源予算内で高い性能の分岐構造を見いだすことができる。
論文 参考訳(メタデータ) (2020-08-24T09:49:19Z) - Light-Weighted CNN for Text Classification [0.0]
分離可能な畳み込みに基づく新しいアーキテクチャを導入する。
分離可能な畳み込みの概念は、既に画像分類の分野に存在している。
このアーキテクチャの助けを借りて、トレーニング可能なパラメータを大幅に削減できる。
論文 参考訳(メタデータ) (2020-04-16T20:23:52Z) - SPECTER: Document-level Representation Learning using Citation-informed
Transformers [51.048515757909215]
SPECTERは、Transformer言語モデルの事前学習に基づいて、科学文書の文書レベルの埋め込みを生成する。
SciDocsは、引用予測から文書分類、レコメンデーションまでの7つの文書レベルのタスクからなる新しい評価ベンチマークである。
論文 参考訳(メタデータ) (2020-04-15T16:05:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。