論文の概要: TechTexC: Classification of Technical Texts using Convolution and
Bidirectional Long Short Term Memory Network
- arxiv url: http://arxiv.org/abs/2012.11420v1
- Date: Mon, 21 Dec 2020 15:22:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 12:23:28.222686
- Title: TechTexC: Classification of Technical Texts using Convolution and
Bidirectional Long Short Term Memory Network
- Title(参考訳): TechTexC: 畳み込みと双方向長期記憶ネットワークを用いた技術テキストの分類
- Authors: Omar Sharif, Eftekhar Hossain, Mohammed Moshiul Hoque
- Abstract要約: 3つの手法を用いて分類処理を行うための分類システム(TechTexC)を開発した。
その結果,BiLSTMモデルを用いたCNNは,サブタスク (a,b,c,g) とタスク-2aのタスク-1に関する他の手法よりも優れていた。
テストセットの場合、cnnとbilstmの併用により、サブタスク1a (70.76%), 1b (79.97%), 1c (65.45%), 1g (49.23%), 2a (70.14%) の精度が向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper illustrates the details description of technical text
classification system and its results that developed as a part of participation
in the shared task TechDofication 2020. The shared task consists of two
sub-tasks: (i) first task identify the coarse-grained technical domain of given
text in a specified language and (ii) the second task classify a text of
computer science domain into fine-grained sub-domains. A classification system
(called 'TechTexC') is developed to perform the classification task using three
techniques: convolution neural network (CNN), bidirectional long short term
memory (BiLSTM) network, and combined CNN with BiLSTM. Results show that CNN
with BiLSTM model outperforms the other techniques concerning task-1 of
sub-tasks (a, b, c and g) and task-2a. This combined model obtained f1 scores
of 82.63 (sub-task a), 81.95 (sub-task b), 82.39 (sub-task c), 84.37 (sub-task
g), and 67.44 (task-2a) on the development dataset. Moreover, in the case of
test set, the combined CNN with BiLSTM approach achieved that higher accuracy
for the subtasks 1a (70.76%), 1b (79.97%), 1c (65.45%), 1g (49.23%) and 2a
(70.14%).
- Abstract(参考訳): 本稿では,TechDofication 2020への参加の一環として開発された技術テキスト分類システムとその成果について詳述する。
共有タスクは2つのサブタスクから構成される: (i) 第一タスクは指定された言語で与えられたテキストの粗い技術的ドメインを識別し、第二タスクはコンピュータサイエンス領域のテキストをきめ細かなサブドメインに分類する。
畳み込みニューラルネットワーク(CNN)、双方向長短期記憶(BiLSTM)ネットワーク、CNNとBiLSTMの3つの手法を用いて分類タスクを実行するために、分類システム(TechTexC)を開発した。
その結果,BiLSTMモデルを用いたCNNはサブタスク(a,b,c,g)とタスク2aのタスク-1に関する他の手法よりも優れていた。
この組み合わせモデルは、開発データセット上で82.63(サブタスクa)、81.95(サブタスクb)、82.39(サブタスクc)、84.37(サブタスクg)、67.44(タスク2a)のf1スコアを得た。
さらにテストセットの場合、cnnとbilstmの併用により、サブタスク1a (70.76%), 1b (79.97%), 1c (65.45%), 1g (49.23%), 2a (70.14%) の精度が向上した。
関連論文リスト
- SemEval-2024 Task 8: Multidomain, Multimodel and Multilingual Machine-Generated Text Detection [68.858931667807]
Subtask Aは、テキストが人間によって書かれたか、機械によって生成されたかを決定するバイナリ分類タスクである。
サブタスクBは、テキストの正確なソースを検出し、それが人間によって書かれたか、特定のLCMによって生成されたかを認識する。
Subtask Cは、著者が人間から機械へ遷移するテキスト内の変化点を特定することを目的としている。
論文 参考訳(メタデータ) (2024-04-22T13:56:07Z) - Provable Multi-Task Representation Learning by Two-Layer ReLU Neural Networks [69.38572074372392]
本稿では,複数タスクにおける非線形モデルを用いたトレーニング中に特徴学習が発生することを示す最初の結果を示す。
私たちのキーとなる洞察は、マルチタスク事前トレーニングは、通常タスク間で同じラベルを持つポイントを整列する表現を好む擬似コントラスト的損失を誘導するということです。
論文 参考訳(メタデータ) (2023-07-13T16:39:08Z) - Multi-Task Classification of Sewer Pipe Defects and Properties using a
Cross-Task Graph Neural Network Decoder [56.673599764041384]
我々は、新しいデコーダ指向マルチタスク分類アーキテクチャ、クロスタスクグラフニューラルネットワーク(CT-GNN)を提案する。
CT-GNNは、クロスタスク情報を用いてタスクごとの解離予測を洗練する。
我々は,Swer-MLデータセットの4つの分類タスクすべてに対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-11-15T15:36:50Z) - UPB at SemEval-2021 Task 7: Adversarial Multi-Task Learning for
Detecting and Rating Humor and Offense [0.6404122934568858]
本稿では, 敵のマルチタスクネットワークであるAMTL-Humorを用いて, ユーモアや攻撃的テキストの検出と評価を行う。
私達の最もよいモデルはすべてのテストされた構成のアンサンブルから成り、95.66% F1スコアおよびタスク1aのための94.70%の正確さを達成します。
論文 参考訳(メタデータ) (2021-04-13T09:59:05Z) - Environmental sound analysis with mixup based multitask learning and
cross-task fusion [0.12891210250935145]
音響シーン分類と音響イベント分類は 密接に関連している2つの課題です
本書では,上記の課題に対して二段階法を提案する。
提案手法は,音響シーンと音響イベント分類の相補的特徴を確認した。
論文 参考訳(メタデータ) (2021-03-30T05:11:53Z) - YNU-HPCC at SemEval-2020 Task 11: LSTM Network for Detection of
Propaganda Techniques in News Articles [5.352512345142247]
本稿では,SemEval-2020タスク11におけるニュース記事のプロパガンダ検出手法について概説する。
本稿では,GloVe単語表現,BERT事前学習モデル,LSTMモデルアーキテクチャを実装した。
本手法は, テストセットにおいて, SIおよびTCサブタスクのランクが17位, 22位, それぞれ有意に向上した。
論文 参考訳(メタデータ) (2020-08-24T02:42:12Z) - CyberWallE at SemEval-2020 Task 11: An Analysis of Feature Engineering
for Ensemble Models for Propaganda Detection [0.0]
Span Identification subtask ではバイLSTMアーキテクチャを使用し、Technical Classification subtask の複雑なアンサンブルモデルを訓練する。
我々のシステムは、SIサブタスクで35チーム中8チーム、TCサブタスクで31チーム中8チームを達成する。
論文 参考訳(メタデータ) (2020-08-22T15:51:16Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - Boundary-assisted Region Proposal Networks for Nucleus Segmentation [89.69059532088129]
大量の核が混在しているため、機械学習モデルはうまく機能しない。
我々は、堅牢なインスタンスレベルの核分割を実現する境界支援領域提案ネットワーク(BRP-Net)を考案する。
論文 参考訳(メタデータ) (2020-06-04T08:26:38Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。