論文の概要: An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named
Entity Recognition
- arxiv url: http://arxiv.org/abs/2005.07692v2
- Date: Mon, 18 May 2020 05:53:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 04:21:01.468398
- Title: An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named
Entity Recognition
- Title(参考訳): トルコ語名称エンティティ認識における最近のニューラルシーケンスタグモデルの評価
- Authors: Gizem Aras, Didem Makaroglu, Seniz Demir, Altan Cakir
- Abstract要約: 本研究では,条件付きランダムフィールド層を有する変圧器ベースネットワークを提案する。
本研究は,移動学習が形態的に豊かな言語処理に与える影響を定量化する文献に寄与する。
- 参考スコア(独自算出の注目度): 5.161531917413708
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) is an extensively studied task that extracts
and classifies named entities in a text. NER is crucial not only in downstream
language processing applications such as relation extraction and question
answering but also in large scale big data operations such as real-time
analysis of online digital media content. Recent research efforts on Turkish, a
less studied language with morphologically rich nature, have demonstrated the
effectiveness of neural architectures on well-formed texts and yielded
state-of-the art results by formulating the task as a sequence tagging problem.
In this work, we empirically investigate the use of recent neural architectures
(Bidirectional long short-term memory and Transformer-based networks) proposed
for Turkish NER tagging in the same setting. Our results demonstrate that
transformer-based networks which can model long-range context overcome the
limitations of BiLSTM networks where different input features at the character,
subword, and word levels are utilized. We also propose a transformer-based
network with a conditional random field (CRF) layer that leads to the
state-of-the-art result (95.95\% f-measure) on a common dataset. Our study
contributes to the literature that quantifies the impact of transfer learning
on processing morphologically rich languages.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、テキスト中の名前付きエンティティを抽出し分類する広範囲に研究されたタスクである。
nerは、関係抽出や質問応答といった下流言語処理アプリケーションだけでなく、オンラインデジタルメディアコンテンツのリアルタイム解析のような大規模ビッグデータ操作においても重要である。
形態学的に豊かな言語であるトルコ語に関する最近の研究は、十分に整形されたテキストに対するニューラルネットワークの有効性を実証し、そのタスクをシーケンスタギング問題として定式化することによって、最先端のアート結果を得た。
本研究では,トルコのNERタグ付けのために提案されているニューラルアーキテクチャ(双方向長短期メモリとトランスフォーマーベースネットワーク)の使用を,同じ環境で実証的に検討する。
長範囲文脈をモデル化可能なトランスフォーマーベースネットワークは,文字,サブワード,単語レベルの異なる入力機能を利用するBiLSTMネットワークの限界を克服することを示した。
また、コンディショナルランダムフィールド(CRF)層を有するトランスフォーマーベースネットワークを提案し、共通データセット上での最先端結果(95.95\% f-measure)を導出する。
本研究は,移動学習が形態的に豊かな言語処理に与える影響を定量化する文献に寄与する。
関連論文リスト
- A Sentiment Analysis of Medical Text Based on Deep Learning [1.8130068086063336]
本稿では,変換器(BERT)の双方向エンコーダ表現を基礎的事前学習モデルとして用いた医療領域に焦点を当てた。
METS-CoVデータセットを用いて実験と解析を行い、異なるディープラーニングネットワークの統合後のトレーニング性能について検討した。
CNNモデルは、BERTのような事前訓練されたモデルと組み合わせて、小さな医療用テキストデータセットでトレーニングされた場合、他のネットワークよりも優れています。
論文 参考訳(メタデータ) (2024-04-16T12:20:49Z) - Convolutional Neural Networks for Sentiment Analysis on Weibo Data: A
Natural Language Processing Approach [0.228438857884398]
本研究では,Weiboの119,988ツイートのデータセット上で,畳み込みニューラルネットワーク(CNN)を用いた感情分析の複雑な課題に対処する。
CNNに基づくモデルを用いて,特徴抽出に単語埋め込みを活用し,感情分類を行う訓練を行った。
このモデルは、テストセットで平均約0.73のマクロ平均F1スコアを達成し、正、中、負の感情でバランスの取れた性能を示した。
論文 参考訳(メタデータ) (2023-07-13T03:02:56Z) - A Comprehensive Survey on Applications of Transformers for Deep Learning
Tasks [60.38369406877899]
Transformerは、シーケンシャルデータ内のコンテキスト関係を理解するために自己認識メカニズムを使用するディープニューラルネットワークである。
Transformerモデルは、入力シーケンス要素間の長い依存関係を処理し、並列処理を可能にする。
我々の調査では、トランスフォーマーベースのモデルのためのトップ5のアプリケーションドメインを特定します。
論文 参考訳(メタデータ) (2023-06-11T23:13:51Z) - Initial Study into Application of Feature Density and
Linguistically-backed Embedding to Improve Machine Learning-based
Cyberbullying Detection [54.83707803301847]
この研究は、自動サイバーバブル検出に関するKaggleコンペティションで提供されたFormspringデータセットで実施された。
本研究は,サイバブリング検出におけるニューラルネットワークの有効性と分類器性能と特徴密度の相関性を確認した。
論文 参考訳(メタデータ) (2022-06-04T03:17:15Z) - A Comparative Study of Transformers on Word Sense Disambiguation [0.0]
本稿では,ニューラルネットワークを用いた埋め込みシステムの文脈化能力について比較検討する。
本稿では,2つのWord Sense Disambiguation (WSD)タスクであるSensEval-2とSensEval-3を用いて,その文脈化能力を評価する。
実験の結果,提案手法は両WSDタスクにおける現状よりも優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-11-30T14:10:22Z) - Improving Classifier Training Efficiency for Automatic Cyberbullying
Detection with Feature Density [58.64907136562178]
言語支援の異なる特徴前処理手法を用いて特徴密度(FD)の有効性を検討した。
データセットの複雑さを推定することで、必要な実験の数を削減できると仮定する。
データセットの言語的複雑さの違いにより、言語的に支援された単語前処理の有効性を議論することが可能になる。
論文 参考訳(メタデータ) (2021-11-02T15:48:28Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - A Novel Deep Learning Method for Textual Sentiment Analysis [3.0711362702464675]
本稿では,階層的注意層を統合した畳み込みニューラルネットワークを提案する。
提案モデルでは,分類精度が高く,情報的単語を抽出できる。
インクリメンタル転送学習を適用すると、分類性能が大幅に向上します。
論文 参考訳(メタデータ) (2021-02-23T12:11:36Z) - On Long-Tailed Phenomena in Neural Machine Translation [50.65273145888896]
最先端のニューラルネットワーク翻訳(NMT)モデルは、低周波トークンの生成に苦労する。
条件付きテキスト生成における構造的依存関係にモデルトレーニングを適応させるために,新たな損失関数である反焦点損失を提案する。
提案手法は,複数の機械翻訳(MT)データセットに対して有効であり,クロスエントロピーよりも顕著に向上することを示す。
論文 参考訳(メタデータ) (2020-10-10T07:00:57Z) - Probing Linguistic Features of Sentence-Level Representations in Neural
Relation Extraction [80.38130122127882]
ニューラルリレーション抽出(RE)に関連する言語特性を対象とした14の探索タスクを導入する。
私たちは、40以上の異なるエンコーダアーキテクチャと2つのデータセットでトレーニングされた言語的特徴の組み合わせによって学習された表現を研究するためにそれらを使用します。
アーキテクチャによって引き起こされるバイアスと言語的特徴の含意は、探索タスクのパフォーマンスにおいて明らかに表現されている。
論文 参考訳(メタデータ) (2020-04-17T09:17:40Z) - TNT-KID: Transformer-based Neural Tagger for Keyword Identification [7.91883337742071]
本稿では,キーワード識別のための Transformer-based Neural Tagger (TNT-KID) というキーワード識別アルゴリズムを提案する。
特定のタスクにトランスフォーマーアーキテクチャを適用し、ドメイン固有のコーパスで事前学習する言語モデルを活用することにより、キーワード抽出に対する教師なしと教師なしの両方のアプローチの欠陥を克服することができる。
論文 参考訳(メタデータ) (2020-03-20T09:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。