論文の概要: End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF: A Reproducibility Study
- arxiv url: http://arxiv.org/abs/2510.10936v1
- Date: Mon, 13 Oct 2025 02:49:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.161575
- Title: End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF: A Reproducibility Study
- Title(参考訳): 双方向LSTM-CNNs-CRFによるエンドツーエンドのシーケンスラベリング:再現性の検討
- Authors: Anirudh Ganesh, Jayavardhan Reddy,
- Abstract要約: 本稿では,Ma と Hovycitemaend が提案するシーケンスラベリングのための最先端のニューラルネットワークアーキテクチャについて述べる。
オリジナルのBiLSTM-CNN-CRFモデルは、畳み込みニューラルネットワーク(CNN)による文字レベルの表現、BiLSTMによる単語レベルのコンテキストモデリング、条件付きランダムフィールド(CRF)を用いた構造化予測を組み合わせる。
提案手法は,CoNLL-2003 NER上で91.18%のF1スコアを達成し,シーケンスラベリングタスクにおけるモデルの有効性を示す。
- 参考スコア(独自算出の注目度): 1.7188280334580195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a reproducibility study of the state-of-the-art neural architecture for sequence labeling proposed by Ma and Hovy (2016)\cite{ma2016end}. The original BiLSTM-CNN-CRF model combines character-level representations via Convolutional Neural Networks (CNNs), word-level context modeling through Bi-directional Long Short-Term Memory networks (BiLSTMs), and structured prediction using Conditional Random Fields (CRFs). This end-to-end approach eliminates the need for hand-crafted features while achieving excellent performance on named entity recognition (NER) and part-of-speech (POS) tagging tasks. Our implementation successfully reproduces the key results, achieving 91.18\% F1-score on CoNLL-2003 NER and demonstrating the model's effectiveness across sequence labeling tasks. We provide a detailed analysis of the architecture components and release an open-source PyTorch implementation to facilitate further research.
- Abstract(参考訳): 本稿では,Ma and Hovy (2016)\cite{ma2016end} が提案したシークエンスラベリングのための最先端のニューラルアーキテクチャの再現性について述べる。
オリジナルのBiLSTM-CNN-CRFモデルは、畳み込みニューラルネットワーク(CNN)による文字レベルの表現、双方向長短期記憶ネットワーク(BiLSTM)による単語レベルのコンテキストモデリング、条件付きランダムフィールド(CRF)を用いた構造化予測を組み合わせたものである。
このエンドツーエンドアプローチは、名前付きエンティティ認識(NER)とPOS(Part-of-speech)タグタスクにおいて優れたパフォーマンスを実現しつつ、手作りの機能を必要としない。
提案手法は,CoNLL-2003 NER上で91.18\%のF1スコアを達成し,シーケンスラベリングタスクにおけるモデルの有効性を示す。
アーキテクチャコンポーネントを詳細に分析し、さらなる研究を容易にするためにオープンソースのPyTorch実装をリリースする。
関連論文リスト
- Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Spintronics for image recognition: performance benchmarking via
ultrafast data-driven simulations [4.2412715094420665]
単一スピントロニクスナノ構造を用いたエコー状態ネットワーク(ESN)による画像分類の実証を行った。
我々は、STVO力学をシミュレートするために、データ駆動型Thiele方程式アプローチと呼ばれる超高速なデータ駆動シミュレーションフレームワークを用いる。
我々は、MNIST、EMNIST-letters、Fashion MNISTデータセットで分類課題を解決するために、この手法をうまく適用することで、ソリューションの汎用性を示す。
論文 参考訳(メタデータ) (2023-08-10T18:09:44Z) - GNN-SL: Sequence Labeling Based on Nearest Examples via GNN [50.55076156520809]
グラフニューラルネットワークシーケンスラベリング(GNN-SL)を導入する。
GNN-SLは、トレーニングセット全体から取得した類似のタグ付け例でバニラシーケンスラベリングモデル出力を増強する。
我々は3つの典型的なシーケンスラベリングタスクについて様々な実験を行う。
GNN-SLはPKUの96.9(+0.2)、CITYUの98.3(+0.4)、MSRの98.5(+0.2)、CWSタスクのASの96.9(+0.2)を達成している。
論文 参考訳(メタデータ) (2022-12-05T04:22:00Z) - Neural Structured Prediction for Inductive Node Classification [29.908759584092167]
本稿では,ラベル付き学習グラフのモデルを学習し,未ラベルの試験グラフ上でノードラベルを推論するために一般化することを目的とした,帰納的環境におけるノード分類について検討する。
本稿では,両者の利点を組み合わせたSPN(Structured Proxy Network)という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-15T15:50:27Z) - Bidirectional LSTM-CRF Attention-based Model for Chinese Word
Segmentation [2.3991565023534087]
中国語単語セグメンテーションのための双方向LSTM-CRFアテンションベースモデルを提案する。
我々のモデルは、他のニューラルネットワークによるベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2021-05-20T11:46:53Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - Introducing the Hidden Neural Markov Chain framework [7.85426761612795]
本稿では,ニューラルモデルの新しいファミリーであるHNMC(Hidden Neural Markov Chain)フレームワークを提案する。
クラシックなHNMC、HNMC2、HNMC-CNの3つのモデルを提案します。
この新しいニューラルネットワークシーケンシャルフレームワークの可能性を示すもので、新しいモデルへの道を開き、最終的には一般的なBiLSTMやBiGRUと競合する可能性がある。
論文 参考訳(メタデータ) (2021-02-17T20:13:45Z) - Regularizing Recurrent Neural Networks via Sequence Mixup [7.036759195546171]
我々は、元々フィードフォワードニューラルネットワークのために提案された一連の有望な正規化手法を拡張した。
提案手法は,単純なニューラルネットワークアーキテクチャの性能を生かしながら,複雑性の実装が容易である。
論文 参考訳(メタデータ) (2020-11-27T05:43:40Z) - An Investigation of Potential Function Designs for Neural CRF [75.79555356970344]
本稿では,ニューラルCRFモデルに対する一連の表現力のあるポテンシャル関数について検討する。
実験により, 隣接する2つのラベルと隣接する2つの単語のベクトル表現に基づく分解された二次ポテンシャル関数が, 常に最高の性能を達成することを示す。
論文 参考訳(メタデータ) (2020-11-11T07:32:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。