論文の概要: BTPK-based learning: An Interpretable Method for Named Entity
Recognition
- arxiv url: http://arxiv.org/abs/2201.09523v1
- Date: Mon, 24 Jan 2022 08:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 02:53:11.481180
- Title: BTPK-based learning: An Interpretable Method for Named Entity
Recognition
- Title(参考訳): BTPKに基づく学習: 名前付きエンティティ認識のための解釈可能な方法
- Authors: Yulin Chen, Zelai Yao, Haixiao Chi, Dov Gabbay, Bo Yuan, Bruno Bentzen
and Beishui Liao
- Abstract要約: 本稿では,新しい二分木モデル (BTPK) を提案し,それを2つの広く使用されているBi-RNNに適用し,BTPKに基づく解釈可能なモデルを得る。
3つの公開データセットによる実験結果から,BTPKに基づく学習は,自己注意を伴う2つの古典的Bi-RNNよりも優れていた。
- 参考スコア(独自算出の注目度): 9.041439626402752
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity recognition (NER) is an essential task in natural language
processing, but the internal mechanism of most NER models is a black box for
users. In some high-stake decision-making areas, improving the interpretability
of an NER method is crucial but challenging. In this paper, based on the
existing Deterministic Talmudic Public announcement logic (TPK) model, we
propose a novel binary tree model (called BTPK) and apply it to two widely used
Bi-RNNs to obtain BTPK-based interpretable ones. Then, we design a
counterfactual verification module to verify the BTPK-based learning method.
Experimental results on three public datasets show that the BTPK-based learning
outperform two classical Bi-RNNs with self-attention, especially on small,
simple data and relatively large, complex data. Moreover, the counterfactual
verification demonstrates that the explanations provided by the BTPK-based
learning method are reasonable and accurate in NER tasks. Besides, the logical
reasoning based on BTPK shows how Bi-RNNs handle NER tasks, with different
distance of public announcements on long and complex sequences.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は自然言語処理において不可欠なタスクであるが、ほとんどのNERモデルの内部メカニズムはユーザにとってブラックボックスである。
高い意思決定領域では、NER法の解釈可能性を向上させることが重要であるが、難しい。
本稿では,既存の決定論的タルムード公告論理(TPK)モデルに基づいて,新しい二分木モデル(BTPK)を提案し,BTPKに基づく解釈可能な2つのBi-RNNに適用する。
次に,btpkベースの学習方法を検証するために,偽検証モジュールを設計する。
3つの公開データセットによる実験結果から、BTPKベースの学習は、2つの古典的Bi-RNN(特に小型で単純なデータと比較的大規模な複雑なデータ)よりも優れていた。
さらに,BTPKに基づく学習手法による説明は,NERタスクにおいて合理的かつ正確であることを示す。
さらに、BTPKに基づく論理的推論は、Bi-RNNがNERタスクをどのように扱うかを示している。
関連論文リスト
- On Significance of Subword tokenization for Low Resource and Efficient
Named Entity Recognition: A case study in Marathi [1.6383036433216434]
低リソース言語のためのNERに焦点をあて、インド語Marathiの文脈におけるケーススタディを示す。
BERTベースのサブワードトークン化器をバニラCNN/LSTMモデルに統合することで,効率的なNERのためのハイブリッド手法を提案する。
従来の単語ベースのトークン化器をBERTトークン化器に置き換えるという単純なアプローチは,バニラ単層モデルの精度をBERTのような深層事前学習モデルの精度に近づけることを示す。
論文 参考訳(メタデータ) (2023-12-03T06:53:53Z) - Injecting linguistic knowledge into BERT for Dialogue State Tracking [60.42231674887294]
本稿では,教師なしの枠組みを用いて言語知識を抽出する手法を提案する。
次に、この知識を用いて、対話状態追跡(DST)タスクにおけるBERTの性能と解釈可能性を高める。
このフレームワークを様々なDSTタスクでベンチマークし、精度の顕著な改善を観察する。
論文 参考訳(メタデータ) (2023-11-27T08:38:42Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - MANER: Mask Augmented Named Entity Recognition for Extreme Low-Resource
Languages [27.812329651072343]
低リソース言語に対する Mask Augmented Named Entity Recognition (MANER) を提案する。
具体的には、名前付きエンティティタグを予測したい文中のすべての単語にマスク>トークンをプリペイドする。
実験によると、100のトレーニング例が少ない100の言語では、最先端のメソッドを最大48%改善し、F1スコアで平均12%改善している。
論文 参考訳(メタデータ) (2022-12-19T18:49:50Z) - Nested Named Entity Recognition as Holistic Structure Parsing [92.8397338250383]
本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2022-04-17T12:48:20Z) - DAMO-NLP at SemEval-2022 Task 11: A Knowledge-based System for
Multilingual Named Entity Recognition [94.1865071914727]
MultiCoNERは、複数の言語に対する短文と低文設定で意味的に曖昧な名前のエンティティを検出することを目的としている。
我々のチームDAMO-NLPは知識に基づくシステムを提案し、ウィキペディアに基づく多言語知識ベースを構築する。
入力文が与えられた場合,本システムは知識ベースから関連コンテキストを効果的に検索する。
我々のシステムはMultiCoNER共有タスクで13トラック中10トラックを獲得した。
論文 参考訳(メタデータ) (2022-03-01T15:29:35Z) - DEXTER: Deep Encoding of External Knowledge for Named Entity Recognition
in Virtual Assistants [10.500933545429202]
NERが重要なコンポーネントであるインテリジェント音声アシスタントでは、ユーザや音声認識エラーのため、NERへの入力がうるさい場合がある。
これらの問題に対処するためのNERシステムについて述べる。
本手法は, セマンティック解析などの関連タスクを改善し, エラー率を最大5%向上することを示す。
論文 参考訳(メタデータ) (2021-08-15T00:14:47Z) - Distributed Word Representation in Tsetlin Machine [14.62945824459286]
Tsetlin Machine (TM) は命題論理に基づく解釈可能なパターン認識アルゴリズムである。
tmに事前学習した単語表現を用いる新しい手法を提案する。
このアプローチはTM性能を大幅に向上させ、同時に解釈性を維持します。
論文 参考訳(メタデータ) (2021-04-14T14:48:41Z) - Question Answering over Knowledge Bases by Leveraging Semantic Parsing
and Neuro-Symbolic Reasoning [73.00049753292316]
本稿では,意味解析と推論に基づくニューロシンボリック質問回答システムを提案する。
NSQAはQALD-9とLC-QuAD 1.0で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-12-03T05:17:55Z) - Domain-Transferable Method for Named Entity Recognition Task [0.6040938686276304]
本稿では、任意の名前付きエンティティの集合に対して、ドメイン固有のNERモデルを学習する方法について述べる。
我々は、人間の努力なしに監督が得られ、ニューラルモデルが互いに学習できると仮定する。
論文 参考訳(メタデータ) (2020-11-24T15:45:52Z) - Interpretability Analysis for Named Entity Recognition to Understand
System Predictions and How They Can Improve [49.878051587667244]
名前付きエンティティ認識のためのLSTM-CRFアーキテクチャの性能について検討する。
文脈表現はシステムの性能に寄与するが、ハイパフォーマンスを駆動する主な要因は、名前トークン自体を学習することにある。
我々は、コンテキストのみからエンティティタイプを推測する可能性を評価するために、人間アノテーションを登録し、コンテキストのみのシステムによるエラーの大部分に対してエンティティタイプを推論することはできないが、改善の余地はいくつかある。
論文 参考訳(メタデータ) (2020-04-09T14:37:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。