論文の概要: Research on multi-dimensional end-to-end phrase recognition algorithm
based on background knowledge
- arxiv url: http://arxiv.org/abs/2007.03860v1
- Date: Wed, 8 Jul 2020 02:30:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 13:06:47.308296
- Title: Research on multi-dimensional end-to-end phrase recognition algorithm
based on background knowledge
- Title(参考訳): 背景知識に基づく多次元語句認識アルゴリズムに関する研究
- Authors: Zheng Li, Gang Tu, Guang Liu, Zhi-Qiang Zhan, Yi-Jian Liu
- Abstract要約: CPWDデータセットの実験では、背景知識を導入することにより、エンドツーエンドの手法の精度を1ポイント以上向上する。
この手法はCCL 2018の競技に応用され、中国のユーモア型認識において第一位を獲得した。
- 参考スコア(独自算出の注目度): 4.020059842004492
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: At present, the deep end-to-end method based on supervised learning is used
in entity recognition and dependency analysis. There are two problems in this
method: firstly, background knowledge cannot be introduced; secondly, multi
granularity and nested features of natural language cannot be recognized. In
order to solve these problems, the annotation rules based on phrase window are
proposed, and the corresponding multi-dimensional end-to-end phrase recognition
algorithm is designed. This annotation rule divides sentences into seven types
of nested phrases, and indicates the dependency between phrases. The algorithm
can not only introduce background knowledge, recognize all kinds of nested
phrases in sentences, but also recognize the dependency between phrases. The
experimental results show that the annotation rule is easy to use and has no
ambiguity; the matching algorithm is more consistent with the multi granularity
and diversity characteristics of syntax than the traditional end-to-end
algorithm. The experiment on CPWD dataset, by introducing background knowledge,
the new algorithm improves the accuracy of the end-to-end method by more than
one point. The corresponding method was applied to the CCL 2018 competition and
won the first place in the task of Chinese humor type recognition.
- Abstract(参考訳): 現在、教師付き学習に基づくエンド・ツー・エンドの深層手法は、エンティティ認識と依存性分析に使われている。
この手法には2つの問題がある: 第一に、背景知識は導入できない;第二に、自然言語の多粒度とネスト特徴は認識できない。
これらの問題を解決するために、フレーズウィンドウに基づくアノテーションルールを提案し、それに対応する多次元の語句認識アルゴリズムを設計する。
このアノテーション規則は、文を7種類のネスト句に分割し、句間の依存関係を示す。
このアルゴリズムは、背景知識を導入するだけでなく、文中のあらゆる種類のネスト句を認識するだけでなく、句間の依存関係を認識する。
実験の結果, アノテーションルールは使い易く, あいまいさがないことがわかった。マッチングアルゴリズムは, 従来のエンドツーエンドアルゴリズムよりも, 文法の多粒度や多様性特性に一貫性がある。
CPWDデータセットの実験では、背景知識を導入することにより、エンドツーエンドの手法の精度を1ポイント以上向上する。
この手法はCCL 2018の競技に応用され、中国のユーモア型認識において第一位を獲得した。
関連論文リスト
- Greed is All You Need: An Evaluation of Tokenizer Inference Methods [4.300681074103876]
4つの異なるアルゴリズムと3つの語彙サイズにまたがる7つのトークン化手法の制御解析を行う。
我々は,最もよく使われているトークン化剤に対して,グリーディ推論が驚くほどよく機能し,最近導入された文脈的にインフォームドされたトークン化剤であるSaGeが,形態的アライメントにおいて他の全てより優れていることを示す。
論文 参考訳(メタデータ) (2024-03-02T19:01:40Z) - RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - DEIM: An effective deep encoding and interaction model for sentence
matching [0.0]
本稿では,ディープエンコーディングとインタラクションに基づく文マッチング手法を提案する。
エンコーダ層では、1つの文を符号化する過程で他の文の情報を参照し、その後、アルゴリズムを用いて情報を融合する。
インタラクション層では、双方向の注意機構と自己注意機構を用いて深い意味情報を得る。
論文 参考訳(メタデータ) (2022-03-20T07:59:42Z) - Improving End-to-End Contextual Speech Recognition with Fine-grained
Contextual Knowledge Selection [21.116123328330467]
本研究は,微粒な文脈知識選択(FineCoS)による混乱問題の緩和に焦点をあてる。
まず,句候補の範囲を狭めるために句選択を適用し,選択した句候補のトークンにトークンの注意を向ける。
我々は、より焦点を絞ったフレーズレベルの文脈表現を得るために、最も関連性の高いフレーズの注意重みを再正規化する。
論文 参考訳(メタデータ) (2022-01-30T13:08:16Z) - Extracting Grammars from a Neural Network Parser for Anomaly Detection
in Unknown Formats [79.6676793507792]
強化学習は、ある未知のフォーマットで文を解析するために、人工知能を訓練する技術として、最近約束されている。
本稿では、ニューラルネットワークから生成規則を抽出し、これらの規則を用いて、ある文が名目か異常かを決定する手順を提案する。
論文 参考訳(メタデータ) (2021-07-30T23:10:24Z) - A Novel Word Sense Disambiguation Approach Using WordNet Knowledge Graph [0.0]
本稿では,SCSMM (Sequential Contextual Likeity Matrix multiplication) という知識に基づく単語感覚解読アルゴリズムを提案する。
SCSMMアルゴリズムは、セマンティックな類似性、知識、文書コンテキストを組み合わせて、それぞれローカルコンテキストのメリットを利用する。
提案されたアルゴリズムは、金の標準データセットの名詞を曖昧にするときに他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2021-01-08T06:47:32Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Tighter Generalization Bounds for Iterative Differentially Private
Learning Algorithms [95.73230376153872]
本稿では,反復学習アルゴリズムにおける一般化とプライバシ保護の関係を2つのステップで検討する。
我々は、$(varepsilon, delta)$-differential privacyは、マルチデータベース学習アルゴリズムに縛られる平均的な一般化を意味することを証明している。
次に,ほとんどの学習アルゴリズムが共有する反復的な性質が,プライバシーの保護とさらなる一般化にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2020-07-18T09:12:03Z) - Research on Annotation Rules and Recognition Algorithm Based on Phrase
Window [4.334276223622026]
フレーズウィンドウに基づくラベリングルールを提案し,それに対応するフレーズ認識アルゴリズムを設計する。
ラベル付けルールでは、フレーズを最小単位とし、文を7種類のネスト可能なフレーズタイプに分割し、フレーズ間の文法的依存関係を示す。
対応するアルゴリズムは、画像中の対象領域を識別するアイデアに基づいて、文中の様々なフレーズの開始位置と終了位置を見つけることができる。
論文 参考訳(メタデータ) (2020-07-07T00:19:47Z) - Learning Coupled Policies for Simultaneous Machine Translation using
Imitation Learning [85.70547744787]
本稿では,プログラマ-解釈ポリシーを併用した同時翻訳モデルを効率よく学習する手法を提案する。
6つの言語対の実験により,翻訳品質の点で,本手法は高いベースラインを達成できた。
論文 参考訳(メタデータ) (2020-02-11T10:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。