論文の概要: Research on Annotation Rules and Recognition Algorithm Based on Phrase
Window
- arxiv url: http://arxiv.org/abs/2007.03140v1
- Date: Tue, 7 Jul 2020 00:19:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 19:42:32.064541
- Title: Research on Annotation Rules and Recognition Algorithm Based on Phrase
Window
- Title(参考訳): フレーズウィンドウに基づくアノテーション規則と認識アルゴリズムに関する研究
- Authors: Guang Liu, Gang Tu, Zheng Li, Yi-Jian Liu
- Abstract要約: フレーズウィンドウに基づくラベリングルールを提案し,それに対応するフレーズ認識アルゴリズムを設計する。
ラベル付けルールでは、フレーズを最小単位とし、文を7種類のネスト可能なフレーズタイプに分割し、フレーズ間の文法的依存関係を示す。
対応するアルゴリズムは、画像中の対象領域を識別するアイデアに基づいて、文中の様々なフレーズの開始位置と終了位置を見つけることができる。
- 参考スコア(独自算出の注目度): 4.334276223622026
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: At present, most Natural Language Processing technology is based on the
results of Word Segmentation for Dependency Parsing, which mainly uses an
end-to-end method based on supervised learning. There are two main problems
with this method: firstly, the la-beling rules are complex and the data is too
difficult to label, the workload of which is large; secondly, the algorithm
cannot recognize the multi-granularity and diversity of language components. In
order to solve these two problems, we propose labeling rules based on phrase
windows, and designed corresponding phrase recognition algorithms. The labeling
rule uses phrases as the minimum unit, di-vides sentences into 7 types of
nestable phrase types, and marks the grammatical dependencies between phrases.
The corresponding algorithm, drawing on the idea of identifying the target area
in the image field, can find the start and end positions of various phrases in
the sentence, and realize the synchronous recognition of nested phrases and
grammatical dependencies. The results of the experiment shows that the labeling
rule is convenient and easy to use, and there is no ambiguity; the algorithm is
more grammatically multi-granular and diverse than the end-to-end algorithm.
Experiments on the CPWD dataset improve the accuracy of the end-to-end method
by about 1 point. The corresponding method was applied to the CCL2018
competition, and the first place in the Chinese Metaphor Sentiment Analysis
Task.
- Abstract(参考訳): 現在、ほとんどの自然言語処理技術は、主に教師付き学習に基づくエンドツーエンドの手法であるWord Segmentation for Dependency Parsingの結果に基づいている。
この手法には2つの大きな問題がある: まず、ラベリング規則は複雑で、ラベル付けが困難であり、その作業負荷が大きい; 第二に、アルゴリズムは言語成分の多粒度と多様性を認識することができない。
これら2つの問題を解決するために,フレーズウィンドウに基づくラベル規則を提案し,対応するフレーズ認識アルゴリズムを設計した。
ラベル付けルールでは、フレーズを最小単位とし、文を7種類のネスト可能なフレーズタイプに分割し、フレーズ間の文法的依存関係を示す。
対応するアルゴリズムは、画像フィールド内の対象領域を識別するアイデアに基づいて、文中の様々な句の開始位置と終了位置を見つけ出し、ネストされた句と文法的依存関係の同期認識を実現する。
実験の結果、ラベリングルールは便利で使いやすく、曖昧さはなく、アルゴリズムは文法的に多粒質であり、エンドツーエンドのアルゴリズムよりも多様であることがわかった。
CPWDデータセットの実験により、エンドツーエンド法の精度が約1ポイント向上した。
対応する手法はCCL2018コンペティションに適用され、中国のメタファー知覚分析タスクでは第1位となった。
関連論文リスト
- RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Multi-Instance Partial-Label Learning: Towards Exploiting Dual Inexact
Supervision [53.530957567507365]
実世界のタスクでは、各トレーニングサンプルは、1つの基底真実ラベルといくつかの偽陽性ラベルを含む候補ラベルセットに関連付けられている。
本稿では,Multi-instance partial-label learning (MIPL) などの問題を定式化する。
既存のマルチインスタンス学習アルゴリズムと部分ラベル学習アルゴリズムはMIPL問題の解法に最適である。
論文 参考訳(メタデータ) (2022-12-18T03:28:51Z) - DEIM: An effective deep encoding and interaction model for sentence
matching [0.0]
本稿では,ディープエンコーディングとインタラクションに基づく文マッチング手法を提案する。
エンコーダ層では、1つの文を符号化する過程で他の文の情報を参照し、その後、アルゴリズムを用いて情報を融合する。
インタラクション層では、双方向の注意機構と自己注意機構を用いて深い意味情報を得る。
論文 参考訳(メタデータ) (2022-03-20T07:59:42Z) - Automatic Vocabulary and Graph Verification for Accurate Loop Closure
Detection [21.862978912891677]
Bag-of-Words (BoW)は、機能と関連付け、ループを検出する視覚語彙を構築する。
本稿では,ノードの半径と特徴記述子のドリフトを比較することで,自然な収束基準を提案する。
本稿では,候補ループの検証のための新しいトポロジカルグラフ検証手法を提案する。
論文 参考訳(メタデータ) (2021-07-30T13:19:33Z) - Extractive approach for text summarisation using graphs [0.0]
本稿では,抽出手法を用いてテキスト要約問題の解法に用いるグラフ関連アルゴリズムについて検討する。
文章の重なり合いと、文章の類似度を測定するための編集距離の2つの指標を考察する。
論文 参考訳(メタデータ) (2021-06-21T10:03:34Z) - Match-Ignition: Plugging PageRank into Transformer for Long-form Text
Matching [66.71886789848472]
実効性と効率性に対処する新しい階層型ノイズフィルタリングモデルであるMatch-Ignitionを提案する。
基本的なアイデアは、よく知られたPageRankアルゴリズムをTransformerに接続し、文と単語レベルの騒々しい情報を識別およびフィルタリングすることです。
文が長文の基本単位であるため、ノイズの多い文はたいてい簡単に検出できるので、PageRankを直接使用してそのような情報をフィルタリングする。
論文 参考訳(メタデータ) (2021-01-16T10:34:03Z) - A Novel Word Sense Disambiguation Approach Using WordNet Knowledge Graph [0.0]
本稿では,SCSMM (Sequential Contextual Likeity Matrix multiplication) という知識に基づく単語感覚解読アルゴリズムを提案する。
SCSMMアルゴリズムは、セマンティックな類似性、知識、文書コンテキストを組み合わせて、それぞれローカルコンテキストのメリットを利用する。
提案されたアルゴリズムは、金の標準データセットの名詞を曖昧にするときに他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2021-01-08T06:47:32Z) - Accelerating Text Mining Using Domain-Specific Stop Word Lists [57.76576681191192]
本稿では,超平面的アプローチと呼ばれるドメイン固有語の自動抽出手法を提案する。
ハイパープレーンベースのアプローチは、無関係な特徴を排除することによって、テキストの寸法を著しく削減することができる。
その結果,超平面型アプローチはコーパスの寸法を90%削減し,相互情報より優れることがわかった。
論文 参考訳(メタデータ) (2020-11-18T17:42:32Z) - Research on multi-dimensional end-to-end phrase recognition algorithm
based on background knowledge [4.020059842004492]
CPWDデータセットの実験では、背景知識を導入することにより、エンドツーエンドの手法の精度を1ポイント以上向上する。
この手法はCCL 2018の競技に応用され、中国のユーモア型認識において第一位を獲得した。
論文 参考訳(メタデータ) (2020-07-08T02:30:00Z) - TextScanner: Reading Characters in Order for Robust Scene Text
Recognition [60.04267660533966]
TextScannerはシーンテキスト認識の代替手法である。
文字クラス、位置、順序に対する画素単位のマルチチャネルセグメンテーションマップを生成する。
また、コンテキストモデリングにRNNを採用し、文字の位置とクラスを並列で予測する。
論文 参考訳(メタデータ) (2019-12-28T07:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。