論文の概要: NameRec*: Highly Accurate and Fine-grained Person Name Recognition
- arxiv url: http://arxiv.org/abs/2103.11360v2
- Date: Tue, 23 Mar 2021 12:25:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 11:38:02.367257
- Title: NameRec*: Highly Accurate and Fine-grained Person Name Recognition
- Title(参考訳): NameRec*: 高精度できめ細かい人物名認識
- Authors: Rui Zhang, Yimeng Dai, Shijie Liu
- Abstract要約: NameRec*タスクは、高精度できめ細やかな人名認識を目指します。
CogNNは、文内のコンテキストと名前形式の豊富なトレーニング信号を完全に探索します。
IsBERTは、重なり合う入力プロセッサと、双方向に重なり合うコンテキスト埋め込み学習を備えた文間エンコーダを備える。
- 参考スコア(独自算出の注目度): 11.43547342030705
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we introduce the NameRec* task, which aims to do highly
accurate and fine-grained person name recognition. Traditional Named Entity
Recognition models have good performance in recognising well-formed person
names from text with consistent and complete syntax, such as news articles.
However, there are rapidly growing scenarios where sentences are of incomplete
syntax and names are in various forms such as user-generated contents and
academic homepages. To address person name recognition in this context, we
propose a fine-grained annotation scheme based on anthroponymy. To take full
advantage of the fine-grained annotations, we propose a Co-guided Neural
Network (CogNN) for person name recognition. CogNN fully explores the
intra-sentence context and rich training signals of name forms. To better
utilize the inter-sentence context and implicit relations, which are extremely
essential for recognizing person names in long documents, we further propose an
Inter-sentence BERT Model (IsBERT). IsBERT has an overlapped input processor,
and an inter-sentence encoder with bidirectional overlapped contextual
embedding learning and multi-hop inference mechanisms. To derive benefit from
different documents with a diverse abundance of context, we propose an advanced
Adaptive Inter-sentence BERT Model (Ada-IsBERT) to dynamically adjust the
inter-sentence overlapping ratio to different documents. We conduct extensive
experiments to demonstrate the superiority of the proposed methods on both
academic homepages and news articles.
- Abstract(参考訳): 本稿では,高精度できめ細かい人物名認識を目的としたNameRec*タスクを提案する。
従来の名前付きエンティティ認識モデルは、ニュース記事のような一貫性のある完全な構文を持つテキストから、よくできた人名を認識するのに優れたパフォーマンスを持つ。
しかし, 文が不完全な構文であり, ユーザ生成コンテンツや学術ホームページなど, 名称が多様であるケースが急速に増えている。
この文脈で人名認識に対処するために,人類学に基づく微粒なアノテーションスキームを提案する。
粒度の細かいアノテーションを最大限に活用するために,人名認識のためのコグナーニューラルネットワーク(CogNN)を提案する。
CogNNは、名前形式の文内コンテキストと豊富な訓練信号を完全に探求している。
長期文書における人物の認識に極めて不可欠である文間コンテキストと暗黙の関係をよりよく活用するために,文間BERTモデル(IsBERT)を提案する。
IsBERTは重なり合う入力プロセッサと、双方向重なり合うコンテキスト埋め込み学習とマルチホップ推論機構を備えた文間エンコーダを備えている。
多様な文脈を持つ異なる文書から利益を得るため、異なる文書に対する相互関係重なり比を動的に調整する高度な適応的相互関係bertモデル(ada-isbert)を提案する。
学術ホームページとニュース記事の両方において,提案手法の優越性を示すため,広範な実験を行った。
関連論文リスト
- Contextual Document Embeddings [77.22328616983417]
本稿では,コンテキスト化された文書埋め込みのための2つの補完手法を提案する。
第一に、文書近傍を明示的にバッチ内コンテキスト損失に組み込む別のコントラスト学習目標である。
第二に、隣接する文書情報をエンコードされた表現に明示的にエンコードする新しいコンテキストアーキテクチャ。
論文 参考訳(メタデータ) (2024-10-03T14:33:34Z) - On the Robustness of Document-Level Relation Extraction Models to Entity Name Variations [33.56352555780006]
本研究では,DocREモデルのエンティティ名のバリエーションに対する堅牢性について検討する。
本稿では,元となるエンティティ名をWikidataから名前に置き換えることで,エンティティにリネームされたドキュメントを生成するための原則的パイプラインを提案する。
実験結果から、3つの代表的なDocREモデルと2つのコンテキスト内モデルの両方が、エンティティ名のバリエーションに十分なロバスト性が欠如していることが判明した。
論文 参考訳(メタデータ) (2024-06-11T16:51:14Z) - Multicultural Name Recognition For Previously Unseen Names [65.268245109828]
本論文は、人名の認識を改善することを目的としており、それは、誰かが生まれたり、名前を変えたりする際にも、成長できる多様なカテゴリーである。
私は103か国の名前を見て、モデルが異なる文化の名前でどれだけうまく機能するかを比較します。
文字入力と単語入力を組み合わせたモデルの方が単語のみのモデルより優れており,従来のNERモデルと比較して精度が向上する可能性がある。
論文 参考訳(メタデータ) (2024-01-23T17:58:38Z) - Language Models As Semantic Indexers [78.83425357657026]
本稿では,ジェネレーティブ言語モデルを用いてセマンティックIDを学習するための自己教師型フレームワークLMIndexerを紹介する。
学習したIDの質を検証し,推奨,製品検索,文書検索の3つの課題において有効性を示す。
論文 参考訳(メタデータ) (2023-10-11T18:56:15Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - Document Domain Randomization for Deep Learning Document Layout
Extraction [37.97092983885967]
文書領域のランダム化(DDR)は,図式化された擬似紙ページのみにトレーニングされた畳み込みニューラルネットワーク(CNN)の転送に成功した最初の例である。
DDRは、興味のあるランダム化されたテキストと非テキストの内容をモデル化することで、擬似文書ページをレンダリングする。
高忠実度意味情報はセマンティッククラスをラベル付けする必要はないが、列車とテスト間のスタイルミスマッチはモデルの精度を低下させる可能性がある。
論文 参考訳(メタデータ) (2021-05-20T19:16:04Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks [81.00481125272098]
本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
論文 参考訳(メタデータ) (2020-08-30T06:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。