論文の概要: Annotation Guidelines for Corpus Novelties: Part 1 -- Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2410.02281v1
- Date: Fri, 4 Oct 2024 09:16:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 07:36:05.182973
- Title: Annotation Guidelines for Corpus Novelties: Part 1 -- Named Entity Recognition
- Title(参考訳): コーパスノベルティのアノテーションガイドライン : その1-名前付きエンティティ認識
- Authors: Arthur Amalvy, Vincent Labatut,
- Abstract要約: 本書では、その注釈中に適用されるガイドラインについて記述する。
注釈者による指示や、注釈付き小説から取り出された多くの例を含んでいる。
- 参考スコア(独自算出の注目度): 3.4955349700835034
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Novelties corpus is a collection of novels (and parts of novels) annotated for Named Entity Recognition (NER) among other tasks. This document describes the guidelines applied during its annotation. It contains the instructions used by the annotators, as well as a number of examples retrieved from the annotated novels, and illustrating expressions that should be marked as entities as well as expressions that should not.
- Abstract(参考訳): ノベルティ・コーパス(英: Novelties corpus)は、名前付きエンティティ認識(NER)に注釈を付けた小説(と小説の一部)のコレクションである。
本書では、その注釈中に適用されるガイドラインについて記述する。
アノテータが使用する指示に加えて、注釈付き小説から検索した多くの例や、実体としてマークすべき表現、そうすべきでない表現を含む。
関連論文リスト
- Annotation Guidelines for Corpus Novelties: Part 2 -- Alias Resolution Version 1.0 [3.4955349700835034]
ノベルティ・コーパス(英: Novelties corpus)は、エイリアス・レゾリューションに注釈を付けた小説(と小説の一部)のコレクションである。
この文書は、アノテーションのプロセスで適用されるガイドラインを記述します。
論文 参考訳(メタデータ) (2024-10-01T09:06:52Z) - Knowledge-Enhanced Dual-stream Zero-shot Composed Image Retrieval [53.89454443114146]
本研究では,ゼロショット合成画像検索タスク(ZS-CIR)について検討した。
従来の作品では、参照画像の特徴をテキスト埋め込み空間に投影することで、擬似ワードトークンを生成する。
知識強化型デュアルストリームゼロショット合成画像検索フレームワーク(KEDs)を提案する。
KEDはデータベースを組み込むことで、参照画像の属性を暗黙的にモデル化する。
論文 参考訳(メタデータ) (2024-03-24T04:23:56Z) - Unsupervised Mapping of Arguments of Deverbal Nouns to Their
Corresponding Verbal Labels [52.940886615390106]
デバーバル名詞は英語の文章でよく使われる動詞で、出来事や行動やその議論を記述している。
名前付けされた構成の引数を扱うために存在する解決策は意味論的アノテーションに基づいている。
本稿では,より統語的アプローチを導入し,デバーバル名詞の議論を対応する動詞構成にマッピングする。
論文 参考訳(メタデータ) (2023-06-24T10:07:01Z) - Quotations, Coreference Resolution, and Sentiment Annotations in
Croatian News Articles: An Exploratory Study [0.0]
本論文はクロアチアのSETimesニュースコーパスにおける引用,共参照解決,感情アノテーションのアノテーションに焦点を当てている。
引用機能アノテーションを備えた生成されたコーパスは、自然言語処理の分野における複数のタスクに使用できる。
論文 参考訳(メタデータ) (2022-12-14T11:54:12Z) - DALLE-2 is Seeing Double: Flaws in Word-to-Concept Mapping in Text2Image
Models [53.29993651680099]
DALLE-2は各単語が解釈においてひとつの役割を持つという制約に従わないことを示す。
DALLE-2は、複数の感覚を持つ名詞の両感覚を同時に表現している。
論文 参考訳(メタデータ) (2022-10-19T14:52:40Z) - Longtonotes: OntoNotes with Longer Coreference Chains [111.73115731999793]
コア参照アノテートされたドキュメントのコーパスを,現在利用可能なものよりもはるかに長い長さで構築する。
結果として得られたコーパスはLongtoNotesと呼ばれ、様々な長さの英語の複数のジャンルの文書を含んでいる。
この新しいコーパスを用いて,最先端のニューラルコアシステムの評価を行った。
論文 参考訳(メタデータ) (2022-10-07T15:58:41Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - Annotation Guidelines for the Turku Paraphrase Corpus [0.6538951857199963]
この文書は、トゥルク語句コーパスの構築に使用される注釈ガイドラインを記述している。
我々のパラフレーズアノテーションスキームはベーススケール1-4を使用し、ラベル1と2は負の候補(パラフレーズではない)に使用される。
基本ラベルに加え、このスキームには2つの正のラベルの中で異なる種類のパラフレーズを分類するための追加のサブカテゴリ(フラッグ)が組み込まれている。
論文 参考訳(メタデータ) (2021-08-17T08:32:55Z) - A Corpus Study and Annotation Schema for Named Entity Recognition and
Relation Extraction of Business Products [68.26059718611914]
製品エンティティのアノテーションと企業-製品関係の言及のためのコーパススタディ、アノテーションスキーマおよび関連ガイドラインを提示する。
積の言及はしばしば名詞句として認識されるが、境界の曖昧さのため、その正確な範囲を定義することは困難である。
提案ガイドラインに準じて,英文Webおよびソーシャルメディア文書の事前コーパスを提示する。
論文 参考訳(メタデータ) (2020-04-07T11:45:22Z) - CASE: Context-Aware Semantic Expansion [68.30244980290742]
本稿では,CASE(Context-Aware Semantic Expansion)と呼ばれる新しいタスクを定義し,検討する。
セマンティックな文脈でシード項が与えられた場合、その文脈に適した他の用語をシードとして提案することを目指している。
このタスクのアノテーションは,既存のコーパスから完全に自動で,大規模に抽出可能であることを示す。
論文 参考訳(メタデータ) (2019-12-31T06:38:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。