論文の概要: A Corpus Study and Annotation Schema for Named Entity Recognition and
Relation Extraction of Business Products
- arxiv url: http://arxiv.org/abs/2004.03287v1
- Date: Tue, 7 Apr 2020 11:45:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 23:59:04.664276
- Title: A Corpus Study and Annotation Schema for Named Entity Recognition and
Relation Extraction of Business Products
- Title(参考訳): 企業製品の名前付きエンティティ認識と関係抽出のためのコーパススタディとアノテーションスキーマ
- Authors: Saskia Sch\"on, Veselina Mironova, Aleksandra Gabryszak, Leonhard
Hennig
- Abstract要約: 製品エンティティのアノテーションと企業-製品関係の言及のためのコーパススタディ、アノテーションスキーマおよび関連ガイドラインを提示する。
積の言及はしばしば名詞句として認識されるが、境界の曖昧さのため、その正確な範囲を定義することは困難である。
提案ガイドラインに準じて,英文Webおよびソーシャルメディア文書の事前コーパスを提示する。
- 参考スコア(独自算出の注目度): 68.26059718611914
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognizing non-standard entity types and relations, such as B2B products,
product classes and their producers, in news and forum texts is important in
application areas such as supply chain monitoring and market research. However,
there is a decided lack of annotated corpora and annotation guidelines in this
domain. In this work, we present a corpus study, an annotation schema and
associated guidelines, for the annotation of product entity and company-product
relation mentions. We find that although product mentions are often realized as
noun phrases, defining their exact extent is difficult due to high boundary
ambiguity and the broad syntactic and semantic variety of their surface
realizations. We also describe our ongoing annotation effort, and present a
preliminary corpus of English web and social media documents annotated
according to the proposed guidelines.
- Abstract(参考訳): サプライチェーンモニタリングや市場調査などの応用分野において,B2B製品や製品クラス,生産者などの非標準エンティティタイプや関係をニュースやフォーラムテキストで認識することが重要である。
しかし、このドメインには注釈付きコーパスとアノテーションガイドラインの欠如が決定されている。
本稿では,製品エンティティのアノテーションと企業と製品の関係について述べるコーパススタディ,アノテーションスキーマおよび関連するガイドラインを提案する。
積の言及はしばしば名詞句として認識されるが、境界のあいまいさとそれらの表面実現の広範な構文的・意味的多様性により、その正確な範囲を定義することは困難である。
また,現在進行中のアノテーションの取り組みについて述べるとともに,提案ガイドラインに従って注釈付き英語Webおよびソーシャルメディア文書の予備コーパスを提示する。
関連論文リスト
- GiesKaNe: Bridging Past and Present in Grammatical Theory and Practical Application [0.0]
GiesKaNeプロジェクトでは、コーパスコンパイルの要件について検討している。
歴史的コーパスとして、GiesKaNeは歴史的コーパスと現代コーパスの両方との関係を確立することを目的としている。
このようなプロジェクトの方法論的な複雑さは、人間の専門知識と機械支援プロセスの補完的な相互作用を通じて管理される。
論文 参考訳(メタデータ) (2025-02-07T17:35:33Z) - FASSILA: A Corpus for Algerian Dialect Fake News Detection and Sentiment Analysis [0.0]
アルジェ方言(AD)は、注釈付きコーパスがないため、課題に直面している。
本研究では,Fake News(FN)検出・感情分析(SA)のための専門コーパスの開発プロセスについて概説する。
論文 参考訳(メタデータ) (2024-11-07T10:39:10Z) - Different Tastes of Entities: Investigating Human Label Variation in
Named Entity Annotations [23.059491714512077]
本稿では,3言語(英語,デンマーク語,バイエルン語)のエキスパートアノテーション付きエンティティデータセットの相違について検討する。
テキストのあいまいさと人為的ガイドラインの変更が,高品質なリビジョンにおける多彩なアノテーションの主要な要因であることを示す。
論文 参考訳(メタデータ) (2024-02-02T14:08:34Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Semantic Role Labeling Meets Definition Modeling: Using Natural Language
to Describe Predicate-Argument Structures [104.32063681736349]
本稿では,離散ラベルの代わりに自然言語定義を用いて述語-代名詞構造を記述する手法を提案する。
PropBankスタイルおよびFrameNetスタイル、依存性ベースおよびスパンベースSRLに関する実験と分析は、解釈可能な出力を持つフレキシブルモデルが必ずしも性能を犠牲にしないことを示す。
論文 参考訳(メタデータ) (2022-12-02T11:19:16Z) - Multilingual Extraction and Categorization of Lexical Collocations with
Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。
以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文 参考訳(メタデータ) (2022-05-23T16:47:37Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - RuREBus: a Case Study of Joint Named Entity Recognition and Relation
Extraction from e-Government Domain [7.6462329126769815]
本稿では、国家機関が発行する文書からなる新しいコーパスに対して、名前付きエンティティ認識(NER)や関係抽出(RE)などの情報抽出手法の適用例を示す。
このコーパスの主な課題は、1) アノテーションスキームが一般的なドメインコーパスで使用されるものとは大きく異なり、2) 文書は英語以外の言語で記述されている。
論文 参考訳(メタデータ) (2020-10-29T20:56:15Z) - A German Corpus for Fine-Grained Named Entity Recognition and Relation
Extraction of Traffic and Industry Events [63.08899104652265]
この研究は、微粒な地理的要素で注釈付けされたドイツ語文書のコーパスを記述する。
また、15の交通・産業関連n-aryリレーションシップやイベントもアノテートされている。
コーパスは、ニュースワイヤーのテキスト、Twitterメッセージ、ラジオ局、警察、鉄道会社からの交通報告で構成されている。
論文 参考訳(メタデータ) (2020-04-07T11:39:50Z) - Mining customer product reviews for product development: A summarization
process [0.7742297876120561]
本研究は、顧客の好みや嫌いに関連する言葉や表現をオンラインレビューから識別し、構造化し、製品開発を指導することを目的としている。
著者らは,製品価格,感情,使用状況など,ユーザの嗜好の多面性を含む要約モデルを提案する。
ケーススタディでは、提案したモデルとアノテーションガイドラインにより、人間のアノテーションは、高信頼度でオンラインレビューを構造化できることを示した。
論文 参考訳(メタデータ) (2020-01-13T13:01:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。