論文の概要: ANEA: Automated (Named) Entity Annotation for German Domain-Specific
Texts
- arxiv url: http://arxiv.org/abs/2112.06724v1
- Date: Mon, 13 Dec 2021 15:09:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 21:23:57.673934
- Title: ANEA: Automated (Named) Entity Annotation for German Domain-Specific
Texts
- Title(参考訳): ANEA: ドイツのドメイン特化テキストに対するエンティティアノテーションの自動(Named)
- Authors: Anastasia Zhukova, Felix Hamborg and Bela Gipp
- Abstract要約: 我々は、ドメイン固有のNERコーパスを作成する際に、人間のアノテータを支援する自動化された(名前付き)エンティティアノテータであるANEAを提案する。
評価において、ANEAはテキストの内容を最もよく表す用語を自動的に識別し、一貫性のある用語群を識別し、これらのグループに記述ラベルを抽出し割り当てる。
- 参考スコア(独自算出の注目度): 10.541787182702217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity recognition (NER) is an important task that aims to resolve
universal categories of named entities, e.g., persons, locations,
organizations, and times. Despite its common and viable use in many use cases,
NER is barely applicable in domains where general categories are suboptimal,
such as engineering or medicine. To facilitate NER of domain-specific types, we
propose ANEA, an automated (named) entity annotator to assist human annotators
in creating domain-specific NER corpora for German text collections when given
a set of domain-specific texts. In our evaluation, we find that ANEA
automatically identifies terms that best represent the texts' content,
identifies groups of coherent terms, and extracts and assigns descriptive
labels to these groups, i.e., annotates text datasets into the domain (named)
entities.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、人、場所、組織、時間といった名前付きエンティティの普遍的なカテゴリを解決することを目的とした重要なタスクである。
多くのユースケースでよく使われるが、NERは工学や医学など、一般的なカテゴリーが最適でない領域ではほとんど適用されない。
ドメイン固有型のNERを容易にするために,ドメイン固有テキストのセットを与えられたときに,ドイツのテキストコレクション用のドメイン固有NERコーパスを作成する際に,人間のアノテータを支援する自動(名前付き)エンティティアノテータであるANEAを提案する。
評価において、ANEAは、テキストのコンテンツを最もよく表す用語を自動で識別し、一貫性のある用語のグループを特定し、これらのグループに記述ラベルを抽出し割り当て、すなわち、テキストデータセットをドメイン(名前)エンティティに注釈付けする。
関連論文リスト
- Decoding Time Series with LLMs: A Multi-Agent Framework for Cross-Domain Annotation [56.78444462585225]
TESSAは、時系列データに対する一般的なアノテーションとドメイン固有のアノテーションの両方を自動的に生成するように設計されたマルチエージェントシステムである。
General Agentは複数のソースドメインにまたがる共通パターンと知識をキャプチャし、時系列とテキストの両方の機能を利用する。
ドメイン固有のエージェントは、ターゲットドメインからの限定アノテーションを使用して、ドメイン固有の用語を学び、ターゲットアノテーションを生成する。
論文 参考訳(メタデータ) (2024-10-22T22:43:14Z) - DomainSum: A Hierarchical Benchmark for Fine-Grained Domain Shift in Abstractive Text Summarization [1.7009235747761653]
DomainSumは抽象的な要約において、きめ細かいドメインシフトをキャプチャするために設計された階層的なベンチマークである。
これらの変化をジャンル,スタイル,トピックという3つのレベルに分類し,階層構造に従うような総合的なベンチマーク分析を通じて示す。
論文 参考訳(メタデータ) (2024-10-21T06:55:35Z) - PoE: a Panel of Experts for Generalized Automatic Dialogue Assessment [58.46761798403072]
モデルベース自動対話評価基準(ADEM)は,複数の領域にわたって良好に機能することが期待される。
大きな進歩にもかかわらず、ある領域でうまく機能するADEMは必ずしも他の領域に一般化するとは限らない。
本稿では,共有トランスフォーマーエンコーダと軽量アダプタの集合からなるPanel of Experts (PoE)ネットワークを提案する。
論文 参考訳(メタデータ) (2022-12-18T02:26:50Z) - Syntax-Guided Domain Adaptation for Aspect-based Sentiment Analysis [23.883810236153757]
ドメイン適応は、ドメイン間で共通の知識を伝達することによって、新しいドメインにおけるデータ不足問題を緩和するための一般的なソリューションである。
より効果的なクロスドメインABSAのための、SDAMと呼ばれる新しい構文誘導型ドメイン適応モデルを提案する。
我々のモデルは、クロスドメインEnd2EndABSAタスクのMicro-F1メトリックに関して、最先端のベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2022-11-10T10:09:33Z) - Discovering Domain Disentanglement for Generalized Multi-source Domain
Adaptation [48.02978226737235]
典型的なマルチソースドメイン適応(MSDA)アプローチは、ラベル付きソースドメインから学習した知識をラベル付きターゲットドメインに転送することを目的としている。
本稿では、各インスタンスのドメイン表現と意味的特徴を分割し、次元的独立性を奨励する変動型ドメイン・アンタングルメント(VDD)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-11T04:33:08Z) - Dynamic Instance Domain Adaptation [109.53575039217094]
教師なしのドメイン適応に関するほとんどの研究は、各ドメインのトレーニングサンプルがドメインラベルを伴っていると仮定している。
適応的な畳み込みカーネルを持つ動的ニューラルネットワークを開発し、各インスタンスにドメインに依存しない深い特徴を適応させるために、インスタンス適応残差を生成する。
我々のモデルはDIDA-Netと呼ばれ、複数の一般的な単一ソースおよび複数ソースのUDAデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-09T20:05:54Z) - Named entity recognition architecture combining contextual and global
features [5.92351086183376]
名前付きエンティティ認識(NER)は、名前付きエンティティの特定と分類を目的とした情報抽出技術である。
我々は,XLNet のコンテキスト特徴と Graph Convolution Network (GCN) のグローバル特徴を組み合わせた NER の性能向上を提案する。
論文 参考訳(メタデータ) (2021-12-15T10:54:36Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Named Entity Recognition in the Legal Domain using a Pointer Generator
Network [0.0]
我々は, 訴訟のPDFファイルからノイズテキストを抽出し, 法的NERの問題点を米国裁判所から調査した。
テキスト内のエンティティの正確な位置は不明で、エンティティはタイプミスやOCRミスを含む可能性がある。
nerタスクをテキストからテキストへのシーケンス生成タスクとして定式化し、ポインタ生成ネットワークを訓練して文書内のエンティティを生成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:34Z) - CrossNER: Evaluating Cross-Domain Named Entity Recognition [47.9831214875796]
ドメイン間のエンティティ認識モデルは、ターゲットドメインにおけるNERサンプルの不足問題に対処することができる。
既存のNERベンチマークのほとんどはドメイン特化エンティティタイプを持たないか、特定のドメインにフォーカスしていないため、クロスドメイン評価の効率が低下する。
CrossNER(クロスドメインNERデータセット)は、5つの異なるドメインにまたがるNERデータのフルラベルコレクションで、異なるドメインのための専門エンティティカテゴリがあります。
論文 参考訳(メタデータ) (2020-12-08T11:31:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。