論文の概要: SLIMER-IT: Zero-Shot NER on Italian Language
- arxiv url: http://arxiv.org/abs/2409.15933v2
- Date: Thu, 14 Nov 2024 13:59:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-15 15:22:45.700411
- Title: SLIMER-IT: Zero-Shot NER on Italian Language
- Title(参考訳): SLIMER-IT:Zero-Shot NER on Italian Language
- Authors: Andrew Zamai, Leonardo Rigutini, Marco Maggini, Andrea Zugarini,
- Abstract要約: 定義とガイドラインに富んだプロンプトを活用するゼロショットNERのための命令チューニング手法であるSLIMER-ITを紹介する。
他の最先端モデルと比較すると、SLIMER-ITの非表示エンティティタグに対する優位性が示される。
- 参考スコア(独自算出の注目度): 3.9786026651178292
- License:
- Abstract: Traditional approaches to Named Entity Recognition (NER) frame the task into a BIO sequence labeling problem. Although these systems often excel in the downstream task at hand, they require extensive annotated data and struggle to generalize to out-of-distribution input domains and unseen entity types. On the contrary, Large Language Models (LLMs) have demonstrated strong zero-shot capabilities. While several works address Zero-Shot NER in English, little has been done in other languages. In this paper, we define an evaluation framework for Zero-Shot NER, applying it to the Italian language. Furthermore, we introduce SLIMER-IT, the Italian version of SLIMER, an instruction-tuning approach for zero-shot NER leveraging prompts enriched with definition and guidelines. Comparisons with other state-of-the-art models, demonstrate the superiority of SLIMER-IT on never-seen-before entity tags.
- Abstract(参考訳): Named Entity Recognition (NER) に対する従来のアプローチは、タスクをBIOシーケンスラベリング問題にフレーム化していた。
これらのシステムは、しばしばダウンストリームタスクにおいて優れているが、広範囲の注釈付きデータを必要とし、アウト・オブ・ディストリビューション・インプット・ドメインや見当たらないエンティティタイプに一般化するのに苦労する。
それとは対照的に、Large Language Models (LLM) は強力なゼロショット機能を示している。
いくつかの作品は英語でZero-Shot NERに対応しているが、他の言語ではほとんど行われていない。
本稿では,Zero-Shot NERの評価フレームワークを定義し,それをイタリア語に適用する。
さらに, SLIMER のイタリア語版である SLIMER-IT についても紹介する。
他の最先端モデルと比較すると、SLIMER-ITの非表示エンティティタグに対する優位性が示される。
関連論文リスト
- ReverseNER: A Self-Generated Example-Driven Framework for Zero-Shot Named Entity Recognition with Large Language Models [0.0]
ゼロショット名前付きエンティティ認識タスクにおいて,大規模言語モデル(LLM)の限界を克服するためのフレームワークであるReverseNERを提案する。
文から始めるのではなく、LLMを使用して定義に基づいてエンティティを生成し、それらを全文に拡張する。
その結果,タスク文と意味的・構造的類似性を保ちながら,明確にラベル付けされたエンティティを持つ注釈付き文が得られた。
論文 参考訳(メタデータ) (2024-11-01T12:08:08Z) - Show Less, Instruct More: Enriching Prompts with Definitions and Guidelines for Zero-Shot NER [3.4998124138877786]
より少ない例でモデルを指示することで、今まで見たことのないエンティティタグに対処するためのアプローチであるSLIMERを提案する。
実験は、定義とガイドラインがより良いパフォーマンス、より速く、より堅牢な学習をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-01T13:25:33Z) - Zero-Shot Cross-Lingual NER Using Phonemic Representations for Low-Resource Languages [5.580028223598989]
既存のゼロショットの言語間NERアプローチは、ターゲット言語についてかなりの事前知識を必要とする。
我々は,異なる言語の表現間のギャップを埋めるために,国際音声アルファベット(IPA)に基づく音声表現を用いたNERの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-06-23T06:38:56Z) - ELLEN: Extremely Lightly Supervised Learning For Efficient Named Entity Recognition [18.884124657093405]
ELENは,微調整言語モデルと言語規則をブレンドした,シンプルで完全にモジュール化されたニューロシンボリックな手法である。
ELLENはCoNLL-2003データセット上で非常に強力なパフォーマンスを実現している。
ゼロショット設定では、ELENは金のデータに基づいてトレーニングされた強力で完全な教師付きモデルの75%以上の性能を達成する。
論文 参考訳(メタデータ) (2024-03-26T05:11:51Z) - Gen-Z: Generative Zero-Shot Text Classification with Contextualized
Label Descriptions [50.92702206798324]
ゼロショットテキスト分類のための生成的プロンプトフレームワークを提案する。
GEN-Zはラベルの自然言語記述に基づく入力テキストのLM可能性を測定する。
データソースの文脈化によるゼロショット分類は、ゼロショットベースラインと少数ショットベースラインの両方を一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2023-11-13T07:12:57Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - Multilingual Autoregressive Entity Linking [49.35994386221958]
mGENREはMultilingual Entity Linking問題のためのシーケンス対シーケンスシステムである。
与えられた言語で言及すると、mGENREはターゲットエンティティの名前を左から右へ、トークンごとに予測します。
提案手法の有効性を3つのMELベンチマーク実験を含む広範囲な評価により示す。
論文 参考訳(メタデータ) (2021-03-23T13:25:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。