Fugu-MT 論文翻訳(概要): Annotated Job Ads with Named Entity Recognition

論文の概要: Annotated Job Ads with Named Entity Recognition

arxiv url: http://arxiv.org/abs/2310.11769v1
Date: Wed, 18 Oct 2023 07:55:53 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-19 17:28:09.105056
Title: Annotated Job Ads with Named Entity Recognition
Title（参考訳）: 名前付きエンティティ認識によるアノテートジョブ広告
Authors: Felix Stollenwerk, Niklas Fastlund, Anna Nyqvist, Joey \"Ohman
Abstract要約: スウェーデンの求人広告にさまざまな有用な情報を表示する、名前付きエンティティ認識モデルを訓練しました。本稿では、アノテーション処理をより効率的にし、高品質なデータを保証するために、我々が採用した手法の概要について述べる。
参考スコア（独自算出の注目度）: 3.25440504493016
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We have trained a named entity recognition (NER) model that screens Swedish job ads for different kinds of useful information (e.g. skills required from a job seeker). It was obtained by fine-tuning KB-BERT. The biggest challenge we faced was the creation of a labelled dataset, which required manual annotation. This paper gives an overview of the methods we employed to make the annotation process more efficient and to ensure high quality data. We also report on the performance of the resulting model.
Abstract（参考訳）: 我々は、スウェーデンの求人広告を様々な有用な情報(求職者に必要なスキルなど)にスクリーニングする名前付きエンティティ認識(NER)モデルを訓練した。 KB-BERTを微調整した。私たちが直面した最大の課題は、手動アノテーションを必要とするラベル付きデータセットの作成でした。本稿では,アノテーション処理をより効率的にし,高品質なデータを確保するために採用した手法の概要を示す。また、結果のモデルの性能についても報告する。

関連論文リスト

Iterative Auto-Annotation for Scientific Named Entity Recognition Using BERT-Based Models [4.884240342385462]
本稿では,BERTモデルを用いたSciNER(Scientific Named Entity Recognition)の反復的手法を提案する。我々は、手動で注釈付きデータの小さな、しかし高品質なデータセットで、微調整済みのモデルへの転送学習を活用する。このプロセスは、細調整されたモデルを使用して、より大きなデータセットの自動アノテートを行い、その後追加の細調整ラウンドによって反復的に洗練される。
論文参考訳（メタデータ） (2025-02-22T17:58:20Z)
KBAlign: Efficient Self Adaptation on Specific Knowledge Bases [75.78948575957081]
大規模言語モデル(LLM)は通常、知識材料を瞬時に活用するために、検索強化世代に依存している。本稿では,知識ベースを含む下流タスクへの効率的な適応を目的としたKBAlignを提案する。提案手法は,Q&Aペアやリビジョン提案などの自己注釈付きデータを用いて反復学習を行い,モデルが知識内容を効率的に把握できるようにする。
論文参考訳（メタデータ） (2024-11-22T08:21:03Z)
Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2024-10-31T06:55:24Z)
Evaluating Named Entity Recognition Using Few-Shot Prompting with Large Language Models [0.0]
Few-Shot PromptingやIn-context Learningは、モデルが最小限の例でエンティティを認識できるようにする。 NERタスクにおけるGPT-4のような最先端モデルの評価を行い、その数ショットのパフォーマンスと完全に教師付きベンチマークを比較した。
論文参考訳（メタデータ） (2024-08-28T13:42:28Z)
A Self Supervised StyleGAN for Image Annotation and Classification with Extremely Limited Labels [35.43549147657739]
画像アノテーションと分類のための自己教師型アプローチであるSS-StyleGANを提案する。提案手法は,50と10の小さなラベル付きデータセットを用いて,強力な分類結果が得られることを示す。
論文参考訳（メタデータ） (2023-12-26T09:46:50Z)
Automated Few-shot Classification with Instruction-Finetuned Language Models [76.69064714392165]
我々は、AuT-Fewが最先端の数ショット学習方法より優れていることを示す。 AuT-Few は RAFT few-shot ベンチマークにおいて,データセット間で最高のランク付け手法であることを示す。
論文参考訳（メタデータ） (2023-05-21T21:50:27Z)
AnnoLLM: Making Large Language Models to Be Better Crowdsourced Annotators [98.11286353828525]
GPT-3.5シリーズのモデルは、様々なNLPタスクにまたがる顕著な少数ショットとゼロショットの能力を示している。本稿では,2段階のアプローチを取り入れたAnnoLLMを提案する。我々はAnnoLLMを用いた対話型情報検索データセットを構築した。
論文参考訳（メタデータ） (2023-03-29T17:03:21Z)
Active Learning for Abstractive Text Summarization [50.79416783266641]
本稿では,抽象テキスト要約におけるアクティブラーニングのための最初の効果的なクエリ戦略を提案する。 ALアノテーションにおける私たちの戦略は、ROUGEと一貫性スコアの点からモデル性能を向上させるのに役立ちます。
論文参考訳（メタデータ） (2023-01-09T10:33:14Z)
"FIJO": a French Insurance Soft Skill Detection Dataset [0.0]
本稿では、多くのソフトスキルアノテーションを含む保険業務のオファーを含む新しい公開データセットFIJOを提案する。名前付きエンティティ認識を用いたスキル検出アルゴリズムの結果を提示し、トランスフォーマーベースのモデルがこのデータセット上で優れたトークンワイズ性能を示すことを示す。
論文参考訳（メタデータ） (2022-04-11T15:54:22Z)
Assisted Text Annotation Using Active Learning to Achieve High Quality with Little Effort [9.379650501033465]
研究者は、手動の注釈だけで、大規模で高品質な注釈付きデータセットを作成できるツールを提案する。我々は、アクティブラーニング(AL)アプローチと事前訓練された言語モデルを組み合わせて、アノテーションカテゴリを半自動で識別する。予備的な結果から,ALを用いることで,複雑なフレームや微妙なフレームを正しく分類するアノテーションの数が大幅に削減されることがわかった。
論文参考訳（メタデータ） (2021-12-15T13:14:58Z)
Towards Good Practices for Efficiently Annotating Large-Scale Image Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。 ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文参考訳（メタデータ） (2021-04-26T16:29:32Z)
DAGA: Data Augmentation with a Generation Approach for Low-resource Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文参考訳（メタデータ） (2020-11-03T07:49:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。