論文の概要: Competence-Level Prediction and Resume & Job Description Matching Using
Context-Aware Transformer Models
- arxiv url: http://arxiv.org/abs/2011.02998v1
- Date: Thu, 5 Nov 2020 17:47:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 11:56:56.411225
- Title: Competence-Level Prediction and Resume & Job Description Matching Using
Context-Aware Transformer Models
- Title(参考訳): 文脈対応変圧器モデルを用いたコンピテンスレベル予測と求人記述マッチング
- Authors: Changmao Li, Elaine Fisher, Rebecca Thomas, Steve Pittard, Vicki
Hertzberg, Jinho D. Choi
- Abstract要約: 臨床研究コーディネーターの4つのレベルに指定された252の職種について、24,933件の求職申告書から6,492件の履歴書を抽出した。
アノテーション間の合意のために、高いカッパスコアが61%に達する。
- 参考スコア(独自算出の注目度): 13.302702823447476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a comprehensive study on resume classification to reduce
the time and labor needed to screen an overwhelming number of applications
significantly, while improving the selection of suitable candidates. A total of
6,492 resumes are extracted from 24,933 job applications for 252 positions
designated into four levels of experience for Clinical Research Coordinators
(CRC). Each resume is manually annotated to its most appropriate CRC position
by experts through several rounds of triple annotation to establish guidelines.
As a result, a high Kappa score of 61% is achieved for inter-annotator
agreement. Given this dataset, novel transformer-based classification models
are developed for two tasks: the first task takes a resume and classifies it to
a CRC level (T1), and the second task takes both a resume and a job description
to apply and predicts if the application is suited to the job T2. Our best
models using section encoding and multi-head attention decoding give results of
73.3% to T1 and 79.2% to T2. Our analysis shows that the prediction errors are
mostly made among adjacent CRC levels, which are hard for even experts to
distinguish, implying the practical value of our models in real HR platforms.
- Abstract(参考訳): 本稿では,アプリケーション数を大幅に削減するために必要な時間と労力を削減し,適切な候補の選択を改善するため,履歴分類に関する総合的研究を行う。
臨床研究コーディネータ(crc)の4つのレベルに分類された252のポジションに対して、24,933の求人から合計6,492の履歴書を抽出する。
各履歴書は、ガイドラインを確立するために、専門家によって最も適切なCRCポジションに手動で注釈付けされる。
その結果、アノテータ間の合意に対して、高いカッパスコアが61%となる。
このデータセットが与えられた場合、第1のタスクは履歴書を取得してCRCレベルに分類し(T1)、第2のタスクは履歴書とジョブ記述の両方を受け取り、アプリケーションがジョブT2に適合しているかどうかを判断する。
セクションエンコーディングとマルチヘッドアテンションデコーディングを用いた最良のモデルでは、T1に対して73.3%、T2に対して79.2%の結果が得られる。
分析の結果,予測誤差は隣接するCRCレベルに大半を占めており,実際のHRプラットフォームにおけるモデルの実用的価値を示唆する専門家でさえ区別が難しいことがわかった。
関連論文リスト
- Preference Optimization for Reasoning with Pseudo Feedback [100.62603571434167]
提案手法では,解のラベル付けを関連するテストケースに対する評価として行うことで,推論タスクに対する疑似フィードバックを生成する手法を提案する。
本研究では,擬似フィードバックを優先最適化に用いる数学的推論と符号化の両タスクについて実験を行い,両タスク間の改善を観察する。
論文 参考訳(メタデータ) (2024-11-25T12:44:02Z) - Large Language Models in the Workplace: A Case Study on Prompt
Engineering for Job Type Classification [58.720142291102135]
本研究では,実環境における職種分類の課題について検討する。
目標は、英語の求職が卒業生やエントリーレベルの地位に適切かどうかを判断することである。
論文 参考訳(メタデータ) (2023-03-13T14:09:53Z) - Predicting Job Titles from Job Descriptions with Multi-label Text
Classification [0.0]
ジョブ記述テキストから関連職名を予測するための多ラベル分類手法を提案する。
本稿では,Bio-GRU-LSTM-CNNを各種事前学習言語モデルで実装し,職種予測問題に適用する。
論文 参考訳(メタデータ) (2021-12-21T09:31:03Z) - Assessing Data Efficiency in Task-Oriented Semantic Parsing [54.87705549021248]
我々は、ある品質バーを達成するのに、ドメイン内の「ターゲット」データがどれだけ必要であるかを近似した4段階のプロトコルを導入する。
我々は,タスク指向セマンティック解析の実践者に対して,その柔軟性と適用性を示す実世界の2つのケーススタディに適用する。
論文 参考訳(メタデータ) (2021-07-10T02:43:16Z) - LRG at SemEval-2021 Task 4: Improving Reading Comprehension with
Abstract Words using Augmentation, Linguistic Features and Voting [0.6850683267295249]
フィリングインザブランクタイプの質問を考えると、タスクは5つのオプションのリストから最適な単語を予測することです。
マスク付き言語モデリング(MLM)タスクで事前訓練されたトランスフォーマーベースのモデルのエンコーダを使用して、Fill-in-the-Blank(FitB)モデルを構築します。
本稿では,BERT の入力長制限に対処するため,チャンク投票や Max Context という変種を提案する。
論文 参考訳(メタデータ) (2021-02-24T12:33:12Z) - NEMO: Frequentist Inference Approach to Constrained Linguistic Typology
Feature Prediction in SIGTYP 2020 Shared Task [83.43738174234053]
タイプ的特徴間の相関関係を表現するために頻繁な推論を用い、この表現を用いて、個々の特徴を予測する単純なマルチクラス推定器を訓練する。
テスト言語149言語に対して,マイクロ平均精度0.66を達成できた。
論文 参考訳(メタデータ) (2020-10-12T19:25:43Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - IIE-NLP-NUT at SemEval-2020 Task 4: Guiding PLM with Prompt Template
Reconstruction Strategy for ComVE [13.334749848189826]
サブタスクを複数選択の質問応答形式に形式化し、プロンプトテンプレートで入力を構築する。
実験結果から,本手法はベースラインシステムと比較して高い性能を示した。
最初の2つのサブタスクの2つの公式テストセットにおいて、96.4の精度と94.3の精度で第3位を確保した。
論文 参考訳(メタデータ) (2020-07-02T06:59:53Z) - On the Inference of Soft Biometrics from Typing Patterns Collected in a
Multi-device Environment [47.37893297206786]
本稿では,マルチデバイス環境における117人を対象に,性別,メジャー/マイナー,タイピングスタイル,年齢,身長の推測を行った。
分類タスクでは、6つの古典的機械学習(ML)と4つのディープラーニング(DL)分類器のパフォーマンスをベンチマークする。
この研究で挙げられた様々なアプリケーションシナリオを考慮して、結果は有望です。
論文 参考訳(メタデータ) (2020-06-16T20:25:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。