Fugu-MT 論文翻訳(概要): A practical method for occupational skills detection in Vietnamese job listings

論文の概要: A practical method for occupational skills detection in Vietnamese job listings

arxiv url: http://arxiv.org/abs/2210.14607v1
Date: Wed, 26 Oct 2022 10:23:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-27 14:32:05.654094
Title: A practical method for occupational skills detection in Vietnamese job listings
Title（参考訳）: ベトナム人求職者における職業スキル検出の実践的方法
Authors: Viet-Trung Tran, Hai-Nam Cao and Tuan-Dung Cao
Abstract要約: 正確でタイムリーな労働市場情報の欠如は、スキルミスマッチにつながる。従来のアプローチは、既存の分類学および/または大きな注釈付きデータに依存している。ベトナムの求人求職者におけるスキル検出のための実践的手法を提案する。
参考スコア（独自算出の注目度）: 0.16114012813668932
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Vietnamese labor market has been under an imbalanced development. The number of university graduates is growing, but so is the unemployment rate. This situation is often caused by the lack of accurate and timely labor market information, which leads to skill miss-matches between worker supply and the actual market demands. To build a data monitoring and analytic platform for the labor market, one of the main challenges is to be able to automatically detect occupational skills from labor-related data, such as resumes and job listings. Traditional approaches rely on existing taxonomy and/or large annotated data to build Named Entity Recognition (NER) models. They are expensive and require huge manual efforts. In this paper, we propose a practical methodology for skill detection in Vietnamese job listings. Rather than viewing the task as a NER task, we consider the task as a ranking problem. We propose a pipeline in which phrases are first extracted and ranked in semantic similarity with the phrases' contexts. Then we employ a final classification to detect skill phrases. We collected three datasets and conducted extensive experiments. The results demonstrated that our methodology achieved better performance than a NER model in scarce datasets.
Abstract（参考訳）: ベトナムの労働市場は不均衡な発展を遂げている。大学卒業者数は増加しているが、失業率も同様である。この状況はしばしば、正確でタイムリーな労働市場情報の欠如によって引き起こされ、労働者の供給と実際の市場需要の間のスキルミスマッチにつながる。労働市場のためのデータモニタリングおよび分析プラットフォームを構築するためには、履歴書や求人情報などの労働関連データから作業スキルを自動的に検出できることが主な課題の1つである。従来のアプローチは、名前付きエンティティ認識(ner)モデルを構築するために、既存の分類法や大規模な注釈データに依存する。費用がかかり、手作業の手間がかかる。本稿では,ベトナムの職業名簿におけるスキル検出のための実践的手法を提案する。タスクをNERタスクとして見るのではなく、タスクをランキング問題として考える。本稿では,まずフレーズを抽出し,意味的類似度でランク付けするパイプラインを提案する。そして、最終分類を用いてスキルフレーズを検出する。 3つのデータセットを収集し,広範な実験を行った。その結果,本手法は少ないデータセットにおけるNERモデルよりも優れた性能を示した。

関連論文リスト

Can Online GenAI Discussion Serve as Bellwether for Labor Market Shifts? [62.386835769570006]
本稿では,大規模言語モデルに関するオンライン議論が,労働市場の変化の早期指標として機能するかどうかを検討する。我々は、公共の談話が雇用の変化の先駆けとなる領域と時間枠を特定するために、4つの異なる分析的アプローチを採用している。調査の結果,求職率,純雇用率,在職期間,失業期間など,複数の指標で1～7ヶ月の雇用変化を事前に予測していることが明らかとなった。
論文参考訳（メタデータ） (2025-11-20T04:18:25Z)
JobHop: A Large-Scale Dataset of Career Trajectories [48.881023210777585]
ジョブホップ(JobHop)は、ベルギーのフランドルにある公共雇用サービスVDABが提供する匿名の履歴書から派生した大規模なパブリックデータセットである。構造化されていない履歴データを処理して、構造化された経歴情報を抽出し、標準化された ESCO の職業コードにマッピングする。これにより、230万以上の作業経験の豊富なデータセットが抽出され、391,000以上のユーザ履歴書にまとめられる。
論文参考訳（メタデータ） (2025-05-12T15:22:29Z)
Likelihood as a Performance Gauge for Retrieval-Augmented Generation [78.28197013467157]
言語モデルの性能の効果的な指標としての可能性を示す。提案手法は,より優れた性能をもたらすプロンプトの選択と構築のための尺度として,疑似可能性を利用する2つの手法を提案する。
論文参考訳（メタデータ） (2024-11-12T13:14:09Z)
Comparative Analysis of Encoder-Based NER and Large Language Models for Skill Extraction from Russian Job Vacancies [0.0]
本研究では,エンコーダとLarge Language Models(LLMs)を併用した名前付きエンティティ認識手法を比較し,ロシアの職種からスキルを抽出する。その結果、従来のNERモデル、特にDeepPavlov RuBERT NERは、精度、精度、リコール、推測時間など、様々な指標でLLMを上回ります。この研究は、自然言語処理(NLP)の分野と労働市場、特に非英語の文脈におけるその応用に寄与する。
論文参考訳（メタデータ） (2024-07-29T09:08:40Z)
Computational Job Market Analysis with Natural Language Processing [5.117211717291377]
本論文は,業務記述から関連情報を抽出する自然言語処理(NLP)技術について考察する。問題の枠組みを定め,注釈付きデータを取得し,抽出手法を導入する。私たちのコントリビューションには、ジョブ記述データセット、非識別データセット、効率的なモデルトレーニングのための新しいアクティブラーニングアルゴリズムが含まれています。
論文参考訳（メタデータ） (2024-04-29T14:52:38Z)
NNOSE: Nearest Neighbor Occupational Skill Extraction [55.22292957778972]
作業スキルデータセットの複雑さに対処する。我々は、データセット統一方式で類似したスキルを検索するために、外部データストアを使用します。我々は、データセット間設定において、頻度の低いパターンを予測し、最大30%のスパンF1で性能向上を観察する。
論文参考訳（メタデータ） (2024-01-30T15:18:29Z)
Making Pre-trained Language Models both Task-solvers and Self-calibrators [52.98858650625623]
プレトレーニング言語モデル(PLM)は、様々な現実世界のシステムのバックボーンとして機能する。以前の研究は、余分なキャリブレーションタスクを導入することでこの問題を緩和できることを示している。課題に対処するためのトレーニングアルゴリズムLM-TOASTを提案する。
論文参考訳（メタデータ） (2023-07-21T02:51:41Z)
Cross-Lingual NER for Financial Transaction Data in Low-Resource Languages [70.25418443146435]
半構造化テキストデータにおける言語間名前認識のための効率的なモデリングフレームワークを提案する。我々は2つの独立したSMSデータセットを英語とアラビア語で使用し、それぞれが半構造化された銀行取引情報を持っている。わずか30のラベル付きサンプルにアクセスすることで、我々のモデルは、英語からアラビア語までの商人、金額、その他の分野の認識を一般化することができる。
論文参考訳（メタデータ） (2023-07-16T00:45:42Z)
Detecting Fake Job Postings Using Bidirectional LSTM [0.0]
本研究は、偽の求人広告を特定するために、双方向長短期記憶(Bidirectional Long Short-Term Memory, Bi-LSTM)モデルを用いる。提案したモデルは、0.91ROC AUCスコアと98.71%の精度で優れた性能を示す。この研究の成果は、偽の求人投稿の拡散に対抗できる堅牢で自動化されたツールの開発に寄与する。
論文参考訳（メタデータ） (2023-04-03T20:05:27Z)
Design of Negative Sampling Strategies for Distantly Supervised Skill Extraction [19.43668931500507]
本稿では,リテラルマッチングによる遠隔監視に基づく,スキル抽出のためのエンドツーエンドシステムを提案する。 ESCO分類を用いて、関連するスキルからネガティブな例を選択することで、最大の改善が得られます。我々は,タスクのさらなる研究を促進するために,研究目的のベンチマークデータセットをリリースする。
論文参考訳（メタデータ） (2022-09-13T13:37:06Z)
MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。正規化最大度(NML)分布の計算法を提案する。得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文参考訳（メタデータ） (2021-07-15T08:19:57Z)
DataOps for Societal Intelligence: a Data Pipeline for Labor Market Skills Extraction and Matching [5.842787579447653]
データOpsモデルを用いて,この問題を定式化し,解決する。そして、履歴書からスキルを抽出する重要なタスクに焦点を合わせます。実データに応用機械学習を適用した予備結果を示す。
論文参考訳（メタデータ） (2021-04-05T15:37:25Z)
Job2Vec: Job Title Benchmarking with Collective Multi-View Representation Learning [51.34011135329063]
Job Title Benchmarking (JTB) は、様々な企業で同様の専門知識を持つ職種をマッチングすることを目的としている。従来のJTBのアプローチは主に手作業による市場調査に依存しており、それは高価で労働集約的である。我々はJTBをジョブ-グラフ上のリンク予測のタスクとして再編成し、ジョブタイトルにマッチするリンクはリンクを持つべきである。
論文参考訳（メタデータ） (2020-09-16T02:33:32Z)
Mining Implicit Relevance Feedback from User Behavior for Web Question Answering [92.45607094299181]
本研究は,ユーザ行動と通過関連性との関連性を検討するための最初の研究である。提案手法は,追加のラベル付きデータを使わずにパスランキングの精度を大幅に向上させる。実際にこの研究は、グローバルな商用検索エンジンにおけるQAサービスの人為的ラベリングコストを大幅に削減する効果が証明されている。
論文参考訳（メタデータ） (2020-06-13T07:02:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。