論文の概要: A Large-scale Industrial and Professional Occupation Dataset
- arxiv url: http://arxiv.org/abs/2005.02780v1
- Date: Sat, 25 Apr 2020 10:45:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 22:00:45.597038
- Title: A Large-scale Industrial and Professional Occupation Dataset
- Title(参考訳): 大規模産業・職業活動データセット
- Authors: Junhua Liu, Yung Chuen Ng and Kwan Hui Lim
- Abstract要約: 今日の求人市場では、職業データマイニングと分析の重要性が高まっている。
このデータセットは、LinkedInの56万ユーザに属する192万のジョブから成っている。
- 参考スコア(独自算出の注目度): 0.2642698101441705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There has been growing interest in utilizing occupational data mining and
analysis. In today's job market, occupational data mining and analysis is
growing in importance as it enables companies to predict employee turnover,
model career trajectories, screen through resumes and perform other human
resource tasks. A key requirement to facilitate these tasks is the need for an
occupation-related dataset. However, most research use proprietary datasets or
do not make their dataset publicly available, thus impeding development in this
area. To solve this issue, we present the Industrial and Professional
Occupation Dataset (IPOD), which comprises 192k job titles belonging to 56k
LinkedIn users. In addition to making IPOD publicly available, we also: (i)
manually annotate each job title with its associated level of seniority, domain
of work and location; and (ii) provide embedding for job titles and discuss
various use cases. This dataset is publicly available at
https://github.com/junhua/ipod.
- Abstract(参考訳): 産業データマイニングと分析の活用への関心が高まっている。
今日の雇用市場では、企業が従業員の転職、モデルキャリアの軌跡、履歴書の表示、その他の人的資源タスクの実行を予測できるため、職業データマイニングと分析の重要性が増している。
これらのタスクを促進するための重要な要件は、職業関連データセットの必要性である。
しかし、ほとんどの研究は独自のデータセットを使用しているか、データセットを公開していないため、この分野の開発を妨げている。
この問題を解決するために、56k LinkedInユーザーに属する192万の職種からなるIndustrial and Professional Occupation Dataset(IPOD)を提示する。
IPODを一般公開するだけでなく、以下も公開する。
(i)各職名にその年長、仕事の領域及び場所の関連レベルを手作業で注釈すること。
(二)肩書きの埋め込みを提供し、各種のユースケースについて論じる。
このデータセットはhttps://github.com/junhua/ipodで公開されている。
関連論文リスト
- Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.87055275344965]
Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。
2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。
本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文 参考訳(メタデータ) (2024-06-17T07:22:51Z) - NNOSE: Nearest Neighbor Occupational Skill Extraction [55.22292957778972]
作業スキルデータセットの複雑さに対処する。
我々は、データセット統一方式で類似したスキルを検索するために、外部データストアを使用します。
我々は、データセット間設定において、頻度の低いパターンを予測し、最大30%のスパンF1で性能向上を観察する。
論文 参考訳(メタデータ) (2024-01-30T15:18:29Z) - Large Models for Time Series and Spatio-Temporal Data: A Survey and
Outlook [95.32949323258251]
時系列データ、特に時系列データと時間時間データは、現実世界のアプリケーションで広く使われている。
大規模言語やその他の基礎モデルの最近の進歩は、時系列データマイニングや時間データマイニングでの使用の増加に拍車を掛けている。
論文 参考訳(メタデータ) (2023-10-16T09:06:00Z) - A practical method for occupational skills detection in Vietnamese job
listings [0.16114012813668932]
正確でタイムリーな労働市場情報の欠如は、スキルミスマッチにつながる。
従来のアプローチは、既存の分類学および/または大きな注釈付きデータに依存している。
ベトナムの求人求職者におけるスキル検出のための実践的手法を提案する。
論文 参考訳(メタデータ) (2022-10-26T10:23:18Z) - CAREER: A Foundation Model for Labor Sequence Data [21.38386300423882]
ジョブシーケンスの基礎モデルであるCAREERを開発した。
CAREERは最初、大規模で受動的に収集された履歴データに適合し、その後、経済的な推測のためにより小さく、より精度の良いデータセットに微調整される。
我々はCAREERがジョブシーケンスの正確な予測をし、広く使われている3つの経済データセットのエコノメトリベースラインを上回ります。
論文 参考訳(メタデータ) (2022-02-16T23:23:50Z) - Bridge Data: Boosting Generalization of Robotic Skills with Cross-Domain
Datasets [122.85598648289789]
マルチドメインとマルチタスクのデータセットが、新しい環境における新しいタスクの学習を改善する方法について検討する。
また、新しいドメイン内の少数のタスクのみのデータによって、ドメインギャップを埋めることができ、ロボットが他のドメインでしか見られなかったさまざまなタスクを実行できることもわかりました。
論文 参考訳(メタデータ) (2021-09-27T23:42:12Z) - Toward Knowledge Discovery Framework for Data Science Job Market in the
United States [1.7205106391379024]
本稿では、米国内におけるデータサイエンス関連業務の求人市場分析のためのフレームワークを提案する。
提案するフレームワークには,連続データ収集,情報抽出,Webベースの視覚化ダッシュボードの3つのサブモジュールが含まれている。
このアプリケーションの現在のバージョンはWeb上にデプロイされており、個人や機関がデータサイエンスのポジションに必要なスキルを調査することができる。
論文 参考訳(メタデータ) (2021-06-14T21:23:15Z) - Job2Vec: Job Title Benchmarking with Collective Multi-View
Representation Learning [51.34011135329063]
Job Title Benchmarking (JTB) は、様々な企業で同様の専門知識を持つ職種をマッチングすることを目的としている。
従来のJTBのアプローチは主に手作業による市場調査に依存しており、それは高価で労働集約的である。
我々はJTBをジョブ-グラフ上のリンク予測のタスクとして再編成し、ジョブタイトルにマッチするリンクはリンクを持つべきである。
論文 参考訳(メタデータ) (2020-09-16T02:33:32Z) - Data science on industrial data -- Today's challenges in brown field
applications [0.0]
本論文は,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。
この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。
機械学習アプリケーションのデータ品質は、実験室を去ると問題になる。
論文 参考訳(メタデータ) (2020-06-10T10:05:16Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。