論文の概要: A Large-scale Industrial and Professional Occupation Dataset
- arxiv url: http://arxiv.org/abs/2005.02780v1
- Date: Sat, 25 Apr 2020 10:45:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 22:00:45.597038
- Title: A Large-scale Industrial and Professional Occupation Dataset
- Title(参考訳): 大規模産業・職業活動データセット
- Authors: Junhua Liu, Yung Chuen Ng and Kwan Hui Lim
- Abstract要約: 今日の求人市場では、職業データマイニングと分析の重要性が高まっている。
このデータセットは、LinkedInの56万ユーザに属する192万のジョブから成っている。
- 参考スコア(独自算出の注目度): 0.2642698101441705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There has been growing interest in utilizing occupational data mining and
analysis. In today's job market, occupational data mining and analysis is
growing in importance as it enables companies to predict employee turnover,
model career trajectories, screen through resumes and perform other human
resource tasks. A key requirement to facilitate these tasks is the need for an
occupation-related dataset. However, most research use proprietary datasets or
do not make their dataset publicly available, thus impeding development in this
area. To solve this issue, we present the Industrial and Professional
Occupation Dataset (IPOD), which comprises 192k job titles belonging to 56k
LinkedIn users. In addition to making IPOD publicly available, we also: (i)
manually annotate each job title with its associated level of seniority, domain
of work and location; and (ii) provide embedding for job titles and discuss
various use cases. This dataset is publicly available at
https://github.com/junhua/ipod.
- Abstract(参考訳): 産業データマイニングと分析の活用への関心が高まっている。
今日の雇用市場では、企業が従業員の転職、モデルキャリアの軌跡、履歴書の表示、その他の人的資源タスクの実行を予測できるため、職業データマイニングと分析の重要性が増している。
これらのタスクを促進するための重要な要件は、職業関連データセットの必要性である。
しかし、ほとんどの研究は独自のデータセットを使用しているか、データセットを公開していないため、この分野の開発を妨げている。
この問題を解決するために、56k LinkedInユーザーに属する192万の職種からなるIndustrial and Professional Occupation Dataset(IPOD)を提示する。
IPODを一般公開するだけでなく、以下も公開する。
(i)各職名にその年長、仕事の領域及び場所の関連レベルを手作業で注釈すること。
(二)肩書きの埋め込みを提供し、各種のユースケースについて論じる。
このデータセットはhttps://github.com/junhua/ipodで公開されている。
関連論文リスト
- KARRIEREWEGE: A Large Scale Career Path Prediction Dataset [29.24421465266904]
我々は500万以上のキャリアパスを含む包括的な公開データセットであるKARRIEREWEGEを紹介する。
履歴書に典型的に見られる自由テキスト入力の問題に対処するために,職名や記述を合成することで,それを強化する。
これにより、非構造化データからの正確な予測が可能になり、実際のアプリケーションの課題と密接に一致します。
論文 参考訳(メタデータ) (2024-12-19T08:02:08Z) - RedStone: Curating General, Code, Math, and QA Data for Large Language Models [134.49774529790693]
本研究では,大規模言語モデルを事前学習するための包括的かつ柔軟なリソースとして,Common Crawlの未完成の可能性を探る。
私たちは、Common Crawlからデータを抽出し、処理するために設計された、革新的でスケーラブルなパイプラインであるRedStoneを紹介します。
論文 参考訳(メタデータ) (2024-12-04T15:27:39Z) - Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.87055275344965]
Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。
2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。
本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文 参考訳(メタデータ) (2024-06-17T07:22:51Z) - NNOSE: Nearest Neighbor Occupational Skill Extraction [55.22292957778972]
作業スキルデータセットの複雑さに対処する。
我々は、データセット統一方式で類似したスキルを検索するために、外部データストアを使用します。
我々は、データセット間設定において、頻度の低いパターンを予測し、最大30%のスパンF1で性能向上を観察する。
論文 参考訳(メタデータ) (2024-01-30T15:18:29Z) - A practical method for occupational skills detection in Vietnamese job
listings [0.16114012813668932]
正確でタイムリーな労働市場情報の欠如は、スキルミスマッチにつながる。
従来のアプローチは、既存の分類学および/または大きな注釈付きデータに依存している。
ベトナムの求人求職者におけるスキル検出のための実践的手法を提案する。
論文 参考訳(メタデータ) (2022-10-26T10:23:18Z) - Bridge Data: Boosting Generalization of Robotic Skills with Cross-Domain
Datasets [122.85598648289789]
マルチドメインとマルチタスクのデータセットが、新しい環境における新しいタスクの学習を改善する方法について検討する。
また、新しいドメイン内の少数のタスクのみのデータによって、ドメインギャップを埋めることができ、ロボットが他のドメインでしか見られなかったさまざまなタスクを実行できることもわかりました。
論文 参考訳(メタデータ) (2021-09-27T23:42:12Z) - Toward Knowledge Discovery Framework for Data Science Job Market in the
United States [1.7205106391379024]
本稿では、米国内におけるデータサイエンス関連業務の求人市場分析のためのフレームワークを提案する。
提案するフレームワークには,連続データ収集,情報抽出,Webベースの視覚化ダッシュボードの3つのサブモジュールが含まれている。
このアプリケーションの現在のバージョンはWeb上にデプロイされており、個人や機関がデータサイエンスのポジションに必要なスキルを調査することができる。
論文 参考訳(メタデータ) (2021-06-14T21:23:15Z) - Job2Vec: Job Title Benchmarking with Collective Multi-View
Representation Learning [51.34011135329063]
Job Title Benchmarking (JTB) は、様々な企業で同様の専門知識を持つ職種をマッチングすることを目的としている。
従来のJTBのアプローチは主に手作業による市場調査に依存しており、それは高価で労働集約的である。
我々はJTBをジョブ-グラフ上のリンク予測のタスクとして再編成し、ジョブタイトルにマッチするリンクはリンクを持つべきである。
論文 参考訳(メタデータ) (2020-09-16T02:33:32Z) - Data science on industrial data -- Today's challenges in brown field
applications [0.0]
本論文は,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。
この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。
機械学習アプリケーションのデータ品質は、実験室を去ると問題になる。
論文 参考訳(メタデータ) (2020-06-10T10:05:16Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。