Fugu-MT 論文翻訳(概要): A Large-scale Industrial and Professional Occupation Dataset

論文の概要: A Large-scale Industrial and Professional Occupation Dataset

arxiv url: http://arxiv.org/abs/2005.02780v1
Date: Sat, 25 Apr 2020 10:45:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-09 22:00:45.597038
Title: A Large-scale Industrial and Professional Occupation Dataset
Title（参考訳）: 大規模産業・職業活動データセット
Authors: Junhua Liu, Yung Chuen Ng and Kwan Hui Lim
Abstract要約: 今日の求人市場では、職業データマイニングと分析の重要性が高まっている。このデータセットは、LinkedInの56万ユーザに属する192万のジョブから成っている。
参考スコア（独自算出の注目度）: 0.2642698101441705
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: There has been growing interest in utilizing occupational data mining and analysis. In today's job market, occupational data mining and analysis is growing in importance as it enables companies to predict employee turnover, model career trajectories, screen through resumes and perform other human resource tasks. A key requirement to facilitate these tasks is the need for an occupation-related dataset. However, most research use proprietary datasets or do not make their dataset publicly available, thus impeding development in this area. To solve this issue, we present the Industrial and Professional Occupation Dataset (IPOD), which comprises 192k job titles belonging to 56k LinkedIn users. In addition to making IPOD publicly available, we also: (i) manually annotate each job title with its associated level of seniority, domain of work and location; and (ii) provide embedding for job titles and discuss various use cases. This dataset is publicly available at https://github.com/junhua/ipod.
Abstract（参考訳）: 産業データマイニングと分析の活用への関心が高まっている。今日の雇用市場では、企業が従業員の転職、モデルキャリアの軌跡、履歴書の表示、その他の人的資源タスクの実行を予測できるため、職業データマイニングと分析の重要性が増している。これらのタスクを促進するための重要な要件は、職業関連データセットの必要性である。しかし、ほとんどの研究は独自のデータセットを使用しているか、データセットを公開していないため、この分野の開発を妨げている。この問題を解決するために、56k LinkedInユーザーに属する192万の職種からなるIndustrial and Professional Occupation Dataset(IPOD)を提示する。 IPODを一般公開するだけでなく、以下も公開する。 (i)各職名にその年長、仕事の領域及び場所の関連レベルを手作業で注釈すること。 (二)肩書きの埋め込みを提供し、各種のユースケースについて論じる。このデータセットはhttps://github.com/junhua/ipodで公開されている。

関連論文リスト

JobHop: A Large-Scale Dataset of Career Trajectories [48.881023210777585]
ジョブホップ(JobHop)は、ベルギーのフランドルにある公共雇用サービスVDABが提供する匿名の履歴書から派生した大規模なパブリックデータセットである。構造化されていない履歴データを処理して、構造化された経歴情報を抽出し、標準化された ESCO の職業コードにマッピングする。これにより、230万以上の作業経験の豊富なデータセットが抽出され、391,000以上のユーザ履歴書にまとめられる。
論文参考訳（メタデータ） (2025-05-12T15:22:29Z)
KARRIEREWEGE: A Large Scale Career Path Prediction Dataset [29.24421465266904]
我々は500万以上のキャリアパスを含む包括的な公開データセットであるKARRIEREWEGEを紹介する。履歴書に典型的に見られる自由テキスト入力の問題に対処するために,職名や記述を合成することで,それを強化する。これにより、非構造化データからの正確な予測が可能になり、実際のアプリケーションの課題と密接に一致します。
論文参考訳（メタデータ） (2024-12-19T08:02:08Z)
RedStone: Curating General, Code, Math, and QA Data for Large Language Models [134.49774529790693]
本研究では,大規模言語モデルを事前学習するための包括的かつ柔軟なリソースとして,Common Crawlの未完成の可能性を探る。私たちは、Common Crawlからデータを抽出し、処理するために設計された、革新的でスケーラブルなパイプラインであるRedStoneを紹介します。
論文参考訳（メタデータ） (2024-12-04T15:27:39Z)
Job-SDF: A Multi-Granularity Dataset for Job Skill Demand Forecasting and Benchmarking [59.87055275344965]
Job-SDFは、ジョブスキルの需要予測モデルをトレーニングし、ベンチマークするために設計されたデータセットである。 2021年から2023年にかけて、中国の大手オンライン求人プラットフォームから集められた1035万件の求人広告に基づいている。本データセットは,職業,企業,地域レベルなど,さまざまな粒度でのスキル需要予測モデルの評価を可能にする。
論文参考訳（メタデータ） (2024-06-17T07:22:51Z)
NNOSE: Nearest Neighbor Occupational Skill Extraction [55.22292957778972]
作業スキルデータセットの複雑さに対処する。我々は、データセット統一方式で類似したスキルを検索するために、外部データストアを使用します。我々は、データセット間設定において、頻度の低いパターンを予測し、最大30%のスパンF1で性能向上を観察する。
論文参考訳（メタデータ） (2024-01-30T15:18:29Z)
Unearthing Large Scale Domain-Specific Knowledge from Public Corpora [103.0865116794534]
データ収集パイプラインに大規模なモデルを導入し、ドメイン固有の情報の生成をガイドします。このアプローチをRetrieve-from-CCと呼ぶ。ドメイン固有の知識に関するデータを収集するだけでなく、パブリックコーパスから潜在的推論手順を含むデータをマイニングする。
論文参考訳（メタデータ） (2024-01-26T03:38:23Z)
Large Models for Time Series and Spatio-Temporal Data: A Survey and Outlook [95.32949323258251]
時系列データ、特に時系列データと時間時間データは、現実世界のアプリケーションで広く使われている。大規模言語やその他の基礎モデルの最近の進歩は、時系列データマイニングや時間データマイニングでの使用の増加に拍車を掛けている。
論文参考訳（メタデータ） (2023-10-16T09:06:00Z)
A practical method for occupational skills detection in Vietnamese job listings [0.16114012813668932]
正確でタイムリーな労働市場情報の欠如は、スキルミスマッチにつながる。従来のアプローチは、既存の分類学および/または大きな注釈付きデータに依存している。ベトナムの求人求職者におけるスキル検出のための実践的手法を提案する。
論文参考訳（メタデータ） (2022-10-26T10:23:18Z)
CAREER: A Foundation Model for Labor Sequence Data [21.38386300423882]
ジョブシーケンスの基礎モデルであるCAREERを開発した。 CAREERは最初、大規模で受動的に収集された履歴データに適合し、その後、経済的な推測のためにより小さく、より精度の良いデータセットに微調整される。我々はCAREERがジョブシーケンスの正確な予測をし、広く使われている3つの経済データセットのエコノメトリベースラインを上回ります。
論文参考訳（メタデータ） (2022-02-16T23:23:50Z)
Bridge Data: Boosting Generalization of Robotic Skills with Cross-Domain Datasets [122.85598648289789]
マルチドメインとマルチタスクのデータセットが、新しい環境における新しいタスクの学習を改善する方法について検討する。また、新しいドメイン内の少数のタスクのみのデータによって、ドメインギャップを埋めることができ、ロボットが他のドメインでしか見られなかったさまざまなタスクを実行できることもわかりました。
論文参考訳（メタデータ） (2021-09-27T23:42:12Z)
Toward Knowledge Discovery Framework for Data Science Job Market in the United States [1.7205106391379024]
本稿では、米国内におけるデータサイエンス関連業務の求人市場分析のためのフレームワークを提案する。提案するフレームワークには,連続データ収集,情報抽出,Webベースの視覚化ダッシュボードの3つのサブモジュールが含まれている。このアプリケーションの現在のバージョンはWeb上にデプロイされており、個人や機関がデータサイエンスのポジションに必要なスキルを調査することができる。
論文参考訳（メタデータ） (2021-06-14T21:23:15Z)
Job2Vec: Job Title Benchmarking with Collective Multi-View Representation Learning [51.34011135329063]
Job Title Benchmarking (JTB) は、様々な企業で同様の専門知識を持つ職種をマッチングすることを目的としている。従来のJTBのアプローチは主に手作業による市場調査に依存しており、それは高価で労働集約的である。我々はJTBをジョブ-グラフ上のリンク予測のタスクとして再編成し、ジョブタイトルにマッチするリンクはリンクを持つべきである。
論文参考訳（メタデータ） (2020-09-16T02:33:32Z)
Data science on industrial data -- Today's challenges in brown field applications [0.0]
本論文は,ストックマシンの現場での作業における技術の現状と今後の展望について述べる。この論文の主な焦点はデータ収集であり、ほとんどの人が予想するよりも扱いにくい。機械学習アプリケーションのデータ品質は、実験室を去ると問題になる。
論文参考訳（メタデータ） (2020-06-10T10:05:16Z)
DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文参考訳（メタデータ） (2019-12-27T02:05:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。