論文の概要: Building a Custom Taxonomy of AI Skills and Tasks from the Ground Up with Job Postings
- arxiv url: http://arxiv.org/abs/2605.21029v1
- Date: Wed, 20 May 2026 11:01:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.635689
- Title: Building a Custom Taxonomy of AI Skills and Tasks from the Ground Up with Job Postings
- Title(参考訳): 求職投稿によるAIスキルとタスクのカスタム分類法の構築
- Authors: Stephen Meisenbacher, Peter Norlander,
- Abstract要約: 我々は2つの大規模求職コーパスを用いて、分類学構築のためのデータポイントの内包(または排除)に関する重要な設計決定を調査する。
系統研究の青写真としてTaxonomyBuilderを提案する。
- 参考スコア(独自算出の注目度): 2.371391648123934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Utilizing LLMs for automated taxonomy construction presents a clear opportunity for the comprehensive, yet efficient mapping of potentially complex domains. When contending with high volumes of rapidly growing corpora, however, it becomes unclear how to best leverage such data for optimal taxonomy construction. Taking the case of systematizing AI skills in the workplace, we use two large-scale job postings corpora to investigate key design decisions for the inclusion (or exclusion) of data points for taxonomy construction. We propose TaxonomyBuilder as a blueprint for our systematic study, with which we evaluate various configurations of custom, data-informed, and hierarchical taxonomies. We demonstrate that less data can provide more clarity: filtering inputs to TaxonomyBuilder provides better domain-specific coverage than offering unfiltered inputs to clustering and LLM-enhanced hierarchical taxonomy labeling tools.
- Abstract(参考訳): 自動分類構築にLLMを用いることで、潜在的に複雑なドメインの包括的かつ効率的なマッピングが可能となる。
しかし, 急速に成長するコーパスと競合する場合には, 最適な分類学構築にどのように最適に活用すればよいかは明らかでない。
職場でAIスキルを体系化する場合、私たちは2つの大規模な求職コーパスを使用して、分類学構築のためのデータポイントの内包(または除外)に関する重要な設計決定を調査します。
本研究の系統的な研究の青写真としてTaxonomyBuilderを提案する。
TaxonomyBuilderへの入力をフィルタリングすることで、クラスタリングやLLMで強化された階層的な分類ラベルツールにフィルタされていない入力を提供するよりも、ドメイン固有のカバレッジが向上します。
関連論文リスト
- Automatic Bottom-Up Taxonomy Construction: A Software Application Domain Study [6.0158981171030685]
ソフトウェアアプリケーションドメイン分類に関するこれまでの研究は、適切な分類法が欠如しているため、課題に直面してきた。
本研究では,複数のデータソースを統合し,アンサンブル手法を活用することで,包括的ソフトウェアアプリケーション領域分類を開発することを目的とする。
論文 参考訳(メタデータ) (2024-09-24T08:55:07Z) - Improving Retrieval in Theme-specific Applications using a Corpus
Topical Taxonomy [52.426623750562335]
ToTER (Topical Taxonomy Enhanced Retrieval) フレームワークを紹介する。
ToTERは、クエリとドキュメントの中心的なトピックを分類学のガイダンスで識別し、そのトピックの関連性を利用して、欠落したコンテキストを補う。
プラグイン・アンド・プレイのフレームワークとして、ToTERは様々なPLMベースのレトリバーを強化するために柔軟に使用できる。
論文 参考訳(メタデータ) (2024-03-07T02:34:54Z) - Creating a Fine Grained Entity Type Taxonomy Using LLMs [0.0]
本研究は, GPT-4とその先進的な反復である GPT-4 Turbo が, 詳細な実体型分類学を自律的に開発する可能性について検討する。
我々の目的は、広く分類されたエンティティタイプから始まる包括的な分類体系を構築することである。
この分類は、GPT-4の内部知識ベースを利用して反復的なプロンプト技術によって徐々に洗練される。
論文 参考訳(メタデータ) (2024-02-19T21:32:19Z) - Using Zero-shot Prompting in the Automatic Creation and Expansion of
Topic Taxonomies for Tagging Retail Banking Transactions [0.0]
本研究は、命令ベース微調整LDMを用いたトピックの構築と拡張のための教師なし手法を提案する(大規模言語モデル)。
既存の分類を新しい用語で拡張するために、ゼロショットプロンプトを使用して、新しいノードを追加する場所を見つける。
得られたタグを使って、小売銀行のデータセットから商人を特徴づけるタグを割り当てます。
論文 参考訳(メタデータ) (2024-01-08T00:27:16Z) - To Classify is to Interpret: Building Taxonomies from Heterogeneous Data
through Human-AI Collaboration [0.39160947065896795]
機械学習(ML)を統合したシステムで分類学の構築を支援する方法について検討する。
本稿では,ユーザが複数のモデルのアウトプットを反復的に考慮できるアプローチを提案する。
論文 参考訳(メタデータ) (2023-07-31T08:24:29Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Large-scale Taxonomy Induction Using Entity and Word Embeddings [13.30719395448771]
本論文では,実体とテキスト埋め込みを用いた知識からの自動推定抽出手法 TIEmb を提案する。
本稿では,Wide Web の大部分から抽出されたクラス置換関係のデータベースである WebIsA データベースにアプローチを適用し,Person and Place ドメインの階層を抽出する。
論文 参考訳(メタデータ) (2021-05-04T05:53:12Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。