論文の概要: Towards Explainable Job Title Matching: Leveraging Semantic Textual Relatedness and Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2509.09522v1
- Date: Thu, 11 Sep 2025 15:02:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-12 16:52:24.434911
- Title: Towards Explainable Job Title Matching: Leveraging Semantic Textual Relatedness and Knowledge Graphs
- Title(参考訳): 説明可能な職種マッチングに向けて:意味的テキスト関連性と知識グラフの活用
- Authors: Vadim Zadykian, Bruno Andrade, Haithem Afli,
- Abstract要約: 本研究では,ジョブタイトルマッチングの文脈における意味的テキスト関連性(STR)について検討する。
本稿では,密文埋め込みとドメイン固有の知識グラフを組み合わせた自己教師型ハイブリッドアーキテクチャを提案する。
KGを付加した細調整SBERTモデルが高STR領域で一貫した改善をもたらすことを示す。
- 参考スコア(独自算出の注目度): 0.19116784879310025
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Semantic Textual Relatedness (STR) captures nuanced relationships between texts that extend beyond superficial lexical similarity. In this study, we investigate STR in the context of job title matching - a key challenge in resume recommendation systems, where overlapping terms are often limited or misleading. We introduce a self-supervised hybrid architecture that combines dense sentence embeddings with domain-specific Knowledge Graphs (KGs) to improve both semantic alignment and explainability. Unlike previous work that evaluated models on aggregate performance, our approach emphasizes data stratification by partitioning the STR score continuum into distinct regions: low, medium, and high semantic relatedness. This stratified evaluation enables a fine-grained analysis of model performance across semantically meaningful subspaces. We evaluate several embedding models, both with and without KG integration via graph neural networks. The results show that fine-tuned SBERT models augmented with KGs produce consistent improvements in the high-STR region, where the RMSE is reduced by 25% over strong baselines. Our findings highlight not only the benefits of combining KGs with text embeddings, but also the importance of regional performance analysis in understanding model behavior. This granular approach reveals strengths and weaknesses hidden by global metrics, and supports more targeted model selection for use in Human Resources (HR) systems and applications where fairness, explainability, and contextual matching are essential.
- Abstract(参考訳): Semantic Textual Relatedness (STR)は、表面的な語彙的類似性を超えて広がるテキスト間のニュアンスな関係をキャプチャする。
本研究では,ジョブタイトルマッチングの文脈におけるSTRについて検討する。これは,重複する用語が制限される場合や誤解を招く場合のレコメンデーションシステムにおける重要な課題である。
文の埋め込みとドメイン固有の知識グラフ(KG)を組み合わせた自己教師型ハイブリッドアーキテクチャを導入し,セマンティックアライメントと説明可能性の両方を改善した。
集約性能のモデルを評価する従来の研究とは異なり,本手法ではSTRスコア連続体を低,中,高意味的関連性という異なる領域に分割することで,データの階層化を強調する。
この階層化評価は意味的に意味のある部分空間をまたいだモデル性能のきめ細かい解析を可能にする。
我々は,グラフニューラルネットワークによるKG統合と非統合の両面から,複数の埋め込みモデルを評価する。
その結果、KGsで強化した細調整SBERTモデルでは、RMSEが強いベースラインよりも25%減少する高STR領域で一貫した改善が得られた。
本研究は,KGとテキスト埋め込みを組み合わせることのメリットだけでなく,モデル行動の理解における地域的パフォーマンス分析の重要性も浮き彫りにした。
この粒度の細かいアプローチは、グローバルなメトリクスによって隠された強みと弱みを明らかにし、公正さ、説明可能性、コンテキストマッチングが不可欠であるヒューマンリソース(HR)システムやアプリケーションにおいて、よりターゲットとなるモデル選択をサポートする。
関連論文リスト
- Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。
従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。
本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文 参考訳(メタデータ) (2025-08-15T06:36:13Z) - Towards Improving Long-Tail Entity Predictions in Temporal Knowledge Graphs through Global Similarity and Weighted Sampling [53.11315884128402]
時間知識グラフ(TKG)補完モデルは、伝統的にトレーニング中にグラフ全体へのアクセスを前提としている。
本稿では,TKGに特化して設計されたインクリメンタルトレーニングフレームワークを提案する。
提案手法は,モデルに依存しない拡張層と加重サンプリング戦略を組み合わせることで,既存のTKG補完手法を拡張および改善することができる。
論文 参考訳(メタデータ) (2025-07-25T06:02:48Z) - Talking to GDELT Through Knowledge Graphs [0.6153162958674417]
本研究では,各アプローチの強みと弱みを質問応答解析で把握するために,様々なRAG(Retrieval Augmented Regeneration)アプローチについて検討する。
テキストコーパスから情報を取得するために,従来のベクトルストアRAGと,最先端の大規模言語モデル(LLM)に基づくアプローチを実装した。
論文 参考訳(メタデータ) (2025-03-10T17:48:10Z) - Deep Sparse Latent Feature Models for Knowledge Graph Completion [24.342670268545085]
本稿では,深部変分オートエンコーダ(VAE)により最適化されたスパース潜時特徴モデルを用いた新しい確率的KGCフレームワークを提案する。
提案手法は, 局所的なテキスト特徴を持つ動的クラスタリング情報を用いて, 欠落した三重項を効果的に完遂すると同時に, 基礎となる潜在構造を解釈しやすくする。
論文 参考訳(メタデータ) (2024-11-24T03:17:37Z) - Unleashing the Potential of Text-attributed Graphs: Automatic Relation Decomposition via Large Language Models [31.443478448031886]
RoSE (Relation-oriented Semantic Edge-Decomposition) は、生のテキスト属性を分析してグラフ構造を分解する新しいフレームワークである。
我々のフレームワークは、さまざまなデータセットのノード分類性能を大幅に向上させ、ウィスコンシンデータセットでは最大16%の改善を実現した。
論文 参考訳(メタデータ) (2024-05-28T20:54:47Z) - Sequential Visual and Semantic Consistency for Semi-supervised Text
Recognition [56.968108142307976]
Scene Text Recognition (STR) は、大規模なアノテートデータを必要とする課題である。
既存のSTR法の多くは、STRモデルの性能を低下させ、ドメイン差を生じさせる合成データに頼っている。
本稿では,視覚的・意味的両面から単語レベルの整合性正則化を取り入れたSTRの半教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2024-02-24T13:00:54Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。