論文の概要: An Interpretable CF-RL-TOPSIS Fusion Model for Skills-Aware Talent Recommendation
- arxiv url: http://arxiv.org/abs/2605.24155v1
- Date: Fri, 22 May 2026 19:22:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.652525
- Title: An Interpretable CF-RL-TOPSIS Fusion Model for Skills-Aware Talent Recommendation
- Title(参考訳): 技量を考慮したCF-RL-TOPSIS融合モデル
- Authors: Özkan Canay,
- Abstract要約: 本研究では,6つのセマンティックプロキシから構築したトランジション対応協調ブランチ,強化スタイルの職業家族バンディット,エントロピー重み付きTOPSISブランチを統合した遅延融合モデルを提案する。
このモデルは、2つのフリーズされたICTタレント履歴ベンチマーク、JobHopとKarrierewegeで、時系列トップ5ランキングとペアのWilcoxonテストを用いて評価されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Effective skills-aware talent recommendation must balance behavioral transition patterns, trajectory-sensitive adaptation, and inspectable occupation-level criteria. Evidence from public benchmarks on how these signals interact, however, remains limited. This study proposes CF-RL-TOPSIS, an interpretable late-fusion model that integrates a transition-aware collaborative branch, a compact reinforcement-style occupation-family bandit, and an entropy-weighted TOPSIS branch constructed from six semantic proxies; the validation-selected fusion coefficients remain auditable. The model is evaluated on two frozen public ICT talent-history benchmarks, JobHop and Karrierewege, using repeated chronological top-5 ranking and paired Wilcoxon tests. On JobHop the full hybrid attains NDCG@5 = 0.3040 +/- 0.0073 and significantly surpasses repeat-last, item Markov, transition-aware collaborative filtering, the CF+TOPSIS hybrid, GRU4Rec, and SASRec (p <= 0.0039 across planned comparisons). On Karrierewege the hybrid remains competitive but does not significantly exceed the strongest Markov baseline, revealing a persistence-dominated setting in which the bandit branch appropriately shrinks to near-zero weight. Proxy-sensitivity, family-level deep Q-network, and runtime checks support this interpretation, and a worked user-level case shows how branch scores, criterion weights, and rank shifts can be inspected for an individual recommendation. The contribution is not a benchmark-agnostic superiority claim, but a reproducible account of the conditions under which transparent late fusion adds value beyond simple continuation heuristics. In semantically rich, non-saturating talent-history regimes the three branches reinforce one another; in persistence-dominated regimes the same architecture remains competitive through its collaborative backbone, with the adaptive branch correctly inactive.
- Abstract(参考訳): 効果的なスキル・アウェア・タレント・レコメンデーションは、行動遷移パターン、軌道に敏感な適応、および検査可能な職業レベルの基準のバランスをとる必要がある。
しかし、これらの信号の相互作用に関する公開ベンチマークからの証拠は、まだ限られている。
CF-RL-TOPSISは,6つのセマンティックプロキシからなるエントロピー重み付きTOPSISブランチと,遷移認識型協調ブランチ,コンパクトな強化型職業家族バンディットを統合した,解釈可能な遅延融合モデルである。
このモデルは、2つのフリーズされたICTタレント履歴ベンチマーク、JobHopとKarrierewegeで、時系列トップ5ランキングとペアのWilcoxonテストを用いて評価されている。
JobHopでは、完全なハイブリッドがNDCG@5 = 0.3040 +/- 0.0073に達し、繰り返しラスト、アイテムマルコフ、遷移対応協調フィルタリング、CF+TOPSISハイブリッド、GRU4Rec、SASRec(p <= 0.0039)をはるかに上回っている。
Karrierewege上では、ハイブリッドは競争力は維持されるが、最も強いマルコフ基底線をはるかに超えず、バンドイット分岐が適切にほぼゼロの質量に縮める永続性支配的な設定が明らかである。
プロキシ感度、家族レベルの深いQ-ネットワーク、実行時チェックは、この解釈をサポートし、作業中のユーザレベルのケースでは、個々のレコメンデーションに対して、ブランチスコア、基準ウェイト、ランクシフトをどのように検査するかを示しています。
この貢献は、ベンチマークに依存しない優越性主張ではなく、透明な後期融合が単純な連続ヒューリスティック以上の価値をもたらす条件の再現可能な説明である。
セマンティックに豊かで、非飽和のタレント・ヒストリーでは、3つのブランチは互いに強化され、永続的な支配体制では、同じアーキテクチャは、協調的なバックボーンを通じて競争力を維持し、適応的なブランチは正しく動作しない。
関連論文リスト
- SAVOIR: Learning Social Savoir-Faire via Shapley-based Reward Attribution [82.31558282651811]
複雑な対人相互作用をナビゲートするソーシャルインテリジェンスは、言語エージェントに根本的な課題を提示する。
既存のアプローチでは、言語モデルを直接使用してエピソードレベルの報酬を分配する。
協調ゲーム理論に基づく新しい原理的枠組みであるSAVOIRを提案する。
論文 参考訳(メタデータ) (2026-04-21T02:08:25Z) - Soft Tournament Equilibrium [2.28438857884398]
本稿では,設定されたトーナメントソリューションを学習・計算するための差別化可能なフレームワークであるソフトトーナメント平衡(STE)を紹介する。
出力はコアエージェントのセットで、それぞれがキャリブレーションされたメンバーシップスコアを持ち、エージェント能力の微妙で堅牢な評価を提供する。
論文 参考訳(メタデータ) (2026-04-06T00:40:14Z) - What If Consensus Lies? Selective-Complementary Reinforcement Learning at Test Time [57.533031432715084]
TTRL(Test-Time Reinforcement Learning)は、Large Language Models(LLM)が、ラベルのないテストストリームの推論能力を向上することを可能にする。
既存のTTRL法は、正の擬似ラベル戦略にのみ依存している。
本研究では,ラベル雑音増幅を効果的に緩和する堅牢なテスト時間強化学習フレームワークであるSCRLを提案する。
論文 参考訳(メタデータ) (2026-03-20T11:47:12Z) - Improving Search Agent with One Line of Code [68.58667107354253]
ツールベースのエージェント強化学習(TARL)は,検索エージェントが外部ツールと対話できるようにトレーニングするための,有望なパラダイムとして登場した。
textbfSearch textbfAgent textbfPolicy textbfOptimization (textbfSAPO)を提案する。
論文 参考訳(メタデータ) (2026-03-10T04:07:39Z) - R-Align: Enhancing Generative Reward Models through Rationale-Centric Meta-Judging [69.96389360650072]
解析精度は, 標準ラベルの精度を超えて, 下流RLHFの結果を高い精度で予測できることが示される。
我々は,金の判断でトレーニングを増強し,合理的アライメントを明示的に監督するR-Alignを提案する。
論文 参考訳(メタデータ) (2026-02-06T15:17:11Z) - Hybrid Reinforcement: When Reward Is Sparse, It's Better to Be Dense [36.71358559780692]
HEROは、検証者信号と報酬モデルスコアを構造化された方法で統合する強化学習フレームワークである。
HEROはRMのみのベースラインと検証者のみのベースラインを一貫して上回り、検証可能なタスクと検証しにくいタスクの両方で大きな利益を上げている。
論文 参考訳(メタデータ) (2025-10-08T17:09:41Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。