論文の概要: Unmasking Fake Careers: Detecting Machine-Generated Career Trajectories via Multi-layer Heterogeneous Graphs
- arxiv url: http://arxiv.org/abs/2509.19677v1
- Date: Wed, 24 Sep 2025 01:18:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.654483
- Title: Unmasking Fake Careers: Detecting Machine-Generated Career Trajectories via Multi-layer Heterogeneous Graphs
- Title(参考訳): 偽造偽造者:多層不均質グラフによる機械生成キャリア軌道の検出
- Authors: Michiharu Yamashita, Thanh Tran, Delvin Ce Zhang, Dongwon Lee,
- Abstract要約: 本研究では,Large Language Models(LLM)と各種手法を用いて,機械学習のキャリアトラジェクトリのデータセットを構築した。
実履歴から構築した統一グローバルグラフにおいて,キャリアエンティティとその関係をモデル化する新しい異種階層型多層グラフフレームワークであるCareerScapeを提案する。
- 参考スコア(独自算出の注目度): 12.505226807730649
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The rapid advancement of Large Language Models (LLMs) has enabled the generation of highly realistic synthetic data. We identify a new vulnerability, LLMs generating convincing career trajectories in fake resumes and explore effective detection methods. To address this challenge, we construct a dataset of machine-generated career trajectories using LLMs and various methods, and demonstrate that conventional text-based detectors perform poorly on structured career data. We propose CareerScape, a novel heterogeneous, hierarchical multi-layer graph framework that models career entities and their relations in a unified global graph built from genuine resumes. Unlike conventional classifiers that treat each instance independently, CareerScape employs a structure-aware framework that augments user-specific subgraphs with trusted neighborhood information from a global graph, enabling the model to capture both global structural patterns and local inconsistencies indicative of synthetic career paths. Experimental results show that CareerScape outperforms state-of-the-art baselines by 5.8-85.0% relatively, highlighting the importance of structure-aware detection for machine-generated content.
- Abstract(参考訳): LLM(Large Language Models)の急速な進歩により、高度に現実的な合成データの生成が可能になった。
我々は、偽履歴書に説得力のあるキャリアトラジェクトリを生成する新たな脆弱性を特定し、効果的な検出方法を探る。
この課題に対処するために, LLMと各種手法を用いて, 機械学習のキャリアトラジェクトリのデータセットを構築し, 従来のテキストベースの検出装置が, 構造化されたキャリアデータに対して不十分に動作することを示す。
実履歴から構築した統一グローバルグラフにおいて,キャリアエンティティとその関係をモデル化する新しい異種階層型多層グラフフレームワークであるCareerScapeを提案する。
各インスタンスを独立して扱う従来の分類器とは異なり、CareerScapeでは、グローバルグラフから信頼された近隣情報でユーザ固有のサブグラフを拡張する構造認識フレームワークを採用しており、モデルがグローバルな構造パターンと、合成キャリアパスを示す局所的不整合の両方をキャプチャすることができる。
実験結果から、CareerScapeは5.8~85.0%の最先端のベースラインを相対的に上回り、機械生成コンテンツに対する構造認識検出の重要性を強調した。
関連論文リスト
- SynthGenNet: a self-supervised approach for test-time generalization using synthetic multi-source domain mixing of street view images [8.23277995673829]
テスト時間領域の堅牢な一般化を実現するための自己教師型学生-教員アーキテクチャであるSynthGenNetを紹介する。
私たちのコントリビューションには、さまざまな合成ソースからラベル付きデータをブレンドする新しいClassMix++アルゴリズムが含まれています。
実世界のデータセット上で50%の平均区間-Over-Union(mIoU)値を達成することにより、私たちのモデルは最先端(単一ソースで参照)よりも優れています。
論文 参考訳(メタデータ) (2025-09-02T13:08:03Z) - LLM-based Contrastive Self-Supervised AMR Learning with Masked Graph Autoencoders for Fake News Detection [17.045049022252563]
デジタル時代における誤報の拡散は、社会的な大きな課題に繋がった。
既存のアプローチは、しばしば、長距離依存、複雑な意味関係、およびニュース拡散に影響を与える社会的ダイナミクスの獲得に苦慮する。
本稿では,複雑な意味関係とニュース伝搬ダイナミクスを融合した,自己教師型誤情報検出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-26T08:58:35Z) - Not All Data are Good Labels: On the Self-supervised Labeling for Time Series Forecasting [18.25649205265032]
本稿では,候補データセットを自然に構築することで,時系列データセットを再ラベルする新たな自己教師型アプローチについて検討する。
単純な再構成ネットワークの最適化において、中間体は自己管理パラダイムの擬似ラベルとして使用される。
実世界の11のデータセットに対する実験により、SCAMは様々なバックボーンモデルの性能を一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-02-20T16:29:37Z) - Large Language Models as Realistic Microservice Trace Generators [48.730974361862366]
本稿では,大規模言語モデル (LLM) を用いて, 合成作業負荷トレースを生成する手法を提案する。
我々はTraceLLMが様々な条件下で多様なリアルなトレースを生成し、精度と妥当性の両方において既存のアプローチよりも優れていることを示す。
TraceLLMは、キートレース機能を予測したり、欠落したデータを埋め込むといった、下流のトレース関連タスクに適応する。
論文 参考訳(メタデータ) (2024-12-16T12:48:04Z) - Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Enhancing Explainability in Mobility Data Science through a combination
of methods [0.08192907805418582]
本稿では,重要なXAI技法を調和させる包括的フレームワークを提案する。
LIME Interpretable Model-a-gnostic Explanations, SHAP, Saliency Map, attention mechanism, direct trajectory Visualization, and Permutation Feature (PFI)
本研究の枠組みを検証するため,様々な利用者の嗜好や受容度を評価する調査を行った。
論文 参考訳(メタデータ) (2023-12-01T07:09:21Z) - GiGaMAE: Generalizable Graph Masked Autoencoder via Collaborative Latent
Space Reconstruction [76.35904458027694]
マスク付きオートエンコーダモデルは、グラフデータに対する優れた一般化能力に欠ける。
本稿では,GiGaMAEと呼ばれる新しいグラフマスマスキングオートエンコーダフレームワークを提案する。
私たちの結果は、グラフ構造化データに基づく基礎モデルの設計に光を当てます。
論文 参考訳(メタデータ) (2023-08-18T16:30:51Z) - Recognizing Unseen Objects via Multimodal Intensive Knowledge Graph
Propagation [68.13453771001522]
画像の領域と対応するセマンティック埋め込みとをマッチングする多モード集中型ZSLフレームワークを提案する。
我々は、大規模な実世界のデータに基づいて、広範囲な実験を行い、そのモデルを評価する。
論文 参考訳(メタデータ) (2023-06-14T13:07:48Z) - Self-supervised Graph-level Representation Learning with Local and
Global Structure [71.45196938842608]
自己教師付き全グラフ表現学習のためのローカル・インスタンスとグローバル・セマンティック・ラーニング(GraphLoG)という統合フレームワークを提案する。
GraphLoGは、局所的な類似点の保存に加えて、グローバルなセマンティッククラスタをキャプチャする階層的なプロトタイプも導入している。
モデル学習のための効率的なオンライン予測最大化(EM)アルゴリズムがさらに開発された。
論文 参考訳(メタデータ) (2021-06-08T05:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。