論文の概要: Bridging Behavioral Biometrics and Source Code Stylometry: A Survey of Programmer Attribution
- arxiv url: http://arxiv.org/abs/2603.11150v1
- Date: Wed, 11 Mar 2026 17:45:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.549857
- Title: Bridging Behavioral Biometrics and Source Code Stylometry: A Survey of Programmer Attribution
- Title(参考訳): ブリッジング行動バイオメトリックスとソースコードスティロメトリ:プログラマの属性に関する調査
- Authors: Marek Horvath, Emilia Pietrikova, Diomidis Spinellis,
- Abstract要約: 本稿では,ソースコード解析に焦点をあてたプログラマ帰属研究の体系的マッピングについて述べる。
最初の135の候補出版物から、2012年から2025年の間に出版された47の論文が構造化スクリーニングプロセスによって選択された。
我々は、スタイリスティックな特徴型と行動的特徴型を、一般的に使用される機械学習技術に関連付ける分類法を導出する。
- 参考スコア(独自算出の注目度): 2.5960593866103014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Programmer attribution seeks to identify or verify the author of a source code artifact using stylistic, structural, or behavioural characteristics. This problem has been studied across software engineering, security, and digital forensics, resulting in a growing and methodologically diverse set of publications. This paper presents a systematic mapping study of programmer attribution research focused on source code analysis. From an initial set of 135 candidate publications, 47 studies published between 2012 and 2025 were selected through a structured screening process. The included works are analysed along several dimensions, including authorship tasks, feature categories, learning and modelling approaches, dataset sources, and evaluation practices. Based on this analysis, we derive a taxonomy that relates stylistic and behavioural feature types to commonly used machine learning techniques and provide a descriptive overview of publication trends, benchmarks, programming languages. A content-level analysis highlights the main thematic clusters in the field. The results indicate a strong focus on closed-world authorship attribution using stylometric features and a heavy reliance on a small number of benchmark datasets, while behavioural signals, authorship verification, and reproducibility remain less explored. The study consolidates existing research into a unified framework and outlines methodological gaps that can guide future work. This manuscript is currently under review. The present version is a preprint.
- Abstract(参考訳): プログラマの属性は、スタイリスティックな、構造的な、あるいは振る舞い的な特性を使って、ソースコードアーティファクトの作者を特定し、検証することを目指している。
この問題は、ソフトウェア工学、セキュリティ、デジタル法医学にまたがって研究され、その結果、成長し、方法論的に多様な出版物が生まれた。
本稿では,ソースコード解析に焦点をあてたプログラマ帰属研究の体系的マッピングについて述べる。
最初の135の候補出版物から、2012年から2025年の間に出版された47の論文が構造化スクリーニングプロセスによって選択された。
その中には、著者タスク、機能カテゴリ、学習とモデリングアプローチ、データセットソース、評価プラクティスなどが含まれる。
この分析に基づいて、スタイリスティックな特徴型と行動的特徴型を共通に使用する機械学習技術に関連付ける分類法を導き、出版トレンド、ベンチマーク、プログラミング言語の解説的概要を提供する。
内容レベルの分析では、フィールド内の主要なテーマクラスタを強調します。
この結果から,触覚的特徴を用いたクローズドワールドの著者帰属と,少数のベンチマークデータセットに大きく依存していることが示唆された。
この研究は、既存の研究を統一された枠組みに集約し、今後の研究を導くための方法論的ギャップを概説する。
この写本は現在レビュー中である。
現在のバージョンはプレプリントです。
関連論文リスト
- Large-Scale Multidimensional Knowledge Profiling of Scientific Literature [46.15403461273178]
2020年から2025年の間に、22の主要なカンファレンスから10万以上の論文をまとめてまとめました。
分析では,安全性の向上,マルチモーダル推論,エージェント指向研究など,いくつかの顕著な変化に注目した。
これらの発見は、AI研究の進化に関するエビデンスベースの見解を提供し、より広範なトレンドを理解し、新たな方向性を特定するためのリソースを提供する。
論文 参考訳(メタデータ) (2026-01-21T16:47:05Z) - A Systematic Literature Review on Detecting Software Vulnerabilities with Large Language Models [2.518519330408713]
ソフトウェア工学における大規模言語モデル(LLM)は、ソフトウェア脆弱性検出への関心を喚起している。
この分野の急速な発展は、断片化された研究の風景を生み出した。
この断片化は、最先端技術の明確な概要を得るのを困難にし、研究を有意義に比較し分類する。
論文 参考訳(メタデータ) (2025-07-30T13:17:16Z) - Ontology Embedding: A Survey of Methods, Applications and Resources [54.3453925775069]
オンロジはドメインの知識とメタデータを表現するために広く使われている。
直接支援できる論理的推論は、学習、近似、予測において非常に限られています。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
論文 参考訳(メタデータ) (2024-06-16T14:49:19Z) - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。
大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。
本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文 参考訳(メタデータ) (2024-03-18T17:57:09Z) - A Taxonomy and Archetypes of Business Analytics in Smart Manufacturing [0.0]
ビジネス分析はスマートマニュファクチャリングの重要な要因だ。
しかし、研究者や実践者は、進歩の追跡と分野における新たな知識獲得に苦慮している。
我々は、スマートマニュファクチャリングにおけるビジネス分析の古型を導出するだけでなく、四部分類を開発する。
論文 参考訳(メタデータ) (2021-10-12T16:13:45Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - Topic Space Trajectories: A case study on machine learning literature [0.0]
本稿では,研究トピックの包括的追跡を可能にする構造であるトピック空間トラジェクトリを提案する。
我々は,32の出版会場から50年間の機械学習研究を対象とする出版コーパスへのアプローチの適用性を示した。
本手法は,論文分類,今後の研究課題の予測,未発表の論文提出のための会議や雑誌の掲載を推奨するために利用することができる。
論文 参考訳(メタデータ) (2020-10-23T10:53:42Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。