論文の概要: Same Same But Different: Preventing Refactoring Attacks on Software Plagiarism Detection
- arxiv url: http://arxiv.org/abs/2510.25057v1
- Date: Wed, 29 Oct 2025 00:48:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.889778
- Title: Same Same But Different: Preventing Refactoring Attacks on Software Plagiarism Detection
- Title(参考訳): 同じだが異なる - ソフトウェアプラジャリズム検出におけるリファクタリングアタックの防止
- Authors: Robin Maisch, Larissa Schmid, Timur Sağlam, Nils Niehues,
- Abstract要約: 本稿では,コードプロパティグラフとグラフ変換を活用することにより,最先端の検出器を強化する新しいフレームワークを提案する。
アルゴリズムとAIによる難読化攻撃の両方を用いて難読化された実世界の学生の応募を包括的に評価した結果、盗作コードの検出において顕著な改善が示された。
- 参考スコア(独自算出の注目度): 1.876319405373752
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Plagiarism detection in programming education faces growing challenges due to increasingly sophisticated obfuscation techniques, particularly automated refactoring-based attacks. While code plagiarism detection systems used in education practice are resilient against basic obfuscation, they struggle against structural modifications that preserve program behavior, especially caused by refactoring-based obfuscation. This paper presents a novel and extensible framework that enhances state-of-the-art detectors by leveraging code property graphs and graph transformations to counteract refactoring-based obfuscation. Our comprehensive evaluation of real-world student submissions, obfuscated using both algorithmic and AI-based obfuscation attacks, demonstrates a significant improvement in detecting plagiarized code.
- Abstract(参考訳): プログラミング教育におけるプラジャリズムの検出は、高度な難読化技術、特にリファクタリングベースの自動攻撃によって、ますます困難に直面する。
教育実践で使用されるコードプラジャリズム検出システムは基本的な難読化に耐性があるが、プログラムの挙動、特にリファクタリングに基づく難読化によって引き起こされる構造的修正に苦慮している。
本稿では、コードプロパティグラフとグラフ変換を利用して、リファクタリングに基づく難読化を防止し、最先端の検出器を強化する新しい拡張可能なフレームワークを提案する。
アルゴリズムとAIによる難読化攻撃の両方を用いて難読化された実世界の学生の応募を包括的に評価した結果、盗作コードの検出において顕著な改善が示された。
関連論文リスト
- Reflective Paper-to-Code Reproduction Enabled by Fine-Grained Verification [46.845133190560375]
複雑なコードを効率的にデバッグするために、人間が体系的なチェックリストを使う方法に触発されて、textbfReflective Paper-to-Code textbfReproductionフレームワークである textbfReProを提案する。
紙の指紋を自動的に抽出し、高品質な監視信号として機能する、正確で原子的な基準の包括的なセットを参照する。
ベースラインよりも13.0%のパフォーマンスギャップを達成し、反射の複雑な論理的および数学的基準を正しく修正する。
論文 参考訳(メタデータ) (2025-08-21T06:57:44Z) - Evaluating Software Plagiarism Detection in the Age of AI: Automated Obfuscation and Lessons for Academic Integrity [0.0]
プログラミングの課題におけるプラジャリズムは、コンピュータサイエンス教育において永続的な問題である。
ソフトウェア盗作検知器は、大規模に不審な類似点を特定するために広く用いられている。
プログラムコードの構造的変更に基づく高度な難読化に対して脆弱である。
論文 参考訳(メタデータ) (2025-05-26T15:59:01Z) - Your Language Model Can Secretly Write Like Humans: Contrastive Paraphrase Attacks on LLM-Generated Text Detectors [77.82885394684202]
テキスト検出を効果的に欺く訓練不要な方法である textbfContrastive textbfParaphrase textbfAttack (CoPA) を提案する。
CoPAは、大規模言語モデルによって生成される人間のような分布とは対照的に、補助的な機械的な単語分布を構築している。
我々の理論的分析は、提案された攻撃の優越性を示唆している。
論文 参考訳(メタデータ) (2025-05-21T10:08:39Z) - The Code Barrier: What LLMs Actually Understand? [7.407441962359689]
本研究では,言語モデルの意味理解能力を評価するために,コード難読化を構造化テストフレームワークとして利用する。
難読化の複雑さが増加するにつれて、統計的に顕著な性能低下が見られる。
本研究では,言語モデルにおけるコード理解を評価するための新しい評価手法を提案する。
論文 参考訳(メタデータ) (2025-04-14T14:11:26Z) - Hierarchical Manifold Projection for Ransomware Detection: A Novel Geometric Approach to Identifying Malicious Encryption Patterns [0.0]
暗号化ベースのサイバー脅威は進化を続けており、従来の検出メカニズムをバイパスする技術がますます高度化している。
階層的多様体射影によって構成された新しい分類フレームワークは、悪意のある暗号化を検出する数学的アプローチを導入する。
提案手法は,暗号シーケンスを構造化多様体の埋め込みに変換し,非ユークリッド特徴分離性による分類ロバスト性を確保する。
論文 参考訳(メタデータ) (2025-02-11T23:20:58Z) - Red Teaming Language Model Detectors with Language Models [114.36392560711022]
大規模言語モデル(LLM)は、悪意のあるユーザによって悪用された場合、重大な安全性と倫理的リスクをもたらす。
近年,LLM生成テキストを検出し,LLMを保護するアルゴリズムが提案されている。
1) LLMの出力中の特定の単語を, 文脈が与えられたシノニムに置き換えること, 2) 生成者の書き方を変更するための指示プロンプトを自動で検索すること,である。
論文 参考訳(メタデータ) (2023-05-31T10:08:37Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。