論文の概要: CNnotator: LLM-Guided Memory Safety Annotation Synthesis
- arxiv url: http://arxiv.org/abs/2606.21822v1
- Date: Sat, 20 Jun 2026 01:21:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 02:54:00.775893
- Title: CNnotator: LLM-Guided Memory Safety Annotation Synthesis
- Title(参考訳): CNnotator: LLM-Guided Memory Safety Annotation Synthesis
- Authors: Twain Byrnes, Mike Dodds,
- Abstract要約: メモリ安全性エラーは、C言語で記述されたシステムにおいて、大きなセキュリティバグの原因となっている。
JavaやRustのようなモダンな言語は、設計上メモリセーフであるため、このようなバグを防ぎます。
大規模言語モデル(LLM)がCNの仕様としてメモリ使用量を表すアノテーションを合成することで、このタスクを実行できるかどうかを問う。
- 参考スコア(独自算出の注目度): 0.7519872646378835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Memory safety errors account for a large proportion of security bugs in systems written in C; modern languages such as Java and Rust prevent such bugs because they are memory-safe by design. To migrate systems to safer languages or identify memory errors, we must first determine how legacy code manipulates memory. This information is only represented implicitly in such code. In many cases, memory usage patterns are merely tedious for humans to figure out, rather than truly difficult. In this work, we ask if large language models (LLMs) can perform this task by having them synthesize annotations representing memory usage as specifications in CN, a hybrid testing/verification tool. Our tool, CNnotator, uses LLMs to automatically generate and test CN specifications. We find that current models are able to generate CN specifications for small-to-medium C programs, with the OpenAI o3 reasoning model achieving a 90% success rate on first attempts and 97% overall success, while the chat model GPT-4o correctly annotates 65% of first attempts. These results suggest AI-assisted annotation is becoming practical for real-world C codebases.
- Abstract(参考訳): メモリ安全性のエラーは、C言語で記述されたシステムのセキュリティバグの大部分が原因であり、JavaやRustのようなモダンな言語は、設計上メモリセーフであるため、そのようなバグを防いでいる。
システムを安全な言語に移行したり、メモリエラーを特定するには、まずレガシーコードがメモリを操作する方法を決定する必要があります。
この情報は、そのようなコードで暗黙的にのみ表現される。
多くの場合、メモリ使用パターンは本当に難しいのではなく、人間が理解するのが面倒です。
本研究では,大規模言語モデル(LLM)が,CNの仕様としてメモリ使用量を表すアノテーションを合成することで,このタスクを実現できるかどうかを問う。
我々のツールであるCNnotatorは、LCMを使用してCN仕様を自動生成し、テストします。
OpenAI o3推論モデルは最初の試みで90%の成功率、全体的な成功率は97%であり、チャットモデルGPT-4oは最初の試みの65%を正しく注釈付けしている。
これらの結果は,実世界のCコードベースにおいて,AI支援アノテーションが実用的になりつつあることを示唆している。
関連論文リスト
- Memory Grafting: Scaling Language Model Pre-training via Offline Conditional Memory [65.39827296429527]
条件付きメモリのスケーリングは、言語モデルのキャパシティを向上する有望な方法である。
Engramのような既存の方法は、事前トレーニング中にスクラッチから大きなメモリテーブルを学習する。
本研究では, グラフトモデルから凍結した隠蔽状態を条件n-gramメモリとして利用する条件記憶スケーリング手法であるメモリグラフトを提案する。
論文 参考訳(メタデータ) (2026-05-20T09:35:04Z) - LLM4C2Rust: Large Language Models for Automated Memory-Safe Code Transpilation [1.4490522938516996]
Rustは、最も若いモダンプログラミング言語の1つで、組み込みのメモリセーフティ保証を提供する。
C/C++コードをメモリセーフなRustコードにトランスパイルすることは、研究の領域が増えている。
本稿では,C/C++-to-Rustトランスパイルを実現するためのRAG(Retrieval-Augmented Generation)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-16T19:33:44Z) - Erasing Without Remembering: Implicit Knowledge Forgetting in Large Language Models [81.62767292169225]
我々は,その一般化に着目して,大規模言語モデルにおける知識の忘れについて検討する。
確率摂動に基づく新しいアンラーニングパラダイムであるPerMUを提案する。
TOFU、Harry Potter、ZsRE、WMDP、MUSEなど、さまざまなデータセットで実験が行われている。
論文 参考訳(メタデータ) (2025-02-27T11:03:33Z) - HMT: Hierarchical Memory Transformer for Efficient Long Context Language Processing [33.720656946186885]
Hierarchical Memory Transformer (HMT) はモデル長文処理を容易にする新しいフレームワークである。
HMTは、既存のモデルの長文処理能力を一貫して改善する。
論文 参考訳(メタデータ) (2024-05-09T19:32:49Z) - MemLLM: Finetuning LLMs to Use An Explicit Read-Write Memory [49.96019697955383]
本稿では,構造化および明示的な読み書きメモリモジュールを統合することで,大規模言語モデル(LLM)の拡張手法であるMemLLMを紹介する。
実験の結果, 言語モデリング, 特に知識集約型タスクにおいて, MemLLMはLLMの性能と解釈可能性を向上させることが示唆された。
論文 参考訳(メタデータ) (2024-04-17T18:13:16Z) - Enabling Memory Safety of C Programs using LLMs [5.297072277460838]
C言語で書かれた低レベルのコードのメモリ安全性違反は、ソフトウェア脆弱性の主要な原因のひとつであり続けています。
このような違反を建設によって除去する方法の1つは、安全なC方言にCコードを移植することである。
このような方言は、最小限のランタイムオーバーヘッドで安全性を保証するためにプログラマが提供するアノテーションに依存している。
この移植は、プログラマに多大な負担をかける手作業であり、そのため、このテクニックの採用は限られている。
論文 参考訳(メタデータ) (2024-04-01T13:05:54Z) - DPZero: Private Fine-Tuning of Language Models without Backpropagation [49.365749361283704]
DPZeroは、ほぼ次元に依存しない新しいゼロオーダーアルゴリズムである。
DPZeroのメモリ効率は、いくつかの下流タスクでプライベートに微調整されたRoBERTaとOPTで実証される。
論文 参考訳(メタデータ) (2023-10-14T18:42:56Z) - UNGOML: Automated Classification of unsafe Usages in Go [2.5338347389265294]
安全でないパッケージは、いくつかの目的のために現実世界のコードで頻繁に使用される。
本稿では,UNGOMLにおいて,安全でない使用のための最初の自動分類器を提案する。
UNGOMLは、グラフやセキュリティ監査のようなユースケースで、安全でない使用を効率的にフィルタするために使用することができる。
論文 参考訳(メタデータ) (2023-06-01T14:02:46Z) - MinUn: Accurate ML Inference on Microcontrollers [2.2638536653874195]
TinyMLとして知られる小さなデバイスで機械学習推論を実行することは、新たな研究分野である。
MinUnは、ARMマイクロコントローラの効率的なコードを生成するために、これらの問題に一様に対処する最初のTinyMLフレームワークである。
論文 参考訳(メタデータ) (2022-10-29T10:16:12Z) - A Model or 603 Exemplars: Towards Memory-Efficient Class-Incremental
Learning [56.450090618578]
CIL(Class-Incremental Learning)は、この要件を満たすために、限られたメモリサイズでモデルをトレーニングすることを目的としている。
モデルサイズを総予算にカウントし,メモリサイズに整合する手法を比較すると,保存モデルは常に機能しないことを示す。
本稿では,メモリ効率のよい拡張可能なMOdelのための MEMO という,シンプルで効果的なベースラインを提案する。
論文 参考訳(メタデータ) (2022-05-26T08:24:01Z) - LaMemo: Language Modeling with Look-Ahead Memory [50.6248714811912]
右側トークンへの漸進的参加により再帰記憶を向上させるLook-Ahead Memory(LaMemo)を提案する。
LaMemoは、メモリ長に比例した追加のオーバーヘッドで、双方向の注意とセグメントの再発を受け入れる。
広く使われている言語モデリングベンチマークの実験は、異なる種類のメモリを備えたベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2022-04-15T06:11:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。