論文の概要: Caruca: Effective and Efficient Specification Mining for Opaque Software Components
- arxiv url: http://arxiv.org/abs/2510.14279v1
- Date: Thu, 16 Oct 2025 04:02:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.714339
- Title: Caruca: Effective and Efficient Specification Mining for Opaque Software Components
- Title(参考訳): Caruca: 不透明なソフトウェアコンポーネントのための効果的で効率的な仕様マイニング
- Authors: Evangelos Lamprou, Seong-Heon Jung, Mayank Keoliya, Lukas Lazarek, Konstantinos Kallas, Michael Greenberg, Nikos Vasilakis,
- Abstract要約: Carucaは不透明なコマンドの自動仕様マイニングシステムである。
1つのケースを除いて、正しい仕様を生成する。
現在、最先端の静的解析ツールの完全な仕様を動かしている。
- 参考スコア(独自算出の注目度): 2.7058710173622544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A wealth of state-of-the-art systems demonstrate impressive improvements in performance, security, and reliability on programs composed of opaque components, such as Unix shell commands. To reason about commands, these systems require partial specifications. However, creating such specifications is a manual, laborious, and error-prone process, limiting the practicality of these systems. This paper presents Caruca, a system for automatic specification mining for opaque commands. To overcome the challenge of language diversity across commands, Caruca first instruments a large language model to translate a command's user-facing documentation into a structured invocation syntax. Using this representation, Caruca explores the space of syntactically valid command invocations and execution environments. Caruca concretely executes each command-environment pair, interposing at the system-call and filesystem level to extract key command properties such as parallelizability and filesystem pre- and post-conditions. These properties can be exported in multiple specification formats and are immediately usable by existing systems. Applying Caruca across 60 GNU Coreutils, POSIX, and third-party commands across several specification-dependent systems shows that Caruca generates correct specifications for all but one case, completely eliminating manual effort from the process and currently powering the full specifications for a state-of-the-art static analysis tool.
- Abstract(参考訳): 多くの最先端システムでは、Unixシェルコマンドのような不透明なコンポーネントで構成されるプログラムの性能、セキュリティ、信頼性が著しく改善されている。
コマンドを推論するためには、これらのシステムは部分的な仕様を必要とする。
しかし、そのような仕様を作成することは手動で、面倒で、エラーを起こしやすいプロセスであり、これらのシステムの実用性を制限する。
本稿では不透明コマンドの自動仕様マイニングシステムであるCarucaについて述べる。
コマンド間の言語多様性の課題を克服するため、Carucaはまず大きな言語モデルを使用して、コマンドのユーザ対応ドキュメンテーションを構造化された呼び出し構文に変換する。
この表現を使って、Carucaは構文的に有効なコマンド呼び出しと実行環境の空間を探索する。
Carucaは、各コマンド環境ペアを具体的に実行し、システムコールとファイルシステムレベルで相互接続して、並列化やファイルシステムの事前条件や後条件といった重要なコマンドプロパティを抽出する。
これらのプロパティは複数の仕様フォーマットでエクスポートでき、すぐに既存のシステムで使用することができる。
60のGNU Coreutil、POSIX、およびいくつかの仕様依存システムにまたがるサードパーティのコマンドにCarucaを適用すると、Carucaは1つのケースを除いて、正しい仕様を生成し、プロセスから手作業を完全に排除し、現在最先端の静的解析ツールの完全な仕様を電源としている。
関連論文リスト
- From Commands to Prompts: LLM-based Semantic File System for AIOS [46.29019415676847]
プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。
従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。
実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2024-09-23T08:39:16Z) - ControlCap: Controllable Region-level Captioning [57.57406480228619]
地域レベルのキャプションは、キャプション・デジェネレーションの問題によって挑戦される。
事前訓練されたマルチモーダルモデルは、最も頻繁なキャプションを予測する傾向にあるが、あまり頻繁でないキャプションを見逃す。
制御可能な領域レベルのキャプション手法を提案し,マルチモーダルモデルに制御語を導入する。
論文 参考訳(メタデータ) (2024-01-31T15:15:41Z) - InstructSeq: Unifying Vision Tasks with Instruction-conditioned
Multi-modal Sequence Generation [59.24938416319019]
InstructSeqは命令条件付きマルチモーダルモデリングフレームワークである。
柔軟な自然言語制御と視覚データとテキストデータの扱いにより、多様な視覚タスクを統一する。
論文 参考訳(メタデータ) (2023-11-30T18:59:51Z) - Large Language Models Based Automatic Synthesis of Software
Specifications [3.081650600579376]
SpecSynは、自然言語ソースからソフトウェア仕様を自動的に合成するフレームワークである。
提案手法は,シーケンス・ツー・シーケンスの学習問題として,ソフトウェア仕様の合成を定式化する。
論文 参考訳(メタデータ) (2023-04-18T01:22:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。