論文の概要: Caruca: Effective and Efficient Specification Mining for Opaque Software Components
- arxiv url: http://arxiv.org/abs/2510.14279v1
- Date: Thu, 16 Oct 2025 04:02:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.714339
- Title: Caruca: Effective and Efficient Specification Mining for Opaque Software Components
- Title(参考訳): Caruca: 不透明なソフトウェアコンポーネントのための効果的で効率的な仕様マイニング
- Authors: Evangelos Lamprou, Seong-Heon Jung, Mayank Keoliya, Lukas Lazarek, Konstantinos Kallas, Michael Greenberg, Nikos Vasilakis,
- Abstract要約: Carucaは不透明なコマンドの自動仕様マイニングシステムである。
1つのケースを除いて、正しい仕様を生成する。
現在、最先端の静的解析ツールの完全な仕様を動かしている。
- 参考スコア(独自算出の注目度): 2.7058710173622544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A wealth of state-of-the-art systems demonstrate impressive improvements in performance, security, and reliability on programs composed of opaque components, such as Unix shell commands. To reason about commands, these systems require partial specifications. However, creating such specifications is a manual, laborious, and error-prone process, limiting the practicality of these systems. This paper presents Caruca, a system for automatic specification mining for opaque commands. To overcome the challenge of language diversity across commands, Caruca first instruments a large language model to translate a command's user-facing documentation into a structured invocation syntax. Using this representation, Caruca explores the space of syntactically valid command invocations and execution environments. Caruca concretely executes each command-environment pair, interposing at the system-call and filesystem level to extract key command properties such as parallelizability and filesystem pre- and post-conditions. These properties can be exported in multiple specification formats and are immediately usable by existing systems. Applying Caruca across 60 GNU Coreutils, POSIX, and third-party commands across several specification-dependent systems shows that Caruca generates correct specifications for all but one case, completely eliminating manual effort from the process and currently powering the full specifications for a state-of-the-art static analysis tool.
- Abstract(参考訳): 多くの最先端システムでは、Unixシェルコマンドのような不透明なコンポーネントで構成されるプログラムの性能、セキュリティ、信頼性が著しく改善されている。
コマンドを推論するためには、これらのシステムは部分的な仕様を必要とする。
しかし、そのような仕様を作成することは手動で、面倒で、エラーを起こしやすいプロセスであり、これらのシステムの実用性を制限する。
本稿では不透明コマンドの自動仕様マイニングシステムであるCarucaについて述べる。
コマンド間の言語多様性の課題を克服するため、Carucaはまず大きな言語モデルを使用して、コマンドのユーザ対応ドキュメンテーションを構造化された呼び出し構文に変換する。
この表現を使って、Carucaは構文的に有効なコマンド呼び出しと実行環境の空間を探索する。
Carucaは、各コマンド環境ペアを具体的に実行し、システムコールとファイルシステムレベルで相互接続して、並列化やファイルシステムの事前条件や後条件といった重要なコマンドプロパティを抽出する。
これらのプロパティは複数の仕様フォーマットでエクスポートでき、すぐに既存のシステムで使用することができる。
60のGNU Coreutil、POSIX、およびいくつかの仕様依存システムにまたがるサードパーティのコマンドにCarucaを適用すると、Carucaは1つのケースを除いて、正しい仕様を生成し、プロセスから手作業を完全に排除し、現在最先端の静的解析ツールの完全な仕様を電源としている。
関連論文リスト
- Youtu-Parsing: Perception, Structuring and Recognition via High-Parallelism Decoding [35.429403152845836]
Youtu-Parsingは、高性能コンテンツ抽出のために設計された、効率的で汎用的な文書解析モデルである。
このモデルは稀な文字、多言語テキスト、手書きコンテンツを扱う際に強い堅牢性を示す。
Youtu-ParsingはOmniDocBenchおよびolmOCR-benchベンチマーク上での最先端(SOTA)パフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-01-28T09:37:13Z) - Sharpen the Spec, Cut the Code: A Case for Generative File System with SYSSPEC [6.536447932095715]
本稿では,生成ファイルシステムを開発するためのフレームワークであるSYSSPECを紹介する。
不正確なプロンプトの代わりに、SYSSPECはファイルシステムの機能を正確に記述するマルチパート仕様を採用している。
進化を管理するため,仕様自体で動作するDAG構造化パッチを開発した。
論文 参考訳(メタデータ) (2025-12-15T07:15:01Z) - WGRAMMAR: Leverage Prior Knowledge to Accelerate Structured Decoding [58.1177179119881]
我々は、ドメイン認識の単純化、制約分解、マスクキャッシングを統合した軽量デコードエンジンであるwgrammarを紹介する。
wgrammarは、既存のシステムよりも最大250倍のスピードアップを実現します。
論文 参考訳(メタデータ) (2025-07-22T17:13:47Z) - Classifier-Guided Captioning Across Modalities [69.75111271002137]
本稿では,音声キャプションにおける可聴性の獲得など,代替設定のセマンティクスにキャプションネットワークを適用する手法を提案する。
本フレームワークは, (i) 言語モデル(LM)を組み込んだ冷凍キャプションシステムと, (ii) キャプションシステムを案内するテキスト分類器の2つの主要コンポーネントから構成される。
特に、既存のゼロショット音声キャプションシステムと組み合わせることで、その品質を改善し、ゼロショット音声キャプションにおける最先端の性能を設定する。
論文 参考訳(メタデータ) (2025-01-03T18:09:26Z) - From Commands to Prompts: LLM-based Semantic File System for AIOS [46.29019415676847]
プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。
従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。
実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2024-09-23T08:39:16Z) - VideoGUI: A Benchmark for GUI Automation from Instructional Videos [78.97292966276706]
VideoGUIは、ビジュアル中心のGUIタスクでGUIアシスタントを評価するために設計された、新しいマルチモーダルベンチマークである。
高品質なWebインストラクショナルビデオから得られたベンチマークは、プロフェッショナルと新しいソフトウェアに関わるタスクに焦点を当てている。
評価の結果,SoTAの大規模マルチモーダルモデルであるGPT4oでさえ,視覚中心のGUIタスクでは不十分であることが判明した。
論文 参考訳(メタデータ) (2024-06-14T17:59:08Z) - ControlCap: Controllable Region-level Captioning [57.57406480228619]
地域レベルのキャプションは、キャプション・デジェネレーションの問題によって挑戦される。
事前訓練されたマルチモーダルモデルは、最も頻繁なキャプションを予測する傾向にあるが、あまり頻繁でないキャプションを見逃す。
制御可能な領域レベルのキャプション手法を提案し,マルチモーダルモデルに制御語を導入する。
論文 参考訳(メタデータ) (2024-01-31T15:15:41Z) - InstructSeq: Unifying Vision Tasks with Instruction-conditioned
Multi-modal Sequence Generation [59.24938416319019]
InstructSeqは命令条件付きマルチモーダルモデリングフレームワークである。
柔軟な自然言語制御と視覚データとテキストデータの扱いにより、多様な視覚タスクを統一する。
論文 参考訳(メタデータ) (2023-11-30T18:59:51Z) - Large Language Models Based Automatic Synthesis of Software
Specifications [3.081650600579376]
SpecSynは、自然言語ソースからソフトウェア仕様を自動的に合成するフレームワークである。
提案手法は,シーケンス・ツー・シーケンスの学習問題として,ソフトウェア仕様の合成を定式化する。
論文 参考訳(メタデータ) (2023-04-18T01:22:44Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。