論文の概要: Feedback-based Automated Verification in Vibe Coding of CAS Adaptation Built on Constraint Logic
- arxiv url: http://arxiv.org/abs/2602.18607v1
- Date: Fri, 20 Feb 2026 20:49:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.190583
- Title: Feedback-based Automated Verification in Vibe Coding of CAS Adaptation Built on Constraint Logic
- Title(参考訳): 制約論理に基づくCAS適応のビブ符号化におけるフィードバックに基づく自動検証
- Authors: Michal Töpfer, František Plášil, Tomáš Bureš, Petr Hnětynka,
- Abstract要約: CAS適応では、システムの動的アーキテクチャと振る舞いの変化を定義することが課題である。
生成LDMの進歩により、システム仕様と望ましいAM動作に基づいてAMコードを生成することは魅力的な機会である。
提案手法は, 動作条件の極めて正確な定式化に基づいて生成したAMの検証を行う場合, ビブ符号化フィードバックループによるAM生成が有効な選択肢であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In CAS adaptation, a challenge is to define the dynamic architecture of the system and changes in its behavior. Implementation-wise, this is projected into an adaptation mechanism, typically realized as an Adaptation Manager (AM). With the advances of generative LLMs, generating AM code based on system specification and desired AM behavior (partially in natural language) is a tempting opportunity. The recent introduction of vibe coding suggests a way to target the problem of the correctness of generated code by iterative testing and vibe coding feedback loops instead of direct code inspection. In this paper, we show that generating an AM via vibe coding feedback loops is a viable option when the verification of the generated AM is based on a very precise formulation of the functional requirements. We specify these as constraints in a novel temporal logic FCL that allows us to express the behavior of traces with much finer granularity than classical LTL enables. Furthermore, we show that by combining the adaptation and vibe coding feedback loops where the FCL constraints are evaluated for the current system state, we achieved good results in the experiments with generating AMs for two example systems from the CAS domain. Typically, just a few feedback loop iterations were necessary, each feeding the LLM with reports describing detailed violations of the constraints. This AM testing was combined with high run path coverage achieved by different initial settings.
- Abstract(参考訳): CAS適応では、システムの動的アーキテクチャと振る舞いの変化を定義することが課題である。
実装面では、これは適応マネージャ(AM)として一般的に実現される適応メカニズムに投影される。
生成LDMの進歩により、システム仕様と所望のAM動作(一部は自然言語)に基づいてAMコードを生成することは魅力的な機会である。
最近のビブ符号の導入は、直接コード検査ではなく、反復的なテストとビブ符号フィードバックループによって生成されたコードの正しさの問題を目標にする方法を示唆している。
本稿では,ビブ符号化フィードバックループによるAM生成が,機能要件の極めて正確な定式化に基づいて生成したAMの検証を行う場合,有効な選択肢であることを示す。
従来のLTLよりも微粒度でトレースの挙動を表現できる新しい時間論理 FCL の制約として指定する。
さらに、FCL制約が評価される適応とビブ符号フィードバックループを組み合わせることで、CASドメインから2つのサンプルシステムに対してAMを生成する実験において、良好な結果が得られることを示す。
通常、フィードバックループのイテレーションはほんの数回必要で、それぞれに制約の詳細な違反を報告したレポートをLLMに提供する。
このAMテストは、異なる初期設定によって達成された高い実行パスカバレッジと組み合わせられた。
関連論文リスト
- ReCALL: Recalibrating Capability Degradation for MLLM-based Composed Image Retrieval [64.14282916266998]
Composed Image Retrievalは、参照画像と修正テキストからなるハイブリッドクエリに基づいてターゲット画像を取得することを目的としている。
本稿では,診断・生成・再定義パイプラインに従うモデルに依存しないフレームワークであるReCALLを提案する。
CIRRとFashionIQの実験では、ReCALLは継続的に劣化した機能を再検討し、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-02T04:52:54Z) - Environment-Aware Code Generation: How far are We? [52.69113158357018]
大規模言語モデル(LLM)がユーザの特定の環境に適した実行可能コードを確実に生成できるかどうかは不明である。
本稿では,環境対応コード生成(EACG)の最初の体系的研究について述べる。
その結果,現在のLLMは環境固有のコード生成に苦しむ一方で,環境の適合性や実行性も向上していることがわかった。
論文 参考訳(メタデータ) (2026-01-18T04:58:15Z) - LLM-Empowered Event-Chain Driven Code Generation for ADAS in SDV systems [24.318466695095026]
本稿では、自然言語要求から検証済みの自動車コードを生成するためのイベントチェーン駆動LLM駆動ワークフローを提案する。
LLMの再トレーニングなしに、有効な信号利用と一貫したコード生成を実現しました。
論文 参考訳(メタデータ) (2025-11-26T19:53:04Z) - CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward [50.97588334916863]
評価と結果報酬のための正確で堅牢な軽量検証モデルであるCompassVerifierを開発した。
数学、知識、多種多様な推論タスクにまたがる多分野の能力を示し、様々な答えの型を処理する能力を示す。
我々は,複数のデータソースから収集したモデル出力からなるVerifierBenchベンチマークを導入し,メタエラーパターンを手動で解析してCompassVerifierを強化する。
論文 参考訳(メタデータ) (2025-08-05T17:55:24Z) - Set-LLM: A Permutation-Invariant LLM [2.9665130256021]
本論文は,大規模言語モデル(LLM)の順序感度という,特定の脆弱性によって動機付けられている。
本研究では,事前学習型LLMに対する新しいアーキテクチャ適応であるSet-LLMを導入し,置換不変性を保証する混合集合文入力の処理を可能にする。
論文 参考訳(メタデータ) (2025-05-21T12:14:26Z) - Teaching Your Models to Understand Code via Focal Preference Alignment [70.71693365502212]
既存の手法では、テストケースの成功率に基づいてn個の候補解が評価される。
このアプローチは、特定のエラーを特定するのではなく、失敗するコードブロック全体を整列するので、意味のあるエラーと訂正の関係を捉えるのに必要な粒度が欠けている。
我々は、人間の反復デバッグを模倣してコードLLMを洗練させる新しい優先順位調整フレームワークであるTarget-DPOを提案する。
論文 参考訳(メタデータ) (2025-03-04T16:56:34Z) - Attribute Controlled Fine-tuning for Large Language Models: A Case Study on Detoxification [76.14641982122696]
本稿では,属性制御付き大規模言語モデル(LLM)の制約学習スキーマを提案する。
提案手法は, ベンチマーク上での競合性能と毒性検出タスクを達成しながら, 不適切な応答を少ないLCMに導出することを示す。
論文 参考訳(メタデータ) (2024-10-07T23:38:58Z) - StepCoder: Improve Code Generation with Reinforcement Learning from
Compiler Feedback [58.20547418182074]
2つの主要コンポーネントからなるコード生成の新しいフレームワークであるStepCoderを紹介します。
CCCSは、長いシーケンスのコード生成タスクをCurriculum of Code Completion Subtaskに分割することで、探索課題に対処する。
FGOは、未実行のコードセグメントをマスクすることでのみモデルを最適化し、Fine-Grained Optimizationを提供する。
提案手法は,出力空間を探索し,対応するベンチマークにおいて最先端の手法より優れた性能を発揮する。
論文 参考訳(メタデータ) (2024-02-02T13:14:31Z) - ChIRAAG: ChatGPT Informed Rapid and Automated Assertion Generation [10.503097140635374]
ChIRAAGはOpenAI GPT4をベースとして、設計の自然言語仕様からSystem Verilog Assertion (SVA)を生成する。
実験では、LSM生成した生のアサーションの27%に誤りがあり、数回の反復で修正された。
以上の結果から,LLMはアサーション生成プロセスにおいて技術者を合理化し,支援し,検証を再構築できることが示唆された。
論文 参考訳(メタデータ) (2024-01-31T12:41:27Z) - Fixing Large Language Models' Specification Misunderstanding for Better Code Generation [13.494822086550604]
muFiXは、大きな言語モデル(LLM)のコード生成性能を改善する新しいプロンプト技術である。
まず、テストケース分析を利用して仕様の理解を得、自己改善プロセスを可能にする。
muFiXはさらに、提供された理解と実際の理解の間のギャップを減らす方向に向けた仕様理解を修正している。
論文 参考訳(メタデータ) (2023-09-28T02:58:07Z) - Capacity Optimality of OAMP in Coded Large Unitarily Invariant Systems [9.101719525164803]
本稿では、単位不変感センサ行列、任意の信号分布、前方誤り制御(FEC)符号化を含む単位不変システム(LUIS)について検討する。
最適化符号を用いたOAMPは、最適化されていない符号とよく知られたTurbo linear MMSEアルゴリズムよりも大幅に性能が向上していることを示す。
論文 参考訳(メタデータ) (2022-06-23T13:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。