論文の概要: Treating Run-time Execution History as a First-Class Citizen: Co-Versioning Run-time Behavior alongside Code
- arxiv url: http://arxiv.org/abs/2604.16933v1
- Date: Sat, 18 Apr 2026 09:36:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.246366
- Title: Treating Run-time Execution History as a First-Class Citizen: Co-Versioning Run-time Behavior alongside Code
- Title(参考訳): ファーストクラス市民としての実行履歴の扱い--コードと並行して実行行動の同時検証
- Authors: Marcus Kessel,
- Abstract要約: この記事では、このミスマッチが、ソフトウェア進化分析とCIの盲点に寄与している、と論じる。
我々は、Git履歴とtextitBehavioral Archiveを結合するパラダイムである textitBehavioral Co-Versioningを提案する。
これにより、セマンティックディファリング、行動認識の回帰ローカライゼーション、そして過去の実行を照会して振り返り監査が可能になる。
- 参考スコア(独自算出の注目度): 2.6397379133308214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Behavioral Co-Versioning remains absent from mainstream practice: while developers routinely version source code with Git, they rarely persist and query how run-time behavior evolves across revisions. This paper argues that this mismatch contributes to a blind spot in software evolution analysis and CI, where rich execution information is discarded and typically reduced to pass/fail outcomes -- despite partial test oracles, flakiness, and silent output or performance drift. We propose \textit{Behavioral Co-Versioning}, a paradigm that couples the Git history with a \textit{Behavioral Archive}: an append-only, queryable store of selected run-time observations (e.g., method I/O and performance signals) collected during test runs and keyed by commit and test context. This enables semantic diffing, behavior-aware regression localization, and retrospective auditing by querying historical executions, complementing proactive, signal-specific monitoring tools. We first outline a minimal data model and change diagnostics based on code/test/behavior fingerprints, and then demonstrate feasibility with a laptop-scale prototype that replays historical commits of a Python project, archives run-time observations in a local Parquet-backed store, and detects behavioral changes not apparent from textual diffs.
- Abstract(参考訳): 開発者は定期的にGitでソースコードをバージョン管理するが、リビジョン全体にわたって実行時の振る舞いがどのように進化するかを問うことは滅多にない。
この記事では、このミスマッチがソフトウェアの進化分析とCIにおいて盲点となり、リッチな実行情報が破棄され、通常はパス/失敗の結果に還元される、と主張する。
本稿では,Git の履歴を \textit{Behavioral Archive} と結合するパラダイムである \textit{Behavioral Co-Versioning} を提案する。
これにより、セマンティックディファレンス、行動認識のレグレッションローカライゼーション、過去の実行をクエリして、プロアクティブで信号固有の監視ツールを補完することで、ふりかえり監査が可能になる。
まず、コード/テスト/振る舞いの指紋に基づいて最小限のデータモデルと診断を概説し、それからPythonプロジェクトの過去のコミットをリプレイし、ローカルのParquet支援ストアで実行時の観察をアーカイブし、テキスト差分から明らかでない振る舞い変化を検出する、ラップトップスケールのプロトタイプの実現可能性を示します。
関連論文リスト
- Interactive Tracking: A Human-in-the-Loop Paradigm with Memory-Augmented Adaptation [60.96010213186819]
自然言語コマンドを使用していつでもトラッカーをガイドできる新しいパラダイムであるInteractive Trackingを導入する。
対話型トラッキングのための最初の大規模ベンチマークであるInteractTrackについて紹介する。
第3に,ユーザからのフィードバックから学習し,トラッキング動作を更新するために動的メモリ機構を利用する新しいベースラインであるInteractive Memory-Augmented Tracking (IMAT)を導入する。
論文 参考訳(メタデータ) (2026-04-02T12:33:27Z) - AlgoVeri: An Aligned Benchmark for Verified Code Generation on Classical Algorithms [54.99368693313797]
既存のベンチマークでは、個々の言語/ツールのみをテストするため、パフォーマンス番号は直接比較できない。
このギャップに対処するAlgoVeriは、Dafny、Verus、Leanで77ドルの古典的アルゴリズムのベリコーディングを評価するベンチマークです。
論文 参考訳(メタデータ) (2026-02-10T06:58:26Z) - Towards Observation Lakehouses: Living, Interactive Archives of Software Behavior [2.6397379133308214]
先行研究では,Sequence Sheets,StimulusResponse Matrices,StimulusResponse Cubesを用いて表現を行った。
本稿では,連続SRCを運用する観測用レイクハウスについて紹介する。
制御パイプライン(SOLAS)とCILASからデータを取り込み、n-versionアセスメント、行動クラスタリング、コンセンサスオラクルを可能にします。
論文 参考訳(メタデータ) (2025-12-02T14:12:36Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - A Case Study on Model Checking and Runtime Verification for Awkernel [0.7199733380797578]
人間が手動で同時動作をレビューしたり、可能なすべての実行をカバーしたテストケースを書くことは難しい。
本稿では,スケジューラなどの並列ソフトウェアの開発手法を提案する。
論文 参考訳(メタデータ) (2025-03-12T11:27:45Z) - GitChameleon: Unmasking the Version-Switching Capabilities of Code Generation Models [16.6780665807022]
textbfGitChameleonは、116のPythonコード補完問題からなる、手動でキュレートされた新しいデータセットである。
GitChameleonは、バージョン固有のコードを生成するためのモダンな大規模言語モデルの性能を厳格に評価するように設計されている。
論文 参考訳(メタデータ) (2024-11-05T23:34:06Z) - Multiversion Hindsight Logging for Continuous Training [8.861816325333963]
Multiversion Hindsight Loggingでは、古いバージョンが異なるデータをログしている場合でも、エンジニアが過去のバージョンをクエリできる。
FlorDBは、履歴クエリの効率的な処理のための統一リレーショナルモデルを提供する。
論文 参考訳(メタデータ) (2023-10-11T21:10:15Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。