論文の概要: Causal Software Engineering: A Vision and Roadmap
- arxiv url: http://arxiv.org/abs/2605.02454v1
- Date: Mon, 04 May 2026 10:58:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.247783
- Title: Causal Software Engineering: A Vision and Roadmap
- Title(参考訳): 因果的ソフトウェアエンジニアリング - ビジョンとロードマップ
- Authors: Roberto Pietrantuono, Luca Giamattei, Stefano Russo, Julien Siebert, Neil Walkinshaw,
- Abstract要約: 因果的ソフトウェアエンジニアリング(Causal Software Engineering, CSE)は、因果的モデルと因果的推論がソフトウェアライフサイクル全体にわたるアクティビティを体系的に通知する未来のパラダイムである。
i)開発と運用にまたがる因果優先のワークフロービュー、(ii)ツールと組織採用のための段階的なロードマップ、(iii)進捗を評価するための評価とベンチマークアジェンダの概要を概説する。
- 参考スコア(独自算出の注目度): 8.555120836654966
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software engineering increasingly involves making high-stakes decisions under uncertainty, using signals from code, field data, and socio-technical processes. Recent AI-driven support (e.g., anomaly detection, predictive analytics, AIOps, as well as LLM-based agents) has amplified engineers' ability to detect patterns and synthesize content and recommendations, but many critical questions are interventional or counterfactual: What is the expected impact of changing a load-balancing strategy? Would an outage have been avoided under a different release plan? Correlational models answer "what tends to co-occur"; they struggle to answer "what would happen if we act." We propose Causal Software Engineering (CSE) as a future paradigm in which causal models and causal reasoning systematically inform activities across the software lifecycle, augmenting existing practices with explicit assumptions, uncertainty-aware effect estimates, and counterfactual diagnosis. We outline (i) a causal-first workflow view spanning development and operations, (ii) a staged roadmap for tools and organizational adoption, and (iii) an evaluation and benchmark agenda for measuring progress.
- Abstract(参考訳): ソフトウェアエンジニアリングは、コードやフィールドデータ、社会技術的プロセスからの信号を使用して、不確実性の下で高い意思決定を行うことが多い。
最近のAI駆動サポート(異常検出、予測分析、AIOps、LLMベースのエージェントなど)は、パターンを検出し、コンテントとレコメンデーションを合成するエンジニアの能力を増幅している。
別のリリース計画の下で、障害は避けられるだろうか?
相関モデルは「共起する傾向があるもの」に答え、「我々が行動すればどうなるか」に答えるのに苦労する。
我々は,因果モデルと因果推論をソフトウェアライフサイクル全体にわたって体系的に通知し,明示的な仮定による既存のプラクティスの強化,不確実性を考慮した効果推定,および対実診断を行うための将来のパラダイムとして,因果ソフトウェアエンジニアリング(CSE)を提案する。
概略
(i)開発と運用にまたがる因果優先のワークフロービュー。
(ii)ツールと組織採用のための段階的なロードマップ、
三 進捗を測る評価及びベンチマークの議題
関連論文リスト
- The Semi-Executable Stack: Agentic Software Engineering and the Expanding Scope of SE [3.6320170149653985]
AIベースのシステムは、ソフトウェアエンジニアリングに対する脅威として、ますます議論されている。
この論文は別の読み方を主張する。
設計されているものは、実行可能なコードから半実行可能なアーティファクトへと拡張するということです。
論文 参考訳(メタデータ) (2026-04-16T18:36:02Z) - On the Paradoxical Interference between Instruction-Following and Task Solving [50.75960598434753]
次の命令は、大規模言語モデル(LLM)を、タスクの実行方法に関する明示的な制約を指定することで、人間の意図と整合させることを目的としている。
我々は,LLMのタスク解決能力にパラドックス的に干渉する命令に従うという,直感に反する現象を明らかにした。
本稿では,タスク解決に追従する命令の干渉を定量化する指標として,SUSTAINSCOREを提案する。
論文 参考訳(メタデータ) (2026-01-29T17:48:56Z) - Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。
SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。
本稿では,この新興領域を体系的に調査する。
論文 参考訳(メタデータ) (2026-01-15T18:55:03Z) - A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [56.40989626804489]
この調査は、Large Language Modelsを使ったソフトウェアエンジニアリングに関する、最初の総合的な分析を提供する。
本稿では,150以上の最近の論文をレビューし,(1)素早い,微調整,エージェントベースのパラダイムに分類した解法,(2)コード生成,翻訳,修復などのタスクを含むベンチマークという2つの重要な側面に沿った分類法を提案する。
論文 参考訳(メタデータ) (2025-10-10T06:56:50Z) - Understanding Software Engineering Agents: A Study of Thought-Action-Result Trajectories [17.975121612118752]
大規模言語モデル(LLM)ベースのエージェントは、複雑なソフトウェアエンジニアリングタスクを自動化するためにますます採用されている。
本研究は,3種類のLLM系エージェントの思考-反感-反感の軌跡について,大規模な実証的研究を行った。
我々は,数量やトークン消費,反復的な行動系列,思考,行動,結果のセマンティックコヒーレンスといった重要な軌道特性を同定する。
論文 参考訳(メタデータ) (2025-06-23T16:34:52Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Generative AI and Empirical Software Engineering: A Paradigm Shift [9.284024538100063]
本稿では,大規模言語モデルのソフトウェア工学への統合が,確立した研究パラダイムをいかに破壊するかを考察する。
我々は、我々が研究している現象、我々が依存する方法や理論、分析するデータ、そして、動的AIを介する環境で発生する妥当性に対する脅威をどう変えるかについて議論する。
私たちの目標は、経験豊かなソフトウェアエンジニアリングコミュニティが、AIシステムが単なるツールではなく、ソフトウェアエンジニアリングとその研究を形作る活発な協力者の未来に、その質問や道具、検証基準を適合させることです。
論文 参考訳(メタデータ) (2025-02-12T04:13:07Z) - SQAPlanner: Generating Data-InformedSoftware Quality Improvement Plans [10.032135866890384]
SQAPlannerアプローチの情報視覚化を開発し、評価します。
調査回答者の80%は、可視化がより実行可能であると認識しています。
論文 参考訳(メタデータ) (2021-02-19T00:17:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。