論文の概要: EngThrive: Make It Fast and Easy to Do Great Work
- arxiv url: http://arxiv.org/abs/2605.04259v1
- Date: Tue, 05 May 2026 19:50:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.523591
- Title: EngThrive: Make It Fast and Easy to Do Great Work
- Title(参考訳): EngThrive: 速くて簡単に仕事ができる
- Authors: Brian Houck, Tim Bozarth, David Liu, Dean Carignan,
- Abstract要約: 本稿では,Microsoftのエンジニアリング組織全体で開発された計測・改善システムであるEngineering Thrive(EngThrive)を紹介する。
EngThriveはスピード、Ease、Qualityという3つの側面の生産性を整理し、Thrivingをガードレールとして、開発者の幸福とパフォーマンスを両立させる。
本稿では,メトリクス選択の指針となる設計原則について述べる。例えば,よくできたメトリクスが「ゲーム」の振る舞いを真の改善と整合させるアプローチについて述べる。
- 参考スコア(独自算出の注目度): 2.097253337231134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Frameworks such as SPACE, DevEx, and DORA established that developer productivity is inherently multidimensional, but left practitioners with a practical question: what should we measure, and how should we use it to improve? This paper introduces Engineering Thrive (EngThrive), a measurement and improvement system developed and deployed across Microsoft's engineering organization. EngThrive organizes productivity around three dimensions - Speed, Ease, and Quality - with Thriving as a guardrail to ensure developer wellbeing improves alongside performance. Within each dimension, outcome-oriented North Star metrics are paired with diagnostic submetrics, combining system telemetry with developer surveys to provide both scale and context. We describe the design principles that guide metric selection, including an approach in which well-chosen metrics align "gaming" behavior with genuine improvement. We also outline the data platform, survey program, and dashboard ecosystem required to operationalize this approach in practice, and present case studies demonstrating how outcome-oriented measurement enables sustained, system-level improvements. Finally, we show that EngThrive functions as a general-purpose evaluation language, applicable not only to developer tools and AI, but to organizational policies, work environments, and other factors that shape how developers experience their work. We offer EngThrive as a concrete model for organizations seeking to move beyond measuring activity toward improving outcomes.
- Abstract(参考訳): SPACE、DevEx、DORAといったフレームワークは、開発者の生産性は本質的に多次元であることを確立しました。
本稿では,Microsoftのエンジニアリング組織全体で開発された計測・改善システムであるEngineering Thrive(EngThrive)を紹介する。
EngThriveはスピード、Ease、Qualityという3つの側面の生産性を整理し、Thrivingをガードレールとして、開発者の幸福とパフォーマンスを両立させる。
各次元において、結果指向のNorth Starメトリクスは診断サブメトリックと組み合わせられ、システムテレメトリと開発者調査を組み合わせて、スケールとコンテキストの両方を提供する。
本稿では,メトリクス選択の指針となる設計原則について述べる。例えば,よくできたメトリクスが「ゲーム」の振る舞いを真の改善と整合させるアプローチについて述べる。
また、本手法の運用に必要なデータプラットフォーム、調査プログラム、ダッシュボードエコシステムについても概説し、結果指向測定が持続的、システムレベルの改善を可能にすることを示すケーススタディを示す。
最後に、EngThriveは汎用的な評価言語として機能し、開発者ツールやAIだけでなく、組織ポリシーや作業環境、開発者の作業経験を形作るその他の要因にも適用できます。
EngThriveは、測定活動を超えて成果の改善を目指す組織にとって、具体的なモデルとして提供します。
関連論文リスト
- Impacts of Generative AI on Agile Teams' Productivity: A Multi-Case Longitudinal Study [5.9568322124195845]
生成人工知能(GenAI)ツールは、ソフトウェア工学におけるパラダイムシフトを表している。
この研究は、GenAIがアジャイルチームに与える影響の経年的評価を提供することを目的としている。
論文 参考訳(メタデータ) (2026-02-14T13:26:16Z) - PerfGuard: A Performance-Aware Agent for Visual Content Generation [53.591105729011595]
PerfGuardは、ビジュアルコンテンツ生成のためのパフォーマンス対応のエージェントフレームワークである。
ツールのパフォーマンス境界をタスク計画とスケジューリングに統合する。
ツール選択の正確性、実行の信頼性、ユーザの意図との整合性にメリットがあります。
論文 参考訳(メタデータ) (2026-01-30T05:12:19Z) - Towards Agentic Intelligence for Materials Science [73.4576385477731]
この調査は、コーパスキュレーションからプレトレーニングから、シミュレーションと実験プラットフォームに面した目標条件付きエージェントまで、ユニークなパイプライン中心の視点を推し進める。
コミュニティをブリッジし、参照の共有フレームを確立するために、まず、AIと材料科学をまたいだ用語、評価、ワークフローの段階を整列する統合レンズを提示する。
論文 参考訳(メタデータ) (2026-01-29T23:48:43Z) - From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence [150.3696990310269]
大規模言語モデル(LLM)は、自然言語記述を直接関数コードに変換することによって、自動ソフトウェア開発を変革した。
コードLLMに関する総合的な合成と実践的ガイド(一連の解析および探索実験)を提供する。
一般LLM(GPT-4, Claude, LLaMA)とコード特殊化LLM(StarCoder, Code LLaMA, DeepSeek-Coder, QwenCoder)のコード機能の解析を行う。
論文 参考訳(メタデータ) (2025-11-23T17:09:34Z) - High-level reasoning while low-level actuation in Cyber-Physical Systems: How efficient is it? [6.40412293456886]
この研究は、C++、Java、Jade、Jason、そしてファジィなJason BDIと緩やかに結合された統合を比較します。
この研究は、エンジニアリングのワークロードと実行効率の具体的なトレードオフを強調している。
本研究は,産業情報化におけるソフトウェア技術選択のためのエビデンスに基づくガイダンスに貢献する。
論文 参考訳(メタデータ) (2025-11-16T10:37:37Z) - MCP-RADAR: A Multi-Dimensional Benchmark for Evaluating Tool Use Capabilities in Large Language Models [33.250579401886206]
本稿では,モデルコンテキストプロトコル(MCP)フレームワークにおいて,LLM(Large Language Models)の性能を評価するために設計された最初の総合ベンチマークであるMPP-RADARを紹介する。
MCP-RADARは、数学的推論、Web検索、Eメール、カレンダー、ファイル管理、端末操作の6つの領域にまたがる507のタスクからなる挑戦的なデータセットを備えている。
主観的な人的評価やバイナリ成功のメトリクスに依存する従来のベンチマークとは異なり、MPP-RADARは複数のタスク領域にわたる客観的な定量測定を採用する。
論文 参考訳(メタデータ) (2025-05-22T14:02:37Z) - How to Measure Performance in Agile Software Development? A Mixed-Method Study [2.477589198476322]
この研究は、アジャイルソフトウェア開発のパフォーマンス指標を実際に使用するときに生じる課題を特定することを目的としている。
結果として、広く使用されているパフォーマンスメトリクスが実際に広く使用されている一方で、アジャイルソフトウェア開発チームは透明性と標準化の欠如と不十分な正確性のために、課題に直面しています。
論文 参考訳(メタデータ) (2024-07-08T19:53:01Z) - Copilot Evaluation Harness: Evaluating LLM-Guided Software Programming [12.355284125578342]
大規模言語モデル(LLM)は、現代のソフトウェア開発の焦点となっている。
LLMは、インテリジェントでチャット駆動のプログラミングアシスタントとして機能することで、開発者の生産性を大幅に向上する可能性がある。
しかし、それぞれのシステムは、最高のパフォーマンスを確保するために、LLMをそのワークスペースに向ける必要がある。
論文 参考訳(メタデータ) (2024-02-22T03:51:34Z) - Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming [77.38174112525168]
私たちは、WS 学習パイプラインの全体的な生産性を、一般的な WS 監督アプローチと比較して平均20%(最大 47% のタスク)改善する、エンドツーエンドのインタラクティブなスーパービジョンシステムである Nemo を紹介します。
論文 参考訳(メタデータ) (2022-03-02T19:57:32Z) - Lifelong Learning Metrics [63.8376359764052]
DARPA Lifelong Learning Machines (L2M) プログラムは、人工知能(AI)システムの進歩を目指している。
本論文は、生涯学習シナリオを実行するエージェントのパフォーマンスの構築と特徴付けのためのフォーマリズムを概説する。
論文 参考訳(メタデータ) (2022-01-20T16:29:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。