論文の概要: Automating Low-Risk Code Review at Meta: RADAR, Risk Calibration, and Review Efficiency
- arxiv url: http://arxiv.org/abs/2605.30208v1
- Date: Thu, 28 May 2026 16:44:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.550195
- Title: Automating Low-Risk Code Review at Meta: RADAR, Risk Calibration, and Review Efficiency
- Title(参考訳): Metaでの低リスクコードレビューの自動化: RADAR、リスク校正、レビュー効率
- Authors: Chris Adams, Arjun Singh Banga, Parveen Bansal, Souvik Bhattacharya, Rujin Cao, Pedro Canahuati, Nate Cook, Brian Ellis, Prabhakar Goyal, Gurinder Grewal, Tianyu He, Matt Labunka, Alex Manners, David Molnar, Ging Cee Ng, Vishal Parekh, Jiefu Pei, Frederic Sagnes, James Saindon, Will Shackleton, Sid Sidhu, Gursharan Singh, Karthik Chengayan Sridhar, Matt Steiner, Pratibha Udmalpet, Sean Xia, Stacey Yan, Audris Mockus, Peter Rigby, Nachiappan Nagappan,
- Abstract要約: Metaでは、人為的な差分あたりのコード行数が前年比105.9%増加した。
開発者毎の差額は51%増加し、エージェントAIが80%以上を占めた。
我々は、キャリブレーションから影響まで、実現可能性から進展する3つの質問を行う。
- 参考スコア(独自算出の注目度): 10.379265985245537
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: AI-assisted coding tools have altered software production. At Meta, significant lines of code per human-landed diff grew by 105.9% year over year and per-developer diff volume rose 51%, with agentic AI responsible for over 80% of that growth. Meanwhile, the share of diffs receiving timely review has declined, exposing a widening gap between code supply and reviewer bandwidth. We ask three questions that progress from feasibility through calibration to impact: (1) can risk-stratified automation operate at scale across diverse organizations, (2) how does tuning the risk threshold affect the trade-off between automation yield and safety, and (3) to what extent does automated review reduce end-to-end latency for AI-generated changes? We deployed RADAR (Risk Aware Diff Auto Review), a multi-stage funnel that classifies each diff by authorship and source type, applies eligibility gates, static heuristics, a machine-learned Diff Risk Score, LLM-based Automated Code Review, and deterministic validation before landing qualifying changes. We evaluate RADAR through telemetry covering 535K+ RADAR-reviewed diffs, observational before-after comparisons for policy changes, and difference-in-differences analysis of efficiency outcomes. RADAR has reviewed 535K+ diffs and landed 331K+. Relaxing the Diff Risk Score threshold from the 25th to the 50th percentile increased the approve rate to 60.31%. The revert rate for RADAR-reviewed diffs is 1/3 that of non-RADAR diffs, and the Production Incident rate is 1/50 that of non-RADAR diffs. RADAR reduces median time to close by over 330% and median diff review wall time by 35%. Risk-aware layered automation can materially reduce review bottlenecks created by AI-driven code growth without compromising production safety.
- Abstract(参考訳): AI支援コーディングツールは、ソフトウェア生産を変更した。
Metaでは、人為的な差分あたりのコード行数が年105.9%増加し、開発者ごとの差分体積は51%増加し、エージェントAIが80%以上を占めるようになった。
一方、タイムリーなレビューを受ける差分の割合は減少しており、コードサプライとレビュアーの帯域幅のギャップが拡大している。
1) リスク階層化された自動化は,さまざまな組織にわたって大規模に運用できる (2) 自動化の利得と安全性のトレードオフに,リスクしきい値の調整はどのような影響を与えるのか,(3) 自動レビューはAIが生成する変更のエンドツーエンドのレイテンシをどの程度削減できるのか?
我々はRADAR(Risk Aware Diff Auto Review)をデプロイし、各diffを著者とソースタイプで分類し、適性ゲート、静的ヒューリスティックス、機械学習Diff Risk Score、LLMベースのAutomated Code Review、着陸資格変更前の決定論的検証を行った。
我々は,535K+ RADAR-reviewed diffsをカバーするテレメトリによるRADARの評価,政策変更の事前比較,効果の差分分析を行った。
RADARは535K+の差分をレビューし、331K+を着陸させた。
ディフリスクスコアの閾値を25位から50位に下げると、承認率は60.31%に上昇した。
RADARリビューディフの逆レートは、非RADARディフの1/3であり、生産インシデントレートは非RADARディフの1/50である。
RADARは、中央値の時間を330%以上削減し、中央値の差分審査時間を35%削減する。
リスクを意識した階層化自動化は、プロダクションの安全性を損なうことなく、AI駆動のコード成長によって生じるレビューボトルネックを大幅に削減することができる。
関連論文リスト
- Amplifying, Not Learning: Fine-Tuned AI Text Detectors Amplify a Pretrained Direction [51.56484100374058]
テキスト検出器は、事前訓練された典型軸を増幅する。
タスク監督前の生エンコーダでは、3つのアーキテクチャでNYT-vs-HC3 AUROC 0.806/0.944/0.834を達成する。
RoBERTaベースでは、生のプロジェクションは微調整を超えるが、RoBERTaベースでは、フル微調整は、試験された流線型人口の双方で生よりも識別を小さくする。
論文 参考訳(メタデータ) (2026-05-20T19:08:38Z) - AIRA: AI-Induced Risk Audit: A Structured Inspection Framework for AI-Generated Code [0.0]
AIによって生成されたコードは、静かに失敗する傾向がある。
本稿では,このパターンが人間のフィードバックによる最適化の成果を反映するかもしれないという仮説を,Reward-Shaped Failure hypothesisで紹介する。
AIRAは、コード内の失敗不確実なパターンを検出するために設計された決定論的15チェック検査フレームワークである。
論文 参考訳(メタデータ) (2026-04-19T19:32:52Z) - TDAD: Test-Driven Agentic Development - Reducing Code Regressions in AI Coding Agents via Graph-Based Impact Analysis [0.0]
TDADはソースコードとテスト間の依存性マップを構築し、パッチをコミットする前に、エージェントはどのテストを検証して自己修正するかを知っている。
本稿では,AI符号化エージェントの事前変更影響分析を行うオープンソースツールであるTDADを提案する。
論文 参考訳(メタデータ) (2026-03-18T17:38:22Z) - Will It Survive? Deciphering the Fate of AI-Generated Code in Open Source [3.6525095710982924]
一般的な仮説では、コードは"使い捨て"であり、すぐにマージされるが、その後すぐに破棄される。
我々は,201件のオープンソースプロジェクトの生存状況を分析し,AIエージェントが作成した20万件のコード修復ユニットを人に対して追跡する。
論文 参考訳(メタデータ) (2026-01-23T15:00:46Z) - Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - LiDAR View Synthesis for Robust Vehicle Navigation Without Expert Labels [50.40632021583213]
我々は、危険な位置で物理的に運転することなく、新しい視点からLiDAR点雲を合成することを提案する。
我々は、LiDARスキャンを入力とし、将来の軌跡を出力として予測するディープラーニングモデルを訓練する。
次に、この予測軌道にウェイポイントコントローラを適用して、エゴ車両のスロットルおよびステアリングラベルを決定する。
論文 参考訳(メタデータ) (2023-08-02T20:46:43Z) - AAVAE: Augmentation-Augmented Variational Autoencoders [43.73699420145321]
本稿では,自動符号化に基づく自己教師型学習における第3のアプローチであるAugmentation-augmented variational autoencoders (AAVAE)を紹介する。
画像分類において提案したAAVAEを,最近のコントラスト学習アルゴリズムや非コントラスト学習アルゴリズムと同様に実証的に評価した。
論文 参考訳(メタデータ) (2021-07-26T17:04:30Z) - DADA: Differentiable Automatic Data Augmentation [58.560309490774976]
コストを大幅に削減する微分可能自動データ拡張(DADA)を提案する。
CIFAR-10, CIFAR-100, SVHN, ImageNetのデータセットについて広範な実験を行った。
その結果,DADAは最先端技術よりも1桁以上高速であり,精度は極めて高いことがわかった。
論文 参考訳(メタデータ) (2020-03-08T13:23:14Z) - Reanalysis of Variance Reduced Temporal Difference Learning [57.150444843282]
Korda と La が提案した分散還元型TD (VRTD) アルゴリズムは,マルコフサンプルを用いたオンラインTD学習に直接適用する。
我々は,VRTDが線形収束速度でTDの固定点解の近傍に収束することが保証されていることを示す。
論文 参考訳(メタデータ) (2020-01-07T05:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。