論文の概要: An Interactive Debugger for Rust Trait Errors
- arxiv url: http://arxiv.org/abs/2504.18704v1
- Date: Fri, 25 Apr 2025 21:33:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.954529
- Title: An Interactive Debugger for Rust Trait Errors
- Title(参考訳): Rust Traitエラーのインタラクティブデバッガ
- Authors: Gavin Gray, Will Crichton, Shriram Krishnamurthi,
- Abstract要約: 本稿では,型推論をインタラクティブに視覚化するシステムArgusについて述べる。
Argusの中核となる洞察は、コンパイラ診断の従来のモデルがすべてワンサイズであると避けることである。
- 参考スコア(独自算出の注目度): 2.2940141855172036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Compiler diagnostics for type inference failures are notoriously bad, and type classes only make the problem worse. By introducing a complex search process during inference, type classes can lead to wholly inscrutable or useless errors. We describe a system, Argus, for interactively visualizing type class inferences to help programmers debug inference failures, applied specifically to Rust's trait system. The core insight of Argus is to avoid the traditional model of compiler diagnostics as one-size-fits-all, instead providing the programmer with different views on the search tree corresponding to different debugging goals. Argus carefully uses defaults to improve debugging productivity, including interface design (e.g., not showing full paths of types by default) and heuristics (e.g., sorting obligations based on the expected complexity of fixing them). We evaluated Argus in a user study where $N = 25$ participants debugged type inference failures in realistic Rust programs, finding that participants using Argus correctly localized $2.2\times$ as many faults and localized $3.3\times$ faster compared to not using Argus.
- Abstract(参考訳): 型推論失敗のコンパイラ診断は、非常に悪いことで知られており、型クラスは問題を悪化させるのみである。
推論中に複雑な検索プロセスを導入することで、型クラスは完全に不可解か役に立たないエラーにつながる可能性がある。
型クラスの推論をインタラクティブに視覚化して,Rustのトレイトシステムに特に適用可能な,推論エラーのデバッグを支援するシステムであるArgusについて説明する。
Argusの中核的な洞察は、コンパイラ診断の従来のモデルがすべてワンサイズであるのを避けることであり、代わりに、異なるデバッグ目標に対応する検索ツリーに対する異なるビューをプログラマに提供する。
Argusは、インターフェース設計(例えば、デフォルトでは、型の全パスを表示しない)やヒューリスティック(例えば、それらを修正するのが予想される複雑さに基づいて、義務をソートする)を含む、デバッグ生産性を改善するために、デフォルトを慎重に使用しています。
私たちはArgusをユーザスタディで評価し、現実的なRustプログラムで25$の参加者が型推論の失敗をデバッグし、Argusを使用する参加者が正しく2.2\times$をローカライズし、Argusを使用しない参加者よりも早く3.3\times$をローカライズした。
関連論文リスト
- VeriDebug: A Unified LLM for Verilog Debugging via Contrastive Embedding and Guided Correction [36.69082579950107]
コントラスト表現とガイド付き修正機能を統合するアプローチであるVeri Debugを提案する。
我々のモデルは、既存のオープンソースSOTA 11.3から大幅に改善されたバグ修正(Acc1)において64.7の精度を実現している。
この性能はオープンソースの代替品より優れているだけでなく、GPT-3.5-turbo (36.6)のような大型のクローズドソースモデルよりも優れている。
論文 参考訳(メタデータ) (2025-04-27T04:09:48Z) - Type-Constrained Code Generation with Language Models [51.03439021895432]
大規模言語モデル(LLM)はコードの形式的な側面をモデル化しないため、コンパイル不可能な出力を生成する。
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
提案手法は,コンパイルエラーを半分以上削減し,コード合成,翻訳,修復作業における機能的正しさを向上する。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - Moldable Exceptions [0.840358257755792]
コンテキスト情報に基づいてデバッガのインタフェースを適応するための軽量なメカニズムである「モールド可能な例外」を導入する。
いくつかの例を通して、モールド可能な例外がライブプログラミング環境をいかに強化するかを提示する。
論文 参考訳(メタデータ) (2024-08-31T14:14:22Z) - A Proposal for a Debugging Learning Support Environment for Undergraduate Students Majoring in Computer Science [0.0]
生徒はデバッガの使い方を知らないし、使ったこともない。
我々は,正しいブレークポイント配置の自己学習を可能にする機能をScratchに実装した。
論文 参考訳(メタデータ) (2024-07-25T03:34:19Z) - VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.61860743476933]
V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。
Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。
6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文 参考訳(メタデータ) (2024-06-19T11:09:16Z) - Evolutionary Generative Fuzzing for Differential Testing of the Kotlin
Compiler [14.259471945857431]
JetBrainsが開発したKotlinコンパイラのバグ発見における差分テストの有効性について検討する。
そこで我々は,K1コンパイラとK2コンパイラの入力プログラムを生成するブラックボックス生成手法を提案する。
ケーススタディでは,提案手法がK1とK2のバグを効果的に検出している。
論文 参考訳(メタデータ) (2024-01-12T16:01:12Z) - Understanding and Mitigating Classification Errors Through Interpretable
Token Patterns [58.91023283103762]
容易に解釈可能な用語でエラーを特徴付けることは、分類器が体系的なエラーを起こす傾向にあるかどうかを洞察する。
正しい予測と誤予測を区別するトークンのパターンを発見することを提案する。
提案手法であるPremiseが実際によく動作することを示す。
論文 参考訳(メタデータ) (2023-11-18T00:24:26Z) - A Static Evaluation of Code Completion by Large Language Models [65.18008807383816]
単純なプログラミング問題に対するモデル生成コードの機能的正当性を評価するために,実行ベースベンチマークが提案されている。
プログラムを実行せずにエラーを検出するlinterのような静的解析ツールは、コード生成モデルを評価するために十分に研究されていない。
抽象構文木を利用して,Pythonのコード補完における静的エラーを定量化する静的評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-05T19:23:34Z) - Effective Random Test Generation for Deep Learning Compilers [16.065653480978092]
Israはドメイン固有の制約解決ツールで、バックトラックなしでセマンティック仕様から制約を解決する。
我々は、TVM、Glow、およびSophGoという商用コンパイラを含む3つの人気のある現実世界のディープラーニングコンパイラに対して、我々のアプローチを実装し、適用する。
Israは、最先端のアプローチや、コンパイラーバグ検出のための有効なテストインプットを構築するためのベースラインアプローチよりも効果的である。
論文 参考訳(メタデータ) (2023-02-02T03:00:36Z) - BigIssue: A Realistic Bug Localization Benchmark [89.8240118116093]
BigIssueは、現実的なバグローカライゼーションのためのベンチマークである。
実際のJavaバグと合成Javaバグの多様性を備えた一般的なベンチマークを提供する。
われわれは,バグローカライゼーションの最先端技術として,APRの性能向上と,現代の開発サイクルへの適用性の向上を期待している。
論文 参考訳(メタデータ) (2022-07-21T20:17:53Z) - On the Robustness of Language Encoders against Grammatical Errors [66.05648604987479]
我々は、非ネイティブ話者から実際の文法的誤りを収集し、これらの誤りをクリーンテキストデータ上でシミュレートするために敵攻撃を行う。
結果,全ての試験モデルの性能は影響するが,影響の程度は異なることがわかった。
論文 参考訳(メタデータ) (2020-05-12T11:01:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。