論文の概要: MLSmellHound: A Context-Aware Code Analysis Tool
- arxiv url: http://arxiv.org/abs/2205.03790v1
- Date: Sun, 8 May 2022 06:01:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 17:31:59.106077
- Title: MLSmellHound: A Context-Aware Code Analysis Tool
- Title(参考訳): MLSmellHound: コンテキスト対応コード分析ツール
- Authors: Jai Kannan, Scott Barnett, Lu\'is Cruz, Anj Simmons, Akash Agarwal
- Abstract要約: コード分析ツールは、複数のプログラミング言語として表されるチーム内の文化的な違いを考慮に入れなければならない。
既存のツールはこれらの文化的な違いを識別できず、機械学習プロジェクトへの採用を減らすソフトウェアエンジニアリングに向けられている。
このアプローチでは、ソースコードの目的(i)技術ドメイン(iii)問題ドメイン(iv)チームノルム(v)開発ライフサイクルステージを含むコンテキストの利用を探索し、この問題を解決しようと試みています。
これにより、エンドユーザーに対してコンテキスト化された意味のあるエラーレポートが可能になる。
- 参考スコア(独自算出の注目度): 4.157846027410602
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Meeting the rise of industry demand to incorporate machine learning (ML)
components into software systems requires interdisciplinary teams contributing
to a shared code base. To maintain consistency, reduce defects and ensure
maintainability, developers use code analysis tools to aid them in identifying
defects and maintaining standards. With the inclusion of machine learning,
tools must account for the cultural differences within the teams which
manifests as multiple programming languages, and conflicting definitions and
objectives. Existing tools fail to identify these cultural differences and are
geared towards software engineering which reduces their adoption in ML
projects. In our approach we attempt to resolve this problem by exploring the
use of context which includes i) purpose of the source code, ii) technical
domain, iii) problem domain, iv) team norms, v) operational environment, and
vi) development lifecycle stage to provide contextualised error reporting for
code analysis. To demonstrate our approach, we adapt Pylint as an example and
apply a set of contextual transformations to the linting results based on the
domain of individual project files under analysis. This allows for
contextualised and meaningful error reporting for the end-user.
- Abstract(参考訳): 機械学習(ML)コンポーネントをソフトウェアシステムに組み込むという業界需要の高まりに応えるには、学際的なチームが共通のコードベースに貢献する必要がある。
一貫性の維持、欠陥の低減、メンテナンス性確保のために、開発者はコード分析ツールを使用して欠陥の特定と標準の維持を支援する。
機械学習を取り入れることで、ツールは複数のプログラミング言語として表されるチーム内の文化的な違いを考慮し、定義と目的を矛盾させる必要がある。
既存のツールはこれらの文化的違いを識別できず、MLプロジェクトでの採用を減らすソフトウェアエンジニアリングに向けられている。
提案手法では,この問題を解決するために,文脈の活用を探求する。
一 ソースコードの目的
二 技術領域
三 問題領域、
iv) チームの規範
五 運用環境、及び
vi) コード解析にコンテキスト化されたエラーレポートを提供する開発ライフサイクルステージ。
提案手法を実証するために,Pylintを例として適用し,分析対象の個々のプロジェクトファイルのドメインに基づいて,コンテキスト変換の集合をリンティング結果に適用する。
これにより、エンドユーザのコンテキスト化と有意義なエラーレポートが可能になる。
関連論文リスト
- LLM With Tools: A Survey [0.0]
本稿では,LCMに外部ツールの使用を教える領域における方法論,問題点,展開について述べる。
ユーザ命令を実行可能なプランにマッピングする一連の関数によってガイドされるツール統合のための標準化パラダイムを導入する。
調査の結果,ツール起動タイミング,選択精度,堅牢な推論プロセスの必要性など,さまざまな課題が明らかになった。
論文 参考訳(メタデータ) (2024-09-24T14:08:11Z) - Agent-Driven Automatic Software Improvement [55.2480439325792]
本提案は,Large Language Models (LLMs) を利用したエージェントの展開に着目して,革新的なソリューションの探求を目的とする。
継続的学習と適応を可能にするエージェントの反復的性質は、コード生成における一般的な課題を克服するのに役立ちます。
我々は,これらのシステムにおける反復的なフィードバックを用いて,エージェントの基盤となるLLMをさらに微調整し,自動化されたソフトウェア改善のタスクに整合性を持たせることを目指している。
論文 参考訳(メタデータ) (2024-06-24T15:45:22Z) - A Study on Developer Behaviors for Validating and Repairing LLM-Generated Code Using Eye Tracking and IDE Actions [13.58143103712]
GitHub Copilotは、LLM(Big Language Model)ベースのコード生成ツールである。
本稿では,Copilotが生成したコードを開発者がどのように検証し,修復するかを検討する。
コードの存在を認識したことにより、パフォーマンスの向上、検索努力の向上、コパイロットの使用頻度の向上、認知作業負荷の向上につながった。
論文 参考訳(メタデータ) (2024-05-25T06:20:01Z) - Code Compass: A Study on the Challenges of Navigating Unfamiliar Codebases [2.808331566391181]
これらの問題に対処するための新しいツールであるCodeを提案する。
本研究は,現在のツールと方法論における大きなギャップを浮き彫りにしている。
私たちのフォーマティブな調査は、開発者がドキュメントをナビゲートする時間をいかに効率的に削減するかを示しています。
論文 参考訳(メタデータ) (2024-05-10T06:58:31Z) - CRAFT: Customizing LLMs by Creating and Retrieving from Specialized
Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。
タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。
本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文 参考訳(メタデータ) (2023-09-29T17:40:26Z) - Guess & Sketch: Language Model Guided Transpilation [59.02147255276078]
学習されたトランスパイレーションは、手作業による書き直しやエンジニアリングの取り組みに代わるものだ。
確率的ニューラルネットワークモデル(LM)は、入力毎に可塑性出力を生成するが、正確性を保証するコストがかかる。
Guess & Sketch は LM の特徴からアライメントと信頼性情報を抽出し、意味的等価性を解決するためにシンボリック・ソルバに渡す。
論文 参考訳(メタデータ) (2023-09-25T15:42:18Z) - CREATOR: Tool Creation for Disentangling Abstract and Concrete Reasoning of Large Language Models [74.22729793816451]
大規模言語モデル(LLM)はツールの利用において大きな進歩を遂げているが、その能力はAPIの可用性によって制限されている。
我々は、LCMがドキュメンテーションとコード実現を使って独自のツールを作成できる新しいフレームワークCREATORを提案する。
我々は,MATH と TabMWP のベンチマークで CREATOR を評価する。
論文 参考訳(メタデータ) (2023-05-23T17:51:52Z) - Technology Readiness Levels for Machine Learning Systems [107.56979560568232]
機械学習システムの開発とデプロイは、現代のツールで簡単に実行できますが、プロセスは一般的に急ぎ、エンドツーエンドです。
私たちは、機械学習の開発と展開のための実証済みのシステムエンジニアリングアプローチを開発しました。
当社の「機械学習技術準備レベル」フレームワークは、堅牢で信頼性が高く、責任あるシステムを確保するための原則的なプロセスを定義します。
論文 参考訳(メタデータ) (2021-01-11T15:54:48Z) - Technology Readiness Levels for AI & ML [79.22051549519989]
機械学習システムの開発は、現代的なツールで容易に実行できるが、プロセスは通常急いで、エンドツーエンドで実行される。
エンジニアリングシステムは、高品質で信頼性の高い結果の開発を効率化するために、明確に定義されたプロセスとテスト標準に従います。
我々は、機械学習の開発と展開のための実証されたシステムエンジニアリングアプローチを提案する。
論文 参考訳(メタデータ) (2020-06-21T17:14:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。