論文の概要: PyExamine A Comprehensive, UnOpinionated Smell Detection Tool for Python
- arxiv url: http://arxiv.org/abs/2501.18327v1
- Date: Thu, 30 Jan 2025 13:14:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-31 15:12:34.326248
- Title: PyExamine A Comprehensive, UnOpinionated Smell Detection Tool for Python
- Title(参考訳): PyExamineはPython用の包括的で不均質なスメル検出ツール
- Authors: Karthik Shivashankar, Antonio Martini,
- Abstract要約: PyExamineは、コードの臭いを検出するアプローチであり、複数のレベルの分析で機能する。
メトリクスは、高レベルのアーキテクチャ上の懸念から実装の詳細まで、あらゆるレベルのコード組織にまたがっています。
PyExamineは検出精度を91.4%、構造臭89.3%、建築臭80.6%と達成した。
- 参考スコア(独自算出の注目度): 5.669063174637433
- License:
- Abstract: The growth of Python adoption across diverse domains has led to increasingly complex codebases, presenting challenges in maintaining code quality. While numerous tools attempt to address these challenges, they often fall short in providing comprehensive analysis capabilities or fail to consider Python-specific contexts. PyExamine addresses these critical limitations through an approach to code smell detection that operates across multiple levels of analysis. PyExamine architecture enables detailed examination of code quality through three distinct but interconnected layers: architectural patterns, structural relationships, and code-level implementations. This approach allows for the detection and analysis of 49 distinct metrics, providing developers with an understanding of their codebase's health. The metrics span across all levels of code organization, from high-level architectural concerns to granular implementation details. Through evaluation on 7 diverse projects, PyExamine achieved detection accuracy rates: 91.4\% for code-level smells, 89.3\% for structural smells, and 80.6\% for architectural smells. These results were further validated through extensive user feedback and expert evaluations, confirming PyExamine's capability to identify potential issues across all levels of code organization with high recall accuracy. In additional to this, we have also used PyExamine to analysis the prevalence of different type of smells, across 183 diverse Python projects ranging from small utilities to large-scale enterprise applications. PyExamine's distinctive combination of comprehensive analysis, Python-specific detection, and high customizability makes it a valuable asset for both individual developers and large teams seeking to enhance their code quality practices.
- Abstract(参考訳): さまざまなドメインでPythonが採用されるようになると、コードベースが複雑になり、コード品質を維持する上での課題が浮かび上がっている。
多くのツールはこれらの課題に対処しようとするが、包括的な分析機能の提供に足りなかったり、Python固有のコンテキストを考慮できなかったりすることが多い。
PyExamineは、複数のレベルの分析を実行するコードの臭い検出アプローチを通じて、これらの重要な制限に対処する。
PyExamineアーキテクチャは、アーキテクチャパターン、構造的関係、コードレベルの実装の3つの異なる相互接続層を通じて、コード品質の詳細な検査を可能にする。
このアプローチにより、49の異なるメトリクスの検出と分析が可能になり、開発者はコードベースの健全性を理解することができる。
メトリクスは、高レベルのアーキテクチャ上の懸念から実装の詳細まで、あらゆるレベルのコード組織にまたがっています。
7つの多様なプロジェクトの評価を通じて、PyExamineは検出精度を91.4\%、コードレベルの臭いは89.3\%、建築上の臭いは80.6\%と達成した。
これらの結果は、広範囲なユーザーフィードバックと専門家の評価を通じてさらに検証され、PyExamineがあらゆるレベルのコード組織に潜在的な問題を高いリコール精度で特定する能力を確認した。
さらに、私たちはPyExamineを使って、小さなユーティリティから大規模エンタープライズアプリケーションまで183の多様なPythonプロジェクトにおいて、さまざまな種類の匂いの頻度を分析しました。
PyExamineの包括的分析、Python固有の検出、高いカスタマイズ性という独特な組み合わせは、コード品質のプラクティスを強化しようとしている個々の開発者と大規模チームの両方にとって価値がある。
関連論文リスト
- PyPulse: A Python Library for Biosignal Imputation [58.35269251730328]
PyPulseは,臨床およびウェアラブルの両方のセンサ設定において生体信号の計算を行うPythonパッケージである。
PyPulseのフレームワークは、非機械学習バイオリサーバーを含む幅広いユーザーベースに対して、使い勝手の良いモジュラーで拡張可能なフレームワークを提供する。
PyPulseはMITライセンスでGithubとPyPIでリリースしました。
論文 参考訳(メタデータ) (2024-12-09T11:00:55Z) - CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models [106.11371409170818]
大規模言語モデル(LLM)は、生成されたコードを自己定義し、自律的に改善する機能を持つエージェントとして機能する。
コード生成プロセスの異なる段階における探索空間を効率的に探索するLLMエージェントのためのフレームワークであるCodeTreeを提案する。
具体的には、異なるコーディング戦略を明示的に探求し、対応するコーディングソリューションを生成し、その後、ソリューションを洗練するために統合されたツリー構造を採用しました。
論文 参考訳(メタデータ) (2024-11-07T00:09:54Z) - CRUXEval-X: A Benchmark for Multilingual Code Reasoning, Understanding and Execution [50.7413285637879]
CRUXEVAL-Xコード推論ベンチマークには19のプログラミング言語が含まれている。
各言語に対して少なくとも600人の被験者で構成され、合計19Kのコンテンツ一貫性テストがある。
Pythonでのみトレーニングされたモデルでさえ、他の言語で34.4%のPass@1を達成することができる。
論文 参考訳(メタデータ) (2024-08-23T11:43:00Z) - PyBench: Evaluating LLM Agent on various real-world coding tasks [13.347173063163138]
PyBenchは、現実世界のタスクの5つの主要なカテゴリをカバーするベンチマークで、10種類以上のファイルをカバーする。
我々の評価は、現在のオープンソースLLMがこれらのタスクに苦戦していることを示している。
微調整された8Bサイズモデル: textbfPyLlama3はPyBench上でエキサイティングなパフォーマンスを実現します。
論文 参考訳(メタデータ) (2024-07-23T15:23:14Z) - CoIR: A Comprehensive Benchmark for Code Information Retrieval Models [56.691926887209895]
textbfInformation textbfRetrieval Benchmark(textbfInformation textbfRetrieval Benchmark)は,コード検索機能の評価に特化して設計された,堅牢で包括的なベンチマークである。
名前は、Textbftenを巧みにキュレートしたコードデータセットから成り、textbfs7の異なるドメインにまたがる、textbfeight特有の検索タスクにまたがる。
我々は9つの広く使われている検索モデルを名前を用いて評価し、最先端のシステムであってもコード検索タスクの実行に重大な困難を見出した。
論文 参考訳(メタデータ) (2024-07-03T07:58:20Z) - CoSQA+: Pioneering the Multi-Choice Code Search Benchmark with Test-Driven Agents [25.861575256100153]
既存のコード検索データセットには制限がある。
彼らは、主にセマンティックな理解を通じてコードを評価する人間のアノテータに依存している。
本稿では、CoSQAの高品質なクエリと複数の適切なコードとをペアリングするCoSQA+を紹介する。
論文 参考訳(メタデータ) (2024-06-17T14:34:14Z) - Using the Uniqueness of Global Identifiers to Determine the Provenance
of Python Software Source Code [0.0]
本稿では,フリー/オープンソースソフトウェア(FOSS)の出現点と,再利用ソースコードのコピー先を特定する必要性について考察する。
本稿では,プログラマが選択した変数,クラス,関数の名前など,ソフトウェア識別子に基づく問題を解決するための軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-24T07:42:11Z) - UKP-SQUARE: An Online Platform for Question Answering Research [50.35348764297317]
我々は、研究者向けのオンラインQAプラットフォームであるUKP-SQUAREを紹介した。
UKP-SQUAREでは、ユーザフレンドリーなWebインターフェースと統合テストを通じて、モダンスキルの大規模なコレクションをクエリし、分析することができる。
論文 参考訳(メタデータ) (2022-03-25T15:00:24Z) - The Prevalence of Code Smells in Machine Learning projects [9.722159563454436]
静的コード解析は、ソースコードの潜在的な欠陥、機会、共通のコーディング標準の違反を見つけるのに使うことができる。
74のオープンソースプロジェクトのデータセットを集め、依存関係をインストールしてPylintを実行しました。
その結果、検出されたすべてのコードの臭いのトップ20に到達した。
論文 参考訳(メタデータ) (2021-03-06T16:01:54Z) - PyODDS: An End-to-end Outlier Detection System with Automated Machine
Learning [55.32009000204512]
PyODDSは、データベースサポート付きアウトレイラ検出のための、エンドツーエンドのPythonシステムである。
具体的には,探索空間を外乱検出パイプラインで定義し,与えられた探索空間内で探索戦略を作成する。
また、データサイエンスや機械学習のバックグラウンドの有無に関わらず、統一されたインターフェイスと視覚化を提供する。
論文 参考訳(メタデータ) (2020-03-12T03:30:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。