論文の概要: AI-Specific Code Smells: From Specification to Detection
- arxiv url: http://arxiv.org/abs/2509.20491v1
- Date: Wed, 24 Sep 2025 19:09:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.552088
- Title: AI-Specific Code Smells: From Specification to Detection
- Title(参考訳): AI-Specific Code Smells: 仕様から検出まで
- Authors: Brahim Mahmoudi, Naouel Moha, Quentin Stievenert, Florent Avellaneda,
- Abstract要約: SpecDetect4AIは、AI固有のコードの臭いの仕様と検出のためのツールベースのアプローチである。
我々は、AI固有の22のコードの臭いを特定し、826のAIベースシステム(2000万行のコード)上でSpecDetect4AIを評価した。
以上の結果から,SpecDetect4AIはAI固有のコードの匂いの特定と検出を専用ルールでサポートし,大規模AIベースのシステムを効果的に分析できることが示唆された。
- 参考スコア(独自算出の注目度): 3.7931928645127986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rise of Artificial Intelligence (AI) is reshaping how software systems are developed and maintained. However, AI-based systems give rise to new software issues that existing detection tools often miss. Among these, we focus on AI-specific code smells, recurring patterns in the code that may indicate deeper problems such as unreproducibility, silent failures, or poor model generalization. We introduce SpecDetect4AI, a tool-based approach for the specification and detection of these code smells at scale. This approach combines a high-level declarative Domain-Specific Language (DSL) for rule specification with an extensible static analysis tool that interprets and detects these rules for AI-based systems. We specified 22 AI-specific code smells and evaluated SpecDetect4AI on 826 AI-based systems (20M lines of code), achieving a precision of 88.66% and a recall of 88.89%, outperforming other existing detection tools. Our results show that SpecDetect4AI supports the specification and detection of AI-specific code smells through dedicated rules and can effectively analyze large AI-based systems, demonstrating both efficiency and extensibility (SUS 81.7/100).
- Abstract(参考訳): 人工知能(AI)の台頭は、ソフトウェアシステムの開発と保守の方法を変えつつある。
しかし、AIベースのシステムは、既存の検出ツールがしばしば見逃すような、新しいソフトウェア問題を引き起こす。
これらのうち、私たちはAI特有のコードの臭い、コード内の繰り返しパターンに焦点を当てており、再現性、サイレント障害、モデル一般化の貧弱といったより深い問題を示しています。
SpecDetect4AIは、これらのコードの仕様と検出を大規模に行うためのツールベースのアプローチである。
このアプローチでは、ルール仕様のための高レベルの宣言型ドメイン特化言語(DSL)と、AIベースのシステムでこれらのルールを解釈し、検出する拡張可能な静的解析ツールを組み合わせる。
我々は、AI固有の22のコードの臭いを特定し、826のAIベースシステム(2000万行のコード)でSpecDetect4AIを評価し、88.66%の精度と88.89%のリコールを達成した。
以上の結果から,SpecDetect4AIはAI特有の臭いの仕様と検出をサポートし,AIベースの大規模システムを効果的に分析し,効率と拡張性の両方を実証する(SUS 81.7/100)。
関連論文リスト
- AuthorMist: Evading AI Text Detectors with Reinforcement Learning [4.806579822134391]
AuthorMistは、AI生成したテキストを人間ライクな文章に変換する、新しい強化学習ベースのシステムだ。
AuthorMistは,本来の意味を保ちながら,AI生成テキストの検出性を効果的に低減することを示す。
論文 参考訳(メタデータ) (2025-03-10T12:41:05Z) - An Empirical Study on Automatically Detecting AI-Generated Source Code: How Far Are We? [8.0988059417354]
本稿では,AI生成コード検出の性能向上のための様々な手法を提案する。
我々の最良のモデルは最先端のAI生成コード検出器(GPTSniffer)より優れており、F1スコアは82.55である。
論文 参考訳(メタデータ) (2024-11-06T22:48:18Z) - Where are we in audio deepfake detection? A systematic analysis over generative and detection models [59.09338266364506]
SONARはAI-Audio Detection FrameworkとBenchmarkの合成である。
最先端のAI合成聴覚コンテンツを識別するための総合的な評価を提供する。
従来のモデルベース検出システムと基礎モデルベース検出システムの両方で、AIオーディオ検出を均一にベンチマークする最初のフレームワークである。
論文 参考訳(メタデータ) (2024-10-06T01:03:42Z) - Can AI-Generated Text be Reliably Detected? [50.95804851595018]
大規模言語モデル(LLM)は、様々なアプリケーションで非常によく機能します。
盗作、偽ニュースの発生、スパムなどの活動においてこれらのモデルが誤用される可能性があることは、彼らの責任ある使用に対する懸念を引き起こしている。
我々は、攻撃者の存在下で、これらのAIテキスト検出装置の堅牢性を強調テストする。
論文 参考訳(メタデータ) (2023-03-17T17:53:19Z) - Asteria-Pro: Enhancing Deep-Learning Based Binary Code Similarity
Detection by Incorporating Domain Knowledge [8.93208472340743]
本稿では,ドメイン知識に基づく事前フィルタリングと再分類モジュールを組み込んだ新しいディープラーニング強化アーキテクチャを提案する。
Asteria-Proは、高い精度で1,482の脆弱な関数を91.65%検出する。
論文 参考訳(メタデータ) (2023-01-02T03:16:26Z) - Autoencoder-based Semantic Novelty Detection: Towards Dependable
AI-based Systems [3.0799158006789056]
本稿では,自動エンコーダに基づくセマンティックノベルティ検出のための新しいアーキテクチャを提案する。
このような意味的ノベルティ検出は、文献から知られている自己エンコーダに基づくノベルティ検出手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-24T17:27:19Z) - OutlierNets: Highly Compact Deep Autoencoder Network Architectures for
On-Device Acoustic Anomaly Detection [77.23388080452987]
人間のオペレーターはしばしば異常な音で産業機械を診断する。
ディープラーニングによる異常検出手法は、工場でのデプロイメントを禁止する膨大な計算リソースを必要とすることが多い。
ここでは、マシン駆動設計探索戦略を探求し、非常にコンパクトなディープコンボリューションオートエンコーダネットワークアーキテクチャのファミリーであるOutlierNetsを作成します。
論文 参考訳(メタデータ) (2021-03-31T04:09:30Z) - NADS: Neural Architecture Distribution Search for Uncertainty Awareness [79.18710225716791]
機械学習(ML)システムは、トレーニングデータとは異なるディストリビューションから来るテストデータを扱う場合、しばしばOoD(Out-of-Distribution)エラーに遭遇する。
既存のOoD検出アプローチはエラーを起こしやすく、時にはOoDサンプルに高い確率を割り当てることもある。
本稿では,すべての不確実性を考慮したアーキテクチャの共通構築ブロックを特定するために,ニューラルアーキテクチャ分布探索(NADS)を提案する。
論文 参考訳(メタデータ) (2020-06-11T17:39:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。