論文の概要: Towards Automated Identification of Violation Symptoms of Architecture Erosion
- arxiv url: http://arxiv.org/abs/2306.08616v5
- Date: Fri, 22 Aug 2025 18:38:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 14:31:50.276894
- Title: Towards Automated Identification of Violation Symptoms of Architecture Erosion
- Title(参考訳): 建築エロージョンの振動症状の自動同定に向けて
- Authors: Ruiyin Li, Peng Liang, Paris Avgeriou,
- Abstract要約: 本稿では,コードレビューにおける開発者の議論から,違反症状の自動識別について検討する。
我々は,事前学習した単語埋め込みを用いた15の機械学習に基づく分類器を開発し,コードレビューのコメントで評価した。
その結果, word2vec を用いた SVM は F1 スコア 0.779 で最高の ML/DL 性能を示した。
- 参考スコア(独自算出の注目度): 2.915855887948474
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Architecture erosion has a detrimental effect on maintenance and evolution, as the implementation deviates from the intended architecture. Detecting symptoms of erosion, particularly architectural violations, at an early stage is crucial. This paper explores the automated identification of violation symptoms from developer discussions in code reviews. We developed 15 machine learning-based and 4 deep learning-based classifiers using three pre-trained word embeddings, and evaluated them on code review comments from four large open-source projects (OpenStack Nova/Neutron and Qt Base/Creator). To validate practical value, we conducted surveys and semi-structured interviews with developers involved in these discussions. We further compared traditional ML/DL classifiers with Large Language Models (LLMs) such as GPT-4o, Qwen-2.5, and DeepSeek-R1. Results show that SVM with word2vec achieved the best ML/DL performance with an F1-score of 0.779, while fastText embeddings also yielded strong results. Ensemble voting strategies enhanced traditional classifiers, and 200-dimensional embeddings generally outperformed 100/300-dimensional ones. LLM-based classifiers consistently surpassed ML/DL models, with GPT-4o achieving the best F1-score of 0.851, though ensembles added no further benefits. Overall, our study provides an automated approach to identify architecture violation symptoms, offers systematic comparisons of ML/DL and LLM methods, and delivers practitioner insights, contributing to sustainable architectural conformance in software systems.
- Abstract(参考訳): アーキテクチャの侵食は、実装が意図したアーキテクチャから逸脱するため、メンテナンスと進化に有害な影響を与える。
浸食の症状、特に建築上の違反を早期に検出することが重要である。
本稿では,コードレビューにおける開発者の議論から,違反症状の自動識別について検討する。
我々は,事前学習した3つの単語埋め込みを用いた15の機械学習ベースおよび4つのディープラーニングベース分類器を開発し,それを4つの大規模オープンソースプロジェクト(OpenStack Nova/NeutronとQt Base/Creator)のコードレビューコメントに基づいて評価した。
実践的価値を評価するため,これらの議論に携わる開発者を対象に,調査および半構造化インタビューを行った。
さらに,従来のML/DL分類器とGPT-4o,Qwen-2.5,DeepSeek-R1といったLarge Language Models(LLM)を比較した。
その結果, word2vec を用いた SVM は F1 スコア 0.779 で最高の ML/DL 性能を示した。
エンサンブル投票戦略は従来の分類器を強化し、200次元埋め込みは一般的に100/300次元よりも優れていた。
LLMベースの分類器は一貫してML/DLモデルを超え、GPT-4oは0.851の最高のF1スコアを達成したが、アンサンブルはそれ以上の利点は加えなかった。
本研究は、アーキテクチャ違反の症状を特定するための自動アプローチを提供し、ML/DL法とLLM法を体系的に比較し、実践者による洞察を提供し、ソフトウェアシステムにおける持続可能なアーキテクチャ適合性に寄与する。
関連論文リスト
- Sentinel: SOTA model to protect against prompt injections [0.0]
大規模言語モデル(LLM)はますます強力になるが、インジェクション攻撃の迅速化には弱い。
本稿では,応答型/ModernBERT大規模アーキテクチャに基づく新しい検出モデルであるSentinelを紹介する。
包括的で目に見えない内部テストセットでは、センチネルは平均精度0.987、F1スコア0.980を示す。
論文 参考訳(メタデータ) (2025-06-05T14:07:15Z) - From Correctness to Comprehension: AI Agents for Personalized Error Diagnosis in Education [24.970741456147447]
大規模言語モデル(LLM)は、GSM8Kのようなベンチマークでほぼ完璧なパフォーマンスを達成し、驚くべき数学的推論能力を示している。
しかし、誤り診断やフィードバック生成よりも正確さが過大評価されているため、パーソナライズされた教育への応用は依然として限られている。
textbfMathCCSは,システム的エラー解析と修正されたフィードバックのためのベンチマークである。
第2に、過去のデータを利用してトレンドを追跡し、診断精度を向上させるシーケンシャルなエラー解析フレームワークを開発する。
第3に、歴史的分析のための時系列エージェントと実時間のためのMLLMエージェントを組み合わせたマルチエージェント協調フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-19T14:57:51Z) - Shortcut Learning Susceptibility in Vision Classifiers [3.004632712148892]
ショートカット学習は、機械学習モデルが意味のある特徴をキャプチャする代わりに、データの急激な相関を利用する場所である。
この現象は、視覚、自然言語処理、音声認識など、さまざまな機械学習アプリケーションで広く利用されている。
クラスラベルと位置相関するデータセットに意図的にショートカットを導入することで,これらのアーキテクチャを体系的に評価する。
論文 参考訳(メタデータ) (2025-02-13T10:25:52Z) - Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.72682366640554]
著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文 参考訳(メタデータ) (2024-03-17T16:36:26Z) - Towards Realistic Zero-Shot Classification via Self Structural Semantic
Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。
本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。
本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-24T17:56:46Z) - Neural Architecture Design and Robustness: A Dataset [11.83842808044211]
ニューラルアーキテクチャ設計とロバストネス評価に関するデータベースを導入する。
我々は、これらのネットワークを、様々な共通の敵攻撃や汚職タイプで評価する。
ネットワークのトポロジを慎重に構築することは、その堅牢性に大きな影響を与える可能性がある。
論文 参考訳(メタデータ) (2023-06-11T16:02:14Z) - Fine-Grained ImageNet Classification in the Wild [0.0]
ロバストネステストは、典型的なモデル評価段階で気づかないいくつかの脆弱性やバイアスを明らかにすることができる。
本研究では,階層的知識の助けを借りて,密接に関連するカテゴリのきめ細かい分類を行う。
論文 参考訳(メタデータ) (2023-03-04T12:25:07Z) - Learning from Mistakes: Self-Regularizing Hierarchical Representations
in Point Cloud Semantic Segmentation [15.353256018248103]
LiDARセマンティックセマンティックセマンティクスは、きめ細かいシーン理解を実現するために注目を集めている。
本稿では、標準モデルから派生した分類ミスタケス(LEAK)からLEArnを分離する粗大な設定を提案する。
我々のLEAKアプローチは非常に一般的で、どんなセグメンテーションアーキテクチャにもシームレスに適用できます。
論文 参考訳(メタデータ) (2023-01-26T14:52:30Z) - Warnings: Violation Symptoms Indicating Architecture Erosion [2.6580082406002705]
開発者の視点から,コードレビューコメントにおけるアーキテクチャ違反症状の特徴について検討した。
コードレビュープロセス中に、違反症状の10つのカテゴリが開発者によって議論される。
最も頻繁に使われている言語パターンは、問題発見である。
論文 参考訳(メタデータ) (2022-12-23T06:29:55Z) - A Context-Sensitive Word Embedding Approach for The Detection of Troll
Tweets [0.0]
本研究では,トロルツイートの自動検出のためのモデルアーキテクチャの開発と評価を行う。
BERT,ELMo,GloVeの埋め込み法はGloVe法よりも優れた性能を示した。
CNNおよびGRUエンコーダも同様にF1スコアとAUCで実行された。
AUCスコア0.929のGRU分類器を用いたELMoベースのアーキテクチャが最適であることがわかった。
論文 参考訳(メタデータ) (2022-07-17T17:12:16Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Robust and Verifiable Information Embedding Attacks to Deep Neural
Networks via Error-Correcting Codes [81.85509264573948]
ディープラーニングの時代、ユーザは、サードパーティの機械学習ツールを使用して、ディープニューラルネットワーク(DNN)分類器をトレーニングすることが多い。
情報埋め込み攻撃では、攻撃者は悪意のあるサードパーティの機械学習ツールを提供する。
本研究では,一般的なポストプロセッシング手法に対して検証可能で堅牢な情報埋め込み攻撃を設計することを目的とする。
論文 参考訳(メタデータ) (2020-10-26T17:42:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。