論文の概要: Configuration Smells in AGENTS.md Files: Common Mistakes in Configuring Coding Agents
- arxiv url: http://arxiv.org/abs/2606.15828v4
- Date: Fri, 19 Jun 2026 12:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-23 13:41:30.743684
- Title: Configuration Smells in AGENTS.md Files: Common Mistakes in Configuring Coding Agents
- Title(参考訳): AgentS.mdファイルの構成スメル:コーディングエージェントの設定における一般的な誤り
- Authors: Helio Victor F. dos Santos, Vitor Costa, Joao Eduardo Montandon, Luciana Lourdes Silva, Marco Tulio Valente,
- Abstract要約: コーディングエージェントの構成ファイルに最初の匂いのカタログを提示する。
このような臭いを識別するために,まず灰色文献レビューとレポジトリマイニング分析を行った。
以上の結果から, コンフィグレーションの匂いが広まっており, リントリークジが最も一般的な匂いであり, ファイルの62%に影響を及ぼすことがわかった。
- 参考スコア(独自算出の注目度): 0.3298597939573778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coding agents are increasingly used to automate software engineering tasks. To guide their behavior, these agents commonly rely on configuration files, typically named AGENTS. md or CLAUDE. md, which provide instructions about architecture, workflows, coding conventions, and testing practices. Despite their growing importance, little is known about common problems affecting the definition and maintenance of these files. In this paper, we present the first catalog of smells for coding-agent configuration files. To identify such smells, we first conducted a grey literature review and a repository mining analysis. As a result, we identified six configuration smells and proposed automated heuristics to detect them. To evaluate the prevalence of the proposed smells, we analyzed 100 popular open-source repositories containing either an AGENTS. md or a CLAUDE. md file. Our results show that configuration smells are widespread. Lint Leakage was the most common smell, affecting 62% of the files, followed by Context Bloat (42%) and Skill Leakage (35%). We further show that several smells frequently co-occur, particularly Context Bloat, Skill Leakage, and Conflicting Instructions.
- Abstract(参考訳): コーディングエージェントは、ソフトウェアエンジニアリングタスクの自動化にますます使われています。
それらの動作をガイドするために、これらのエージェントは通常、AgentSという名前のコンフィギュレーションファイルに依存する。
md または CLAUDE。
アーキテクチャ、ワークフロー、コーディング規約、テストプラクティスに関するインストラクションを提供する。
その重要性は増しているが、これらのファイルの定義とメンテナンスに影響を及ぼす一般的な問題についてはほとんど分かっていない。
本稿では,コードエージェント構成ファイルの匂いのカタログを初めて提示する。
このような臭いを識別するために,まず灰色文献レビューとレポジトリマイニング分析を行った。
その結果,6種類の臭気が検出され,自動ヒューリスティックが検出された。
提案する嗅覚の有病率を評価するため,エージェントを含む100のオープンソースリポジトリを解析した。
mdまたはCLAUDE。
mdファイル
以上の結果から, 構成の臭いが広まっています。
リントリーク(Lint Leakage)は最も一般的な臭いで、ファイルの62%に影響を与え、その後Context Bloat(42%)とSkill Leakage(35%)が続いた。
さらに,特にContext Bloat, Skill Leakage, Conflicting Instructionsなど,複数の匂いが混在していることも示している。
関連論文リスト
- How to Interpret Agent Behavior [56.59836196946289]
本稿では,エージェントの動作を実行時に記述・解析するための分類法であるACT*ONOMYを紹介する。
共用語彙を提供することで、ACT*ONOMYは研究者、エージェントデザイナー、エンドユーザーがエージェントの振る舞いをより一貫して解釈するのに役立つ。
論文 参考訳(メタデータ) (2026-05-13T14:52:40Z) - LongMemEval-V2: Evaluating Long-Term Agent Memory Toward Experienced Colleagues [80.29362825271768]
LongMemEval-V2は、メモリシステムが、カスタマイズされた環境で知識のある同僚になるために必要な経験を得るのに役立つかどうかを評価するためのベンチマークである。
LME-V2には、Webエージェントの5つのコアメモリ能力をカバーする451の質問が含まれている。
AgentRunbook-Rは生の状態観察,イベント,戦略ノートのための知識プールを備えた,効率的なRAGベースのメモリであり,AgentRunbook-Cはトラジェクトリをファイルとして格納し,コードエージェントを起動して,拡張サンドボックスに証拠を収集する。
論文 参考訳(メタデータ) (2026-05-12T17:59:34Z) - SmellBench: Evaluating LLM Agents on Architectural Code Smell Repair [1.6922906233636834]
アーキテクチャコードはソフトウェアの保守性を損なうため、手作業で修理するのにコストがかかる。
本稿では,大規模言語モデルエージェントによる建築コードの臭いの修復に関する経験的評価について述べる。
SmellBenchは、嗅覚タイプ固有の最適化プロンプトを組み込んだタスクオーケストレーションフレームワークです。
論文 参考訳(メタデータ) (2026-05-07T22:33:32Z) - FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents [53.03492387564392]
我々はFS-Researcherを紹介した。FS-Researcherはファイルシステムベースのフレームワークで、永続的なワークスペースを通じてコンテキストウィンドウを超えて深い研究をスケールする。
Context Builderエージェントはインターネットを閲覧し、構造化されたノートを書き、ソースを階層的な知識ベースにアーカイブする。
その後、レポートライターエージェントが最終レポートセクションをセクションごとに構成し、知識ベースを事実のソースとして扱う。
論文 参考訳(メタデータ) (2026-02-02T03:00:19Z) - A Causal Perspective on Measuring, Explaining and Mitigating Smells in LLM-Generated Code [49.09545217453401]
Propensity Smelly Score (PSC) は、特定の臭いの種類を生成する確率を推定する計量である。
我々は、生成戦略、モデルサイズ、モデルアーキテクチャ、および生成したコードの構造特性をいかに形成するかを識別する。
PSCは、開発者がモデルの振る舞いを解釈し、コード品質を評価するのに役立つ。
論文 参考訳(メタデータ) (2025-11-19T19:18:28Z) - Your Build Scripts Stink: The State of Code Smells in Build Scripts [7.543600033457145]
セキュアでないURLはMavenビルドスクリプトで最も一般的なコードの臭いでした。
HardcodedPaths/URLはGradleとCMakeのスクリプトでよく見られる。
ワイルドカードの使用は、Makefilesで最も頻繁に見られる臭いとして現れた。
論文 参考訳(メタデータ) (2025-06-22T09:01:42Z) - Task-Aware Specialization for Efficient and Robust Dense Retrieval for
Open-Domain Question Answering [85.08146789409354]
我々は高密度検索のための新しいアーキテクチャであるタスクアウェアドメイン(TASER)を提案する。
TASERは単一のエンコーダで共有ブロックと特殊ブロックをインターリーブすることでパラメータ共有を可能にする。
実験の結果,TASERの精度はBM25を上回り,パラメータの約60%を2エンコーダ高密度検索器として用いることができた。
論文 参考訳(メタデータ) (2022-10-11T05:33:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。