論文の概要: ATLAS: Agentic Taxonomy of Large-Scale Software Ecosystems
- arxiv url: http://arxiv.org/abs/2606.21597v1
- Date: Fri, 19 Jun 2026 16:51:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 06:47:05.653712
- Title: ATLAS: Agentic Taxonomy of Large-Scale Software Ecosystems
- Title(参考訳): ATLAS: 大規模ソフトウェアエコシステムのエージェント分類
- Authors: Junyi Lu, Mengyao Lyu, Jiahui Wu, Lei Yu, Chengwei Liu, Fengjun Zhang, Li Yang, Chun Zuo, Yang Liu,
- Abstract要約: GitHubには、ソフトウェアリポジトリの体系的な階層的な分類がない。
ソフトウェアリポジトリの階層的な分類を自動的に構築し、プロジェクトをエンドツーエンドに分類する最初のフレームワークであるATLASを紹介します。
- 参考スコア(独自算出の注目度): 14.128311996090352
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The open-source ecosystem on GitHub lacks a systematic hierarchical taxonomy of software repositories. GitHub Topics, the dominant organizational mechanism, is flat, inconsistent, and covers only 67% of projects. We present ATLAS, the first framework that automatically constructs a hierarchical taxonomy for software repositories and classifies projects into it end-to-end. By combining LLM global knowledge with real repository distributions, ATLAS proposes meaningful splitting dimensions and iteratively corrects those that fail to accommodate real projects. A Designer Agent proposes splitting dimensions while a Classifier Agent assigns repositories; a self-corrective refinement loop uses classification failures to drive dimension revision through escalating strategies. We evaluate ATLAS on 54,387 GitHub repositories against six baselines spanning four paradigms, two downstream tasks, and three model families. On a stratified 2,001-repository benchmark, ATLAS achieves a Taxonomy Quality F-score (TQF) of 83.13%, outperforming the best baseline by 15 percentage points (on the full 54k corpus the approximate TQF is 73.0%, a gap driven by Path Granularity's all-or-nothing scoring on longer paths rather than lower classification accuracy). It is the only method to simultaneously achieve high structural quality and high practical applicability. On downstream tasks, ATLAS enables alternative discovery with P@1 = 85.71%, surpassing even human-curated lists (62.34%), and achieves the highest P@1 for repository retrieval. The taxonomy further reveals structural ecosystem trends that are difficult to obtain from flat tags or similarity methods: the shift from libraries to AI/ML applications (now 61% of newly community-adopted projects) becomes visible only through hierarchical, type-based categorization. An interactive taxonomy explorer is available at https://atlas-taxonomy.netlify.app/
- Abstract(参考訳): GitHub上のオープンソースのエコシステムには、ソフトウェアリポジトリの体系的な階層的な分類がない。
主要な組織メカニズムであるGitHub Topicsは、フラットで一貫性がなく、プロジェクトの67%しかカバーしていない。
ソフトウェアリポジトリの階層的な分類を自動的に構築し、プロジェクトをエンドツーエンドに分類する最初のフレームワークであるATLASを紹介します。
LLMグローバル知識と実際のリポジトリ分布を組み合わせることで、ATLASは意味のある分割次元を提案し、実際のプロジェクトに対応できないものを反復的に修正する。
デザイナエージェントは分割次元を提案し、分類エージェントはレポジトリを割り当てる。
我々は,4つのパラダイム,2つのダウンストリームタスク,3つのモデルファミリーにまたがる6つのベースラインに対して,54,387のGitHubリポジトリ上でATLASを評価した。
階層化された2,001-リポジトリのベンチマークにおいて、ATLASは分類品質Fスコア(TQF)の83.13%を達成し、最高のベースラインを15パーセント上回った(完全な54kコーパスでは、近似TQFは73.0%であり、パスグラニュラリティのより低い分類精度よりも長い経路におけるオール・オア・ナッシングスコアによって駆動される)。
高い構造的品質と高い実用性を同時に達成する唯一の方法である。
下流のタスクでは、ATLASはP@1 = 85.71%で代替の発見を可能にし、人為的なリスト(62.34%)を上回り、リポジトリの検索において最も高いP@1を達成する。
ライブラリからAI/MLアプリケーション(現在は新たにコミュニティに登録されたプロジェクトの61%)への移行は、階層的で型ベースの分類によってのみ見えます。
インタラクティブな分類エクスプローラがhttps://atlas-taxonomy.netlify.app/で公開されている。
関連論文リスト
- ATLAS: All-round Testing of Long-context Abilities across Scales [42.83200405769639]
ATLASは、長文評価を長さ依存の能力プロファイルとして再定義するベンチマークフレームワークである。
ATLASは、(i)アプリケーションワークロードから基礎的な操作を分離する階層化された分類法、(ii)固定された8K-1Mグリッド上のスコア長曲線を統合するAUCスコア、(iii)不均衡なプロファイルをペナルライズする分類カテゴリー上の調和平均集計であるATLAScoreの3つの方法論に貢献する。
論文 参考訳(メタデータ) (2026-05-27T07:33:47Z) - Code2UML: Agentic LLMs with context engineering for scalable software visualization [7.069738194755401]
本稿では,ソースコードリポジトリからの自動ダイアグラム生成のためのコンテキストエンジニアリングを備えたエージェントアーキテクチャを提案する。
PlannerAgent、Analyzer DiagramAgent、CorrectorAgent、DependencyAnalyzerAgentの5つの特別なエージェントの階層を採用しており、Claude Agent SDK上に構築されている。
決定論的で重み付けされたIR圧縮層は、完全なプロジェクトIRをトークン制約に適合するように保証されたダイアグラム固有のビューに変換する。
論文 参考訳(メタデータ) (2026-05-23T08:01:26Z) - AgentAtlas: Beyond Outcome Leaderboards for LLM Agents [0.025718125188898048]
AgentAtlasは、診断語彙および監査プロトコルとしてのエージェント評価を再設定する。
i)6状態制御-決定分類(Act / Ask / Refuse / Stop / Confirm / Recover)、(ii)一次誤差源と下流衝撃を持つ軌道障害語彙、(iv)8つのモデルで評価された合成1,342-itemに関する実証的プロトコル研究。
論文 参考訳(メタデータ) (2026-05-19T22:05:12Z) - Orchard: An Open-Source Agentic Modeling Framework [124.68499958175111]
スケーラブルなエージェントモデリングのためのオープンソースのフレームワークOrchardを紹介します。
Orchard Envは、サンドボックスライフサイクル管理のための再利用可能なプリミティブを提供する軽量環境サービスである。
Orchard Envの上に、3つのエージェントモデリングレシピを構築します。
論文 参考訳(メタデータ) (2026-05-14T16:35:12Z) - Label-Free Cross-Task LoRA Merging with Null-Space Compression [50.63908869296697]
我々は,ラベルフリーで出力に依存しない手法であるNull-Space Compression (NSC) Mergingを紹介した。
NSCは、従来のメソッドがタスクのサブセットに収まるバランスの取れたゲインを持つ20の異種視覚タスクに対して、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-27T11:34:41Z) - Hierarchy-Aware Fine-Tuning of Vision-Language Models [18.244518940229202]
視覚言語モデルは、大規模な画像テキスト事前学習を通じて強力なマルチモーダル表現を学習する。
標準的アプローチはラベルをフラットなカテゴリとして扱い、完全な微調整を必要とする。
構造的一貫性を保ちつつ,いくつかのパラメータを更新する,効率的な階層型微調整フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-25T06:44:33Z) - GLiClass: Generalist Lightweight Model for Sequence Classification Tasks [49.2639069781367]
本稿では,シーケンス分類タスクにGLiNERアーキテクチャを適用する新しい手法であるGLiClassを提案する。
提案手法は,ゼロショットおよび少数ショット学習シナリオに必要な柔軟性を維持しつつ,埋め込み方式に匹敵する高い精度と効率を実現する。
論文 参考訳(メタデータ) (2025-08-11T06:22:25Z) - SCAN: Structured Capability Assessment and Navigation for LLMs [54.54085382131134]
textbfSCAN (Structured Capability Assessment and Navigation) は、大規模言語モデルの詳細な特徴付けを可能にする実用的なフレームワークである。
SCANには4つの重要なコンポーネントが含まれている。
TaxBuilder – クエリから機能表示タグを抽出して階層的な分類構造を構築する。
RealMixは、各機能タグに対する十分な評価データを保証するクエリ合成とフィルタリングのメカニズムである。
PC$2$ベースのLCM-as-a-Judge法は従来のLCM-as-a-Judge法と比較して大幅に精度が向上する
論文 参考訳(メタデータ) (2025-05-10T16:52:40Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - Hierarchical Few-Shot Object Detection: Problem, Benchmark and Method [29.810528396323303]
階層型小ショットオブジェクト検出(Hi-FSOD)と呼ばれる新しい問題を提案・解決する。
Hi-FSODは、FSODパラダイムの階層的なカテゴリを持つオブジェクトを検出することを目的としている。
大規模かつ高品質なHi-FSODベンチマークデータセットHiFSOD-Birdを構築した。
論文 参考訳(メタデータ) (2022-10-08T07:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。