Fugu-MT 論文翻訳(概要): Automatic Multi-level Feature Tree Construction for Domain-Specific Reusable Artifacts Management

論文の概要: Automatic Multi-level Feature Tree Construction for Domain-Specific Reusable Artifacts Management

arxiv url: http://arxiv.org/abs/2506.03946v1
Date: Wed, 04 Jun 2025 13:33:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-05 21:20:14.357988
Title: Automatic Multi-level Feature Tree Construction for Domain-Specific Reusable Artifacts Management
Title（参考訳）: ドメイン特定再利用可能なアーティファクト管理のためのマルチレベル特徴木の自動構築
Authors: Dongming Jin, Zhi Jin, Nianyu Li, Kai Yang, Linyu Li, Suijing Guan,
Abstract要約: 本稿では,FTBuilDERという自動多層特徴木構築フレームワークを提案する。自動的にドメイン固有のソフトウェアリポジトリをクロールし、メタデータをマージして構造化されたアーティファクトライブラリを構築する。これにより、アーティファクトの選択に26%の時間を節約でき、GPT-4でアーティファクトレコメンデーションの精度を235%向上できる。
参考スコア（独自算出の注目度）: 15.822095826931942
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the rapid growth of open-source ecosystems (e.g., Linux) and domain-specific software projects (e.g., aerospace), efficient management of reusable artifacts is becoming increasingly crucial for software reuse. The multi-level feature tree enables semantic management based on functionality and supports requirements-driven artifact selection. However, constructing such a tree heavily relies on domain expertise, which is time-consuming and labor-intensive. To address this issue, this paper proposes an automatic multi-level feature tree construction framework named FTBUILDER, which consists of three stages. It automatically crawls domain-specific software repositories and merges their metadata to construct a structured artifact library. It employs clustering algorithms to identify a set of artifacts with common features. It constructs a prompt and uses LLMs to summarize their common features. FTBUILDER recursively applies the identification and summarization stages to construct a multi-level feature tree from the bottom up. To validate FTBUILDER, we conduct experiments from multiple aspects (e.g., tree quality and time cost) using the Linux distribution ecosystem. Specifically, we first simultaneously develop and evaluate 24 alternative solutions in the FTBUILDER. We then construct a three-level feature tree using the best solution among them. Compared to the official feature tree, our tree exhibits higher quality, with a 9% improvement in the silhouette coefficient and an 11% increase in GValue. Furthermore, it can save developers more time in selecting artifacts by 26% and improve the accuracy of artifact recommendations with GPT-4 by 235%. FTBUILDER can be extended to other open-source software communities and domain-specific industrial enterprises.
Abstract（参考訳）: オープンソースエコシステム(Linuxなど)とドメイン固有のソフトウェアプロジェクト(航空宇宙など)の急速な成長に伴い、再利用可能なアーティファクトの効率的な管理は、ソフトウェア再利用にとってますます重要になっている。マルチレベル機能ツリーは機能に基づいたセマンティック管理を可能にし、要件駆動のアーティファクト選択をサポートする。しかし、そのような木を構築するのはドメインの専門知識に大きく依存する。本稿では,3段階からなるFTBUILDERという機能木自動構築フレームワークを提案する。自動的にドメイン固有のソフトウェアリポジトリをクロールし、メタデータをマージして構造化されたアーティファクトライブラリを構築する。クラスタリングアルゴリズムを使用して、共通の特徴を持つアーティファクトのセットを識別する。プロンプトを構築し、LLMを使って共通の特徴を要約する。 FTBuilDERは、ボトムアップから多層特徴木を構築するために、識別と要約の段階を再帰的に適用する。 FTBuilDERを検証するために,Linuxディストリビューションエコシステムを用いて,複数の側面(木質,時間コストなど)から実験を行う。具体的には、FTBuilDERで24の代替ソリューションを同時に開発し、評価する。次に、最も優れたソリューションを使って、3レベルの特徴木を構築します。その結果, シルエット係数は9%改善し, GValueは11%向上した。さらに、アーティファクトの選択に要する時間を26%削減し、GPT-4によるアーティファクトレコメンデーションの精度を235%向上させることができる。 FTBUILDERは、他のオープンソースソフトウェアコミュニティやドメイン固有の産業に拡張することができる。

関連論文リスト

Do Not Treat Code as Natural Language: Implications for Repository-Level Code Generation and Beyond [13.550121154853715]
自然言語ではなく構造化コードとしてコードを扱う,リポジトリレベルのコード生成フレームワークであるHydraを紹介します。我々はHydraがオープンソースおよびクローズドソースのCodeLLMにまたがって最先端のパフォーマンスを実現することを示す。
論文参考訳（メタデータ） (2026-02-12T07:44:00Z)
A Needle in a Haystack: Intent-driven Reusable Artifacts Recommendation with LLMs [37.95562238022091]
オープンソースソフトウェア開発では、冗長な実装作業を避けるため、既存のアーティファクトの再利用が広く採用されている。多くの再利用可能なアーティファクトに直面している場合、開発者は、期待されるニーズを満たすアーティファクトを見つけるのに苦労することが多い。この負担を軽減するため、アーティファクトレコメンデーションを自動化するために、検索ベースおよび学習ベース技術が提案されている。
論文参考訳（メタデータ） (2025-11-23T08:39:43Z)
WHU-STree: A Multi-modal Benchmark Dataset for Street Tree Inventory [12.479581358582877]
WHU-STreeは、クロスシティー、リッチアノテート、マルチモーダル・ストリートツリーデータセットである。同期した点雲と高解像度の画像を統合し、50種にわたる21,007個の注釈付きツリーインスタンスと2つの形態パラメータを含む。
論文参考訳（メタデータ） (2025-09-16T15:23:40Z)
TreeGPT: Pure TreeFFN Encoder-Decoder Architecture for Structured Reasoning Without Attention Mechanisms [0.16244541005112745]
TreeGPTは、構造化推論タスクのための純粋なTreeFFNエンコーダデコーダ設計の可能性を探る無注意ニューラルネットワークアーキテクチャである。我々はARC Prize 2025データセットに対するアプローチを評価し、TreeGPTは3.16Mパラメータを使用して99%の精度を達成している。
論文参考訳（メタデータ） (2025-09-06T00:39:33Z)
ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文参考訳（メタデータ） (2025-02-11T21:35:13Z)
LLMs for Generation of Architectural Components: An Exploratory Empirical Study in the Serverless World [0.0]
本稿では,関数・アズ・ア・サービス(F)のためのアーキテクチャコンポーネントを生成するための大規模言語モデルの有用性について検討する。アーキテクチャコンポーネントの小さなサイズは、このアーキテクチャスタイルを現在のLLMを使って生成可能にする。我々は、リポジトリに存在する既存のテストを通じて正確性を評価し、ソフトウェア工学(SE)と自然言語処理(NLP)ドメインのメトリクスを使用する。
論文参考訳（メタデータ） (2025-02-04T18:06:04Z)
CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models [106.11371409170818]
大規模言語モデル(LLM)は、生成されたコードを自己定義し、自律的に改善する機能を持つエージェントとして機能する。コード生成プロセスの異なる段階における探索空間を効率的に探索するLLMエージェントのためのフレームワークであるCodeTreeを提案する。具体的には、異なるコーディング戦略を明示的に探求し、対応するコーディングソリューションを生成し、その後、ソリューションを洗練するために統合されたツリー構造を採用しました。
論文参考訳（メタデータ） (2024-11-07T00:09:54Z)
Supporting Software Maintenance with Dynamically Generated Document Hierarchies [41.407915858583344]
HGENは、ソースコードを6つのステージで変換し、構造化された文書の階層構造に変換する、完全に自動化されたパイプラインである。我々はHGENを定量的にも質的にも評価した。その結果,HGENは手作業で構築したドキュメントに類似したアーティファクト階層を生成し,コアコンセプトをベースラインアプローチよりもはるかに高いカバレッジで実現していることがわかった。
論文参考訳（メタデータ） (2024-08-11T17:11:14Z)
Tree-of-Traversals: A Zero-Shot Reasoning Algorithm for Augmenting Black-box Language Models with Knowledge Graphs [72.89652710634051]
知識グラフ(KG)は、信頼性があり、構造化され、ドメイン固有であり、最新の外部知識を提供することで、Large Language Models(LLM)を補完する。そこで本研究では,ゼロショット推論アルゴリズムであるTree-of-Traversalsを導入する。
論文参考訳（メタデータ） (2024-07-31T06:01:24Z)
AdaTreeFormer: Few Shot Domain Adaptation for Tree Counting from a Single High-Resolution Image [11.649568595318307]
本稿では,十分なラベル付き木を用いてソースドメインから学習するフレームワークを提案する。限られた数のラベル付き木しか持たないターゲットドメインに適合する。実験の結果、AdaTreeFormerは最先端の技術をはるかに上回っていることがわかった。
論文参考訳（メタデータ） (2024-02-05T12:34:03Z)
Enhancing Open-Domain Task-Solving Capability of LLMs via Autonomous Tool Integration from GitHub [79.31134731122462]
オープンドメインのタスク解決能力を評価するためにOpenActベンチマークを導入します。我々は,オープンドメインの進化するクエリに,GitHubから専門ツールを自律的に統合することで対処できる,新しいLLMベースのエージェントシステムであるOpenAgentを紹介する。
論文参考訳（メタデータ） (2023-12-28T15:47:30Z)
Flexible Modeling and Multitask Learning using Differentiable Tree Ensembles [6.037383467521294]
本稿では、任意の損失関数、欠落応答、マルチタスク学習をサポートするために、ツリーアンサンブルを学習するための柔軟なフレームワークを提案する。我々のフレームワークは、一階述語法で訓練できる、微分可能なツリーアンサンブルの上に構築されている。我々のフレームワークは、一般的なツールキットよりも100倍コンパクトで、表現力に富んだツリーアンサンブルを23%も得ることを示す。
論文参考訳（メタデータ） (2022-05-19T17:30:49Z)
Simplified DOM Trees for Transferable Attribute Extraction from the Web [15.728164692696689]
Webページを考えると、構造化されたオブジェクトと関心のあるさまざまな属性の抽出は、さまざまな下流アプリケーションを容易にします。既存のアプローチは、DOMツリーノードのタグ付けタスクとして問題を定式化する。本稿では,各ノードの有用なコンテキストを効率的に取得することで,この問題に取り組むための新しい転送可能な手法であるSimpDOMを提案する。
論文参考訳（メタデータ） (2021-01-07T07:41:55Z)
Rethinking Learnable Tree Filter for Generic Feature Transform [71.77463476808585]
Learnable Tree Filterはセマンティックセグメンテーションのためのモデル構造保存関係に対する顕著なアプローチを示す。幾何学的制約を緩和するために,マルコフ確率場として再構成して解析を行い,学習可能な不定項を導入する。セマンティックセグメンテーションでは、ベルとホイッスルなしでCityscapesベンチマークでトップパフォーマンス(82.1% mIoU)を達成しています。
論文参考訳（メタデータ） (2020-12-07T07:16:47Z)
MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文参考訳（メタデータ） (2020-07-24T17:06:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。