Fugu-MT 論文翻訳(概要): RefExpo: Unveiling Software Project Structures through Advanced Dependency Graph Extraction

論文の概要: RefExpo: Unveiling Software Project Structures through Advanced Dependency Graph Extraction

arxiv url: http://arxiv.org/abs/2407.02620v2
Date: Wed, 04 Dec 2024 22:48:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-06 20:43:01.576371
Title: RefExpo: Unveiling Software Project Structures through Advanced Dependency Graph Extraction
Title（参考訳）: RefExpo: 高度な依存性グラフ抽出によるソフトウェアプロジェクト構造の構築
Authors: Vahid Haratian, Pouria Derakhshanfar, Vladimir Kovalenko, Eray Tüzün,
Abstract要約: RefExpoは再利用可能なDG抽出ツールで、Java、Python、JavaScriptなどの複数の言語をサポートする。この記事では、Java、Python、JavaScriptなどの複数の言語をサポートする再利用可能なDG抽出ツールであるRefExpoを紹介した。
参考スコア（独自算出の注目度）: 4.213593962963307
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The dependency graph (DG) of a software project offers valuable insights for identifying its key components and has been leveraged in numerous studies. However, there is a lack of reusable tools for DG extraction. Existing tools are either outdated and difficult to configure or fail to provide accurate analysis. This study introduces RefExpo, a reusable DG extraction tool that supports multiple languages such as Java, Python, and JavaScript. RefExpo is a plugin based on IntelliJ, a well-maintained and reputed IDE. We also compile an initial version of our dataset, consisting of 20 Java and Python projects. RefExpo's validity is evaluated at two levels: specific language features and comparisons against other tools, referred to as micro and macro levels. Our results show RefExpo achieves 92\% and 100\% recall on micro test suites Judge and PyCG for Python and Java, respectively. In macro-level experiments, RefExpo outperformed existing tools by 31\% and 7\% in finding unique and shared results. The installable version of RefExpo is available on the IntelliJ marketplace, and a short video describing its functionality is available on YouTube.
Abstract（参考訳）: ソフトウェアプロジェクトの依存性グラフ(DG)は、重要なコンポーネントを特定する上で貴重な洞察を提供し、多くの研究で活用されている。しかし、DG抽出のための再利用可能なツールが不足している。既存のツールは時代遅れで、設定が難しいか、正確な分析ができないかのどちらかです。この記事では、Java、Python、JavaScriptなどの複数の言語をサポートする再利用可能なDG抽出ツールであるRefExpoを紹介した。 RefExpoはIntelliJをベースにしたプラグインだ。また、20のJavaプロジェクトとPythonプロジェクトからなるデータセットの初期バージョンもコンパイルしています。 RefExpoの有効性は、特定の言語の特徴と、マイクロレベルとマクロレベルと呼ばれる他のツールとの比較の2つのレベルで評価される。その結果, RefExpo は Python と Java のマイクロテストスイートである judge と PyCG で 992 % と 100 % のリコールを達成した。マクロレベルの実験では、RefExpoは、独特で共有された結果の発見において、既存のツールを31.5%と7.%で上回りました。 RefExpoのインストール可能なバージョンはIntelliJマーケットプレースで利用可能であり、その機能を説明する短いビデオがYouTubeで公開されている。

関連論文リスト

Repository Intelligence Graph: Deterministic Architectural Map for LLM Code Assistants [0.0]
リポジトリを意識したコーディングエージェントは、しばしばビルドとテストの構造を回復するのに苦労する。私たちは、ビルド可能なコンポーネント、アグリゲータ、ランナー、テスト、外部パッケージ、パッケージマネージャを表す決定論的、エビデンスを背景としたアーキテクチャマップであるRepository Intelligence Graph(RIG)を紹介します。 Claude Code、Cursor、Codexの3つの商用エージェントを、現実世界のMetaFFIプロジェクトを含む、低から高ビルドの複雑さにまたがる8つのリポジトリで評価します。
論文参考訳（メタデータ） (2026-01-15T06:42:45Z)
GREx: Generalized Referring Expression Segmentation, Comprehension, and Generation [99.51887959226735]
本稿では、GRES(Generalized Referring Expression)、GREC(GREC)、GREG(Generation)という3つの新しいベンチマークを紹介する。 GRExは古典的なRExを拡張して、式が任意の数のオブジェクトを識別できるようにする。我々は,マルチターゲット,ノーターゲット,シングルターゲット表現を含む最初の大規模GRExデータセットgRefCOCOを構築した。
論文参考訳（メタデータ） (2026-01-08T18:59:30Z)
Repairing Tool Calls Using Post-tool Execution Reflection and RAG [5.352165816659788]
エージェントシステムは,Python関数やREST APIエンドポイント,kubectlなどのコマンドラインツールをコールすることで,外部システムと対話する。これらのツールコールは、様々な構文的および意味的な理由で失敗することが多い。大規模言語モデル(LLM)に基づくリフレクションとドメイン固有検索拡張生成(RAG)を組み合わせたポストツール実行コンポーネントを開発した。
論文参考訳（メタデータ） (2025-10-17T03:50:37Z)
RAILS: Retrieval-Augmented Intelligence for Learning Software Development [0.0]
GPT-3.5-Turboのような大規模言語モデル(LLM)は、外部またはプロジェクト固有のドキュメントにアクセスできない場合、不完全なコードや不正なインポートを生成する。我々は、LLMプロンプトを拡張するフレームワークであるRAILSを紹介し、キュレートされたリソースから意味的に検索されたコンテキストを付加する。 RAILSを、標準ライブラリ、GUI API、外部ツール、カスタムユーティリティにまたがる78の現実世界のJavaインポートエラーケースで評価した。
論文参考訳（メタデータ） (2025-06-28T03:30:04Z)
Empirical Evaluation of Generalizable Automated Program Repair with Large Language Models [4.757323827658957]
自動プログラム修正は、開発者がソフトウェアをメンテナンスするのを助けるバグ修正を提案する。近年の研究では、LLMを修復に利用できることが示されている。オープンモデル (Llama 3.3, Qwen 2.5 Coder, DeepSeek R1 (dist.) など) やクローズドモデル (o3-mini, GPT-4o, Claude 3.7 Sonnet, Gemini 2.0 Flash など) を含む,最新の13モデルの多種多様なセットを評価した。
論文参考訳（メタデータ） (2025-06-03T18:15:14Z)
EnvBench: A Benchmark for Automated Environment Setup [76.02998475135824]
大規模言語モデルにより、研究者はソフトウェア工学領域における実用的なリポジトリレベルのタスクに集中できるようになった。環境設定に関する既存の研究は革新的なエージェント戦略を導入しているが、その評価は小さなデータセットに基づいていることが多い。このギャップに対処するため、包括的環境設定ベンチマークEnvBenchを紹介します。
論文参考訳（メタデータ） (2025-03-18T17:19:12Z)
ExecRepoBench: Multi-level Executable Code Completion Evaluation [45.963424627710765]
本稿では,リポジトリレベルのベンチマークであるExecRepoBenchの作成を通じて,ソフトウェア開発におけるコード補完を強化する新しいフレームワークを紹介する。本稿では,抽象構文木をベースとした多段階文法ベースの補完手法を提案し,様々な論理単位のコードフラグメントをマスキングする。次に,Repo-Instruct の 7B パラメータでオープンソースの LLM を微調整し,強力なコード補完ベースラインモデル Qwen2.5-Coder-Instruct-C を生成する。
論文参考訳（メタデータ） (2024-12-16T17:14:35Z)
RepoGraph: Enhancing AI Software Engineering with Repository-level Code Graph [63.87660059104077]
RepoGraphは、現代のAIソフトウェアエンジニアリングソリューションのためのリポジトリレベルの構造を管理するプラグインモジュールである。 RepoGraphはすべてのシステムのパフォーマンスを大幅に向上させ、オープンソースフレームワークの間で新たな最先端技術を生み出している。
論文参考訳（メタデータ） (2024-10-03T05:45:26Z)
CodexGraph: Bridging Large Language Models and Code Repositories via Code Graph Databases [13.733229886643041]
大きな言語モデル(LLM)は、HumanEvalやMBPPのようなスタンドアロンのコードタスクに優れていますが、コードリポジトリ全体の処理に苦労しています。類似性に基づく検索は複雑なタスクではリコールが低いことが多いが、手動ツールやAPIは通常タスク固有であり、専門家の知識を必要とする。我々は,LLMエージェントをコードリポジトリから抽出したグラフデータベースインターフェースと統合するシステムであるCodexGraphを紹介する。
論文参考訳（メタデータ） (2024-08-07T17:13:59Z)
How to Understand Whole Software Repository? [64.19431011897515]
リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文参考訳（メタデータ） (2024-06-03T15:20:06Z)
Class-Level Code Generation from Natural Language Using Iterative, Tool-Enhanced Reasoning over Repository [4.767858874370881]
実世界のリポジトリ内でクラスレベルのコードを生成する際に,LLMを厳格に評価するためのベンチマークであるRepoClassBenchを紹介する。 RepoClassBenchには、リポジトリの選択からJava、Python、C#にまたがる"Natural Language to Class Generation"タスクが含まれている。 Retrieve-Repotools-Reflect (RRR)は,レポジトリレベルのコンテキストを反復的にナビゲートし,推論する静的解析ツールを備えた新しいアプローチである。
論文参考訳（メタデータ） (2024-04-22T03:52:54Z)
ReGAL: Refactoring Programs to Discover Generalizable Abstractions [59.05769810380928]
Generalizable Abstraction Learning (ReGAL)は、再利用可能な関数のライブラリをコード化して学習する手法である。 ReGALによって発見された共有関数ライブラリは、プログラムが様々な領域で容易に予測できることを示している。 CodeLlama-13Bでは、ReGALはLOGOで11.5%、日付理解で26.1%、TextCraftで8.1%という絶対精度が向上し、3つのドメインのうち2つでGPT-3.5を上回った。
論文参考訳（メタデータ） (2024-01-29T18:45:30Z)
EASYTOOL: Enhancing LLM-based Agents with Concise Tool Instruction [56.02100384015907]
EasyToolは、多種多様で長いツールドキュメントを統一的で簡潔なツール命令に変換するフレームワークである。トークン使用量を大幅に削減し、現実のシナリオにおけるツール利用のパフォーマンスを向上させることができる。
論文参考訳（メタデータ） (2024-01-11T15:45:11Z)
Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文参考訳（メタデータ） (2023-12-29T14:25:22Z)
Visual In-Context Prompting [100.93587329049848]
本稿では,オープンセットのセグメンテーションや検出といった視覚的タスクのためのユニバーサルな視覚的インコンテキストプロンプトフレームワークを提案する。エンコーダ-デコーダアーキテクチャ上に構築し,ストロークやボックス,ポイントなど,さまざまなプロンプトをサポートする汎用的なプロンプトエンコーダを開発する。広範にわたる調査の結果,提案した視覚的インコンテクストは,異常参照と汎用セグメンテーション機能を引き起こすことが示された。
論文参考訳（メタデータ） (2023-11-22T18:59:48Z)
ControlLLM: Augment Language Models with Tools by Searching on Graphs [97.62758830255002]
我々は,大規模言語モデル(LLM)が実世界のタスクを解くためのマルチモーダルツールを利用できる新しいフレームワークであるControlLLMを提案する。フレームワークは,(1)複雑なタスクを明確なサブタスクに分割し,入力と出力を適切に定義したサブタスクに分解するtextittask Decomposer,(2)構築済みのツールグラフ上で最適なソリューションパスを探索する textitThoughts-on-Graph(ToG)パラダイム,(3)ソリューションパスを解釈して実行するリッチなツールボックスを備えた textitexecution Engine,の3つの主要なコンポーネントから構成される。
論文参考訳（メタデータ） (2023-10-26T21:57:21Z)
scg-cli -- a Tool Supporting Software Comprehension via Extraction and Analysis of Semantic Code Graph [0.0]
scg-cliは、ソフトウェアの理解を容易にするコマンドラインツールである。 JavaおよびScalaプロジェクトから、コード構造と依存関係に関するセマンティック情報を取り出す。プロジェクトメトリクスを取得し、最も重要なコードエンティティを見つけ、プロジェクトのパーティショニングを計算するのに使うことができる。
論文参考訳（メタデータ） (2023-10-03T19:04:51Z)
CRAFT: Customizing LLMs by Creating and Retrieving from Specialized Toolsets [75.64181719386497]
大規模言語モデル(LLM)のためのツール作成・検索フレームワークであるCRAFTを提案する。タスク用に特別にキュレートされたツールセットを作成し、複雑なタスクを解決する能力を高めるためにこれらのセットからツールを取得するコンポーネントをLLMに装備する。本手法はフレキシブルに設計されており,既製のLCMを細かな調整なしに未確認領域やモダリティに適応するためのプラグアンドプレイ方式を提供する。
論文参考訳（メタデータ） (2023-09-29T17:40:26Z)
ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs [104.37772295581088]
オープンソースの大規模言語モデル(LLM)、例えばLLaMAは、ツール使用能力に大きく制限されている。データ構築、モデルトレーニング、評価を含む汎用ツールであるToolLLMを紹介する。ツール使用のためのインストラクションチューニングフレームワークであるToolBenchを,ChatGPTを使って自動構築する。
論文参考訳（メタデータ） (2023-07-31T15:56:53Z)
A Language Model of Java Methods with Train/Test Deduplication [5.529795221640365]
このツールデモでは、Javaソースコードの言語モデルの研究ツールキットが紹介されている。対象読者には、Javaのサブルーチン、ステートメント、変数の粒度レベルでの問題を研究する研究者も含まれる。
論文参考訳（メタデータ） (2023-05-15T00:22:02Z)
Desbordante: from benchmarking suite to high-performance science-intensive data profiler (preprint) [36.537985747809245]
Desbordanteは、オープンソースのコードを持つ高性能な科学集約型データプロファイラである。類似のシステムとは異なり、マルチユーザ環境での産業的応用に重点を置いて構築されている。効率的で、クラッシュに対して回復力があり、スケーラブルです。
論文参考訳（メタデータ） (2023-01-14T19:14:51Z)
DeepKE: A Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population [95.0099875111663]
DeepKEは、名前付きエンティティ認識、関係抽出、属性抽出など、さまざまな情報抽出タスクを実装している。 DeepKEを使えば、開発者や研究者はデータセットやモデルをカスタマイズして、要求に応じて構造化されていないデータから情報を抽出できる。
論文参考訳（メタデータ） (2022-01-10T13:29:05Z)
LabelGit: A Dataset for Software Repositories Classification using Attributed Dependency Graphs [11.523471275501857]
LabelGitと呼ばれるGitHubプロジェクトの新しいデータセットを作成します。私たちのデータセットは、依存関係グラフや識別子からのソースコードニューラル表現など、ソースコードからの直接的な情報を使用します。プロキシに頼らず、ソースコード全体を分類するために使用するソリューションの開発を支援することを願っています。
論文参考訳（メタデータ） (2021-03-16T07:28:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。