論文の概要: AndroLibZoo: A Reliable Dataset of Libraries Based on Software
Dependency Analysis
- arxiv url: http://arxiv.org/abs/2307.12609v3
- Date: Fri, 9 Feb 2024 02:21:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 20:42:28.575557
- Title: AndroLibZoo: A Reliable Dataset of Libraries Based on Software
Dependency Analysis
- Title(参考訳): AndroLibZoo: ソフトウェア依存分析に基づくライブラリの信頼性の高いデータセット
- Authors: Jordan Samhi, Tegawend\'e F. Bissyand\'e, Jacques Klein
- Abstract要約: そこで我々は,AndroLibZooというデータセットの形式で,高精度かつ最新のサードパーティライブラリセットを生成するための自動アプローチを提案する。
私たちのデータセットはコミュニティで利用でき、現在34の813のライブラリが含まれており、進化を意図しています。
- 参考スコア(独自算出の注目度): 6.342380566583581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Android app developers extensively employ code reuse, integrating many
third-party libraries into their apps. While such integration is practical for
developers, it can be challenging for static analyzers to achieve scalability
and precision when libraries account for a large part of the code. As a direct
consequence, it is common practice in the literature to consider developer code
only during static analysis --with the assumption that the sought issues are in
developer code rather than the libraries. However, analysts need to distinguish
between library and developer code. Currently, many static analyses rely on
white lists of libraries. However, these white lists are unreliable,
inaccurate, and largely non-comprehensive.
In this paper, we propose a new approach to address the lack of comprehensive
and automated solutions for the production of accurate and ``always up to date"
sets of libraries. First, we demonstrate the continued need for a white list of
libraries. Second, we propose an automated approach to produce an accurate and
up-to-date set of third-party libraries in the form of a dataset called
AndroLibZoo. Our dataset, which we make available to the community, contains to
date 34 813 libraries and is meant to evolve.
- Abstract(参考訳): androidアプリ開発者はコード再利用を幅広く採用し、多くのサードパーティライブラリをアプリに組み込んでいる。
このような統合は開発者にとっては実用的だが、ライブラリがコードの大部分を占める場合、静的アナライザがスケーラビリティと精度を達成することは困難である。
直接の結果として、静的解析の間のみ開発者コードを検討することは、文献においてよくあることです -- 求める問題はライブラリではなく開発者コードにあると仮定します。
しかし、アナリストはライブラリと開発者コードを区別する必要がある。
現在、多くの静的解析はライブラリのホワイトリストに依存している。
しかし、これらのホワイトリストは信頼できず、不正確であり、ほとんど理解できない。
本稿では,ライブラリセットの正確かつ‘always up-date’を実現するための包括的かつ自動化されたソリューションの欠如に対処するための新しいアプローチを提案する。
まず,図書館のホワイトリストが引き続き必要であることを示す。
第2に,androlibzooと呼ばれるデータセットの形式で,正確かつ最新のサードパーティライブラリセットを生成するための自動アプローチを提案する。
私たちのデータセットはコミュニティで利用でき、現在34の813のライブラリが含まれており、進化を意図しています。
関連論文リスト
- SocialED: A Python Library for Social Event Detection [53.928241775629566]
SocialEDは、ソーシャルイベント検出(SED)タスクをサポートするように設計された、包括的なオープンソースのPythonライブラリである。
詳細なドキュメンテーションを備えた統一APIを提供し、研究者や実践者がソーシャルメディアにおけるイベント検出の完全なソリューションを提供する。
SocialEDは、グラフ構築やトークン化など、幅広い事前処理技術をサポートし、モデルのトレーニングや予測のための標準化されたインターフェースを含んでいる。
論文 参考訳(メタデータ) (2024-12-18T03:37:47Z) - Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。
エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。
Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文 参考訳(メタデータ) (2024-12-02T18:11:30Z) - LibEvolutionEval: A Benchmark and Study for Version-Specific Code Generation [40.87656746406113]
LibEvolutionEvalは,インラインコード補完を正確に行うために,ライブラリ進化の理解を必要とする研究である。
パブリック・モデルの評価を行い、パブリック・ライブラリの進化がモデルの性能に大きく影響することを発見した。
本稿では,検索したバージョン固有のライブラリの文書化と,高速に進化するパッケージを扱う際のモデルの能力向上について検討する。
論文 参考訳(メタデータ) (2024-11-19T21:52:23Z) - Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文 参考訳(メタデータ) (2024-10-02T09:11:10Z) - CompSuite: A Dataset of Java Library Upgrade Incompatibility Issues [25.189328666070107]
CompSuiteは123の現実世界のJavaクライアント-ライブラリペアを含むデータセットで、ライブラリのアップグレードは非互換性の問題を引き起こします。
CompSuiteの各非互換性問題は、開発者によって書かれたテストケースに関連付けられており、この問題を再現するために使用できる。
論文 参考訳(メタデータ) (2023-05-15T14:26:14Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - An Empirical Study of Library Usage and Dependency in Deep Learning
Frameworks [12.624032509149869]
ピトルチ、カフェ、シキットルンはプロジェクトの18%と14%で最も頻度の高い組み合わせである。
開発者は同じプロジェクトで2つか3つのdlライブラリを使用し、同じ関数と同じファイルの両方で異なる複数のdlライブラリを使用する傾向がある。
論文 参考訳(メタデータ) (2022-11-28T19:31:56Z) - Code Librarian: A Software Package Recommendation System [65.05559087332347]
オープンソースライブラリ用のリコメンデーションエンジンであるLibrarianを提示する。
1)プログラムのインポートライブラリで頻繁に使用されること、2)プログラムのインポートライブラリと似た機能を持つこと、3)開発者の実装と似た機能を持つこと、4)提供されるコードのコンテキストで効率的に使用できること、である。
論文 参考訳(メタデータ) (2022-10-11T12:30:05Z) - Repro: An Open-Source Library for Improving the Reproducibility and
Usability of Publicly Available Research Code [74.28810048824519]
Reproは、研究コードのユーザビリティ向上を目的とした、オープンソースのライブラリである。
Dockerコンテナ内で研究者がリリースしたソフトウェアを実行するための軽量Python APIを提供する。
論文 参考訳(メタデータ) (2022-04-29T01:54:54Z) - Req2Lib: A Semantic Neural Model for Software Library Recommendation [8.713783358744166]
我々はReq2Libと呼ばれる新しいニューラルアプローチを提案し、プロジェクトの要件を記述したライブラリを推奨する。
本研究では,自然言語における要求記述の関連情報と意味情報の学習にシーケンス・ツー・シーケンスモデルを用いる。
我々の予備評価は、Req2Libがライブラリを正確に推奨できることを示しています。
論文 参考訳(メタデータ) (2020-05-24T14:37:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。