論文の概要: JEDI: Java Evaluation of Declarative and Imperative Queries
- arxiv url: http://arxiv.org/abs/2605.23543v1
- Date: Fri, 22 May 2026 12:07:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.335078
- Title: JEDI: Java Evaluation of Declarative and Imperative Queries
- Title(参考訳): JEDI: 宣言型および命令型クエリのJava評価
- Authors: Filippo Schiavio, Walter Binder,
- Abstract要約: ストリームベースのアプリケーションに特化したベンチマークが不足している。
この作業では、Stream APIをターゲットにしたベンチマークスイートであるJEDIを紹介します。
- 参考スコア(独自算出の注目度): 1.6042394978941517
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Java Stream API aims at increasing developer productivity thanks to an easy-to-read declarative syntax to express computations. It also simplifies parallel computing, providing a high-level abstraction on top of common parallelization aspects. Unfortunately, there is a lack of benchmarks specifically targeting stream-based applications. Such a lack of benchmarks makes it difficult for researchers and developers of the Java class library to optimize the Stream API. Moreover, in the absence of dedicated benchmarks, it is difficult to analyze the performance of streams to suggest developers how to write efficient code using the API. In this work we present JEDI, a benchmark suite that targets the Stream API. JEDI is automatically generated by converting SQL benchmarks into Java benchmarks. Our code generator supports targets different implementations (both stream-based and imperative) for the same query. The ultimate goal of our benchmark suite -- and the main contribution of this work -- is to analyze the performance of the different implementations to spot inefficient code structures and better alternatives, suggesting best practices to Java developers. Among the multiple implementations we generate, we focus on different parallelization strategies and explain the most efficient parallelization strategies based on characteristics of the processed data. Finally, the code generation producing imperative code defines of a baseline that can guide researchers and Java implementers to optimize the Stream API.
- Abstract(参考訳): Java Stream APIは、計算を表現できる宣言型構文のおかげで、開発者の生産性を高めることを目的としている。
また、並列計算を単純化し、共通の並列化の側面の上に高レベルな抽象化を提供する。
残念なことに、ストリームベースのアプリケーションに特化したベンチマークが不足しています。
このようなベンチマークの欠如は、Javaクラスライブラリの研究者や開発者がStream APIを最適化することを困難にしている。
さらに、専用のベンチマークがないため、ストリームのパフォーマンスを分析して、APIを使って効率的なコードを書く方法を開発者に提案することは困難である。
この作業では、Stream APIをターゲットにしたベンチマークスイートであるJEDIを紹介します。
JEDIはSQLベンチマークをJavaベンチマークに変換することで自動的に生成される。
私たちのコードジェネレータは、同じクエリに対して異なる実装(ストリームベースと命令の両方)をターゲットにしています。
ベンチマークスイートの最終的な目標は、この作業の主な貢献は、異なる実装のパフォーマンスを分析して、非効率なコード構造とより良い代替品を見つけることで、Java開発者にベストプラクティスを提案することです。
生成する複数の実装の中で、異なる並列化戦略に注目し、処理データの特徴に基づく最も効率的な並列化戦略を説明する。
最後に、命令型コードを生成するコード生成は、研究者やJava実装者がStream APIを最適化できるようにガイドできるベースラインを定義する。
関連論文リスト
- Misleading Microbenchmarks on the Java Virtual Machines [1.4885603159356078]
Java仮想マシン(JVM)では、開発者はメソッドやクラスの最もパフォーマンスの良い実装を選択するためにマイクロベンチマークを使うことが多い。
本稿では,非現実的プロファイルを誘導する条件下でのマイクロベンチマークの使用が,既存のガイドラインに従っているにもかかわらず,どのように誤解を招くかを示す。
論文 参考訳(メタデータ) (2026-05-22T12:38:12Z) - PerfCodeBench: Benchmarking LLMs for System-Level High-Performance Code Optimization [43.72919370258115]
PerfCodeBenchは、大規模言語モデル(LLM)を高速コード最適化で評価するための実行可能なベンチマークである。
このタスクには、システムレベルの実装選択、ハードウェア対応の最適化、パフォーマンスボトルネックの慎重に処理する必要がある。
我々の評価は、モデル生成コードと専門家最適化実装の間に明確なギャップがあることを示します。
論文 参考訳(メタデータ) (2026-05-13T08:10:26Z) - CodeAlignBench: Assessing Code Generation Models on Developer-Preferred Code Adjustments [1.3999481573773072]
本稿では,命令追従機能の評価を行うマルチ言語ベンチマークを提案する。
本ベンチマークでは、初期問題に規定された事前定義された制約の順守と、フォローアップ命令に基づいて改善を行う能力の2つの主要な設定で命令に従うことを評価する。
論文 参考訳(メタデータ) (2025-10-31T15:47:07Z) - A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [14.665460257371164]
GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。
API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文 参考訳(メタデータ) (2024-09-23T17:22:09Z) - DOCE: Finding the Sweet Spot for Execution-Based Code Generation [69.5305729627198]
本稿では,候補生成,$n$-best再ランク,最小ベイズリスク(MBR)復号化,自己老化などを含む包括的フレームワークを提案する。
本研究は,実行ベースメソッドの重要性と,実行ベースメソッドと実行フリーメソッドとの差を明らかにする。
論文 参考訳(メタデータ) (2024-08-25T07:10:36Z) - ScenEval: A Benchmark for Scenario-Based Evaluation of Code Generation [4.181146104301203]
本稿では,この手法をコード生成のための大規模言語モデルを用いて実証する。
ScenEvalと呼ばれるベンチマークは、教科書、オンラインチュートリアルウェブサイト、Stack Overflowの問題から構築されている。
実験の結果,ChatGPTの性能はコーディングタスクの複雑さによって低下することがわかった。
論文 参考訳(メタデータ) (2024-06-18T14:02:20Z) - Long Code Arena: a Set of Benchmarks for Long-Context Code Models [75.70507534322336]
Long Code Arenaは、プロジェクト全体のコンテキストを必要とするコード処理タスクのための6つのベンチマークスイートである。
これらのタスクは、ライブラリベースのコード生成、CIビルドの修復、プロジェクトレベルのコード補完、コミットメッセージ生成、バグローカライゼーション、モジュールの要約といった、コード処理のさまざまな側面をカバーする。
各タスクに対して、テスト用の手作業によるデータセット、評価スイート、オープンソースのベースラインソリューションを提供しています。
論文 参考訳(メタデータ) (2024-06-17T14:58:29Z) - JavaBench: A Benchmark of Object-Oriented Code Generation for Evaluating Large Language Models [22.95865189208591]
OOP機能を実行するプロジェクトレベルのJavaベンチマークであるJavaBenchを提案する。
106のJavaクラスに389のメソッドを持つ4つのJavaプロジェクトで構成されている。
282人の大学生が合格し、平均スコアは90.93/100である。
論文 参考訳(メタデータ) (2024-06-10T06:43:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。