論文の概要: Data-Driven Evidence-Based Syntactic Sugar Design
- arxiv url: http://arxiv.org/abs/2402.01079v1
- Date: Fri, 2 Feb 2024 00:35:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 17:15:09.693377
- Title: Data-Driven Evidence-Based Syntactic Sugar Design
- Title(参考訳): データ駆動エビデンスに基づくシュガーデザイン
- Authors: David OBrien, Robert Dyer, Tien N. Nguyen, Hridesh Rajan
- Abstract要約: 本稿では,頻繁なサブグラフマイニング手法を適用して,データ駆動プログラミングの進化を動機付ける手法を提案する。
データセットは、Javaコントロールフローグラフを一般化して、幅広いプログラミング言語の使用状況と重複のインスタンスをキャプチャすることで採掘される。
提案手法の利点として,様々なプログラミング構造を含む新しい構文糖を同定した。
- 参考スコア(独自算出の注目度): 18.25926052900955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Programming languages are essential tools for developers, and their evolution
plays a crucial role in supporting the activities of developers. One instance
of programming language evolution is the introduction of syntactic sugars,
which are additional syntax elements that provide alternative, more readable
code constructs. However, the process of designing and evolving a programming
language has traditionally been guided by anecdotal experiences and intuition.
Recent advances in tools and methodologies for mining open-source repositories
have enabled developers to make data-driven software engineering decisions. In
light of this, this paper proposes an approach for motivating data-driven
programming evolution by applying frequent subgraph mining techniques to a
large dataset of 166,827,154 open-source Java methods. The dataset is mined by
generalizing Java control-flow graphs to capture broad programming language
usages and instances of duplication. Frequent subgraphs are then extracted to
identify potentially impactful opportunities for new syntactic sugars. Our
diverse results demonstrate the benefits of the proposed technique by
identifying new syntactic sugars involving a variety of programming constructs
that could be implemented in Java, thus simplifying frequent code idioms. This
approach can potentially provide valuable insights for Java language designers,
and serve as a proof-of-concept for data-driven programming language design and
evolution.
- Abstract(参考訳): プログラミング言語は開発者にとって必須のツールであり、その進化は開発者の活動をサポートする上で重要な役割を果たす。
プログラミング言語の進化の1つの例は、代替で読みやすいコード構造を提供する追加の構文要素である構文シュガーの導入である。
しかしながら、プログラミング言語の設計と進化のプロセスは、伝統的に逸話的な経験と直観によって導かれてきた。
オープンソースリポジトリをマイニングするツールや方法論の最近の進歩により、開発者はデータ駆動型ソフトウェアエンジニアリングの意思決定が可能になった。
そこで本研究では,166,827,154個のオープンソースJavaメソッドの大規模データセットに頻繁なサブグラフマイニング手法を適用することで,データ駆動プログラミングの進化を促す手法を提案する。
このデータセットは、Javaの制御フローグラフを一般化して、幅広いプログラミング言語の使用状況と重複のインスタンスをキャプチャする。
頻繁なサブグラフが抽出され、新しい構文シュガーの潜在的影響のある機会が特定される。
多様な結果から,Javaで実装可能な様々なプログラミング構造を含む新しい構文シュガーを同定し,頻繁なコードイディオムを簡素化することで,提案手法の利点を実証した。
このアプローチは、Java言語のデザイナに貴重な洞察を与え、データ駆動型プログラミング言語の設計と進化の実証となる可能性がある。
関連論文リスト
- Natural language is not enough: Benchmarking multi-modal generative AI for Verilog generation [37.309663295844835]
視覚言語入力からのVerilog合成に適したマルチモーダル生成モデルのオープンソースベンチマークを提案する。
また、オープンソースのビジュアルで自然言語のVerilogクエリ言語フレームワークについても紹介する。
本結果は,自然言語のみに基づくクエリと比較して,マルチモーダル生成のVerilogが大幅に向上したことを示す。
論文 参考訳(メタデータ) (2024-07-11T13:10:09Z) - CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
我々は,LLMの性能を高めるため,グラフィカル検索拡張コード生成フレームワークであるCodeGRAGを提案する。
CodeGRAGは、制御フローとデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミング言語と自然言語のギャップを埋める。
ハードメタグラフプロンプト、ソフトプロンプト技術、事前訓練されたGNN専門家の目的の有効性を検証するために、C++言語とピソン言語の両方を含む4つのデータセットで様々な実験と改善が行われた。
論文 参考訳(メタデータ) (2024-05-03T02:48:55Z) - GPTs Are Multilingual Annotators for Sequence Generation Tasks [11.59128394819439]
本研究では,大規模言語モデルを用いた自律アノテーション手法を提案する。
提案手法はコスト効率だけでなく,低リソース言語アノテーションにも適用可能であることを示す。
論文 参考訳(メタデータ) (2024-02-08T09:44:02Z) - AdaCCD: Adaptive Semantic Contrasts Discovery Based Cross Lingual
Adaptation for Code Clone Detection [69.79627042058048]
AdaCCDは、その言語でアノテーションを使わずに、新しい言語のクローンコードを検出する新しい言語間適応手法である。
5つのプログラミング言語からなる多言語コードクローン検出ベンチマークを構築し,AdaCCDの言語間適応性を評価する。
論文 参考訳(メタデータ) (2023-11-13T12:20:48Z) - Large Language Models as Analogical Reasoners [155.9617224350088]
CoT(Chain-of- Thought)は、言語モデルのプロンプトとして、推論タスク全体で素晴らしいパフォーマンスを示す。
そこで本稿では,大規模言語モデルの推論プロセスを自動的にガイドする,新たなプロンプト手法であるアナログプロンプトを導入する。
論文 参考訳(メタデータ) (2023-10-03T00:57:26Z) - Exploring Large Language Model for Graph Data Understanding in Online
Job Recommendations [63.19448893196642]
本稿では,大規模言語モデルが提供するリッチな文脈情報と意味表現を利用して行動グラフを解析する新しいフレームワークを提案する。
この機能を利用することで、個々のユーザに対してパーソナライズされた、正確なジョブレコメンデーションが可能になる。
論文 参考訳(メタデータ) (2023-07-10T11:29:41Z) - A Comprehensive Review of State-of-The-Art Methods for Java Code
Generation from Natural Language Text [0.0]
本稿では,Javaコード生成タスクにおけるディープラーニングモデルの進化と進展を概観する。
我々は,最も重要な手法に焦点を合わせ,そのメリットと限界,およびコミュニティが使用する目的的機能を示す。
論文 参考訳(メタデータ) (2023-06-10T07:27:51Z) - Benchmarking Language Models for Code Syntax Understanding [79.11525961219591]
事前学習された言語モデルは、自然言語処理とプログラム理解の両方において素晴らしい性能を示している。
本研究では,プログラムの構文構造を特定するための,最先端の事前訓練モデルの最初の徹底的なベンチマークを行う。
この結果から,既存のプログラミング言語の事前学習手法の限界が指摘され,構文構造をモデル化することの重要性が示唆された。
論文 参考訳(メタデータ) (2022-10-26T04:47:18Z) - Cross-Lingual Adaptation for Type Inference [29.234418962960905]
弱い型付き言語間で深層学習に基づく型推論を行うための言語間適応フレームワークPLATOを提案する。
強く型付けされた言語からのデータを活用することで、PLATOは、バックボーンのクロスプログラミング言語モデルの難易度を改善する。
論文 参考訳(メタデータ) (2021-07-01T00:20:24Z) - Reinforced Iterative Knowledge Distillation for Cross-Lingual Named
Entity Recognition [54.92161571089808]
言語間NERは、知識をリッチリソース言語から低リソース言語に転送する。
既存の言語間NERメソッドは、ターゲット言語でリッチなラベル付けされていないデータをうまく利用しない。
半教師付き学習と強化学習のアイデアに基づく新しいアプローチを開発する。
論文 参考訳(メタデータ) (2021-06-01T05:46:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。