論文の概要: CodeLens: An Interactive Tool for Visualizing Code Representations
- arxiv url: http://arxiv.org/abs/2307.14902v1
- Date: Thu, 27 Jul 2023 14:46:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-28 14:11:07.931553
- Title: CodeLens: An Interactive Tool for Visualizing Code Representations
- Title(参考訳): CodeLens: コード表現を視覚化するインタラクティブツール
- Authors: Yuejun Guo and Seifeddine Bettaieb and Qiang Hu and Yves Le Traon and
Qiang Tang
- Abstract要約: ソフトウェアエンジニアリングタスクを自動化するためには、ソースコードを汎用的な入力形式で表現することが不可欠である。
コード表現を視覚化することで、人間の専門家がコードに関する直感的な洞察を得られるようになる。
我々は、様々な表現方法をサポートする視覚的相互作用環境を提供するツール、CodeLensを紹介する。
- 参考スコア(独自算出の注目度): 12.59741038895472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Representing source code in a generic input format is crucial to automate
software engineering tasks, e.g., applying machine learning algorithms to
extract information. Visualizing code representations can further enable human
experts to gain an intuitive insight into the code. Unfortunately, as of today,
there is no universal tool that can simultaneously visualise different types of
code representations. In this paper, we introduce a tool, CodeLens, which
provides a visual interaction environment that supports various representation
methods and helps developers understand and explore them. CodeLens is designed
to support multiple programming languages, such as Java, Python, and
JavaScript, and four types of code representations, including sequence of
tokens, abstract syntax tree (AST), data flow graph (DFG), and control flow
graph (CFG). By using CodeLens, developers can quickly visualize the specific
code representation and also obtain the represented inputs for models of code.
The Web-based interface of CodeLens is available at http://www.codelens.org.
The demonstration video can be found at http://www.codelens.org/demo.
- Abstract(参考訳): 汎用的な入力形式でソースコードを表現することは、例えば機械学習アルゴリズムを用いて情報を抽出するなど、ソフトウェアエンジニアリングタスクを自動化するために重要である。
コード表現を視覚化することで、人間の専門家がコードに対する直感的な洞察を得ることができる。
残念ながら、今日現在、異なるタイプのコード表現を同時に視覚化できる普遍的なツールは存在しない。
本稿では,様々な表現方法をサポートし,開発者の理解と探索を支援するビジュアルインタラクション環境を提供するツールであるcodelensを紹介する。
CodeLensは、Java、Python、JavaScriptなどの複数のプログラミング言語をサポートし、トークンのシーケンス、抽象構文木(AST)、データフローグラフ(DFG)、制御フローグラフ(CFG)を含む4種類のコード表現をサポートするように設計されている。
CodeLensを使用することで、開発者は特定のコード表現を素早く視覚化し、コードモデルの表現された入力を取得することができる。
CodeLensのWebベースのインターフェースはhttp://www.codelens.orgで公開されている。
デモビデオはhttp://www.codelens.org/demo.com/で見ることができる。
関連論文リスト
- IRCoder: Intermediate Representations Make Language Models Robust
Multilingual Code Generators [55.40713784611711]
本研究では,コンパイラ中間表現を活用することで,Code-LMの多言語機能を改善する可能性について検討する。
まず,約400万のソースコードファイルからなる並列データセットであるSLTransをコンパイルする。
次に、SLTransにおける因果言語モデリングトレーニングを継続して実施し、Code-LMはIR言語を学習せざるを得なかった。
IRCoderと呼ばれる結果のモデルは、さまざまなコード生成タスクやメトリクスに対して、サイズと一貫性のあるゲインを表示します。
論文 参考訳(メタデータ) (2024-03-06T17:52:08Z) - SparseCoder: Identifier-Aware Sparse Transformer for File-Level Code
Summarization [51.67317895094664]
本稿では,大規模なソースコードプロジェクトの理解と維持を支援するファイルレベルのコード要約について検討する。
長いコードシーケンスを効果的に処理するための識別子対応スパース変換器であるSparseCoderを提案する。
論文 参考訳(メタデータ) (2024-01-26T09:23:27Z) - TransformCode: A Contrastive Learning Framework for Code Embedding via
Subtree transformation [10.168149114095566]
我々は、コード埋め込みを対照的な学習方法で学習する、TransformCodeと呼ばれる新しいフレームワークを提案する。
私たちのフレームワークは柔軟で適応性があり、コード表現を必要とする他の下流タスクに簡単に拡張できます。
論文 参考訳(メタデータ) (2023-11-10T09:05:23Z) - Retrieval-Augmented Code Generation for Universal Information Extraction [66.68673051922497]
情報抽出は、自然言語テキストから構造的知識を抽出することを目的としている。
本稿では,Large Language Models(LLMs)に基づく汎用検索拡張コード生成フレームワークを提案する。
Code4UIEはPythonクラスを採用し、様々な構造的知識のタスク固有のスキーマを普遍的に定義する。
論文 参考訳(メタデータ) (2023-11-06T09:03:21Z) - COMEX: A Tool for Generating Customized Source Code Representations [7.151800146054561]
COMEXは、研究者と開発者が複数のコードビューを作成し、組み合わせることを可能にするフレームワークである。
プロシージャ内スニペットとプロシージャ間スニペットの両方を使用して、メソッドレベルのスニペットとプログラムレベルのスニペットの両方を分析することができる。
これは40以上の言語をサポートする、広く使われているインクリメンタル分析ツールであるtree-sitter上に構築されている。
論文 参考訳(メタデータ) (2023-07-10T16:46:34Z) - Code Execution with Pre-trained Language Models [88.04688617516827]
コードインテリジェンスのトレーニング済みモデルのほとんどは実行トレースを無視しており、ソースコードと構文構造のみに依存している。
我々は,大規模かつ現実的なPythonデータセットとコード実行タスクを作成するために,突然変異に基づくデータ拡張手法を開発した。
次に、コード実行事前学習とカリキュラム学習を活用して意味理解を強化するトランスフォーマーモデルであるCodeExecutorを提案する。
論文 参考訳(メタデータ) (2023-05-08T10:00:05Z) - Adding Context to Source Code Representations for Deep Learning [13.676416860721877]
我々は、ディープラーニングモデルが分析対象のコードに関する追加のコンテキスト情報にアクセスできることは有益であると主張している。
本稿では,コード自体の情報とともに,コール階層からコンテキストを符号化することで,最先端のディープラーニングモデルの性能を向上できることを示す。
論文 参考訳(メタデータ) (2022-07-30T12:47:32Z) - CODE-MVP: Learning to Represent Source Code from Multiple Views with
Contrastive Pre-Training [26.695345034376388]
本稿では,ソースコードの自然言語記述と異なるビューを,マルチビューによるコントラスト事前学習と統合したフレームワークに統合することを提案する。
具体的には、まずコンパイラツールを用いて複数のコードビューを抽出し、その相補的な情報を対照的な学習フレームワークで学習する。
5つのデータセット上の3つの下流タスクの実験は、いくつかの最先端ベースラインと比較して、CODE-MVPの優位性を示している。
論文 参考訳(メタデータ) (2022-05-04T12:40:58Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - UniXcoder: Unified Cross-Modal Pre-training for Code Representation [65.6846553962117]
プログラミング言語のためのクロスモーダル事前学習モデルUniXcoderを提案する。
木の構造情報を全て保持するシーケンス構造でASTを変換する1対1のマッピング手法を提案する。
我々は,UniXcoderを9つのデータセット上で5つのコード関連タスクで評価する。
論文 参考訳(メタデータ) (2022-03-08T04:48:07Z) - Project CodeNet: A Large-Scale AI for Code Dataset for Learning a
Diversity of Coding Tasks [11.10732802304274]
Project CodeNetは、1400万のコードサンプルと55の異なるプログラミング言語で約5億行のコードで構成されている。
Project CodeNetは、その規模だけでなく、ベンチマークに役立つコーディングタスクの多様性にも特有である。
論文 参考訳(メタデータ) (2021-05-25T00:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。