論文の概要: HAConvGNN: Hierarchical Attention Based Convolutional Graph Neural
Network for Code Documentation Generation in Jupyter Notebooks
- arxiv url: http://arxiv.org/abs/2104.01002v1
- Date: Wed, 31 Mar 2021 22:36:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 13:40:30.578645
- Title: HAConvGNN: Hierarchical Attention Based Convolutional Graph Neural
Network for Code Documentation Generation in Jupyter Notebooks
- Title(参考訳): HAConvGNN:Jupyter Notebooksにおけるコードドキュメンテーション生成のための階層的注意に基づく畳み込みグラフニューラルネットワーク
- Authors: Xuye Liu, Dakuo Wang, April Wang, Lingfei Wu
- Abstract要約: Seq2Seqネットワークを強化するための階層型注意ベースのConvGNNコンポーネントを提案する。
Kaggleノートブックでデータセットを構築し、モデル(HAConvGNN)をベースラインモデルに対して評価します。
- 参考スコア(独自算出の注目度): 33.37494243822309
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many data scientists use Jupyter notebook to experiment code, visualize
results, and document rationales or interpretations. The code documentation
generation CDG task in notebooks is related but different from the code
summarization task in software engineering, as one documentation (markdown
cell) may consist of a text (informative summary or indicative rationale) for
multiple code cells. Our work aims to solve the CDG task by encoding the
multiple code cells as separated AST graph structures, for which we propose a
hierarchical attention-based ConvGNN component to augment the Seq2Seq network.
We build a dataset with publicly available Kaggle notebooks and evaluate our
model (HAConvGNN) against baseline models (e.g., Code2Seq or Graph2Seq).
- Abstract(参考訳): 多くのデータサイエンティストはjupyter notebookを使ってコードを実験し、結果を視覚化し、理論や解釈を文書化する。
ノートブックにおけるコードドキュメント生成CDGタスクは関連しているが、ソフトウェア工学におけるコード要約タスクとは異なっている。
本研究の目的は,複数のコードセルを分離したASTグラフ構造として符号化することでCDGの課題を解決することであり,Seq2Seqネットワークの拡張を目的とした階層型アテンションベースのConvGNNコンポーネントを提案する。
公開されているKaggleノートブックでデータセットを構築し、ベースラインモデル(Code2SeqやGraph2Seqなど)に対してモデル(HAConvGNN)を評価します。
関連論文リスト
- Contextualized Data-Wrangling Code Generation in Computational Notebooks [131.26365849822932]
我々は、マルチモーダルなコンテキスト依存を明確にしたデータラングリングコード生成例をマイニングするために、CoCoMineという自動アプローチを提案する。
コンテクスト化されたデータラングリングコード生成のための58,221のサンプルを含むデータセットであるCoCoNoteをNotebooksで構築する。
実験結果は、データラングリングコード生成にデータコンテキストを組み込むことの重要性を示す。
論文 参考訳(メタデータ) (2024-09-20T14:49:51Z) - Typhon: Automatic Recommendation of Relevant Code Cells in Jupyter Notebooks [0.3122672716129843]
本稿では,Jupyterノートブックのコードセルを自動的に推薦するTyphonを提案する。
Typhonは開発者のマークダウン記述セルをトークン化し、データベースから最もよく似たコードセルを探す。
我々は、KaggleコンペティションからJupyterノートブックのTyphonツールを評価し、そのアプローチが適度な精度でコードセルを推薦できることを発見した。
論文 参考訳(メタデータ) (2024-05-15T03:59:59Z) - CodeExp: Explanatory Code Document Generation [94.43677536210465]
既存のコード・トゥ・テキスト生成モデルは、コードの高レベルな要約のみを生成する。
我々は、コードのための高品質な説明記述の基準を特定するために、人間の研究を行う。
タスクのための多段階微調整戦略とベースラインモデルを提案する。
論文 参考訳(メタデータ) (2022-11-25T18:05:44Z) - Doc2Graph: a Task Agnostic Document Understanding Framework based on
Graph Neural Networks [0.965964228590342]
GNNモデルに基づくタスクに依存しない文書理解フレームワークDoc2Graphを提案する。
形態理解,請求書レイアウト解析,テーブル検出における鍵情報抽出のための2つの挑戦的データセットに対するアプローチを評価する。
論文 参考訳(メタデータ) (2022-08-23T19:48:10Z) - Graph Spring Network and Informative Anchor Selection for Session-based
Recommendation [2.6524289609910654]
セッションベースのレコメンデーション(SBR)は、進行中の匿名セッションの次の項目を予測することを目的としている。
SBRの最大の課題は、アイテム間のリッチな関係をキャプチャし、IDベースのアイテム埋め込みを学習してそのような関係をキャプチャする方法である。
我々は、アイテムグラフに埋め込まれたIDベースのアイテムを学習するために、グラフスプリングネットワーク(GSN)と呼ばれる新しいグラフニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-19T02:47:44Z) - Text Classification for Task-based Source Code Related Questions [0.0]
StackOverflowは、開発者がコーディングしたいタスク質問に対する完全な回答を提供する小さなスニペットでソリューションを提供する。
Seq2Seqと、(自然言語の)意図とPythonのコードスニペットを取り入れたバイナリ分類器です。
隠れ状態層の埋め込みは、構築された語彙からの通常の標準埋め込みよりも若干優れていた。
論文 参考訳(メタデータ) (2021-10-31T20:10:21Z) - Deep Graph Matching and Searching for Semantic Code Retrieval [76.51445515611469]
本稿では,グラフニューラルネットワークに基づくエンドツーエンドのディープグラフマッチングと探索モデルを提案する。
まず、自然言語クエリテキストとプログラミング言語のコードスニペットをグラフ構造化データで表現する。
特に、DGMSは、個々のクエリテキストやコードスニペットのより構造的な情報をキャプチャするだけでなく、それらの微妙な類似性も学習する。
論文 参考訳(メタデータ) (2020-10-24T14:16:50Z) - GraphCodeBERT: Pre-training Code Representations with Data Flow [97.00641522327699]
本稿では,コード固有の構造を考慮したプログラミング言語の事前学習モデルであるGraphCodeBERTを提案する。
これは変数間の"where-the-value-comes-from"の関係をエンコードするコードのセマンティックレベルの構造です。
コード検索,クローン検出,コード翻訳,コード改良の4つのタスクにおいて,本モデルを評価する。
論文 参考訳(メタデータ) (2020-09-17T15:25:56Z) - Learning to map source code to software vulnerability using
code-as-a-graph [67.62847721118142]
セキュリティの観点からソースコードのニュアンス学習におけるグラフニューラルネットワークの適用性について検討する。
我々は,既存のコード・アズ・フォトや線形シーケンスの符号化手法よりも,脆弱性検出に有効なコード・アズ・グラフの符号化法を示す。
論文 参考訳(メタデータ) (2020-06-15T16:05:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。