論文の概要: A Toolkit for Generating Code Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2002.09440v3
- Date: Tue, 28 Sep 2021 03:44:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 01:36:41.111461
- Title: A Toolkit for Generating Code Knowledge Graphs
- Title(参考訳): コード知識グラフを生成するためのツールキット
- Authors: Ibrahim Abdelaziz, Julian Dolby, Jamie McCusker, Kavitha Srinivas
- Abstract要約: GraphGen4Codeはコードナレッジグラフを構築するためのツールキットである。
プログラム検索、コード理解、バグ検出、コード自動化といった様々なアプリケーションに電力を供給することができる。
- 参考スコア(独自算出の注目度): 8.518227414062384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge graphs have been proven extremely useful in powering diverse
applications in semantic search and natural language understanding. In this
paper, we present GraphGen4Code, a toolkit to build code knowledge graphs that
can similarly power various applications such as program search, code
understanding, bug detection, and code automation. GraphGen4Code uses generic
techniques to capture code semantics with the key nodes in the graph
representing classes, functions, and methods. Edges indicate function usage
(e.g., how data flows through function calls, as derived from program analysis
of real code), and documentation about functions (e.g., code documentation,
usage documentation, or forum discussions such as StackOverflow). Our toolkit
uses named graphs in RDF to model graphs per program, or can output graphs as
JSON. We show the scalability of the toolkit by applying it to 1.3 million
Python files drawn from GitHub, 2,300 Python modules, and 47 million forum
posts. This results in an integrated code graph with over 2 billion triples. We
make the toolkit to build such graphs as well as the sample extraction of the 2
billion triples graph publicly available to the community for use.
- Abstract(参考訳): 知識グラフは、セマンティック検索や自然言語理解における多様な応用に非常に有用であることが証明されている。
本稿では,プログラム検索,コード理解,バグ検出,コード自動化など,さまざまなアプリケーションに同様の機能を持つコード知識グラフを構築するためのツールキットであるGraphGen4Codeを提案する。
GraphGen4Codeは、クラス、関数、メソッドを表すグラフのキーノードでコードセマンティクスをキャプチャする一般的なテクニックを使用している。
エッジは関数の使用状況(例えば、実際のコードのプログラム分析から派生した関数呼び出しを通じてのデータフロー)と関数に関するドキュメント(例えば、コードドキュメント、利用ドキュメント、stackoverflowのようなフォーラムの議論)を示している。
我々のツールキットはRDFで名前付きグラフを使用してプログラムごとのグラフをモデル化します。
GitHubから1300万のPythonファイル,2300のPythonモジュール,4700万のフォーラムポストに適用することで,ツールキットのスケーラビリティを示す。
これにより、20億以上のトリプルを持つ統合コードグラフが得られる。
このようなグラフを構築するためのツールキットと、コミュニティが利用可能な20億のトリプルグラフのサンプル抽出を作成します。
関連論文リスト
- G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering [61.93058781222079]
現実のテキストグラフを対象とするフレキシブルな問合せフレームワークを開発した。
本手法は,テキスト応答とグラフの関連部分をハイライトする。
論文 参考訳(メタデータ) (2024-02-12T13:13:04Z) - MGNet: Learning Correspondences via Multiple Graphs [78.0117352211091]
学習対応は、不均一な対応分布と低い不整合率で設定された初期対応から正しい対応を見つけることを目的としている。
最近の進歩は、通常、グラフニューラルネットワーク(GNN)を使用して単一のタイプのグラフを構築したり、グローバルなグラフに局所グラフをスタックしてタスクを完了させる。
本稿では,複数の補完グラフを効果的に組み合わせるためのMGNetを提案する。
論文 参考訳(メタデータ) (2024-01-10T07:58:44Z) - GRAPE for Fast and Scalable Graph Processing and random walk-based
Embedding [0.5035217505850539]
本稿では,グラフ処理と埋め込みのためのソフトウェアリソースであるGRAPEを紹介する。
専門的でスマートなデータ構造、アルゴリズム、ランダムウォークベースのメソッドの高速な並列実装を使用することで、大きなグラフでスケールすることができる。
論文 参考訳(メタデータ) (2021-10-12T17:49:46Z) - DIG: A Turnkey Library for Diving into Graph Deep Learning Research [39.58666190541479]
DIG: Dive into Graphsは研究指向のライブラリで、いくつかの高度なタスクで共通のグラフ深層学習アルゴリズムを統合および統合しています。
それぞれの方向に対して、データインターフェース、共通アルゴリズム、評価メトリクスの統合実装を提供します。
論文 参考訳(メタデータ) (2021-03-23T15:05:10Z) - Graph Traversal with Tensor Functionals: A Meta-Algorithm for Scalable
Learning [29.06880988563846]
Graph Traversal via Functionals (GTTF)はグラフアルゴリズムを埋め込むための統合メタアルゴリズムフレームワークである。
提案手法は多種多様であり,学習方法は偏りのない方法で行われ,期待通り,特定の実装が直接実行されるかのように学習を近似する。
論文 参考訳(メタデータ) (2021-02-08T16:52:52Z) - Efficient Graph Deep Learning in TensorFlow with tf_geometric [53.237754811019464]
グラフ深層学習のための効率的でフレンドリなライブラリであるtf_geometricを導入する。
tf_geometricは、人気のあるGNNの実装と同様に、グラフニューラルネットワーク(GNN)を構築するためのカーネルライブラリを提供する。
カーネルライブラリは、グラフデータ構造、グラフマップ-リデュースフレームワーク、グラフミニバッチ戦略など、効率的なGNNを構築するためのインフラストラクチャで構成されている。
論文 参考訳(メタデータ) (2021-01-27T17:16:36Z) - About Graph Degeneracy, Representation Learning and Scalability [2.029783382155471]
ウォークベースグラフ表現学習アルゴリズムの時間とメモリ消費を削減するために,Kコア分解を利用した2つの手法を提案する。
提案手法の有効性を,いくつかの学術的データセットを用いて評価した。
論文 参考訳(メタデータ) (2020-09-04T09:39:43Z) - Grale: Designing Networks for Graph Learning [68.23038997141381]
我々は,数十億のノードを持つグラフのグラフ設計問題に対処するために,スケーラブルなGraleを提案する。
グレールは、(潜在的に弱い)類似性の異なる測度を融合して、そのノード間の高いタスク固有のホモフィリーを示すグラフを作成する。
Googleでは、数千億のノードを持つデータセットや、数十兆の潜在的なエッジを含む、20以上の異なる産業環境にGraleをデプロイしています。
論文 参考訳(メタデータ) (2020-07-23T13:25:36Z) - Learning to map source code to software vulnerability using
code-as-a-graph [67.62847721118142]
セキュリティの観点からソースコードのニュアンス学習におけるグラフニューラルネットワークの適用性について検討する。
我々は,既存のコード・アズ・フォトや線形シーケンスの符号化手法よりも,脆弱性検出に有効なコード・アズ・グラフの符号化法を示す。
論文 参考訳(メタデータ) (2020-06-15T16:05:27Z) - Graph Convolution Machine for Context-aware Recommender System [59.50474932860843]
グラフ畳み込みの利点を文脈認識推薦システム(CARS)に拡張する。
我々は、エンコーダ、グラフ畳み込み層、デコーダの3つのコンポーネントからなるエンドツーエンドフレームワークである textitGraph Convolution Machine (GCM) を提案する。
我々はYelpとAmazonの3つの実世界のデータセットで実験を行い、GCMの有効性とCARSのためのグラフ畳み込みの利点を検証する。
論文 参考訳(メタデータ) (2020-01-30T15:32:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。