論文の概要: A Toolkit for Generating Code Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2002.09440v3
- Date: Tue, 28 Sep 2021 03:44:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 01:36:41.111461
- Title: A Toolkit for Generating Code Knowledge Graphs
- Title(参考訳): コード知識グラフを生成するためのツールキット
- Authors: Ibrahim Abdelaziz, Julian Dolby, Jamie McCusker, Kavitha Srinivas
- Abstract要約: GraphGen4Codeはコードナレッジグラフを構築するためのツールキットである。
プログラム検索、コード理解、バグ検出、コード自動化といった様々なアプリケーションに電力を供給することができる。
- 参考スコア(独自算出の注目度): 8.518227414062384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge graphs have been proven extremely useful in powering diverse
applications in semantic search and natural language understanding. In this
paper, we present GraphGen4Code, a toolkit to build code knowledge graphs that
can similarly power various applications such as program search, code
understanding, bug detection, and code automation. GraphGen4Code uses generic
techniques to capture code semantics with the key nodes in the graph
representing classes, functions, and methods. Edges indicate function usage
(e.g., how data flows through function calls, as derived from program analysis
of real code), and documentation about functions (e.g., code documentation,
usage documentation, or forum discussions such as StackOverflow). Our toolkit
uses named graphs in RDF to model graphs per program, or can output graphs as
JSON. We show the scalability of the toolkit by applying it to 1.3 million
Python files drawn from GitHub, 2,300 Python modules, and 47 million forum
posts. This results in an integrated code graph with over 2 billion triples. We
make the toolkit to build such graphs as well as the sample extraction of the 2
billion triples graph publicly available to the community for use.
- Abstract(参考訳): 知識グラフは、セマンティック検索や自然言語理解における多様な応用に非常に有用であることが証明されている。
本稿では,プログラム検索,コード理解,バグ検出,コード自動化など,さまざまなアプリケーションに同様の機能を持つコード知識グラフを構築するためのツールキットであるGraphGen4Codeを提案する。
GraphGen4Codeは、クラス、関数、メソッドを表すグラフのキーノードでコードセマンティクスをキャプチャする一般的なテクニックを使用している。
エッジは関数の使用状況(例えば、実際のコードのプログラム分析から派生した関数呼び出しを通じてのデータフロー)と関数に関するドキュメント(例えば、コードドキュメント、利用ドキュメント、stackoverflowのようなフォーラムの議論)を示している。
我々のツールキットはRDFで名前付きグラフを使用してプログラムごとのグラフをモデル化します。
GitHubから1300万のPythonファイル,2300のPythonモジュール,4700万のフォーラムポストに適用することで,ツールキットのスケーラビリティを示す。
これにより、20億以上のトリプルを持つ統合コードグラフが得られる。
このようなグラフを構築するためのツールキットと、コミュニティが利用可能な20億のトリプルグラフのサンプル抽出を作成します。
関連論文リスト
- InstructG2I: Synthesizing Images from Multimodal Attributed Graphs [50.852150521561676]
InstructG2Iと呼ばれるグラフ文脈条件拡散モデルを提案する。
InstructG2Iはまずグラフ構造とマルチモーダル情報を利用して情報的隣人サンプリングを行う。
Graph-QFormerエンコーダは、グラフノードをグラフプロンプトの補助セットに適応的に符号化し、デノナイジングプロセスを導く。
論文 参考訳(メタデータ) (2024-10-09T17:56:15Z) - GraphStorm: all-in-one graph machine learning framework for industry applications [75.23076561638348]
GraphStormはスケーラブルなグラフ構築、グラフモデルのトレーニング、推論のためのエンドツーエンドソリューションである。
GraphStormのすべてのコンポーネントは数十億のノードを持つグラフ上で動作でき、コードを変更することなく、モデルのトレーニングと推論を異なるハードウェアにスケールすることができる。
GraphStormは、2023年5月にリリースされて以来、数十億以上の業界アプリケーションで使われ、デプロイされてきた。
論文 参考訳(メタデータ) (2024-06-10T04:56:16Z) - CleanGraph: Human-in-the-loop Knowledge Graph Refinement and Completion [8.358365661172025]
CleanGraphは知識グラフの洗練と完成を容易にするために設計されたWebベースのツールである。
知識グラフは、高品質でエラーのない事実に基礎を置いている。
論文 参考訳(メタデータ) (2024-05-07T01:40:23Z) - Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs [60.71360240206726]
大規模言語モデル(LLM)は、特に知識集約的なタスクにおいて幻覚に悩まされる。
既存の研究は、外部知識コーパスから取得した個々のテキスト単位でLLMを拡張することを提案する。
本稿では,グラフを反復的に推論することで,LLMをグラフで拡張するためのGraph Chain-of-thinkt (Graph-CoT) というフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-10T15:41:53Z) - MGNet: Learning Correspondences via Multiple Graphs [78.0117352211091]
学習対応は、不均一な対応分布と低い不整合率で設定された初期対応から正しい対応を見つけることを目的としている。
最近の進歩は、通常、グラフニューラルネットワーク(GNN)を使用して単一のタイプのグラフを構築したり、グローバルなグラフに局所グラフをスタックしてタスクを完了させる。
本稿では,複数の補完グラフを効果的に組み合わせるためのMGNetを提案する。
論文 参考訳(メタデータ) (2024-01-10T07:58:44Z) - DIG: A Turnkey Library for Diving into Graph Deep Learning Research [39.58666190541479]
DIG: Dive into Graphsは研究指向のライブラリで、いくつかの高度なタスクで共通のグラフ深層学習アルゴリズムを統合および統合しています。
それぞれの方向に対して、データインターフェース、共通アルゴリズム、評価メトリクスの統合実装を提供します。
論文 参考訳(メタデータ) (2021-03-23T15:05:10Z) - Graph Traversal with Tensor Functionals: A Meta-Algorithm for Scalable
Learning [29.06880988563846]
Graph Traversal via Functionals (GTTF)はグラフアルゴリズムを埋め込むための統合メタアルゴリズムフレームワークである。
提案手法は多種多様であり,学習方法は偏りのない方法で行われ,期待通り,特定の実装が直接実行されるかのように学習を近似する。
論文 参考訳(メタデータ) (2021-02-08T16:52:52Z) - Efficient Graph Deep Learning in TensorFlow with tf_geometric [53.237754811019464]
グラフ深層学習のための効率的でフレンドリなライブラリであるtf_geometricを導入する。
tf_geometricは、人気のあるGNNの実装と同様に、グラフニューラルネットワーク(GNN)を構築するためのカーネルライブラリを提供する。
カーネルライブラリは、グラフデータ構造、グラフマップ-リデュースフレームワーク、グラフミニバッチ戦略など、効率的なGNNを構築するためのインフラストラクチャで構成されている。
論文 参考訳(メタデータ) (2021-01-27T17:16:36Z) - About Graph Degeneracy, Representation Learning and Scalability [2.029783382155471]
ウォークベースグラフ表現学習アルゴリズムの時間とメモリ消費を削減するために,Kコア分解を利用した2つの手法を提案する。
提案手法の有効性を,いくつかの学術的データセットを用いて評価した。
論文 参考訳(メタデータ) (2020-09-04T09:39:43Z) - Learning to map source code to software vulnerability using
code-as-a-graph [67.62847721118142]
セキュリティの観点からソースコードのニュアンス学習におけるグラフニューラルネットワークの適用性について検討する。
我々は,既存のコード・アズ・フォトや線形シーケンスの符号化手法よりも,脆弱性検出に有効なコード・アズ・グラフの符号化法を示す。
論文 参考訳(メタデータ) (2020-06-15T16:05:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。