論文の概要: RDFFrames: Knowledge Graph Access for Machine Learning Tools
- arxiv url: http://arxiv.org/abs/2002.03614v4
- Date: Mon, 6 Sep 2021 04:39:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:38:22.156646
- Title: RDFFrames: Knowledge Graph Access for Machine Learning Tools
- Title(参考訳): rdfframes: 機械学習ツールのためのナレッジグラフアクセス
- Authors: Aisha Mohamed, Ghadeer Abuoda, Abdurrahman Ghanem, Zoi Kaoudi, Ashraf
Aboulnaga
- Abstract要約: ナレッジグラフのための機械学習ツールは、データベースシステムを使用することの明らかな利点にもかかわらず、SPARQLを使用しない。
これは、データモデルとプログラミングスタイルの点で、SPARQLと機械学習ツールのミスマッチのためです。
本稿では,機械学習ソフトウェアスタックからの知識グラフのインターフェースを提供するフレームワークであるRDFFramesを提案する。
- 参考スコア(独自算出の注目度): 6.50725902438059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge graphs represented as RDF datasets are integral to many machine
learning applications. RDF is supported by a rich ecosystem of data management
systems and tools, most notably RDF database systems that provide a SPARQL
query interface. Surprisingly, machine learning tools for knowledge graphs do
not use SPARQL, despite the obvious advantages of using a database system. This
is due to the mismatch between SPARQL and machine learning tools in terms of
data model and programming style. Machine learning tools work on data in
tabular format and process it using an imperative programming style, while
SPARQL is declarative and has as its basic operation matching graph patterns to
RDF triples. We posit that a good interface to knowledge graphs from a machine
learning software stack should use an imperative, navigational programming
paradigm based on graph traversal rather than the SPARQL query paradigm based
on graph patterns. In this paper, we present RDFFrames, a framework that
provides such an interface. RDFFrames provides an imperative Python API that
gets internally translated to SPARQL, and it is integrated with the PyData
machine learning software stack. RDFFrames enables the user to make a sequence
of Python calls to define the data to be extracted from a knowledge graph
stored in an RDF database system, and it translates these calls into a compact
SPQARL query, executes it on the database system, and returns the results in a
standard tabular format. Thus, RDFFrames is a useful tool for data preparation
that combines the usability of PyData with the flexibility and performance of
RDF database systems.
- Abstract(参考訳): RDFデータセットとして表される知識グラフは多くの機械学習アプリケーションに不可欠なものである。
RDFは、データ管理システムとツールの豊富なエコシステム、特にSPARQLクエリインターフェースを提供するRDFデータベースシステムによってサポートされている。
驚くべきことに、ナレッジグラフのための機械学習ツールは、データベースシステムを使用することの明らかな利点にもかかわらず、SPARQLを使用しない。
これは、データモデルとプログラミングスタイルの点で、SPARQLと機械学習ツールのミスマッチのためです。
機械学習ツールは、表形式のデータを処理し、命令型プログラミングスタイルで処理するが、SPARQLは宣言的であり、RDFトリプルにグラフパターンをマッチする基本的な操作として機能する。
機械学習ソフトウェアスタックからの知識グラフに対する優れたインターフェースは、グラフパターンに基づいたSPARQLクエリパラダイムではなく、グラフトラバーサルに基づく命令型ナビゲーションプログラミングパラダイムを使用するべきであると仮定する。
本稿では,そのようなインターフェースを提供するフレームワークであるRDFFramesについて述べる。
RDFFramesは、内部的にSPARQLに変換される命令型Python APIを提供し、PyData機械学習ソフトウェアスタックに統合されている。
rdfframesによってユーザは、rdfデータベースシステムに格納されたナレッジグラフから抽出されるデータを定義するためにpython呼び出しのシーケンスを作成でき、これらの呼び出しをコンパクトなspqarlクエリに変換し、データベースシステム上で実行し、結果を標準の表形式で返すことができる。
したがって、RDFFramesは、PyDataのユーザビリティとRDFデータベースシステムの柔軟性と性能を組み合わせたデータ準備に有用なツールである。
関連論文リスト
- Less is More: Making Smaller Language Models Competent Subgraph Retrievers for Multi-hop KGQA [51.3033125256716]
本研究では,小言語モデルで処理される条件生成タスクとして,サブグラフ検索タスクをモデル化する。
2億2千万のパラメータからなる基本生成部分グラフ検索モデルでは,最先端モデルと比較して競合検索性能が向上した。
LLMリーダを接続した最大の3Bモデルは、WebQSPとCWQベンチマークの両方で、SOTAのエンドツーエンドパフォーマンスを新たに設定します。
論文 参考訳(メタデータ) (2024-10-08T15:22:36Z) - ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。
我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2024-09-02T03:19:56Z) - AutoRDF2GML: Facilitating RDF Integration in Graph Machine Learning [9.408189129889006]
AutoRDF2GMLは、RDFデータをグラフ機械学習タスクに適したデータ表現に変換するように設計されたフレームワークである。
大規模RDF知識グラフから作成したグラフ機械学習のための新しいベンチマークデータセットを4つ提示する。
論文 参考訳(メタデータ) (2024-07-26T13:44:06Z) - PyTorch Frame: A Modular Framework for Multi-Modal Tabular Learning [54.912520425218496]
PyTorch Frame は PyTorch をベースとした多モード表データの深層学習フレームワークである。
モジュラー方式で多種多様なモデルを実装することにより,PyTorch Frameの有用性を示す。
我々は、グラフニューラルネットワーク(GNN)のためのPyTorchライブラリであるPyTorch GeometricとPyTorch Frameを統合し、関係データベース上でエンドツーエンドの学習を行う。
論文 参考訳(メタデータ) (2024-03-31T19:15:09Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - Linked Papers With Code: The Latest in Machine Learning as an RDF
Knowledge Graph [1.450405446885067]
Linked Papers With CodeはRDFの知識グラフで、40万近い機械学習出版物に関する包括的で現在の情報を提供する。
非RDFベースのPapers With Codeと比較して、LPWCは機械学習の最新の進歩をRDFフォーマットに変換する。
Linked Open Dataクラウドのナレッジグラフとして、RDFダンプファイルからSPARQLエンドポイントまで、複数のフォーマットでLPWCを提供しています。
論文 参考訳(メタデータ) (2023-10-31T14:09:15Z) - Large Language Models for Automated Data Science: Introducing CAAFE for
Context-Aware Automated Feature Engineering [52.09178018466104]
データセットのセマンティックな特徴を生成するために、コンテキスト認識自動特徴工学(CAAFE)を導入する。
方法論的には単純だが、CAAFEは14のデータセットのうち11のパフォーマンスを改善している。
我々は,AutoMLシステムの範囲をセマンティックなAutoMLに拡張できるコンテキスト認識ソリューションの重要性を強調した。
論文 参考訳(メタデータ) (2023-05-05T09:58:40Z) - Expressive Reasoning Graph Store: A Unified Framework for Managing RDF
and Property Graph Databases [9.021529689292985]
ERGS(Expressive Reasoning Graph Store)について紹介する。
ERGSはJanusGraph上に構築されたグラフストアで、RDFデータセットの保存とクエリを可能にする。
本稿では、RDFデータをProperty Graph表現に変換し、SPARQLクエリを一連のGremlinに変換するクエリ変換モジュールを記述する。
論文 参考訳(メタデータ) (2022-09-13T09:07:50Z) - Skip Vectors for RDF Data: Extraction Based on the Complexity of Feature
Patterns [0.0]
Resource Description Framework(RDF)は、Web上のリソースの属性や関連性などのメタデータを記述するためのフレームワークである。
本研究では,近隣のエッジとノードの様々な組み合わせを抽出することにより,RDFグラフ内の各リソースの特徴を表す新しい特徴ベクトル(スキップベクトル)を提案する。
分類タスクは、SVM、k-nearest neighbors法、ニューラルネットワーク、ランダムフォレスト、AdaBoostなどの従来の機械学習アルゴリズムに、各リソースの低次元スキップベクトルを適用することで行うことができる。
論文 参考訳(メタデータ) (2022-01-06T10:07:49Z) - A Novel Approach for Generating SPARQL Queries from RDF Graphs [0.0]
この研究は、研究マスターの論文プロジェクトの一部として行われている。
目標は、RDFグラフをクエリするために、ユーザが提供するキーワードに基づいてSPARQLクエリを生成することだ。
論文 参考訳(メタデータ) (2020-05-30T18:28:49Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。