論文の概要: Benchmarking Recommendation, Classification, and Tracing Based on Hugging Face Knowledge Graph
- arxiv url: http://arxiv.org/abs/2505.17507v1
- Date: Fri, 23 May 2025 06:00:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.853522
- Title: Benchmarking Recommendation, Classification, and Tracing Based on Hugging Face Knowledge Graph
- Title(参考訳): Hugging Face Knowledge Graphに基づくベンチマーク推薦・分類・追跡
- Authors: Qiaosheng Chen, Kaijia Huang, Xiao Zhou, Weiqing Luo, Yuanning Cui, Gong Cheng,
- Abstract要約: HuggingKGは、MLリソース管理のためにHugging Faceコミュニティから構築された最初の大規模知識グラフである。
2.60万のノードと620万のエッジを持つHuggingKGは、ドメイン固有の関係とリッチテキスト属性をキャプチャする。
HuggingBenchは、リソースレコメンデーション、分類、トレースを含む、IRタスク用の3つの新しいテストコレクションを備えたマルチタスクベンチマークである。
- 参考スコア(独自算出の注目度): 17.251910893293626
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of open source machine learning (ML) resources, such as models and datasets, has accelerated IR research. However, existing platforms like Hugging Face do not explicitly utilize structured representations, limiting advanced queries and analyses such as tracing model evolution and recommending relevant datasets. To fill the gap, we construct HuggingKG, the first large-scale knowledge graph built from the Hugging Face community for ML resource management. With 2.6 million nodes and 6.2 million edges, HuggingKG captures domain-specific relations and rich textual attributes. It enables us to further present HuggingBench, a multi-task benchmark with three novel test collections for IR tasks including resource recommendation, classification, and tracing. Our experiments reveal unique characteristics of HuggingKG and the derived tasks. Both resources are publicly available, expected to advance research in open source resource sharing and management.
- Abstract(参考訳): モデルやデータセットといったオープンソースの機械学習(ML)リソースの急速な成長は、IR研究を加速させている。
しかし、Hugging Faceのような既存のプラットフォームでは、構造化表現を明示的に利用せず、高度なクエリや、モデル進化のトレースや関連するデータセットの推奨といった分析を制限している。
このギャップを埋めるため,MLリソース管理のためのHugging Faceコミュニティから構築された,最初の大規模知識グラフであるHuggingKGを構築した。
2.60万のノードと620万のエッジを持つHuggingKGは、ドメイン固有の関係とリッチテキスト属性をキャプチャする。
これにより、リソースレコメンデーション、分類、トレースを含む3つのIRタスク用の新しいテストコレクションを備えたマルチタスクのベンチマークであるHuggingBenchをさらに提示できる。
本実験では,HuggingKGと派生タスクの特徴を明らかにした。
どちらのリソースも公開されており、オープンソースのリソース共有と管理の研究を進めることが期待されている。
関連論文リスト
- Explain What You Mean: Intent Augmented Knowledge Graph Recommender Built With An LLM [8.40367600570591]
Intent Knowledge Recommender (IKGR)は、検索拡張生成と知識グラフの構築と密度化のための符号化アプローチを活用する新しいフレームワークである。
IKGRは知識ギャップを克服し、公開と内部レコメンデーションデータセットの両方で最先端のベースラインよりも大幅に向上します。
論文 参考訳(メタデータ) (2025-05-16T06:07:19Z) - GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [84.41557981816077]
本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-03T07:04:29Z) - Retrieval-Augmented Generation with Graphs (GraphRAG) [84.29507404866257]
Retrieval-augmented Generation (RAG) は、追加情報を取得することによって下流タスクの実行を向上させる強力な技術である。
グラフは、その固有の「エッジで接続されたノード」の性質により、巨大な異種情報と関係情報を符号化する。
従来のRAGとは異なり、多種多様な形式とドメイン固有の関係知識のようなグラフ構造化データのユニークさは、異なるドメインでGraphRAGを設計する際、ユニークで重要な課題を生じさせる。
論文 参考訳(メタデータ) (2024-12-31T06:59:35Z) - Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [46.55831783809377]
大規模言語モデル(LLM)の幻覚を緩和するための効果的なアプローチとして,検索拡張世代(RAG)がますます認識されている。
PruningRAGはマルチグラニュラリティ・プルーニング・ストラテジーを用いて,関連コンテキストをより効果的に統合し,誤った情報に対するネガティブな影響を軽減するためのプラグアンドプレイRAGフレームワークである。
論文 参考訳(メタデータ) (2024-09-03T03:31:37Z) - Learning To Rank Resources with GNN [7.337247167823921]
本稿では,資源クエリと資源リソースの関係をモデル化可能なグラフニューラルネットワーク(GNN)に基づく学習からランクへのアプローチを提案する。
提案手法は,様々なパフォーマンス指標において,最先端の6.4%から42%を上回っている。
論文 参考訳(メタデータ) (2023-04-17T02:01:45Z) - A Survey of Knowledge Graph Reasoning on Graph Types: Static, Dynamic,
and Multimodal [57.8455911689554]
知識グラフ推論(KGR)は、知識グラフに基づくマイニング論理則に基づいて、既存の事実から新しい事実を推論することを目的としている。
質問応答やレコメンデーションシステムなど、多くのAIアプリケーションでKGを使うことに大きなメリットがあることが証明されている。
論文 参考訳(メタデータ) (2022-12-12T08:40:04Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z) - Deep Learning on Knowledge Graph for Recommender System: A Survey [36.41255991011155]
知識グラフは、2つのオブジェクトと1つまたは複数の関連属性を接続する高次関係を符号化することができる。
新たなグラフニューラルネットワーク(GNN)の助けを借りて,対象特性と関係性の両方をKGから抽出することができる。
論文 参考訳(メタデータ) (2020-03-25T22:53:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。