論文の概要: ArtifactLinker: Linking Scientific Artifacts for Automatic State-of-the-Art Discovery
- arxiv url: http://arxiv.org/abs/2605.16902v1
- Date: Sat, 16 May 2026 09:26:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.22805
- Title: ArtifactLinker: Linking Scientific Artifacts for Automatic State-of-the-Art Discovery
- Title(参考訳): ArtifactLinker: 科学的アーティファクトをリンクして、最先端の自動発見
- Authors: Haofei Yu, Jiaxuan You, Peter Clark, Bodhisattwa Prasad Majumder, Kyle Richardson,
- Abstract要約: ArtifactLinkerは、データセットの最先端(SOTA)モデルを自動的に検出するフレームワークである。
14,053のアーティファクトと51,337の関係を持つArtifactBenchというベンチマークが提示されている。
その結果,(1)既存のアーティファクト間のグラフ構造がリンク予測の欠如に有効であること,(2)ArtifactLinkerを用いたエンドツーエンドのランキングと検証がSOTAの潜在的な結果の発見と研究の洞察に役立つこと,などが示唆された。
- 参考スコア(独自算出の注目度): 58.48859167777581
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific artifacts such as models and datasets are foundations for research. With the rapid growth of platforms like HuggingFace, researchers now have access to a large number of artifacts. Yet, a key challenge remains: how can we automatically discover the state-of-the-art (SOTA) model for a given dataset by fully leveraging existing artifacts? We formalize this task as automatic SOTA discovery by modeling HuggingFace as an artifact graph, where nodes are models/datasets and edges represent evaluations. We propose ArtifactLinker, a two-stage framework: (1) ranking promising unobserved model--dataset links using Graph Neural Networks (GNNs) or graph-augmented Large Language Models (LLMs), and (2) verifying top-ranked links via coding experiments with LLM-based agents. We further introduce a benchmark named ArtifactBench with 14,053 artifacts and 51,337 relations to evaluate the performance of both stages. Results show that (1) graph structures between existing artifacts are effective for missing link prediction; (2) end-to-end ranking and verification with ArtifactLinker help discover potential SOTA results and research insights.
- Abstract(参考訳): モデルやデータセットのような科学的アーティファクトは研究の基盤である。
HuggingFaceのようなプラットフォームが急速に成長し、研究者は多数のアーティファクトにアクセスできるようになった。
しかし、重要な課題は残る: 既存のアーティファクトを完全に活用することで、特定のデータセットの最先端(SOTA)モデルをどうやって自動的に検出できるのか?
我々は,HuggingFaceをアーティファクトグラフとしてモデル化することで,このタスクを自動SOTA発見として形式化し,ノードはモデル/データセットであり,エッジは評価を表す。
本稿では,(1)グラフニューラルネットワーク(GNN)やグラフ拡張大言語モデル(LLM)を用いた有望な未観測モデルデータセットリンクのランク付け,(2)LLMエージェントを用いたコーディング実験による上位リンクの検証,という2段階のフレームワークであるArtifactLinkerを提案する。
さらに,14,053個のアーティファクトと51,337個の関係を持つArtifactBenchというベンチマークを導入し,両ステージの性能評価を行った。
その結果,(1)既存のアーティファクト間のグラフ構造がリンク予測の欠如に有効であること,(2)ArtifactLinkerを用いたエンドツーエンドのランキングと検証がSOTAの潜在的な結果の発見と研究の洞察に役立つこと,などが示唆された。
関連論文リスト
- HEHRGNN: A Unified Embedding Model for Knowledge Graphs with Hyperedges and Hyper-Relational Edges [0.0]
実世界の知識ベースは、バイナリエッジで表現できない複雑な事実とn-aryな事実のかなりのシェアを持っている。
ハイパーエッジとハイパーリレーショナルエッジの両方を持つn-aryリレーショナルKGに対する統一的な埋め込みモデルを提案する。
また、ハイパーエッジおよびハイパーリレーショナルデータセットのベースラインモデルよりもリンク予測性能が改善されている。
論文 参考訳(メタデータ) (2026-02-21T16:38:23Z) - Future Link Prediction Without Memory or Aggregation [25.066464612400768]
時間グラフの将来のリンク予測は、実世界の動的システムに広く適用可能な基本課題である。
既存のメソッドは通常、複雑なメモリとアグリゲーションモジュールに依存しますが、目に見えないエッジを扱うのに苦労しています。
本稿では,メモリやアグリゲーションモジュールを捨てるシンプルなアーキテクチャであるCRAFT(Cross-Attention based Future Link Predictor on Temporal Graphs)を提案する。
論文 参考訳(メタデータ) (2025-05-26T01:53:27Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Unified Visual Relationship Detection with Vision and Language Models [89.77838890788638]
この研究は、複数のデータセットからラベル空間の結合を予測する単一の視覚的関係検出器のトレーニングに焦点を当てている。
視覚と言語モデルを活用した統合視覚関係検出のための新しいボトムアップ手法UniVRDを提案する。
人物体間相互作用検出とシーングラフ生成の双方による実験結果から,本モデルの競合性能が示された。
論文 参考訳(メタデータ) (2023-03-16T00:06:28Z) - Text Representation Enrichment Utilizing Graph based Approaches: Stock
Market Technical Analysis Case Study [0.0]
本稿では,教師なしノード表現学習モデルとノード分類/エッジ予測モデルを組み合わせたトランスダクティブハイブリッド手法を提案する。
提案手法は,この分野における最初の研究である株式市場の技術分析報告を分類するために開発された。
論文 参考訳(メタデータ) (2022-11-29T11:26:08Z) - A Multi-Level Attention Model for Evidence-Based Fact Checking [58.95413968110558]
シーケンス構造をトレーニング可能な,シンプルなモデルを提案する。
Fact extract and VERification のための大規模データセットの結果、我々のモデルはグラフベースのアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2021-06-02T05:40:12Z) - NASE: Learning Knowledge Graph Embedding for Link Prediction via Neural
Architecture Search [9.634626241415916]
リンク予測は、知識グラフ(KG)におけるエンティティ間の欠落した接続を予測するタスクである
これまでの研究では、Automated Machine Learning(AutoML)を使用して、データセットに最適なモデルを探していた。
リンク予測タスクのための新しいニューラルネットワーク探索(NAS)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。