論文の概要: SemRepo: A Knowledge Graph for Research Software and Its Scholarly Ecosystem
- arxiv url: http://arxiv.org/abs/2605.13310v1
- Date: Wed, 13 May 2026 10:25:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.979721
- Title: SemRepo: A Knowledge Graph for Research Software and Its Scholarly Ecosystem
- Title(参考訳): SemRepo: 研究ソフトウェアのための知識グラフとそのスカラーエコシステム
- Authors: Abdul Rafay, Yuni Susanti, David Lamprecht, Michael Färber,
- Abstract要約: 科学研究に関連する200,000近いGitHubリポジトリを記述したRDFナレッジグラフであるSemRepoを紹介した。
SemRepoはコントリビュータ、イシュー、プログラミング言語などのリポジトリレベルのメタデータをキャプチャし、外部の学術知識グラフとリンクする。
- 参考スコア(独自算出の注目度): 4.049850026698638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present SemRepo, an RDF knowledge graph comprising over 81 million triples describing nearly 200,000 GitHub repositories associated with scientific research. SemRepo captures repository-level metadata, such as contributors, issues, and programming languages, and interlinks this information with external scholarly knowledge graphs. In particular, repository authors are linked to their profiles in SemOpenAlex, repositories are connected to scholarly publications in LPWC, and research artifacts, such as datasets and experiments, are linked via MLSea-KG. This integration enables queries that span publications and their scholarly artifacts, which are typically fragmented across separate platforms. SemRepo supports analyses that are difficult to perform with existing resources in isolation, including provenance reconstruction across repositories and publications, as well as the systematic identification of risks to research reproducibility and software sustainability. By unifying research software with its scholarly context in a single graph, SemRepo provides an important infrastructure for large-scale analysis of software within the broader scientific research ecosystem.
- Abstract(参考訳): 科学研究に関連する200,000近いGitHubリポジトリを記述したRDFナレッジグラフであるSemRepoを紹介した。
SemRepoはコントリビュータ、イシュー、プログラミング言語などのリポジトリレベルのメタデータをキャプチャし、外部の学術知識グラフとリンクする。
特に、リポジトリの作者はSemOpenAlexのプロフィールにリンクされ、リポジトリはLPWCの学術出版物にリンクされ、データセットや実験のような研究成果物はMLSea-KGを介してリンクされている。
この統合により、出版物とその学術的成果物にまたがるクエリが可能になり、通常は別々のプラットフォームにまたがって断片化される。
SemRepoは、リポジトリや出版物にまたがる前例の再構築や、再現性やソフトウェアの持続可能性を研究するためのリスクの体系的な識別など、既存のリソースを分離して実行することの難しい分析をサポートする。
研究ソフトウェアを学術的なコンテキストをひとつのグラフにまとめることで、SemRepoはより広範な科学研究エコシステム内のソフトウェアを大規模に分析するための重要な基盤を提供する。
関連論文リスト
- Construction of a Battery Research Knowledge Graph using a Global Open Catalog [0.0]
我々はOpenAlex上に構築された電池研究の著者中心のグラフを構築するパイプラインを提案する。
各著者に対して、粗粒のOpenAlex概念とタイトルや抽象概念から抽出された細粒のキーフレーズを結合した重み付き研究記述子を導出する。
このフレームワークは、バッテリー関連の189,581のコーパスに適用される。
論文 参考訳(メタデータ) (2026-04-22T06:45:42Z) - Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms [83.16077040470975]
Python Package Index(PyPI)上のライブラリのメタデータは、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。
本稿は,5万PyPIの著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。
我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
論文 参考訳(メタデータ) (2026-01-21T16:13:57Z) - OpenDORS: A dataset of openly referenced open research software [1.0026496861838448]
オープンアクセス文献に参照された134,352のユニークなオープンリサーチソフトウェアプロジェクトと134,154のソースコードリポジトリのデータセットを提示する。
各データセットレコードは、参照パブリッシュを特定し、ソフトウェアプロジェクトのソースコードリポジトリをリストアップする。
122,425のソースコードリポジトリに対して、データセットは最新バージョン、ライセンス情報、プログラミング言語、記述メタデータファイルのメタデータを提供する。
論文 参考訳(メタデータ) (2025-12-01T11:45:50Z) - Debian in the Research Software Ecosystem: A Bibliometric Analysis [0.0]
本研究の目的は,学術出版を通じてDebianシステムを調べることである。
調査データは公開リポジトリで公開され、人口統計と文献学のトレンドが報告される。
論文 参考訳(メタデータ) (2025-08-25T14:37:50Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - Automated Requirements Relation Extraction [4.110571395660999]
本章は、自然言語に基づく関係抽出の分野における理論的・実践的基礎について、明確な視点を提供することを目的とする。
まず、最も一般的な要求関係型を含む分野における最も関連性の高い文献に基づいて、要求関係の基礎について述べる。
章の中核は、(i)均衡関係の識別と分類のための自然言語技術(syntactic vs. semantic techniques)と(ii)関係抽出作業のための情報抽出方法の2つのセクションから構成される。
論文 参考訳(メタデータ) (2024-01-22T16:14:27Z) - The Software Heritage Open Science Ecosystem [0.0]
ソフトウェア遺産 (Software Heritage) は、ソフトウェアソースコードと関連する開発履歴の公開アーカイブである。
2億5000万以上の共同開発プロジェクトから得られた16億以上のユニークなソースコードファイルをアーカイブしている。
1つのメルクル直接非巡回グラフで公開コードの開発履歴を実体化することで、ソフトウェアに関する実証的研究を支援する。
実験を行うソフトウェアに依存するあらゆる分野において、ソフトウェアアーチファクトのソースコードの可用性と整合性を保証する。
論文 参考訳(メタデータ) (2023-10-16T11:32:03Z) - The Semantic Scholar Open Data Platform [92.2948743167744]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。