論文の概要: Construction of a Battery Research Knowledge Graph using a Global Open Catalog
- arxiv url: http://arxiv.org/abs/2604.20241v1
- Date: Wed, 22 Apr 2026 06:45:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.994214
- Title: Construction of a Battery Research Knowledge Graph using a Global Open Catalog
- Title(参考訳): グローバルオープンカタログを用いた電池研究知識グラフの構築
- Authors: Luca Foppiano, Sae Dieb, Malik Zain, Kazuki Kasama, Keitaro Sodeyama, Mikiko Tanifuji,
- Abstract要約: 我々はOpenAlex上に構築された電池研究の著者中心のグラフを構築するパイプラインを提案する。
各著者に対して、粗粒のOpenAlex概念とタイトルや抽象概念から抽出された細粒のキーフレーズを結合した重み付き研究記述子を導出する。
このフレームワークは、バッテリー関連の189,581のコーパスに適用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Battery research is a rapidly growing and highly interdisciplinary field, making it increasingly difficult to track relevant expertise and identify potential collaborators across institutional boundaries. In this work, we present a pipeline for constructing an author-centric knowledge graph of battery research built on OpenAlex, a large-scale open bibliographic catalogue. For each author, we derive a weighted research descriptors vector that combines coarse-grained OpenAlex concepts with fine-grained keyphrases extracted from titles and abstracts using KeyBERT with ChatGPT (gpt-3.5-turbo) as the backend model, selected after evaluating multiple alternatives. Vector components are weighted by research descriptor origin, authorship position, and temporal recency. The framework is applied to a corpus of 189,581 battery-related works. The resulting vectors support author-author similarity computation, community detection, and exploratory search through a browser-based interface. The knowledge graph is then serialized in RDF and linked to Wikidata identifiers, making it interoperable with external linked open data sources and extensible beyond the battery domain. Unlike prior author-centric analyses confined to institutional repositories, our approach operates at cross-institutional scale and grounds similarity in domain semantics rather than citation or co-authorship structure alone.
- Abstract(参考訳): バッテリー研究は急速に成長し、学際的な分野であり、関連する専門知識を追跡し、機関の境界を越えて潜在的な協力者を特定することはますます困難になっている。
本研究では,大規模オープン書誌カタログであるOpenAlex上に構築された電池研究の著者中心の知識グラフを構築するためのパイプラインを提案する。
各著者に対して,複数の代替案を評価して選択したバックエンドモデルとしてKeyBERTとChatGPT(gpt-3.5-turbo)を用いて,粗粒度のOpenAlex概念とタイトルや抽象語から抽出した細粒度のキーフレーズを結合した重み付き研究記述子ベクトルを導出する。
ベクトル成分は、研究記述子の起源、著者の位置、時間的傾向によって重み付けされる。
このフレームワークは、バッテリー関連の189,581のコーパスに適用される。
結果として生成されるベクターは、作者-著者の類似性計算、コミュニティ検出、ブラウザベースのインターフェイスによる探索検索をサポートする。
知識グラフはRDFでシリアライズされ、Wikidata識別子にリンクされ、外部にリンクされたオープンデータソースと相互運用可能で、バッテリドメインを超えて拡張可能である。
従来の著作者中心の分析は機関リポジトリに限定されていたが,本手法は,引用や共著者構造のみではなく,ドメイン意味論における類似性を前提として,クロス・インスティテュート・スケールで運用されている。
関連論文リスト
- Paper Circle: An Open-source Multi-agent Research Discovery and Analysis Framework [82.66443886385125]
ペーパーサークル(Paper Circle)は、学術文献の発見、評価、整理、理解に必要な労力を減らすために設計された発見・分析システムである。
1)複数のソースからのオフラインおよびオンライン検索を統合するディスカバリパイプライン,多エージェントスコアリング,多様性対応ランキング,構造化アウトプット,2)個々の論文を概念,メソッド,数値などの型付きノードで構造化された知識グラフに変換する分析パイプライン,の2つの補完パイプラインで構成されている。
論文 参考訳(メタデータ) (2026-04-07T17:59:58Z) - ResearchPilot: A Local-First Multi-Agent System for Literature Synthesis and Related Work Drafting [3.272585676511349]
ResearchPilotは、文献レビュー支援のためのオープンソースのセルフホスト可能なマルチエージェントシステムである。
自然言語研究の質問を受けて、Semantic ScholarとarXivから論文を検索する。
紙抽象物から構造化された結果を抽出し、クロスペーパーパターンを合成し、引用・認識作業部を起草する。
論文 参考訳(メタデータ) (2026-03-15T22:02:59Z) - MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations [0.0]
大規模な科学的コラボレーションは、膨大な内部文書のコーパスを生み出している。
我々は、物理解析に関する特定の文脈対応の質問に答えるように設計された、レトリーバル拡張生成(RAG)ベースのシステムであるMITRAのプロトタイプを提案する。
MITRAは、内部データベースからの文書検索にSeleniumを使用した新しい自動パイプラインと、高忠実なテキスト抽出のためのレイアウト解析を備えたOCRを採用している。
論文 参考訳(メタデータ) (2026-03-10T15:28:35Z) - FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents [53.03492387564392]
我々はFS-Researcherを紹介した。FS-Researcherはファイルシステムベースのフレームワークで、永続的なワークスペースを通じてコンテキストウィンドウを超えて深い研究をスケールする。
Context Builderエージェントはインターネットを閲覧し、構造化されたノートを書き、ソースを階層的な知識ベースにアーカイブする。
その後、レポートライターエージェントが最終レポートセクションをセクションごとに構成し、知識ベースを事実のソースとして扱う。
論文 参考訳(メタデータ) (2026-02-02T03:00:19Z) - Intelligent Scientific Literature Explorer using Machine Learning (ISLE) [0.797970449705065]
本稿では,大規模データ取得,ハイブリッド検索,セマンティックトピックモデリング,異種知識グラフ構築を組み合わせた科学文献探索システムを提案する。
提案するフレームワークは,AIによる科学的発見の基盤となる。
論文 参考訳(メタデータ) (2025-12-14T16:54:24Z) - Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval [49.42043077545341]
知識グラフ(KG)から構造化文書関係を付加したLLMを拡張した知識対応クエリ拡張フレームワークを提案する。
文書テキストをリッチなKGノード表現として活用し、KAR(Knowledge-Aware Retrieval)のための文書ベースの関係フィルタリングを利用する。
論文 参考訳(メタデータ) (2024-10-17T17:03:23Z) - The Ontoverse: Democratising Access to Knowledge Graph-based Data Through a Cartographic Interface [33.861478826378054]
我々は地理的視覚化と階層的に構造化されたドメイン知識に依存したデータナビゲーションにユニークなアプローチを開発した。
提案手法は自然言語処理技術を用いて,基礎となるデータから名前付きエンティティを抽出し,関連する意味領域参照やナビゲーション構造に対して正規化する。
これにより、エンドユーザは、ニーズに関連するエンティティを識別し、広範なグラフ分析にアクセスできるようになる。
論文 参考訳(メタデータ) (2024-07-22T10:29:25Z) - Rethinking Text Line Recognition Models [57.47147190119394]
2つのデコーダファミリー(コネクショニスト時間分類と変換器)と3つのエンコーダモジュール(双方向LSTM、自己認識、GRCL)を考える。
広く使用されているシーンと手書きテキストの公開データセットの精度とパフォーマンスを比較します。
より一般的なTransformerベースのモデルとは異なり、このアーキテクチャは任意の長さの入力を処理できる。
論文 参考訳(メタデータ) (2021-04-15T21:43:13Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z) - CORAL: COde RepresentAtion Learning with Weakly-Supervised Transformers
for Analyzing Data Analysis [33.190021245507445]
ソースコード、特に科学的なソースコードの大規模解析は、データサイエンスのプロセスをよりよく理解する約束を持っている。
本稿では,抽象構文木と周辺自然言語コメントからコードの共同表現を計算するための,弱い教師付きトランスフォーマーベースのアーキテクチャを提案する。
本モデルでは,手軽に手軽に管理できる弱さを生かし,専門家による供給よりも38%の精度向上を実現し,ベースラインを上回ります。
論文 参考訳(メタデータ) (2020-08-28T19:57:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。