論文の概要: Darth Vecdor: An Open-Source System for Generating Knowledge Graphs Through Large Language Model Queries
- arxiv url: http://arxiv.org/abs/2512.15906v1
- Date: Wed, 17 Dec 2025 19:20:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.786874
- Title: Darth Vecdor: An Open-Source System for Generating Knowledge Graphs Through Large Language Model Queries
- Title(参考訳): Darth Vecdor: 大規模言語モデルクエリによる知識グラフ生成のためのオープンソースシステム
- Authors: Jonathan A. Handler,
- Abstract要約: 多くの大規模言語モデル(LLM)は、インターネット上の膨大な知識に基づいて訓練されている。
Darth Vecdor (DV)は、この知識を構造化された用語マップ化されたsqlデータベースに抽出するために設計された。
コスト、スピード、安全性、信頼性などの懸念は、特に大量運用において発生する可能性がある。
- 参考スコア(独自算出の注目度): 0.8641885390441709
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Many large language models (LLMs) are trained on a massive body of knowledge present on the Internet. Darth Vecdor (DV) was designed to extract this knowledge into a structured, terminology-mapped, SQL database ("knowledge base" or "knowledge graph"). Knowledge graphs may be useful in many domains, including healthcare. Although one might query an LLM directly rather than a SQL-based knowledge graph, concerns such as cost, speed, safety, and confidence may arise, especially in high-volume operations. These may be mitigated when the information is pre-extracted from the LLM and becomes query-able through a standard database. However, the author found the need to address several issues. These included erroneous, off-topic, free-text, overly general, and inconsistent LLM responses, as well as allowing for multi-element responses. DV was built with features intended to mitigate these issues. To facilitate ease of use, and to allow for prompt engineering by those with domain expertise but little technical background, DV provides a simple, browser-based graphical user interface. DV has been released as free, open-source, extensible software, on an "as is" basis, without warranties or conditions of any kind, either express or implied. Users need to be cognizant of the potential risks and benefits of using DV and its outputs, and users are responsible for ensuring any use is safe and effective. DV should be assumed to have bugs, potentially very serious ones. However, the author hopes that appropriate use of current and future versions of DV and its outputs can help improve healthcare.
- Abstract(参考訳): 多くの大規模言語モデル(LLM)は、インターネット上の膨大な知識に基づいて訓練されている。
Darth Vecdor (DV)は、この知識を構造化された用語マップ付きSQLデータベース("knowledge base"または"knowledge graph")に抽出するために設計された。
知識グラフは医療を含む多くの領域で有用である。
SQL ベースの知識グラフではなく LLM を直接クエリする場合もあるが、特に高ボリュームな操作において、コスト、スピード、安全性、信頼性などの懸念が生じる可能性がある。
これらは、情報が LLM から事前抽出されたときに緩和され、標準データベースを通じてクエリ可能となる。
しかし、著者はいくつかの問題に対処する必要に迫られた。
これには誤った、オフトピー的、自由テキスト、過度に一般的な、一貫性のないLCM応答が含まれ、複数要素応答が可能である。
DVはこれらの問題を緩和するための機能を備えていた。
使いやすさを容易にし、ドメインの専門知識があるが技術的な背景がほとんどない人々による迅速なエンジニアリングを可能にするため、DVはシンプルなブラウザベースのグラフィカルユーザーインターフェースを提供する。
DVはフリーでオープンソースで拡張可能なソフトウェアとして"as is"ベースでリリースされた。
ユーザは、DVとそのアウトプットを使用する潜在的なリスクとメリットを認識し、あらゆる使用が安全かつ効果的であることを保証する責任を負う必要がある。
DVにはバグがあり、潜在的に深刻なバグがあるはずだ。
しかし著者らは、現在および将来のDVとそのアウトプットの適切な利用は、医療の改善に役立つと期待している。
関連論文リスト
- ReFactX: Scalable Reasoning with Reliable Facts via Constrained Generation [8.331415420334361]
本稿では,検索者や補助モデルに依存することなく,大規模言語モデルが外部知識にアクセスできるようにするスケーラブルな手法を提案する。
提案手法はプレビルドプレフィックスツリーインデックスを用いた制約付き生成を用いる。
質問応答に関する提案を評価した結果,大規模知識ベース(事実8億件)にスケールし,ドメイン固有のデータに適応し,効果的な結果が得られた。
論文 参考訳(メタデータ) (2025-08-23T10:21:47Z) - DepsRAG: Towards Agentic Reasoning and Planning for Software Dependency Management [2.9860252315941618]
DepsRAGは、ソフトウェア依存関係の推論を支援するために設計されたマルチエージェントフレームワークである。
開発者は会話インターフェースを通じてDepsRAGと対話し、依存関係に関するクエリをポーズすることができる。
GPT-4-Turbo と Llama-3 を多段階推論タスクで用いた DepsRAG の評価を行い,Critic-Agent 機構の統合による3倍の精度向上を観察した。
論文 参考訳(メタデータ) (2024-05-30T20:05:44Z) - SearchLVLMs: A Plug-and-Play Framework for Augmenting Large Vision-Language Models by Searching Up-to-Date Internet Knowledge [56.772051051558215]
大規模視覚言語モデル(LVLM)は、LLaVAシリーズのような最新の知識を知らない。
本稿では,サーチLVLMと呼ばれる最新の知識に関する視覚的質問応答(VQA)を扱うために,既存のLVLMを増補するプラグイン・アンド・プレイフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T13:32:07Z) - A Simple Baseline for Knowledge-Based Visual Question Answering [78.00758742784532]
本稿では,知識に基づく視覚質問応答(KB-VQA)の問題について述べる。
本論文の主な貢献は,よりシンプルで容易に再現可能なパイプラインを提案することである。
近年のアプローチとは対照的に,本手法はトレーニングフリーであり,外部データベースやAPIへのアクセスを必要とせず,OK-VQAおよびA-OK-VQAデータセット上で最先端の精度を実現する。
論文 参考訳(メタデータ) (2023-10-20T15:08:17Z) - On the Safety of Open-Sourced Large Language Models: Does Alignment
Really Prevent Them From Being Misused? [49.99955642001019]
オープンソースでアライメントされた大きな言語モデルは、望ましくないコンテンツを生成するために簡単に誤解される可能性があることを示す。
我々のキーとなる考え方は、オープンソースLLMの生成プロセスを直接操作して、望ましくないコンテンツを生成するのを誤解することです。
論文 参考訳(メタデータ) (2023-10-02T19:22:01Z) - Open Domain Question Answering over Virtual Documents: A Unified
Approach for Data and Text [62.489652395307914]
我々は、知識集約型アプリケーションのための構造化知識を符号化する手段として、Data-to-text法、すなわち、オープンドメイン質問応答(QA)を用いる。
具体的には、ウィキペディアとウィキソースの3つのテーブルを付加知識源として使用する、データとテキスト上でのオープンドメインQAのための冗長化-レトリバー・リーダー・フレームワークを提案する。
UDT-QA(Unified Data and Text QA)は,知識インデックスの拡大を効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-10-16T00:11:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。