論文の概要: Med-CRAFT: Automated Construction of Interpretable and Multi-Hop Video Workloads via Knowledge Graph Traversal
- arxiv url: http://arxiv.org/abs/2512.01045v1
- Date: Sun, 30 Nov 2025 19:24:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.55768
- Title: Med-CRAFT: Automated Construction of Interpretable and Multi-Hop Video Workloads via Knowledge Graph Traversal
- Title(参考訳): Med-CRAFT:知識グラフトラバースによる解釈可能・マルチホップビデオワークロードの自動構築
- Authors: Shenxi Liu, Kan Li, Mingyang Zhao, Yuhang Tian, Shoujun Zhou, Bin Li,
- Abstract要約: textbfPipelineNameは、新しいニューロシンボリックデータエンジニアリングフレームワークである。
Med-CRAFTは生のビデオストリームから構造化されたビジュアルプリミティブを抽出し、動的時空間知識グラフにインスタンス化する。
このパイプラインをインスタンス化し、大規模な医療ビデオ推論ベンチマークであるM3-Med-Autoを生成します。
- 参考スコア(独自算出の注目度): 13.216513001286812
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The scarcity of high-quality, logically annotated video datasets remains a primary bottleneck in advancing Multi-Modal Large Language Models (MLLMs) for the medical domain. Traditional manual annotation is prohibitively expensive and non-scalable, while existing synthetic methods often suffer from stochastic hallucinations and a lack of logical interpretability. To address these challenges, we introduce \textbf{\PipelineName}, a novel neuro-symbolic data engineering framework that formalizes benchmark synthesis as a deterministic graph traversal process. Unlike black-box generative approaches, Med-CRAFT extracts structured visual primitives (e.g., surgical instruments, anatomical boundaries) from raw video streams and instantiates them into a dynamic Spatiotemporal Knowledge Graph. By anchoring query generation to valid paths within this graph, we enforce a rigorous Chain-of-Thought (CoT) provenance for every synthesized benchmark item. We instantiate this pipeline to produce M3-Med-Auto, a large-scale medical video reasoning benchmark exhibiting fine-grained temporal selectivity and multi-hop logical complexity. Comprehensive evaluations demonstrate that our automated pipeline generates query workloads with complexity comparable to expert-curated datasets. Furthermore, a logic alignment analysis reveals a high correlation between the prescribed graph topology and the reasoning steps of state-of-the-art MLLMs, validating the system's capability to encode verifiable logic into visual-linguistic benchmarks. This work paves the way for scalable, low-cost construction of robust evaluation protocols in critical domains.
- Abstract(参考訳): 高品質で論理的な注釈付きビデオデータセットの不足は、医療領域向けにMLLM(Multi-Modal Large Language Models)を前進させる上で、依然として主要なボトルネックとなっている。
従来の手書きの注釈は高価であり、拡張不可能であるが、既存の合成法は確率的幻覚と論理的解釈性の欠如に悩まされることが多い。
これらの課題に対処するために,ベンチマーク合成を決定論的グラフトラバーサルプロセスとして形式化する,新しいニューロシンボリックデータエンジニアリングフレームワークである‘textbf{\PipelineName} を導入する。
ブラックボックス生成アプローチとは異なり、Med-CRAFTは生のビデオストリームから構造化された視覚的プリミティブ(例えば、手術器具、解剖学的境界)を抽出し、動的時空間知識グラフにインスタンス化する。
このグラフ内の有効なパスにクエリ生成を固定することにより、合成されたベンチマーク項目毎に厳密なChain-of-Thought(CoT)証明を強制する。
このパイプラインをインスタンス化し、M3-Med-Autoを生成する。M3-Med-Autoは、微細な時間選択性とマルチホップ論理的複雑さを示す大規模医療ビデオ推論ベンチマークである。
包括的な評価では、我々の自動パイプラインは、専門家が計算したデータセットに匹敵する複雑さでクエリワークロードを生成する。
さらに、論理アライメント解析は、所定のグラフトポロジと最先端MLLMの推論ステップとの間に高い相関関係を示し、検証可能なロジックを視覚言語学的ベンチマークにエンコードするシステムの能力を検証する。
この研究は、クリティカルドメインにおけるロバスト評価プロトコルのスケーラブルで低コストな構築の道を開いた。
関連論文リスト
- Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z) - OntoLogX: Ontology-Guided Knowledge Graph Extraction from Cybersecurity Logs with Large Language Models [3.4435169157853465]
システムログはサイバー脅威インテリジェンス(CTI)の貴重な情報源である
しかし、それらのユーティリティは、構造の欠如、セマンティックな一貫性の欠如、デバイスやセッション間の断片化によって制限されることが多い。
OntoLogXは生ログをオントロジー基底知識グラフ(KG)に変換する
システムはKGをセッションに集約し、MITRE ATT&CKの戦術を予測する。
論文 参考訳(メタデータ) (2025-10-01T19:46:15Z) - Leveraging Knowledge Graphs and LLM Reasoning to Identify Operational Bottlenecks for Warehouse Planning Assistance [1.2749527861829046]
我々のフレームワークは知識グラフ(KG)とLarge Language Model(LLM)ベースのエージェントを統合している。
生のDESデータを意味的にリッチなKGに変換し、シミュレーションイベントとエンティティの関係をキャプチャする。
LLMベースのエージェントは反復推論を使用し、相互依存的なサブクエストを生成する。各サブクエストに対して、KGインタラクションのためのCypherクエリを生成し、情報を抽出し、エラーを修正する。
論文 参考訳(メタデータ) (2025-07-23T07:18:55Z) - Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents [106.04963073116468]
フローチャートは意思決定プロセスを視覚化するための重要なツールです。
視覚言語モデルは、これらの図を分析する際に、存在しない接続や決定経路を幻覚させる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャートについて紹介する。
本稿では, グラフベースの推論により微細なホック帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
論文 参考訳(メタデータ) (2025-06-02T06:02:41Z) - RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library [58.404895570822184]
RV-Synは、新しい数学的合成手法である。
このライブラリからPython形式の関数を組み合わせることで、グラフをソリューションとして生成する。
構築したグラフに基づいて,解誘導論理認識問題生成を実現する。
論文 参考訳(メタデータ) (2025-04-29T04:42:02Z) - Large Language Models Meet Symbolic Provers for Logical Reasoning Evaluation [24.081573908824353]
一階述語論理(FOL)推論はインテリジェントシステムにおいて重要である。
既存のベンチマークは、広範囲の人間のアノテーションや手作りテンプレートに依存していることが多い。
本稿では,大言語モデルの生成強度を記号型プローサの厳密性と精度で相乗化するProverGenという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-10T15:31:54Z) - Large Language Models as Realistic Microservice Trace Generators [48.730974361862366]
本稿では,大規模言語モデル (LLM) を用いて, 合成作業負荷トレースを生成する手法を提案する。
我々はTraceLLMが様々な条件下で多様なリアルなトレースを生成し、精度と妥当性の両方において既存のアプローチよりも優れていることを示す。
TraceLLMは、キートレース機能を予測したり、欠落したデータを埋め込むといった、下流のトレース関連タスクに適応する。
論文 参考訳(メタデータ) (2024-12-16T12:48:04Z) - Explainable Spatio-Temporal GCNNs for Irregular Multivariate Time Series: Architecture and Application to ICU Patient Data [7.433698348783128]
XST-CNN(eXG-Temporal Graph Conal Neural Network)は、不均一で不規則なマルチ時系列(MTS)データを処理するための新しいアーキテクチャである。
提案手法は,GCNNパイプラインを利用して時間的・時間的統合パイプライン内での時間的特徴を捉える。
ICU患者のマルチドラッグ抵抗(MDR)を予測するために,実世界の電子健康記録データを用いてXST-CNNを評価した。
論文 参考訳(メタデータ) (2024-11-01T22:53:17Z) - LOGICSEG: Parsing Visual Semantics with Neural Logic Learning and
Reasoning [73.98142349171552]
LOGICSEGは、神経誘導学習と論理推論をリッチデータとシンボリック知識の両方に統合する、全体論的視覚意味論である。
ファジィ論理に基づく連続的な緩和の間、論理式はデータとニューラルな計算グラフに基礎を置いており、論理によるネットワークトレーニングを可能にする。
これらの設計によりLOGICSEGは、既存のセグメンテーションモデルに容易に統合できる汎用的でコンパクトなニューラル論理マシンとなる。
論文 参考訳(メタデータ) (2023-09-24T05:43:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。