論文の概要: STIndex: A Context-Aware Multi-Dimensional Spatiotemporal Information Extraction System
- arxiv url: http://arxiv.org/abs/2604.08597v1
- Date: Tue, 07 Apr 2026 04:42:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.471953
- Title: STIndex: A Context-Aware Multi-Dimensional Spatiotemporal Information Extraction System
- Title(参考訳): 文脈対応多次元時空間情報抽出システムSTIndex
- Authors: Wenxiao Zhang, Yu Liu, Qiang sun, Yihao Ding, Sirui Li, Yanbing Liu, Jin B. Hong, Wei Liu,
- Abstract要約: textbfSTIndexは、構造化されていないコンテンツを多次元のデータウェアハウスに構造化するエンドツーエンドシステムである。
textbfSTIndexは文書レベルのメモリ、ジオコーディング補正、品質検証を統合している。
ライブデモとオープンソースコードはhttps://stindex.ai4wa.com/dashboard.comで公開されている。
- 参考スコア(独自算出の注目度): 25.729969757935436
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting structured knowledge from unstructured data still faces practical limitations: entity and event extraction pipelines remain brittle, knowledge graph construction requires costly ontology engineering, and cross-domain generalization is rarely production-ready. In contrast, space and time provide universal contextual anchors that naturally align heterogeneous information and benefit downstream tasks such as retrieval and reasoning. We introduce \textbf{STIndex}, an end-to-end system that structures unstructured content into a multidimensional spatiotemporal data warehouse. Users define domain-specific analysis dimensions with configurable hierarchies, while large language models perform context-aware extraction and grounding. \textbf{STIndex} integrates document-level memory, geocoding correction, and quality validation, and offers an interactive analytics dashboard for visualization, clustering, burst detection, and entity network analysis. In evaluation on a public health benchmark, \textbf{STIndex} improves spatiotemporal entity extraction F1 by 4.37\% (GPT-4o-mini) and 3.60\% (Qwen3-8B). A live demonstration and open-source code are available at https://stindex.ai4wa.com/dashboard.
- Abstract(参考訳): エンティティとイベント抽出パイプラインは不安定であり、知識グラフの構築にはコストがかかるオントロジー工学が必要である。
対照的に、空間と時間は、不均一な情報を自然に整列させ、検索や推論のような下流のタスクに利益をもたらす、普遍的な文脈的アンカーを提供する。
本稿では,非構造化コンテンツを多次元時空間データウェアハウスに構造化するエンドツーエンドシステムであるtextbf{STIndex}を紹介する。
ユーザーは構成可能な階層でドメイン固有の分析ディメンションを定義し、大きな言語モデルはコンテキスト認識の抽出とグラウンドを実行する。
\textbf{STIndex}はドキュメントレベルのメモリ、ジオコーディング補正、品質検証を統合し、可視化、クラスタリング、バースト検出、エンティティネットワーク分析のためのインタラクティブな分析ダッシュボードを提供する。
公衆衛生ベンチマークの評価において、 \textbf{STIndex} は時空間実体抽出 F1 を 4.37 % (GPT-4o-mini) と 3.60 % (Qwen3-8B) 改善する。
ライブデモとオープンソースコードはhttps://stindex.ai4wa.com/dashboard.comで公開されている。
関連論文リスト
- It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks [87.7937890373758]
時系列基礎モデル(TSFM)は,特定のデータセットモデルから一般化可能なタスク評価に至るまで,予測環境に革命をもたらしている。
我々は、50の新しいデータセットと98の予測タスクからなる次世代タスク中心のベンチマークであるTIMEを紹介する。
静的なメタラベルに基づく従来のデータセットレベルの評価を超える新しいパターンレベルの評価視点を提案する。
論文 参考訳(メタデータ) (2026-02-12T16:31:01Z) - Event Extraction in Large Language Model [99.94321497574805]
私たちは、LLM中心のソリューションに認知的な足場を提供するシステムコンポーネントとして、EEは見なされるべきである、と論じます。
この調査では、EEのテキストとマルチモーダル設定、タスクと分類の整理、ルールベースとニューラルモデルから命令駆動および生成フレームワークへのメソッド進化のトレースについて取り上げている。
論文 参考訳(メタデータ) (2025-12-22T16:22:14Z) - Online Segment Any 3D Thing as Instance Tracking [60.20416622842975]
オンライン3Dセグメンテーションをインスタンス追跡問題として再認識する(AutoSeg3D)。
視覚基礎モデルに固有の断片化問題を緩和するために,空間整合性学習を導入する。
ScanNet200上でESAMを2.8 AP上回る新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2025-12-08T14:48:51Z) - Integrating Temporal and Structural Context in Graph Transformers for Relational Deep Learning [6.780460717949915]
直近の領域を越えてノードを検索することで,グローバルなコンテキストを向上する時空間サブグラフサンプリング手法を提案する。
また,リレーショナルディープラーニングのためのグラフトランスフォーマーアーキテクチャであるGraph Perceiver (RGP)を提案する。
RGPは最先端のパフォーマンスを提供し、リレーショナルディープラーニングのための汎用的でスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-11-06T17:08:21Z) - Priors in Time: Missing Inductive Biases for Language Model Interpretability [58.07412640266836]
スパースオートエンコーダは、時間とともに概念の独立を前提としており、定常性を暗示している。
本稿では,時間的帰納バイアスを持つ新たな解釈可能性目標である時間的特徴分析を導入し,その表現を2つの部分に分解する。
私たちの結果は、堅牢な解釈可能性ツールの設計において、データにマッチする帰納的バイアスの必要性を浮き彫りにしています。
論文 参考訳(メタデータ) (2025-11-03T18:43:48Z) - StructText: A Synthetic Table-to-Text Approach for Benchmark Generation with Multi-Dimensional Evaluation [8.251302684712773]
StructTextは、テキストからキー値抽出のための高忠実度ベンチマークを自動的に生成するエンドツーエンドフレームワークである。
提案手法は,49件の文書を対象とした71,539件のサンプルを用いて評価した。
論文 参考訳(メタデータ) (2025-07-28T21:20:44Z) - MindBench: A Comprehensive Benchmark for Mind Map Structure Recognition and Analysis [35.31073435549237]
文書分析にMindBenchという新しいベンチマークを導入する。
これには、厳密に構築されたバイリンガル認証または合成画像、詳細なアノテーション、評価指標、ベースラインモデルが含まれる。
これらのタスクには、完全パース、部分パース、位置関連パース、構造化された視覚質問応答(VQA)、位置関連VQAが含まれる。
論文 参考訳(メタデータ) (2024-07-03T06:39:18Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Schema-aware Reference as Prompt Improves Data-Efficient Knowledge Graph
Construction [57.854498238624366]
本稿では,データ効率のよい知識グラフ構築のためのRAP(Schema-Aware Reference As Prompt)の検索手法を提案する。
RAPは、人間の注釈付きおよび弱教師付きデータから受け継いだスキーマと知識を、各サンプルのプロンプトとして動的に活用することができる。
論文 参考訳(メタデータ) (2022-10-19T16:40:28Z) - HOSE-Net: Higher Order Structure Embedded Network for Scene Graph
Generation [20.148175528691905]
本稿では,関係の局所的および大域的構造情報を出力空間に組み込むための新しい構造認識型組込み分類器(SEC)モジュールを提案する。
また,高次構造情報を導入して部分空間の数を減らし,階層的セマンティックアグリゲーション(HSA)モジュールを提案する。
提案したHOSE-Netは、Visual GenomeとVRDの2つの人気のあるベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-08-12T07:58:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。