論文の概要: BDIViz in Action: Interactive Curation and Benchmarking for Schema Matching Methods
- arxiv url: http://arxiv.org/abs/2604.10763v1
- Date: Sun, 12 Apr 2026 18:16:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.206783
- Title: BDIViz in Action: Interactive Curation and Benchmarking for Schema Matching Methods
- Title(参考訳): BDIViz in Action: スキーママッチングのためのインタラクティブなキュレーションとベンチマーク
- Authors: Eden Wu, Christos Koutras, Cláudio T. Silva, Juliana Freire,
- Abstract要約: BDIViz は LLM による検証とスキーママッチングのためのインタラクティブな可視化システムである。
BDIVizへの新たな拡張は、Human-in-the-loopベンチマークと反復型マーカ開発という、データ統合研究における重要なニーズに対処する。
- 参考スコア(独自算出の注目度): 12.444984647326024
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Schema matching remains fundamental to data integration, yet evaluating and comparing matching methods is hindered by limited benchmark diversity and lack of interactive validation frameworks. BDIViz, recently published at IEEE VIS 2025, is an interactive visualization system for schema matching with LLM-assisted validation. Given source and target datasets, BDIViz applies automatic matching methods and visualizes candidates in an interactive heatmap with hierarchical navigation, zoom, and filtering. Users validate matches directly in the heatmap and inspect ambiguous cases using coordinated views that show attribute descriptions, example values, and distributions. An LLM assistant generates structured explanations for selected candidates to support decision-making. This demonstration showcases a new extension to BDIViz that addresses a critical need in data integration research: human-in-the-loop benchmarking and iterative matcher development. New matchers can be integrated through a standardized interface, while user validations become evolving ground truth for real-time performance evaluation. This enables benchmarking new algorithms, constructing high-quality ground-truth datasets through expert validation, and comparing matcher behavior across diverse schemas and domains. We demonstrate two complementary scenarios: (i) data harmonization, where users map a large tabular dataset to a target schema with value-level inspection and LLM-generated explanations; and (ii) developer-in-the-loop benchmarking, where developers integrate custom matchers, observe performance metrics, and refine their algorithms.
- Abstract(参考訳): スキーママッチングは依然としてデータ統合の基本であるが、マッチングメソッドの評価と比較は、限られたベンチマークの多様性と対話型バリデーションフレームワークの欠如によって妨げられている。
BDIVizは、最近IEEE VIS 2025で発表された、LCMアシストバリデーションとスキーママッチングのためのインタラクティブな可視化システムである。
ソースとターゲットのデータセットが与えられた場合、BDIVizは自動マッチング手法を適用し、階層的なナビゲーション、ズーム、フィルタリングを備えたインタラクティブなヒートマップで候補を視覚化する。
ユーザは、ヒートマップでマッチを直接検証し、属性記述、例値、分布を示すコーディネートされたビューを使用してあいまいなケースを検査する。
LLMアシスタントは、選択された候補に対する構造化された説明を生成し、意思決定を支援する。
このデモでは、ヒューマン・イン・ザ・ループ・ベンチマークと反復型マーカ開発という、データ統合研究における重要なニーズに対処するBDIVizの新たな拡張が紹介されている。
ユーザバリデーションはリアルタイムのパフォーマンス評価の基盤となる一方で,新しいマーカを標準化されたインターフェースを通じて統合することができる。
これにより、新しいアルゴリズムのベンチマーク、専門家のバリデーションによる高品質な基盤構造データセットの構築、さまざまなスキーマやドメイン間でのマッチング動作の比較が可能になる。
補完的なシナリオを2つ示します。
i) 大きな表形式のデータセットを値レベルの検査とLCMによる説明を伴うターゲットスキーマにマッピングするデータ調和化。
開発者がカスタムマーカを統合し、パフォーマンスメトリクスを観察し、アルゴリズムを洗練する。
関連論文リスト
- Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models [64.58262227709842]
ARISE(Attention-weighted Representation with Integrated Semantic Embeddings)が紹介される。
正確なクラスタリングのためにカテゴリデータのメトリック空間を補完するセマンティックアウェア表現を構築する。
8つのベンチマークデータセットの実験では、7つの代表的なデータセットよりも一貫した改善が示されている。
論文 参考訳(メタデータ) (2026-01-03T11:37:46Z) - Schema Matching on Graph: Iterative Graph Exploration for Efficient and Explainable Data Integration [0.0]
大規模言語モデル(LLM)はスキーママッチングにおいて有望であるが、幻覚と最新のドメイン知識の欠如に悩まされている。
本稿では,単純な1ホップSPARQLクエリの反復実行を利用する新しいフレームワークであるSMoG(Matching on Graph)を紹介する。
実世界の医療データセットの実験結果は、SMoGが最先端のベースラインに匹敵するパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-11-25T13:13:56Z) - CoT Referring: Improving Referring Expression Tasks with Grounded Reasoning [67.18702329644526]
CoT Referringは、構造化されたチェーン・オブ・シークレット・トレーニングデータ構造を通じて、モデル推論をモダリティにわたって強化する。
トレーニングデータを再構築して、新たな出力フォームを実行し、既存のデータセットに新たなアノテーションを提供します。
また、検出とセグメント化機能を統合MLLMフレームワークに統合し、新しい適応重み付き損失で学習して性能を最適化する。
論文 参考訳(メタデータ) (2025-10-03T08:50:21Z) - CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward [50.97588334916863]
評価と結果報酬のための正確で堅牢な軽量検証モデルであるCompassVerifierを開発した。
数学、知識、多種多様な推論タスクにまたがる多分野の能力を示し、様々な答えの型を処理する能力を示す。
我々は,複数のデータソースから収集したモデル出力からなるVerifierBenchベンチマークを導入し,メタエラーパターンを手動で解析してCompassVerifierを強化する。
論文 参考訳(メタデータ) (2025-08-05T17:55:24Z) - Full Triple Matcher: Integrating all triple elements between heterogeneous Knowledge Graphs [0.09471093245585005]
知識グラフ(KG)は構造化情報の表現と推論のための強力なツールである。
現在のアプローチは、多様で複雑なコンテキストを統合する必要があるシナリオでは不足する可能性がある。
ラベルマッチングと3重マッチングからなる新しいKG積分法を提案する。
論文 参考訳(メタデータ) (2025-07-20T07:46:55Z) - Schemora: schema matching via multi-stage recommendation and metadata enrichment using off-the-shelf llms [0.0]
SCHEMORAは、大規模言語モデルとハイブリッド検索技術を組み合わせたスキーママッチングフレームワークである。
MIMIC-OMOPベンチマークで評価され、HitRate@5で7.49%、HitRate@3で3.75%上昇した。
論文 参考訳(メタデータ) (2025-07-18T21:50:36Z) - QID: Efficient Query-Informed ViTs in Data-Scarce Regimes for OCR-free Visual Document Understanding [53.69841526266547]
トレーニング済みのVision-Language Modelを新しいデータセットで微調整することは、ビジョンエンコーダの最適化に不足することが多い。
視覚エンコーダにクエリの埋め込みを統合する,新しい,合理化されたアーキテクチャ保存アプローチであるQIDを導入する。
論文 参考訳(メタデータ) (2025-04-03T18:47:16Z) - Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.23571456538149]
本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。
Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。
実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文 参考訳(メタデータ) (2024-10-31T16:34:03Z) - CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。
従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。
粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Self Supervised Correlation-based Permutations for Multi-View Clustering [7.093692674858257]
汎用データ型のためのエンドツーエンドのディープラーニングに基づくマルチビュークラスタリングフレームワークを提案する。
提案手法は,新しい置換に基づく正準相関目標を用いた有意義な融合表現を生成する。
論文 参考訳(メタデータ) (2024-02-26T08:08:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。