論文の概要: FD-NL2SQL: Feedback-Driven Clinical NL2SQL that Improves with Use
- arxiv url: http://arxiv.org/abs/2604.15646v1
- Date: Fri, 17 Apr 2026 02:45:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.713603
- Title: FD-NL2SQL: Feedback-Driven Clinical NL2SQL that Improves with Use
- Title(参考訳): FD-NL2SQL: フィードバック駆動型臨床NL2SQLの使用により改善
- Authors: Suparno Roy Chowdhury, Tejas Anvekar, Manan Roy Choudhury, Muhammad Ali Khan, Kaneez Zahra Rubab Khakwani, Mohamad Bassam Sonbol, Irbaz Bin Riaz, Vivek Gupta,
- Abstract要約: 腫瘍学のトライアルリポジトリを探索する臨床医は、バイオマーカー、エンドポイント、介入、時間に対するアドホックでマルチ制約のクエリを必要とすることが多い。
我々はFD-NL2合成のデモを行う。
- 参考スコア(独自算出の注目度): 10.080176148010247
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinicians exploring oncology trial repositories often need ad-hoc, multi-constraint queries over biomarkers, endpoints, interventions, and time, yet writing SQL requires schema expertise. We demo FD-NL2SQL, a feedback-driven clinical NL2SQL assistant for SQLite-based oncology databases. Given a natural-language question, a schema-aware LLM decomposes it into predicate-level sub-questions, retrieves semantically similar expert-verified NL2SQL exemplars via sentence embeddings, and synthesizes executable SQL conditioned on the decomposition, retrieved exemplars, and schema, with post-processing validity checks. To improve with use, FD-NL2SQL incorporates two update signals: (i) clinician edits of generated SQL are approved and added to the exemplar bank; and (ii) lightweight logic-based SQL augmentation applies a single atomic mutation (e.g., operator or column change), retaining variants only if they return non-empty results. A second LLM generates the corresponding natural-language question and predicate decomposition for accepted variants, automatically expanding the exemplar bank without additional annotation. The demo interface exposes decomposition, retrieval, synthesis, and execution results to support interactive refinement and continuous improvement.
- Abstract(参考訳): オンコロジートライアルリポジトリを探索する臨床医は、バイオマーカー、エンドポイント、介入、時間に関するアドホックでマルチ制約のクエリを必要とすることが多いが、SQLを書くにはスキーマの専門知識が必要である。
SQLiteベースのオンコロジーデータベースのためのフィードバック駆動臨床NL2SQLアシスタントであるFD-NL2SQLをデモする。
自然言語の質問が与えられた場合、スキーマ対応のLLMは、それを述語レベルのサブクエストに分解し、文の埋め込みを通じて意味的に類似した専門家認証NL2SQLの例を検索し、分解、検索された例、スキーマに条件付き実行可能なSQLを後処理の妥当性チェックで合成する。
FD-NL2SQLは、使用を改善するために、2つの更新シグナルを組み込んだ。
(i)生成されたSQLの臨床編集が承認され、模範銀行に追加され、
(ii)軽量なロジックベースのSQL拡張は、単一のアトミックな突然変異(例えば、オペレータやカラムの変更)を適用し、空でない結果を返す場合にのみ変種を保持する。
第2のLLMは、対応する自然言語質問を生成し、受け入れられた変種を述語分解し、追加のアノテーションを使わずに模範バンクを自動的に拡張する。
デモインターフェイスは、インタラクティブな洗練と継続的な改善をサポートするために、分解、検索、合成、実行結果を公開する。
関連論文リスト
- Track-SQL: Enhancing Generative Language Models with Dual-Extractive Modules for Schema and Context Tracking in Multi-turn Text-to-SQL [50.84251174559123]
生成言語モデルの性能は、マルチターンテキストソースと同程度に拡張されない。
マルチターンテキスト・ソースにおけるスキーマとコンテキスト変化を追跡するために設計された二重抽出モジュールを用いた生成言語モデルを強化するトラック-を提案する。
Track-は、データセットでそれぞれ7.1%と9.55%のマルチターンインタラクションの実行精度を大幅に改善する。
論文 参考訳(メタデータ) (2026-03-06T07:57:06Z) - Hallucination Detection for LLM-based Text-to-SQL Generation via Two-Stage Metamorphic Testing [8.942002314582789]
大型言語モデル(LLM)は幻覚、すなわち非現実的または非論理的内容を生成する。
本稿では,メタモルフィックテスト(MT)に基づく新しい幻覚検出手法を提案する。
F1スコアは69.36%から82.76%の範囲である。
論文 参考訳(メタデータ) (2025-12-24T04:04:26Z) - Text-to-SQL as Dual-State Reasoning: Integrating Adaptive Context and Progressive Generation [54.53145282349042]
DSR-sourced, textbfDual-textbfS textbfReasoning frameworkを導入する。
ポストトレーニングやインコンテキストの例がなければ、DSR-sourcedは競合性能を達成し、スパイダー2.0-Snowで35.28%、BIRD開発で68.32%に達する。
論文 参考訳(メタデータ) (2025-11-26T13:52:50Z) - CRED-SQL: Enhancing Real-world Large Scale Database Text-to-SQL Parsing through Cluster Retrieval and Execution Description [15.080310729603466]
CRED-は大規模データベース向けに設計されたフレームワークで、クラスタ検索と実行記述を統合している。
自然言語質問(NLQ)と対応するsqlクエリのギャップを埋める。
CRED-は最新のgit-the-art(SOTA)パフォーマンスを実現し、その有効性とスケーラビリティを検証する。
論文 参考訳(メタデータ) (2025-08-18T09:43:07Z) - UNJOIN: Enhancing Multi-Table Text-to-SQL Generation via Schema Simplification [50.59009084277447]
論理生成からスキーマ要素の検索を分離するフレームワークUNJOINを紹介する。
最初の段階では、各列をテーブル名でプレフィックスすることで、データベース内のすべてのテーブルの列名を単一のテーブル表現にマージします。
第2段階では、クエリは、この単純化されたスキーマに基づいて生成され、JOIN、UNION、リレーショナルロジックを再構築することで、元のスキーマにマップされる。
論文 参考訳(メタデータ) (2025-05-23T17:28:43Z) - PET-SQL: A Prompt-Enhanced Two-Round Refinement of Text-to-SQL with Cross-consistency [19.067737007347613]
スパイダーベンチマークで新しいSOTA結果が得られ、実行精度は87.6%である。
提案手法は, 87.6%の精度で, スパイダーベンチマークで新しいSOTA結果が得られる。
論文 参考訳(メタデータ) (2024-03-13T02:32:41Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - Improving Text-to-SQL Semantic Parsing with Fine-grained Query
Understanding [84.04706075621013]
トークンレベルのきめ細かいクエリ理解に基づく汎用的モジュール型ニューラルネットワーク解析フレームワークを提案する。
我々のフレームワークは、名前付きエンティティ認識(NER)、ニューラルエンティティリンカ(NEL)、ニューラルエンティティリンカ(NSP)の3つのモジュールから構成されている。
論文 参考訳(メタデータ) (2022-09-28T21:00:30Z) - Weakly Supervised Text-to-SQL Parsing through Question Decomposition [53.22128541030441]
我々は最近提案されたQDMR(QDMR)という意味表現を活用している。
質問やQDMR構造(非専門家によって注釈付けされたり、自動予測されたりする)、回答が与えられたら、我々は自動的にsqlクエリを合成できる。
本結果は,NL-ベンチマークデータを用いて訓練したモデルと,弱い教師付きモデルが競合することを示す。
論文 参考訳(メタデータ) (2021-12-12T20:02:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。