論文の概要: Ambiguity Resolution in Text-to-Structured Data Mapping
- arxiv url: http://arxiv.org/abs/2505.11679v1
- Date: Fri, 16 May 2025 20:39:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.778196
- Title: Ambiguity Resolution in Text-to-Structured Data Mapping
- Title(参考訳): テキストから構造化データマッピングにおけるあいまいさの解消
- Authors: Zhibo Hu, Chen Wang, Yanfeng Shu, Hye-Young Paik, Liming Zhu,
- Abstract要約: 自然言語における曖昧さは、構造化されたデータマッピングに対する正確なテキストを実現するための重要な障害である。
本稿では,概念不足の予測を通じて曖昧なエージェントツールを呼び出し,大規模言語モデル(LLM)の性能を向上させるための新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 10.285528620331696
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ambiguity in natural language is a significant obstacle for achieving accurate text to structured data mapping through large language models (LLMs), which affects the performance of tasks such as mapping text to agentic tool calling and text-to-SQL queries. Existing methods of ambiguity handling either exploit ReACT framework to produce the correct mapping through trial and error, or supervised fine tuning to guide models to produce a biased mapping to improve certain tasks. In this paper, we adopt a different approach that characterizes the representation difference of ambiguous text in the latent space and leverage the difference to identify ambiguity before mapping them to structured data. To detect ambiguity of a sentence, we focused on the relationship between ambiguous questions and their interpretations and what cause the LLM ignore multiple interpretations. Different to the distance calculated by dense embedding vectors, we utilize the observation that ambiguity is caused by concept missing in latent space of LLM to design a new distance measurement, computed through the path kernel by the integral of gradient values for each concepts from sparse-autoencoder (SAE) under each state. We identify patterns to distinguish ambiguous questions with this measurement. Based on our observation, We propose a new framework to improve the performance of LLMs on ambiguous agentic tool calling through missing concepts prediction.
- Abstract(参考訳): 自然言語の曖昧さは、大規模言語モデル(LLM)を通じて構造化されたデータマッピングに正確なテキストを実現するための重要な障害であり、テキストをエージェントツール呼び出しやテキストからSQLクエリにマッピングするといったタスクのパフォーマンスに影響を与える。
既存の曖昧性を扱う方法は、試行錯誤によって正しいマッピングを生成するためにReACTフレームワークを利用するか、特定のタスクを改善するためにバイアスマッピングを生成するためにモデルをガイドするための微調整を監督する。
本稿では,不明瞭なテキストの潜在空間における表現差を特徴付ける異なるアプローチを採用し,その差を利用してあいまいさを識別し,構造化データにマッピングする。
文のあいまいさを検出するために,あいまいな質問と解釈の関係と,LLMが複数の解釈を無視している原因に焦点をあてた。
密埋め込みベクトルによって計算される距離と異なり、各状態におけるスパースオートエンコーダ(SAE)から各概念の勾配値の積分によって、経路カーネルを通して計算される新しい距離測定を設計するために、LLMの潜在空間に欠落した概念によって曖昧さが引き起こされるという観測を利用する。
この測定であいまいな質問を区別するパターンを同定する。
そこで本研究では,不明瞭なエージェントツール上でのLCMの性能向上のための新しいフレームワークを提案する。
関連論文リスト
- Clarifying Ambiguities: on the Role of Ambiguity Types in Prompting Methods for Clarification Generation [5.259846811078731]
我々は、明確化のためのあいまいさの概念に注目し、明確化プロセスにおいてあいまいさをモデル化し統合することを模索する。
我々はこの新しいプロンプトスキームをAmbiguity Type-Chain of Thought (AT-CoT)と名付けた。
論文 参考訳(メタデータ) (2025-04-16T14:21:02Z) - CLEAR-KGQA: Clarification-Enhanced Ambiguity Resolution for Knowledge Graph Question Answering [13.624962763072899]
KGQAシステムは通常、ユーザクエリは曖昧であると仮定するが、これは現実世界のアプリケーションではめったに行われない仮定である。
本稿では,対話的明確化を通じて,エンティティのあいまいさ(類似した名前を持つエンティティの区別など)と意図のあいまいさ(ユーザクエリの異なる解釈を明確にするなど)を動的に扱う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-13T17:34:35Z) - LayerFlow: Layer-wise Exploration of LLM Embeddings using Uncertainty-aware Interlinked Projections [11.252261879736102]
LayerFlowはビジュアル分析ワークスペースで、リンクされたプロジェクション設計に埋め込みを表示する。
変換、表現、解釈の不確実性を伝達する。
提案するワークスペースのユーザビリティについて,再現性およびエキスパートケーススタディを通じて紹介する。
論文 参考訳(メタデータ) (2025-04-09T12:24:58Z) - Large Language Model Guided Progressive Feature Alignment for Multimodal UAV Object Detection [21.16636753446158]
既存のUAVオブジェクト検出手法は、しばしばモダリティ間の意味的ギャップの影響を見落としている。
本稿では,LPANet と呼ばれる,Large Language Model (LLM) ガイド付きプログレッシブ機能アライメントネットワークを提案する。
提案手法は,最先端のマルチモーダルUAVオブジェクト検出器よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-03-10T05:53:30Z) - Disambiguate First Parse Later: Generating Interpretations for Ambiguity Resolution in Semantic Parsing [56.82807063333088]
本稿では, 自然言語の解釈を論理形式にマッピングする前に, あいまいさを解消するモジュラー手法を提案する。
我々のアプローチは解釈のカバレッジを改善し、異なるアノテーションスタイル、データベース構造、あいまいさタイプを持つデータセットをまたいだ一般化を行う。
論文 参考訳(メタデータ) (2025-02-25T18:42:26Z) - AMBROSIA: A Benchmark for Parsing Ambiguous Questions into Database Queries [56.82807063333088]
我々は,新たなベンチマークであるAMBROSIAを導入し,テキスト・ツー・オープン・プログラムの開発を促進することを期待する。
私たちのデータセットには、3種類のあいまいさ(スコープのあいまいさ、アタッチメントのあいまいさ、あいまいさ)を示す質問が含まれている。
いずれの場合も、データベースのコンテキストが提供されてもあいまいさは持続する。
これは、スクラッチからデータベースを制御して生成する、新しいアプローチによって実現される。
論文 参考訳(メタデータ) (2024-06-27T10:43:04Z) - Contrastive Instruction Tuning [61.97704869248903]
意味論的に等価な命令-インスタンスペア間の類似性を最大化するために、コントラスト命令チューニングを提案する。
PromptBenchベンチマークの実験によると、CoINはLLMの頑健さを一貫して改善し、文字、単語、文、意味のレベルを平均して2.5%の精度で変化させる。
論文 参考訳(メタデータ) (2024-02-17T00:09:32Z) - SUN: Exploring Intrinsic Uncertainties in Text-to-SQL Parsers [61.48159785138462]
本稿では,ニューラルネットワークに基づくアプローチ(SUN)における本質的な不確かさを探索することにより,テキストから依存への変換性能を向上させることを目的とする。
5つのベンチマークデータセットの大規模な実験により、我々の手法は競合より大幅に優れ、新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-09-14T06:27:51Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。