Fugu-MT 論文翻訳(概要): On Efficient Approximate Queries over Machine Learning Models

論文の概要: On Efficient Approximate Queries over Machine Learning Models

arxiv url: http://arxiv.org/abs/2206.02845v1
Date: Mon, 6 Jun 2022 18:35:19 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-08 16:01:31.652850
Title: On Efficient Approximate Queries over Machine Learning Models
Title（参考訳）: 機械学習モデルによる効率的な近似クエリについて
Authors: Dujian Ding, Sihem Amer-Yahia, Laks VS Lakshmanan
Abstract要約: 本稿では,プロキシを活用し,オラクルの使用量を最小限に抑えることで,クエリ応答を近似する新しい統一フレームワークを開発する。我々のフレームワークは、データサンプルに高価なオラクルを呼び出し、DB内のオブジェクトに安価なプロキシを適用するという、司法的な組み合わせを使用します。我々のアルゴリズムは最先端のアルゴリズムより優れており、証明可能な統計的保証で高い結果が得られる。
参考スコア（独自算出の注目度）: 30.26180913049285
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The question of answering queries over ML predictions has been gaining attention in the database community. This question is challenging because the cost of finding high quality answers corresponds to invoking an oracle such as a human expert or an expensive deep neural network model on every single item in the DB and then applying the query. We develop a novel unified framework for approximate query answering by leveraging a proxy to minimize the oracle usage of finding high quality answers for both Precision-Target (PT) and Recall-Target (RT) queries. Our framework uses a judicious combination of invoking the expensive oracle on data samples and applying the cheap proxy on the objects in the DB. It relies on two assumptions. Under the Proxy Quality assumption, proxy quality can be quantified in a probabilistic manner w.r.t. the oracle. This allows us to develop two algorithms: PQA that efficiently finds high quality answers with high probability and no oracle calls, and PQE, a heuristic extension that achieves empirically good performance with a small number of oracle calls. Alternatively, under the Core Set Closure assumption, we develop two algorithms: CSC that efficiently returns high quality answers with high probability and minimal oracle usage, and CSE, which extends it to more general settings. Our extensive experiments on five real-world datasets on both query types, PT and RT, demonstrate that our algorithms outperform the state-of-the-art and achieve high result quality with provable statistical guarantees.
Abstract（参考訳）: ML予測に対するクエリに回答する問題は、データベースコミュニティで注目を集めている。高品質な回答を見つけるコストは、DBのすべての項目で人間の専門家や高価なディープニューラルネットワークモデルといった託宣を呼び起こし、クエリを適用することに対応するため、この問題は難しい。精度目標(pt)とリコール目標(rt)の両方に対して、oracleが高品質の回答を見つけることを最小限に抑えるためにプロキシを利用して、近似クエリ応答のための新しい統一フレームワークを開発した。我々のフレームワークは、データサンプルに高価なオラクルを呼び出し、DB内のオブジェクトに安価なプロキシを適用するという、司法的な組み合わせを使用します。それは2つの仮定に依存する。プロキシ品質の仮定の下では、プロキシ品質は確率的な方法で量子化することができる。これにより、高い確率でオラクル呼び出しのない高品質な回答を効率的に見つけるPQAと、少数のオラクル呼び出しで経験的に優れたパフォーマンスを達成するヒューリスティックな拡張であるPQEの2つのアルゴリズムを開発することができる。あるいは、Core Set Closureの仮定の下で、高い確率と最小のオラクル使用率で効率よく高品質な回答を返すCSCと、より一般的な設定に拡張するCSEの2つのアルゴリズムを開発する。クエリタイプptとrtの5つの実世界のデータセットに関する広範な実験は、我々のアルゴリズムが最先端を上回っており、統計的保証によって高い結果品質を達成していることを示している。

関連論文リスト

Beyond Prompting: An Efficient Embedding Framework for Open-Domain Question Answering [16.619631626069324]
大規模言語モデルは、最近、新しいフロンティアにオープンドメインの質問に答えた。一般的なレトリバーリーダーパイプラインは、しばしば複数のプロンプトレベル命令に依存する。 EmbQAは,レシーバとリーダの両方を強化した埋め込みレベルのフレームワークである。
論文参考訳（メタデータ） (2025-03-03T14:41:35Z)
PlanGEN: A Multi-Agent Framework for Generating Planning and Reasoning Trajectories for Complex Problem Solving [89.60370366013142]
制約,検証,選択という3つの重要な要素を持つモデルに依存しない,スケーラブルなエージェントフレームワークであるPlanGENを提案する。具体的には、推論時間アルゴリズムの性能を向上させるために、制約誘導反復検証を提案する。
論文参考訳（メタデータ） (2025-02-22T06:21:56Z)
Personalized Top-k Set Queries Over Predicted Scores [21.74740893966611]
本研究は,予測スコア上でトップkクエリに応答する上で,高価な外部オラクルの適用性について検討する。任意の集合ベースのスコアリング関数を処理する汎用計算フレームワークを提案する。
論文参考訳（メタデータ） (2025-02-18T16:19:08Z)
Avoiding $\mathbf{exp(R_{max})}$ scaling in RLHF through Preference-based Exploration [20.76451379043945]
RLHF(Reinforcement Learning from Human Feedback)は,大規模言語モデル(LLM)アライメントのための重要な手法として登場した。本稿では、オンラインRLHFの設定と、サンプル効率の向上に焦点をあてる。
論文参考訳（メタデータ） (2025-02-02T04:40:04Z)
Unleashing LLM Reasoning Capability via Scalable Question Synthesis from Scratch [54.12139707822201]
本稿では,新しい,スケーラブルで費用対効果の高いデータ合成手法であるScaleQuestを提案する。スクラッチから多様な質問を生成することで、100万の問題解決ペアのデータセットを生成します。私たちの実験では、データに基づいてトレーニングされたモデルが、既存のオープンソースデータセットより優れています。
論文参考訳（メタデータ） (2024-10-24T12:42:04Z)
Oracle problems as communication tasks and optimization of quantum algorithms [0.0]
鍵となる疑問は、アルゴリズムが一定の数のクエリのみを使用して学習タスクをどの程度うまく成功させることができるかである。本研究では,出力と実値の相互情報を用いたアルゴリズムの性能測定を提案する。
論文参考訳（メタデータ） (2024-09-23T21:03:39Z)
ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
我々は、エンドツーエンドのクロスモーダル検索のための先駆的なジェネリッククロスモーダル rEtrieval framework (ACE) を提案する。 ACEは、クロスモーダル検索における最先端のパフォーマンスを達成し、Recall@1の強いベースラインを平均15.27%上回る。
論文参考訳（メタデータ） (2024-06-25T12:47:04Z)
FoRAG: Factuality-optimized Retrieval Augmented Generation for Web-enhanced Long-form Question Answering [11.73887020240588]
本稿では,多面的回答の生成において明確な論理を実現するために,新しいアウトライン強化ジェネレータを提案する。そこで本研究では,2つの微細なRLHFフレームワークを念頭に設計したファクトリティ最適化手法を提案する。特に,本手法をLlama2-7B-chatに適用する場合,導出モデルFoRAG-L-7BはWebGPT-175Bを3つの一般的なメトリクスで上回っている。
論文参考訳（メタデータ） (2024-06-19T19:06:36Z)
UniOQA: A Unified Framework for Knowledge Graph Question Answering with Large Language Models [4.627548680442906]
OwnThinkは、近年導入された中国の最も広範なオープンドメイン知識グラフである。質問応答のための2つの並列アプローチを統合する統合フレームワークであるUniOQAを紹介する。 UniOQAは特にSpCQL Logical Accuracyを21.2%に、Execution Accuracyを54.9%に向上させ、このベンチマークで新たな最先端結果を達成した。
論文参考訳（メタデータ） (2024-06-04T08:36:39Z)
Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文参考訳（メタデータ） (2024-03-21T13:52:30Z)
MinPrompt: Graph-based Minimal Prompt Data Augmentation for Few-shot Question Answering [64.6741991162092]
オープンドメイン質問応答のための最小限のデータ拡張フレームワークMinPromptを提案する。我々は、生テキストをグラフ構造に変換し、異なる事実文間の接続を構築する。次に、グラフアルゴリズムを適用して、原文のほとんどの情報をカバーするのに必要な最小限の文の集合を識別する。同定された文サブセットに基づいてQAペアを生成し、選択した文に基づいてモデルをトレーニングし、最終モデルを得る。
論文参考訳（メタデータ） (2023-10-08T04:44:36Z)
Adaptive Oracle-Efficient Online Learning [23.185655992407742]
オラクル効率のアルゴリズムは指数関数的に大きい決定空間を探索し、どのデータセットでも最善を尽くしたかを選択する。我々は、オラクル効率が良く、小さな環境に順応する、後続のリーダーアルゴリズムを設計するための新しいフレームワークを提供する。我々は、オンラインオークションや、近似可能性を保持するトランスダクティブオンライン分類を含む、現実世界の一連の設定を識別する。
論文参考訳（メタデータ） (2022-10-17T19:32:30Z)
RnG-KBQA: Generation Augmented Iterative Ranking for Knowledge Base Question Answering [57.94658176442027]
KBQAのランク・アンド・ジェネレートアプローチであるRnG-KBQAを提案する。我々はGrailQA と WebQSP データセット上で,最先端の新たな結果を得る。
論文参考訳（メタデータ） (2021-09-17T17:58:28Z)
Approximating Aggregated SQL Queries With LSTM Networks [31.528524004435933]
本稿では、近似クエリ処理(AQP)とも呼ばれるクエリ近似法を提案する。我々は、LSTMネットワークを用いて、クエリと結果の関係を学習し、クエリ結果を予測するための高速な推論層を提供する。提案手法では,1秒間に最大12万のクエリを予測でき,クエリのレイテンシは2ms以下であった。
論文参考訳（メタデータ） (2020-10-25T16:17:58Z)
Probabilistic Case-based Reasoning for Open-World Knowledge Graph Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文参考訳（メタデータ） (2020-10-07T17:48:12Z)
New Oracle-Efficient Algorithms for Private Synthetic Data Release [52.33506193761153]
微分プライベートな合成データを構築するための3つの新しいアルゴリズムを提案する。アルゴリズムは最悪の場合でも差分プライバシーを満たす。現状の手法である高次元行列機構 citeMcKennaMHM18 と比較すると,我々のアルゴリズムは大規模作業負荷の精度が向上する。
論文参考訳（メタデータ） (2020-07-10T15:46:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。