論文の概要: Fast LLM-Based Semantic Filtering: From a Unified Framework to an Adaptive Two-Phase Method
- arxiv url: http://arxiv.org/abs/2606.08090v1
- Date: Sat, 06 Jun 2026 10:32:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.771015
- Title: Fast LLM-Based Semantic Filtering: From a Unified Framework to an Adaptive Two-Phase Method
- Title(参考訳): 高速LLMに基づくセマンティックフィルタ:統一フレームワークから適応2相法へ
- Authors: Kyoungmin Kim, Martin Catheland, Anastasia Ailamaki,
- Abstract要約: 精度目標の下で文書コーパス上で自然言語のye/no述語を評価することは、LLMベースのデータ処理の基盤となる。
すべてのドキュメント(オラクル)で LLM を呼び出すことは禁じられているので、カスケードはオラクルと高速なプロキシをペアにします。
私たちは、クエリレベルの困難コンパス、最小のオラクル上の低いバウンドは、プロキシベースのカスケードが作成可能な任意のプロキシベースのカスケード、プロキシのソフトトレーニングラベルの3つの目的のために、初めて、ドキュメントごとの信頼性を使用する。
- 参考スコア(独自算出の注目度): 4.977982322940808
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Evaluating a natural-language yes/no predicate over a document corpus under an accuracy target - the semantic filter - is a cornerstone of LLM-based data processing. Calling the LLM on every document (the oracle) is prohibitive, so cascades pair the oracle with a fast proxy. As deployed today, they leave four limitations on the table. (1) Each cascade family - model-free clustering, prebuilt small-LLM proxies, online-trained proxies - commits to a single representation and pipeline, and wins on only a narrow query regime. (2) The strongest online proxy invests in a custom training scheme on a bi-encoder over dense embeddings, missing the token-level evidence richer predicates require. (3) The proxy is trained against binary yes/no labels, wasting the LLM's per-document confidence at the boundary documents it most needs to learn. (4) Existing calibrations add a uniform safety margin, conflating genuine proxy uncertainty with small-sample noise and inflating cascade cost. We address these by (1) composing families adaptively - model-free clustering first, online proxy only when needed, with oracle calls shared across phases; (2) replacing the cosine bi-encoder with a hybrid of off-the-shelf token-aware models; (3) training the proxy with the oracle's per-document confidence as a soft label; and (4) a calibration that adds the safety margin only where the labeled sample is sparse. We are also the first to use the oracle's per-document confidence for three purposes: a query-level difficulty compass, a lower bound on the minimum oracle calls any proxy-based cascade can make, and the proxy's soft training label. At a 90% accuracy target on three 10K-document corpora, our methods are 1.6-2.0x faster than the best prior method per corpus and meet the target on 95% of queries; the BER-derived lower bound indicates a further ~4-20x of headroom for future work.
- Abstract(参考訳): 精度の高いターゲットであるセマンティックフィルタの下で、文書コーパス上の自然言語のye/no述語を評価することは、LLMベースのデータ処理の基盤となる。
すべてのドキュメント(オラクル)で LLM を呼び出すことは禁じられているので、カスケードはオラクルと高速なプロキシをペアにします。
今日デプロイされるにつれて、彼らはテーブルに4つの制限を残します。
1) 各カスケードファミリー - モデルフリーのクラスタリング、ビルド済みの小さなLLMプロキシ、オンライントレーニングされたプロキシ - は、単一の表現とパイプラインにコミットし、狭いクエリシステムでのみ勝利する。
2)最強のオンラインプロキシは,濃密な埋め込みに関するバイエンコーダのカスタムトレーニングスキームに投資し,より豊かな述語が必要とするトークンレベルの証拠を欠いている。
(3) プロキシはバイナリの yes/noラベルに対してトレーニングされ、LLMのドキュメントごとの信頼性を最も学ぶ必要がある境界文書に無駄にします。
(4) 既存のキャリブレーションは、均一な安全マージンを付加し、真のプロキシの不確実性を小さなサンプルノイズと混同し、カスケードコストを膨らませる。
1) モデルフリークラスタリング 第一に,必要な時にのみオンラインプロキシ,第2に,フェーズ間で共有される託主呼び出し,(2) コサインバイエンコーダを市販のトークン認識モデルのハイブリッドに置き換えること,(3) 文書ごとの信頼度をソフトラベルとして,(3) ラベル付きサンプルがスパースされた場所のみに,安全マージンを付加する校正を行うことによって,これらの課題に対処する。
クエリレベルのコンパス、最小限のオラクルのバウンダリがプロキシベースのカスケードを呼び出し、プロキシのソフトトレーニングラベルです。
3つの10K文書コーパスに対して90%の精度目標を達成し,提案手法は1コーパスあたりの最良メソッドよりも1.6-2.0倍高速であり,95%のクエリに対して目標を満たす。
関連論文リスト
- From Attack Simulation to SIEM Rule: Deterministic Detection-as-Code Synthesis with Probe-Level Traceability [51.56484100374058]
セキュリティチームは、自身のシステムに対する攻撃をシミュレートして、監視が真の侵入者を捕まえるかどうかをチェックする。
人間はそのギャップを手でブリッジし、それぞれの発見を読み、対応するシグマルールを書きます。
ロックされたコーパスからプローブが引き出されると,この変換が部分的に自動化されることを示す。
論文 参考訳(メタデータ) (2026-06-03T14:26:25Z) - HCRE: LLM-based Hierarchical Classification for Cross-Document Relation Extraction with a Prediction-then-Verification Strategy [54.91468501159335]
文書間関係抽出 (RE) は, 異なる文書に存在する頭部尾部エンティティ間の関係を識別することを目的としている。
本稿では,各レベルでの多視点検証により信頼性を向上させる推論戦略を提案する。
論文 参考訳(メタデータ) (2026-04-09T07:55:27Z) - $k$NNProxy: Efficient Training-Free Proxy Alignment for Black-Box Zero-Shot LLM-Generated Text Detection [19.213077720525696]
既存のLGT検出器は、学習ベースのアプローチとゼロショットメソッドの2つの幅広いクラスに分類される。
ゼロショット法の信頼性は、オフザシェルフプロキシLDMがしばしば未知のソースとよく一致しているという仮定に依存している。
トレーニング不要でクエリ効率のよいプロキシアライメントフレームワークである$k$-nearest neighbor proxy(k$NN Proxy)を提案する。
論文 参考訳(メタデータ) (2026-04-02T13:11:06Z) - A Reliability Evaluation of Hybrid Deterministic-LLM Based Approaches for Academic Course Registration PDF Information Extraction [0.0]
本研究では,KRS文書からの情報抽出手法の信頼性を3つの戦略を用いて評価した。
実験は、LCMベースのテストのための140の文書と、Camelotベースのパイプライン評価のための860の文書で実施された。
論文 参考訳(メタデータ) (2026-03-09T02:09:02Z) - A BERTology View of LLM Orchestrations: Token- and Layer-Selective Probes for Efficient Single-Pass Classification [2.0069888187253615]
生産LLMシステムは、安全と他の分類の重いステップのために、しばしば別々のモデルに依存している。
代わりに、私たちはLLMによって既に支払われた計算を再利用し、隠れた状態の軽量プローブを訓練し、生成に使用する同じ前方パスでラベルを予測する。
論文 参考訳(メタデータ) (2026-01-19T18:40:29Z) - Towards Small Language Models for Security Query Generation in SOC Workflows [2.773295737427326]
セキュリティ運用センターのアナリストは、Kusto Query Language(KQL)を使用して、大規模なテレメトリストリームを定期的にクエリする。
適切なKQLを書くには特別な専門知識が必要です。
本稿では,Small Language Models (SLM) が企業セキュリティのために,正確で費用対効果の高い自然言語-KQL翻訳を可能にするかどうかを検討する。
論文 参考訳(メタデータ) (2025-12-07T05:18:27Z) - ScaleDoc: Scaling LLM-based Predicates over Large Document Collections [17.985997510845873]
現代のワークロードでは、意味的理解を必要とする非構造化ドキュメントがますます多く含まれている。
textscScaleDocは、述語実行をオフライン表現フェーズと最適化されたオンラインフィルタリングフェーズに分離することで、この問題に対処する新しいシステムである。
textscScaleDocは2$times$のエンドツーエンドのスピードアップを実現し、高価なLCM呼び出しを最大85%削減し、大規模なセマンティック分析を実用的かつ効率的にする。
論文 参考訳(メタデータ) (2025-09-16T03:18:06Z) - Document Attribution: Examining Citation Relationships using Large Language Models [62.46146670035751]
そこで本研究では,帰属を簡単なテキスト・エンタテインメント・タスクとみなすゼロショット・アプローチを提案する。
また,アトリビューションプロセスの強化におけるアテンションメカニズムの役割についても検討する。
論文 参考訳(メタデータ) (2025-05-09T04:40:11Z) - Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z) - Optimizing Server-side Aggregation For Robust Federated Learning via
Subspace Training [80.03567604524268]
クライアント間の非IIDデータ分散と中毒攻撃は、現実世界のフェデレーション学習システムにおける2つの大きな課題である。
サーバ側集約プロセスを最適化する汎用的なアプローチであるSmartFLを提案する。
本稿では,SmartFLの収束と一般化能力に関する理論的解析を行う。
論文 参考訳(メタデータ) (2022-11-10T13:20:56Z) - Fewer is More: A Deep Graph Metric Learning Perspective Using Fewer
Proxies [65.92826041406802]
本稿では,グラフ分類の観点から,プロキシベースのディープグラフメトリックラーニング手法を提案する。
複数のグローバルプロキシを利用して、各クラスの元のデータポイントを総括的に近似する。
本研究では, 近接関係を接地トラス・ラベルに従って調整する, 新たな逆ラベル伝搬アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-10-26T14:52:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。