論文の概要: FLARE: Task-agnostic embedding model evaluation through a normalization process
- arxiv url: http://arxiv.org/abs/2604.17344v1
- Date: Sun, 19 Apr 2026 09:31:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.477683
- Title: FLARE: Task-agnostic embedding model evaluation through a normalization process
- Title(参考訳): FLARE: 正規化プロセスによるタスク非依存埋め込みモデルの評価
- Authors: Jingzhou Jiang, Yixuan Tang, Yi Yang, Kar Yan Tam,
- Abstract要約: フローベースラベルレス表現埋め込み評価(FLARE)
11のデータセットと8の埋め込み器で、FLAREは監督ベンチマークでSpearmanの0.90ドルに達した。
- 参考スコア(独自算出の注目度): 11.999388314465191
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When task-specific labels are not available, it becomes difficult to select an embedding model for a specific target corpus. Existing labelless measures based on kernel estimators or Gaussian mixes fail in high-dimensional space, resulting in unstable rankings. We propose a flow-based labelless representation embedding evaluation (FLARE), which utilizes normalized streams to estimate information sufficiency directly from log-likelihood and avoid distance-based density estimation. We give a finite sample boundary, indicating that the estimation error depends on the intrinsic dimension of the data manifold rather than the original embedding dimension. On 11 datasets and 8 embedders, FLARE reached Spearman's $ρ$ of 0.90 under the supervised benchmark and remained stable in high-dimensional embeddings ($d \geq 3{,}584$) as the existing labelless baseline collapsed.
- Abstract(参考訳): タスク固有のラベルが利用できない場合、特定のターゲットコーパスに対する埋め込みモデルを選択することは困難になる。
既存のカーネル推定器やガウス混合に基づくラベルなし測度は高次元空間で失敗し、不安定なランク付けをもたらす。
本研究では,フローベースラベルレス表現埋め込み評価 (FLARE) を提案する。
有限標本境界を与え、推定誤差が元の埋め込み次元ではなく、データ多様体の内在次元に依存することを示す。
11のデータセットと8の埋め込み器で、FLAREは監督されたベンチマークでSpearmanの0.90$に到達し、既存のラベルなしベースラインが崩壊すると、高次元の埋め込み(d \geq 3{,}584$)で安定していた。
関連論文リスト
- SELFDOUBT: Uncertainty Quantification for Reasoning LLMs via the Hedge-to-Verify Ratio [0.038379177968040606]
言語モデル推論のための単一パス不確実性フレームワークであるSELFDOUBTを提案する。
私たちのキーシグナルであるHedge-to-Verify Ratio(HVR)は、推論トレースが不確実性マーカーを含むかどうかを検出し、もしそうであれば、明示的な自己チェック行動によってオフセットされているかどうかを検出する。
SELFDOUBTは単一の観測された推論軌道で動作し、任意のプロプライエタリなAPI上でのレイテンシとコスト制約によるデプロイメントに適している。
論文 参考訳(メタデータ) (2026-04-07T19:19:29Z) - OASIS-DC: Generalizable Depth Completion via Output-level Alignment of Sparse-Integrated Monocular Pseudo Depth [1.4896509623302834]
最近の基礎モデルはゼロショット深度推定で優れているが、その出力はメートル法よりも本質的に相対的である。
比較的深度が大域的なレイアウトや境界を保っているという事実を活用し, 疎範囲測定で校正する。
精度の低いラベル付きサンプルから精度の高い測定値の予測が可能となるように,事前の信頼性に追従する改良ネットワークを設計する。
論文 参考訳(メタデータ) (2026-02-01T14:57:33Z) - Model Evaluation in the Dark: Robust Classifier Metrics with Missing Labels [2.384873896423002]
本稿では,精度,リコール,ROC-AUCなどの指標を用いて分類器の評価を行うための多重計算手法を提案する。
予測分布の位置と形状が一般的に正しいことを実証的に示す。
論文 参考訳(メタデータ) (2025-04-25T14:31:42Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Score Matching for Truncated Density Estimation on a Manifold [6.53626518989653]
近年, トラッピング密度推定にスコアマッチングを用いる方法が提案されている。
我々は、境界を持つリーマン多様体に一致するトランカットされたスコアの新たな拡張を示す。
シミュレーションデータ実験において、スコアマッチング推定器は真のパラメータ値を低い推定誤差で近似することができる。
論文 参考訳(メタデータ) (2022-06-29T14:14:49Z) - Evaluating State-of-the-Art Classification Models Against Bayes
Optimality [106.50867011164584]
正規化フローを用いて学習した生成モデルのベイズ誤差を正確に計算できることを示す。
われわれの手法を用いて、最先端の分類モデルについて徹底的な調査を行う。
論文 参考訳(メタデータ) (2021-06-07T06:21:20Z) - Localization Uncertainty Estimation for Anchor-Free Object Detection [48.931731695431374]
アンカーベース物体検出のための既存の不確実性推定手法にはいくつかの制限がある。
アンカーフリー物体検出のためのUADと呼ばれる新しい位置推定不確実性推定手法を提案する。
本手法は,ボックスオフセットの4方向の不確かさを均一に捉え,どの方向が不確実であるかを判断する。
論文 参考訳(メタデータ) (2020-06-28T13:49:30Z) - Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。
我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文 参考訳(メタデータ) (2020-03-04T12:27:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。