論文の概要: On the Replicability of Combining Word Embeddings and Retrieval Models
- arxiv url: http://arxiv.org/abs/2001.04484v1
- Date: Mon, 13 Jan 2020 19:01:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 22:48:38.492771
- Title: On the Replicability of Combining Word Embeddings and Retrieval Models
- Title(参考訳): 単語埋め込みと検索モデルの組み合わせの再現性について
- Authors: Luca Papariello, Alexandros Bampoulidis, Mihai Lupu
- Abstract要約: 我々は、Fisherカーネルフレームワークの使用に関する魅力的な仮説を実証しようとする最近の実験を再現する。
具体的には、von Mises-Fisher (VMF) 分布の混合モデルを使用することは、VMF とベクトル空間モデルの両方の余弦距離に焦点をあてることによって有益である。
- 参考スコア(独自算出の注目度): 71.18271398274513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We replicate recent experiments attempting to demonstrate an attractive
hypothesis about the use of the Fisher kernel framework and mixture models for
aggregating word embeddings towards document representations and the use of
these representations in document classification, clustering, and retrieval.
Specifically, the hypothesis was that the use of a mixture model of von
Mises-Fisher (VMF) distributions instead of Gaussian distributions would be
beneficial because of the focus on cosine distances of both VMF and the vector
space model traditionally used in information retrieval. Previous experiments
had validated this hypothesis. Our replication was not able to validate it,
despite a large parameter scan space.
- Abstract(参考訳): 我々は最近の実験を再現し、文書表現への単語埋め込みと文書分類、クラスタリング、検索におけるこれらの表現の使用に対するFisherカーネルフレームワークと混合モデルの使用に関する魅力的な仮説を実証した。
具体的には、ガウス分布の代わりにvon Mises-Fisher(VMF)分布の混合モデルを使用することは、情報検索に伝統的に用いられてきたVMFとベクトル空間モデルの両方の余弦距離に焦点をあてることによって有益である。
以前の実験でこの仮説が検証された。
パラメータの広いスキャン空間にもかかわらず、我々のレプリケーションはそれを検証できなかった。
関連論文リスト
- Theoretical Insights for Diffusion Guidance: A Case Study for Gaussian
Mixture Models [59.331993845831946]
拡散モデルは、所望の特性に向けてサンプル生成を操るために、スコア関数にタスク固有の情報を注入することの恩恵を受ける。
本稿では,ガウス混合モデルの文脈における拡散モデルに対する誘導の影響を理解するための最初の理論的研究を提供する。
論文 参考訳(メタデータ) (2024-03-03T23:15:48Z) - Projection Regret: Reducing Background Bias for Novelty Detection via
Diffusion Models [72.07462371883501]
本研究では,非意味情報のバイアスを緩和する効率的な新規性検出手法であるemphProjection Regret(PR)を提案する。
PRは、テスト画像とその拡散ベースの投影の間の知覚距離を計算し、異常を検出する。
拡張実験により、PRは生成モデルに基づく新規性検出手法の先行技術よりも有意なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-12-05T09:44:47Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Intervention Generalization: A View from Factor Graph Models [7.117681268784223]
操作されたシステムの分布の因子化に関する最小限の仮定に基づいて、過去の実験から新しい条件への飛躍をいかに保証するかを詳しく検討する。
仮定された$textitinterventional Factor Model$ (IFM) は必ずしも情報であるとは限らないが、不測のコンバウンディングとフィードバックのメカニズムを明示的にモデル化する必要性を便利に抽象化する。
論文 参考訳(メタデータ) (2023-06-06T21:44:23Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Mixture of von Mises-Fisher distribution with sparse prototypes [0.0]
von Mises-Fisher分布の混合は、単位超球面上のデータをクラスタリングするのに使うことができる。
本稿では,l1のペナル化確率を用いてフォン・ミーゼス混合物を推定する。
論文 参考訳(メタデータ) (2022-12-30T08:00:38Z) - Geometric Priors for Scientific Generative Models in Inertial
Confinement Fusion [32.1427322437781]
We developed a Wasserstein autoencoder (WAE) with a hyperspherical prior for multimodal data。
我々は,データセットのモーダル性間の既知の関係を科学的制約として利用し,提案モデルの異なる特性について検討する。
論文 参考訳(メタデータ) (2021-11-24T21:06:36Z) - Variational Capsule Encoder [6.244396213953519]
我々はベイジアンカプセル(B-Caps)と呼ばれる新しいカプセルネットワークに基づく変分エンコーダアーキテクチャを提案する。
このアプローチは、従来のアプローチよりも潜在領域における機能のより優れた表現を学習できる、という仮説を立てた。
この結果から,VAE設定下では検討されていない表現学習におけるカプセルネットワークの強みが示唆された。
論文 参考訳(メタデータ) (2020-10-18T20:52:16Z) - Generative Model without Prior Distribution Matching [26.91643368299913]
変分オートエンコーダ(VAE)とその変分は、いくつかの先行分布を満たすために低次元の潜在表現を学習することによって古典的な生成モデルである。
我々は、先行変数に適合させるのではなく、先行変数が埋め込み分布と一致するように提案する。
論文 参考訳(メタデータ) (2020-09-23T09:33:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。