論文の概要: Contrastive estimation reveals topic posterior information to linear
models
- arxiv url: http://arxiv.org/abs/2003.02234v1
- Date: Wed, 4 Mar 2020 18:20:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 12:33:38.485811
- Title: Contrastive estimation reveals topic posterior information to linear
models
- Title(参考訳): 対比的推定は、話題の後方情報を線形モデルに示す
- Authors: Christopher Tosh and Akshay Krishnamurthy and Daniel Hsu
- Abstract要約: コントラスト学習(Contrastive Learning)は、自然に発生する類似データと異なるデータポイントのペアを利用して、データに有用な埋め込みを見つけるための表現学習のアプローチである。
比較学習は、その基礎となるトピック後続情報を線形モデルに示す文書の表現を復元できることを示す。
- 参考スコア(独自算出の注目度): 38.80336134485453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contrastive learning is an approach to representation learning that utilizes
naturally occurring similar and dissimilar pairs of data points to find useful
embeddings of data. In the context of document classification under topic
modeling assumptions, we prove that contrastive learning is capable of
recovering a representation of documents that reveals their underlying topic
posterior information to linear models. We apply this procedure in a
semi-supervised setup and demonstrate empirically that linear classifiers with
these representations perform well in document classification tasks with very
few training examples.
- Abstract(参考訳): コントラスト学習(Contrastive Learning)は、自然に発生する類似データと異なるデータポイントのペアを利用して、データに有用な埋め込みを見つけるための表現学習のアプローチである。
トピックモデリングの前提下での文書分類の文脈において、コントラスト学習は、その基礎となるトピック後続情報を線形モデルに示す文書の表現を復元できることを示す。
この手順を半教師付きで適用し, 訓練例の少ない文書分類タスクにおいて, これらの表現を用いた線形分類器が有効であることを示す。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Contextualizing the Limits of Model & Evaluation Dataset Curation on
Semantic Similarity Classification Tasks [1.8130068086063336]
本稿では,事前学習されたモデルとオープン評価データセットの制限が,バイナリ意味類似性分類タスクの性能評価にどう影響するかを示す。
1)これらのデータセットのキュレーションや事前学習したモデルトレーニング体制のエンドユーザー向けドキュメンテーションは容易にはアクセスできないことが多く,(2)現実の文脈でそのようなシステムを迅速に展開するための低摩擦と高需要を考えると,本研究では,データセット間の性能格差,埋め込み技術,距離測定値などを示す先行作業を強化する。
論文 参考訳(メタデータ) (2023-11-03T17:12:07Z) - Learning ECG signal features without backpropagation [0.0]
時系列型データの表現を生成する新しい手法を提案する。
この方法は理論物理学の考えに頼り、データ駆動方式でコンパクトな表現を構築する。
本稿では,ECG信号分類の課題に対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2023-07-04T21:35:49Z) - Estimating class separability of text embeddings with persistent homology [1.9956517534421363]
本稿では、トポロジ的観点からテキストデータセットのクラス分離性を推定する教師なし手法を提案する。
本手法を応用して, 組込みの分離性向上を図り, トレーニングプロセスが停止した場合の検知方法について述べる。
その結果,本手法のクラス分離性の推定値と教師付き手法のクラス分離性の推定値が一致していることが示唆された。
論文 参考訳(メタデータ) (2023-05-24T10:58:09Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - VLCDoC: Vision-Language Contrastive Pre-Training Model for Cross-Modal
Document Classification [3.7798600249187295]
文書データからのマルチモーダル学習は、前もって意味論的に意味のある機能を学習可能な下流タスクに事前学習可能にすることで、近年大きな成功を収めている。
本稿では,言語と視覚の手がかりを通したクロスモーダル表現の学習により,文書分類問題にアプローチする。
提案手法は,ハイレベルなインタラクションを利用して,モダリティ内外における効果的な注意の流れから関連する意味情報を学習する。
論文 参考訳(メタデータ) (2022-05-24T12:28:12Z) - Layer-wise Analysis of a Self-supervised Speech Representation Model [26.727775920272205]
自己教師付き学習アプローチは、音声表現モデルの事前学習に成功している。
事前訓練された表現そのものに符号化された情報のタイプや範囲についてはあまり研究されていない。
論文 参考訳(メタデータ) (2021-07-10T02:13:25Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。