Fugu-MT 論文翻訳(概要): On SkipGram Word Embedding Models with Negative Sampling: Unified Framework and Impact of Noise Distributions

論文の概要: On SkipGram Word Embedding Models with Negative Sampling: Unified Framework and Impact of Noise Distributions

arxiv url: http://arxiv.org/abs/2009.04413v1
Date: Wed, 2 Sep 2020 02:11:51 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-22 18:17:25.247043
Title: On SkipGram Word Embedding Models with Negative Sampling: Unified Framework and Impact of Noise Distributions
Title（参考訳）: 負サンプリングによるSkipGram単語埋め込みモデルについて:統一フレームワークと雑音分布の影響
Authors: Ziqiao Wang, Yongyi Mao, Hongyu Guo, Richong Zhang
Abstract要約: 我々はワードコンテキスト分類(WCC)と呼ばれる単語埋め込みの枠組みを定式化する。 WCC埋め込みモデルの学習に及ぼす雑音分布の影響を実験的に検討した。既存のWCCモデルより優れている新しい埋め込みモデルをいくつか発見する。
参考スコア（独自算出の注目度）: 47.83593080349749
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: SkipGram word embedding models with negative sampling, or SGN in short, is an elegant family of word embedding models. In this paper, we formulate a framework for word embedding, referred to as Word-Context Classification (WCC), that generalizes SGN to a wide family of models. The framework, utilizing some "noise examples", is justified through a theoretical analysis. The impact of noise distribution on the learning of the WCC embedding models is studied experimentally, suggesting that the best noise distribution is in fact the data distribution, in terms of both the embedding performance and the speed of convergence during training. Along our way, we discover several novel embedding models that outperform the existing WCC models.
Abstract（参考訳）: skipgram word embedded model with negative sampling, 略してsgn)は、単語埋め込みモデルのエレガントなファミリーである。本稿では,SGNを多種多様なモデルに一般化する,ワードコンテキスト分類(Word-Context Classification, WCC)と呼ばれる単語埋め込みの枠組みを定式化する。いくつかの「ノイズ例」を活用するこのフレームワークは、理論的分析によって正当化される。 WCC埋込みモデルの学習に及ぼすノイズ分布の影響を実験的に検討し, 組込み性能と学習時の収束速度の両面から, 最高のノイズ分布は実際にデータ分布であることが示唆された。その過程で,既存のwccモデルに匹敵する新たな埋め込みモデルがいくつか発見される。

関連論文リスト

Evaluating Robustness of Vision-Language Models Under Noisy Conditions [0.0176290054713643]
VLM(Vision-Language Models)は、画像キャプションや視覚的質問応答といったマルチモーダルタスクにおいて、例外的な成功を収めている。制御摂動下での複数の最先端VLMの性能を評価するための総合評価フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-15T22:31:21Z)
Learning Counterfactually Decoupled Attention for Open-World Model Attribution [75.52873383916672]
本稿では,オープンワールドモデル帰属のためのCDAL法を提案する。我々の手法は、特に目に見えない新規攻撃に対して、最先端のモデルを大きなマージンで継続的に改善する。
論文参考訳（メタデータ） (2025-06-29T03:25:45Z)
Diffusion models under low-noise regime [3.729242965449096]
拡散モデルは, 汚損レベルが小さい場合に有効であることを示す。トレーニングセットのサイズ,データ幾何,および客観選択形状のモデル化方法の定量化を行う。この研究は、実用的なアプリケーションにおける生成モデルの信頼性に対する理解のギャップに対処し始めます。
論文参考訳（メタデータ） (2025-06-09T15:07:16Z)
Supervised Score-Based Modeling by Gradient Boosting [49.556736252628745]
本稿では,スコアマッチングを組み合わせた勾配向上アルゴリズムとして,SSM(Supervised Score-based Model)を提案する。推測時間と予測精度のバランスをとるため,SSMの学習とサンプリングに関する理論的解析を行った。我々のモデルは、精度と推測時間の両方で既存のモデルより優れています。
論文参考訳（メタデータ） (2024-11-02T07:06:53Z)
Explaining word embeddings with perfect fidelity: Case study in research impact prediction [0.0]
本稿では,単語埋め込みに基づいて学習したロジスティック回帰に基づく分類モデルに対して,新たな特徴重要度手法である自己モデルRated Entities(SMER)を提案する。 SMERは理論上、説明されたモデルに完全に忠実である。 SMERはLIME,SHAP,Global Tree surrogatesよりもよく説明できることを示した。
論文参考訳（メタデータ） (2024-09-24T09:28:24Z)
High-Performance Few-Shot Segmentation with Foundation Models: An Empirical Study [64.06777376676513]
基礎モデルに基づく数ショットセグメンテーション(FSS)フレームワークを開発した。具体的には、基礎モデルから暗黙的な知識を抽出し、粗い対応を構築するための簡単なアプローチを提案する。 2つの広く使われているデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2024-09-10T08:04:11Z)
An Interpretable Evaluation of Entropy-based Novelty of Generative Models [36.29214321258605]
生成モデルのモードベースノベルティを定量化するために,カーネルベースのエントロピーノベルティ(KEN)スコアを提案する。合成および実画像データセットの数値計算結果から,新しいモードの検出におけるフレームワークの有効性を示す。
論文参考訳（メタデータ） (2024-02-27T08:00:52Z)
Syntactically Robust Training on Partially-Observed Data for Open Information Extraction [25.59133746149343]
オープン情報抽出モデルは十分な監督力を持った有望な結果を示している。そこで本研究では,統語論的に頑健な学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-01-17T12:39:13Z)
On the Compositional Generalization Gap of In-Context Learning [73.09193595292233]
In-distriion (ID) と Out-of-distriion (OOD) の相違について考察する。我々は,3つの意味解析データセットを用いて,OPT,BLOOM,CodeGen,Codexの4つのモデルファミリを評価する。
論文参考訳（メタデータ） (2022-11-15T19:56:37Z)
Few-shot Text Classification with Dual Contrastive Consistency [31.141350717029358]
本稿では,事前学習した言語モデルを用いて,数ショットのテキスト分類を行う方法について検討する。ラベル付きデータが少ない場合の教師付きコントラスト学習と、ラベルなしデータの一貫性と規則化を採用する。
論文参考訳（メタデータ） (2022-09-29T19:26:23Z)
On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文参考訳（メタデータ） (2022-06-09T17:12:32Z)
Stochastic Aggregation in Graph Neural Networks [9.551282469099887]
グラフニューラルネットワーク(GNN)は、過スムージングおよび限られた電力識別を含む病理を発現する。 GNNsにおける集約のための統合フレームワーク(STAG)を提案する。そこでは、近隣からの集約プロセスにノイズが(適応的に)注入され、ノード埋め込みを形成する。
論文参考訳（メタデータ） (2021-02-25T02:52:03Z)
Explaining and Improving Model Behavior with k Nearest Neighbor Representations [107.24850861390196]
モデルの予測に責任のあるトレーニング例を特定するために, k 近傍表現を提案する。我々は,kNN表現が学習した素因関係を明らかにするのに有効であることを示す。以上の結果から,kNN手法により,直交モデルが逆入力に対してより堅牢であることが示唆された。
論文参考訳（メタデータ） (2020-10-18T16:55:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。