論文の概要: BELT: Blockwise Missing Embedding Learning Transfomer
- arxiv url: http://arxiv.org/abs/2105.10360v1
- Date: Fri, 21 May 2021 13:55:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 03:30:11.863216
- Title: BELT: Blockwise Missing Embedding Learning Transfomer
- Title(参考訳): BELT: 埋め込み学習トランスフォーマーのブロックワイズ
- Authors: Doudou Zhou, and Tianxi Cai, and Junwei Lu
- Abstract要約: 本稿では,行単位/列単位の欠落を扱うために,ブロックワイドなbf埋め込みbf学習bf変換器(BELT)を提案する。
具体的には,複数の音源から各行列が重なり合う場合の行列回復を効率的に行う手法を提案する。
- 参考スコア(独自算出の注目度): 9.341699514447113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Matrix completion has attracted a lot of attention in many fields including
statistics, applied mathematics and electrical engineering. Most of works focus
on the independent sampling models under which the individual observed entries
are sampled independently. Motivated by applications in the integration of
multiple (point-wise mutual information) PMI matrices, we propose the model
{\bf B}lockwise missing {\bf E}mbedding {\bf L}earning {\bf T}ransformer (BELT)
to treat row-wise/column-wise missingness. Specifically, our proposed method
aims at efficient matrix recovery when every pair of matrices from multiple
sources has an overlap. We provide theoretical justification for the proposed
BELT method. Simulation studies show that the method performs well in finite
sample under a variety of configurations. The method is applied to integrate
several PMI matrices built by EHR data and Chinese medical text data, which
enables us to construct a comprehensive embedding set for CUI and Chinese with
high quality.
- Abstract(参考訳): マトリックスの完成は統計学、応用数学、電気工学など多くの分野で注目を集めている。
ほとんどの作品は、個々の観察されたエントリが独立にサンプリングされる独立したサンプリングモデルに焦点を当てている。
複数(ポイントワイドな相互情報)PMI行列の統合への応用により、行ワイド/カラムワイドの欠如を扱うためのモデル {\bf B}lockwise missing {\bf E}mbedding {\bf L}earning {\bf T}ransformer (BELT)を提案する。
具体的には,複数の音源から各行列が重なり合う場合の行列回復を効率的に行う手法を提案する。
提案手法の理論的正当性について述べる。
シミュレーション研究によれば、この手法は有限サンプルでも様々な構成でうまく機能する。
EHRデータと中国の医療用テキストデータによって構築された複数のPMI行列を統合するために本手法を適用し,CUIと中国語の総合的な埋め込みセットを高品質に構築する。
関連論文リスト
- Optimal Estimation of Shared Singular Subspaces across Multiple Noisy Matrices [3.3373545585860596]
本研究は,低ランク行列デノジングフレームワークにおいて,複数の行列にまたがる共有(左)特異部分空間を推定することに焦点を当てる。
信号行列の真の特異部分空間が同一である場合、Stack-SVDは最小の最大速度最適化を実現する。
部分的共有の様々なケースにおいて、Stack-SVDが有効であり続ける条件を厳格に特徴付け、最小限の最適性を達成したり、一貫した見積もりを達成できなかったりする。
論文 参考訳(メタデータ) (2024-11-26T02:49:30Z) - Align$^2$LLaVA: Cascaded Human and Large Language Model Preference Alignment for Multi-modal Instruction Curation [56.75665429851673]
本稿では,人間とLLMの選好アライメントという2つのユニークな視点から導いた,新しい命令キュレーションアルゴリズムを提案する。
実験により,合成マルチモーダル命令を最大90%圧縮することにより,モデル性能の維持や改善が可能であることが示された。
論文 参考訳(メタデータ) (2024-09-27T08:20:59Z) - Empirical Bayes Linked Matrix Decomposition [0.0]
この問題に対する経験的変分ベイズ的アプローチを提案する。
単一行列文脈において新規な反復的計算手法について述べる。
提案手法は,下層の低ランク信号の回復に関して,異なるシナリオ下で非常によく機能することを示す。
論文 参考訳(メタデータ) (2024-08-01T02:13:11Z) - Enhanced Latent Multi-view Subspace Clustering [25.343388834470247]
潜在空間表現を復元するための拡張潜在多視点サブスペースクラスタリング(ELMSC)手法を提案する。
提案するELMSCは,最先端のマルチビュークラスタリング手法よりも高いクラスタリング性能を実現することができる。
論文 参考訳(メタデータ) (2023-12-22T15:28:55Z) - Spectral Entry-wise Matrix Estimation for Low-Rank Reinforcement
Learning [53.445068584013896]
低ランク構造を持つ強化学習(RL)における行列推定問題について検討した。
低ランク帯では、回収される行列は期待される腕の報酬を指定し、低ランクマルコフ決定プロセス(MDP)では、例えばMDPの遷移カーネルを特徴付ける。
簡単なスペクトルベースの行列推定手法は,行列の特異部分空間を効率よく復元し,ほぼ最小の入力誤差を示すことを示す。
論文 参考訳(メタデータ) (2023-10-10T17:06:41Z) - Large-scale gradient-based training of Mixtures of Factor Analyzers [67.21722742907981]
本稿では,勾配降下による高次元学習を効果的に行うための理論解析と新しい手法の両立に寄与する。
MFAトレーニングと推論/サンプリングは,学習終了後の行列逆変換を必要としない精度行列に基づいて行うことができることを示す。
理論解析と行列の他に,SVHNやMNISTなどの画像データセットにMFAを適用し,サンプル生成と外乱検出を行う能力を示す。
論文 参考訳(メタデータ) (2023-08-26T06:12:33Z) - Multi-modal Multi-view Clustering based on Non-negative Matrix
Factorization [0.0]
本稿では,マルチモーダルクラスタリングアルゴリズムについて検討し,マルチモーダル・マルチビュー非負行列分解法を提案する。
実験の結果,様々なデータセットを用いて評価した提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-08-09T08:06:03Z) - MinT: Boosting Generalization in Mathematical Reasoning via Multi-View
Fine-Tuning [53.90744622542961]
数学領域における推論は、小言語モデル(LM)にとって重要な課題である。
多様なアノテーションスタイルで既存の数学的問題データセットを利用する新しい手法を提案する。
実験結果から,LLaMA-7Bモデルが先行手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-16T05:41:53Z) - Multi-view Data Visualisation via Manifold Learning [0.03222802562733786]
本論文は, 学生のT分散SNE, LLE, ISOMAPの拡張を提案し, 多視点データの次元的縮小と可視化を可能にする。
マルチビューマニホールド学習手法で得られた低次元埋め込みをK平均アルゴリズムに組み込むことにより、サンプルのクラスタを正確に特定できることを示した。
論文 参考訳(メタデータ) (2021-01-17T19:54:36Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Federated Multi-view Matrix Factorization for Personalized
Recommendations [53.74747022749739]
本稿では,フェデレートされた学習フレームワークを,複数のデータソースを用いた行列分解に拡張する,フェデレートされたマルチビュー行列分解手法を提案する。
本手法では,ユーザの個人情報を中央サーバに転送することなく,マルチビューモデルを学習することができる。
論文 参考訳(メタデータ) (2020-04-08T21:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。