論文の概要: Scalable variable selection for two-view learning tasks with projection
operators
- arxiv url: http://arxiv.org/abs/2307.01558v1
- Date: Tue, 4 Jul 2023 08:22:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 17:48:35.934479
- Title: Scalable variable selection for two-view learning tasks with projection
operators
- Title(参考訳): プロジェクション演算子を用いた2視点学習タスクのスケーラブル変数選択
- Authors: Sandor Szedmak (1), Riikka Huusari (1), Tat Hong Duong Le (1), Juho
Rousu (1) ((1) Department of Computer Science, Aalto University, Espoo,
Finland)
- Abstract要約: 本稿では,2視点設定やベクトル値による教師付き学習問題に対して,新しい変数選択法を提案する。
当社のフレームワークは,データサンプルの数が数百万にものぼる,非常に大規模な選択タスクを処理できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper we propose a novel variable selection method for two-view
settings, or for vector-valued supervised learning problems. Our framework is
able to handle extremely large scale selection tasks, where number of data
samples could be even millions. In a nutshell, our method performs variable
selection by iteratively selecting variables that are highly correlated with
the output variables, but which are not correlated with the previously chosen
variables. To measure the correlation, our method uses the concept of
projection operators and their algebra. With the projection operators the
relationship, correlation, between sets of input and output variables can also
be expressed by kernel functions, thus nonlinear correlation models can be
exploited as well. We experimentally validate our approach, showing on both
synthetic and real data its scalability and the relevance of the selected
features. Keywords: Supervised variable selection, vector-valued learning,
projection-valued measure, reproducing kernel Hilbert space
- Abstract(参考訳): 本稿では,2視点設定,あるいはベクトル値教師付き学習問題に対する新しい変数選択法を提案する。
当社のフレームワークは,データサンプルの数が数百万にものぼる,非常に大規模な選択タスクを処理できる。
本手法は,出力変数と高い相関性を持つ変数を反復的に選択することで変数選択を行うが,従来選択されていた変数と相関性はない。
相関を測るために,提案手法は射影作用素とその代数の概念を用いる。
投影演算子では、入力変数と出力変数のセットの間の相関関係もカーネル関数によって表現できるため、非線形相関モデルも活用できる。
提案手法を実験的に検証し,合成データと実データの両方において,そのスケーラビリティと特徴の関連性を示す。
キーワード:教師付き変数選択、ベクトル値学習、投影値測度、カーネルヒルベルト空間
関連論文リスト
- Data-driven path collective variables [0.0]
本稿では,集合変数の生成,最適化,比較のための新しい手法を提案する。
結果として得られる集合変数は1次元、解釈可能、微分可能である。
2つの異なるアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2023-12-21T14:07:47Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - DiscoVars: A New Data Analysis Perspective -- Application in Variable
Selection for Clustering [0.0]
基礎となる学習課題によらず,変数の重要度を決定するために,新しいデータ分析視点を提案する。
本稿では,データから重要な変数を選択するための新しい手法を提案する。
ユーザフレンドリーなインターフェース開発環境であるShinyアプリとして,当社のツールを紹介します。
論文 参考訳(メタデータ) (2023-04-08T10:57:19Z) - Multi-Task Learning for Sparsity Pattern Heterogeneity: A Discrete
Optimization Approach [5.757286797214176]
最適サブセット選択を線形マルチタスク学習(MTL)に拡張する
本稿では,タスク間の情報共有を支援するMLLのモデリングフレームワークを提案する。
提案手法は,変数選択および予測精度において,他のスパースMTL法よりも優れている。
論文 参考訳(メタデータ) (2022-12-16T19:52:25Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - VarCLR: Variable Semantic Representation Pre-training via Contrastive
Learning [84.70916463298109]
VarCLRは変数名のセマンティック表現を学ぶための新しいアプローチである。
VarCLRはコントラスト学習に適しており、明示的に類似した入力間の距離を最小化することを目的としている。
VarCLRはBERTのような洗練された汎用言語モデルを効果的に適用できることを示す。
論文 参考訳(メタデータ) (2021-12-05T18:40:32Z) - A Two-Stage Variable Selection Approach for Correlated High Dimensional
Predictors [4.8128078741263725]
本稿では,グループ変数選択問題に対して,変数クラスタリングステージとグループ変数ステージを組み合わせた2段階アプローチを提案する。
変数クラスタリングステージは、データからの情報を使用してグループ構造を見つけ、既存のグループ変数選択メソッドのパフォーマンスを向上させる。
この2段階法は, 予測精度, アクティブな予測器の選択精度において, より優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-24T17:28:34Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z) - Visual Neural Decomposition to Explain Multivariate Data Sets [13.117139248511783]
多次元データセットにおける変数間の関係を調べることは、データアナリストとエンジニアにとって共通の課題である。
本稿では,入力変数と対象変数との相関関係を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-09-11T15:53:37Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z) - Parameter Space Factorization for Zero-Shot Learning across Tasks and
Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。
タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。
我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文 参考訳(メタデータ) (2020-01-30T16:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。