論文の概要: Kan Extensions in Data Science and Machine Learning
- arxiv url: http://arxiv.org/abs/2203.09018v1
- Date: Thu, 17 Mar 2022 01:31:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-19 05:38:25.763356
- Title: Kan Extensions in Data Science and Machine Learning
- Title(参考訳): データサイエンスと機械学習におけるカン拡張
- Authors: Dan Shiebler
- Abstract要約: カン拡大はこの概念を一般化する圏論において強力な道具である。
ラベルからクラスタリングアルゴリズムを学習する手順を導出し、実データ上でこの手順の性能を探索する。
次に、ラベル付き例のデータセットから関数への一般的なマッピングを学習するために、Kan拡張をどのように利用できるかを検討する。
- 参考スコア(独自算出の注目度): 1.14219428942199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A common problem in data science is "use this function defined over this
small set to generate predictions over that larger set." Extrapolation,
interpolation, statistical inference and forecasting all reduce to this
problem. The Kan extension is a powerful tool in category theory that
generalizes this notion. In this work we explore several applications of Kan
extensions to data science. We begin by deriving a simple classification
algorithm as a Kan extension and experimenting with this algorithm on real
data. Next, we use the Kan extension to derive a procedure for learning
clustering algorithms from labels and explore the performance of this procedure
on real data. We then investigate how Kan extensions can be used to learn a
general mapping from datasets of labeled examples to functions and to
approximate a complex function with a simpler one.
- Abstract(参考訳): データサイエンスにおける一般的な問題は、「この小さな集合上で定義されたこの関数を使用して、その大きな集合に対する予測を生成する」ことである。
補間、補間、統計的推測、予測は全てこの問題に還元される。
カン拡大はこの概念を一般化する圏論において強力な道具である。
本研究では,データサイエンスにおけるkan拡張の応用について検討する。
まず,単純な分類アルゴリズムをkan拡張として導出し,本アルゴリズムを実データ上で実験する。
次に,kan拡張を用いてラベルからクラスタリングアルゴリズムを学習する手順を導出し,本手法の性能を実データ上で検証する。
次に,ラベル付き例のデータセットから関数への一般マッピングを学習し,複雑な関数を単純な関数で近似するためにkan拡張をどのように利用できるかを検討する。
関連論文リスト
- Relation-aware Ensemble Learning for Knowledge Graph Embedding [68.94900786314666]
我々は,既存の手法を関係性に配慮した方法で活用し,アンサンブルを学習することを提案する。
関係認識アンサンブルを用いてこれらのセマンティクスを探索すると、一般的なアンサンブル法よりもはるかに大きな検索空間が得られる。
本稿では,リレーショナルなアンサンブル重みを独立に検索する分割探索合成アルゴリズムRelEns-DSCを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:40:12Z) - Predictive Coding beyond Correlations [59.47245250412873]
このようなアルゴリズムのうちの1つは、予測符号化と呼ばれ、因果推論タスクを実行することができるかを示す。
まず、予測符号化の推論過程における簡単な変化が、因果グラフを再利用したり再定義したりすることなく、介入を計算できることを示す。
論文 参考訳(メタデータ) (2023-06-27T13:57:16Z) - An Interactive Interface for Novel Class Discovery in Tabular Data [54.11148718494725]
新規クラスディスカバリー(英: Novel Class Discovery、NCD)とは、異なるクラスがラベル付けされていることを考慮し、ラベル付けされていないセットで新しいクラスを発見しようとする問題である。
現在提案されているNCD法の大部分は画像データにのみ対応している。
このインターフェースにより、ドメインの専門家は表データでNCDのための最先端のアルゴリズムを簡単に実行することができる。
論文 参考訳(メタデータ) (2023-06-22T14:32:53Z) - Shape complexity in cluster analysis [0.0]
クラスタ分析において、一般的な第一歩は、データをクラスタに分割することを目的として、データをスケールすることだ。
ここでは,クラスタリングに先立って使用するスケーリング係数の獲得を目的として,データの多次元形状の利用について検討する。
いくつかの象徴的なデータセットで、新しいアプローチの強みと潜在的な弱点を強調します。
論文 参考訳(メタデータ) (2022-05-17T01:33:15Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Improving Efficiency and Accuracy of Causal Discovery Using a
Hierarchical Wrapper [7.570246812206772]
観測データからの因果発見は、科学の多くの分野において重要なツールである。
大規模なサンプルリミットでは、音と完全な因果探索アルゴリズムが導入されている。
しかし、これらのアルゴリズムが使用する統計的テストのパワーを制限するのは、有限のトレーニングデータのみである。
論文 参考訳(メタデータ) (2021-07-11T09:24:49Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Learning Aggregation Functions [78.47770735205134]
任意の濃度の集合に対する学習可能なアグリゲータであるLAF(Learning Aggregation Function)を紹介する。
半合成および実データを用いて,LAFが最先端の和(max-)分解アーキテクチャより優れていることを示す実験を報告する。
論文 参考訳(メタデータ) (2020-12-15T18:28:53Z) - Clustering multivariate functional data using unsupervised binary trees [0.0]
本研究では,汎用関数データに対するモデルに基づくクラスタリングアルゴリズムを提案する。
ランダム関数データ実現は、定義領域内の離散的、おそらくランダムな点において誤差で測定することができる。
新しいアルゴリズムは、簡単に解釈可能な結果とオンラインデータセットの迅速な予測を提供します。
論文 参考訳(メタデータ) (2020-12-10T20:56:49Z) - Learning Self-Expression Metrics for Scalable and Inductive Subspace
Clustering [5.587290026368626]
サブスペースクラスタリングは、高次元データをクラスタリングするための最先端のアプローチとして確立されている。
本研究では,シアムニューラルネットワークアーキテクチャを用いて,サブスペース親和性関数を学習するための新しい距離学習手法を提案する。
我々のモデルは、パラメータの一定数とメモリフットプリントの恩恵を受けており、かなり大きなデータセットにスケールすることができる。
論文 参考訳(メタデータ) (2020-09-27T15:40:12Z) - Extracting the main trend in a dataset: the Sequencer algorithm [0.0]
一次元の傾向は、しばしば列と呼ばれ、単純な現象についての洞察を与える。
本稿では,データセットの主なトレンドを汎用的に識別するアルゴリズムであるSequencerを提案する。
多くのケースにおいて、一般的なt-SNEおよびUMAP次元減少技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-06-24T18:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。