論文の概要: Lecture notes on high-dimensional data
- arxiv url: http://arxiv.org/abs/2101.05841v7
- Date: Fri, 20 Sep 2024 13:52:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-09 15:57:56.102953
- Title: Lecture notes on high-dimensional data
- Title(参考訳): 高次元データに関する講義ノート
- Authors: Sven-Ake Wegner,
- Abstract要約: 改訂版が教科書(Mathematical Introduction to Data Science, Springer, Berlin, Heidelberg, 2024, https://link.springer.com/book007/978-3-662-69426-8)の一部として出版された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: These are lecture notes based on the first part of a course on 'Mathematical Data Science', which I taught to final year BSc students in the UK in 2019-2020. Topics include: concentration of measure in high dimensions; Gaussian random vectors in high dimensions; random projections; separation/disentangling of Gaussian data. A revised version has been published as part of the textbook [Mathematical Introduction to Data Science, Springer, Berlin, Heidelberg, 2024, https://link.springer.com/book/10.1007/978-3-662-69426-8].
- Abstract(参考訳): 以下は、2019-2020年にイギリスでBScの学生に教えた「数学データサイエンス」の講座の最初の部分に基づく講義ノートである。
トピックは、高次元における測度集中、高次元におけるガウス確率ベクトル、乱射影、ガウスデータの分離・分離である。
改訂版が教科書 (Mathematical Introduction to Data Science, Springer, Berlin, Heidelberg, 2024, https://link.springer.com/book/10.1007/978-3-662-69426-8] の一部として出版された。
関連論文リスト
- ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining [104.34751911174196]
ShapeNetとModelNetを用いた大規模3DGSデータセットを構築した。
データセットのShapeSplatは、87のユニークなカテゴリから65Kのオブジェクトで構成されています。
textbftextitGaussian-MAEを導入し、ガウスパラメータからの表現学習の独特な利点を強調した。
論文 参考訳(メタデータ) (2024-08-20T14:49:14Z) - Historical Astronomical Diagrams Decomposition in Geometric Primitives [13.447991818689463]
我々は、XII世紀からXVIII世紀にかけての様々な伝統から、303の天文図のユニークなデータセットを紹介した。
我々はDINO-DETR上に構築されたモデルを構築し、複数の幾何学的プリミティブの予測を可能にする。
提案手法は,複数のプリミティブに対して有意義なパラメトリゼーションを導入することにより,ラインに制限されたLETRベースラインを改良する。
論文 参考訳(メタデータ) (2024-03-13T17:20:25Z) - Mathematics of Neural Networks (Lecture Notes Graduate Course) [0.0]
このコースは、大学院レベルの数学の学生のためのニューラルネットワークの導入を目的としている。
講義ノートは、適度な数学のバックグラウンドを持つすべての学生にアクセスできるよう、可能な限り自己完結型にされた。
このコースには、Jupyterノートブックのセットという形でのコーディングチュートリアルや課題も含まれていた。
論文 参考訳(メタデータ) (2024-03-06T08:45:29Z) - Statistical physics, Bayesian inference and neural information
processing [2.7870396480031903]
統計物理学のレンズによる神経情報処理について論じる。
内容にはベイズ的推論や、学習と一般化に関するギブスの記述との関係が含まれる。
論文 参考訳(メタデータ) (2023-09-29T06:40:13Z) - Automated Feedback Generation for a Chemistry Database and Abstracting
Exercise [0.0]
このデータセットには2年連続で207件の論文が含まれており、21の論文が一次文献からまとめられている。
モデルは利用可能なデータセット(約15,000のサンプル)を使用して事前トレーニングされ、送信されたデータセットの80%で微調整された。
学生が提出した文章は、背景、技法、観察の3つのクラスに特徴づけられる。
論文 参考訳(メタデータ) (2023-05-22T15:04:26Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - Cosmology from Galaxy Redshift Surveys with PointNet [65.89809800010927]
宇宙論において、銀河赤方偏移サーベイは、宇宙における位置の置換不変な集まりに類似している。
我々は、ポイントクラウドデータから直接、宇宙パラメータの値を回帰するために、textitPointNetのようなニューラルネットワークを使用します。
我々のPointNetsの実装は、$mathcalO(104) - MathcalO(105)$銀河の入力を一度に分析できるので、この応用の初期の作業は、およそ2桁の精度で改善される。
論文 参考訳(メタデータ) (2022-11-22T15:35:05Z) - Minimalist Data Wrangling with Python [4.429175633425273]
Pythonを使ったData Wranglingは、学生によるデータサイエンス入門として構想されている。
これは、重要な概念を詳細に議論するだけでなく、ハイレベルな概要を提供する。
論文 参考訳(メタデータ) (2022-11-09T01:24:39Z) - Geometer: Graph Few-Shot Class-Incremental Learning via Prototype
Representation [50.772432242082914]
既存のグラフニューラルネットワークに基づく手法は主に、豊富なラベリングを持つ固定クラス内の未ラベルノードの分類に重点を置いている。
本稿では,この難易度で実用的なグラフ数ショットクラスインクリメンタルラーニング(GFSCIL)問題に着目し,Geometerと呼ばれる新しい手法を提案する。
完全に接続されたニューラルネットワークのクラスを置き換えて再トレーニングする代わりに、Geometerは、最も近いクラスのプロトタイプを見つけることによって、ノードのラベルを予測する。
論文 参考訳(メタデータ) (2022-05-27T13:02:07Z) - ACRONYM: A Large-Scale Grasp Dataset Based on Simulation [64.37675024289857]
ACRONYMは物理シミュレーションに基づくロボットグリップ計画のためのデータセットである。
データセットには17.7Mのパラレルジャウグリップが含まれ、262の異なるカテゴリから8872のオブジェクトにまたがっている。
我々は、この大規模で多様なデータセットの価値を、2つの最先端の学習に基づく把握計画アルゴリズムの訓練に利用することで示す。
論文 参考訳(メタデータ) (2020-11-18T23:24:00Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。