論文の概要: voxel2vec: A Natural Language Processing Approach to Learning
Distributed Representations for Scientific Data
- arxiv url: http://arxiv.org/abs/2207.02565v1
- Date: Wed, 6 Jul 2022 10:23:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 13:46:21.156484
- Title: voxel2vec: A Natural Language Processing Approach to Learning
Distributed Representations for Scientific Data
- Title(参考訳): voxel2vec: 科学データの分散表現学習のための自然言語処理手法
- Authors: Xiangyang He and Yubo Tao and Shuoliu Yang and Haoran Dai and and Hai
Lin
- Abstract要約: 科学データの関連性は複雑で複雑である。
voxel2vec は低次元ベクトル空間におけるスカラー値/スカラー値の組み合わせの分散表現を学習するために用いられる。
スカラー値/スカラー値の組み合わせをシンボルとして表現することで、voxel2vecは空間分布の文脈でそれらの類似性を学ぶ。
- 参考スコア(独自算出の注目度): 3.221413414619465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Relationships in scientific data, such as the numerical and spatial
distribution relations of features in univariate data, the scalar-value
combinations' relations in multivariate data, and the association of volumes in
time-varying and ensemble data, are intricate and complex. This paper presents
voxel2vec, a novel unsupervised representation learning model, which is used to
learn distributed representations of scalar values/scalar-value combinations in
a low-dimensional vector space. Its basic assumption is that if two scalar
values/scalar-value combinations have similar contexts, they usually have high
similarity in terms of features. By representing scalar values/scalar-value
combinations as symbols, voxel2vec learns the similarity between them in the
context of spatial distribution and then allows us to explore the overall
association between volumes by transfer prediction. We demonstrate the
usefulness and effectiveness of voxel2vec by comparing it with the isosurface
similarity map of univariate data and applying the learned distributed
representations to feature classification for multivariate data and to
association analysis for time-varying and ensemble data.
- Abstract(参考訳): 不定値データにおける特徴の数値的・空間的分布関係、多変量データにおけるスカラー値の組み合わせの関係、時間的変動とアンサンブルデータのボリュームの関係など、科学データにおける関係は複雑で複雑である。
本稿では,スカラー値/スカラー値の組み合わせの分散表現を低次元ベクトル空間で学習する,新しい教師なし表現学習モデルvoxel2vecを提案する。
その基本的な前提は、2つのスカラー値/スカラー値の組み合わせが類似したコンテキストを持つ場合、通常は特徴の点で高い類似性を持つということである。
スカラー値/スカラー値の組み合わせをシンボルとして表現することで、voxel2vecは空間分布の文脈でそれらの類似性を学習し、転送予測によってボリューム間の全体関係を探索することができる。
単変量データの等表面類似度マップと比較し,多変量データの特徴分類や時間変化およびアンサンブルデータの関連解析に学習した分散表現を適用して,voxel2vecの有用性と有効性を示す。
関連論文リスト
- Unsupervised detection of semantic correlations in big data [47.201377047286215]
本稿では,2進数として表される高次元データにおける意味的相関を検出する手法を提案する。
本研究では,データ記述に必要な独立座標の最小個数を定量化するデータセットの2値固有次元を推定する。
提案アルゴリズムは, いわゆる次元の呪いとは無関係であり, ビッグデータ解析に利用することができる。
論文 参考訳(メタデータ) (2024-11-04T14:37:07Z) - Comparing the information content of probabilistic representation spaces [3.7277730514654555]
確率的表現空間は、データセットに関する情報を伝達し、トレーニング損失やネットワークアーキテクチャなどの要因の影響を理解するために、そのような空間の情報内容を比較する。
ここでは、ポイントベースの比較尺度に基づいて構築する代わりに、ハードクラスタリングに関する文献から古典的な手法に基づいて構築する。
本稿では,データセットのサンプルを用いて表現空間をフィンガープリントする手法を提案する。
論文 参考訳(メタデータ) (2024-05-31T17:33:07Z) - ComboStoc: Combinatorial Stochasticity for Diffusion Generative Models [65.82630283336051]
拡散生成モデルの既存のトレーニングスキームにより,次元と属性の組み合わせによって区切られた空間が十分に標本化されていないことを示す。
構造を完全に活用するプロセスを構築し,ComboStocという名前でこの問題に対処する。
論文 参考訳(メタデータ) (2024-05-22T15:23:10Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Hodge-Aware Contrastive Learning [101.56637264703058]
単純コンプレックスは、マルチウェイ依存によるデータのモデリングに有効である。
我々は、単純なデータを処理するための対照的な自己教師付き学習手法を開発した。
論文 参考訳(メタデータ) (2023-09-14T00:40:07Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - Multimodal Data Fusion in High-Dimensional Heterogeneous Datasets via
Generative Models [16.436293069942312]
我々は、教師なしの方法で高次元異種データから確率的生成モデルを学習することに興味がある。
本稿では,指数関数的な分布系を通じて異なるデータ型を結合する一般的なフレームワークを提案する。
提案アルゴリズムは、実数値(ガウス)とカテゴリー(マルチノミカル)の特徴を持つ、よく遭遇する異種データセットについて詳細に述べる。
論文 参考訳(メタデータ) (2021-08-27T18:10:31Z) - Contrastive analysis for scatter plot-based representations of
dimensionality reduction [0.0]
本稿では,マルチ次元データセットを探索し,クラスタの形成を解釈する手法を提案する。
また,属性がクラスタ形成にどのように影響するかを理解するために使用される統計変数間の関係を視覚的に解釈し,探索する二部グラフも導入する。
論文 参考訳(メタデータ) (2021-01-26T01:16:31Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Unsupervised Heterogeneous Coupling Learning for Categorical
Representation [50.1603042640492]
この研究は、結合間の相互作用を解き放ち、結合したカテゴリデータを表現するためのUNTIE(UNsupervised heTerogeneous couplIng lEarning)アプローチを導入する。
UNTIEは、ヘテロジニアスおよび階層的値-オブジェクト結合の教師なし表現学習のために、カーネルk平均目的関数を効率よく最適化する。
UNTIEで学習した表現は、最先端のカテゴリ表現やディープ表現モデルに対して大幅な性能改善を行う。
論文 参考訳(メタデータ) (2020-07-21T11:23:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。