論文の概要: An Empirical Evaluation of the t-SNE Algorithm for Data Visualization in
Structural Engineering
- arxiv url: http://arxiv.org/abs/2109.08795v1
- Date: Sat, 18 Sep 2021 01:24:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 12:35:56.984422
- Title: An Empirical Evaluation of the t-SNE Algorithm for Data Visualization in
Structural Engineering
- Title(参考訳): 構造工学におけるデータ可視化のためのt-SNEアルゴリズムの実証評価
- Authors: Parisa Hajibabaee, Farhad Pourkamali-Anaraki, Mohammad Amin
Hariri-Ardebili
- Abstract要約: t-Distributed Neighbor Embedding (t-SNE)アルゴリズムは、可視化目的で設定された地震関連データセットの寸法を縮小するために用いられる。
SMOTE(Synthetic Minority Oversampling Technique)は、このようなデータセットの不均衡な性質に対処するために用いられる。
トレーニングデータセットにおけるt-SNEとSMOTEを用いて、ニューラルネットワーク分類器は精度を犠牲にすることなく、有望な結果が得られることを示す。
- 参考スコア(独自算出の注目度): 2.4493299476776773
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A fundamental task in machine learning involves visualizing high-dimensional
data sets that arise in high-impact application domains. When considering the
context of large imbalanced data, this problem becomes much more challenging.
In this paper, the t-Distributed Stochastic Neighbor Embedding (t-SNE)
algorithm is used to reduce the dimensions of an earthquake engineering related
data set for visualization purposes. Since imbalanced data sets greatly affect
the accuracy of classifiers, we employ Synthetic Minority Oversampling
Technique (SMOTE) to tackle the imbalanced nature of such data set. We present
the result obtained from t-SNE and SMOTE and compare it to the basic approaches
with various aspects. Considering four options and six classification
algorithms, we show that using t-SNE on the imbalanced data and SMOTE on the
training data set, neural network classifiers have promising results without
sacrificing accuracy. Hence, we can transform the studied scientific data into
a two-dimensional (2D) space, enabling the visualization of the classifier and
the resulting decision surface using a 2D plot.
- Abstract(参考訳): 機械学習における基本的なタスクは、高インパクトアプリケーションドメインで発生する高次元データセットを可視化することである。
大規模な不均衡データのコンテキストを考えると、この問題はさらに難しくなる。
本稿では, t-Distributed Stochastic Neighbor Embedding (t-SNE) アルゴリズムを用いて, 可視化のための地震工学関連データセットの寸法を縮小する。
不均衡なデータセットは分類器の精度に大きな影響を与えるため、これらのデータセットの不均衡の性質に取り組むためにSMOTE(Synthetic Minority Oversampling Technique)を用いる。
本稿では, t-SNE と SMOTE から得られた結果を, 基本的なアプローチと様々な側面を比較した。
4つの選択肢と6つの分類アルゴリズムを考慮すると、不均衡なデータにt-SNE、トレーニングデータセットにSMOTEを用いることで、ニューラルネットワーク分類器は精度を犠牲にすることなく有望な結果が得られることを示す。
これにより、研究対象の科学的データを2次元(2次元)空間に変換することができ、2次元プロットを用いて分類器と結果の決定面の可視化が可能となる。
関連論文リスト
- Two-Stage Hierarchical and Explainable Feature Selection Framework for Dimensionality Reduction in Sleep Staging [0.6216545676226375]
脳波は睡眠研究において重要な役割を果たす。
脳波信号データシーケンスの高次元特性のため、異なる睡眠段階のデータの可視化とクラスタリングが課題となっている。
本稿では,特徴選択アルゴリズムを取り入れた2段階の階層的かつ説明可能な特徴選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-31T23:54:53Z) - Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study [49.5374512525016]
医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T16:59:27Z) - On the Convergence of Loss and Uncertainty-based Active Learning Algorithms [3.506897386829711]
本研究では、勾配降下法(SGD)アルゴリズムを用いて機械学習モデルの学習に必要な収束率とデータサンプルサイズについて検討する。
線形分類器と線形分離可能なデータセットに対する2乗ヒンジ損失と類似のトレーニング損失関数を用いた収束結果を提案する。
論文 参考訳(メタデータ) (2023-12-21T15:22:07Z) - Defect Classification in Additive Manufacturing Using CNN-Based Vision
Processing [76.72662577101988]
本稿では、まず、畳み込みニューラルネットワーク(CNN)を用いて、画像データセットの欠陥をAMから第2に正確に分類し、発達した分類モデルにアクティブラーニング技術を適用する。
これにより、トレーニングデータやトレーニングデータの生成に必要なデータのサイズを削減できる、ヒューマン・イン・ザ・ループ機構の構築が可能になる。
論文 参考訳(メタデータ) (2023-07-14T14:36:58Z) - Machine Learning Based Missing Values Imputation in Categorical Datasets [2.5611256859404983]
この研究では、分類データセットのギャップを埋めるための機械学習アルゴリズムの使用について検討した。
Error Correction Output Codesフレームワークを使用して構築されたアンサンブルモデルに重点が置かれた。
大量のラベル付きデータの要求を含む、これらの奨励的な結果にもかかわらず、データ計算の欠如に対する深い学習には障害がある。
論文 参考訳(メタデータ) (2023-06-10T03:29:48Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - Data Scaling Laws in NMT: The Effect of Noise and Architecture [59.767899982937756]
ニューラルネットワーク翻訳(NMT)のデータスケーリング特性に及ぼすアーキテクチャとトレーニングデータ品質の影響について検討する。
データスケーリング指数は最小限の影響を受けており、より多くのデータを追加することで、極端に悪いアーキテクチャやトレーニングデータの補償が可能になることを示唆しています。
論文 参考訳(メタデータ) (2022-02-04T06:53:49Z) - Rank-R FNN: A Tensor-Based Learning Model for High-Order Data
Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。
まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。
Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2021-04-11T16:37:32Z) - Prediction of Object Geometry from Acoustic Scattering Using
Convolutional Neural Networks [8.067201256886733]
本研究は,畳み込みニューラルネットワークを訓練することにより,散乱特徴から物体形状を推定することを提案する。
データ劣化に対する我々のアプローチの堅牢性は、データセットを用いてトレーニングされたネットワークの性能を比較して評価する。
論文 参考訳(メタデータ) (2020-10-21T00:51:14Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z) - Performance Analysis of Semi-supervised Learning in the Small-data
Regime using VAEs [0.261072980439312]
そこで本研究では,データ空間の潜在空間表現を事前学習した既存のアルゴリズムを用いて,データ構造入力の低次元の特徴を抽出する手法を提案する。
微調整された潜在空間は、分類に有用な一定の重みを与える。
ここでは、半教師付き学習において、遅延空間サイズが異なるVAEアルゴリズムの性能解析について述べる。
論文 参考訳(メタデータ) (2020-02-26T16:19:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。