論文の概要: Neural Network Architecture for Database Augmentation Using Shared
Features
- arxiv url: http://arxiv.org/abs/2302.01374v1
- Date: Thu, 2 Feb 2023 19:17:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-06 18:35:31.517363
- Title: Neural Network Architecture for Database Augmentation Using Shared
Features
- Title(参考訳): 共有特徴を用いたデータベース拡張のためのニューラルネットワークアーキテクチャ
- Authors: William C. Sleeman IV, Rishabh Kapoor, Preetam Ghosh
- Abstract要約: 医学のような領域では、大きな単一ソースデータセットや同一の機能を持つマルチソースデータセットを作成するのが難しくなる。
本稿では、これらのデータセット間で共通する機能を用いて、データ拡張を提供するニューラルネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The popularity of learning from data with machine learning and neural
networks has lead to the creation of many new datasets for almost every problem
domain. However, even within a single domain, these datasets are often
collected with disparate features, sampled from different sub-populations, and
recorded at different time points. Even with the plethora of individual
datasets, large data science projects can be difficult as it is often not
trivial to merge these smaller datasets. Inherent challenges in some domains
such as medicine also makes it very difficult to create large single source
datasets or multi-source datasets with identical features. Instead of trying to
merge these non-matching datasets directly, we propose a neural network
architecture that can provide data augmentation using features common between
these datasets. Our results show that this style of data augmentation can work
for both image and tabular data.
- Abstract(参考訳): 機械学習とニューラルネットワークによるデータからの学習の人気は、ほぼすべての問題領域に対する多くの新しいデータセットの作成につながっている。
しかし、単一のドメイン内でも、これらのデータセットは、しばしば異なる特徴で収集され、異なるサブ人口からサンプリングされ、異なる時点に記録される。
個々のデータセットが多すぎるとしても、これらの小さなデータセットをマージするのは簡単ではないことが多いため、大規模なデータサイエンスプロジェクトは難しい場合がある。
医学のような領域では、大きな単一ソースデータセットや同一の機能を持つマルチソースデータセットを作成することも非常に困難である。
これらの非マッチングデータセットを直接マージする代わりに、これらのデータセット間で共通する機能を使用してデータ拡張を提供するニューラルネットワークアーキテクチャを提案する。
この方法では,画像データと表データの両方に有効であることを示す。
関連論文リスト
- The Brain's Bitter Lesson: Scaling Speech Decoding With Self-Supervised Learning [3.649801602551928]
我々は、異種録音からの学習を表現するために、神経科学にインスパイアされた自己教師対象のセットをニューラルネットワークとともに開発する。
その結果、これらの目的によって学習された表現は、データとともにスケールし、主題、データセット、タスクをまたいで一般化し、同等の自己監督的アプローチを上回ります。
論文 参考訳(メタデータ) (2024-06-06T17:59:09Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - Combining datasets to increase the number of samples and improve model
fitting [7.4771091238795595]
我々はImp(ComImp)に基づくコンバインドデータセットと呼ばれる新しいフレームワークを提案する。
さらに,PCA,PCA-ComImpを用いたComImpの変種を提案する。
提案手法は,より小さなデータセット上での予測モデルの精度を大幅に向上させることで,転送学習と幾らか類似していることが示唆された。
論文 参考訳(メタデータ) (2022-10-11T06:06:37Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - Bridge Data: Boosting Generalization of Robotic Skills with Cross-Domain
Datasets [122.85598648289789]
マルチドメインとマルチタスクのデータセットが、新しい環境における新しいタスクの学習を改善する方法について検討する。
また、新しいドメイン内の少数のタスクのみのデータによって、ドメインギャップを埋めることができ、ロボットが他のドメインでしか見られなかったさまざまなタスクを実行できることもわかりました。
論文 参考訳(メタデータ) (2021-09-27T23:42:12Z) - Neural Network Training with Highly Incomplete Datasets [1.5658704610960568]
GapNetは、高度に不完全なデータセットを使用することができる、別のディープラーニングトレーニングアプローチである。
以上の結果から,GapNetはアルツハイマー病の病態とコビッド19による入院リスクのある患者の同定を改善することが示唆された。
論文 参考訳(メタデータ) (2021-07-01T13:21:45Z) - DAIL: Dataset-Aware and Invariant Learning for Face Recognition [67.4903809903022]
顔認識の性能向上のためには、通常大規模なトレーニングデータセットが必要である。
2つの大きな問題のために異なるデータセットを自然に組み合わせるのは問題で面倒です。
トレーニング中に異なるデータセットの異なるクラスと同じ人を扱うことは、バックプロパゲーションに影響します。
手動でラベルをクリーニングするには 人的努力が要る 特に何百万もの画像と何千ものIDがある時は
論文 参考訳(メタデータ) (2021-01-14T01:59:52Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。