論文の概要: EvoSplit: An evolutionary approach to split a multi-label data set into
disjoint subset
- arxiv url: http://arxiv.org/abs/2102.06154v1
- Date: Thu, 11 Feb 2021 17:53:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-12 19:24:14.429814
- Title: EvoSplit: An evolutionary approach to split a multi-label data set into
disjoint subset
- Title(参考訳): EvoSplit: 複数ラベルデータセットを非結合なサブセットに分割する進化的アプローチ
- Authors: Francisco Florez-Revuelta
- Abstract要約: 本稿では,マルチラベルデータセットを教師付き機械学習用サブセットに分割する進化的手法であるEvoSplitを提案する。
どちらのアプローチも、よく知られたマルチラベルデータセットと、コンピュータビジョンや機械学習アプリケーションで現在使われている大規模な画像データセットを使用して検証されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a new evolutionary approach, EvoSplit, for the
distribution of multi-label data sets into disjoint subsets for supervised
machine learning. Currently, data set providers either divide a data set
randomly or using iterative stratification, a method that aims to maintain the
label (or label pair) distribution of the original data set into the different
subsets. Following the same aim, this paper first introduces a single-objective
evolutionary approach that tries to obtain a split that maximizes the
similarity between those distributions independently. Second, a new
multi-objective evolutionary algorithm is presented to maximize the similarity
considering simultaneously both distributions (label and label pair). Both
approaches are validated using well-known multi-label data sets as well as
large image data sets currently used in computer vision and machine learning
applications. EvoSplit improves the splitting of a data set in comparison to
the iterative stratification following different measures: Label Distribution,
Label Pair Distribution, Examples Distribution, folds and fold-label pairs with
zero positive examples.
- Abstract(参考訳): 本稿では、教師付き機械学習のための非結合サブセットにマルチラベルデータセットを分散するための新しい進化的アプローチであるEvoSplitを提案する。
現在、データセットプロバイダは、データセットをランダムに分割するか、あるいは元のデータセットのラベル(またはラベルペア)分布を異なるサブセットに維持することを目的とした反復成層法を用いている。
同じ目的に続き、本論文はまず、これらの分布の類似性を独立に最大化する分割を求める、単目的進化的アプローチを提案する。
次に,両分布(ラベルとラベルペア)を同時に考慮し,類似性を最大化するために,新たな多目的進化アルゴリズムを提案する。
どちらのアプローチも、よく知られたマルチラベルデータセットと、現在コンピュータビジョンや機械学習アプリケーションで使われている大規模な画像データセットを使用して検証される。
EvoSplitは、ラベル分布、ラベルペア分布、例分布、折り畳みおよび折り畳みラベルペアの0の例に従って反復的な階層化と比較して、データセットの分割を改善します。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Labeled-to-Unlabeled Distribution Alignment for Partially-Supervised Multi-Organ Medical Image Segmentation [30.953837550398884]
部分教師付き多臓器画像セグメンテーションは統合意味セグメンテーションモデルの構築を目的としている。
本稿では,特徴分布を調整し,識別能力を向上するラベル付き非ラベル分布アライメントフレームワークを提案する。
提案手法は,最先端部分教師方式よりもかなりのマージンで性能を向上する。
論文 参考訳(メタデータ) (2024-09-05T03:55:37Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Relation-Aware Distribution Representation Network for Person Clustering
with Multiple Modalities [17.569843539515734]
顔、体、声を含む多モードの手がかりでクラスタリングする人は、様々なタスクに欠かせない。
マルチモーダルな手がかりの分布表現を生成するためのリレーショナル・アウェア分布表現ネットワーク(RAD-Net)を提案する。
提案手法は,ビデオパーソンクラスタリングデータセットにおけるFスコアの+6%と+8.2%を大幅に改善する。
論文 参考訳(メタデータ) (2023-08-01T15:04:56Z) - Cooperative Self-Training for Multi-Target Adaptive Semantic
Segmentation [26.79776306494929]
複数のドメイン固有分類器間の協調を誘導するために擬似ラベルを用いた自己学習戦略を提案する。
我々は、自己学習の不可欠な部分を形成する画像ビューを生成する効率的な方法として、特徴スタイリングを採用している。
論文 参考訳(メタデータ) (2022-10-04T13:03:17Z) - Learning Semantic Segmentation from Multiple Datasets with Label Shifts [101.24334184653355]
本論文では,ラベル空間が異なる複数のデータセットを対象としたモデルの自動学習手法であるUniSegを提案する。
具体的には,ラベルの相反と共起を考慮に入れた2つの損失を提案する。
論文 参考訳(メタデータ) (2022-02-28T18:55:19Z) - Distributionally Robust Data Join [25.210910180745504]
本稿では,元の特徴,補助特徴,バイナリラベルに対する全ての確率に対する最大損失を最小限に抑える予測器の構築問題を紹介する。
これは分散ロバスト最適化(DRO)の一般化であり、2つのデータソースが可能であり、そのうちの1つはラベル付けされていないものは補助的特徴を含む可能性がある。
論文 参考訳(メタデータ) (2022-02-11T17:46:24Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Imbalanced Continual Learning with Partitioning Reservoir Sampling [46.427023757892336]
シーケンシャルなデータストリームからの継続的な学習は、機械学習研究にとって重要な課題である。
予測不能な逆性は,多くの多ラベルデータセットにおいて自然に存在し,長い尾の分布を推定する。
本稿では,Reservoir Smpling (PRS) というリプレイ型アプローチのための新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-09-08T10:28:18Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。