論文の概要: Spatiotemporal Classification with limited labels using Constrained
Clustering for large datasets
- arxiv url: http://arxiv.org/abs/2210.07522v1
- Date: Fri, 14 Oct 2022 05:05:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 17:20:10.179897
- Title: Spatiotemporal Classification with limited labels using Constrained
Clustering for large datasets
- Title(参考訳): Constrained Clustering を用いた大規模データセットの時空間分類
- Authors: Praveen Ravirathinam, Rahul Ghosh, Ke Wang, Keyang Xuan, Ankush
Khandelwal, Hilary Dugan, Paul Hanson, Vipin Kumar
- Abstract要約: 分離可能な表現は、より良い分類能力を持つ教師付きモデルにつながる可能性がある。
ラベルの少ない制約付き損失を使って、より優れた表現を学べる方法を示します。
我々は,ラベルの少ない手法を用いて,ラベルのないデータから新しいラベル付きサンプルを抽出し,より優れた分類につながる教師付き手法を拡張できることを示す。
- 参考スコア(独自算出の注目度): 22.117238467818623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating separable representations via representation learning and clustering
is critical in analyzing large unstructured datasets with only a few labels.
Separable representations can lead to supervised models with better
classification capabilities and additionally aid in generating new labeled
samples. Most unsupervised and semisupervised methods to analyze large datasets
do not leverage the existing small amounts of labels to get better
representations. In this paper, we propose a spatiotemporal clustering paradigm
that uses spatial and temporal features combined with a constrained loss to
produce separable representations. We show the working of this method on the
newly published dataset ReaLSAT, a dataset of surface water dynamics for over
680,000 lakes across the world, making it an essential dataset in terms of
ecology and sustainability. Using this large unlabelled dataset, we first show
how a spatiotemporal representation is better compared to just spatial or
temporal representation. We then show how we can learn even better
representation using a constrained loss with few labels. We conclude by showing
how our method, using few labels, can pick out new labeled samples from the
unlabeled data, which can be used to augment supervised methods leading to
better classification.
- Abstract(参考訳): 表現学習とクラスタリングによる分離可能な表現の作成は、少数のラベルで大規模な非構造化データセットを分析する上で重要である。
分離可能な表現は、より良い分類能力を持つ教師付きモデルにつながり、さらに新しいラベル付きサンプルを生成するのに役立つ。
大規模なデータセットを分析するための教師なしおよび半教師なしの手法の多くは、既存の少量のラベルを利用せず、より良い表現を得る。
本稿では,空間的特徴と時間的特徴と制約付き損失を組み合わせて分離可能な表現を生成する時空間クラスタリングパラダイムを提案する。
本稿では, 世界中の680,000湖における地下水動態のデータセットであるReaLSATについて検討し, 生態学と持続可能性の観点から重要なデータセットであることを示す。
この大きな乱れのないデータセットを用いて、空間的あるいは時間的表現よりも時空間的表現の方が優れていることを示す。
そして、ラベルの少ない制約付き損失を使って、より良い表現を学ぶ方法を示します。
我々は,ラベルの少ない手法を用いて,ラベルのないデータから新しいラベル付きサンプルを抽出し,より優れた分類につながる教師付き手法を拡張できることを示す。
関連論文リスト
- Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.74296438621836]
Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。
弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。
Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-08-22T15:29:08Z) - Label Learning Method Based on Tensor Projection [82.51786483693206]
テンソルプロジェクション(LLMTP)に基づくラベル学習手法を提案する。
行列射影変換をテンソル射影に拡張し、ビュー間の空間構造情報を活用できるようにする。
さらに、テンソルのSchatten $p$-norm正規化を導入し、異なるビューのクラスタリングラベル行列を可能な限り一貫性を持たせる。
論文 参考訳(メタデータ) (2024-02-26T13:03:26Z) - A Data-efficient Framework for Robotics Large-scale LiDAR Scene Parsing [10.497309421830671]
既存の最先端の3Dポイントクラウド理解手法は、完全に教師された方法でのみうまく機能する。
この研究は、ラベルが制限されているときのポイントクラウドを理解するための、汎用的でシンプルなフレームワークを提示している。
論文 参考訳(メタデータ) (2023-12-03T02:38:51Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Learned Label Aggregation for Weak Supervision [8.819582879892762]
本稿では,ラベル付きデータを容易に生成するために,弱い監視信号を集約するデータプログラミング手法を提案する。
生成したラベルの質は、すべてのLFからノイズの多いラベルを集約し、基底真実のラベルを推測するラベル集約モデルに依存する。
合成されたデータを用いてモデルをトレーニングし、モデルに効果的なアーキテクチャを設計できることを示す。
論文 参考訳(メタデータ) (2022-07-27T14:36:35Z) - Label-Free Model Evaluation with Semi-Structured Dataset Representations [78.54590197704088]
ラベルなしモデル評価(AutoEval)は、ラベルなしテストセットでモデル精度を推定する。
画像ラベルがない場合、データセット表現に基づいて、回帰を伴うAutoEvalのモデル性能を推定する。
本稿では,AutoEvalのリッチな情報を含む回帰学習のための半構造化データセット表現を提案する。
論文 参考訳(メタデータ) (2021-12-01T18:15:58Z) - Fuzzy Overclustering: Semi-Supervised Classification of Fuzzy Labels
with Overclustering and Inverse Cross-Entropy [1.6392706389599345]
ファジィラベルの半教師付き分類を扱うための新しいフレームワークを提案する。
これは、これらのファジィラベルのサブ構造を検出するために、オーバークラスタリング(overclustering)という考え方に基づいている。
本研究では,ファジィラベルを用いた実世界のプランクトンデータに適用した場合,従来の半教師付き手法よりも優れたフレームワークを示す。
論文 参考訳(メタデータ) (2021-10-13T10:50:50Z) - Towards Clustering-friendly Representations: Subspace Clustering via
Graph Filtering [16.60975509085194]
本稿では,スムーズな表現を実現するグラフフィルタリング手法を提案する。
画像および文書クラスタリングデータセットの実験により、我々の手法は最先端のサブスペースクラスタリング技術により改善されていることを示す。
アブレーション研究では、グラフフィルタリングがノイズを除去し、画像の構造を保存し、クラスの分離性を高めることが示されている。
論文 参考訳(メタデータ) (2021-06-18T02:21:36Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - Automatically Discovering and Learning New Visual Categories with
Ranking Statistics [145.89790963544314]
我々は,他のクラスをラベル付けした画像コレクションにおいて,新しいクラスを発見する問題に対処する。
汎用クラスタリングモデルを学び、後者を用いて、非競合データ中の新しいクラスを識別する。
我々は,標準分類ベンチマークに対するアプローチと,新しいカテゴリー発見法の性能を,有意なマージンで評価した。
論文 参考訳(メタデータ) (2020-02-13T18:53:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。