論文の概要: Self-supervised similarity search for large scientific datasets
- arxiv url: http://arxiv.org/abs/2110.13151v1
- Date: Mon, 25 Oct 2021 18:00:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-28 12:03:33.370277
- Title: Self-supervised similarity search for large scientific datasets
- Title(参考訳): 大規模科学データセットの自己教師付き類似性探索
- Authors: George Stein, Peter Harrington, Jacqueline Blaum, Tomislav Medan,
Zarija Lukic
- Abstract要約: 本稿では,大規模未ラベルデータセットの探索と活用に自己教師付き学習を用いることを提案する。
まず、各画像の対称性、不確実性、ノイズに頑健な低次元表現を除去するために、自己教師付きモデルを訓練する。
次に,この表現を用いて対話型セマンティック類似検索ツールを構築し,公開する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the use of self-supervised learning to explore and exploit large
unlabeled datasets. Focusing on 42 million galaxy images from the latest data
release of the Dark Energy Spectroscopic Instrument (DESI) Legacy Imaging
Surveys, we first train a self-supervised model to distil low-dimensional
representations that are robust to symmetries, uncertainties, and noise in each
image. We then use the representations to construct and publicly release an
interactive semantic similarity search tool. We demonstrate how our tool can be
used to rapidly discover rare objects given only a single example, increase the
speed of crowd-sourcing campaigns, and construct and improve training sets for
supervised applications. While we focus on images from sky surveys, the
technique is straightforward to apply to any scientific dataset of any
dimensionality. The similarity search web app can be found at
https://github.com/georgestein/galaxy_search
- Abstract(参考訳): 本稿では,教師なし学習を用いて,ラベルなしの大規模データセットを探索し,活用する。
desi(dark energy spectroscopic instrument)レガシイメージングサーベイの最新データリリースから得られた4200万の銀河画像に注目し,まず,対称性,不確実性,ノイズにロバストな低次元表現を識別するために,自己教師付きモデルを訓練した。
次に,この表現を用いて対話型セマンティック類似検索ツールを構築し,公開する。
また,クラウドソーシングキャンペーンのスピード向上や,教師付きアプリケーションのためのトレーニングセットの構築と改善のために,このツールを使ってレアなオブジェクトを迅速に発見する方法を実証する。
スカイサーベイの画像に焦点を当てているが、この技術はどんな次元の科学データセットにも簡単に適用できる。
similarity search web appはhttps://github.com/georgestein/galaxy_searchにある。
関連論文リスト
- Contrasting Deepfakes Diffusion via Contrastive Learning and Global-Local Similarities [88.398085358514]
Contrastive Deepfake Embeddings (CoDE)は、ディープフェイク検出に特化した新しい埋め込み空間である。
CoDEは、グローバルローカルな類似性をさらに強化することで、対照的な学習を通じて訓練される。
論文 参考訳(メタデータ) (2024-07-29T18:00:10Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Zero-shot sketch-based remote sensing image retrieval based on multi-level and attention-guided tokenization [8.678089483952474]
本研究では,リモートセンシング画像を対象としたゼロショット・スケッチベース検索手法を提案する。
マルチレベルの特徴抽出、自己アテンション誘導トークン化とフィルタリング、モダリティ間のアテンション更新が採用されている。
本手法は,既存のスケッチベースリモートセンシング画像検索技術よりも優れている。
論文 参考訳(メタデータ) (2024-02-03T13:11:14Z) - Stellar: Systematic Evaluation of Human-Centric Personalized
Text-to-Image Methods [52.806258774051216]
我々は,個々のイメージを入力し,生成プロセスの基盤となるテキストと,所望の視覚的コンテキストを記述したテキストに焦点をあてる。
我々は,既存の関連するデータセットよりも桁違いの大きさの個人画像と,リッチなセマンティックな接地真実アノテーションが容易に利用できるパーソナライズされたプロンプトを含む標準化データセット(Stellar)を紹介した。
被験者ごとにテストタイムの微調整を必要とせず,新しいSoTAを定量的かつ人為的に設定した,シンプルで効率的でパーソナライズされたテキスト・ツー・イメージのベースラインを導出する。
論文 参考訳(メタデータ) (2023-12-11T04:47:39Z) - AugNet: End-to-End Unsupervised Visual Representation Learning with
Image Augmentation [3.6790362352712873]
我々は、未ラベル画像の集合から画像特徴を学習するための新しいディープラーニングトレーニングパラダイムであるAugNetを提案する。
実験により,低次元空間における画像の表現が可能であることを実証した。
多くのディープラーニングベースの画像検索アルゴリズムとは異なり、我々のアプローチは外部アノテーション付きデータセットへのアクセスを必要としない。
論文 参考訳(メタデータ) (2021-06-11T09:02:30Z) - The Intrinsic Dimension of Images and Its Impact on Learning [60.811039723427676]
自然画像データは従来の画素表現の高次元にもかかわらず低次元構造を示すと広く信じられている。
本研究では,一般的なデータセットに次元推定ツールを適用し,深層学習における低次元構造の役割を検討する。
論文 参考訳(メタデータ) (2021-04-18T16:29:23Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - Estimating Galactic Distances From Images Using Self-supervised
Representation Learning [1.0499611180329804]
対照的な自己教師付き学習フレームワークを用いて、光度画像から銀河の距離を推定する。
コンピュータビジョンからのデータ増分と、銀河塵のアプリケーション固有の増分計算を組み込んでいます。
1)ラベルのない大量のコーパスで事前トレーニングを行い,さらにラベルの微調整を行うことで,完全教師付きモデルの精度が得られることを示す。
論文 参考訳(メタデータ) (2021-01-12T04:39:26Z) - Self-Supervised Representation Learning for Astronomical Images [1.0499611180329804]
自己教師付き学習は,意味的に有用なスカイサーベイ画像の表現を復元する。
本手法は,教師付きモデルの2-4倍のラベルをトレーニングに使用しながら,精度を向上できることを示す。
論文 参考訳(メタデータ) (2020-12-24T03:25:36Z) - Geography-Aware Self-Supervised Learning [79.4009241781968]
異なる特徴により、標準ベンチマークにおけるコントラスト学習と教師あり学習の間には、非自明なギャップが持続していることが示される。
本稿では,リモートセンシングデータの空間的整合性を利用した新しいトレーニング手法を提案する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションにおけるコントラスト学習と教師あり学習のギャップを埋めるものである。
論文 参考訳(メタデータ) (2020-11-19T17:29:13Z) - Self-supervised Learning for Astronomical Image Classification [1.2891210250935146]
天文学では、毎日大量の画像データが測光サーベイによって生成される。
本稿では,未ラベルの天体画像から深部畳み込みニューラルネットワークを学習する手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。