論文の概要: Visual Exploration of Large-Scale Image Datasets for Machine Learning
with Treemaps
- arxiv url: http://arxiv.org/abs/2205.06935v1
- Date: Sat, 14 May 2022 00:26:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-17 15:07:38.932409
- Title: Visual Exploration of Large-Scale Image Datasets for Machine Learning
with Treemaps
- Title(参考訳): treemapsを用いた機械学習のための大規模画像データセットの視覚的探索
- Authors: Donald Bertucci, Md Montaser Hamid, Yashwanthi Anand, Anita
Ruangrotsakun, Delyar Tabatabai, Melissa Perez, and Minsuk Kahng
- Abstract要約: 我々は機械学習のための大規模画像データセットを探索する新しいアプローチであるDendroMapを開発した。
画像の高次元表現から階層的クラスタ構造を抽出することにより、画像を効果的に整理する。
ユーザーはデータセットの全体分布を理解し、特定の関心領域をインタラクティブに拡大することができる。
- 参考スコア(独自算出の注目度): 1.881768127321966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present DendroMap, a novel approach to interactively
exploring large-scale image datasets for machine learning. Machine learning
practitioners often explore image datasets by generating a grid of images or
projecting high-dimensional representations of images into 2-D using
dimensionality reduction techniques (e.g., t-SNE). However, neither approach
effectively scales to large datasets because images are ineffectively organized
and interactions are insufficiently supported. To address these challenges, we
develop DendroMap by adapting Treemaps, a well-known visualization technique.
DendroMap effectively organizes images by extracting hierarchical cluster
structures from high-dimensional representations of images. It enables users to
make sense of the overall distributions of datasets and interactively zoom into
specific areas of interests at multiple levels of abstraction. Our case studies
with widely-used image datasets for deep learning demonstrate that users can
discover insights about datasets and trained models by examining the diversity
of images, identifying underperforming subgroups, and analyzing classification
errors. We conducted a user study that evaluates the effectiveness of DendroMap
in grouping and searching tasks by comparing it with a gridified version of
t-SNE and found that participants preferred DendroMap over the compared method.
- Abstract(参考訳): 本稿では,機械学習のための大規模画像データセットをインタラクティブに探索する新しい手法であるdendromapを提案する。
機械学習の実践者は、画像のグリッドを生成したり、画像の高次元表現を2次元に投影して画像データセットを探索することが多い(t-sneなど)。
しかし、画像が効果的に整理されず、相互作用が不十分なため、どちらのアプローチも大きなデータセットに効果的にスケールしない。
これらの課題に対処するために、よく知られた可視化技術であるTreemapsを適用してDendroMapを開発する。
dendromapは、画像の高次元表現から階層的なクラスタ構造を抽出することで、効率的に画像を整理する。
ユーザはデータセットの全体分布を理解し、さまざまなレベルの抽象化で特定の関心領域をインタラクティブに拡大することができる。
深層学習に広く使用されている画像データセットを用いたケーススタディでは,画像の多様性を検証し,低パフォーマンスサブグループを特定し,分類エラーを分析することで,データセットやトレーニングモデルに関する洞察を発見できることが示されている。
本研究では,T-SNEのグリッド化バージョンと比較し,グループ化と探索作業におけるDendroMapの有効性を評価するユーザスタディを行い,提案手法よりもDendroMapを好んだ。
関連論文リスト
- Masked Image Modeling: A Survey [73.21154550957898]
マスク付き画像モデリングは、コンピュータビジョンにおける強力な自己教師付き学習技術として登場した。
我々は近年,分類学を構築し,最も顕著な論文をレビューしている。
我々は,最も人気のあるデータセット上で,様々なマスク付き画像モデリング手法の性能評価結果を集約する。
論文 参考訳(メタデータ) (2024-08-13T07:27:02Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - SepHRNet: Generating High-Resolution Crop Maps from Remote Sensing
imagery using HRNet with Separable Convolution [3.717258819781834]
本稿では、HRNetと分離可能な畳み込み層を統合し、空間的パターンをキャプチャし、データの時間的パターンをキャプチャする、新たなDeep Learningアプローチを提案する。
提案アルゴリズムは、作物マップの生成において、97.5%の分類精度と55.2%のIoUを高い分類精度で達成する。
論文 参考訳(メタデータ) (2023-07-11T18:07:25Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Learning Efficient Representations for Enhanced Object Detection on
Large-scene SAR Images [16.602738933183865]
SAR(Synthetic Aperture Radar)画像のターゲットの検出と認識は難しい問題である。
近年開発されたディープラーニングアルゴリズムは,SAR画像の固有の特徴を自動的に学習することができる。
本稿では,効率的かつ堅牢なディープラーニングに基づくターゲット検出手法を提案する。
論文 参考訳(メタデータ) (2022-01-22T03:25:24Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Homography augumented momentum constrastive learning for SAR image
retrieval [3.9743795764085545]
本稿では, ホログラフィ変換を用いた画像検索手法を提案する。
また,ラベル付け手順を必要としないコントラスト学習によって誘導されるDNNのトレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-21T17:27:07Z) - From Heatmaps to Structural Explanations of Image Classifiers [31.44267537307587]
この論文は、Deep Networkからいくつかの高レベルな概念を純粋に抽出し視覚化しようとする、説明可能なニューラルネットワーク(XNN)を説明することから始まる。
重要な欠落点が信頼性の高いヒートマップ可視化ツールであることに気付き、I-GOSとiGOS++を開発した。
研究プロセスを通じて、我々はディープネットワークの説明を構築する上での洞察について多くを学びました。
論文 参考訳(メタデータ) (2021-09-13T23:39:57Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Sparse data to structured imageset transformation [0.0]
スパースデータセットを含む機械学習の問題は、サンプルと特徴の数が非常に大きい場合、畳み込みニューラルネットワークの使用の恩恵を受ける可能性がある。
このようなデータセットをイメージセットに変換し、畳み込みニューラルネットワークで使用可能な各イメージ構造を与えようとする。
論文 参考訳(メタデータ) (2020-05-07T20:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。