論文の概要: WizMap: Scalable Interactive Visualization for Exploring Large Machine
Learning Embeddings
- arxiv url: http://arxiv.org/abs/2306.09328v1
- Date: Thu, 15 Jun 2023 17:58:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-16 13:17:48.563638
- Title: WizMap: Scalable Interactive Visualization for Exploring Large Machine
Learning Embeddings
- Title(参考訳): wizmap:大規模機械学習埋め込みを探索するスケーラブルなインタラクティブな可視化
- Authors: Zijie J. Wang, Fred Hohman, Duen Horng Chau
- Abstract要約: 我々は、研究者や実践者が大きな埋め込みを簡単に探索するのに役立つインタラクティブな可視化ツールであるWizMapを紹介します。
WizMapは、新しいマルチ解像度埋め込み要約法と、慣れ親しんだマップのようなインタラクション設計により、ユーザが簡単に埋め込みスペースをナビゲートし、解釈できる。
- 参考スコア(独自算出の注目度): 19.942124500874503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models often learn latent embedding representations that
capture the domain semantics of their training data. These embedding
representations are valuable for interpreting trained models, building new
models, and analyzing new datasets. However, interpreting and using embeddings
can be challenging due to their opaqueness, high dimensionality, and the large
size of modern datasets. To tackle these challenges, we present WizMap, an
interactive visualization tool to help researchers and practitioners easily
explore large embeddings. With a novel multi-resolution embedding summarization
method and a familiar map-like interaction design, WizMap enables users to
navigate and interpret embedding spaces with ease. Leveraging modern web
technologies such as WebGL and Web Workers, WizMap scales to millions of
embedding points directly in users' web browsers and computational notebooks
without the need for dedicated backend servers. WizMap is open-source and
available at the following public demo link: https://poloclub.github.io/wizmap.
- Abstract(参考訳): マシンラーニングモデルは、トレーニングデータのドメインセマンティクスをキャプチャする潜在埋め込み表現を学習することが多い。
これらの埋め込み表現は、トレーニングされたモデルの解釈、新しいモデルの構築、新しいデータセットの分析に有用である。
しかし、埋め込みの解釈と利用は、その不透明さ、高次元性、そして現代のデータセットの大きなサイズのために困難である。
このような課題に取り組むために,研究者や実践者が大規模な埋め込みを簡単に探索できるインタラクティブな可視化ツールwizmapを提案する。
WizMapは、新しいマルチ解像度埋め込み要約法と、よく知られたマップのようなインタラクション設計により、ユーザが簡単に埋め込みスペースをナビゲートし、解釈できる。
WebGLやWeb WorkersといったモダンなWebテクノロジを活用して、WizMapは、専用のバックエンドサーバを必要とせずに、ユーザのWebブラウザや計算ノートブックに直接、数百万の埋め込みポイントをスケールする。
wizmapはオープンソースであり、以下の公開デモリンクで利用可能である。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - EDGE: Enhanced Grounded GUI Understanding with Enriched Multi-Granularity Synthetic Data [15.801018643716437]
本稿では,大規模視覚言語モデル(LVLM)のGUI理解と対話能力を,データ駆動型アプローチにより向上することを目的とする。
本稿では,Web上のWebページから大規模で粒度の高いトレーニングデータを自動的に生成する汎用データ合成フレームワークEDGEを提案する。
提案手法は,手動アノテーションへの依存を著しく低減し,研究者がWeb上で利用可能な膨大な公開リソースを活用して作業を進めることを可能にする。
論文 参考訳(メタデータ) (2024-10-25T10:46:17Z) - From Categories to Classifiers: Name-Only Continual Learning by Exploring the Web [118.67589717634281]
継続的な学習はしばしば、非現実的に時間がかかり、実際にコストがかかるという仮定である、広範な注釈付きデータセットの可用性に依存します。
時間とコストの制約により手動のアノテーションが禁止される、名前のみの連続学習と呼ばれる新しいパラダイムを探求する。
提案手法は,広範かつ進化を続けるインターネットを活用して,未処理のウェブ教師付きデータを検索・ダウンロードして画像分類を行う。
論文 参考訳(メタデータ) (2023-11-19T10:43:43Z) - The mapKurator System: A Complete Pipeline for Extracting and Linking
Text from Historical Maps [7.209761597734092]
mapKuratorは、マシンラーニングモデルと包括的なデータ処理パイプラインを統合するエンドツーエンドシステムである。
我々はmapKuratorシステムをデプロイし、David Rumsey Historical Mapコレクションに6万以上の地図と1億以上のテキスト/場所名の処理を可能にしました。
論文 参考訳(メタデータ) (2023-06-29T16:05:40Z) - From Visual Prompt Learning to Zero-Shot Transfer: Mapping Is All You
Need [18.42388423333944]
本稿では、事前訓練されたモデルの知識と下流タスクとのセマンティックアライメントを用いたより効果的なマッピングであるSeMapを提案する。
その結果,提案したSeMapは,視覚的即興学習とゼロショット転送の両方において,大きな進歩をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2023-03-09T13:59:49Z) - Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language
Navigation [87.52136927091712]
我々は,ロボットエージェントが言語指導によって記述された経路をたどって,環境の中をナビゲートするよう訓練する,現実的かつ困難な問題に対処する。
高精度かつ効率的なナビゲーションを実現するためには,環境オブジェクトの空間的位置と意味情報の両方を正確に表現した地図を構築することが重要である。
より包括的にオブジェクトを表現するために,オブジェクトの細粒度(色,テクスチャなど)とセマンティッククラスの両方を含む多粒度マップを提案する。
論文 参考訳(メタデータ) (2022-10-14T04:23:27Z) - S$^2$Contact: Graph-based Network for 3D Hand-Object Contact Estimation
with Semi-Supervised Learning [70.72037296392642]
モノクロ画像から接触を学習できる新しい半教師付きフレームワークを提案する。
具体的には、大規模データセットにおける視覚的および幾何学的整合性制約を利用して擬似ラベルを生成する。
より正確な再構築を行うために手動インタラクションを規定するコンタクトマップを使用することの利点を示す。
論文 参考訳(メタデータ) (2022-08-01T14:05:23Z) - Shuffler: A Large Scale Data Management Tool for ML in Computer Vision [0.0]
我々は,大規模なコンピュータビジョンデータセットの管理を容易にするオープンソースツールであるshufflerを提案する。
Shuffler氏は、コンピュータビジョンに適用された教師あり学習に一般的に役立つアノテーションによる40以上のデータ処理操作を定義している。
論文 参考訳(メタデータ) (2021-04-11T22:27:28Z) - Visualising Deep Network's Time-Series Representations [93.73198973454944]
機械学習モデルの普及にもかかわらず、多くの場合、モデルの内部で起きていることに関する洞察のないブラックボックスとして運用される。
本稿では,多次元時系列データの可視化に着目し,この問題に対処する手法を提案する。
高周波在庫市場データセットの実験は、この方法が迅速かつ識別可能な可視化を提供することを示しています。
論文 参考訳(メタデータ) (2021-03-12T09:53:34Z) - Where2Act: From Pixels to Actions for Articulated 3D Objects [54.19638599501286]
可動部を有する関節物体の押出しや引抜き等の基本動作に関連する高度に局所化された動作可能な情報を抽出する。
シミュレーションでネットワークをトレーニングできるオンラインデータサンプリング戦略を備えた学習から対話までのフレームワークを提案します。
私たちの学習モデルは、現実世界のデータにも転送します。
論文 参考訳(メタデータ) (2021-01-07T18:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。