論文の概要: Low-dimensional embeddings of high-dimensional data
- arxiv url: http://arxiv.org/abs/2508.15929v1
- Date: Thu, 21 Aug 2025 19:23:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.172099
- Title: Low-dimensional embeddings of high-dimensional data
- Title(参考訳): 高次元データの低次元埋め込み
- Authors: Cyril de Bodt, Alex Diaz-Papkovich, Michael Bleher, Kerstin Bunte, Corinna Coupette, Sebastian Damrich, Enrique Fita Sanmartin, Fred A. Hamprecht, Emőke-Ágnes Horvát, Dhruv Kohli, Smita Krishnaswamy, John A. Lee, Boudewijn P. F. Lelieveldt, Leland McInnes, Ian T. Nabney, Maximilian Noichl, Pavlin G. Poličar, Bastian Rieck, Guy Wolf, Gal Mishne, Dmitry Kobak,
- Abstract要約: 低次元埋め込みアルゴリズムは、データの可視化、探索、分析のための低次元表現、または埋め込みを生成する。
多くの埋め込みアルゴリズムが開発され、研究や産業で広く使われている。
このレビューは、最近の開発の概要を詳述し、低次元埋め込みの作成と利用のベストプラクティスのリストを作成し、さまざまなデータセットに対する一般的なアプローチを評価し、残りの課題と、この分野におけるオープンな問題について議論する。
- 参考スコア(独自算出の注目度): 35.01192808772252
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large collections of high-dimensional data have become nearly ubiquitous across many academic fields and application domains, ranging from biology to the humanities. Since working directly with high-dimensional data poses challenges, the demand for algorithms that create low-dimensional representations, or embeddings, for data visualization, exploration, and analysis is now greater than ever. In recent years, numerous embedding algorithms have been developed, and their usage has become widespread in research and industry. This surge of interest has resulted in a large and fragmented research field that faces technical challenges alongside fundamental debates, and it has left practitioners without clear guidance on how to effectively employ existing methods. Aiming to increase coherence and facilitate future work, in this review we provide a detailed and critical overview of recent developments, derive a list of best practices for creating and using low-dimensional embeddings, evaluate popular approaches on a variety of datasets, and discuss the remaining challenges and open problems in the field.
- Abstract(参考訳): 高次元データの大規模な収集は、生物学から人文科学まで、多くの学術分野や応用分野においてほぼ至るところで行われている。
高次元データを直接扱うことが課題となるため、データ可視化、探索、分析のための低次元表現、あるいは埋め込みを生成するアルゴリズムの需要はこれまで以上に大きくなっている。
近年,多くの組込みアルゴリズムが開発され,研究や産業で広く利用されている。
この関心の高まりにより、基礎的な議論と並んで技術的な課題に直面した、大規模で断片的な研究分野が生まれ、既存の手法を効果的に活用する方法に関する明確なガイダンスは残っていない。
このレビューでは、コヒーレンスを高め、今後の作業を促進することを目的として、最近の開発の概要を詳述し、低次元埋め込みの作成と利用のためのベストプラクティスのリストを作成し、さまざまなデータセットに対する一般的なアプローチを評価し、残りの課題と分野におけるオープンな問題について議論する。
関連論文リスト
- Towards Data-Centric AI: A Comprehensive Survey of Traditional, Reinforcement, and Generative Approaches for Tabular Data Transformation [37.43210238341124]
この調査では、データ空間の洗練に欠かせない技術として、特徴選択と特徴生成を強調し、データ中心型AIの重要な側面について検討する。
本稿では、最も関連性の高いデータ属性を識別・保持する機能選択手法の体系的なレビューと、複雑なデータパターンのキャプチャーを容易にする新機能を作成する機能生成アプローチについて述べる。
論文 参考訳(メタデータ) (2025-01-17T21:05:09Z) - Deep Learning-Based Object Pose Estimation: A Comprehensive Survey [73.74933379151419]
ディープラーニングに基づくオブジェクトポーズ推定の最近の進歩について論じる。
また、複数の入力データモダリティ、出力ポーズの自由度、オブジェクト特性、下流タスクについても調査した。
論文 参考訳(メタデータ) (2024-05-13T14:44:22Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey [17.19337964440007]
現在、この研究領域における主要なテクニック、メトリクス、データセット、モデル、最適化アプローチを要約し比較する包括的なレビューが欠如しています。
この調査は、これらの領域における最近の進歩を集約し、使用するデータセット、メトリクス、方法論の詳細な調査と分類を提供することによって、このギャップに対処することを目的としている。
既存の文献の強さ、限界、未探索領域、ギャップを識別し、この重要かつ急速に発展する分野における将来の研究の方向性についていくつかの洞察を提供する。
論文 参考訳(メタデータ) (2024-02-27T23:59:01Z) - The Efficiency Spectrum of Large Language Models: An Algorithmic Survey [54.19942426544731]
LLM(Large Language Models)の急速な成長は、様々なドメインを変換する原動力となっている。
本稿では,LLMのエンドツーエンドのアルゴリズム開発に不可欠な多面的効率性について検討する。
論文 参考訳(メタデータ) (2023-12-01T16:00:25Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。