Fugu-MT 論文翻訳(概要): Measures of Complexity for Large Scale Image Datasets

論文の概要: Measures of Complexity for Large Scale Image Datasets

arxiv url: http://arxiv.org/abs/2008.04431v1
Date: Mon, 10 Aug 2020 21:54:23 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-31 23:14:48.931366
Title: Measures of Complexity for Large Scale Image Datasets
Title（参考訳）: 大規模画像データセットの複雑度尺度
Authors: Ameet Annasaheb Rahane and Anbumani Subramanian
Abstract要約: 本研究では,データセットの複雑さを計測する比較的単純な手法のシリーズを構築する。我々は,自動運転研究コミュニティであるCityscapes,IDD,BDD,Vistaの4つのデータセットを用いて分析を行った。エントロピーに基づくメトリクスを用いて、これらのデータセットのランク順の複雑さを示し、ディープラーニングに関して確立されたランク順と比較する。
参考スコア（独自算出の注目度）: 0.3655021726150368
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Large scale image datasets are a growing trend in the field of machine learning. However, it is hard to quantitatively understand or specify how various datasets compare to each other - i.e., if one dataset is more complex or harder to ``learn'' with respect to a deep-learning based network. In this work, we build a series of relatively computationally simple methods to measure the complexity of a dataset. Furthermore, we present an approach to demonstrate visualizations of high dimensional data, in order to assist with visual comparison of datasets. We present our analysis using four datasets from the autonomous driving research community - Cityscapes, IDD, BDD and Vistas. Using entropy based metrics, we present a rank-order complexity of these datasets, which we compare with an established rank-order with respect to deep learning.
Abstract（参考訳）: 大規模な画像データセットは、機械学習分野における成長傾向である。しかし、深層学習ベースのネットワークに関して、1つのデータセットが'learn'よりも複雑または困難である場合、さまざまなデータセットが相互にどのように比較するかを定量的に理解または特定することは困難である。本研究では,データセットの複雑さを測る比較的単純な手法のシリーズを構築する。さらに,データセットの視覚的比較を支援するために,高次元データの可視化を実証する手法を提案する。我々は,自動運転研究コミュニティであるCityscapes,IDD,BDD,Vistaの4つのデータセットを用いて分析を行った。エントロピーに基づくメトリクスを用いて、これらのデータセットのランク順の複雑さを示し、ディープラーニングに関して確立されたランク順と比較する。

関連論文リスト

Learning to Solve Complex Problems via Dataset Decomposition [53.1641602054716]
本研究では、複雑なデータセットをよりシンプルで学習しやすいコンポーネントに分解する逆カリキュラム生成アプローチについて検討する。そこで本研究では,教師が段階的に推論する能力を備えた教師学習フレームワークを提案する。
論文参考訳（メタデータ） (2026-02-23T19:25:40Z)
What Matters in Learning from Large-Scale Datasets for Robot Manipulation [12.703188997313223]
我々はこの質問に答えるために大規模なデータセット合成研究を行っている。既存のデータセットの多様性の共通源を手続き的にエミュレートするデータ生成フレームワークを開発した。カメラのポーズや空間配置は、収集における多様性と検索におけるアライメントの両方にとって重要な次元であることがわかった。
論文参考訳（メタデータ） (2025-06-16T14:25:29Z)
Anymate: A Dataset and Baselines for Learning 3D Object Rigging [18.973312365787137]
本稿では,230Kの3Dアセットの大規模データセットと,専門家によるリギングとスキン情報の組み合わせについて述べる。本稿では,関節,接続性,およびスキンウェイト予測のための3つの逐次モジュールを用いた学習ベースの自動リギングフレームワークを提案する。我々のモデルは既存の手法を著しく上回り、自動化リギングとスキンニングにおける将来の手法を比較する基盤を提供する。
論文参考訳（メタデータ） (2025-05-09T17:59:33Z)
Making Sense of Data in the Wild: Data Analysis Automation at Scale [0.1747623282473278]
本稿では,インテリジェントエージェントと検索拡張生成を組み合わせることで,データ解析,データセットキュレーション,インデックス作成を大規模に自動化する手法を提案する。提案手法により,より詳細なデータセット記述,より高いヒット率,データセット検索タスクの多様性が得られた。
論文参考訳（メタデータ） (2025-01-27T10:04:10Z)
EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文参考訳（メタデータ） (2025-01-14T13:42:22Z)
Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文参考訳（メタデータ） (2024-07-20T17:14:31Z)
Scaling Laws for the Value of Individual Data Points in Machine Learning [55.596413470429475]
個々のデータポイントの値のスケーリング行動を調べることによって、新しい視点を導入する。スケーリング法則を支持するための学習理論を提供し、それが様々なモデルクラスにまたがっていることを実証的に観察する。私たちの研究は、個々のデータポイントの値のスケーリング特性を理解し、活用するための第一歩です。
論文参考訳（メタデータ） (2024-05-30T20:10:24Z)
MASSTAR: A Multi-Modal and Large-Scale Scene Dataset with a Versatile Toolchain for Surface Prediction and Completion [25.44529512862336]
MASSTARはマルチモーダルなlArgeスケールのシーンデータセットであり、サーフAce predictionと完了のためのVerSatile Toolchainを備えている。環境から生の3Dデータを処理するための汎用的で効率的なツールチェーンを開発した。実世界の部分的なデータを含む1000以上のシーンレベルのモデルからなるサンプルデータセットを生成する。
論文参考訳（メタデータ） (2024-03-18T11:35:18Z)
TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文参考訳（メタデータ） (2022-08-16T20:46:08Z)
REGRAD: A Large-Scale Relational Grasp Dataset for Safe and Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。データセットは2D画像と3Dポイントクラウドの両方で収集されます。ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文参考訳（メタデータ） (2021-04-29T05:31:21Z)
Joint Geometric and Topological Analysis of Hierarchical Datasets [7.098759778181621]
本稿では,複数の階層的データセットに整理された高次元データに注目する。この研究の主な新規性は、トポロジカルデータ分析と幾何多様体学習という、2つの強力なデータ分析アプローチの組み合わせにある。本手法は, 最新手法と比較して優れた分類結果をもたらすことを示した。
論文参考訳（メタデータ） (2021-04-03T13:02:00Z)
Automatic Curation of Large-Scale Datasets for Audio-Visual Representation Learning [62.47593143542552]
本稿では,自動データセットキュレーションのためのサブセット最適化手法について述べる。本研究では,高視聴覚対応の映像を抽出し,自己監視モデルが自動的に構築されているにもかかわらず,既存のスケールのビデオデータセットと類似したダウンストリームパフォーマンスを達成できることを実証した。
論文参考訳（メタデータ） (2021-01-26T14:27:47Z)
Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。私たちのフレームワークは、サンプル間の関係をよく保存します。サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文参考訳（メタデータ） (2020-07-11T10:57:45Z)
Dataset Condensation with Gradient Matching [36.14340188365505]
本研究では,大規模なデータセットを,深層ニューラルネットワークをスクラッチからトレーニングするための情報的合成サンプルの小さなセットに凝縮させることを学習する,データセット凝縮という,データ効率のよい学習のためのトレーニングセット合成手法を提案する。いくつかのコンピュータビジョンベンチマークでその性能を厳格に評価し、最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-06-10T16:30:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。