論文の概要: The Stanford Drone Dataset is More Complex than We Think: An Analysis of
Key Characteristics
- arxiv url: http://arxiv.org/abs/2203.11743v1
- Date: Tue, 22 Mar 2022 13:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 13:59:28.221272
- Title: The Stanford Drone Dataset is More Complex than We Think: An Analysis of
Key Characteristics
- Title(参考訳): スタンフォード大学のドローンデータセットは、想像以上に複雑だ: 重要な特徴の分析
- Authors: Joshua Andle, Nicholas Soucy, Simon Socolow, Salimeh Yasaei Sekeh
- Abstract要約: スタンフォード・ドローン・データセット(SDD)の特徴について論じる。
この不便さがユーザに提供する情報を減らし,パフォーマンスに与える影響を実証する。
私たちの意図は、今後このデータセットに適用されるパフォーマンスとメソッドを向上させると同時に、新しいユーザのためのデータセットの明らかでない特徴を明確化することにあります。
- 参考スコア(独自算出の注目度): 2.064612766965483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Several datasets exist which contain annotated information of individuals'
trajectories. Such datasets are vital for many real-world applications,
including trajectory prediction and autonomous navigation. One prominent
dataset currently in use is the Stanford Drone Dataset (SDD). Despite its
prominence, discussion surrounding the characteristics of this dataset is
insufficient. We demonstrate how this insufficiency reduces the information
available to users and can impact performance. Our contributions include the
outlining of key characteristics in the SDD, employment of an
information-theoretic measure and custom metric to clearly visualize those
characteristics, the implementation of the PECNet and Y-Net trajectory
prediction models to demonstrate the outlined characteristics' impact on
predictive performance, and lastly we provide a comparison between the SDD and
Intersection Drone (inD) Dataset. Our analysis of the SDD's key characteristics
is important because without adequate information about available datasets a
user's ability to select the most suitable dataset for their methods, to
reproduce one another's results, and to interpret their own results are
hindered. The observations we make through this analysis provide a readily
accessible and interpretable source of information for those planning to use
the SDD. Our intention is to increase the performance and reproducibility of
methods applied to this dataset going forward, while also clearly detailing
less obvious features of the dataset for new users.
- Abstract(参考訳): 個人軌跡の注釈付き情報を含むいくつかのデータセットが存在する。
このようなデータセットは、軌道予測や自律ナビゲーションなど、多くの現実世界のアプリケーションにとって不可欠である。
現在使用されている注目すべきデータセットは、Stanford Drone Dataset (SDD)である。
しかし,このデータセットの特徴に関する議論は不十分である。
この不便さがユーザに提供する情報を減らし,パフォーマンスに与える影響を実証する。
コントリビューションには、SDDの重要な特徴の概要、これらの特徴を明確に視覚化するための情報理論測度とカスタムメトリックの使用、予測性能に対する特徴の概略的影響を示すPECNetとY-Net軌道予測モデルの実装、最後にSDDとIntersection Drone(inD)データセットの比較などが含まれる。
利用可能なデータセットに関する十分な情報がなければ、ユーザがそれぞれのメソッドに最も適したデータセットを選択し、お互いの結果を再現し、自身の結果を解釈する能力が妨げられるため、SDDの重要な特徴について分析することが重要である。
この分析によって得られた観察は、SDDの使用を計画する人々にとって、容易にアクセス可能で解釈可能な情報ソースを提供する。
当社の意図は、今後このデータセットに適用されるメソッドのパフォーマンスと再現性を高めると同時に、新規ユーザのためのデータセットの明確な特徴を明確化することにあります。
関連論文リスト
- LESS: Selecting Influential Data for Targeted Instruction Tuning [69.50855460630105]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - A Survey on Autonomous Driving Datasets: Data Statistic, Annotation, and
Outlook [27.04693234358137]
高品質なデータセットは、信頼性の高い自律運転アルゴリズムの開発に不可欠である。
以前のデータセット調査では、データセットをレビューしようとしたが、限られた数に集中するか、データセットの文字に関する詳細な調査が欠如していた。
複数の視点から200以上の自律走行データセットを網羅的に検討した。
論文 参考訳(メタデータ) (2024-01-02T22:35:33Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - On The State of Data In Computer Vision: Human Annotations Remain
Indispensable for Developing Deep Learning Models [0.0]
高品質ラベル付きデータセットは機械学習(ML)の発展に重要な役割を果たす
2012年にImageNetデータセットとAlexNetモデルが登場して以来、新しいオープンソースのラベル付きビジョンデータセットのサイズはほぼ一定である。
コンピュータビジョンコミュニティの少数の出版物は、Imagenetよりも桁違いの大きさのデータセットの教師付き学習に取り組む。
論文 参考訳(メタデータ) (2021-07-31T00:08:21Z) - On the Composition and Limitations of Publicly Available COVID-19 X-Ray
Imaging Datasets [0.0]
データ不足、トレーニングとターゲット人口のミスマッチ、グループ不均衡、ドキュメントの欠如は、バイアスの重要な原因である。
本稿では,現在公開されている新型コロナウイルス胸部X線データセットの概要を紹介する。
論文 参考訳(メタデータ) (2020-08-26T14:16:01Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。