論文の概要: The Stanford Drone Dataset is More Complex than We Think: An Analysis of
Key Characteristics
- arxiv url: http://arxiv.org/abs/2203.11743v1
- Date: Tue, 22 Mar 2022 13:58:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 13:59:28.221272
- Title: The Stanford Drone Dataset is More Complex than We Think: An Analysis of
Key Characteristics
- Title(参考訳): スタンフォード大学のドローンデータセットは、想像以上に複雑だ: 重要な特徴の分析
- Authors: Joshua Andle, Nicholas Soucy, Simon Socolow, Salimeh Yasaei Sekeh
- Abstract要約: スタンフォード・ドローン・データセット(SDD)の特徴について論じる。
この不便さがユーザに提供する情報を減らし,パフォーマンスに与える影響を実証する。
私たちの意図は、今後このデータセットに適用されるパフォーマンスとメソッドを向上させると同時に、新しいユーザのためのデータセットの明らかでない特徴を明確化することにあります。
- 参考スコア(独自算出の注目度): 2.064612766965483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Several datasets exist which contain annotated information of individuals'
trajectories. Such datasets are vital for many real-world applications,
including trajectory prediction and autonomous navigation. One prominent
dataset currently in use is the Stanford Drone Dataset (SDD). Despite its
prominence, discussion surrounding the characteristics of this dataset is
insufficient. We demonstrate how this insufficiency reduces the information
available to users and can impact performance. Our contributions include the
outlining of key characteristics in the SDD, employment of an
information-theoretic measure and custom metric to clearly visualize those
characteristics, the implementation of the PECNet and Y-Net trajectory
prediction models to demonstrate the outlined characteristics' impact on
predictive performance, and lastly we provide a comparison between the SDD and
Intersection Drone (inD) Dataset. Our analysis of the SDD's key characteristics
is important because without adequate information about available datasets a
user's ability to select the most suitable dataset for their methods, to
reproduce one another's results, and to interpret their own results are
hindered. The observations we make through this analysis provide a readily
accessible and interpretable source of information for those planning to use
the SDD. Our intention is to increase the performance and reproducibility of
methods applied to this dataset going forward, while also clearly detailing
less obvious features of the dataset for new users.
- Abstract(参考訳): 個人軌跡の注釈付き情報を含むいくつかのデータセットが存在する。
このようなデータセットは、軌道予測や自律ナビゲーションなど、多くの現実世界のアプリケーションにとって不可欠である。
現在使用されている注目すべきデータセットは、Stanford Drone Dataset (SDD)である。
しかし,このデータセットの特徴に関する議論は不十分である。
この不便さがユーザに提供する情報を減らし,パフォーマンスに与える影響を実証する。
コントリビューションには、SDDの重要な特徴の概要、これらの特徴を明確に視覚化するための情報理論測度とカスタムメトリックの使用、予測性能に対する特徴の概略的影響を示すPECNetとY-Net軌道予測モデルの実装、最後にSDDとIntersection Drone(inD)データセットの比較などが含まれる。
利用可能なデータセットに関する十分な情報がなければ、ユーザがそれぞれのメソッドに最も適したデータセットを選択し、お互いの結果を再現し、自身の結果を解釈する能力が妨げられるため、SDDの重要な特徴について分析することが重要である。
この分析によって得られた観察は、SDDの使用を計画する人々にとって、容易にアクセス可能で解釈可能な情報ソースを提供する。
当社の意図は、今後このデータセットに適用されるメソッドのパフォーマンスと再現性を高めると同時に、新規ユーザのためのデータセットの明確な特徴を明確化することにあります。
関連論文リスト
- DRUPI: Dataset Reduction Using Privileged Information [20.59889438709671]
データセットリダクション(DR)は、ターゲットタスクのパフォーマンスを維持しながら、大規模なデータセットからより小さなサブセットにサンプルを選択または蒸留する。
本稿では,DRUPI(Privleged Information)を用いたデータセットリダクションについて紹介する。
我々の研究結果によると、効果的な特徴ラベルは過度に差別的かつ過度に多様性があり、中程度のレベルがデータセットの有効性を改善するのに最適であることが判明した。
論文 参考訳(メタデータ) (2024-10-02T14:49:05Z) - Data Proportion Detection for Optimized Data Management for Large Language Models [32.62631669919273]
我々は,事前学習データの割合の自動推定を可能にする新しいトピック,textitdata proportion Detectionを導入する。
データ比例検出のための厳密な理論的証明、実用的なアルゴリズム、予備実験結果を提供する。
論文 参考訳(メタデータ) (2024-09-26T04:30:32Z) - Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - Computationally and Memory-Efficient Robust Predictive Analytics Using Big Data [0.0]
本研究では、データ不確実性、ストレージ制限、ビッグデータを用いた予測データ駆動モデリングの課題をナビゲートする。
本稿では,ロバスト主成分分析(RPCA)を有効ノイズ低減と外乱除去に利用し,最適センサ配置(OSP)を効率的なデータ圧縮・記憶に活用する。
論文 参考訳(メタデータ) (2024-03-27T22:39:08Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。