論文の概要: IITP-VDLand: A Comprehensive Dataset on Decentraland Parcels
- arxiv url: http://arxiv.org/abs/2404.07533v1
- Date: Thu, 11 Apr 2024 07:54:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 14:49:00.556220
- Title: IITP-VDLand: A Comprehensive Dataset on Decentraland Parcels
- Title(参考訳): IITP-VDLand: 分散パーセルに関する包括的なデータセット
- Authors: Ankit K. Bhagat, Dipika Jha, Raju Halder, Rajendra N. Paramanik, Chandra M. Kumar,
- Abstract要約: IITP-VDLandは、パーセル特性、トレーディング履歴、過去のアクティビティ、トランザクション、ソーシャルメディアのインタラクションを含む、豊富な属性を提供する。
仮想世界における各パーセルの特異性を測定するために,データセットにキー,すなわちRarityスコアを導入する。
- 参考スコア(独自算出の注目度): 1.83621951969607
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents IITP-VDLand, a comprehensive dataset of Decentraland parcels sourced from diverse platforms. Unlike existing datasets which have limited attributes and records, IITP-VDLand offers a rich array of attributes, encompassing parcel characteristics, trading history, past activities, transactions, and social media interactions. Alongside, we introduce a key attribute in the dataset, namely Rarity score, which measures the uniqueness of each parcel within the virtual world. Addressing the significant challenge posed by the dispersed nature of this data across various sources, we employ a systematic approach, utilizing both available APIs and custom scripts, to gather it. Subsequently, we meticulously curate and organize the information into four distinct segments: (1) Characteristics Data-Fragment, (2) OpenSea Trading History Data-Fragment, (3) Ethereum Activity Transactions Data-Fragment, and (4) Social Media Data-Fragment. We envisage that this dataset would serve as a robust resource for training machine- and deep-learning models specifically designed to address real-world challenges within the domain of Decentraland parcels. The performance benchmarking of more than 20 state-of-the-art price prediction models on our dataset yields promising results, achieving a maximum R2 score of 0.8251 and an accuracy of 74.23% in case of Extra Trees Regressor and Classifier. The key findings reveal that the ensemble models performs better than both deep learning and linear models for our dataset. We observe a significant impact of coordinates, geographical proximity, rarity score, and few other economic indicators on the prediction of parcel prices.
- Abstract(参考訳): 本稿では,多種多様なプラットフォームから得られた分散型パーセルの包括的データセットであるIITP-VDLandを提案する。
限られた属性とレコードを持つ既存のデータセットとは異なり、IITP-VDLandは、パーセル特性、トレーディング履歴、過去のアクティビティ、トランザクション、ソーシャルメディアインタラクションを含む、豊富な属性の配列を提供する。
同時に、仮想世界における各パーセルのユニークさを測定するRarityスコアというデータセットに重要な属性を導入します。
さまざまなソースに分散したデータによって引き起こされる重大な課題に対処するために、利用可能なAPIとカスタムスクリプトの両方を活用する、体系的なアプローチを採用しました。
その結果,(1)特徴データフラグメント,(2)オープンシートレーディングヒストリーデータフラグメント,(3)Ethereumアクティビティトランザクションデータフラグメント,(4)ソーシャルメディアデータフラグメントの4つに,情報を慎重にキュレートし整理した。
このデータセットは、Decentralandパーセルの領域内の現実的な課題に対処するために特別に設計された、機械学習およびディープラーニングモデルをトレーニングするための堅牢なリソースとして機能する、と私たちは考えています。
我々のデータセット上で20以上の最先端価格予測モデルのパフォーマンスベンチマークは有望な結果をもたらし、エクストラツリー回帰器および分類器の場合、最大R2スコアは0.8251、精度は74.23%となる。
重要な発見は、アンサンブルモデルが、私たちのデータセットのディープラーニングモデルと線形モデルの両方よりも優れていることを示している。
コーディネート,地理的近接度,希少度スコア,その他の経済指標がパーセル価格の予測に与える影響を観察する。
関連論文リスト
- Self-consistent Deep Geometric Learning for Heterogeneous Multi-source Spatial Point Data Prediction [10.646376827353551]
環境モニタリングや天然資源管理といった分野において,マルチソース空間データ予測が重要である。
この領域の既存のモデルはドメイン固有の性質のためにしばしば不足し、様々な情報源からの情報を統合する戦略が欠如している。
我々は,地中真理ラベルを頼らずに,様々な情報源からの情報を順に整列する,革新的なマルチソース空間点データ予測フレームワークを導入する。
論文 参考訳(メタデータ) (2024-06-30T16:13:13Z) - Paved2Paradise: Cost-Effective and Scalable LiDAR Simulation by Factoring the Real World [0.2630859234884723]
Paved2Paradiseは、スクラッチからライダーデータセットを生成するためのシンプルで費用対効果の高いアプローチである。
Paved2Paradise合成データのみを訓練したモデルが果樹園におけるヒトの検出に極めて有効であることを示す。
論文 参考訳(メタデータ) (2023-12-02T12:23:07Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z) - Assessing Data Efficiency in Task-Oriented Semantic Parsing [54.87705549021248]
我々は、ある品質バーを達成するのに、ドメイン内の「ターゲット」データがどれだけ必要であるかを近似した4段階のプロトコルを導入する。
我々は,タスク指向セマンティック解析の実践者に対して,その柔軟性と適用性を示す実世界の2つのケーススタディに適用する。
論文 参考訳(メタデータ) (2021-07-10T02:43:16Z) - Cross-Dataset Collaborative Learning for Semantic Segmentation [17.55660581677053]
我々は、Cross-Dataset Collaborative Learning (CDCL) と呼ばれる、単純で柔軟で汎用的なセマンティックセグメンテーション手法を提案する。
複数のラベル付きデータセットを付与することで、各データセット上の特徴表現の一般化と識別を改善することを目指しています。
単一データセットとクロスデータセットの設定で,Cityscapes,BDD100K,CamVid,COCO Stuffという4つの多様なデータセットに対して,広範な評価を行う。
論文 参考訳(メタデータ) (2021-03-21T09:59:47Z) - Domain Adaptative Causality Encoder [52.779274858332656]
我々は,適応因果同定と局所化の課題に対処するために,依存木の特徴と敵対学習を活用する。
我々は、テキストにあらゆる種類の因果関係を統合する新しい因果関係データセット、MedCausを提案する。
論文 参考訳(メタデータ) (2020-11-27T04:14:55Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。