論文の概要: H4M: Heterogeneous, Multi-source, Multi-modal, Multi-view and
Multi-distributional Dataset for Socioeconomic Analytics in the Case of
Beijing
- arxiv url: http://arxiv.org/abs/2208.12542v1
- Date: Thu, 11 Aug 2022 13:57:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 10:43:44.480160
- Title: H4M: Heterogeneous, Multi-source, Multi-modal, Multi-view and
Multi-distributional Dataset for Socioeconomic Analytics in the Case of
Beijing
- Title(参考訳): H4M:北京における社会経済分析のための異種・マルチソース・マルチモーダル・マルチビュー・マルチディストリビューションデータセット
- Authors: Yaping Zhao, Shuhui Shi, Ramgopal Ravi, Zhongrui Wang, Edmund Y. Lam,
Jichang Zhao
- Abstract要約: ヘテロジニアス・マルチソース・マルチモーダル・マルチビュー・マルチディストリビューション・データセット「H4M」について述べる。
混合データセットには、中国北京の不動産取引、関心点、交通パターン、マイクロブログのトレンドのデータが含まれている。
- 参考スコア(独自算出の注目度): 4.746544835197422
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The study of socioeconomic status has been reformed by the availability of
digital records containing data on real estate, points of interest, traffic and
social media trends such as micro-blogging. In this paper, we describe a
heterogeneous, multi-source, multi-modal, multi-view and multi-distributional
dataset named "H4M". The mixed dataset contains data on real estate
transactions, points of interest, traffic patterns and micro-blogging trends
from Beijing, China. The unique composition of H4M makes it an ideal test bed
for methodologies and approaches aimed at studying and solving problems related
to real estate, traffic, urban mobility planning, social sentiment analysis
etc. The dataset is available at: https://indigopurple.github.io/H4M/index.html
- Abstract(参考訳): 社会経済的地位の研究は、不動産、関心点、交通、マイクロブログのようなソーシャルメディアのトレンドを含むデジタル記録の入手によって、改革された。
本稿では,ヘテロジニアス,マルチソース,マルチモーダル,マルチビュー,マルチ分散データセット「h4m」について述べる。
混合データセットには、中国北京の不動産取引、関心点、交通パターン、マイクロブログのトレンドのデータが含まれている。
H4Mの独特な構成は、不動産、交通、都市移動計画、社会感情分析などに関わる問題を研究・解決するための方法論とアプローチのための理想的なテストベッドとなる。
データセットは、https://indigopurple.github.io/H4M/index.htmlで公開されている。
関連論文リスト
- MM-Soc: Benchmarking Multimodal Large Language Models in Social Media
Platforms [27.610607218826157]
本稿では,マルチモーダル大規模言語モデルによるソーシャルメディアコンテンツの理解を評価するためのベンチマークであるMM-Socを紹介する。
MM-Socは、注目すべきマルチモーダルデータセットをコンパイルし、新しい大規模なYouTubeタグ付けデータセットを組み込む。
我々は,モデルの社会的理解能力の向上の必要性を浮き彫りにして,重要な性能格差を特定した。
論文 参考訳(メタデータ) (2024-02-21T22:27:40Z) - Embrace Divergence for Richer Insights: A Multi-document Summarization
Benchmark and a Case Study on Summarizing Diverse Information from News
Articles [142.7366365876213]
同一イベントを含む複数のニュース記事において遭遇する多様な情報を要約する新しい課題を提案する。
この作業を容易にするために、多様な情報を特定するためのデータ収集スキーマの概要と、DiverseSummというデータセットをキュレートした。
データセットには245のニュース記事が含まれており、各ストーリーは10のニュース記事からなり、人間公認の参照と組み合わせられる。
論文 参考訳(メタデータ) (2023-09-17T20:28:17Z) - MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation
of Videos [106.06278332186106]
マルチモーダル・アウトプット(MSMO)を用いたマルチモーダル・サマリゼーションが有望な研究方向として浮上している。
既存のパブリックMSMOデータセットには多くの制限がある。
textbfMMSumデータセットを精巧にキュレートした。
論文 参考訳(メタデータ) (2023-06-07T07:43:11Z) - MuG: A Multimodal Classification Benchmark on Game Data with Tabular,
Textual, and Visual Fields [26.450463943664822]
本研究では,8つのデータセットを用いたマルチモーダル分類ベンチマーク MuG を提案する。
マルチアスペクトデータ分析を行い、ラベルバランス率、欠落特徴率、各モード内のデータの分布、ラベルと入力モダリティの相関など、ベンチマークに関する洞察を提供する。
論文 参考訳(メタデータ) (2023-02-06T18:09:06Z) - A deep learning framework to generate realistic population and mobility
data [5.180648702293017]
国勢調査と家庭旅行調査のデータセットは、定期的に家庭や個人から収集されている。
これらのデータセットは、プライバシの懸念による人口の限られたサンプルを表すか、集約されることが多い。
本稿では,社会経済的特徴(年齢,性別,産業など)とトリップチェーン(活動場所)の両方を含む合成人口を生成する枠組みを提案する。
論文 参考訳(メタデータ) (2022-11-14T14:05:09Z) - PATE: Property, Amenities, Traffic and Emotions Coming Together for Real
Estate Price Prediction [4.746544835197422]
我々は、さまざまな社会経済特性の経済的貢献を評価するために、複数のデータソースを使用します。
実験は北京の28,550戸で行われた。
論文 参考訳(メタデータ) (2022-08-29T12:31:10Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Multi-CPR: A Multi Domain Chinese Dataset for Passage Retrieval [19.000263567641817]
経路検索のための新しい多領域中国語データセット(Multi-CPR)を提案する。
データセットはEコマース、エンターテイメントビデオ、メディカルを含む3つの異なるドメインから収集される。
一般ドメインからのデータセットでトレーニングされた検索モデルの性能は、特定のドメインで必然的に低下する。
論文 参考訳(メタデータ) (2022-03-07T13:20:46Z) - M5Product: A Multi-modal Pretraining Benchmark for E-commercial Product
Downstream Tasks [94.80043324367858]
我々は600万以上のマルチモーダルペアからなるM5Productという大規模データセットをコントリビュートする。
M5Productには、画像、テキスト、テーブル、ビデオ、オーディオなど、複数のモードの豊富な情報が含まれている。
論文 参考訳(メタデータ) (2021-09-09T13:50:22Z) - Two-Faced Humans on Twitter and Facebook: Harvesting Social Multimedia
for Human Personality Profiling [74.83957286553924]
我々は、"PERS"と呼ばれる新しい多視点融合フレームワークを適用して、マイアーズ・ブリッグス・パーソナリティ・タイプインジケータを推定する。
実験の結果,多視点データからパーソナリティ・プロファイリングを学習する能力は,多様なソーシャル・マルチメディア・ソースからやってくるデータを効率的に活用できることが示唆された。
論文 参考訳(メタデータ) (2021-06-20T10:48:49Z) - OSOUM Framework for Trading Data Research [79.0383470835073]
私たちは、私たちの知る限り、最初のオープンソースのシミュレーションプラットフォームであるOpen SOUrce Market Simulator(OSOUM)を提供して、トレーディング市場、特にデータ市場を分析します。
我々は、購入に利用可能なさまざまなデータセットを所有する売り手と、購入に有効な適切なデータセットを検索する買い手という2つのタイプのエージェントからなる、特定のデータ市場モデルを記述し、実装する。
データ市場を扱うための商用フレームワークはすでに存在していますが、購入者および販売者の両方が(データ)市場に参加することの可能な振る舞いをシミュレートするための、自由で広範なエンドツーエンドの研究ツールを提供しています。
論文 参考訳(メタデータ) (2021-02-18T09:20:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。