論文の概要: Variable-Based Network Analysis of Datasets on Data Exchange Platforms
- arxiv url: http://arxiv.org/abs/2003.05109v1
- Date: Wed, 11 Mar 2020 04:42:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 11:17:07.474115
- Title: Variable-Based Network Analysis of Datasets on Data Exchange Platforms
- Title(参考訳): データ交換プラットフォーム上のデータセットの可変ネットワーク解析
- Authors: Teruaki Hayashi, Yukio Ohsawa
- Abstract要約: 2つのデータプラットフォームサービス上のデータセットのメタデータに対して,新しい変数ベース構造解析を用いたネットワークアプローチを適用する。
データネットワークの構造は、人間関係のネットワークと同様、局所的に密集しており、非常に順応的であることに注意された。
- 参考スコア(独自算出の注目度): 0.15229257192293197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, data exchange platforms have emerged in the digital economy to
enable better resource allocation in a data-driven society, which requires
cross-organizational data collaborations. Understanding the characteristics of
the data on these platforms is important for their application; however, the
structures of such platforms have not been extensively investigated. In this
study, we apply a network approach with a novel variable-based structural
analysis to the metadata of datasets on two data platform services. It was
noted that the structures of the data networks are locally dense and highly
assortative, similar to human-related net-works. Even though the data on these
platforms are designed and collected differently, depending on the use
objectives, the variables of heterogeneous data exhibit a power distribution,
and the data networks exhibit multi-scaling behavior. Furthermore, we found
that the data collection strategies of the platforms are related to the variety
of variables, density of the networks, and their robustness from the viewpoint
of sustainability and social acceptability of the data platforms.
- Abstract(参考訳): 近年、データ交換プラットフォームがデジタル経済に登場し、データ駆動型社会におけるより良いリソース配分を可能にしている。
これらのプラットフォーム上のデータの特徴を理解することはアプリケーションにとって重要であるが、そのようなプラットフォームの構造は広く研究されていない。
本研究では,2つのデータプラットフォームサービス上のデータセットのメタデータに対して,新しい可変構造解析を用いたネットワークアプローチを適用する。
データネットワークの構造は、人間関係のネットワークと似ていて、局所的に高密度で多種多様である。
これらのプラットフォーム上のデータは、使用目的に応じて設計と収集が異なるが、異種データの変数は電力分布を示し、データネットワークはマルチスケーリング動作を示す。
さらに,プラットフォームのデータ収集戦略は,データプラットフォームの持続可能性や社会的受容性の観点から,変数の多様性,ネットワーク密度,堅牢性に関係していることがわかった。
関連論文リスト
- Leveraging GPT for the Generation of Multi-Platform Social Media Datasets for Research [0.0]
ソーシャルメディアデータセットは、偽情報、影響操作、ソーシャルセンシング、ヘイトスピーチ検出、サイバーいじめ、その他の重要なトピックの研究に不可欠である。
これらのデータセットへのアクセスは、コストとプラットフォーム規制のために制限されることが多い。
本稿では,複数のプラットフォームにまたがって,語彙的および意味論的に関連するソーシャルメディアデータセットを作成するための,大規模言語モデルの可能性について検討する。
論文 参考訳(メタデータ) (2024-07-11T09:12:39Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - On the Cross-Dataset Generalization of Machine Learning for Network
Intrusion Detection [50.38534263407915]
ネットワーク侵入検知システム(NIDS)はサイバーセキュリティの基本的なツールである。
多様なネットワークにまたがる一般化能力は、その有効性と現実のアプリケーションにとって必須の要素である。
本研究では,機械学習に基づくNIDSの一般化に関する包括的分析を行う。
論文 参考訳(メタデータ) (2024-02-15T14:39:58Z) - Decentralized Data Governance as Part of a Data Mesh Platform: Concepts
and Approaches [0.0]
データメッシュは、分散分析データ管理のための社会技術的アプローチである。
本稿では、主要なデータメッシュの概念の概念モデルを提示し、プラットフォーム手段によるガバナンスを促進するためのさまざまなアプローチについて論じる。
論文 参考訳(メタデータ) (2023-07-05T15:18:15Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Federated Learning over Harmonized Data Silos [0.7106986689736825]
Federated Learning(フェデレートラーニング)は、地理的に分散したデータサイロがデータを共有せずに共同で機械学習モデルを学習することを可能にする、分散機械学習アプローチである。
本稿では,データ調和とデータ計算の重要なステップを取り入れた,エンドツーエンドのフェデレーション学習統合システムのためのアーキテクチャビジョンを提案する。
論文 参考訳(メタデータ) (2023-05-15T19:55:51Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Towards Federated Bayesian Network Structure Learning with Continuous
Optimization [14.779035801521717]
本稿では,ベイズネットワークの構造を推定するクロスサイロ・フェデレーション学習手法を提案する。
本研究では,連続最適化に基づく分散構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-18T14:36:05Z) - Collaborative Problem Solving on a Data Platform Kaggle [0.4511923587827301]
データ交換エコシステムは、データと知識の交換を容易にするプラットフォームサービスによって開発されている。
本研究では,データ分析競合プラットフォームであるKaggleについて検討する。
論文 参考訳(メタデータ) (2021-07-26T02:28:01Z) - Representation Matters: Assessing the Importance of Subgroup Allocations
in Training Data [85.43008636875345]
訓練データにおける多様な表現は,サブグループのパフォーマンス向上と集団レベルの目標達成の鍵である。
分析と実験は、データセット構成がパフォーマンスにどのように影響するかを説明し、既存のデータにおけるトレンドとドメイン知識を用いて、意図的かつ客観的なデータセット設計を導くのに役立つ構成結果を提供する。
論文 参考訳(メタデータ) (2021-03-05T00:27:08Z) - Multi-level Graph Convolutional Networks for Cross-platform Anchor Link
Prediction [47.047999403900775]
クロスプラットフォームのアカウントマッチングは、ソーシャルネットワークの分析において重要な役割を果たす。
本稿では,ローカルネットワーク構造とハイパーグラフ構造の両方において,マルチレベルグラフの畳み込みを考慮した新しいフレームワークを提案する。
提案手法は,既存の作業におけるデータ不足を克服し,必ずしもユーザ人口統計情報に依存しない。
論文 参考訳(メタデータ) (2020-06-02T22:01:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。