論文の概要: Data Architecture for Digital Object Space Management Service (DOSM)
using DAT
- arxiv url: http://arxiv.org/abs/2306.12909v3
- Date: Sun, 23 Jul 2023 21:08:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 19:06:42.550455
- Title: Data Architecture for Digital Object Space Management Service (DOSM)
using DAT
- Title(参考訳): DATを用いたデジタルオブジェクト空間管理サービス(DOSM)のデータアーキテクチャ
- Authors: Moamin Abughazala, Henry Muccini
- Abstract要約: この研究は、データの動き、データフォーマット、データ位置、データ処理(バッチまたはリアルタイム)、データストレージ技術、およびデータ上の主要な操作を記述することに焦点を当てている。
データアーキテクチャは、ソースから目的地へのデータフローを記述する複雑なタスクである。
- 参考スコア(独自算出の注目度): 1.8945921149936187
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Internet of Things (IoT) data and social media data are two of the
fastest-growing data segments. Having high-quality data is crucial for making
informed business decisions. The strategic process of leveraging insights from
data is known as data-driven decision-making. To achieve this, it is necessary
to collect, store, analyze, and protect data in the best ways possible. Data
architecture is a complex task that involves describing the flow of data from
its source to its destination and creating a blueprint for managing the data to
meet business needs for information. In this paper, we utilize the Data
Architecture Tool (DAT) to model data for Digital Space Management Service,
which was developed as part of the VASARI project. This work focuses on
describing the movement of data, data formats, data location, data processing
(batch or real-time), data storage technologies, and main operations on the
data.
- Abstract(参考訳): IoT(Internet of Things)データとソーシャルメディアデータは、急成長するデータセグメントの2つだ。
高品質なデータを持つことは、インフォームドビジネスの決定に不可欠です。
データからの洞察を活用する戦略的プロセスは、データ駆動意思決定として知られている。
これを達成するためには、データの収集、保存、分析、保護を可能な限り最善の方法で行う必要があります。
データアーキテクチャは、ソースから目的地へのデータフローを記述し、情報に対するビジネスニーズを満たすためにデータを管理するブループリントを作成する複雑なタスクである。
本稿では,データアーキテクチャツール(Data Architecture Tool, DAT)を用いて,VASARIプロジェクトの一部として開発されたDigital Space Management Serviceのデータモデリングを行う。
本研究は、データ移動、データフォーマット、データロケーション、データ処理(バッチまたはリアルタイム)、データストレージ技術、データに関する主要な操作を記述することに焦点を当てる。
関連論文リスト
- Architectural Design Decisions for Self-Serve Data Platforms in Data
Meshes [3.627365672061558]
データメッシュは、分析的エンタープライズデータから大規模に価値を管理し、生成するための、新たな分散型アプローチである。
データの所有権は、データに最も近いビジネスドメインに移行し、データの共有と管理を自律的な製品として促進し、フェデレートされた自動データガバナンスモデルを使用する。
データメッシュは、データプロダクトを効率的に構築、共有、管理するために、ドメインチームとガバナンスチームにサービスを提供するマネージドデータプラットフォームに依存しています。
論文 参考訳(メタデータ) (2024-02-07T09:13:26Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Architecting Data-Intensive Applications : From Data Architecture Design
to Its Quality Assurance [0.0]
データアーキテクチャは、ビジネスニーズを満たすためのデータの記述、収集、保存、処理、分析において重要である。
各種の業界領域において,DATを5つ以上のケースで評価し,その例外的な適応性と有効性を示した。
論文 参考訳(メタデータ) (2024-01-22T14:58:54Z) - Data Management For Large Language Models: A Survey [66.59562797566163]
大規模言語モデル(LLM)の訓練におけるデータの役割
本調査は,LLMの事前学習および教師付き微調整段階におけるデータ管理の現状を概観する。
論文 参考訳(メタデータ) (2023-12-04T07:42:16Z) - Data Acquisition: A New Frontier in Data-centric AI [65.90972015426274]
まず、現在のデータマーケットプレースを調査し、データセットに関する詳細な情報を提供するプラットフォームが不足していることを明らかにする。
次に、データプロバイダと取得者間のインタラクションをモデル化するベンチマークであるDAMチャレンジを紹介します。
提案手法の評価は,機械学習における効果的なデータ取得戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-11-22T22:15:17Z) - Modeling Data Analytics Architecture for Smart Cities Data-Driven
Applications using DAT [1.8945921149936187]
この記事では、DATを利用したデータ駆動スマートシティアプリケーションのためのモデル駆動エンジニアリングを使用したデータ分析アーキテクチャ(DAA)の開発経験について紹介します。
DAAは、DATを利用したデータ駆動スマートシティアプリケーションにモデル駆動エンジニアリングを使用する。
論文 参考訳(メタデータ) (2023-07-17T21:52:57Z) - DAT: Data Architecture Modeling Tool for Data-Driven Applications [1.6037279419318131]
データアーキテクチャ(DA)は、ビジネスニーズを満たすためのデータの記述、収集、保存、処理、分析に焦点を当てている。
DATは、データアーキテクト、データエンジニア、その他のステークホルダーが、システムを通してデータがどのように流れるかを記述することを可能にする、モデル駆動のエンジニアリングツールです。
論文 参考訳(メタデータ) (2023-06-21T11:24:59Z) - A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。
ディープラーニング技術はこの10年で前例のない発展を遂げた。
本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文 参考訳(メタデータ) (2023-01-13T15:11:38Z) - A Big Data Lake for Multilevel Streaming Analytics [0.4640835690336652]
本稿では,データレイクと呼ばれるデータストレージアーキテクチャにおいて,高ボリューム,速度,多種多様なデータを生の形式で保存することに焦点を当てる。
データレイクの開発に使用できるさまざまなオープンソースと商用プラットフォームについて議論し、比較する。
データストリームの取り込み、ステージング、マルチレベルストリーミング分析のための実世界のデータレイク開発ユースケースを提案する。
論文 参考訳(メタデータ) (2020-09-25T19:57:21Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。