論文の概要: Federated Data Science to Break Down Silos [Vision]
- arxiv url: http://arxiv.org/abs/2111.13186v1
- Date: Thu, 25 Nov 2021 17:41:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-29 17:19:45.437808
- Title: Federated Data Science to Break Down Silos [Vision]
- Title(参考訳): フェデレーションデータサイエンスがサイロを崩壊させる[ビジョン]
- Authors: Essam Mansour, Kavitha Srinivas, Katja Hose
- Abstract要約: KEKはオープンなフェデレーション付きデータサイエンスプラットフォームで、データサイエンスパイプラインとその(メタ)データを共有するだけでなく、効率的な検索方法も提供する。
そうすることでKEKは、意味的に関連があり、ある目標を達成するために組み合わせられるアーティファクトを実際に見つけるという、これまで無視された課題に対処する。
- 参考スコア(独自算出の注目度): 7.983153466056216
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Similar to Open Data initiatives, data science as a community has launched
initiatives for sharing not only data but entire pipelines, derivatives,
artifacts, etc. (Open Data Science). However, the few efforts that exist focus
on the technical part on how to facilitate sharing, conversion, etc. This
vision paper goes a step further and proposes KEK, an open federated data
science platform that does not only allow for sharing data science pipelines
and their (meta)data but also provides methods for efficient search and, in the
ideal case, even allows for combining and defining pipelines across platforms
in a federated manner. In doing so, KEK addresses the so far neglected
challenge of actually finding artifacts that are semantically related and that
can be combined to achieve a certain goal.
- Abstract(参考訳): Open Dataイニシアチブと同様に、コミュニティとしてのデータサイエンスは、データだけでなく、パイプライン全体、デリバティブ、アーティファクトなどを共有するイニシアチブ(Open Data Science)を立ち上げた。
しかし、いくつかの取り組みは、共有、変換等を容易にする方法について技術的な部分に焦点を当てている。
オープンフェデレーションデータサイエンスプラットフォームであるkekは、データサイエンスパイプラインとその(メタ)データを共有するだけでなく、効率的な検索方法を提供し、理想的な場合には、プラットフォーム間でパイプラインを結合し、定義することもできる。
そうすることでKEKは、意味的に関連があり、ある目標を達成するために組み合わせられるアーティファクトを実際に見つけるという、これまで無視された課題に対処する。
関連論文リスト
- FedNE: Surrogate-Assisted Federated Neighbor Embedding for Dimensionality Reduction [47.336599393600046]
textscFedNEは、textscFedAvgフレームワークと対照的なNEテクニックを統合する新しいアプローチである。
我々は、合成データセットと実世界のデータセットの両方について包括的な実験を行う。
論文 参考訳(メタデータ) (2024-09-17T19:23:24Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - KGLiDS: A Platform for Semantic Abstraction, Linking, and Automation of Data Science [4.120803087965204]
本稿では、機械学習と知識グラフ技術を用いて、データサイエンスアーティファクトのセマンティクスとその接続を抽象化し、キャプチャするスケーラブルなプラットフォームKGLiDSを提案する。
この情報に基づいて、KGLiDSはデータディスカバリやパイプライン自動化など、さまざまなダウンストリームアプリケーションを可能にする。
論文 参考訳(メタデータ) (2023-03-03T20:31:04Z) - Mapping Climate Change Research via Open Repositories & AI: advantages
and limitations for an evidence-based R&D policy-making [0.0]
ここ数年、いくつかのイニシアチブが、オープンな方法で研究出力データとメタデータへのアクセスを提供し始めている。
これらのプラットフォームは科学的な生産を一般大衆に開放しており、エビデンスベースの政策決定にとって貴重な資産となり得る。
STIのエコシステム全体を包括的に把握するためには、これらのリソースのそれぞれが提供する情報を組み合わせて分析する必要がある。
本稿では,デンマークのSTIエコシステム全体の気候活動研究を4つのオープンアクセスSTIデータソースを用いてマッピングする場合について検討する。
論文 参考訳(メタデータ) (2022-09-19T12:56:30Z) - DC-BENCH: Dataset Condensation Benchmark [79.18718490863908]
この研究は、データセットの凝縮に関する最初の大規模標準ベンチマークを提供する。
それは、凝縮法の生成可能性と有効性を包括的に反映する一連の評価から成り立っている。
ベンチマークライブラリは、将来の研究とアプリケーションを容易にするためにオープンソース化されている。
論文 参考訳(メタデータ) (2022-07-20T03:54:05Z) - Paradigm selection for Data Fusion of SAR and Multispectral Sentinel
data applied to Land-Cover Classification [63.072664304695465]
本稿では、畳み込みニューラルネットワーク(CNN)に基づく4つのデータ融合パラダイムを分析し、実装する。
目標は、最良のデータ融合フレームワークを選択するための体系的な手順を提供することであり、その結果、最高の分類結果が得られる。
この手順は、土地被覆分類のために検証されているが、他のケースに転送することができる。
論文 参考訳(メタデータ) (2021-06-18T11:36:54Z) - FedOCR: Communication-Efficient Federated Learning for Scene Text
Recognition [76.26472513160425]
本研究では、分散化されたデータセットを用いて、ロバストなシーンテキスト認識器を訓練する方法について研究する。
FedOCRをエンドデバイスにデプロイするのに適したものにするために、軽量モデルとハッシュ技術の使用を含む2つの改善を行った。
論文 参考訳(メタデータ) (2020-07-22T14:30:50Z) - A Common Operating Picture Framework Leveraging Data Fusion and Deep
Learning [0.7348448478819135]
本稿では,処理,爆発,拡散のソリューションを高速化するためのデータ融合フレームワークを提案する。
私たちのプラットフォームは、ディープラーニングやその他の処理手段を活用することで、複数のデータソースから情報を抽出するサービスの集合体です。
最初のイテレーションでは、ビジュアルデータ(FMV, WAMI, CCTV/PTZ-Cameras, オープンソースビデオなど)とAISデータストリーム(衛星と地上ソース)に焦点を当てました。
論文 参考訳(メタデータ) (2020-01-16T18:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。