論文の概要: Enhancing Data Space Semantic Interoperability through Machine Learning:
a Visionary Perspective
- arxiv url: http://arxiv.org/abs/2303.08932v1
- Date: Wed, 15 Mar 2023 20:57:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 17:48:48.995223
- Title: Enhancing Data Space Semantic Interoperability through Machine Learning:
a Visionary Perspective
- Title(参考訳): 機械学習によるデータ空間セマンティック相互運用性の強化:ビジョン的視点
- Authors: Zeyd Boukhers and Christoph Lange and Oya Beyan
- Abstract要約: 我々のビジョンペーパーは、機械学習の適用を通じて、データ空間におけるセマンティックインターオペラビリティの未来を改善する計画の概要を述べている。
機械学習のパワーを活用することで、データ空間におけるセマンティック相互運用性を大幅に改善できると考えています。
データ空間の将来に対する私たちのビジョンは、従来のデータ交換の限界に対処し、コミュニティのすべてのメンバーにとってよりアクセスしやすく、価値のあるデータを提供します。
- 参考スコア(独自算出の注目度): 5.994412766684842
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our vision paper outlines a plan to improve the future of semantic
interoperability in data spaces through the application of machine learning.
The use of data spaces, where data is exchanged among members in a
self-regulated environment, is becoming increasingly popular. However, the
current manual practices of managing metadata and vocabularies in these spaces
are time-consuming, prone to errors, and may not meet the needs of all
stakeholders. By leveraging the power of machine learning, we believe that
semantic interoperability in data spaces can be significantly improved. This
involves automatically generating and updating metadata, which results in a
more flexible vocabulary that can accommodate the diverse terminologies used by
different sub-communities. Our vision for the future of data spaces addresses
the limitations of conventional data exchange and makes data more accessible
and valuable for all members of the community.
- Abstract(参考訳): 我々のビジョンペーパーは、機械学習の適用を通じて、データ空間におけるセマンティックインターオペラビリティの未来を改善する計画の概要である。
自己規制された環境のメンバ間でデータ交換を行うデータ空間の利用は、ますます人気が高まっている。
しかしながら、これらの空間におけるメタデータと語彙を管理する現在の手動のプラクティスは、時間がかかり、エラーを起こしやすく、すべての利害関係者のニーズを満たしていない可能性がある。
機械学習のパワーを活用することで、データ空間におけるセマンティック相互運用性を大幅に改善できると考えています。
これはメタデータの自動生成と更新を伴い、様々なサブコミュニティが使用する多様な用語に対応可能な、より柔軟な語彙となる。
データ空間の将来に対する私たちのビジョンは、従来のデータ交換の限界に対処し、コミュニティのすべてのメンバーにとってよりアクセスしやすく、価値のあるデータを提供します。
関連論文リスト
- SPACE-IDEAS: A Dataset for Salient Information Detection in Space Innovation [0.3017070810884304]
本研究では,空間領域に関連するイノベーションのアイデアから情報を検出するためのデータセットであるSPACE-IDEASを紹介する。
SPACE-IDEASのテキストは大きく異なり、非公式、技術的、学術的、ビジネス指向の書き込みスタイルを含んでいる。
手動でアノテートしたデータセットに加えて、大きな生成言語モデルを使ってアノテートされた拡張バージョンをリリースします。
論文 参考訳(メタデータ) (2024-03-25T17:04:02Z) - Maximizing Data Efficiency for Cross-Lingual TTS Adaptation by
Self-Supervised Representation Mixing and Embedding Initialization [57.38123229553157]
本稿では,テキスト音声合成システムにおける言語適応のための効果的な伝達学習フレームワークを提案する。
ラベル付きおよびラベルなしの最小データを用いて言語適応を実現することに注力する。
実験結果から,本フレームワークは,ラベル付きデータの4つの発声とラベル付きデータの15分で,未知の言語で理解不能な音声を合成できることが示唆された。
論文 参考訳(メタデータ) (2024-01-23T21:55:34Z) - Augmented Datasheets for Speech Datasets and Ethical Decision-Making [2.7106766103546236]
音声データセットは音声言語技術(SLT)の訓練に不可欠である
基礎となるトレーニングデータの多様性の欠如は、公平で堅牢なSLT製品を構築する上で、深刻な制限につながる可能性がある。
このようなデータ収集の倫理に関して、基礎となるトレーニングデータに対する監視の欠如がしばしばある。
論文 参考訳(メタデータ) (2023-05-08T12:49:04Z) - A Data Fusion Framework for Multi-Domain Morality Learning [3.0671872389903547]
複数の異種データセットをトレーニングするためのデータ融合フレームワークについて述べる。
提案フレームワークは,道徳的推論における先行研究と比較して,異なるデータセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-04-04T22:05:02Z) - Label Name is Mantra: Unifying Point Cloud Segmentation across
Heterogeneous Datasets [17.503843467554592]
本稿では,異なるラベル集合を持つ異種データセットからの学習を支援する原理的アプローチを提案する。
我々の考えは、学習済みの言語モデルを用いて、ラベル名を用いて離散ラベルを連続的な潜在空間に埋め込むことである。
私たちのモデルは最先端の技術を大きなマージンで上回ります。
論文 参考訳(メタデータ) (2023-03-19T06:14:22Z) - A Vision for Semantically Enriched Data Science [19.604667287258724]
ドメイン知識の活用やデータセマンティクスといった重要な分野は、ほとんど自動化されていない分野です。
データサイエンスの自動化のための新しいツールと組み合わせて、データに対する“セマンティック”な理解と推論を活用することが、一貫性と説明可能なデータ拡張と変換にどのように役立つか、私たちは考えています。
論文 参考訳(メタデータ) (2023-03-02T16:03:12Z) - Robotic Skill Acquisition via Instruction Augmentation with
Vision-Language Models [70.82705830137708]
言語条件制御のためのデータ駆動型インストラクション拡張(DIAL)について紹介する。
我々は,CLIPのセマンティック理解を利用したセミ言語ラベルを用いて,未知の実演データの大規模なデータセットに知識を伝達する。
DIALは、模倣学習ポリシーによって、新しい能力を獲得し、元のデータセットにない60の新しい命令を一般化することができる。
論文 参考訳(メタデータ) (2022-11-21T18:56:00Z) - Privacy-Preserving Machine Learning for Collaborative Data Sharing via
Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。
本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T17:36:58Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。