論文の概要: A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering
- arxiv url: http://arxiv.org/abs/2603.15722v1
- Date: Mon, 16 Mar 2026 17:08:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:06.910493
- Title: A Framework and Prototype for a Navigable Map of Datasets in Engineering Design and Systems Engineering
- Title(参考訳): エンジニアリング設計とシステム工学におけるデータセットのナビゲート可能なマップのフレームワークとプロトタイプ
- Authors: H. Sinan Bank, Daniel R. Herber,
- Abstract要約: 本稿では,EDSEにおけるデータセットマップの体系的枠組みを提案する。
このフレームワークは、ドメイン、ライフサイクルステージ、データタイプ、フォーマットによってエンジニアリングデータセットを分類するために設計された多次元分類に基づいており、顔の発見を可能にしている。
現在のデータランドスケープの分析では、初期段階の設計とシステムアーキテクチャにおける未表現領域(データ砂漠')と、予測保守と自律システムにおける比較的よく表現された領域(データオーセ'')が明らかにされている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The proliferation of data across the system lifecycle presents both a significant opportunity and a challenge for Engineering Design and Systems Engineering (EDSE). While this ``digital thread'' has the potential to drive innovation, the fragmented and inaccessible nature of existing datasets hinders method validation, limits reproducibility, and slows research progress. Unlike fields such as computer vision and natural language processing, which benefit from established benchmark ecosystems, engineering design research often relies on small, proprietary, or ad-hoc datasets. This paper addresses this challenge by proposing a systematic framework for a ``Map of Datasets in EDSE.'' The framework is built upon a multi-dimensional taxonomy designed to classify engineering datasets by domain, lifecycle stage, data type, and format, enabling faceted discovery. An architecture for an interactive discovery tool is detailed and demonstrated through a working prototype, employing a knowledge graph data model to capture rich semantic relationships between datasets, tools, and publications. An analysis of the current data landscape reveals underrepresented areas (``data deserts'') in early-stage design and system architecture, as well as relatively well-represented areas (``data oases'') in predictive maintenance and autonomous systems. The paper identifies key challenges in curation and sustainability and proposes mitigation strategies, laying the groundwork for a dynamic, community-driven resource to accelerate data-centric engineering research.
- Abstract(参考訳): システムライフサイクルにまたがるデータの拡散は、エンジニアリングデザインとシステムエンジニアリング(EDSE)にとって大きな機会と課題の両方をもたらします。
この‘デジタルスレッド’はイノベーションを促進する可能性があるが、既存のデータセットの断片的でアクセス不能な性質は、メソッドの検証を妨げ、再現性を制限し、研究の進展を遅らせている。
確立されたベンチマークエコシステムの恩恵を受けるコンピュータビジョンや自然言語処理のような分野とは異なり、エンジニアリング設計の研究は小さな、プロプライエタリ、アドホックなデータセットに依存していることが多い。
本稿では,EDSE における ``Map of Datasets' の体系的フレームワークを提案することで,この問題に対処する。
フレームワークは、ドメイン、ライフサイクルステージ、データタイプ、フォーマットによってエンジニアリングデータセットを分類するために設計された多次元分類に基づいており、顔の発見を可能にします。
インタラクティブな発見ツールのアーキテクチャは、作業プロトタイプを通じて詳細に説明され、データセット、ツール、出版物間のリッチなセマンティックな関係をキャプチャするために知識グラフデータモデルを使用する。
現在のデータランドスケープの分析では、初期段階の設計とシステムアーキテクチャにおける未表現領域(`data deserts'')と、予測保守と自律システムにおける比較的よく表現された領域(`data oases'')が明らかになっている。
本稿では、キュレーションとサステナビリティにおける重要な課題を特定し、データ中心エンジニアリング研究を加速する動的なコミュニティ主導のリソースの基盤となる緩和戦略を提案する。
関連論文リスト
- Enginuity: Building an Open Multi-Domain Dataset of Complex Engineering Diagrams [2.8809775760443657]
Enginuity - 自動ダイアグラム解析用に設計された包括的な構造アノテーションを備えた、最初のオープンで大規模なマルチドメインエンジニアリングダイアグラムデータセットを提案する。
階層的なコンポーネント関係,コネクション,セマンティック要素をさまざまなエンジニアリング領域にわたって取得することにより,提案したデータセットは,構造化図解析,クロスモーダル情報検索,AI支援エンジニアリングシミュレーションなどの重要な下流タスクに,マルチモーダルな大規模言語モデルで対処することが可能になる。
論文 参考訳(メタデータ) (2026-01-19T18:54:50Z) - Forging Spatial Intelligence: A Roadmap of Multi-Modal Data Pre-Training for Autonomous Systems [75.78934957242403]
自動運転車とドローンは、マルチモーダル搭載センサーデータから真の空間情報を必要とする。
本稿では,この目標に向かって進む中核的な技術群を同定し,マルチモーダル・プレトレーニングのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-30T17:58:01Z) - OpenConstruction: A Systematic Synthesis of Open Visual Datasets for Data-Centric Artificial Intelligence in Construction Monitoring [4.795391174842949]
建設業界は、サイト監視のための人工知能(AI)と機械学習(ML)アプリケーションをサポートするために、視覚データにますます依存している。
ビジュアルデータセットへの関心が高まりつつあるにもかかわらず、既存のリソースは、実世界の建設条件のサイズ、品質、代表性に大きく変化している。
本研究では,これらの知見をオープンソースカタログであるOpenConstructionに合成し,データ駆動型手法開発を支援する。
論文 参考訳(メタデータ) (2025-08-15T13:56:21Z) - Customized Information and Domain-centric Knowledge Graph Construction with Large Language Models [0.0]
本稿では,構造化情報へのタイムリーなアクセスを実現するための知識グラフに基づく新しいアプローチを提案する。
本フレームワークは,情報検索,キーフレーズ抽出,セマンティックネットワーク生成,トピックマップ可視化などを含むテキストマイニングプロセスを含む。
当社の方法論を自動車電気システムの領域に適用して,スケーラブルなアプローチを実証する。
論文 参考訳(メタデータ) (2024-09-30T07:08:28Z) - Redefining Data-Centric Design: A New Approach with a Domain Model and Core Data Ontology for Computational Systems [2.872069347343959]
本稿では,新しい情報ドメインモデルを導入することにより,計算システムを設計するための革新的なデータ中心パラダイムを提案する。
提案モデルは従来のノード中心のフレームワークから離れ、オブジェクト、イベント、コンセプト、アクションを組み込んだマルチモーダルアプローチを使用して、データ中心の分類に焦点を当てている。
論文 参考訳(メタデータ) (2024-09-01T22:34:12Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - DATED: Guidelines for Creating Synthetic Datasets for Engineering Design
Applications [3.463438487417909]
本研究では,合成データセットの生成,注釈付け,検証のための包括的ガイドラインを提案する。
この研究は、データセットの適切なサイズ、多様性、有用性、現実性を保証するために、思慮深いサンプリング手法の重要性を強調している。
本論文は、総合的に、エンジニアリング設計のための合成データセットの作成と公開を意図した研究者に貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-05-15T21:00:09Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。