論文の概要: Growing the Simulation Ecosystem: Introducing Mesa Data to Provide
Transparent, Accessible and Extensible Data Pipelines for Simulation
Development
- arxiv url: http://arxiv.org/abs/2104.02809v3
- Date: Mon, 15 Nov 2021 11:26:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 04:25:46.326370
- Title: Growing the Simulation Ecosystem: Introducing Mesa Data to Provide
Transparent, Accessible and Extensible Data Pipelines for Simulation
Development
- Title(参考訳): シミュレーションエコシステムの成長: シミュレーション開発のための透明でアクセシブルで拡張可能なデータパイプラインを提供するMesaデータの導入
- Authors: Thomas Pike, Samantha Golden, Daniel Lowdermilk, Brandon Luong,
Benjamin Rosado
- Abstract要約: Agent Based Modelコミュニティは、モデリング者が厳格なシミュレーションを開発するのを助けるために、リッチで多様なライブラリ、プラットフォーム、アプリケーションのエコシステムを持っています。
この堅牢で多様なエコシステムにもかかわらず、微生物コミュニティからグローバルエコシステムへの生活の複雑さは、再利用可能なコードを作る上で大きな課題をもたらしている。
この研究は、より包括的なエコシステムのビジョンを提供することによって、これらの課題を緩和するための新しいツールを提供することを目指している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Agent Based Model community has a rich and diverse ecosystem of
libraries, platforms, and applications to help modelers develop rigorous
simulations. Despite this robust and diverse ecosystem, the complexity of life
from microbial communities to the global ecosystem still presents substantial
challenges in making reusable code that can optimize the ability of the
knowledge-sharing and reproducibility. This research seeks to provide new tools
to mitigate some of these challenges by offering a vision of a more holistic
ecosystem that takes researchers and practitioners from the data collection
through validation, with transparent, accessible, and extensible subcomponents.
This proposed approach is demonstrated through two data pipelines (crop yield
and synthetic population) that take users from data download through the
cleaning and processing until users of have data that can be integrated into an
ABM. These pipelines are built to be transparent: by walking users step by step
through the process, accessible: by being skill scalable so users can leverage
them without code or with code, and extensible by being freely available on the
coding sharing repository GitHub to facilitate community development. Reusing
code that simulates complex phenomena is a significant challenge but one that
must be consistently addressed to help the community move forward. This
research seeks to aid that progress by offering potential new tools extended
from the already robust ecosystem to help the community collaborate more
effectively internally and across disciplines.
- Abstract(参考訳): Agent Based Modelコミュニティは、モデリング者が厳格なシミュレーションを開発するのに役立つ、リッチで多様なライブラリ、プラットフォーム、アプリケーションのエコシステムを持っています。
この堅牢で多様なエコシステムにもかかわらず、微生物コミュニティからグローバルエコシステムへの生活の複雑さは、知識共有と再現性の能力を最適化できる再利用可能なコードを作成する上で大きな課題をまだ示している。
この研究は、研究者や実践者がデータ収集からバリデーションを通じて、透明でアクセスしやすく拡張可能なサブコンポーネントを通じて、より包括的なエコシステムのビジョンを提供することによって、これらの課題を緩和するための新しいツールを提供することを目指している。
このアプローチは、2つのデータパイプライン(crop yieldとsynthetic population)によって実証され、データのダウンロードからクリーニングと処理を経て、abmに統合可能なデータを持つまでユーザーを導く。
これらのパイプラインは透過的に構築されている: ユーザをステップバイステップで通過させることで、アクセス可能: スキルをスケーラブルにすることで、ユーザはコードやコードなしでそれらを活用でき、コミュニティ開発を容易にするために、githubのコーディング共有リポジトリで自由に利用できるように拡張できる。
複雑な現象をシミュレートするコードの再利用は大きな課題ですが、コミュニティの前進を支援するために一貫して対処する必要があります。
この研究は、すでに堅牢なエコシステムから拡張された潜在的な新しいツールを提供することによって、コミュニティがより効果的に内部的および規律にわたって協力することを支援することを目的としている。
関連論文リスト
- Enabling Advanced Land Cover Analytics: An Integrated Data Extraction Pipeline for Predictive Modeling with the Dynamic World Dataset [1.3757956340051605]
Dynamic Worldデータセットを扱うために、フレキシブルで効率的なエンドツーエンドパイプラインを提示します。
これには、ノイズ除去に取り組む前処理および表現フレームワーク、大量のデータの効率的な抽出、LULCデータの再表現が含まれる。
パイプラインのパワーを実証するために、都市化予測問題のためのデータを抽出し、優れたパフォーマンスで機械学習モデルのスイートを構築する。
論文 参考訳(メタデータ) (2024-10-11T16:13:01Z) - Code-Survey: An LLM-Driven Methodology for Analyzing Large-Scale Codebases [3.8153349016958074]
我々は,大規模規模の探索と解析を目的とした最初のLCM駆動型手法であるCode-Surveyを紹介した。
調査を慎重に設計することで、Code-Surveyはコミット、Eメールなどの構造化されていないデータを、構造化、構造化、分析可能なデータセットに変換する。
これにより、複雑なソフトウェアの進化を定量的に分析し、設計、実装、保守、信頼性、セキュリティに関する貴重な洞察を明らかにすることができる。
論文 参考訳(メタデータ) (2024-09-24T17:08:29Z) - GenRec: A Flexible Data Generator for Recommendations [1.384948712833979]
GenRecは、現実的でよく知られた特性を示す合成ユーザ・イテム相互作用を生成するための新しいフレームワークである。
このフレームワークは潜在因子モデリングに基づく生成プロセスに基づいている。
論文 参考訳(メタデータ) (2024-07-23T15:53:17Z) - LEGENT: Open Platform for Embodied Agents [60.71847900126832]
LEGENTはLarge Language Models (LLM) とLarge Multimodal Models (LMM) を用いたエンボディエージェントを開発するためのオープンでスケーラブルなプラットフォームである。
LEGENTはリッチでインタラクティブな3D環境を提供し、コミュニケーション可能でアクション可能なエージェントをユーザフレンドリーなインターフェースと組み合わせている。
実験では、EGENT生成データに基づいて訓練された胚性視覚言語モデルが、エンボディタスクにおいてGPT-4Vを超える。
論文 参考訳(メタデータ) (2024-04-28T16:50:12Z) - A Knowledge-Oriented Approach to Enhance Integration and Communicability
in the Polkadot Ecosystem [0.0]
本稿では,これらの課題に対処するために,ドメインオントロジーを含む概念的フレームワークであるPontoを提案する。
POntoはエコシステムの概念と関係を構造化した表現を提供し、プラットフォームを形式的に理解することを可能にする。
提案されたナレッジ指向のアプローチは、統合性とコミュニケーション性を高め、より広い範囲のユーザがエコシステムに参加し、AIベースのアプリケーションの開発を容易にすることを可能にする。
論文 参考訳(メタデータ) (2023-08-01T17:34:30Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Off-the-Grid MARL: Datasets with Baselines for Offline Multi-Agent
Reinforcement Learning [4.159549932951023]
オフラインマルチエージェント強化学習(MARL)は、このようなデータセットから効果的な分散型コントローラを構築するための有望なパラダイムを提供する。
MARLはまだ初期段階であり、標準化されたベンチマークデータセットとベースラインがない。
OG-MARLは、協調的なオフラインMARL研究のためのベースラインを持つ高品質データセットのリポジトリである。
論文 参考訳(メタデータ) (2023-02-01T15:41:27Z) - A Transformer Framework for Data Fusion and Multi-Task Learning in Smart
Cities [99.56635097352628]
本稿では,新興スマートシティを対象としたトランスフォーマーベースのAIシステムを提案する。
ほぼ全ての入力データと出力タスクタイプをサポートし、現在のS&CCをサポートする。
S&CC環境を代表する多様なタスクセットを学習して実演する。
論文 参考訳(メタデータ) (2022-11-18T20:43:09Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。