論文の概要: Altar: Structuring Sharable Experimental Data from Early Exploration to Publication
- arxiv url: http://arxiv.org/abs/2602.18588v1
- Date: Fri, 20 Feb 2026 19:54:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.179153
- Title: Altar: Structuring Sharable Experimental Data from Early Exploration to Publication
- Title(参考訳): Altar: 初期の探査から公開までの実験データを構造化する
- Authors: William Gaultier, Andrea Lodetti, Ian Coghill, David Colliaux, Maximilian Fleck, Alienor Lahlou,
- Abstract要約: 実験プロジェクトのアクティブな開発フェーズでデータとメタデータを管理することは、大きな課題を示します。
ここでは、厳密なデータモデルを導入することなく、プロジェクトの開始から実験データを構築するためのフレームワークであるAltarを紹介する。
AltarはSacredの実験追跡モデルを中心に構築され、実験データ(Meta)をキャプチャして構造する。
- 参考スコア(独自算出の注目度): 0.6927055673104934
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Managing the data and metadata during the active development phase of an experimental project presents a significant challenge, particularly in collaborative research. This phase is frequently overlooked in Data Management Plans included in project proposals, despite its important role in ensuring reproducibility and preventing the need for retroactive reconstruction at the time of publication. Here we present Altar, a lightweight, domain-agnostic framework for structuring experimental data from the onset of a project without imposing rigid data models. Altar is built around the Sacred experiment-tracking model and captures experimental (meta)data and structures them. Parameters, metadata, curves and small files are stored in a flexible NoSQL database, while large raw data are maintained in dedicated storage and linked through unique identifiers, ensuring efficiency and traceability. This integration is composable with exiting workflows, allowing integration with minimial disruption of work habits. We document different pathways to use Altar based on users skillset (PhD students, Post-docs, Principal Investigators, Laboratory administrators, System administrators). While getting started with Altar does not require a specialized infrastructure, the framework can be easily deployed on a server and made publicly accessible when scaling up or preparing data for publication. By addressing the dynamic phase of research, Altar provides a practical bridge between exploratory experimentation and FAIR-aligned data sharing.
- Abstract(参考訳): 実験プロジェクトのアクティブな開発フェーズでデータとメタデータを管理することは、特に共同研究において大きな課題となる。
このフェーズは、再現性を確保し、出版時の遡及的な再構築を阻害する重要な役割があるにもかかわらず、プロジェクト提案に含まれるデータ管理計画でしばしば見過ごされる。
ここでは、プロジェクト開始時点から実験データを構築するための軽量でドメインに依存しないフレームワークであるAltarを紹介します。
AltarはSacredの実験追跡モデルを中心に構築され、実験データ(Meta)をキャプチャして構造する。
パラメータ、メタデータ、カーブ、小さなファイルは柔軟なNoSQLデータベースに格納され、大きな生データは専用のストレージに保持され、ユニークな識別子を介してリンクされ、効率とトレーサビリティを確保する。
この統合はワークフローを終了することで構成可能であり、作業習慣の最小限の破壊と統合できる。
ユーザスキルセット(PhD学生,ポストドック,プリンシパルインベリゲータ,ラボ管理者,システム管理者)に基づいて,Altarを使用するためのさまざまな経路を文書化する。
Altarを使い始めるには特別なインフラを必要としないが、フレームワークは簡単にサーバにデプロイでき、公開のためのデータのスケールアップや準備を行う際には公開アクセスが可能である。
研究の動的フェーズに対処することで、Altarは探索実験とFAIRに準拠したデータ共有の実践的なブリッジを提供する。
関連論文リスト
- DataParasite Enables Scalable and Repurposable Online Data Curation [0.9543667840503739]
DataParasiteはスケーラブルなオンラインデータ収集のためのモジュールパイプラインである。
キュレーションタスクを独立したエンティティレベルの検索に分解する。
データの収集コストを手作業によるキュレーションと比較して桁違いに削減しながら高い精度を達成する。
論文 参考訳(メタデータ) (2026-01-05T22:04:16Z) - A Configuration-First Framework for Reproducible, Low-Code Localization [4.904092547705666]
無線ローカライゼーションのための低コードで構成優先のフレームワークであるLOCALIZEを紹介する。
このフレームワークは、同等のランタイムとメモリの動作を維持しながら、オーサリングの労力を削減する。
論文 参考訳(メタデータ) (2025-10-29T16:57:33Z) - Putting Data at the Centre of Offline Multi-Agent Reinforcement Learning [3.623224034411137]
オフラインマルチエージェント強化学習(英語: offline multi-agent reinforcement learning, MARL)は、静的データセットを用いてマルチエージェントシステムの最適制御ポリシーを見つける研究のエキサイティングな方向である。
この分野は定義上はデータ駆動型だが、これまでのところ、最先端の結果を達成するための努力は、データを無視してきた。
研究の大部分は、一貫した方法論を使わずに独自のデータセットを生成し、これらのデータセットの特徴に関するまばらな情報を提供する。
論文 参考訳(メタデータ) (2024-09-18T14:13:24Z) - Introducing a Comprehensive, Continuous, and Collaborative Survey of Intrusion Detection Datasets [2.7082111912355877]
COMIDDSは、侵入検出データセットを前例のないレベルで包括的に調査する試みである。
実際のデータサンプルや関連する出版物へのリンクを含む、各データセットに関する構造化されたクリティカルな情報を提供する。
論文 参考訳(メタデータ) (2024-08-05T14:40:41Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - Fingerprinting and Building Large Reproducible Datasets [3.2873782624127843]
提案手法は,大規模なデータセットの作成を容易にし,その証明を確実にするツール支援手法である。
抽出プロセスに提供されたデータセットを特徴付けるユニークな指紋を定義する方法を提案する。
論文 参考訳(メタデータ) (2023-06-20T08:59:33Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。