論文の概要: Kleinkram: Open Robotic Data Management
- arxiv url: http://arxiv.org/abs/2511.20492v1
- Date: Tue, 25 Nov 2025 16:59:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.559877
- Title: Kleinkram: Open Robotic Data Management
- Title(参考訳): Kleinkram: オープンなロボットデータ管理
- Authors: Cyrill Püntener, Johann Schwabe, Dominique Garmier, Jonas Frey, Marco Hutter,
- Abstract要約: 我々は、大規模で非構造化のロボットデータセットを管理するという課題を解決するために設計された、フリーでオープンソースのシステムであるKleinkramを紹介します。
モジュラーでオンプレミスのクラウドソリューションとして設計されたKleinkramは、スケーラブルなストレージ、インデックス、データセットの共有を可能にする。
- 参考スコア(独自算出の注目度): 7.35185731175356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Kleinkram, a free and open-source system designed to solve the challenge of managing massive, unstructured robotic datasets. Designed as a modular, on-premises cloud solution, Kleinkram enables scalable storage, indexing, and sharing of datasets, ranging from individual experiments to large-scale research collections. Kleinkram natively integrates with standard formats such as ROS bags and MCAP and utilises S3-compatible storage for flexibility. Beyond storage, Kleinkram features an integrated "Action Runner" that executes customizable Docker-based workflows for data validation, curation, and benchmarking. Kleinkram has successfully managed over 30 TB of data from diverse robotic systems, streamlining the research lifecycle through a modern web interface and a robust Command Line Interface (CLI).
- Abstract(参考訳): 我々は、大規模で非構造化のロボットデータセットを管理するという課題を解決するために設計された、フリーでオープンソースのシステムであるKleinkramを紹介します。
モジュラーでオンプレミスのクラウドソリューションとして設計されたKleinkramは、個々の実験から大規模な研究コレクションまで、スケーラブルなストレージ、インデックス、データセットの共有を可能にする。
Kleinkramは、ROSバッグやMCAPなどの標準フォーマットとネイティブに統合され、柔軟性のためにS3互換ストレージを利用する。
ストレージ以外にも、データバリデーション、キュレーション、ベンチマークのためのカスタマイズ可能なDockerベースのワークフローを実行する“Action Runner”が統合されている。
Kleinkramは、多様なロボットシステムから30TB以上のデータを管理し、最新のWebインターフェースと堅牢なCommand Line Interface(CLI)を通じて研究ライフサイクルを合理化している。
関連論文リスト
- FastUMI-100K: Advancing Data-driven Robotic Manipulation with a Large-scale UMI-style Dataset [55.66606167502093]
我々は,大規模なUMIスタイルのマルチモーダルデモデータセットであるFastUMI-100Kを提案する。
FastUMI-100Kは、現実世界のロボットデモデータの多様な要求を満たすために、よりスケーラブルで柔軟性があり、適応可能なソリューションを提供する。
我々のデータセットは、エンドエフェクタ状態、多視点手首装着魚眼画像、テキストアノテーションを含むマルチモーダルストリームを統合している。
論文 参考訳(メタデータ) (2025-10-09T09:57:25Z) - LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.1690891731311]
従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。
このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。
明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2025-09-30T22:34:23Z) - GBSK: Skeleton Clustering via Granular-ball Computing and Multi-Sampling for Large-Scale Data [62.363178614776295]
本稿では,大規模データセットのクラスタリング処理を行うために,GBSKというスケーラブルなスケルトンクラスタリングアルゴリズムを提案する。
データセットのマルチサンプリングと多粒度グラニュラーボールの構築により、GBSKは徐々に統計的「骨格」を発見
さらに,ユーザビリティの向上と現実シナリオへの展開を容易にするため,パラメータ設定を簡略化した適応型AGBSKを導入する。
論文 参考訳(メタデータ) (2025-09-28T08:41:15Z) - OnPrem.LLM: A Privacy-Conscious Document Intelligence Toolkit [2.132096006921048]
我々は,大規模言語モデル(LLM)を機密性の高い非公開データに適用するためのPythonベースのツールキットであるOnPrem$.$LLMを提案する。
このシステムはプライバシ保護のユースケース用に設計されており、ドキュメント処理とストレージのためのプレビルドパイプラインを提供する。
論文 参考訳(メタデータ) (2025-05-12T15:36:27Z) - MLKV: Efficiently Scaling up Large Embedding Model Training with Disk-based Key-Value Storage [22.848456481878568]
本稿では,MLKVを提案する。MLKVは,組込みモデルトレーニングにおけるスケーラビリティの課題に対処するために設計された,効率的で再利用可能なデータストレージフレームワークである。
オープンソースのワークロードの実験では、MLKVは、産業的な強度を持つキーバリューストア上に構築されたオフロード戦略を1.6-12.6倍上回っている。
論文 参考訳(メタデータ) (2025-04-02T08:57:01Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data
Format [88.33443450434521]
タスク指向対話(TOD)システムはデジタルアシスタントとして機能し、フライトの予約やレストランの検索といった様々なタスクを通じてユーザを誘導する。
TODシステムを構築するための既存のツールキットは、データ、モデル、実験環境の包括的な配列を提供するのに不足することが多い。
本稿では,このギャップを埋めるための多面的対話システムツールキットConvLab-3を紹介する。
論文 参考訳(メタデータ) (2022-11-30T16:37:42Z) - Scalable Discovery and Continuous Inventory of Personal Data at Rest in
Cloud Native Systems [0.0]
クラウドネイティブシステムは、多数の多パラダイムデータストアを通じて大量の個人データを処理している。
プライバシーエンジニアリングの観点では、個人情報が保存されているすべての正確な場所を追跡することが重要な課題だ。
i) 個人データの安静時のスケーラブルな発見のためのワークフローパターンと,i) クラウドネイティブシステムアーキテクチャと,そのワークフローパターンのオープンソースプロトタイプ実装からなるTeresiasを提案する。
論文 参考訳(メタデータ) (2022-09-09T10:45:34Z) - CodeReef: an open platform for portable MLOps, reusable automation
actions and reproducible benchmarking [0.2148535041822524]
CodeReef - クロスプラットフォームMLOps(MLSysOps)を実現するために必要なすべてのコンポーネントを共有するオープンプラットフォームを提供する。
CodeReefソリューションも導入しています – 非仮想化、ポータブル、カスタマイズ可能なアーカイブファイルとしてモデルをパッケージ化し、共有する手段です。
論文 参考訳(メタデータ) (2020-01-22T09:52:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。