論文の概要: MetaboNet: The Largest Publicly Available Consolidated Dataset for Type 1 Diabetes Management
- arxiv url: http://arxiv.org/abs/2601.11505v1
- Date: Fri, 16 Jan 2026 18:38:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.600364
- Title: MetaboNet: The Largest Publicly Available Consolidated Dataset for Type 1 Diabetes Management
- Title(参考訳): MetaboNet: 1型糖尿病管理のための最も大規模に利用可能な統合データセット
- Authors: Miriam K. Wolff, Peter Calhoun, Eleonora Maria Aiello, Yao Qin, Sam F. Royston,
- Abstract要約: 現在のデータセットは構造的に大きく異なり、アクセスと処理に時間がかかる。
複数の公開可能なT1Dデータセットは、MetaboNetデータセットと呼ばれる統一リソースに統合された。
- 参考スコア(独自算出の注目度): 3.015362156937042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Progress in Type 1 Diabetes (T1D) algorithm development is limited by the fragmentation and lack of standardization across existing T1D management datasets. Current datasets differ substantially in structure and are time-consuming to access and process, which impedes data integration and reduces the comparability and generalizability of algorithmic developments. This work aims to establish a unified and accessible data resource for T1D algorithm development. Multiple publicly available T1D datasets were consolidated into a unified resource, termed the MetaboNet dataset. Inclusion required the availability of both continuous glucose monitoring (CGM) data and corresponding insulin pump dosing records. Additionally, auxiliary information such as reported carbohydrate intake and physical activity was retained when present. The MetaboNet dataset comprises 3135 subjects and 1228 patient-years of overlapping CGM and insulin data, making it substantially larger than existing standalone benchmark datasets. The resource is distributed as a fully public subset available for immediate download at https://metabo-net.org/ , and with a Data Use Agreement (DUA)-restricted subset accessible through their respective application processes. For the datasets in the latter subset, processing pipelines are provided to automatically convert the data into the standardized MetaboNet format. A consolidated public dataset for T1D research is presented, and the access pathways for both its unrestricted and DUA-governed components are described. The resulting dataset covers a broad range of glycemic profiles and demographics and thus can yield more generalizable algorithmic performance than individual datasets.
- Abstract(参考訳): Type 1 Diabetes(T1D)アルゴリズムの進歩は、既存のT1D管理データセットの断片化と標準化の欠如によって制限されている。
現在のデータセットは構造的に大きく異なり、アクセスと処理に時間がかかるため、データ統合を阻害し、アルゴリズム開発における可視性と一般化性を低下させる。
この研究は、T1Dアルゴリズム開発のための統一的でアクセスしやすいデータリソースを確立することを目的としている。
複数の公開可能なT1Dデータセットは、MetaboNetデータセットと呼ばれる統一リソースに統合された。
インクルージョンは連続グルコースモニタリング(CGM)データとそれに対応するインスリンポンプ量記録の両方を入手することを必要とした。
また、報告された炭水化物摂取や身体活動などの補助情報を現在まで保持した。
MetaboNetデータセットは、3135名の被験者と、CGMとインスリンの重複した1228年の患者データで構成されており、既存のスタンドアロンベンチマークデータセットよりも大幅に大きい。
リソースは、https://metabo-net.org/ですぐにダウンロードできる完全なパブリックサブセットとして配布され、それぞれのアプリケーションプロセスを通してアクセス可能なデータ利用契約(DUA)制限サブセットで配布される。
後者のサブセットのデータセットには、データを自動的に標準化されたMetaboNetフォーマットに変換する処理パイプラインが提供される。
T1D研究のための統合された公開データセットを提示し、その制限のないコンポーネントとDUAが支配するコンポーネントの両方のアクセス経路について述べる。
得られたデータセットは、グリセミックプロファイルと人口統計学の範囲をカバーするため、個々のデータセットよりもより一般化可能なアルゴリズム性能を得ることができる。
関連論文リスト
- OpenDataArena: A Fair and Open Arena for Benchmarking Post-Training Dataset Value [74.80873109856563]
OpenDataArena(ODA)は、トレーニング後のデータの本質的な価値をベンチマークするために設計された、総合的でオープンなプラットフォームである。
ODAは4つの主要な柱からなる包括的なエコシステムを確立している。 (i) 多様なモデル間で公平でオープンな比較を保証する統一的なトレーニング評価パイプライン、 (ii) 異なる軸数に沿ってデータ品質をプロファイリングする多次元スコアリングフレームワーク、 (iii) データセットの系図を視覚化してコンポーネントソースを識別するインタラクティブなデータ系統探索である。
論文 参考訳(メタデータ) (2025-12-16T03:33:24Z) - AZT1D: A Real-World Dataset for Type 1 Diabetes [6.102406188211489]
AZT1Dは、自動インスリンデリバリーシステム上で、タイプ1糖尿病(T1D)を持つ25人の個人から収集されたデータを含むデータセットである。
AZT1Dはリッチで博物学的なデータを提供することで、幅広い人工知能と機械学習アプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-05-27T21:54:53Z) - WikiDBGraph: A Data Management Benchmark Suite for Collaborative Learning over Database Silos [48.88393315169039]
協調学習(CL)技術により、複数のパーティが生データを共有せずにモデルを共同でトレーニングできる。
現在のCLベンチマークとアルゴリズムは、主に、分離、アライメント、結合可能なデータベースの仮定の下で学習ステップを目標としています。
我々は1700万の重み付きエッジでリンクされた10万の現実世界のリレーショナルデータベースから構築された大規模なデータセットを構築した。
論文 参考訳(メタデータ) (2025-05-22T13:07:06Z) - Hierarchical Conditional Tabular GAN for Multi-Tabular Synthetic Data Generation [0.0]
複雑な多言語データセットから多言語データを合成するアルゴリズムHCTGANを提案する。
提案アルゴリズムは, 深層・複雑な多言語データセットに対して, 大量の合成データをより効率的にサンプリングできることを示す。
我々は,HCTGANアルゴリズムが複雑な関係を持つ深層多言語データセットに対して,大量の合成データを効率的に生成するのに適していると結論付けた。
論文 参考訳(メタデータ) (2024-11-11T14:09:26Z) - Putting Data at the Centre of Offline Multi-Agent Reinforcement Learning [3.623224034411137]
オフラインマルチエージェント強化学習(英語: offline multi-agent reinforcement learning, MARL)は、静的データセットを用いてマルチエージェントシステムの最適制御ポリシーを見つける研究のエキサイティングな方向である。
この分野は定義上はデータ駆動型だが、これまでのところ、最先端の結果を達成するための努力は、データを無視してきた。
研究の大部分は、一貫した方法論を使わずに独自のデータセットを生成し、これらのデータセットの特徴に関するまばらな情報を提供する。
論文 参考訳(メタデータ) (2024-09-18T14:13:24Z) - ACES: Automatic Cohort Extraction System for Event-Stream Datasets [1.9338569571933975]
医療における機械学習(ML)において、再現性は依然として重要な課題である。
イベントストリームデータを対象とした自動コホート抽出システム(ACES)を提案する。
ACESは、表現中のMLタスクを定義するためのエントリの障壁を著しく低くする可能性がある。
論文 参考訳(メタデータ) (2024-06-28T04:48:05Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - GenURL: A General Framework for Unsupervised Representation Learning [58.59752389815001]
教師なし表現学習(URL)は、教師なしの高次元データのコンパクトな埋め込みを学習する。
本稿では,様々なURLタスクにスムーズに適応可能な類似性ベースの統合URLフレームワークGenURLを提案する。
実験により、GenURLは、自己教師付き視覚学習、無教師付き知識蒸留(KD)、グラフ埋め込み(GE)、次元縮小において、一貫した最先端性能を達成することが示された。
論文 参考訳(メタデータ) (2021-10-27T16:24:39Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z) - Dual-Teacher: Integrating Intra-domain and Inter-domain Teachers for
Annotation-efficient Cardiac Segmentation [65.81546955181781]
本稿では,新しい半教師付きドメイン適応手法,すなわちDual-Teacherを提案する。
学生モデルは、2つの教師モデルによってラベル付けされていない対象データとラベル付けされた情報源データの知識を学習する。
提案手法では, ラベルなしデータとモダリティ間データとを並列に利用でき, 性能が向上することを示した。
論文 参考訳(メタデータ) (2020-07-13T10:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。