論文の概要: BioimageAIpub: a toolbox for AI-ready bioimaging data publishing
- arxiv url: http://arxiv.org/abs/2512.15820v1
- Date: Wed, 17 Dec 2025 15:12:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:31.747449
- Title: BioimageAIpub: a toolbox for AI-ready bioimaging data publishing
- Title(参考訳): BioimageAIpub:AI対応のバイオイメージングデータ公開ツールボックス
- Authors: Stefan Dvoretskii, Anwai Archit, Constantin Pape, Josh Moore, Marco Nolden,
- Abstract要約: BioimageAIpubはバイオイメージングデータ変換を効率化するワークフローである。
データセットとモデルを共有するために広く使用されているプラットフォームであるHuggingFaceへのシームレスなアップロードを可能にする。
- 参考スコア(独自算出の注目度): 1.149497648076115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern bioimage analysis approaches are data hungry, making it necessary for researchers to scavenge data beyond those collected within their (bio)imaging facilities. In addition to scale, bioimaging datasets must be accompanied with suitable, high-quality annotations and metadata. Although established data repositories such as the Image Data Resource (IDR) and BioImage Archive offer rich metadata, their contents typically cannot be directly consumed by image analysis tools without substantial data wrangling. Such a tedious assembly and conversion of (meta)data can account for a dedicated amount of time investment for researchers, hindering the development of more powerful analysis tools. Here, we introduce BioimageAIpub, a workflow that streamlines bioimaging data conversion, enabling a seamless upload to HuggingFace, a widely used platform for sharing machine learning datasets and models.
- Abstract(参考訳): 現代のバイオイメージ分析アプローチは、データ空腹であり、研究者は、(バイオ)イメージング施設内で収集されたデータを超えてデータを盗む必要がある。
大規模化に加えて、バイオイメージングデータセットには、適切な高品質のアノテーションとメタデータが伴わなければならない。
画像データリソース(IDR)やバイオイメージアーカイブ(Bio Image Archive)のような確立されたデータリポジトリは、豊富なメタデータを提供するが、その内容は、実際のデータラングリングなしでは画像解析ツールによって直接消費することはできない。
このような退屈な組み立てと(メタ)データの変換は、研究者に専用の時間的投資を課し、より強力な分析ツールの開発を妨げる。
ここでは、バイオイメージングデータの変換を効率化するワークフローであるBioimageAIpubを紹介し、機械学習データセットとモデルを共有するために広く使用されているプラットフォームであるHuggingFaceへのシームレスなアップロードを可能にする。
関連論文リスト
- Flexible metadata harvesting for ecology using large language models [3.4117490081172774]
大規模言語モデル(LLM)に基づくメタデータ抽出装置を開発した。
任意のデータセットのランディングページからメタデータを柔軟に抽出する。
既存のメタデータ標準を使用して、これらをユーザ定義の統一フォーマットに変換する。
論文 参考訳(メタデータ) (2025-08-21T10:10:29Z) - DRAGON: A Large-Scale Dataset of Realistic Images Generated by Diffusion Models [48.347550000332866]
DRAGONは25の拡散モデルの画像からなる包括的なデータセットである。
データセットには、多様な対象を表す多様な画像が含まれている。
DRAGONは、合成コンテンツの検出および属性技術の開発と評価において、法医学的なコミュニティを支援するように設計されている。
論文 参考訳(メタデータ) (2025-05-16T13:50:34Z) - MRGen: Segmentation Data Engine for Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。
本稿では,データ合成における生成モデルの利用について検討する。
本稿では,テキストプロンプトとセグメンテーションマスクを条件とした医用画像合成のためのデータエンジンMRGenを提案する。
論文 参考訳(メタデータ) (2024-12-04T16:34:22Z) - An Innovative Tool for Uploading/Scraping Large Image Datasets on Social
Networks [9.27070946719462]
我々は、意図的に作成したデジタルツールを用いて、自動化されたアプローチを提案する。
このツールは、画像データセット全体を希望するデジタルプラットフォームに自動的にアップロードし、アップロードされたすべての写真をダウンロードすることができる。
論文 参考訳(メタデータ) (2023-11-01T23:27:37Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Data privacy protection in microscopic image analysis for material data
mining [8.266759895003279]
本研究では,データプライバシ保護に基づく材料微細構造画像特徴抽出アルゴリズムであるFedTransferを提案する。
1) 多結晶微細構造画像分割タスクにフェデレート学習アルゴリズムを導入し,機械学習をフル活用し,データアイランドを壊し,ユーザデータのプライバシとセキュリティを確保する条件下でモデル一般化能力を向上させる。
ユーザの機密性に緊急でない画像のスタイル情報を共有することにより、異なるユーザのデータ分散の違いによるパフォーマンスペナルティを低減することができる。
論文 参考訳(メタデータ) (2021-11-09T11:16:33Z) - Development of Semantic Web-based Imaging Database for Biological
Morphome [0.0]
本稿ではRIKEN Microstructureural Imaging MetaDatabaseを紹介する。
画像メタデータを記述したセマンティックWebベースの画像データベースである。
本稿では,このデータベースにより促進できる形態画像データの高度活用について論じる。
論文 参考訳(メタデータ) (2021-10-20T15:59:35Z) - Data Augmentation for Meta-Learning [58.47185740820304]
メタ学習アルゴリズムは、各トレーニングステップでデータ、クエリデータ、タスクをサンプリングする。
データ拡張は、クラス毎に利用可能な画像の数を増やすだけでなく、全く新しいクラス/タスクを生成するためにも使用できる。
提案したメタ固有データ拡張は,数ショットの分類ベンチマークにおいて,メタラーナーの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-10-14T13:48:22Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。