Fugu-MT 論文翻訳(概要): Making Sense of Metadata Mess: Alignment & Risk Assessment for Diatom Data Use Case

論文の概要: Making Sense of Metadata Mess: Alignment & Risk Assessment for Diatom Data Use Case

arxiv url: http://arxiv.org/abs/2411.00677v1
Date: Fri, 01 Nov 2024 15:36:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:43.342444
Title: Making Sense of Metadata Mess: Alignment & Risk Assessment for Diatom Data Use Case
Title（参考訳）: メタデータのメトリクスを理解する:珪藻データ利用事例のアライメントとリスクアセスメント
Authors: Kio Polson, Marina Potapova, Uttam Meena, Chad Peiper, Joshua Brown, Joshua Agar, Jane Greenberg,
Abstract要約: 本稿では,Drexel大学自然科学アカデミーのダイアトム・ハーバリウム(Diaatom Herbarium)のデジタル部分へのアクセスを目的としたメタデータ研究について報告する。本稿では,1) 関連メタデータ標準のレビュー,2) ハマー等が共有する顕微鏡メタデータフレームワーク,2) 標準メタデータのメタデータ特性を標準メタデータタイプにマッピングするベースラインメタデータアライメント,3) 標準データキュレーションの実施過程に関連するメタデータリスク分析の結果について報告する。
参考スコア（独自算出の注目度）: 0.18846515534317265
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Biologists study Diatoms, a fundamental algae, to assess the health of aquatic systems. Diatom specimens have traditionally been preserved on analog slides, where a single slide can contain thousands of these microscopic organisms. Digitization of these collections presents both metadata challenges and opportunities. This paper reports on metadata research aimed at providing access to a digital portion of the Academy of Natural Sciences' Diatom Herbarium, Drexel University. We report results of a 3-part study covering 1) a review of relevant metadata standards and a microscopy metadata framework shared by Hammer et al., 2) a baseline metadata alignment mapping current diatom metadata properties to standard metadata types, and 3) a metadata risk analysis associated with the course of standard data curation practices. This research is part of an effort involving the transfer of these digital slides to an new system, DataFed, to support global accessible. The final section of this paper includes a conclusion and discusses next steps.
Abstract（参考訳）: 生物学者は、水生システムの健康を評価するために、基本的な藻である珪藻を研究する。珪藻の標本は伝統的にアナログスライド上に保存されており、単一のスライドには数千の顕微鏡生物が含まれている。これらのコレクションのデジタル化は、メタデータの課題と機会の両方を示します。本稿では,Drexel大学自然科学アカデミーのダイアトム・ハーバリウム(Diaatom Herbarium)のデジタル部分へのアクセスを目的としたメタデータ研究について報告する。第3部研究報告の結果について報告する。 1)関連メタデータ標準のレビューとHammerらが共有する顕微鏡メタデータフレームワーク、2)現在の珪藻メタデータ特性を標準メタデータタイプにマッピングするベースラインメタデータアライメント。 3)標準データキュレーションの行程に関連するメタデータリスク分析。この研究は、グローバルアクセスをサポートするために、これらのデジタルスライドを新しいシステムであるDataFedに転送する作業の一部である。本稿の最終節では、結論と次のステップについて論じる。

関連論文リスト

LAND: A Longitudinal Analysis of Neuromorphic Datasets [47.84658158364453]
このレビューでは、既存のニューロモルフィックデータセットをキャプチャし、423以上のデータセットをカバーしている。これらのデータセットの分析は、そのサイズ、標準化の欠如、実際のデータにアクセスする上での困難さを示している。より重要な懸念は、シミュレーションまたはビデオ・ツー・イベントの手法によって生成される合成データセットの台頭である。
論文参考訳（メタデータ） (2026-02-17T19:46:33Z)
WildSci: Advancing Scientific Reasoning from In-the-Wild Literature [50.16160754134139]
我々は、ピアレビューされた文献から自動的に合成されるドメイン固有の科学質問の新しいデータセットWildSciを紹介する。複雑な科学的推論タスクを複数選択形式でフレーミングすることにより、明確に定義された報酬信号によるスケーラブルなトレーニングを可能にする。一連の科学的ベンチマークの実験は、我々のデータセットとアプローチの有効性を実証している。
論文参考訳（メタデータ） (2026-01-09T06:35:23Z)
Clinical Document Metadata Extraction: A Scoping Review [6.756965638374919]
このスコーピングレビューは,臨床文書メタデータ抽出研究のカタログ化を目的としている。ルールベースおよび従来の機械学習から文書メタデータを抽出する方法が進歩している。大規模言語モデルの出現は、タスクやデータセット間の一般化可能性の広範な探索を可能にした。
論文参考訳（メタデータ） (2025-12-28T17:21:16Z)
MeXtract: Light-Weight Metadata Extraction from Scientific Papers [48.73595915402094]
本稿では,科学論文からのメタデータ抽出を目的とした軽量言語モデルであるMeXtractを紹介する。 MeXtractはMOLEベンチマークでメタデータ抽出の最先端性能を達成する。研究コミュニティのために、すべてのコード、データセット、モデルを公開しています。
論文参考訳（メタデータ） (2025-10-08T11:12:28Z)
Mic-hackathon 2024: Hackathon on Machine Learning for Electron and Scanning Probe Microscopy [54.24356756795849]
顕微鏡は、ナノメートルと原子スケールにおける材料構造と機能に関する情報の主要な源である。主要な資金機関によるデータ管理計画(DMP)の導入は、保存とアクセスを促進する。標準化されたコードエコシステム、ベンチマーク、統合戦略が欠如しているため、洞察を得るのは難しいままです。
論文参考訳（メタデータ） (2025-06-10T03:54:36Z)
Manalyzer: End-to-end Automated Meta-analysis with Multi-agent System [48.093356587573666]
メタアナリシス(Meta-analysis)は、複数の既存の研究からデータを合成し、包括的な結論を導き出す体系的な研究手法である。伝統的なメタ分析は、文献検索、紙のスクリーニング、データ抽出を含む複雑な多段階パイプラインを含む。本稿では,ツールコールによるエンドツーエンドの自動メタ分析を実現するマルチエージェントシステムManalyzerを提案する。
論文参考訳（メタデータ） (2025-05-22T07:25:31Z)
Decoding MIE: A Novel Dataset Approach Using Topic Extraction and Affiliation Parsing [0.0]
本研究は,医療情報学ヨーロッパ(MIE)会議の手続きから得られた新しいデータセットを紹介する。我々は,「健康技術・情報学研究」誌の4,606論文からメタデータと要約を抽出し,分析した。
論文参考訳（メタデータ） (2024-10-06T19:34:23Z)
UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文参考訳（メタデータ） (2024-02-20T11:50:27Z)
CSMeD: Bridging the Dataset Gap in Automated Citation Screening for Systematic Literature Reviews [10.207938863784829]
CSMeDは9つの公開コレクションを統合したメタデータセットである。 CSMeDは自動引用スクリーニングモデルの性能を訓練し評価するための総合的なリソースとして機能する。我々はCSMeD-FTを導入した。CSMeD-FTは、全文パブリッシュスクリーニングタスクを明示的に評価するために設計された新しいデータセットである。
論文参考訳（メタデータ） (2023-11-21T09:36:11Z)
PGB: A PubMed Graph Benchmark for Heterogeneous Network Representation Learning [5.747361083768407]
バイオメディカル文献のための異種グラフ埋め込み評価のための新しいベンチマークであるPubMed Graph Benchmark (PGB)を紹介する。ベンチマークには、抽象的な著者、引用、MeSH階層、MeSH階層、その他の情報を含む豊富なメタデータが含まれている。
論文参考訳（メタデータ） (2023-05-04T10:09:08Z)
Toward a Flexible Metadata Pipeline for Fish Specimen Images [1.0838759597899268]
本稿では,30万枚以上のデジタル魚の標本画像を含むコレクションのためのフレキシブルなメタデータパイプラインの開発を目的としたイニシアチブについて報告する。画像とその関連メタデータは、自動種識別、セグメンテーション、形質抽出を含むAI関連科学研究に使用されている。
論文参考訳（メタデータ） (2022-11-18T23:25:17Z)
Recent Few-Shot Object Detection Algorithms: A Survey with Performance Comparison [54.357707168883024]
Few-Shot Object Detection (FSOD)は、人間の学習能力を模倣する。 FSODは、学習した汎用オブジェクトの知識を共通のヘビーテールから新しいロングテールオブジェクトクラスにインテリジェントに転送する。本稿では,問題定義,共通データセット,評価プロトコルなどを含むFSODの概要を紹介する。
論文参考訳（メタデータ） (2022-03-27T04:11:28Z)
Multimodal Approach for Metadata Extraction from German Scientific Publications [0.0]
ドイツ語の科学論文からメタデータを抽出するための多モーダル深層学習手法を提案する。本稿では,自然言語処理と画像ビジョン処理を組み合わせることで,複数の入力データについて考察する。提案手法は,約8800の文書からなるデータセットを用いて学習し,F1スコアの0.923を得ることができた。
論文参考訳（メタデータ） (2021-11-10T15:19:04Z)
Weakly-supervised Graph Meta-learning for Few-shot Node Classification [53.36828125138149]
新しいグラフメタ学習フレームワーク - Graph Hallucination Networks (Meta-GHN) を提案する。新たなロバストネス強化エピソードトレーニングに基づいて、Meta-GHNは、弱いラベル付きデータからクリーンノード表現を幻覚させるメタ学習を行う。大規模な実験は、既存のグラフメタ学習研究よりもMeta-GHNの方が優れていることを示す。
論文参考訳（メタデータ） (2021-06-12T22:22:10Z)
Graph-based Semi-supervised Learning: A Comprehensive Review [51.26862262550445]
半教師付き学習(ssl)はラベル付きデータとラベルなしデータの両方を利用する能力があるため、実際非常に価値があります。重要なSSLメソッドのクラスは、グラフベースの半教師付き学習(GSSL)メソッドに対応するグラフとしてデータを自然に表現することです。 GSSLメソッドは、構造のユニークさ、アプリケーションの普遍性、大規模データへのスケーラビリティのために、さまざまなドメインでその利点を実証しています。
論文参考訳（メタデータ） (2021-02-26T05:11:09Z)
Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文参考訳（メタデータ） (2020-11-11T22:32:21Z)
Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文参考訳（メタデータ） (2020-10-14T16:50:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。