論文の概要: Enhancing Canine Musculoskeletal Diagnoses: Leveraging Synthetic Image Data for Pre-Training AI-Models on Visual Documentations
- arxiv url: http://arxiv.org/abs/2409.08181v1
- Date: Thu, 12 Sep 2024 16:13:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 15:45:03.467300
- Title: Enhancing Canine Musculoskeletal Diagnoses: Leveraging Synthetic Image Data for Pre-Training AI-Models on Visual Documentations
- Title(参考訳): 犬の筋肉骨格の診断の強化:ビジュアルドキュメンテーションによる事前学習AIモデルのための合成画像データを活用する
- Authors: Martin Thißen, Thi Ngoc Diep Tran, Ben Joel Schönbein, Ute Trapp, Barbara Esteve Ratsch, Beate Egner, Romana Piat, Elke Hergenröther,
- Abstract要約: この研究の目的は、AIベースの診断支援システムを開発するために、データ不足の影響を軽減することである。
本稿では,現実的な視覚資料を模倣した合成画像データを生成する手法を提案する。
その結果, 診断精度が約10%向上したことが明らかとなった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The examination of the musculoskeletal system in dogs is a challenging task in veterinary practice. In this work, a novel method has been developed that enables efficient documentation of a dog's condition through a visual representation. However, since the visual documentation is new, there is no existing training data. The objective of this work is therefore to mitigate the impact of data scarcity in order to develop an AI-based diagnostic support system. To this end, the potential of synthetic data that mimics realistic visual documentations of diseases for pre-training AI models is investigated. We propose a method for generating synthetic image data that mimics realistic visual documentations. Initially, a basic dataset containing three distinct classes is generated, followed by the creation of a more sophisticated dataset containing 36 different classes. Both datasets are used for the pre-training of an AI model. Subsequently, an evaluation dataset is created, consisting of 250 manually created visual documentations for five different diseases. This dataset, along with a subset containing 25 examples. The obtained results on the evaluation dataset containing 25 examples demonstrate a significant enhancement of approximately 10% in diagnosis accuracy when utilizing generated synthetic images that mimic real-world visual documentations. However, these results do not hold true for the larger evaluation dataset containing 250 examples, indicating that the advantages of using synthetic data for pre-training an AI model emerge primarily when dealing with few examples of visual documentations for a given disease. Overall, this work provides valuable insights into mitigating the limitations imposed by limited training data through the strategic use of generated synthetic data, presenting an approach applicable beyond the canine musculoskeletal assessment domain.
- Abstract(参考訳): 犬における筋骨格系の検査は、獣医の実践において難しい課題である。
本研究では,視覚的表現による犬の状態の効率的なドキュメンテーションを可能にする新しい手法を開発した。
しかし、ビジュアルドキュメンテーションは新しいので、既存のトレーニングデータはありません。
この研究の目的は、AIベースの診断支援システムを開発するために、データ不足の影響を軽減することである。
この目的のために、AIモデルの事前学習のための病気の現実的な視覚的ドキュメンテーションを模倣する合成データの可能性について検討した。
本稿では,現実的な視覚資料を模倣した合成画像データを生成する手法を提案する。
最初は3つの異なるクラスを含む基本的なデータセットが生成され、続いて36の異なるクラスを含むより洗練されたデータセットが生成される。
両方のデータセットは、AIモデルの事前トレーニングに使用される。
その後、評価データセットが作成され、250人が手作業で5つの病気のビジュアルドキュメントを作成している。
このデータセットと25のサンプルを含むサブセット。
その結果,実世界の視覚資料を模倣した生成合成画像を利用する場合,診断精度が約10%向上することが確認された。
しかし、これらの結果は250の例を含むより大きな評価データセットには当てはまらないため、AIモデルの事前トレーニングに合成データを使用することの利点は、主に、特定の疾患の視覚的ドキュメントの少数の例を扱うときに現れることを示唆している。
全体として、この研究は、犬筋骨格評価領域を超えて適用可能なアプローチを提示し、生成された合成データの戦略的利用を通じて、限られた訓練データによって課される制限を緩和するための貴重な洞察を提供する。
関連論文リスト
- Can Medical Vision-Language Pre-training Succeed with Purely Synthetic Data? [8.775988650381397]
医療ビジョン言語による事前トレーニングモデルのトレーニングには、ペアで高品質な画像テキストデータを備えたデータセットが必要である。
近年の大規模言語モデルの進歩により,大規模合成画像テキストペアの生成が可能になった。
多様な高品質な合成データセットを構築するための自動パイプラインを提案する。
論文 参考訳(メタデータ) (2024-10-17T13:11:07Z) - NLICE: Synthetic Medical Record Generation for Effective Primary
Healthcare Differential Diagnosis [0.765458997723296]
患者記録の作成には,SymCatという公衆疾患症状データソースを用いている。
合成データの表現性を高めるために,NLICEと呼ばれる医学標準化された症状モデリング手法を用いる。
予測疾患モデルをトレーニングするためのデータセットの有効性を示す。
論文 参考訳(メタデータ) (2024-01-24T19:17:45Z) - Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。
このようなモデルは大きい傾向があり、訓練データの総量を必要とする。
人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。
このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文 参考訳(メタデータ) (2023-11-02T01:51:43Z) - How Good Are Synthetic Medical Images? An Empirical Study with Lung
Ultrasound [0.3312417881789094]
生成モデルを使用して合成トレーニングデータを追加することで、データの不足に対処するための低コストな方法が提供される。
合成データと実データの両方によるトレーニングは、実データのみによるトレーニングよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-05T15:42:53Z) - Synthetic Augmentation with Large-scale Unconditional Pre-training [4.162192894410251]
アノテーション付きデータへの依存性を低減するため,HistoDiffusionという合成拡張手法を提案する。
HistoDiffusionは、大規模にラベル付けされていないデータセットで事前トレーニングし、その後、拡張トレーニングのために小さなラベル付きデータセットに適用することができる。
本手法は,3つの病理組織学的データセットを事前学習し,大腸癌の病理組織学的データセット(CRC)を事前学習データセットから除外して評価する。
論文 参考訳(メタデータ) (2023-08-08T03:34:04Z) - Using simulation to calibrate real data acquisition in veterinary
medicine [0.1420200946324199]
本稿では,獣医学におけるデータ取得と診断を促進するためのシミュレーション環境の革新的利用について検討する。
この研究は、BlenderとBlenderprocライブラリの力を利用して、多様な解剖、環境、行動条件を反映した合成データセットを生成する。
生成されたデータは、正常な歩行と異常な歩行を識別するための機械学習アルゴリズムの訓練に使用される。
論文 参考訳(メタデータ) (2023-07-21T16:50:10Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。