論文の概要: Content Generation Models in Computational Pathology: A Comprehensive Survey on Methods, Applications, and Challenges
- arxiv url: http://arxiv.org/abs/2505.10993v2
- Date: Mon, 08 Sep 2025 08:12:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.046676
- Title: Content Generation Models in Computational Pathology: A Comprehensive Survey on Methods, Applications, and Challenges
- Title(参考訳): 計算病理におけるコンテンツ生成モデル:方法,応用,課題に関する包括的調査
- Authors: Yuan Zhang, Xinfeng Zhang, Xiaoming Qi, Xinyu Wu, Feng Chen, Guanyu Yang, Huazhu Fu,
- Abstract要約: レビューでは、画像生成、テキスト生成、分子プロファイル形態学生成などの4つの重要な領域に焦点を当てている。
我々は、コンテンツ生成アーキテクチャーの進化を、初期の生成的敵ネットワークから、拡散モデルや生成的視覚言語モデルにおける最近の進歩まで遡る。
レビューはオープン課題と今後の研究方向性について議論し、統合的かつ臨床的に展開可能な世代システムの開発に重点を置いて締めくくっている。
- 参考スコア(独自算出の注目度): 55.41538606569424
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Content generation modeling has emerged as a promising direction in computational pathology, offering capabilities such as data-efficient learning, synthetic data augmentation, and task-oriented generation across diverse diagnostic tasks. This review provides a comprehensive synthesis of recent progress in the field, organized into four key domains: image generation, text generation, molecular profile-morphology generation, and other specialized generation applications. By analyzing over 150 representative studies, we trace the evolution of content generation architectures -- from early generative adversarial networks to recent advances in diffusion models and generative vision-language models. We further examine the datasets and evaluation protocols commonly used in this domain and highlight ongoing limitations, including challenges in generating high-fidelity whole slide images, clinical interpretability, and concerns related to the ethical and legal implications of synthetic data. The review concludes with a discussion of open challenges and prospective research directions, with an emphasis on developing integrated and clinically deployable generation systems. This work aims to provide a foundational reference for researchers and practitioners developing content generation models in computational pathology.
- Abstract(参考訳): コンテンツ生成モデリングは、データ効率の学習、合成データ拡張、さまざまな診断タスクにおけるタスク指向生成などの機能を提供する、計算病理学における有望な方向として現れてきた。
このレビューは、画像生成、テキスト生成、分子プロファイル形態学生成、その他の特殊な生成アプリケーションという4つの重要な領域にまとめられた、この分野における最近の進歩の包括的合成を提供する。
150以上の代表的な研究を分析して、初期の生成的敵ネットワークから近年の拡散モデルや生成的視覚言語モデルまで、コンテンツ生成アーキテクチャの進化をたどる。
さらに,本領域で一般的に使用されるデータセットと評価プロトコルについて検討し,高忠実度スライド画像の生成における課題,臨床解釈可能性,および合成データの倫理的・法的意味に関する懸念など,継続的な制約を強調した。
このレビューは、オープン課題と今後の研究方向性に関する議論から締めくくられ、統合的かつ臨床的に展開可能な世代システムの開発に重点を置いている。
本研究は、計算病理学におけるコンテンツ生成モデルを開発する研究者や実践者に対して、基礎的な参照を提供することを目的としている。
関連論文リスト
- Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - A systematic review of challenges and proposed solutions in modeling multimodal data [0.9674145073701153]
臨床研究における強力なアプローチとしてマルチモーダルデータモデリングが登場している。
この系統的なレビューは、69の研究から得られた知見を合成し、共通の障害を同定する。
本稿では,伝達学習,生成モデル,注意機構,有望なソリューションを提供するニューラルアーキテクチャ探索など,近年の方法論的進歩に注目した。
論文 参考訳(メタデータ) (2025-05-11T11:23:51Z) - A Comprehensive Survey of Synthetic Tabular Data Generation [27.112327373017457]
タブラルデータ(Tabular data)は、様々な現実世界のアプリケーションにまたがる最も一般的かつ重要なデータフォーマットの1つである。
データ不足、プライバシーの懸念、クラス不均衡といった問題によって制約されることが多い。
合成データ生成は、生成モデルを利用して実際のデータセットの分布を学習する、有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2025-04-23T08:33:34Z) - Biomedical Foundation Model: A Survey [84.26268124754792]
ファンデーションモデルは、広範なラベルなしデータセットから学習する大規模な事前訓練モデルである。
これらのモデルは、質問応答や視覚的理解といった様々な応用に適応することができる。
本研究は,生物医学分野における基礎モデルの可能性を探るものである。
論文 参考訳(メタデータ) (2025-03-03T22:42:00Z) - From large language models to multimodal AI: A scoping review on the potential of generative AI in medicine [40.23383597339471]
マルチモーダルAIは、イメージング、テキスト、構造化データを含む多様なデータモダリティを単一のモデルに統合することができる。
このスコーピングレビューは、マルチモーダルAIの進化を探求し、その方法、アプリケーション、データセット、臨床環境での評価を強調している。
診断支援,医療報告生成,薬物発見,会話型AIの革新を推進し,一過性のアプローチからマルチモーダルアプローチへのシフトを示唆した。
論文 参考訳(メタデータ) (2025-02-13T11:57:51Z) - Foundation Models in Computational Pathology: A Review of Challenges, Opportunities, and Impact [0.34826922265324145]
は、細胞と病理のスペクトルにわたって微妙な視覚下組織の手がかりをマイニングする能力を示している。
データの規模は劇的に増加し、数千から数百万のマルチギガピクセルの組織画像へと成長した。
これらのイノベーションの真の可能性と臨床実践への統合について検討する。
論文 参考訳(メタデータ) (2025-02-12T11:57:11Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Generative AI in Vision: A Survey on Models, Metrics and Applications [0.0]
生成AIモデルは、現実的で多様なデータサンプルの作成を可能にすることで、さまざまな分野に革命をもたらした。
これらのモデルの中で、拡散モデルは高品質な画像、テキスト、オーディオを生成するための強力なアプローチとして現れている。
本稿では,AI拡散モデルとレガシモデルについて概観し,その基礎となる技術,異なる領域にわたる応用,課題について概説する。
論文 参考訳(メタデータ) (2024-02-26T07:47:12Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - DIME: Fine-grained Interpretations of Multimodal Models via Disentangled
Local Explanations [119.1953397679783]
我々は,マルチモーダルモデルの解釈における最先端化に注力する。
提案手法であるDIMEは,マルチモーダルモデルの高精度かつきめ細かな解析を可能にする。
論文 参考訳(メタデータ) (2022-03-03T20:52:47Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。