論文の概要: Position: Restructuring of Categories and Implementation of Guidelines Essential for VLM Adoption in Healthcare
- arxiv url: http://arxiv.org/abs/2505.08818v1
- Date: Mon, 12 May 2025 18:39:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-15 21:44:09.235681
- Title: Position: Restructuring of Categories and Implementation of Guidelines Essential for VLM Adoption in Healthcare
- Title(参考訳): 位置:医療におけるカテゴリーの再構築とVLM導入のためのガイドラインの実施
- Authors: Amara Tariq, Rimita Lahiri, Charles Kahn, Imon Banerjee,
- Abstract要約: 視覚言語モデル(VLM)の開発には、明確で標準化されたレポーティングプロトコルが必要である。
従来の機械学習レポート標準と評価ガイドラインは、多相VLM研究に対応するために再構成されなければならない。
本稿では、VLM研究の分類フレームワークを提案し、対応する報告標準の概要を示す。
- 参考スコア(独自算出の注目度): 5.9372801317341155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The intricate and multifaceted nature of vision language model (VLM) development, adaptation, and application necessitates the establishment of clear and standardized reporting protocols, particularly within the high-stakes context of healthcare. Defining these reporting standards is inherently challenging due to the diverse nature of studies involving VLMs, which vary significantly from the development of all new VLMs or finetuning for domain alignment to off-the-shelf use of VLM for targeted diagnosis and prediction tasks. In this position paper, we argue that traditional machine learning reporting standards and evaluation guidelines must be restructured to accommodate multiphase VLM studies; it also has to be organized for intuitive understanding of developers while maintaining rigorous standards for reproducibility. To facilitate community adoption, we propose a categorization framework for VLM studies and outline corresponding reporting standards that comprehensively address performance evaluation, data reporting protocols, and recommendations for manuscript composition. These guidelines are organized according to the proposed categorization scheme. Lastly, we present a checklist that consolidates reporting standards, offering a standardized tool to ensure consistency and quality in the publication of VLM-related research.
- Abstract(参考訳): 視覚言語モデル(VLM)の発展、適応、応用の複雑で多面的な性質は、明確に標準化された報告プロトコルの確立を必要とする。
これらの報告基準の定義は、新しいVLMの開発やドメインアライメントの微調整から、対象とする診断や予測タスクにVLMをオフザシェルフで使用することなど、VLMに関わる研究の多様性によって本質的に困難である。
本稿では、従来の機械学習レポート標準と評価ガイドラインは、多相VLM研究に対応するために再構成されるべきであり、再現性に関する厳密な基準を維持しつつ、開発者を直感的に理解するためにも組織化する必要があると論じる。
コミュニティの採用を促進するため,VLM研究の分類フレームワークを提案し,評価やデータレポーティングプロトコル,レコメンデーションを包括的に扱うための対応報告標準を概説する。
これらのガイドラインは,提案した分類体系に従って整理される。
最後に、VLM関連研究の公開において、一貫性と品質を確保するための標準化されたツールを提供することにより、報告基準を統一するチェックリストを提案する。
関連論文リスト
- TaMPERing with Large Language Models: A Field Guide for using Generative AI in Public Administration Research [0.0]
大規模言語モデル(LLM)の社会科学研究への統合は、科学的調査を進めるための変革的な機会を提示する。
この原稿では、タスク、モデル、プロンプト、評価、レポートの5つの決定ポイントに基づいて構成された、TaMPERフレームワークの方法論を紹介します。
論文 参考訳(メタデータ) (2025-03-30T21:38:11Z) - The ELEVATE-AI LLMs Framework: An Evaluation Framework for Use of Large Language Models in HEOR: an ISPOR Working Group Report [12.204470166456561]
この記事では、ELEVATE AI LLMsフレームワークとチェックリストを紹介します。
このフレームワークは、モデル特性、正確性、包括性、公平性を含む10の評価領域から構成される。
体系的な文献レビューと健康経済モデルの研究の枠組みとチェックリストの検証は、レポートの強さとギャップを識別する能力を強調した。
論文 参考訳(メタデータ) (2024-12-23T14:09:10Z) - CATER: Leveraging LLM to Pioneer a Multidimensional, Reference-Independent Paradigm in Translation Quality Evaluation [0.0]
Comprehensive AI-assisted Translation Edit Ratio (CATER)は、機械翻訳(MT)の品質を評価するための新しいフレームワークである。
大きな言語モデル(LLM)は、慎重に設計されたプロンプトベースのプロトコルによって使用される。
論文 参考訳(メタデータ) (2024-12-15T17:45:34Z) - NLP Cluster Analysis of Common Core State Standards and NAEP Item Specifications [0.0]
Camilli (2024) は、一連のコンテンツ標準とアイテム仕様の関係をマッピングするために自然言語処理(NLP)を用いた方法論を提案した。
本研究は,NLPがマッピングプロセスの改善に有効であることを示す。
論文 参考訳(メタデータ) (2024-11-20T15:44:58Z) - Investigating Privacy Bias in Training Data of Language Models [1.3167450470598043]
プライバシーバイアス(英: privacy bias)とは、あるコンテキスト内で情報の流れが適切に流れる際の歪を指す。
このスキューは、既存の期待に沿うか、システムの問題の症状を示すかもしれない。
文脈整合性に基づく手法を用いてプライバシーバイアスを評価する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-05T17:50:31Z) - LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文 参考訳(メタデータ) (2024-06-18T09:29:18Z) - Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文 参考訳(メタデータ) (2024-05-12T15:49:38Z) - Vision-Language Instruction Tuning: A Review and Analysis [52.218690619616474]
VLIT(Vision-Language Instruction Tuning)は、純粋なテキスト命令チューニングよりも複雑な特徴を示す。
既存のVLITデータセットの詳細な分類と、高品質なVLITデータが持つべき特性を識別する。
これらの特徴を既存のVLITデータ構築プロセスに導出する原理として取り入れることで、我々は広範囲な実験を行い、調整されたマルチモーダルLCMの性能に対する肯定的な影響を検証した。
論文 参考訳(メタデータ) (2023-11-14T14:02:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。