Fugu-MT 論文翻訳(概要): Position: Restructuring of Categories and Implementation of Guidelines Essential for VLM Adoption in Healthcare

論文の概要: Position: Restructuring of Categories and Implementation of Guidelines Essential for VLM Adoption in Healthcare

arxiv url: http://arxiv.org/abs/2505.08818v1
Date: Mon, 12 May 2025 18:39:54 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-15 21:44:09.235681
Title: Position: Restructuring of Categories and Implementation of Guidelines Essential for VLM Adoption in Healthcare
Title（参考訳）: 位置:医療におけるカテゴリーの再構築とVLM導入のためのガイドラインの実施
Authors: Amara Tariq, Rimita Lahiri, Charles Kahn, Imon Banerjee,
Abstract要約: 視覚言語モデル(VLM)の開発には、明確で標準化されたレポーティングプロトコルが必要である。従来の機械学習レポート標準と評価ガイドラインは、多相VLM研究に対応するために再構成されなければならない。本稿では、VLM研究の分類フレームワークを提案し、対応する報告標準の概要を示す。
参考スコア（独自算出の注目度）: 5.9372801317341155
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The intricate and multifaceted nature of vision language model (VLM) development, adaptation, and application necessitates the establishment of clear and standardized reporting protocols, particularly within the high-stakes context of healthcare. Defining these reporting standards is inherently challenging due to the diverse nature of studies involving VLMs, which vary significantly from the development of all new VLMs or finetuning for domain alignment to off-the-shelf use of VLM for targeted diagnosis and prediction tasks. In this position paper, we argue that traditional machine learning reporting standards and evaluation guidelines must be restructured to accommodate multiphase VLM studies; it also has to be organized for intuitive understanding of developers while maintaining rigorous standards for reproducibility. To facilitate community adoption, we propose a categorization framework for VLM studies and outline corresponding reporting standards that comprehensively address performance evaluation, data reporting protocols, and recommendations for manuscript composition. These guidelines are organized according to the proposed categorization scheme. Lastly, we present a checklist that consolidates reporting standards, offering a standardized tool to ensure consistency and quality in the publication of VLM-related research.
Abstract（参考訳）: 視覚言語モデル(VLM)の発展、適応、応用の複雑で多面的な性質は、明確に標準化された報告プロトコルの確立を必要とする。これらの報告基準の定義は、新しいVLMの開発やドメインアライメントの微調整から、対象とする診断や予測タスクにVLMをオフザシェルフで使用することなど、VLMに関わる研究の多様性によって本質的に困難である。本稿では、従来の機械学習レポート標準と評価ガイドラインは、多相VLM研究に対応するために再構成されるべきであり、再現性に関する厳密な基準を維持しつつ、開発者を直感的に理解するためにも組織化する必要があると論じる。コミュニティの採用を促進するため,VLM研究の分類フレームワークを提案し,評価やデータレポーティングプロトコル,レコメンデーションを包括的に扱うための対応報告標準を概説する。これらのガイドラインは,提案した分類体系に従って整理される。最後に、VLM関連研究の公開において、一貫性と品質を確保するための標準化されたツールを提供することにより、報告基準を統一するチェックリストを提案する。

関連論文リスト

OLAF: Towards Robust LLM-Based Annotation Framework in Empirical Software Engineering [2.74296307006009]
大規模言語モデル(LLM)は、ソフトウェア工学において、アノテーションタスクの自動化やアシストにますます使われている。既存の研究では、信頼性、キャリブレーション、ドリフトの標準化された尺度が欠如していることが多い。 LLMに基づくアノテーションは、純粋に自動化されたアクティビティではなく、測定プロセスとして扱われるべきである。
論文参考訳（メタデータ） (2025-12-17T21:24:07Z)
Designing Empirical Studies on LLM-Based Code Generation: Towards a Reference Framework [0.3568466510804538]
大規模言語モデル(LLM)に基づくコード生成に関する経験的研究を設計・報告するための理論的枠組みを提案する。このフレームワークは、そのような実験を行ったこれまでの経験と、最近の研究における重要な類似点と相違点の比較分析の両方に基礎を置いている。問題ソース、品質属性、メトリクスなどのコアコンポーネントに関する評価を組織化し、構造化および体系的な実験をサポートする。
論文参考訳（メタデータ） (2025-10-04T16:15:54Z)
CoT Referring: Improving Referring Expression Tasks with Grounded Reasoning [67.18702329644526]
CoT Referringは、構造化されたチェーン・オブ・シークレット・トレーニングデータ構造を通じて、モデル推論をモダリティにわたって強化する。トレーニングデータを再構築して、新たな出力フォームを実行し、既存のデータセットに新たなアノテーションを提供します。また、検出とセグメント化機能を統合MLLMフレームワークに統合し、新しい適応重み付き損失で学習して性能を最適化する。
論文参考訳（メタデータ） (2025-10-03T08:50:21Z)
LLM-as-classifier: Semi-Supervised, Iterative Framework for Hierarchical Text Classification using Large Language Models [0.0]
大規模言語モデル(LLM)は、構造化されていないテキストデータを解析する前例のない機能を提供している。標準的な微調整アプローチはリソース集約的であり、実世界のデータ分散の動的な性質にしばしば苦労する。
論文参考訳（メタデータ） (2025-08-22T15:47:17Z)
Expert Preference-based Evaluation of Automated Related Work Generation [54.29459509574242]
本稿では,従来の作業評価基準と専門家固有の嗜好を統合したマルチターン評価フレームワークGREPを提案する。より優れたアクセシビリティを実現するため、我々はGREPの2つの変種を設計する: プロプライエタリなLLMを評価対象とするより正確な変種と、オープンウェイトなLLMをより安価な代替品である。
論文参考訳（メタデータ） (2025-08-11T13:08:07Z)
TaMPERing with Large Language Models: A Field Guide for using Generative AI in Public Administration Research [0.0]
大規模言語モデル(LLM)の社会科学研究への統合は、科学的調査を進めるための変革的な機会を提示する。この原稿では、タスク、モデル、プロンプト、評価、レポートの5つの決定ポイントに基づいて構成された、TaMPERフレームワークの方法論を紹介します。
論文参考訳（メタデータ） (2025-03-30T21:38:11Z)
The ELEVATE-AI LLMs Framework: An Evaluation Framework for Use of Large Language Models in HEOR: an ISPOR Working Group Report [12.204470166456561]
この記事では、ELEVATE AI LLMsフレームワークとチェックリストを紹介します。このフレームワークは、モデル特性、正確性、包括性、公平性を含む10の評価領域から構成される。体系的な文献レビューと健康経済モデルの研究の枠組みとチェックリストの検証は、レポートの強さとギャップを識別する能力を強調した。
論文参考訳（メタデータ） (2024-12-23T14:09:10Z)
CATER: Leveraging LLM to Pioneer a Multidimensional, Reference-Independent Paradigm in Translation Quality Evaluation [0.0]
Comprehensive AI-assisted Translation Edit Ratio (CATER)は、機械翻訳(MT)の品質を評価するための新しいフレームワークである。大きな言語モデル(LLM)は、慎重に設計されたプロンプトベースのプロトコルによって使用される。
論文参考訳（メタデータ） (2024-12-15T17:45:34Z)
NLP Cluster Analysis of Common Core State Standards and NAEP Item Specifications [0.0]
Camilli (2024) は、一連のコンテンツ標準とアイテム仕様の関係をマッピングするために自然言語処理(NLP)を用いた方法論を提案した。本研究は,NLPがマッピングプロセスの改善に有効であることを示す。
論文参考訳（メタデータ） (2024-11-20T15:44:58Z)
Investigating Privacy Bias in Training Data of Language Models [1.3167450470598043]
プライバシーバイアス(英: privacy bias)とは、あるコンテキスト内で情報の流れが適切に流れる際の歪を指す。このスキューは、既存の期待に沿うか、システムの問題の症状を示すかもしれない。文脈整合性に基づく手法を用いてプライバシーバイアスを評価する新しい手法を提案する。
論文参考訳（メタデータ） (2024-09-05T17:50:31Z)
TRACE: TRansformer-based Attribution using Contrastive Embeddings in LLMs [50.259001311894295]
TRACE と呼ばれるコントラスト埋め込みを用いた新しいTRansformer-based Attribution フレームワークを提案する。 TRACEは情報源の属性を精度良く改善し,大規模言語モデルの信頼性と信頼性を高める貴重なツールであることを示す。
論文参考訳（メタデータ） (2024-07-06T07:19:30Z)
LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.76373105981212]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文参考訳（メタデータ） (2024-06-18T09:29:18Z)
IMDL-BenCo: A Comprehensive Benchmark and Codebase for Image Manipulation Detection & Localization [58.32394109377374]
IMDL-BenCoは、最初の包括的なIMDLベンチマークおよびモジュラーフレームワークである。 IMDLフレームワークを標準化された再利用可能なコンポーネントに分解し、モデル構築パイプラインを改訂する。 8つの最先端IMDLモデル(うち1つはスクラッチから再現される)、2つの標準トレーニングおよび評価プロトコル、15のGPUアクセラレーション評価メトリクス、そして3種類の堅牢性評価が含まれている。
論文参考訳（メタデータ） (2024-06-15T09:44:54Z)
OLMES: A Standard for Language Model Evaluations [64.85905119836818]
OLMESは、再現可能な言語モデル評価のための文書化された、実用的な、オープンな標準である。これは、複数の質問の非自然的な「閉じた」定式化を必要とする小さなベースモデル間の有意義な比較をサポートする。 OLMESには、既存の文献の結果によってガイドされた、よく考えられたドキュメント化されたレコメンデーションと、オープンな質問を解決する新しい実験が含まれている。
論文参考訳（メタデータ） (2024-06-12T17:37:09Z)
Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。 LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文参考訳（メタデータ） (2024-05-12T15:49:38Z)
A State-of-the-practice Release-readiness Checklist for Generative AI-based Software Products [8.986278918477595]
本稿では,大規模言語モデルをソフトウェア製品に統合することの複雑さを考察し,リリースの準備の整合性を決定する上で直面する課題に焦点をあてる。グレー文献の体系的なレビューでは,事前学習から微調整,ユーザエクスペリエンスの考慮に至るまで,LCMのデプロイにおける一般的な課題が明確化されている。この調査では,パフォーマンスや監視,デプロイメント戦略など,重要なリリース準備の面を評価する上で,実践者のガイドとして設計された包括的なチェックリストが紹介されている。
論文参考訳（メタデータ） (2024-03-27T19:02:56Z)
Vision-Language Instruction Tuning: A Review and Analysis [52.218690619616474]
VLIT(Vision-Language Instruction Tuning)は、純粋なテキスト命令チューニングよりも複雑な特徴を示す。既存のVLITデータセットの詳細な分類と、高品質なVLITデータが持つべき特性を識別する。これらの特徴を既存のVLITデータ構築プロセスに導出する原理として取り入れることで、我々は広範囲な実験を行い、調整されたマルチモーダルLCMの性能に対する肯定的な影響を検証した。
論文参考訳（メタデータ） (2023-11-14T14:02:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。