論文の概要: Consistency of AI-Generated Exercise Prescriptions: A Repeated Generation Study Using a Large Language Model
- arxiv url: http://arxiv.org/abs/2604.11287v1
- Date: Mon, 13 Apr 2026 10:50:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.479602
- Title: Consistency of AI-Generated Exercise Prescriptions: A Repeated Generation Study Using a Large Language Model
- Title(参考訳): AIによるエクササイズ記述の一貫性:大規模言語モデルを用いた繰り返し生成研究
- Authors: Kihyuk Lee,
- Abstract要約: 大きな言語モデル(LLM)は、パーソナライズされたエクササイズ処方薬を生成するためのツールとして研究されている。
本研究は, LLM生成運動処方薬のモデル内整合性について, 繰り返し生成設計を用いて評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: Large language models (LLMs) have been explored as tools for generating personalized exercise prescriptions, yet the consistency of outputs under identical conditions remains insufficiently examined. Objective: This study evaluated the intra-model consistency of LLM-generated exercise prescriptions using a repeated generation design. Methods: Six clinical scenarios were used to generate exercise prescriptions using Gemini 2.5 Flash (20 outputs per scenario; total n = 120). Consistency was assessed across three dimensions: (1) semantic consistency using SBERT-based cosine similarity, (2) structural consistency based on the FITT principle using an AI-as-a-judge approach, and (3) safety expression consistency, including inclusion rates and sentence-level quantification. Results: Semantic similarity was high across scenarios (mean cosine similarity: 0.879-0.939), with greater consistency in clinically constrained cases. Frequency showed consistent patterns, whereas variability was observed in quantitative components, particularly exercise intensity. Unclassifiable intensity expressions were observed in 10-25% of resistance training outputs. Safety-related expressions were included in 100% of outputs; however, safety sentence counts varied significantly across scenarios (H=86.18, p less than 0.001), with clinical cases generating more safety expressions than healthy adult cases. Conclusions: LLM-generated exercise prescriptions demonstrated high semantic consistency but showed variability in key quantitative components. Reliability depends substantially on prompt structure, and additional structural constraints and expert validation are needed before clinical deployment.
- Abstract(参考訳): 背景: 大規模言語モデル (LLM) は, 個別のエクササイズ処方薬を生成するためのツールとして検討されてきたが, 同一条件下での出力の整合性は十分に検証されていない。
目的: 本研究は, LLM生成運動処方薬のモデル内整合性について, 繰り返し生成設計を用いて評価した。
方法: Gemini 2.5 Flash(シナリオ毎に20のアウトプット,合計120のn=120)を使用して,エクササイズ処方薬を生成するために6つの臨床シナリオが使用された。
一貫性は,(1)SBERTに基づくコサイン類似性を用いた意味的一貫性,(2)AI-as-a-judgeアプローチによるFITT原則に基づく構造的一貫性,(3)包含率と文レベルの定量化を含む安全表現一貫性の3つの次元にわたって評価された。
結果: セマンティック類似度は, 平均コサイン類似度 0.879-0.939 で, 臨床拘束症例では高い整合性を示した。
周波数は一貫したパターンを示し, 定量的成分, 特に運動強度の変動が観察された。
耐久訓練出力の10~25%で非有意な強度表現が観察された。
安全関連表現は100%のアウトプットに含まれていたが、安全文の数はシナリオによって大きく異なる(H=86.18, p:0.001未満)。
結論: LLMによるエクササイズ処方は, 意味的整合性が高いが, 重要量成分の変動が認められた。
信頼性は即時構造に大きく依存しており、追加の構造的制約や専門家による検証は臨床展開前に必要である。
関連論文リスト
- Towards Responsible Multimodal Medical Reasoning via Context-Aligned Vision-Language Models [11.019570079187552]
医用視覚言語モデル (VLM) は放射線学のタスクにおいて強い性能を示すが、しばしば流動的だが弱弱な結論をもたらす。
我々は、診断結果を生成する前に、異種の臨床的証拠間での合意を強制する文脈整合推論フレームワークを導入する。
論文 参考訳(メタデータ) (2026-04-09T23:09:38Z) - Eligibility-Aware Evidence Synthesis: An Agentic Framework for Clinical Trial Meta-Analysis [49.83108591873481]
EligMetaはエージェントフレームワークで、自動トライアル発見と、資格を意識したメタ分析を統合する。
フレームワークは、目標トライアル間の人口アライメントを反映した類似性に基づく研究重量を計算し、適性基準を構造化する。
論文 参考訳(メタデータ) (2026-04-03T03:18:50Z) - Efficient Self-Evaluation for Diffusion Language Models via Sequence Regeneration [48.19579266939883]
拡散大言語モデル (dLLMs) は多様性、制御可能性、並列性を高める能力において大きな注目を集めている。
我々は,dLLMの簡易かつ効果的な自己評価信頼度定量化法であるDiSEを提案する。
論文 参考訳(メタデータ) (2026-03-03T08:58:20Z) - Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering [94.37535002230504]
本研究では,Semantically Decoupled Latent Steeringと呼ばれる学習自由な推論時間制御フレームワークを開発した。
提案手法は,大言語モデル (LLM) による意味分解による意味のない介入ベクトルを構築する。
本手法は歴史的幻覚の可能性を著しく低下させることを示す。
論文 参考訳(メタデータ) (2026-02-27T04:49:01Z) - Equivariant Evidential Deep Learning for Interatomic Potentials [55.6997213490859]
不確かさの定量化は、分子動力学シミュレーションにおける機械学習の原子間ポテンシャルの信頼性を評価するために重要である。
既存のMLIPのUQアプローチは、高い計算コストや準最適性能によって制限されることが多い。
我々は,原子間ポテンシャルの定量的深層学習(texte2$IP)を提案する。
論文 参考訳(メタデータ) (2026-02-11T02:00:25Z) - Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.85462513661566]
ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文 参考訳(メタデータ) (2025-11-19T20:11:49Z) - Identification of Causal Direction under an Arbitrary Number of Latent Confounders [54.76982125821112]
実世界のシナリオでは、観測された変数は複数の潜伏変数によって同時に影響を受けることがある。
我々は,特定の方法で構築された観測変数の高次累積行列を併用する。
これらの高次累積行列の階数不足特性から,2つの観測変数間の因果非対称性が直接観察可能であることを示す。
論文 参考訳(メタデータ) (2025-10-26T15:10:00Z) - Multimodal Forecasting of Sparse Intraoperative Hypotension Events Powered by Language Model [14.69824092898171]
術中低血圧 (IOH) は全身麻酔下で頻繁に発生し, 心筋損傷や死亡率の増加などの副作用と強く関連している。
その重要性にもかかわらず、IOH予測はイベントのばらつきと、さまざまな患者にまたがる静的データと動的データを統合することの難しさによって妨げられている。
スパース低血圧事象を正確に識別し識別する多モーダル言語モデルフレームワークである textbfIOHFuseLM を提案する。
論文 参考訳(メタデータ) (2025-05-28T08:44:55Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。