論文の概要: Synthesizing the Expert: A Validated Multimodal Dataset for Trustworthy AI-Assisted Swimming Coaching
- arxiv url: http://arxiv.org/abs/2605.12799v1
- Date: Tue, 12 May 2026 22:34:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.716203
- Title: Synthesizing the Expert: A Validated Multimodal Dataset for Trustworthy AI-Assisted Swimming Coaching
- Title(参考訳): エキスパートの合成: 信頼できるAI支援スイミングコーチングのための検証済みマルチモーダルデータセット
- Authors: Ahmad Al-Kabbany, Esraa Kassem,
- Abstract要約: 本研究では、水泳分野における高度なAIアプリケーションのための構造化された検索補助生成(RAG)システムに焦点を当てる。
本研究では,4次元にまたがる多モーダルな知識ベースを活用する新しい生成フレームワークを提案する。
構造化され合成された地上の真実を提供することで、この研究は水族学における信頼できるAIの基礎的なベンチマークを確立する。
- 参考スコア(独自算出の注目度): 0.6445605125467574
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This research is primarily concerned with the critical problem of synthesizing a structured Retrieval-Augmented Generation (RAG) system for advanced AI applications in the domain of swimming. As the integration of Artificial Intelligence in sports science matures, its applications in swimming have become increasingly diverse, spanning from real-time technical coaching and talent scouting to comprehensive performance profiling and the dynamic personalization of training periodization. Within this landscape, RAG-based systems represent a pivotal advancement in Large Language Model (LLM) enhanced swimming analysis, as they allow for the grounding of generative outputs in authoritative domain knowledge, thereby ensuring the credibility of AI-generated advice, contextually and technically. Despite this potential, building robust RAG systems using only real-world aquatic data presents significant challenges, including ethical constraints regarding athlete biometrics, and the high cost of manual expert labeling. To address these barriers, we propose a novel generative framework that leverages a multimodal knowledge base gathered across four dimensions: physiological data, physiological literature, kinematic sensor data, and unstructured domain expertise. Our proposed framework utilizes a multi-agent LLM architecture to synthesize a high-fidelity dataset of 1,864 validated "Question-Context-Answer" triplets-drawn from 1,914 drafts evaluated against 12 physiological soundness rules. By providing a structured, synthetic ground truth, this work establishes a foundational benchmark for trustworthy AI in aquatics. The outcomes of this research promise to enhance the reliability of automated coaching and open a plethora of future directions in "Meta-Agent" development and athletic profiling, ultimately bridging the gap between raw data engineering and practical sports science application.
- Abstract(参考訳): この研究は主に、水泳分野における高度なAI応用のための構造化検索補助生成システム(RAG)の合成に関する重要な問題に関するものである。
スポーツ科学における人工知能の統合が成熟するにつれて、リアルタイムの技術コーチングやタレントスカウトから総合的なパフォーマンスプロファイリング、トレーニング周期化の動的パーソナライズまで、水泳へのその応用は多様化しつつある。
この状況の中で、RAGベースのシステムは、権威的ドメイン知識における生成的アウトプットの基盤化を可能にし、文脈的および技術的にAI生成アドバイスの信頼性を確保するため、Large Language Model(LLM)強化水泳分析における重要な進歩を表している。
この可能性にもかかわらず、実世界の水生データのみを用いた堅牢なRAGシステムの構築は、アスリートの生体認証に関する倫理的制約や、手動による専門家のラベル付けのコストなど、重大な課題を呈している。
これらの障壁に対処するために、生理学データ、生理学文献、運動センサデータ、非構造ドメインの専門知識の4つの次元にまたがるマルチモーダル知識ベースを活用する新しい生成フレームワークを提案する。
提案フレームワークはマルチエージェントLCMアーキテクチャを用いて,12の生理的音質規則に対して評価された1,914のドラフトから得られた1,864の高忠実度データセットを合成する。
構造化され合成された地上の真実を提供することで、この研究は水族学における信頼できるAIの基礎的なベンチマークを確立する。
この研究の結果は、自動コーチングの信頼性を高め、"Meta-Agent"開発と運動プロファイリングにおける将来的な方向性を開拓し、最終的に生データ工学と実践スポーツ科学のギャップを埋めることが約束される。
関連論文リスト
- Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale [3.0317183198617066]
Sandpiperは、高ボリュームの会話データと人間の質的な専門知識の橋渡しとして設計された混合開始システムである。
本稿では,AIを用いた定性分析における研究効率の向上,レータ間信頼性,研究者信頼度を評価するためのシステムの有効性を評価するためのユーザスタディを提案する。
論文 参考訳(メタデータ) (2026-03-09T14:01:42Z) - THETA: A Textual Hybrid Embedding-based Topic Analysis Framework and AI Scientist Agent for Scalable Computational Social Science [5.225859530177356]
本稿では,テキストハイブリッド埋め込みに基づくトピック分析(THETA)を紹介する。
THETAは、膨大なデータスケールと豊富な理論深度の間のギャップを埋める、新しい計算パラダイムとオープンソースツールである。
以上の結果から,LDA,EMM,CTMなどの従来のモデルよりも高い性能を示した。
論文 参考訳(メタデータ) (2026-03-06T07:12:05Z) - An AI Implementation Science Study to Improve Trustworthy Data in a Large Healthcare System [1.6881002551798014]
本研究では,大規模多施設小児科システムであるSingers Childrens (SCs) におけるAI導入事例について述べる。
我々は,Pythonベースのデータ品質評価ツールをSCsインフラストラクチャと互換性を持ち,OHDsiのR/Javaベースのデータ品質ダッシュボードを拡張した。
また,FHIR標準を用いた顎顔面マイクロソミー(CFM)の体系的およびケース特異的AI実装戦略の比較を行った。
論文 参考訳(メタデータ) (2025-12-01T14:21:16Z) - SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。
実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。
回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文 参考訳(メタデータ) (2025-11-29T09:18:39Z) - Cross-Disciplinary Knowledge Retrieval and Synthesis: A Compound AI Architecture for Scientific Discovery [1.5143261755366868]
BioSageは、LLMをRAGと統合した新しい複合AIアーキテクチャで、AI、データサイエンス、バイオメディカル、バイオセキュリティドメインにわたる発見を可能にするために、特殊なエージェントとツールを編成した。
本システムでは,クエリ計画と応答合成を備えた検索エージェントを含む,複数の特殊エージェントを特徴とし,引用支援型応答を持つドメイン間の知識検索を実現する。
我々の研究は、チャート、表、構造化された科学データに対するマルチモーダル検索と推論に重点を置いており、また、クロスディシプリナ発見のための総合的なマルチモーダルベンチマークも開発している。
論文 参考訳(メタデータ) (2025-11-23T05:33:11Z) - Advancing AI Research Assistants with Expert-Involved Learning [84.30323604785646]
大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、生物医学的な発見を促進することを約束するが、その信頼性は未定である。
ARIEL(AI Research Assistant for Expert-in-the-Loop Learning)は,オープンソースの評価・最適化フレームワークである。
LMMは詳細な視覚的推論に苦しむのに対し、最先端のモデルでは流動性はあるが不完全な要約を生成する。
論文 参考訳(メタデータ) (2025-05-03T14:21:48Z) - Identifying Trustworthiness Challenges in Deep Learning Models for Continental-Scale Water Quality Prediction [69.38041171537573]
水質は環境の持続可能性、生態系の回復力、公衆衛生に基礎を置いている。
ディープラーニングは、大規模な水質予測と科学的洞察生成のための変革的なポテンシャルを提供する。
汚染緩和や資源配分等、高額な運用上の意思決定に広く採用されていることは、未解決の信頼性の課題によって防止されている。
論文 参考訳(メタデータ) (2025-03-13T01:50:50Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - OlympicArena: Benchmarking Multi-discipline Cognitive Reasoning for Superintelligent AI [73.75520820608232]
我々は,11,163のバイリンガル問題を含む,テキストのみとインターリーブされたテキストイメージのモダリティを紹介する。
これらの課題には、7つのフィールドと62の国際オリンピック大会にわたる幅広い規律が含まれており、データ漏洩について厳格に調査されている。
我々の評価によると、GPT-4oのような先進モデルでさえ、複雑な推論とマルチモーダル統合における現在のAI制限を反映して、全体的な精度は39.97%しか達成していない。
論文 参考訳(メタデータ) (2024-06-18T16:20:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。