Fugu-MT 論文翻訳(概要): Analyzing Multimodal Features of Spontaneous Voice Assistant Commands for Mild Cognitive Impairment Detection

論文の概要: Analyzing Multimodal Features of Spontaneous Voice Assistant Commands for Mild Cognitive Impairment Detection

arxiv url: http://arxiv.org/abs/2411.04158v1
Date: Wed, 06 Nov 2024 13:50:50 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:45.095982
Title: Analyzing Multimodal Features of Spontaneous Voice Assistant Commands for Mild Cognitive Impairment Detection
Title（参考訳）: 軽度認知障害検出のための自発音声アシスタントコマンドのマルチモーダル特徴の解析
Authors: Nana Lin, Youxiang Zhu, Xiaohui Liang, John A. Batsis, Caroline Summerour,
Abstract要約: 軽度認知障害(MCI)は認知症の進行リスクが高いため、公衆衛生上の問題である。本研究では,高齢者35名を対象に,自発音声アシスタント(VA)コマンドによるMCI検出の可能性について検討した。
参考スコア（独自算出の注目度）: 7.211692305360444
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Mild cognitive impairment (MCI) is a major public health concern due to its high risk of progressing to dementia. This study investigates the potential of detecting MCI with spontaneous voice assistant (VA) commands from 35 older adults in a controlled setting. Specifically, a command-generation task is designed with pre-defined intents for participants to freely generate commands that are more associated with cognitive ability than read commands. We develop MCI classification and regression models with audio, textual, intent, and multimodal fusion features. We find the command-generation task outperforms the command-reading task with an average classification accuracy of 82%, achieved by leveraging multimodal fusion features. In addition, generated commands correlate more strongly with memory and attention subdomains than read commands. Our results confirm the effectiveness of the command-generation task and imply the promise of using longitudinal in-home commands for MCI detection.
Abstract（参考訳）: 軽度認知障害(MCI)は認知症の進行リスクが高いため、公衆衛生上の問題である。本研究では,高齢者35名を対象に,自発音声アシスタント(VA)コマンドによるMCI検出の可能性について検討した。具体的には、コマンド生成タスクは、参加者が読み取りコマンドよりも認知能力に関連のあるコマンドを自由に生成するための、事前に定義された意図で設計されている。音声・テキスト・インテント・マルチモーダル融合機能を備えたMCI分類・回帰モデルを開発した。コマンド生成タスクは,マルチモーダル融合機能を利用して,平均分類精度82%でコマンド読取タスクより優れることがわかった。さらに、生成されたコマンドは読み取りコマンドよりもメモリやアテンションサブドメインと強く関連している。本研究は,コマンド生成タスクの有効性を確認し,MCI検出に長手型ホームコマンドを使用することの約束を示唆するものである。

関連論文リスト

Point, Detect, Count: Multi-Task Medical Image Understanding with Instruction-Tuned Vision-Language Models [3.3091869879941687]
マルチタスク医療画像理解のための微調整視覚言語モデル(VLM)について検討する。我々は各タスクを視覚言語推論に適した命令ベースのプロンプトに再構成する。その結果,マルチタスクトレーニングにより堅牢性と精度が向上した。
論文参考訳（メタデータ） (2025-05-22T13:18:44Z)
Cog-TiPRO: Iterative Prompt Refinement with LLMs to Detect Cognitive Decline via Longitudinal Voice Assistant Commands [8.516584356273825]
認知低下の早期発見は、神経変性疾患の進行を遅らせる介入を可能にするために重要である。本研究は音声コマンドの音声パターンの経時的解析により認知低下を検出する非侵襲的ツールとして音声アシスタントシステム(VAS)について検討する。
論文参考訳（メタデータ） (2025-05-22T05:40:12Z)
Can Language Models Follow Multiple Turns of Entangled Instructions? [4.44881011141635]
現実世界のシナリオは、秘密のプライバシ、個人の好み、優先順位付けなど、時間とともに複数の命令をまたいだ一貫性を必要とする。本研究は,多方向命令処理における大規模言語モデルの能力について,系統的研究を行った。我々は,Human-in-the-loopアプローチを用いて,約1.1Kの高品質なマルチターン会話を用いたMultiTurnInstructを構築した。
論文参考訳（メタデータ） (2025-03-17T14:31:37Z)
SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Experts [54.11162991206203]
本稿では,多様なナビゲーションタスクを統一的で汎用的なフレームワークに統合する。本稿では,エージェントによる意思決定の推論を効果的に行うことのできる,新しい状態適応型エキスパート混合モデルを提案する。
論文参考訳（メタデータ） (2024-12-07T06:12:53Z)
Dissecting Dissonance: Benchmarking Large Multimodal Models Against Self-Contradictory Instructions [12.976125568770353]
矛盾するコマンドを認識する上でのLMMの能力を評価するために,自己コントラクショナルインストラクションベンチマークを導入する。言語とビジョンのパラダイムに均等に分散した2万のコンフリクトで構成されている。我々の総合的な評価では、現在のLMMは、自己認識の欠如により、マルチモーダルな命令の不一致を特定するのに一貫して苦労している。
論文参考訳（メタデータ） (2024-08-02T08:11:11Z)
DiPEx: Dispersing Prompt Expansion for Class-Agnostic Object Detection [45.56930979807214]
本研究では、視覚言語モデルを用いて、自己教師付きプロンプト学習戦略による物体検出を強化する。最初の発見は、手作業によるテキストクエリが、しばしば検出されていないオブジェクトをもたらすことを示している。本稿では,リコール率を高めるためにDiPEx(Dispersing Prompt Expansion)アプローチを提案する。
論文参考訳（メタデータ） (2024-06-21T07:33:37Z)
Active Instruction Tuning: Improving Cross-Task Generalization by Training on Prompt Sensitive Tasks [101.40633115037983]
インストラクションチューニング(IT)は,大規模言語モデル(LLM)を命令付き多種多様なタスクで訓練することにより,印象的なゼロショット一般化を実現する。 ITモデルの性能と一般化性を改善するために、新しいタスクをどのように選択するかは、未解決の問題である。本稿では,情報的タスクを識別する新しいフレームワークである即時不確実性に基づくアクティブな指導チューニングを提案し,選択したタスク上でモデルをアクティブにチューニングする。
論文参考訳（メタデータ） (2023-11-01T04:40:05Z)
Bootstrapping Adaptive Human-Machine Interfaces with Offline Reinforcement Learning [82.91837418721182]
適応インターフェイスは、ユーザがシーケンシャルな意思決定タスクを実行するのに役立つ。近年のヒューマン・イン・ザ・ループ・機械学習の進歩により、ユーザとの対話によってこのようなシステムが改善されている。本稿では,生のコマンド信号をアクションにマッピングするインタフェースを訓練するための強化学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2023-09-07T16:52:27Z)
Instruction Position Matters in Sequence Generation with Large Language Models [67.87516654892343]
大規模言語モデル(LLM)は、翻訳や要約といった条件付きシーケンス生成タスクを実行することができる。入力文の後にタスク命令の位置をシフトさせることにより,LLMの指示追従能力を向上させることを提案する。
論文参考訳（メタデータ） (2023-08-23T12:36:57Z)
CLARA: Classifying and Disambiguating User Commands for Reliable Interactive Robotic Agents [29.55525755230298]
我々は、対話型ロボットエージェントの文脈において、与えられたユーザコマンドが明確であるか、曖昧であるか、あるいは不可能であるかを推測することに集中する。あいまいなコマンドに対しては、質問生成を通じてユーザと対話することで、コマンドを曖昧にします。本稿では,ロボットによる状況認識のためのデータセットについて述べる。
論文参考訳（メタデータ） (2023-06-17T15:24:54Z)
Leveraging Pretrained Representations with Task-related Keywords for Alzheimer's Disease Detection [69.53626024091076]
アルツハイマー病(AD)は高齢者に特に顕著である。事前学習モデルの最近の進歩は、AD検出モデリングを低レベル特徴から高レベル表現にシフトさせる動機付けとなっている。本稿では,高レベルの音響・言語的特徴から,より優れたAD関連手がかりを抽出する,いくつかの効率的な手法を提案する。
論文参考訳（メタデータ） (2023-03-14T16:03:28Z)
MUG: Interactive Multimodal Grounding on User Interfaces [12.035123646959669]
本稿では,ユーザとエージェントがインタフェース画面上で協調作業を行うマルチモーダルグラウンドのための対話型タスクMUGを提案する。ユーザがコマンドを与え、エージェントがコマンドに応答する。MUGはエージェントの応答を見る際に、エージェントがそのアクションを洗練または修正するための追加コマンドを与えるように、複数のラウンドのインタラクションを可能にする。
論文参考訳（メタデータ） (2022-09-29T21:08:18Z)
MRI-based Multi-task Decoupling Learning for Alzheimer's Disease Detection and MMSE Score Prediction: A Multi-site Validation [9.427540028148963]
MRIによる高齢者健診におけるアルツハイマー病(AD)の正確な検出とMMSEスコアの予測は重要な課題であるこれら2つのタスクに関する従来の手法のほとんどは、シングルタスク学習に基づいており、それらの相関を考慮することは滅多にない。本稿では,AD検出とMMSEスコア予測のためのMRIに基づくマルチタスク分離学習手法を提案する。
論文参考訳（メタデータ） (2022-04-02T09:19:18Z)
Adversarial Reinforced Instruction Attacker for Robust Vision-Language Navigation [145.84123197129298]
自然言語に基づくナビゲーションタスクでは,言語指導が重要な役割を担っている。より堅牢なナビゲータを訓練し、長い指導から重要な要素を動的に抽出する。具体的には,航法士が間違った目標に移動することを誤認することを学習する動的強化命令攻撃装置(DR-Attacker)を提案する。
論文参考訳（メタデータ） (2021-07-23T14:11:31Z)
Learning to Ask Conversational Questions by Optimizing Levenshtein Distance [83.53855889592734]
明示的な編集動作によって最小レベンシュテイン距離(MLD)を最適化する強化反復シーケンス編集(RISE)フレームワークを導入する。 RISEは会話の特徴に関連するトークンに注意を払うことができる。 2つのベンチマークデータセットの実験結果から、RISEは最先端の手法を大幅に上回っていることがわかった。
論文参考訳（メタデータ） (2021-06-30T08:44:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。