Fugu-MT 論文翻訳(概要): Multidimensional Human Activity Recognition With Large Language Model: A Conceptual Framework

論文の概要: Multidimensional Human Activity Recognition With Large Language Model: A Conceptual Framework

arxiv url: http://arxiv.org/abs/2410.03546v1
Date: Mon, 16 Sep 2024 21:36:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-02 21:39:44.730140
Title: Multidimensional Human Activity Recognition With Large Language Model: A Conceptual Framework
Title（参考訳）: 大規模言語モデルを用いた多次元人間の活動認識:概念的枠組み
Authors: Syed Mhamudul Hasan,
Abstract要約: 緊急対応や高齢者ケアのような高リスク環境では、大きな言語モデル(LLM)の統合がリスクアセスメント、リソースアロケーション、緊急対応に革命をもたらします。本稿では,HAR(Human Activity Recognition)システムにおける多次元学習を支援するために,様々なウェアラブルデバイスを1次元と見なす概念的枠組みを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In high-stake environments like emergency response or elder care, the integration of large language model (LLM), revolutionize risk assessment, resource allocation, and emergency responses in Human Activity Recognition (HAR) systems by leveraging data from various wearable sensors. We propose a conceptual framework that utilizes various wearable devices, each considered as a single dimension, to support a multidimensional learning approach within HAR systems. By integrating and processing data from these diverse sources, LLMs can process and translate complex sensor inputs into actionable insights. This integration mitigates the inherent uncertainties and complexities associated with them, and thus enhancing the responsiveness and effectiveness of emergency services. This paper sets the stage for exploring the transformative potential of LLMs within HAR systems in empowering emergency workers to navigate the unpredictable and risky environments they encounter in their critical roles.
Abstract（参考訳）: 大規模言語モデル(LLM)の統合により、ヒューマンアクティビティ認識(HAR)システムにおけるリスクアセスメント、リソースアロケーション、緊急応答に革命をもたらす。本稿では,HARシステム内の多次元学習を支援するために,様々なウェアラブルデバイスを1次元と見なす概念的枠組みを提案する。これらの多様なソースからのデータの統合と処理により、LLMは複雑なセンサー入力を処理し、実行可能な洞察に変換することができる。この統合は、それらに関連する固有の不確実性と複雑さを緩和し、救急サービスの応答性と有効性を高める。本稿では, HAR システムにおける LLM の転換可能性を探究し, 危機的役割において遭遇する予測不能でリスクの高い環境を, 緊急作業員がナビゲートできるようにする段階を定めている。

関連論文リスト

SV-LLM: An Agentic Approach for SoC Security Verification using Large Language Models [8.912091484067508]
SV-LLMは,システムオンチップ(SoC)セキュリティ検証の自動化と強化を目的とした,新しいマルチエージェントアシスタントシステムである。検証質問応答、セキュリティ資産の識別、脅威モデリング、テスト計画とプロパティ生成、脆弱性検出、シミュレーションベースのバグ検証といったタスクのための特別なエージェントを統合することで、SV-LLMはワークフローを合理化する。このシステムは,手作業による介入を減らすこと,精度の向上,セキュリティ分析の高速化,設計サイクルの初期段階におけるリスクの積極的な識別と緩和を支援することを目的としている。
論文参考訳（メタデータ） (2025-06-25T13:31:13Z)
Multi-RAG: A Multimodal Retrieval-Augmented Generation System for Adaptive Video Understanding [2.3390724500399838]
Multi-RAGは、情報集約的な状況下で人間に適応的な支援を提供するために設計された検索拡張生成システムである。本システムは,マルチソース情報ストリームの統合と推論により,状況理解の改善と認知負荷の低減を目的としている。
論文参考訳（メタデータ） (2025-05-29T20:31:29Z)
MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。 MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文参考訳（メタデータ） (2025-05-12T17:35:43Z)
LLM-Based Human-Agent Collaboration and Interaction Systems: A Survey [34.275920463375684]
大規模言語モデル(LLM)は、完全に自律的なエージェントの構築への関心が高まっている。 LLM-HASは、システムの性能、信頼性、安全性を高めるために、人為的な情報、フィードバック、制御をエージェントシステムに組み込む。本稿は, LLM-HASの総合的かつ構造化された最初の調査である。
論文参考訳（メタデータ） (2025-05-01T08:29:26Z)
Multimodal Large Language Models for Enhanced Traffic Safety: A Comprehensive Review and Future Trends [5.233512464561313]
従来のアドバンストドライバー支援システムは、しばしば動的な現実のシナリオで苦労する。本稿では,これらの制約に対処する上で,MLLM(Multimodal Large Language Models)の変換可能性について概説する。 MLLMを次世代の交通安全システムの基礎として位置づけることで、この分野に革命をもたらす可能性を示している。
論文参考訳（メタデータ） (2025-04-21T18:48:35Z)
Exploring the Roles of Large Language Models in Reshaping Transportation Systems: A Survey, Framework, and Roadmap [51.198001060683296]
大型言語モデル(LLM)は、輸送上の課題に対処するための変革的な可能性を提供する。 LLM4TRは,交通におけるLSMの役割を体系的に分類する概念的枠組みである。それぞれの役割について,交通予測や自律運転,安全分析,都市移動最適化など,さまざまな応用について検討した。
論文参考訳（メタデータ） (2025-03-27T11:56:27Z)
Towards Agentic Recommender Systems in the Era of Multimodal Large Language Models [75.4890331763196]
大規模言語モデル(LLM)の最近のブレークスルーは、エージェントAIシステムの出現につながっている。 LLMベースのAgentic RS(LLM-ARS)は、よりインタラクティブで、コンテキストを認識し、プロアクティブなレコメンデーションを提供する。
論文参考訳（メタデータ） (2025-03-20T22:37:15Z)
Interpretable Concept-based Deep Learning Framework for Multimodal Human Behavior Modeling [5.954573238057435]
EUの一般データ保護規則は、リスクの高いAIシステムが十分に解釈可能であることを要求している。既存の説明可能なメソッドは、しばしば解釈可能性とパフォーマンスを妥協する。我々は、新しく一般化可能なフレームワーク、すなわち注意誘導概念モデル(AGCM)を提案する。 AGCMは、予測につながる概念とそれらがどこに観察されるかを特定することによって、学習可能な概念的な説明を提供する。
論文参考訳（メタデータ） (2025-02-14T13:15:21Z)
SenseRAG: Constructing Environmental Knowledge Bases with Proactive Querying for LLM-Based Autonomous Driving [10.041702058108482]
本研究では,大規模言語モデル(LLM)の文脈推論機能を活用することにより,自律運転(AD)における状況認識の高度化の必要性に対処する。厳密なラベルベースのアノテーションに依存する従来の認識システムとは異なり、リアルタイムのマルチモーダルセンサーデータを統一されたLLM対応の知識ベースに統合する。実世界のV2Xデータセットを用いた実験結果は、知覚と予測性能の大幅な改善を示す。
論文参考訳（メタデータ） (2025-01-07T05:15:46Z)
RA-BLIP: Multimodal Adaptive Retrieval-Augmented Bootstrapping Language-Image Pre-training [55.54020926284334]
近年,MLLM (Multimodal Large Language Models) が注目されている。検索拡張技術はLLMとMLLMの両方に有効なプラグインであることが証明されている。本研究では,MLLMの新しい検索支援フレームワークであるRA-BLIP(Retrieval-Augmented Bootstrapping Language-Image Pre-training)を提案する。
論文参考訳（メタデータ） (2024-10-18T03:45:19Z)
Coherence-Driven Multimodal Safety Dialogue with Active Learning for Embodied Agents [23.960719833886984]
M-CoDAL(M-CoDAL)は、安全クリティカルな状況下でのコミュニケーションをよりよく理解するために、実施エージェント向けに設計されたマルチモーダル対話システムである。提案手法は,2K Reddit画像から抽出した1Kの安全違反を含む,新たに作成されたマルチモーダルデータセットを用いて評価する。このデータセットで得られた結果は、我々のアプローチが会話の安全性だけでなく、安全状況、ユーザーの感情、および会話の安全性の解決を改善することを実証している。
論文参考訳（メタデータ） (2024-10-18T03:26:06Z)
Selective Exploration and Information Gathering in Search and Rescue Using Hierarchical Learning Guided by Natural Language Input [5.522800137785975]
本稿では,大規模言語モデル(LLM)と階層的強化学習(HRL)フレームワークを連携させるシステムを提案する。提案システムは,人間の利害関係者からの言語入力を実用的なRLインサイトへ翻訳し,検索戦略を調整するように設計されている。 LLMによる人為的情報の利用とHRLによるタスク実行の構造化により、長い地平線とスパース報酬を特徴とする環境におけるエージェントの学習効率と意思決定プロセスを大幅に改善する。
論文参考訳（メタデータ） (2024-09-20T12:27:47Z)
Cooperative Resilience in Artificial Intelligence Multiagent Systems [2.0608564715600273]
本稿では, 協調レジリエンスの明確な定義とその定量化手法を提案する。その結果は、集団システムが破壊に直面してどのように準備し、抵抗し、回復し、幸福を維持し、変革するかを分析する上で、レジリエンス指標の重要な役割を強調している。
論文参考訳（メタデータ） (2024-09-20T03:28:48Z)
A Study on Prompt Injection Attack Against LLM-Integrated Mobile Robotic Systems [4.71242457111104]
大規模言語モデル(LLM)はマルチモーダルプロンプトを処理でき、よりコンテキスト対応の応答を生成することができる。主な懸念事項の1つは、ロボットナビゲーションタスクでLLMを使用する際の潜在的なセキュリティリスクである。本研究は,LPM統合システムにおける即時注入が移動ロボットの性能に及ぼす影響について検討する。
論文参考訳（メタデータ） (2024-08-07T02:48:22Z)
A Comprehensive Review of Multimodal Large Language Models: Performance and Challenges Across Different Tasks [74.52259252807191]
MLLM(Multimodal Large Language Models)は、単一のモダリティシステムの能力を超えた現実世界のアプリケーションの複雑さに対処する。本稿では,自然言語,視覚,音声などのマルチモーダルタスクにおけるMLLMの応用を体系的に整理する。
論文参考訳（メタデータ） (2024-08-02T15:14:53Z)
Towards LLM-Powered Ambient Sensor Based Multi-Person Human Activity Recognition [4.187145402358247]
HAR(Human Activity Recognition)は、在宅医療、高齢者介護、ホームセキュリティなどの分野における中心的な問題の一つである。本稿では,大規模言語モデルに基づくLAHARというシステムフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-25T07:41:34Z)
AntEval: Evaluation of Social Interaction Competencies in LLM-Driven Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文参考訳（メタデータ） (2024-01-12T11:18:00Z)
Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文参考訳（メタデータ） (2024-01-07T19:11:18Z)
A Low-rank Matching Attention based Cross-modal Feature Fusion Method for Conversational Emotion Recognition [54.44337276044968]
低ランクマッチング注意法(LMAM)と呼ばれる新しい軽量クロスモーダル機能融合法を提案する。 LMAMは、会話における文脈的感情的意味情報を効果的に捉え、自己認識機構によって引き起こされる二次的複雑性問題を緩和する。実験により, LMAMの軽量化を前提として, 他の一般的な相互拡散法と比較し, LMAMの優位性を検証した。
論文参考訳（メタデータ） (2023-06-16T16:02:44Z)
Sample-Efficient Reinforcement Learning in the Presence of Exogenous Information [77.19830787312743]
実世界の強化学習アプリケーションでは、学習者の観察空間は、その課題に関する関連情報と無関係情報の両方でユビキタスに高次元である。本稿では,強化学習のための新しい問題設定法であるExogenous Decision Process (ExoMDP)を導入する。内因性成分の大きさのサンプル複雑度で準最適ポリシーを学習するアルゴリズムであるExoRLを提案する。
論文参考訳（メタデータ） (2022-06-09T05:19:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。