論文の概要: Game of LLMs: Discovering Structural Constructs in Activities using Large Language Models
- arxiv url: http://arxiv.org/abs/2406.13777v1
- Date: Wed, 19 Jun 2024 19:02:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 18:35:22.103771
- Title: Game of LLMs: Discovering Structural Constructs in Activities using Large Language Models
- Title(参考訳): ゲーム・オブ・LLM:大規模言語モデルを用いた活動における構造構造の発見
- Authors: Shruthi K. Hiremath, Thomas Ploetz,
- Abstract要約: 我々は,大規模言語モデルを用いて,基礎となるビルディングブロック(構造構造体)の同定に着目する。
本稿では,これらのビルディングブロックをモデルとしたアクティビティ認識手法の開発を提案する。
- 参考スコア(独自算出の注目度): 0.11029371407785957
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human Activity Recognition is a time-series analysis problem. A popular analysis procedure used by the community assumes an optimal window length to design recognition pipelines. However, in the scenario of smart homes, where activities are of varying duration and frequency, the assumption of a constant sized window does not hold. Additionally, previous works have shown these activities to be made up of building blocks. We focus on identifying these underlying building blocks--structural constructs, with the use of large language models. Identifying these constructs can be beneficial especially in recognizing short-duration and infrequent activities. We also propose the development of an activity recognition procedure that uses these building blocks to model activities, thus helping the downstream task of activity monitoring in smart homes.
- Abstract(参考訳): 人間活動認識は時系列解析の問題である。
コミュニティが使用している一般的な分析手順は、認識パイプラインの設計に最適なウィンドウ長を仮定する。
しかし、活動期間と頻度が異なるスマートホームのシナリオでは、一定サイズの窓の仮定は保持されない。
さらに、以前の研究は、これらのアクティビティがビルディングブロックで構成されていることを示している。
我々は,大規模言語モデルを用いて,これらの基盤となる構造構造を同定することに注力する。
これらの構成物を特定することは、特に短期的・頻繁な活動を認識する上で有益である。
また、これらのビルディングブロックを用いて活動のモデル化を行い、スマートホームにおける活動監視の下流タスクを支援する活動認識手法の開発も提案する。
関連論文リスト
- WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [85.95607119635102]
大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-07T07:15:49Z) - Maintenance Required: Updating and Extending Bootstrapped Human Activity Recognition Systems for Smart Homes [0.11029371407785957]
市販のHARシステムは、個々の家庭の限られた能力に有効である。
以前の作業は、最初のフェーズを目標にしました。
ブートストラップ付きHARシステム上に構築し,効率的な更新・拡張手順を導入する。
論文 参考訳(メタデータ) (2024-06-20T16:08:40Z) - Latent Properties of Lifelong Learning Systems [59.50307752165016]
本稿では,生涯学習アルゴリズムの潜伏特性を推定するために,アルゴリズムに依存しないサロゲート・モデリング手法を提案する。
合成データを用いた実験により,これらの特性を推定するためのアプローチを検証する。
論文 参考訳(メタデータ) (2022-07-28T20:58:13Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Spatiotemporal Deformable Models for Long-Term Complex Activity
Detection [23.880673582575856]
自動車や手術ロボットなどの自律システムでは、長期的な複雑な活動認識が不可欠です。
現在のほとんどのメソッドは、短期的なアクション/アクティビティや、数フレームまたは秒間しか続かないアクションの組み合わせを単にローカライズするように設計されている。
本フレームワークは, (i) 動作検出, (ii) 変形可能な部品形状のモデル化, (iii) 空間的機構の3つの主要な構成要素から構成される。
論文 参考訳(メタデータ) (2021-04-16T16:05:34Z) - A Tree-structure Convolutional Neural Network for Temporal Features
Exaction on Sensor-based Multi-resident Activity Recognition [4.619245607612873]
マルチレジデント活動認識(TSC-MRAR)のためのエンドツーエンド木構造畳み込みニューラルネットワークフレームワークを提案する。
まず、各サンプルをイベントとして扱い、スライディングウインドウに過去のセンサの読み取りを埋め込んだ現在のイベントを得る。
そして、時間的特徴を自動的に生成するために、木構造ネットワークを設計し、近くの読み物の時間的依存を導出する。
論文 参考訳(メタデータ) (2020-11-05T14:31:00Z) - Learning to Abstract and Predict Human Actions [60.85905430007731]
ビデオにおける人間の活動の階層構造をモデル化し,行動予測におけるそのような構造の効果を実証する。
イベントの部分的階層を観察し、その構造を複数の抽象化レベルで将来の予測にロールアウトすることで、人間の活動の構造を学習できる階層型ニューラルネットワークであるHierarchical-Refresher-Anticipatorを提案する。
論文 参考訳(メタデータ) (2020-08-20T23:57:58Z) - Intra- and Inter-Action Understanding via Temporal Action Parsing [118.32912239230272]
本研究では,スポーツビデオにサブアクションの手動アノテーションを付加した新しいデータセットを構築し,その上に時間的行動解析を行う。
スポーツ活動は通常、複数のサブアクションから構成されており、このような時間構造に対する意識は、行動認識に有益であることを示す。
また,時間的解析手法を多数検討し,そのラベルを知らずにトレーニングデータからサブアクションをマイニングできる改良手法を考案した。
論文 参考訳(メタデータ) (2020-05-20T17:45:18Z) - Enabling Edge Cloud Intelligence for Activity Learning in Smart Home [1.3858051019755284]
エッジクラウドアーキテクチャに基づく新しいアクティビティ学習フレームワークを提案する。
我々は,1つのスマートホーム環境における活動認識と予測に時間的特徴を利用する。
論文 参考訳(メタデータ) (2020-05-14T11:43:20Z) - ZSTAD: Zero-Shot Temporal Activity Detection [107.63759089583382]
本研究では,ゼロショット時間的活動検出(ZSTAD)と呼ばれる新たなタスク設定を提案する。
このソリューションのアーキテクチャとして,R-C3Dに基づくエンドツーエンドのディープネットワークを設計する。
THUMOS14とCharadesデータセットの両方の実験は、目に見えない活動を検出するという点で有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-03-12T02:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。