論文の概要: WorkR: Occupation Inference for Intelligent Task Assistance
- arxiv url: http://arxiv.org/abs/2407.18518v1
- Date: Fri, 26 Jul 2024 05:23:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-29 14:20:08.080311
- Title: WorkR: Occupation Inference for Intelligent Task Assistance
- Title(参考訳): WorkR: インテリジェントタスクアシストのための実行推論
- Authors: Yonchanok Khaokaew, Hao Xue, Mohammad Saiedur Rahaman, Flora D. Salim,
- Abstract要約: 本研究では、受動的センシングを利用して様々なタスクアクティビティから広汎な信号をキャプチャするフレームワークWorkRを紹介する。
アプリケーション利用,移動,社会的相互作用,環境からの信号は,ユーザの職業を知らせるものである,と我々は主張する。
匿名化された、コンテキストに富んだアクティビティとタスクログデータセットを用いた実験により、我々のモデルは91%以上の精度で正確な職業推定が可能であることを実証した。
- 参考スコア(独自算出の注目度): 8.720927048233458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occupation information can be utilized by digital assistants to provide occupation-specific personalized task support, including interruption management, task planning, and recommendations. Prior research in the digital workplace assistant domain requires users to input their occupation information for effective support. However, as many individuals switch between multiple occupations daily, current solutions falter without continuous user input. To address this, this study introduces WorkR, a framework that leverages passive sensing to capture pervasive signals from various task activities, addressing three challenges: the lack of a passive sensing architecture, personalization of occupation characteristics, and discovering latent relationships among occupation variables. We argue that signals from application usage, movements, social interactions, and the environment can inform a user's occupation. WorkR uses a Variational Autoencoder (VAE) to derive latent features for training models to infer occupations. Our experiments with an anonymized, context-rich activity and task log dataset demonstrate that our models can accurately infer occupations with more than 91% accuracy across six ISO occupation categories.
- Abstract(参考訳): 作業情報は、デジタルアシスタントによって、割り込み管理、タスク計画、レコメンデーションを含む、職業固有の個別タスクサポートを提供するために利用することができる。
デジタル・ワークス・アシスタント・ドメインにおける先行研究では、利用者は効果的な支援のために職業情報を入力する必要がある。
しかし、多くの個人が毎日複数の職業を切り替えるにつれて、現在のソリューションは継続的なユーザー入力なしで混乱する。
そこで本研究では,受動的センシングを利用して様々なタスク活動から広汎な信号を捉え,受動的センシングアーキテクチャの欠如,職業特性のパーソナライズ,職業変数間の潜伏関係の発見という3つの課題に対処するフレームワークWorkRを紹介する。
アプリケーション利用,移動,社会的相互作用,環境からの信号は,ユーザの職業を知らせるものである,と我々は主張する。
WorkRは変分オートエンコーダ(VAE)を使用して、職業を推測するトレーニングモデルの潜在機能を引き出す。
匿名化された、文脈に富んだアクティビティとタスクログのデータセットを用いた実験により、我々のモデルは6つのISO職業カテゴリで91%以上の精度で正確に職業を推測できることを示した。
関連論文リスト
- Towards Intention Recognition for Robotic Assistants Through Online POMDP Planning [2.693342141713236]
意図認識は、人間の日常的なタスクを支援する自動アシスタントの設計と開発において重要な役割を果たす。
本稿では,オンラインの意図認識のための部分的に観測可能なモデルについて述べるとともに,予備的な実験結果を示すとともに,この問題のファミリに存在する課題について論じる。
論文 参考訳(メタデータ) (2024-11-26T11:13:00Z) - Learning Diverse Bimanual Dexterous Manipulation Skills from Human Demonstrations [29.867524903691802]
BiDexHDは、既存のバイマニュアルデータセットからタスク構築を統一するフレームワークであり、教師-学生ポリシー学習を使用してすべてのタスクに対処する。
TACOデータセットに対する実証的な評価は、6つのカテゴリで141のタスクにまたがっており、トレーニングされたタスクでは74.59%、目に見えないタスクでは51.07%のタスク実行率を示している。
論文 参考訳(メタデータ) (2024-10-03T13:35:15Z) - WorkArena++: Towards Compositional Planning and Reasoning-based Common Knowledge Work Tasks [85.95607119635102]
大型言語モデル(LLM)は人間のような知性を模倣することができる。
WorkArena++は、Webエージェントの計画、問題解決、論理的/論理的推論、検索、コンテキスト的理解能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-07-07T07:15:49Z) - WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks? [83.19032025950986]
本稿では,Webブラウザを介してソフトウェアと対話する大規模言語モデルベースエージェントについて検討する。
WorkArenaは、広く使用されているServiceNowプラットフォームに基づく33のタスクのベンチマークである。
BrowserGymは、そのようなエージェントの設計と評価のための環境である。
論文 参考訳(メタデータ) (2024-03-12T14:58:45Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Can Foundation Models Watch, Talk and Guide You Step by Step to Make a
Cake? [62.59699229202307]
AIの進歩にもかかわらず、インタラクティブなタスクガイダンスシステムの開発は依然として大きな課題である。
我々は、人間のユーザと人間のインストラクターとの自然なインタラクションに基づいて、新しいマルチモーダルベンチマークデータセット、ウォッチ、トーク、ガイド(WTaG)を作成しました。
いくつかの基礎モデルを活用して、これらのモデルが認識可能なタスクガイダンスに迅速に適応できるかを調査した。
論文 参考訳(メタデータ) (2023-11-01T15:13:49Z) - Active Task Randomization: Learning Robust Skills via Unsupervised
Generation of Diverse and Feasible Tasks [37.73239471412444]
我々は、教師なしのトレーニングタスクの生成を通じて、堅牢なスキルを学ぶアプローチであるActive Task Randomization (ATR)を導入する。
ATRは、タスクの多様性と実現可能性のバランスをとることで、堅牢なスキルを学ぶために、初期環境状態と操作目標からなる適切なタスクを選択する。
本研究では,視覚的入力に基づく逐次操作問題の解決のために,タスクプランナが学習スキルを構成することを実証する。
論文 参考訳(メタデータ) (2022-11-11T11:24:55Z) - Task Compass: Scaling Multi-task Pre-training with Task Prefix [122.49242976184617]
既存の研究では、大規模教師付きタスクによるマルチタスク学習がタスク間の負の効果に悩まされていることが示されている。
タスク間の関係を探索するために,タスクプレフィックスガイド付きマルチタスク事前学習フレームワークを提案する。
我々のモデルは、幅広いタスクの強力な基盤バックボーンとして機能するだけでなく、タスク関係を分析するための探索ツールとしても実現可能である。
論文 参考訳(メタデータ) (2022-10-12T15:02:04Z) - Identifying Auxiliary or Adversarial Tasks Using Necessary Condition
Analysis for Adversarial Multi-task Video Understanding [34.75145779372538]
本稿では,モデルが適切に動作すべき補助タスクと,モデルがうまく動作すべきでない逆タスクの両方を組み込むことで,マルチタスク学習の一般化概念を提案する。
提案する新たなフレームワークであるAMT(Adversarial Multi-Task Neural Networks)は,NAAがシーン認識であると判断した敵タスクをペナルティ化する。
提案手法は, 精度を3%向上させるとともに, 相関バイアスのシーン特徴ではなく, アクション特徴への参画を促す。
論文 参考訳(メタデータ) (2022-08-22T06:26:11Z) - Distribution Matching for Heterogeneous Multi-Task Learning: a
Large-scale Face Study [75.42182503265056]
マルチタスク学習は、共有学習アルゴリズムによって複数のタスクを共同で学習する方法論として登場した。
我々は異種mtlに対処し,検出,分類,回帰問題を同時に解決する。
大規模な顔分析のための最初のフレームワークであるFaceBehaviorNetを構築し、すべての顔行動タスクを共同で学習する。
論文 参考訳(メタデータ) (2021-05-08T22:26:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。