論文の概要: NLU for Game-based Learning in Real: Initial Evaluations
- arxiv url: http://arxiv.org/abs/2205.13754v1
- Date: Fri, 27 May 2022 03:48:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 06:17:21.523100
- Title: NLU for Game-based Learning in Real: Initial Evaluations
- Title(参考訳): 実戦におけるゲーム学習のためのNLU:初期評価
- Authors: Eda Okur, Saurav Sahay, Lama Nachman
- Abstract要約: 本研究では、最近提案されたトランスフォーマーベースマルチタスクNLUアーキテクチャの利点について検討する。
主に、小規模のドメイン固有の教育ゲームデータセット上でIntent Recognitionを実行する。
我々は、より単純なベースラインアプローチと比較して、Dual IntentとEntity Transformer(DIET)アーキテクチャは現実世界のデータを扱うのに十分な堅牢であることを示した。
- 参考スコア(独自算出の注目度): 9.912419882236918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intelligent systems designed for play-based interactions should be
contextually aware of the users and their surroundings. Spoken Dialogue Systems
(SDS) are critical for these interactive agents to carry out effective
goal-oriented communication with users in real-time. For the real-world (i.e.,
in-the-wild) deployment of such conversational agents, improving the Natural
Language Understanding (NLU) module of the goal-oriented SDS pipeline is
crucial, especially with limited task-specific datasets. This study explores
the potential benefits of a recently proposed transformer-based multi-task NLU
architecture, mainly to perform Intent Recognition on small-size
domain-specific educational game datasets. The evaluation datasets were
collected from children practicing basic math concepts via play-based
interactions in game-based learning settings. We investigate the NLU
performances on the initial proof-of-concept game datasets versus the
real-world deployment datasets and observe anticipated performance drops
in-the-wild. We have shown that compared to the more straightforward baseline
approaches, Dual Intent and Entity Transformer (DIET) architecture is robust
enough to handle real-world data to a large extent for the Intent Recognition
task on these domain-specific in-the-wild game datasets.
- Abstract(参考訳): プレイベースのインタラクション用に設計されたインテリジェントシステムは、ユーザとその周囲をコンテキスト的に認識する必要がある。
対話型対話システム(sds)は,ユーザとの効果的な目標指向コミュニケーションをリアルタイムに行うために重要である。
このような対話エージェントの現実世界(すなわち、その内)への展開では、特にタスク固有のデータセットが限定的に存在するため、目標指向SDSパイプラインの自然言語理解(NLU)モジュールの改善が不可欠である。
本研究では,最近提案されたトランスフォーマーベースマルチタスクNLUアーキテクチャの利点について検討する。
評価データセットは,ゲームベースの学習環境におけるプレイベースインタラクションを通じて,基本的な数学概念を実践する子供たちから収集した。
概念実証ゲームデータセットと実世界の展開データセットのnlu性能を調査し,期待した性能低下を観察した。
より単純なベースラインアプローチと比較して、dual intentとentity transformer(diet)アーキテクチャは、これらのドメイン固有のゲームデータセットのインテント認識タスクにおいて、現実世界のデータを扱うのに十分な堅牢性を示している。
関連論文リスト
- Flex: End-to-End Text-Instructed Visual Navigation with Foundation Models [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly-lexically) で合成され,VLM(Vision Language Models) をフリーズしたパッチワイド特徴抽出器として利用するフレームワークである。
本研究では,本手法が4段階のフライ・トゥ・ターゲットタスクにおいて有効であることを示す。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Cross-Domain HAR: Few Shot Transfer Learning for Human Activity
Recognition [0.2944538605197902]
本稿では,HARデータセットを有効な転送学習に利用するための経済的なアプローチを提案する。
本稿では,教師が学習する自己学習パラダイムに則って,新たな伝達学習フレームワークであるクロスドメインHARを紹介する。
本手法の有効性を,撮影活動認識のシナリオで実証する。
論文 参考訳(メタデータ) (2023-10-22T19:13:25Z) - A Dimensional Structure based Knowledge Distillation Method for
Cross-Modal Learning [15.544134849816528]
簡単な作業から抽出した特徴を解析・観察することで特徴識別性と次元構造(DS)の相関を見いだす。
クロスモーダル・ナレッジ・蒸留法 (CMKD) を提案し, 教師付きクロスモーダル・ラーニング (CML) の性能向上を図る。
提案手法は, チャネル的に独立して, 中間的な特徴を均一に分散させることで, その精度を高めるために, 難易度から意味的に無関係な特徴を学習する。
論文 参考訳(メタデータ) (2023-06-28T07:29:26Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - KERM: Knowledge Enhanced Reasoning for Vision-and-Language Navigation [61.08389704326803]
VLN(Vision-and-Language Navigation)は、実シーンにおける自然言語命令に続く遠隔地への移動を可能にするタスクである。
以前のアプローチのほとんどは、ナビゲート可能な候補を表現するために、機能全体やオブジェクト中心の機能を利用している。
本稿では,知識を活用したエージェントナビゲーション能力向上のための知識強化推論モデル(KERM)を提案する。
論文 参考訳(メタデータ) (2023-03-28T08:00:46Z) - Data Augmentation with Paraphrase Generation and Entity Extraction for
Multimodal Dialogue System [9.912419882236918]
我々は,小学生が基本数学の概念を学ぶための多モーダル対話システムに向けて研究している。
本研究では,音声対話システムパイプラインの自然言語理解モジュールのパラフレーズ生成によるデータ拡張の可能性を探る。
我々は,小型シードデータを用いたモデル・イン・ザ・ループ(MITL)戦略のパラフレーズ化が,インテント認識タスクの性能改善をもたらす有望なアプローチであることを示した。
論文 参考訳(メタデータ) (2022-05-09T02:21:20Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Transformer-Based Behavioral Representation Learning Enables Transfer
Learning for Mobile Sensing in Small Datasets [4.276883061502341]
時系列から一般化可能な特徴表現を学習できるモバイルセンシングデータのためのニューラルネットワークフレームワークを提供する。
このアーキテクチャは、CNNとTrans-formerアーキテクチャの利点を組み合わせて、より良い予測性能を実現する。
論文 参考訳(メタデータ) (2021-07-09T22:26:50Z) - Where2Act: From Pixels to Actions for Articulated 3D Objects [54.19638599501286]
可動部を有する関節物体の押出しや引抜き等の基本動作に関連する高度に局所化された動作可能な情報を抽出する。
シミュレーションでネットワークをトレーニングできるオンラインデータサンプリング戦略を備えた学習から対話までのフレームワークを提案します。
私たちの学習モデルは、現実世界のデータにも転送します。
論文 参考訳(メタデータ) (2021-01-07T18:56:38Z) - Deflating Dataset Bias Using Synthetic Data Augmentation [8.509201763744246]
自律走行車(AV)の視覚タスクの最先端の手法は、教師あり学習に依存している。
本研究の目的は,視覚タスクにおける実際のデータセットのギャップを埋めるために,ターゲットとなる合成データ拡張の利用を検討することである。
AVに実用的な3つの異なるコンピュータビジョンタスクに関する実証研究は、トレーニングミックスに合成データを持つことは、クロスデータセットの一般化性能を著しく向上させることを一貫して示している。
論文 参考訳(メタデータ) (2020-04-28T21:56:10Z) - Deep Learning based Pedestrian Inertial Navigation: Methods, Dataset and
On-Device Inference [49.88536971774444]
慣性測定ユニット(IMU)は小型で安価でエネルギー効率が良く、スマートデバイスや移動ロボットに広く使われている。
正確で信頼性の高い歩行者ナビゲーションをサポートするために慣性データをエクスプロイトすることは、新しいインターネット・オブ・シングス・アプリケーションやサービスにとって重要なコンポーネントである。
我々は、深層学習に基づく慣性ナビゲーション研究のための最初の公開データセットであるOxIOD(OxIOD)を提示、リリースする。
論文 参考訳(メタデータ) (2020-01-13T04:41:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。