論文の概要: A comprehensive study of on-device NLP applications -- VQA, automated Form filling, Smart Replies for Linguistic Codeswitching
- arxiv url: http://arxiv.org/abs/2409.19010v1
- Date: Mon, 23 Sep 2024 19:28:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 05:00:47.392293
- Title: A comprehensive study of on-device NLP applications -- VQA, automated Form filling, Smart Replies for Linguistic Codeswitching
- Title(参考訳): オンデバイスNLPアプリケーションに関する総合的研究 -- VQA、自動フォームフィリング、言語コードスイッチングのためのスマートリプライ
- Authors: Naman Goyal,
- Abstract要約: 2つのカテゴリに3つの新しい体験を提案する。
まず、画面理解に活用できる体験について議論する。
拡張可能な2つ目のカテゴリは、多言語話者をサポートするスマートリプライである。
- 参考スコア(独自算出の注目度): 22.835086775191346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent improvement in large language models, open doors for certain new experiences for on-device applications which were not possible before. In this work, we propose 3 such new experiences in 2 categories. First we discuss experiences which can be powered in screen understanding i.e. understanding whats on user screen namely - (1) visual question answering, and (2) automated form filling based on previous screen. The second category of experience which can be extended are smart replies to support for multilingual speakers with code-switching. Code-switching occurs when a speaker alternates between two or more languages. To the best of our knowledge, this is first such work to propose these tasks and solutions to each of them, to bridge the gap between latest research and real world impact of the research in on-device applications.
- Abstract(参考訳): 大規模言語モデルの最近の改良は、これまで不可能だったデバイス上のアプリケーションのための、ある種の新しいエクスペリエンスの扉を開くことである。
本稿では,2つのカテゴリに3つの新しい体験を提案する。
まず、ユーザ画面上の何を理解するか、すなわち、(1)視覚的質問応答、(2)以前の画面に基づく自動フォームフィリングなど、画面理解に活用できる体験について議論する。
拡張可能な2つ目のカテゴリは、コードスイッチングを備えた多言語話者をサポートするスマートリプライである。
コードスイッチングは、話者が2つ以上の言語を交互に切り替えたときに発生する。
私たちの知る限りでは、デバイス上のアプリケーションにおける研究の最新の研究と実世界への影響のギャップを埋めるために、これらのタスクとソリューションをそれぞれ提案するのは、これが初めてである。
関連論文リスト
- Code-switching in text and speech reveals information-theoretic audience design [5.3329709073809095]
コードスイッチングに影響を与える要因について,言語モデルを用いて検討する。
ある話者が1つの言語(第一言語)と別の言語(第二言語)を交互に話すとき、コードスイッチングが発生する
論文 参考訳(メタデータ) (2024-08-08T17:14:12Z) - Code-Switched Language Identification is Harder Than You Think [69.63439391717691]
コードスイッチングは、文字と音声の通信において一般的な現象である。
CSコーパスの構築の応用について検討する。
タスクをもっと多くの言語に拡張することで、タスクをより現実的にします。
文レベルのマルチラベルタグ付け問題としてタスクを再構築し、より難易度の高いものにする。
論文 参考訳(メタデータ) (2024-02-02T15:38:47Z) - SADAS: A Dialogue Assistant System Towards Remediating Norm Violations
in Bilingual Socio-Cultural Conversations [56.31816995795216]
SADAS(Socially-Aware Dialogue Assistant System)は、会話が敬意と理解で広がることを保証するためのシステムである。
本システムの新しいアーキテクチャは,(1)対話に存在する規範のカテゴリを特定すること,(2)潜在的な規範違反を検出すること,(3)違反の深刻さを評価すること,(4)違反の是正を目的とした対策を実施すること,を含む。
論文 参考訳(メタデータ) (2024-01-29T08:54:21Z) - Measuring Entrainment in Spontaneous Code-switched Speech [3.9736028502700527]
我々は,人間間のコードスイッチによる自発音声における文字と音声のエントレメントのパターンについて検討した。
本研究は,コミュニケーション現象としてのエントレメントの「普遍的」性質に重要な意味を生じさせるものである。
論文 参考訳(メタデータ) (2023-11-13T19:41:34Z) - Automatic Identification of Motivation for Code-Switching in Speech
Transcripts [3.8073142980733]
コードスイッチング(英: Code-switching)は、言語を切り替えることであり、言語学的、社会学的、文化的に重要な意味を持つ。
日々の音声で話者が音声で会話する幅広いモチベーションを自動的に識別するシステムを構築した。
新しい言語対に適応でき、新しい言語対(ヒンディー語-英語)で66%の精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-11-30T05:45:05Z) - Bilingual by default: Voice Assistants and the role of code-switching in
creating a bilingual user experience [0.5047889990543175]
バイリンガルユーザのためのVAインタラクションにおいて直面する言語生産上の課題を強調した。
我々は、コードスイッチングのようなバイリンガル相互作用で見られる現象を促進することで、より包括的で改善されたユーザーエクスペリエンスを育むことができると論じる。
論文 参考訳(メタデータ) (2022-06-20T13:26:48Z) - Towards Best Practices for Training Multilingual Dense Retrieval Models [54.91016739123398]
我々は,このような設計を用いて,多種多様言語における単言語検索の課題に焦点をあてる。
本研究は多言語高密度検索モデルのトレーニングのための「ベストプラクティス」ガイドとして組織されている。
論文 参考訳(メタデータ) (2022-04-05T17:12:53Z) - An Adversarial Learning based Multi-Step Spoken Language Understanding
System through Human-Computer Interaction [70.25183730482915]
対戦型学習に基づく多段階音声言語理解システムを提案する。
我々は,F1の観点で解析性能を少なくとも2.5%向上させることを実証した。
論文 参考訳(メタデータ) (2021-06-06T03:46:53Z) - Mobile App Tasks with Iterative Feedback (MoTIF): Addressing Task
Feasibility in Interactive Visual Environments [54.405920619915655]
これまで最大数のインタラクティブ環境向けに自然言語コマンドを用いたデータセットであるMoTIF(Iterative Feedback)を用いたモバイルアプリタスクを紹介します。
MoTIFは、満足できないインタラクティブ環境のための自然言語リクエストを最初に含んでいる。
初期実現可能性分類実験を行い、より豊かな視覚言語表現の必要性を検証し、f1スコア37.3まで到達した。
論文 参考訳(メタデータ) (2021-04-17T14:48:02Z) - Evaluating Multilingual Text Encoders for Unsupervised Cross-Lingual
Retrieval [51.60862829942932]
本稿では,言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性に着目した体系的実証研究を行う。
文レベルのCLIRでは、最先端のパフォーマンスが達成できることを実証する。
しかし、ピーク性能は、汎用の多言語テキストエンコーダをオフ・ザ・シェルフで使うのではなく、文の理解タスクにさらに特化したバリエーションに依存している。
論文 参考訳(メタデータ) (2021-01-21T00:15:38Z) - Transformer-Transducers for Code-Switched Speech Recognition [23.281314397784346]
コード切替音声認識のためのトランスフォーマー・トランスデューサモデルアーキテクチャを用いたエンドツーエンドのASRシステムを提案する。
まず、コードスイッチングの低リソースシナリオを扱うために、2つの補助損失関数を導入する。
第二に,言語ID情報を用いた新しいマスクベースのトレーニング戦略を提案し,文内コードスイッチングに向けたラベルエンコーダのトレーニングを改善する。
論文 参考訳(メタデータ) (2020-11-30T17:27:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。