論文の概要: SALAD: Smart AI Language Assistant Daily
- arxiv url: http://arxiv.org/abs/2402.07431v2
- Date: Tue, 13 Feb 2024 06:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 11:51:24.597774
- Title: SALAD: Smart AI Language Assistant Daily
- Title(参考訳): SALAD: スマートAI言語アシスタント
- Authors: Ragib Amin Nihal, Tran Dong Huu Quoc, Lin Zirui, Xu Yimimg, Liu
Haoran, An Zhaoyi, and Kyou Ma
- Abstract要約: SALADは、外国人が日本語を学ぶのを助けるために設計された、AIによる言語学習アプリケーションである。
漢字仮名文字の翻訳、音声認識、翻訳音声、語彙追跡、文法説明、新たに学習した単語から生成された歌などを提供している。
- 参考スコア(独自算出の注目度): 0.25128687379089687
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SALAD is an AI-driven language-learning application designed to help
foreigners learn Japanese. It offers translations in Kanji-Kana-Romaji, speech
recognition, translated audio, vocabulary tracking, grammar explanations, and
songs generated from newly learned words. The app targets beginners and
intermediate learners, aiming to make language acquisition more accessible and
enjoyable. SALAD uses daily translations to enhance fluency and comfort in
communication with native speakers. The primary objectives include effective
Japanese language learning, user engagement, and progress tracking. A survey by
us found that 39% of foreigners in Japan face discomfort in conversations with
Japanese speakers. Over 60% of foreigners expressed confidence in SALAD's
ability to enhance their Japanese language skills. The app uses large language
models, speech recognition, and diffusion models to bridge the language gap and
foster a more inclusive community in Japan.
- Abstract(参考訳): saladは、外国人が日本語を学ぶのを助けるai駆動の言語学習アプリケーションだ。
漢字仮名文字の翻訳、音声認識、翻訳音声、語彙追跡、文法説明、新たに学習した単語から生成された歌などを提供している。
このアプリは初心者と中間学習者をターゲットにしており、言語習得をより使いやすくすることを目指している。
SALADは日々の翻訳を使用して、ネイティブスピーカーとのコミュニケーションの流布と快適さを高める。
主な目的は、効果的な日本語学習、ユーザエンゲージメント、進捗追跡である。
我が国の外国人の39%が日本人話者との会話に不快を感じている。
外国人の60%以上がSALADの日本語能力に自信を示していた。
このアプリは、大きな言語モデル、音声認識、拡散モデルを使用して、言語ギャップを埋め、日本のより包括的なコミュニティを育む。
関連論文リスト
- Lens: Rethinking Multilingual Enhancement for Large Language Models [70.85065197789639]
Lensは、大規模言語モデル(LLM)の多言語機能を強化する新しいアプローチである
LLMの上位層から言語に依存しない、言語固有のサブ空間内の隠された表現を操作できる。
既存のポストトレーニング手法に比べて計算資源がはるかに少ないため、優れた結果が得られる。
論文 参考訳(メタデータ) (2024-10-06T08:51:30Z) - Error-preserving Automatic Speech Recognition of Young English Learners' Language [6.491559928368298]
言語学習者が実践しなければならない中心的なスキルの1つは、言語を話すことである。
近年の音声技術と自然言語処理の進歩は、彼らの発話スキルを実践する新しいツールの開発を可能にしている。
そこで我々は,若手学習者による自然発話に対処し,誤りを抑えるASRシステムを構築した。
論文 参考訳(メタデータ) (2024-06-05T13:15:37Z) - CORI: CJKV Benchmark with Romanization Integration -- A step towards Cross-lingual Transfer Beyond Textual Scripts [50.44270798959864]
一部の言語は、他の言語よりも接続性が良く、ターゲット言語は、密接に関連する言語からの転送の恩恵を受けることができる。
本研究では,言語間移動におけるソース言語の影響について検討し,対象言語と高い接触を持つソース言語を選択することの重要性を示す。
論文 参考訳(メタデータ) (2024-04-19T04:02:50Z) - CLARA: Multilingual Contrastive Learning for Audio Representation
Acquisition [5.520654376217889]
CLARAはラベル付きデータへの依存を最小限に抑え、言語間の一般化を強化する。
我々のアプローチは、主観的評価問題を克服し、音声における感情的ニュアンスを十分に捉えている。
低リソース言語に適応し、多言語音声表現学習の進歩を示す。
論文 参考訳(メタデータ) (2023-10-18T09:31:56Z) - Lip Reading for Low-resource Languages by Learning and Combining General
Speech Knowledge and Language-specific Knowledge [57.38948190611797]
本稿では,特に低リソース言語を対象とした新しい唇読解フレームワークを提案する。
低リソース言語は、そのモデルを訓練するのに十分なビデオテキストペアデータを持っていないため、低リソース言語のための唇読解モデルを開発するのは難しいと考えられている。
論文 参考訳(メタデータ) (2023-08-18T05:19:03Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Scaling Speech Technology to 1,000+ Languages [66.31120979098483]
MMS(Massively Multilingual Speech)プロジェクトは、タスクに応じてサポート言語を10~40倍増やす。
主な材料は、一般に公開されている宗教文書の読解に基づく新しいデータセットである。
我々は,1,406言語,1,107言語用1つの多言語自動音声認識モデル,同一言語用音声合成モデル,4,017言語用言語識別モデルについて,事前学習したwav2vec 2.0モデルを構築した。
論文 参考訳(メタデータ) (2023-05-22T22:09:41Z) - Rethinking Annotation: Can Language Learners Contribute? [13.882919101548811]
本稿では,言語学習者がベンチマークデータセットにアノテーションを貢献できるかどうかを検討する。
我々は、英語、韓国語、インドネシア語という3つの言語と、感情分析、自然言語推論、名前付きエンティティ認識、機械読解の4つのNLPタスクをターゲットにしている。
言語学習者、特に中級または上級の言語習熟度を持つ者は、追加資源の助けを借りてかなり正確なラベルを提供することができる。
論文 参考訳(メタデータ) (2022-10-13T08:22:25Z) - FreeTalky: Don't Be Afraid! Conversations Made Easier by a Humanoid
Robot using Persona-based Dialogue [1.7651013017598882]
本稿では,外国語に関する不安を経験する人々を対象とした,ディープラーニングに基づく外国語学習プラットフォームFreeTalkyを提案する。
NAOに埋め込まれたペルソナベースの対話システムは、ユーザにとって興味深く一貫したマルチターン対話を提供する。
論文 参考訳(メタデータ) (2021-12-08T05:48:11Z) - An Interactive Foreign Language Trainer Using Assessment and Feedback
Modalities [0.0]
この研究は、情報工学の分野において最もよく使われている4つの外国語のうちの1つまたは全てから学生が学ぶのに役立つように設計されている。
このプログラムは、学生に基礎的、中間的、高度なレベルを素早く教えることを目的としている。
論文 参考訳(メタデータ) (2020-11-23T16:35:59Z) - That Sounds Familiar: an Analysis of Phonetic Representations Transfer
Across Languages [72.9927937955371]
我々は、他言語に存在するリソースを用いて、多言語自動音声認識モデルを訓練する。
我々は,多言語設定における全言語間での大幅な改善と,多言語設定におけるスターク劣化を観察した。
分析の結果、ひとつの言語に固有の電話でさえ、他の言語からのトレーニングデータを追加することで大きなメリットがあることがわかった。
論文 参考訳(メタデータ) (2020-05-16T22:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。