論文の概要: CodeVaani: A Multilingual, Voice-Based Code Learning Assistant
- arxiv url: http://arxiv.org/abs/2511.20654v1
- Date: Wed, 08 Oct 2025 17:15:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.306641
- Title: CodeVaani: A Multilingual, Voice-Based Code Learning Assistant
- Title(参考訳): CodeVaani:多言語音声ベースのコード学習アシスタント
- Authors: Jayant Havare, Srikanth Tamilselvam, Ashish Mittal, Shalaka Thorat, Soham Jadia, Varsha Apte, Ganesh Ramakrishnan,
- Abstract要約: 我々は、Bodhitreeに組み込まれたコードを理解するための多言語音声駆動アシスタントCodeVaaniを紹介する。
これは、学習者が母国語でプログラミングの概念を探求するのに役立つ音声対応アシスタントである。
28人の初心者プログラマを対象に行った調査では、CodeVaaniは75%の応答精度を達成し、参加者の80%以上が肯定的な評価を受けた。
- 参考スコア(独自算出の注目度): 13.984753319694763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Programming education often assumes English proficiency and text-based interaction, creating barriers for students from multilingual regions such as India. We present CodeVaani, a multilingual speech-driven assistant for understanding code, built into Bodhitree [1], a Learning Management System developed at IIT Bombay. It is a voice-enabled assistant that helps learners explore programming concepts in their native languages. The system integrates Indic ASR, a codeaware transcription refinement module, and a code model for generating relevant answers. Responses are provided in both text and audio for natural interaction. In a study with 28 beginner programmers, CodeVaani achieved 75% response accuracy, with over 80% of participants rating the experience positively. Compared to classroom assistance, our framework offers ondemand availability, scalability to support many learners, and multilingual support that lowers the entry barrier for students with limited English proficiency. The demo will illustrate these capabilities and highlight how voice-based AI systems can make programming education more inclusive. Supplementary artifacts and demo video are also made available.
- Abstract(参考訳): プログラミング教育は英語の習熟度とテキストベースの相互作用を前提としており、インドなどの多言語圏の学生にとって障壁となっている。
In this present CodeVaani, a multilingual speech-driven assistant for understanding code, built in Bodhitree [1], a Learning Management System at IIT Bombay。
これは、学習者が母国語でプログラミングの概念を探求するのに役立つ音声対応アシスタントである。
このシステムは、コードウェアの転写改善モジュールであるIndic ASRと、関連する回答を生成するためのコードモデルを統合する。
応答はテキストと音声の両方で提供される。
28人の初心者プログラマを対象に行った調査では、CodeVaaniは75%の応答精度を達成し、参加者の80%以上が肯定的な評価を受けた。
授業支援と比較して,我々のフレームワークは,オンデマンド・アベイラビリティ,多くの学習者を支援するスケーラビリティ,英語能力に制限のある学生の入学障壁を低くする多言語サポートを提供する。
デモでは、これらの機能を説明し、音声ベースのAIシステムがプログラミング教育をより包括的にする方法を強調している。
追加のアーティファクトやデモビデオも公開されている。
関連論文リスト
- GenAI Voice Mode in Programming Education [0.0]
マルチモーダル生成AI(GenAI)を用いたリアルタイム音声インタフェースは、障害のある初心者プログラマのアクセシビリティニーズに対処する可能性がある。
そこで本稿では,Python を学習しながら,9年生9人の音声対話を教室環境における音声対応チューターを用いて分析する。
論文 参考訳(メタデータ) (2025-09-12T15:25:08Z) - Breaking the Programming Language Barrier: Multilingual Prompting to Empower Non-Native English Learners [3.1550561074143597]
非ネイティブ英語話者(NNES)は、プログラミングを学ぶ上で、複数の障壁に直面している。
生成AI(GenAI)の進歩は、これらの障壁を壊す可能性がある。
本稿では,NNES学生が母国語でコードを生成することを促す最初の調査を行う。
論文 参考訳(メタデータ) (2024-12-17T11:06:02Z) - CodeAid: Evaluating a Classroom Deployment of an LLM-based Programming
Assistant that Balances Student and Educator Needs [14.866602418099518]
LLMを使ったプログラミングアシスタントCodeAidは、コードソリューションを公開せずに技術的に正しい応答を提供する。
CodeAidは概念的疑問に答え、行ごとの説明で擬似コードを生成し、修正提案で生徒の誤ったコードに注釈を付ける。
論文 参考訳(メタデータ) (2024-01-20T20:14:42Z) - Teacher Perception of Automatically Extracted Grammar Concepts for L2
Language Learning [66.79173000135717]
本研究は、カンナダ語とマラティ語という2つのインドの言語教育に適用する。
我々は、形態素構文(単語順、一致、ケースマーキング、または単語形成の学習)と意味論(語彙の学習)に関する疑問に答える自然なテキストコーパスから記述を抽出する。
我々は,北米の学校から言語教育者の助けを借りて手作業による評価を行い,教材が授業の準備や学習者評価に利用できる可能性を見出した。
論文 参考訳(メタデータ) (2023-10-27T18:17:29Z) - Lip Reading for Low-resource Languages by Learning and Combining General
Speech Knowledge and Language-specific Knowledge [57.38948190611797]
本稿では,特に低リソース言語を対象とした新しい唇読解フレームワークを提案する。
低リソース言語は、そのモデルを訓練するのに十分なビデオテキストペアデータを持っていないため、低リソース言語のための唇読解モデルを開発するのは難しいと考えられている。
論文 参考訳(メタデータ) (2023-08-18T05:19:03Z) - AudioPaLM: A Large Language Model That Can Speak and Listen [79.44757696533709]
本稿では,音声理解・生成のための大規模言語モデルであるAudioPaLMを紹介する。
AudioPaLMはテキストベースの言語モデルと音声ベースの言語モデルを融合する。
音声認識や音声音声翻訳などの応用により、テキストと音声を処理および生成することができる。
論文 参考訳(メタデータ) (2023-06-22T14:37:54Z) - LAE: Language-Aware Encoder for Monolingual and Multilingual ASR [87.74794847245536]
言語固有の情報を混在させることにより,両状況に対処する新しい言語対応エンコーダ (LAE) アーキテクチャを提案する。
マンダリン・イングリッシュ・コードスウィッチ音声を用いた実験により,LAEはフレームレベルで異なる言語を識別できることが示唆された。
論文 参考訳(メタデータ) (2022-06-05T04:03:12Z) - Code Switched and Code Mixed Speech Recognition for Indic languages [0.0]
多言語自動音声認識(ASR)システムの訓練は、音響情報と語彙情報が典型的には言語固有のものであるため困難である。
言語識別(LID)に基づく一言語モデルとエンドツーエンドの多言語音声認識システムの性能を比較した。
また,Hindi- English と Bengali- English の相似解法を提案し,それぞれ 21.77 と 28.27 の WER を実現する。
論文 参考訳(メタデータ) (2022-03-30T18:09:28Z) - Multilingual and code-switching ASR challenges for low resource Indian
languages [59.2906853285309]
インドの7つの言語に関連する2つのサブタスクを通じて、多言語およびコードスイッチングASRシステムの構築に重点を置いている。
これらの言語では、列車とテストセットからなる600時間分の音声データを合計で提供します。
また,マルチリンガルサブタスクとコードスイッチサブタスクのテストセットでは,それぞれ30.73%と32.45%という,タスクのベースラインレシピも提供しています。
論文 参考訳(メタデータ) (2021-04-01T03:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。