論文の概要: Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní
- arxiv url: http://arxiv.org/abs/2603.05743v1
- Date: Thu, 05 Mar 2026 23:07:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:44.687018
- Title: Let's Talk, Not Type: An Oral-First Multi-Agent Architecture for Guaraní
- Title(参考訳): タイプではなく,話し合おう - Guaraní のオーラルファーストなマルチエージェントアーキテクチャ
- Authors: Samantha Adorno, Akshata Kishore Moharir, Ratna Kandala,
- Abstract要約: 本稿では,生きた口頭での実践と一致しない限り,AIにおける言語サポートは不十分なままである,と論じる。
本稿では,標準の"text-to-speech"パイプラインの代替として,オーラルファーストなマルチエージェントアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.3181700357675698
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Although artificial intelligence (AI) and Human-Computer Interaction (HCI) systems are often presented as universal solutions, their design remains predominantly text-first, underserving primarily oral languages and indigenous communities. This position paper uses Guaraní, an official and widely spoken language of Paraguay, as a case study to argue that language support in AI remains insufficient unless it aligns with lived oral practices. We propose an alternative to the standard "text-to-speech" pipeline, proposing instead an oral-first multi-agent architecture. By decoupling Guaraní natural language understanding from dedicated agents for conversation state and community-led governance, we demonstrate a technical framework that respects indigenous data sovereignty and diglossia. Our work moves beyond mere recognition to focus on turn-taking, repair, and shared context as the primary locus of interaction. We conclude that for AI to be truly culturally grounded, it must shift from adapting oral languages to text-centric systems to treating spoken conversation as a first-class design requirement, ensuring digital ecosystems empower rather than overlook diverse linguistic practices.
- Abstract(参考訳): 人工知能 (AI) とヒューマン・コンピュータ・インタラクション (HCI) システムは、しばしば普遍的な解決策として提示されるが、その設計は主にテキストファーストであり、主に口頭語や先住民のコミュニティに根ざしている。
このポジションペーパーは、パラグアイの公用語で広く話されているグアラーニを、生きた口頭での慣行に沿わない限り、AIにおける言語サポートが不十分であると主張するケーススタディとして用いている。
本稿では,標準の"text-to-speech"パイプラインの代替として,オーラルファーストなマルチエージェントアーキテクチャを提案する。
グアラーニの自然言語理解を会話状態とコミュニティ主導のガバナンスのための専用エージェントから切り離すことで、先住民のデータ主権と尊厳を尊重する技術的な枠組みを実証する。
私たちの仕事は単なる認識を超えて、ターンテイキング、修復、コンテキスト共有に重点を置いています。
AIが真に文化的基盤を持つためには、口頭言語からテキスト中心のシステムに移行し、音声会話を第一級の設計要件として扱い、多様な言語プラクティスを見渡すのではなく、デジタルエコシステムを力づける必要がある、と結論付けています。
関連論文リスト
- Improving Speech Emotion Recognition in Under-Resourced Languages via Speech-to-Speech Translation with Bootstrapping Data Selection [49.27067541740956]
音声感情認識(SER)は、人間とコンピュータの自然な相互作用が可能な汎用AIエージェントを開発する上で重要な要素である。
英語や中国語以外の言語でラベル付きデータが不足しているため、堅牢な多言語SERシステムの構築は依然として困難である。
本稿では,低SERリソース言語におけるSERの性能向上のための手法を提案する。
論文 参考訳(メタデータ) (2024-09-17T08:36:45Z) - Harnessing the Power of Artificial Intelligence to Vitalize Endangered Indigenous Languages: Technologies and Experiences [31.62071644137294]
我々は、世界の言語の多様性の低下と、AIとNLPに固有の倫理的課題をもたらすインディジェネラル言語について論じる。
Indigenous Language のための高品質な機械学習トランスレータの開発に励む成果を報告する。
私たちは2023年と2024年にブラジルの先住民コミュニティで実施したプロジェクトで構築したプロトタイプを紹介します。
論文 参考訳(メタデータ) (2024-07-17T14:46:37Z) - Standard Language Ideology in AI-Generated Language [1.2815904071470705]
標準言語イデオロギーは、大言語モデル(LLM)によって生成された言語に反映され、強化される
我々は、AI生成言語における標準言語イデオロギーがどのように現れるかを示す、オープンな問題の表層分類を提示する。
論文 参考訳(メタデータ) (2024-06-13T01:08:40Z) - Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.64412090339044]
音声から4つの言語アノテーションを自動抽出するタスクであるWav2Glossを提案する。
音声からのインターリニア・グロッシド・テキスト・ジェネレーションの今後の研究の基盤となる基盤となるものについて述べる。
論文 参考訳(メタデータ) (2024-03-19T21:45:29Z) - What Do Dialect Speakers Want? A Survey of Attitudes Towards Language Technology for German Dialects [60.8361859783634]
我々はドイツ語に関連する方言と地域言語に関する話者を調査した。
回答者は特に、方言入力で動作する潜在的なNLPツールを好んでいる。
論文 参考訳(メタデータ) (2024-02-19T09:15:28Z) - Towards Bridging the Digital Language Divide [4.234367850767171]
多言語言語処理システムは、しばしばハードワイヤで、通常不随意で、特定の言語に対して隠された表現的嗜好を示す。
偏りのある技術は、しばしば表現される言語の複雑さに不公平な研究・開発手法の結果であることを示す。
我々は,技術設計と方法論の両面から,言語バイアスを減らすことを目的とした新しいイニシアティブを提案する。
論文 参考訳(メタデータ) (2023-07-25T10:53:20Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z) - ReferentialGym: A Nomenclature and Framework for Language Emergence &
Grounding in (Visual) Referential Games [0.30458514384586394]
自然言語は、人間が情報を伝達し、共通の目標に向けて協力するための強力なツールである。
計算言語学者は、言語ゲームによって引き起こされる人工言語の出現を研究している。
AIコミュニティは、言語の出現と、より優れたヒューマンマシンインターフェースに向けた基礎研究を開始した。
論文 参考訳(メタデータ) (2020-12-17T10:22:15Z) - Experience Grounds Language [185.73483760454454]
言語理解研究は、言語が記述する物理的世界と、それが促進する社会的相互作用とを関連づけることに失敗している。
テキストだけで訓練された後にタスクに取り組むための言語処理モデルの驚くべき効果にもかかわらず、成功した言語コミュニケーションは世界の共有経験に依存している。
論文 参考訳(メタデータ) (2020-04-21T16:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。