論文の概要: Foundation Models in Augmentative and Alternative Communication:
Opportunities and Challenges
- arxiv url: http://arxiv.org/abs/2401.08866v1
- Date: Tue, 16 Jan 2024 22:38:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-18 17:38:04.370900
- Title: Foundation Models in Augmentative and Alternative Communication:
Opportunities and Challenges
- Title(参考訳): 拡張的・代替的コミュニケーションの基礎モデル--機会と課題
- Authors: Ambra Di Paola, Serena Muraro, Roberto Marinelli, Christian Pilato
- Abstract要約: AAC(Augmentative and Alternative Communication)は、コミュニケーション障害を持つ人々を支援する重要な技術である。
潜在能力を最大限に発揮するためには、AACの材料は特定の特性に従わなければならない。
本稿では,基礎モデルの能力を活用して多くのAAC問題に対処することを目的としたオープンプラットフォームであるAMBRAを紹介する。
- 参考スコア(独自算出の注目度): 0.8737150966778532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Augmentative and Alternative Communication (AAC) are essential techniques
that help people with communication disabilities. AAC demonstrates its
transformative power by replacing spoken language with symbol sequences.
However, to unlock its full potential, AAC materials must adhere to specific
characteristics, placing the onus on educators to create custom-tailored
materials and symbols. This paper introduces AMBRA (Pervasive and Personalized
Augmentative and Alternative Communication based on Federated Learning and
Generative AI), an open platform that aims to leverage the capabilities of
foundation models to tackle many AAC issues, opening new opportunities (but
also challenges) for AI-enhanced AAC. We thus present a compelling vision--a
roadmap towards a more inclusive society. By leveraging the capabilities of
modern technologies, we aspire to not only transform AAC but also guide the way
toward a world where communication knows no bounds.
- Abstract(参考訳): AAC(Augmentative and Alternative Communication)は、コミュニケーション障害を持つ人々を支援する重要な技術である。
AACは、音声言語を記号列に置き換えることで変換力を示す。
しかし、その潜在能力を最大限に活用するためには、AACの材料は特定の特性に固執し、教育者に対してカスタムにカスタマイズされた材料やシンボルを作成する。
本稿では,基礎モデルの能力を活用して多くのaac問題に取り組むオープンプラットフォームであるambra (pervasive and personalized augmentedative and alternative communication based on federated learning and generative ai)について紹介する。
そこで我々は,より包括的な社会に向けた説得力のあるビジョンを提示する。
現代の技術の能力を活用することで、私たちはAACを変換するだけでなく、コミュニケーションが境界を知らない世界へと導くことを目指しています。
関連論文リスト
- GLaM-Sign: Greek Language Multimodal Lip Reading with Integrated Sign Language Accessibility [0.0]
このデータセットは、ブリッジング通信ギャップにおけるマルチモーダルリソースの変換可能性を強調する。
これはアクセシビリティとマルチモーダルAIにおいて画期的なリソースであり、Deaf and Hard-of-Hearing(DHH)個人をサポートするように設計されている。
論文 参考訳(メタデータ) (2025-01-09T13:06:47Z) - Latent-Predictive Empowerment: Measuring Empowerment without a Simulator [56.53777237504011]
我々は、より実用的な方法でエンパワーメントを計算するアルゴリズムであるLatent-Predictive Empowerment(LPE)を提案する。
LPEは、スキルと国家間の相互情報の原則的な置き換えである目的を最大化することで、大きなスキルセットを学習する。
論文 参考訳(メタデータ) (2024-10-15T00:41:18Z) - Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [55.63497537202751]
コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文 参考訳(メタデータ) (2024-07-11T14:00:53Z) - Policy Learning with a Language Bottleneck [65.99843627646018]
PLLBB(Policy Learning with a Language Bottleneck)は、AIエージェントが言語規則を生成するためのフレームワークである。
PLLBBは、言語モデルによってガイドされるルール生成ステップと、エージェントがルールによってガイドされる新しいポリシーを学ぶ更新ステップとを交互に使用する。
2人のプレイヤーによるコミュニケーションゲーム、迷路解決タスク、および2つの画像再構成タスクにおいて、PLLBBエージェントはより解釈可能で一般化可能な振る舞いを学習できるだけでなく、学習したルールを人間のユーザと共有できることを示す。
論文 参考訳(メタデータ) (2024-05-07T08:40:21Z) - Bridging the Social & Technical Divide in Augmentative and Alternative Communication (AAC) Applications for Autistic Adults [6.186903967370576]
自閉症成人12名を対象に詳細なインタビューを行い,現在のAACの問題点を把握し,どの技術進歩が有用かを検討した。
インタビューでは、入力の柔軟性、出力の柔軟性、AACの選択または適応、AACの開始または交換のタイミング、利益、大人としてのアクセス、継続的な使用のための障害ブロック、社会的関心事、コミュニケーションの制御など、9つの異なるカテゴリのテーマを見つけました。
論文 参考訳(メタデータ) (2024-04-26T23:30:07Z) - A call for embodied AI [1.7544885995294304]
我々は、人工知能の次の基本ステップとして、エンボディードAIを提案する。
Embodied AIの範囲を広げることで、認知アーキテクチャに基づく理論的枠組みを導入する。
このフレームワークはFristonのアクティブな推論原則と一致しており、EAI開発に対する包括的なアプローチを提供する。
論文 参考訳(メタデータ) (2024-02-06T09:11:20Z) - Language-Oriented Communication with Semantic Coding and Knowledge
Distillation for Text-to-Image Generation [53.97155730116369]
我々は言語指向意味コミュニケーション(LSC)の新しい枠組みを提唱した。
LSCでは、機械は人間の言語メッセージを使って通信し、SC効率のために自然言語処理(NLP)技術を用いて解釈および操作することができる。
1) テキストプロンプトをキーヘッドワードに圧縮するセマンティック・ソース・コーディング(SSC)、2) セマンティック・チャネル・コーディング(SCC)、2) セマンティック・チャネル・コーディング(SCC)、3) セマンティック・ナレッジ・蒸留(SKD)、3) リスナーの言語学習を通じてリスナーに適応したプロンプトを生成するセマンティック・ナレッジ・蒸留(SKD)の3つの革新的なアルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-09-20T08:19:05Z) - Federated Learning-Empowered AI-Generated Content in Wireless Networks [58.48381827268331]
フェデレートドラーニング(FL)は、学習効率を改善し、AIGCのプライバシー保護を達成するために利用することができる。
我々は,AIGCの強化を目的としたFLベースの技術を提案し,ユーザが多様でパーソナライズされた高品質なコンテンツを作成できるようにすることを目的とする。
論文 参考訳(メタデータ) (2023-07-14T04:13:11Z) - Voluminous yet Vacuous? Semantic Capital in an Age of Large Language
Models [0.0]
大きな言語モデル(LLM)は、自然言語処理の領域において変換力として出現し、人間のようなテキストを生成する力を持つ。
本稿では、これらのモデルの進化、能力、限界について考察し、それらが引き起こす倫理的懸念を強調した。
論文 参考訳(メタデータ) (2023-05-29T09:26:28Z) - WenLan 2.0: Make AI Imagine via a Multimodal Foundation Model [74.4875156387271]
我々は,膨大なマルチモーダル(視覚的・テキスト的)データを事前学習した新しい基礎モデルを開発する。
そこで本研究では,様々な下流タスクにおいて,最先端の成果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T12:25:21Z) - PicTalky: Augmentative and Alternative Communication Software for
Language Developmental Disabilities [2.2944351895226953]
AAC(Augmentative and Alternative Communication)は、言語障害のある人々のための実践的なコミュニケーション手段である。
言語発達障害児のコミュニケーション能力と言語理解能力の向上を支援するAIベースのAACシステムであるPicTalkyを提案する。
論文 参考訳(メタデータ) (2021-09-27T10:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。