論文の概要: TwIPS: A Large Language Model Powered Texting Application to Simplify Conversational Nuances for Autistic Users
- arxiv url: http://arxiv.org/abs/2407.17760v1
- Date: Thu, 25 Jul 2024 04:15:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-26 15:17:52.224850
- Title: TwIPS: A Large Language Model Powered Texting Application to Simplify Conversational Nuances for Autistic Users
- Title(参考訳): TwIPS: 自閉症ユーザのための会話ニュアンスを簡単にするための大規模言語モデルによるテキストアプリケーション
- Authors: Rukhshan Haroon, Fahad Dogar,
- Abstract要約: 自閉症の個人はしばしば、感情的な声調や非文学的なニュアンスを伝え、解釈するのに困難を経験する。
大規模言語モデル(LLM)を利用したプロトタイプテキストアプリケーションTwIPSについて述べる。
我々は、AIベースのシミュレーションと会話スクリプトを利用して、TwIPSを8人の自閉症参加者で評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autistic individuals often experience difficulties in conveying and interpreting emotional tone and non-literal nuances. Many also mask their communication style to avoid being misconstrued by others, spending considerable time and mental effort in the process. To address these challenges in text-based communication, we present TwIPS, a prototype texting application powered by a large language model (LLM), which can assist users with: a) deciphering tone and meaning of incoming messages, b) ensuring the emotional tone of their message is in line with their intent, and c) coming up with alternate phrasing for messages that could be misconstrued and received negatively by others. We leverage an AI-based simulation and a conversational script to evaluate TwIPS with 8 autistic participants in an in-lab setting. Our findings show TwIPS enables a convenient way for participants to seek clarifications, provides a better alternative to tone indicators, and facilitates constructive reflection on writing technique and style. We also examine how autistic users utilize language for self-expression and interpretation in instant messaging, and gather feedback for enhancing our prototype. We conclude with a discussion around balancing user-autonomy with AI-mediation, establishing appropriate trust levels in AI systems, and customization needs if autistic users in the context of AI-assisted communication
- Abstract(参考訳): 自閉症の個人はしばしば、感情的な声調や非文学的なニュアンスを伝え、解釈するのに困難を経験する。
多くの人々はコミュニケーションスタイルを隠蔽し、他人によって誤解されるのを避け、その過程でかなりの時間と精神的な努力を費やす。
テキストベースのコミュニケーションにおけるこれらの課題に対処するために,大言語モデル(LLM)を利用したプロトタイプテキストアプリケーションであるTwIPSを紹介した。
a) 受信メッセージのトーンと意味を解読すること
b) メッセージの感情的トーンが意図と一致していること、及び
c) 他人から否定的に解釈され,受信される可能性のあるメッセージについて,別の言い換えをする。
我々は、AIベースのシミュレーションと会話スクリプトを利用して、TwIPSを8人の自閉症参加者で評価する。
以上の結果から,TwIPSは,参加者が明確化を求めるための便利な方法であり,音調指標の代替として優れた手段であり,文字の技法やスタイルに対する構成的反映を容易にすることが示唆された。
また,インスタントメッセージにおける自己表現と解釈に,自閉症ユーザーが言語をどのように活用しているかを検証し,プロトタイプの強化のためにフィードバックを集める。
我々は、AIメディエーションによるユーザ自律性のバランス、AIシステムにおける適切な信頼レベルの設定、AI支援コミュニケーションの文脈における自閉症ユーザのニーズのカスタマイズに関する議論を締めくくった。
関連論文リスト
- Predictive Speech Recognition and End-of-Utterance Detection Towards Spoken Dialog Systems [55.99999020778169]
本稿では,次の単語を予測し,発話終了まで残される時間を推定する機能について検討する。
我々は,音響情報と言語情報の両方を組み込んだクロスアテンションに基づくアルゴリズムを開発した。
その結果,提案モデルでは,提案する単語を予測し,将来のEOUイベントを実際のEOUより300ミリ秒前まで推定する能力を示した。
論文 参考訳(メタデータ) (2024-09-30T06:29:58Z) - Constraining Participation: Affordances of Feedback Features in Interfaces to Large Language Models [49.74265453289855]
大規模言語モデル(LLM)は、コンピュータ、Webブラウザ、ブラウザベースのインターフェースによるインターネット接続を持つ人なら誰でも利用できるようになった。
本稿では,ChatGPTインタフェースにおける対話型フィードバック機能の可能性について検討し,ユーザ入力の形状やイテレーションへの参加について分析する。
論文 参考訳(メタデータ) (2024-08-27T13:50:37Z) - Toward a Dialogue System Using a Large Language Model to Recognize User Emotions with a Camera [0.0]
ユーザの表情から感情を認識するためのAIエージェントの方法は研究されていない。
LLMをベースとしたAIエージェントが、カメラと対話してユーザをキャプチャすることで、感情状態に応じてユーザと対話できるかどうかを検討した。
その結果、AIエージェントは、HappyやAngryのような比較的高いスコアを持つ感情状態の感情状態に応じて会話できることを確認した。
論文 参考訳(メタデータ) (2024-08-15T07:03:00Z) - WordDecipher: Enhancing Digital Workspace Communication with Explainable AI for Non-native English Speakers [11.242099987201573]
非ネイティブ英語話者(NNES)は、デジタルワークスペースコミュニケーションにおける課題に直面している。
現在のAI支援書記ツールは、流布強化と書き直し提案を備えている。
我々は、デジタルワークスペースコミュニケーションを強化するための説明可能なAI支援記述ツールであるWordDecipherを提案する。
論文 参考訳(メタデータ) (2024-04-10T13:40:29Z) - Paralinguistics-Enhanced Large Language Modeling of Spoken Dialogue [71.15186328127409]
パラリンGPT(Paralin GPT)
モデルは、シリアライズされたマルチタスクフレームワーク内の入力プロンプトとして、テキスト、音声埋め込み、およびパラ言語属性の会話コンテキストを取る。
音声対話データセットとして,感情ラベルをパラ言語属性として含むSwitchboard-1コーパスを利用する。
論文 参考訳(メタデータ) (2023-12-23T18:14:56Z) - Utilizing Speech Emotion Recognition and Recommender Systems for
Negative Emotion Handling in Therapy Chatbots [0.0]
本稿では,ユーザの感情を理解し,人間のような共感を与えることのできる,聴覚認知によるチャットボットのセラピーを強化するアプローチを提案する。
提案手法は,CNNモデルとShEMOデータセットを用いた音声感情認識(SER)技術を含む。
より没入的で共感的なユーザエクスペリエンスを実現するため、GlowTTSと呼ばれるテキスト音声モデルを統合する。
論文 参考訳(メタデータ) (2023-11-18T16:35:55Z) - A Vector Quantized Approach for Text to Speech Synthesis on Real-World
Spontaneous Speech [94.64927912924087]
我々は、YouTubeやポッドキャストから現実の音声を使ってTSシステムを訓練する。
最近のText-to-Speechアーキテクチャは、複数のコード生成とモノトニックアライメントのために設計されている。
近年のテキスト・トゥ・スペーチ・アーキテクチャは,いくつかの客観的・主観的尺度において,既存のTSシステムより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-08T17:34:32Z) - Multimodal Emotion Recognition using Transfer Learning from Speaker
Recognition and BERT-based models [53.31917090073727]
本稿では,音声とテキストのモダリティから,伝達学習モデルと微調整モデルとを融合したニューラルネットワークによる感情認識フレームワークを提案する。
本稿では,対話型感情的モーションキャプチャー・データセットにおけるマルチモーダル・アプローチの有効性を評価する。
論文 参考訳(メタデータ) (2022-02-16T00:23:42Z) - PicTalky: Augmentative and Alternative Communication Software for
Language Developmental Disabilities [2.2944351895226953]
AAC(Augmentative and Alternative Communication)は、言語障害のある人々のための実践的なコミュニケーション手段である。
言語発達障害児のコミュニケーション能力と言語理解能力の向上を支援するAIベースのAACシステムであるPicTalkyを提案する。
論文 参考訳(メタデータ) (2021-09-27T10:46:14Z) - Hierarchical Summarization for Longform Spoken Dialog [1.995792341399967]
音声対話の広汎性にもかかわらず、自動音声理解と品質情報抽出は依然として著しく貧弱である。
テキストを理解することに比べ、聴覚コミュニケーションは、話者の拡散、非公式な散文スタイル、構造の欠如など、多くの追加的な課題を生んでいる。
本稿では、2段階のASRとテキスト要約パイプラインを提案し、これらの音声認識課題を解決するためのセマンティックセグメンテーションとマージアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-08-21T23:31:31Z) - An Attribute-Aligned Strategy for Learning Speech Representation [57.891727280493015]
属性選択機構によってこれらの問題に柔軟に対処できる音声表現を導出する属性整合学習戦略を提案する。
具体的には、音声表現を属性依存ノードに分解する層式表現可変オートエンコーダ(LR-VAE)を提案する。
提案手法は,IDのないSER上での競合性能と,無感情SV上でのより良い性能を実現する。
論文 参考訳(メタデータ) (2021-06-05T06:19:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。