論文の概要: Introducing the Talk Markup Language (TalkML):Adding a little social
intelligence to industrial speech interfaces
- arxiv url: http://arxiv.org/abs/2105.11294v1
- Date: Mon, 24 May 2021 14:25:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 19:27:51.495292
- Title: Introducing the Talk Markup Language (TalkML):Adding a little social
intelligence to industrial speech interfaces
- Title(参考訳): Talk Markup Language(TalkML)の紹介:産業音声インタフェースへのソーシャルインテリジェンスの導入
- Authors: Peter Wallis
- Abstract要約: 自然言語の理解は、AI研究の最も残念な失敗の1つだ。
本稿では、他の分野からアイデアを取り入れて実装した方法について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Virtual Personal Assistants like Siri have great potential but such
developments hit the fundamental problem of how to make computational devices
that understand human speech. Natural language understanding is one of the more
disappointing failures of AI research and it seems there is something we
computer scientists don't get about the nature of language. Of course
philosophers and linguists think quite differently about language and this
paper describes how we have taken ideas from other disciplines and implemented
them. The background to the work is to take seriously the notion of language as
action and look at what people actually do with language using the techniques
of Conversation Analysis. The observation has been that human communication is
(behind the scenes) about the management of social relations as well as the
(foregrounded) passing of information. To claim this is one thing but to
implement it requires a mechanism. The mechanism described here is based on the
notion of language being intentional - we think intentionally, talk about them
and recognise them in others - and cooperative in that we are compelled to help
out. The way we are compelled points to a solution to the ever present problem
of keeping the human on topic. The approach has led to a recent success in
which we significantly improve user satisfaction independent of task
completion. Talk Markup Language (TalkML) is a draft alternative to VoiceXML
that, we propose, greatly simplifies the scripting of interaction by providing
default behaviours for no input and not recognised speech events.
- Abstract(参考訳): Siriのようなバーチャルパーソナルアシスタントは大きな可能性を秘めているが、このような開発は人間の音声を理解するための計算装置の作り方に関する根本的な問題となっている。
自然言語理解は、ai研究のより残念な失敗の1つであり、コンピュータ科学者が言語の性質について理解できないものがあります。
もちろん哲学者や言語学者は言語について全く異なる考え方をしており、この論文は我々が他の分野からアイデアを取り入れ、それを実践した方法について説明している。
この仕事の背景は、言語を行動として真剣に捉え、会話分析のテクニックを使って、人々が実際に言語で何をしているかを見ることである。
観察によると、人間同士のコミュニケーションは、情報伝達だけでなく、社会関係の管理に関するものである(場面に関係している)。
これは1つ主張するが、実装するにはメカニズムが必要である。
ここで説明するメカニズムは、意図的な言語の概念 - 意図的に考え、話し、他人に認識する - に基づいており、協力して助けを求められている。
私たちが強いられる方法は、人間を話題にし続けるという、現在ある問題の解決策を指し示します。
このアプローチは,タスク完了とは無関係にユーザ満足度を大幅に向上させることに成功した。
Talk Markup Language(TalkML)はVoiceXMLに代わる草案であり、入力がなく、認識されていない音声イベントに対してデフォルト動作を提供することにより、対話のスクリプティングを大幅に単純化する。
関連論文リスト
- Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - SIFToM: Robust Spoken Instruction Following through Theory of Mind [51.326266354164716]
本稿では,認知にインスパイアされた音声指導モデルであるSIFToMを提案し,多様な音声条件下でロボットが人間の指示を実践的に追従できるようにする。
結果から,SIFToMモデルは現状の音声モデルや言語モデルよりも優れており,課題に追従する音声命令に対する人間レベルの精度に近づいていることがわかった。
論文 参考訳(メタデータ) (2024-09-17T02:36:10Z) - Revisiting the DARPA Communicator Data using Conversation Analysis [0.0]
本稿では, コンピュータシステムにおける「改善の機会」を, 「誓い言葉」の形で乱用を探すことによって識別するアプローチについて述べる。
その前提は、人間がコンピュータに対して制裁として誓うことであり、したがって、言葉を誓うことは、システムが本来あるべきように振る舞わない点を表す。
より大きなテキストコーパスに依存しない計算言語学には代替的な未来があることを実証したい。
論文 参考訳(メタデータ) (2023-07-13T15:33:01Z) - Computational Language Acquisition with Theory of Mind [84.2267302901888]
我々は、心の理論(ToM)を備えた言語学習エージェントを構築し、その学習過程への影響を測定する。
重み付けされたToMリスナーコンポーネントを用いた学習話者は,画像参照ゲームの設定において,性能向上につながることがわかった。
論文 参考訳(メタデータ) (2023-03-02T18:59:46Z) - Whither the Priors for (Vocal) Interactivity? [6.709659274527638]
音声に基づくコミュニケーションは、人間とロボットが対話する最も自然な方法の1つとしてしばしば引用される。
それにもかかわらず、結果として生じる相互作用は自然に他ならない」。
このようなコミュニケーションの失敗は、より深い誤認の兆候である、とここでは主張されている。
論文 参考訳(メタデータ) (2022-03-16T12:06:46Z) - Learning Language-Conditioned Robot Behavior from Offline Data and
Crowd-Sourced Annotation [80.29069988090912]
本研究では,ロボットインタラクションの大規模なオフラインデータセットから視覚に基づく操作タスクを学習する問題について検討する。
クラウドソースの自然言語ラベルを用いたオフラインロボットデータセットの活用を提案する。
提案手法は目標画像仕様と言語条件付き模倣技術の両方を25%以上上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-02T17:42:13Z) - Few-shot Language Coordination by Modeling Theory of Mind [95.54446989205117]
我々は、数ショット$textit language coordinate$のタスクについて研究する。
リードエージェントは、言語能力の異なるエージェントの$textitpopulation$と調整する必要があります。
これは、人間のコミュニケーションの重要な構成要素であるパートナーの信念をモデル化する能力を必要とする。
論文 参考訳(メタデータ) (2021-07-12T19:26:11Z) - SocialAI 0.1: Towards a Benchmark to Stimulate Research on
Socio-Cognitive Abilities in Deep Reinforcement Learning Agents [23.719833581321033]
人間との社会的相互作用に参加できる体型自律エージェントを構築することは、AIの主要な課題の1つです。
現在のアプローチは、非常に単純で非多様な社会状況におけるコミュニケーションツールとして言語に焦点を当てています。
人間レベルのAIを目指すためには、より広範な社会的スキルが必要であると私たちは主張します。
論文 参考訳(メタデータ) (2021-04-27T14:16:29Z) - Self-play for Data Efficient Language Acquisition [20.86261546611472]
学習エージェントにおける言語習得の効率と品質を向上させるために,コミュニケーションの対称性を利用する。
直接監督の代わりにセルフプレイを使用することで、エージェントが役割間で知識を伝達できることが示される。
論文 参考訳(メタデータ) (2020-10-10T02:09:19Z) - Speaker Independent and Multilingual/Mixlingual Speech-Driven Talking
Head Generation Using Phonetic Posteriorgrams [58.617181880383605]
そこで本研究では,音声後部グラフを用いた新しい手法を提案する。
我々の手法は手作りの特徴を必要とせず、近年の手法に比べてノイズに強い。
本モデルは,複数言語/混合言語音声を説得力のある入力としてサポートした最初のモデルである。
論文 参考訳(メタデータ) (2020-06-20T16:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。