論文の概要: Defining maximum acceptable latency of AI-enhanced CAI tools
- arxiv url: http://arxiv.org/abs/2201.02792v1
- Date: Sat, 8 Jan 2022 08:52:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-12 07:42:00.837910
- Title: Defining maximum acceptable latency of AI-enhanced CAI tools
- Title(参考訳): AI強化CAIツールの最大許容レイテンシの定義
- Authors: Claudio Fantinuoli, Maddalena Montecchio
- Abstract要約: 本稿では,同時モダリティに携わるインタプリタに対して,認知的に許容できる最大システムの遅延を調査するための実験結果について述べる。
その結果、インタプリタは元のテキストの変換に大きな影響を与えることなく、システム遅延を3秒で処理できることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent years have seen an increasing number of studies around the design of
computer-assisted interpreting tools with integrated automatic speech
processing and their use by trainees and professional interpreters. This paper
discusses the role of system latency of such tools and presents the results of
an experiment designed to investigate the maximum system latency that is
cognitively acceptable for interpreters working in the simultaneous modality.
The results show that interpreters can cope with a system latency of 3 seconds
without any major impact in the rendition of the original text, both in terms
of accuracy and fluency. This value is above the typical latency of available
AI-based CAI tools and paves the way to experiment with larger context-based
language models and higher latencies.
- Abstract(参考訳): 近年,統合された自動音声処理によるコンピュータ支援解釈ツールの設計や,研修生やプロの通訳による利用に関する研究が増えている。
本稿では,このようなツールのシステム遅延の役割について論じ,同時に作業するインタプリタに対して認知的に許容される最大システムの遅延を調査するための実験結果を示す。
その結果、インタプリタは、精度とフラレンシーの両面で、元のテキストのランディングに大きな影響を与えずに、システムのレイテンシーを3秒で処理できることがわかった。
この値は、利用可能なAIベースのCAIツールの典型的なレイテンシよりも高く、より大きなコンテキストベースの言語モデルとより高いレイテンシで実験する方法を舗装している。
関連論文リスト
- Comparative Analysis of Audio Feature Extraction for Real-Time Talking Portrait Synthesis [3.210706100833053]
我々は、従来のAFEモデルをOpen AIのWhisperに置き換える、完全に統合されたシステムを提案し、実装する。
我々はWhisperが処理を高速化するだけでなく、レンダリング品質の特定の側面を改善し、より現実的で応答性の高い対話型対話を実現することを示した。
論文 参考訳(メタデータ) (2024-11-20T11:18:05Z) - Asynchronous Tool Usage for Real-Time Agents [61.3041983544042]
並列処理とリアルタイムツール利用が可能な非同期AIエージェントを導入する。
私たちの重要な貢献は、エージェントの実行とプロンプトのためのイベント駆動有限状態マシンアーキテクチャです。
この研究は、流体とマルチタスクの相互作用が可能なAIエージェントを作成するための概念的なフレームワークと実践的なツールの両方を提示している。
論文 参考訳(メタデータ) (2024-10-28T23:57:19Z) - LVLM-Interpret: An Interpretability Tool for Large Vision-Language Models [50.259006481656094]
本稿では,大規模視覚言語モデルの内部メカニズムの理解を目的とした対話型アプリケーションを提案する。
このインタフェースは, 画像パッチの解釈可能性を高めるために設計されており, 応答の生成に有効である。
本稿では,一般的な大規模マルチモーダルモデルであるLLaVAにおける障害機構の理解に,アプリケーションがどのように役立つかのケーススタディを示す。
論文 参考訳(メタデータ) (2024-04-03T23:57:34Z) - On-the-Fly Syntax Highlighting: Generalisation and Speed-ups [2.208443815105053]
オンザフライ構文強調は、視覚二次表記値を言語派生のそれぞれの文字と素早く関連付けるタスクである。
スピード制約はツールのユーザビリティを保証するために不可欠であり、オンラインソースコードにアクセスするエンドユーザの応答性を示す。
コードの理解力を高めるためには、正確なハイライトを達成することが重要です。
このようなリゾルバの開発コストに対処することは、多くのプログラミング言語のバージョンを考えると必須である。
論文 参考訳(メタデータ) (2024-02-13T19:43:22Z) - DIALIGHT: Lightweight Multilingual Development and Evaluation of
Task-Oriented Dialogue Systems with Large Language Models [76.79929883963275]
DIALIGHTは多言語タスク指向対話(ToD)システムの開発と評価のためのツールキットである。
ローカル発話レベルとグローバル対話レベルの両方において、人間のきめ細かい評価のためのセキュアでユーザフレンドリーなWebインターフェースを備えている。
評価の結果, PLMの微調整により精度とコヒーレンスが向上する一方, LLMベースのシステムは多様で類似した応答を生成するのに優れていた。
論文 参考訳(メタデータ) (2024-01-04T11:27:48Z) - Accelerating LLaMA Inference by Enabling Intermediate Layer Decoding via
Instruction Tuning with LITE [62.13435256279566]
大規模言語モデル(LLM)は、様々な自然言語タスクで顕著なパフォーマンスを実現している。
しかし、その大きなサイズは推論を遅く、計算的に高価にする。
最終層の生成能力に影響を与えることなく、これらの層が「良い」生成能力を得ることができることを示す。
論文 参考訳(メタデータ) (2023-10-28T04:07:58Z) - MAPLE-X: Latency Prediction with Explicit Microprocessor Prior Knowledge [87.41163540910854]
ディープニューラルネットワーク(DNN)レイテンシのキャラクタリゼーションは、時間を要するプロセスである。
ハードウェアデバイスの事前知識とDNNアーキテクチャのレイテンシを具体化し,MAPLEを拡張したMAPLE-Xを提案する。
論文 参考訳(メタデータ) (2022-05-25T11:08:20Z) - KUDO Interpreter Assist: Automated Real-time Support for Remote
Interpretation [1.0257312460783732]
Interpreter Assistは、リモート同時解釈(RSI)シナリオの統合に特化したコンピュータ支援型解釈ツールである。
自動用語作成ツールとリアルタイム提案システムという,2つの主要な機能セットで構成されている。
論文 参考訳(メタデータ) (2022-01-05T19:38:06Z) - Towards the evaluation of simultaneous speech translation from a
communicative perspective [0.0]
本稿では,同時音声翻訳エンジンの品質評価を目的とした実験結果について述べる。
機械が情報性の観点からやや良く機能する一方で、人間の通訳者にとって、知性の観点からはより良いパフォーマンスを見出した。
論文 参考訳(メタデータ) (2021-03-15T13:09:00Z) - Evaluating Multilingual Text Encoders for Unsupervised Cross-Lingual
Retrieval [51.60862829942932]
本稿では,言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性に着目した体系的実証研究を行う。
文レベルのCLIRでは、最先端のパフォーマンスが達成できることを実証する。
しかし、ピーク性能は、汎用の多言語テキストエンコーダをオフ・ザ・シェルフで使うのではなく、文の理解タスクにさらに特化したバリエーションに依存している。
論文 参考訳(メタデータ) (2021-01-21T00:15:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。