論文の概要: Developing automatic verbatim transcripts for international multilingual
meetings: an end-to-end solution
- arxiv url: http://arxiv.org/abs/2309.15609v1
- Date: Wed, 27 Sep 2023 12:16:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-28 13:42:43.444280
- Title: Developing automatic verbatim transcripts for international multilingual
meetings: an end-to-end solution
- Title(参考訳): 国際多言語会議用自動言語書き起こしの開発 : エンドツーエンド解法
- Authors: Akshat Dewan, Michal Ziemski, Henri Meylan, Lorenzo Concina, Bruno
Pouliquen
- Abstract要約: 本稿では,全自動会議書記書作成のためのエンドツーエンドソリューションと,各種言語への機械翻訳について述べる。
このツールは、社内で開発された音声テキスト(S2T)と機械翻訳(MT)コンポーネントを使用して、World Intellectual Property Organization (WIPO)で開発された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an end-to-end solution for the creation of fully
automated conference meeting transcripts and their machine translations into
various languages. This tool has been developed at the World Intellectual
Property Organization (WIPO) using in-house developed speech-to-text (S2T) and
machine translation (MT) components. Beyond describing data collection and
fine-tuning, resulting in a highly customized and robust system, this paper
describes the architecture and evolution of the technical components as well as
highlights the business impact and benefits from the user side. We also point
out particular challenges in the evolution and adoption of the system and how
the new approach created a new product and replaced existing established
workflows in conference management documentation.
- Abstract(参考訳): 本稿では,全自動会議書記書作成のためのエンドツーエンドソリューションと,各種言語への機械翻訳について述べる。
このツールは、社内で開発された音声テキスト(S2T)と機械翻訳(MT)コンポーネントを使用して、World Intellectual Property Organization (WIPO)で開発された。
高度にカスタマイズされたロバストなシステムを実現するデータ収集と微調整を説明するだけでなく、技術コンポーネントのアーキテクチャと進化を説明した上で、ユーザ側からのビジネスへの影響とメリットを強調する。
また,システムの進化と採用における課題や,新たなアプローチが新たなプロダクトを生み出し,既存のワークフローをカンファレンス管理資料に置き換えた方法についても指摘した。
関連論文リスト
- Automating IETF Insights generation with AI [0.0]
IETF Insightsプロジェクトは、Internet Engineering Task Force (IETF) Working Groupsの活動に関する包括的なレポートの作成を合理化している。
このシステムは、ミーティング分、参加者リスト、ドラフト、アジェンダを含む様々なIETFソースからのデータを収集、統合、分析する。
論文 参考訳(メタデータ) (2024-10-17T07:59:05Z) - A Library for Automatic Natural Language Generation of Spanish Texts [6.102700502396687]
本稿では,スペイン語文の自然言語生成システム(NLG)について,意味のある単語の最小セットから提案する。
システムは、ユーザが提示した主語セットから完全で一貫性があり、正しく綴られた文を生成することができる。
設計によって他の言語に容易に適応でき、広範囲のデジタルデバイスに統合することができる。
論文 参考訳(メタデータ) (2024-05-27T15:44:06Z) - IMTLab: An Open-Source Platform for Building, Evaluating, and Diagnosing
Interactive Machine Translation Systems [94.39110258587887]
IMTLabは、オープンソースのエンドツーエンド対話型機械翻訳(IMT)システムプラットフォームである。
IMTLabは、対話的な翻訳プロセス全体を、ヒューマン・イン・ザ・ループ設定によるタスク指向の対話として扱う。
論文 参考訳(メタデータ) (2023-10-17T11:29:04Z) - Democratizing Neural Machine Translation with OPUS-MT [56.21988248821684]
本稿では,オープン機械翻訳モデルとツールの開発に焦点をあて,OPUSエコシステムについて述べる。
我々は現在進行中の言語カバレッジと翻訳品質向上のミッションについて論じるとともに,モジュール型翻訳モデルの開発に向けた取り組みについても述べる。
論文 参考訳(メタデータ) (2022-12-04T22:16:27Z) - The Whole Truth and Nothing But the Truth: Faithful and Controllable
Dialogue Response Generation with Dataflow Transduction and Constrained
Decoding [65.34601470417967]
本稿では,ニューラルネットワークモデリングとルールベース生成の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。
本実験により, 本システムは, 流布性, 妥当性, 真理性の評価において, ルールベースおよび学習的アプローチの両方に優れることがわかった。
論文 参考訳(メタデータ) (2022-09-16T09:00:49Z) - The YiTrans End-to-End Speech Translation System for IWSLT 2022 Offline
Shared Task [92.5087402621697]
本稿では,IWSLT 2022オフラインタスクに対するエンドツーエンドYiTrans音声翻訳システムの提案について述べる。
YiTransシステムは、大規模な訓練済みエンコーダデコーダモデル上に構築されている。
最終提出は自動評価基準でまず英語・ドイツ語・英語・中国語のエンド・ツー・エンド・システムにランク付けする。
論文 参考訳(メタデータ) (2022-06-12T16:13:01Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - FST: the FAIR Speech Translation System for the IWSLT21 Multilingual
Shared Task [36.51221186190272]
IWSLT 2021評価キャンペーンに提出したエンドツーエンドの多言語音声翻訳システムについて述べる。
本システムは,モダリティ,タスク,言語間の伝達学習を活用して構築する。
論文 参考訳(メタデータ) (2021-07-14T19:43:44Z) - A Data-Centric Framework for Composable NLP Workflows [109.51144493023533]
アプリケーションドメインにおける経験的自然言語処理システム(例えば、ヘルスケア、ファイナンス、教育)は、複数のコンポーネント間の相互運用を伴う。
我々は,このような高度なNLPの高速な開発を支援するために,統一的なオープンソースフレームワークを構築した。
論文 参考訳(メタデータ) (2021-03-02T16:19:44Z) - Designing the Business Conversation Corpus [20.491255702901288]
我々は,新たに構築された日英ビジネス会話並列コーパスを導入することで,会話テキストの機械翻訳品質を向上させることを目的とする。
コーパスの詳細な解析と自動翻訳の難題について述べる。
また、機械翻訳訓練シナリオにコーパスを追加して、結果のシステムの利用によるメリットを示す実験を行った。
論文 参考訳(メタデータ) (2020-08-05T05:19:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。