論文の概要: Language-independence of DisCoCirc's Text Circuits: English and Urdu
- arxiv url: http://arxiv.org/abs/2208.10281v1
- Date: Thu, 11 Aug 2022 09:32:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-28 22:17:36.546039
- Title: Language-independence of DisCoCirc's Text Circuits: English and Urdu
- Title(参考訳): DisCoCircテキスト回路の言語依存性:英語とウルドゥー語
- Authors: Muhammad Hamza Waseem, Jonathon Liu, Vincent Wang-Ma\'scianica, Bob
Coecke
- Abstract要約: DisCoCircはテキストの文法と意味を表現するためのフレームワークである。
本研究では,DisCoCirc回路を通過すると,英語とウルドゥー語の文法構造の違いがなくなることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DisCoCirc is a newly proposed framework for representing the grammar and
semantics of texts using compositional, generative circuits. While it
constitutes a development of the Categorical Distributional Compositional
(DisCoCat) framework, it exposes radically new features. In particular, [14]
suggested that DisCoCirc goes some way toward eliminating grammatical
differences between languages. In this paper we provide a sketch that this is
indeed the case for restricted fragments of English and Urdu. We first develop
DisCoCirc for a fragment of Urdu, as it was done for English in [14]. There is
a simple translation from English grammar to Urdu grammar, and vice versa. We
then show that differences in grammatical structure between English and Urdu -
primarily relating to the ordering of words and phrases - vanish when passing
to DisCoCirc circuits.
- Abstract(参考訳): DisCoCircは、合成生成回路を用いてテキストの文法と意味を表現するための新しいフレームワークである。
これはカテゴリ分散構成(DisCoCat)フレームワークの開発を構成するが、根本的に新しい機能を公開する。
特に[14]は、DisCoCircが言語間の文法的な違いをなくすための何らかの方法を示している。
本稿では、英語とウルドゥー語の制限された断片について、これが事実であることを示す。
私たちはまず、[14]で英語で行ったように、Urduの断片のためにDisCoCircを開発しました。
英語文法からウルドゥー文法への簡単な翻訳があり、その逆もある。
次に,DCoCirc回路を通過すると,単語や句の順序に関する英語とウルディプリムの文法構造の違いがなくなることを示す。
関連論文リスト
- CoSTA: Code-Switched Speech Translation using Aligned Speech-Text Interleaving [61.73180469072787]
インド語から英語のテキストへのコード変更音声の音声翻訳(ST)の問題に焦点をあてる。
本稿では、事前訓練された自動音声認識(ASR)と機械翻訳(MT)モジュールを足場として、新しいエンドツーエンドモデルアーキテクチャCOSTAを提案する。
COSTAは、多くの競合するカスケードおよびエンドツーエンドのマルチモーダルベースラインを3.5BLEUポイントまで上回っている。
論文 参考訳(メタデータ) (2024-06-16T16:10:51Z) - TransVIP: Speech to Speech Translation System with Voice and Isochrony Preservation [97.54885207518946]
カスケード方式で多様なデータセットを活用する新しいモデルフレームワークTransVIPを提案する。
本稿では、話者の音声特性と、翻訳過程における音源音声からの等時性を維持するために、2つの分離エンコーダを提案する。
フランス語と英語のペアに関する実験により、我々のモデルは、現在最先端の音声音声翻訳モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-28T04:11:37Z) - A Pipeline For Discourse Circuits From CCG [0.0]
DisCoCircは、自然言語のテキストを、テキストのコアセマンティック情報をキャプチャするサーキットとして表現する。
DisCoCircは、短期量子コンピュータで実装可能なNLPモデルを提供することを目標としている。
論文 参考訳(メタデータ) (2023-11-29T18:46:29Z) - Variational Quantum Classifiers for Natural-Language Text [0.8722210937404288]
変分量子テキスト分類器(VQTC)に対する3つの潜在的アプローチについて議論する。
1つ目は、テキストをタスク固有の文重み付けを伴う独立した文のグループとして扱う重み付けされたbag-of-sencesアプローチである。
第2のアプローチは、テキストをコア参照を解決したメンバ文の統合として扱う、コア参照解決アプローチである。
一方,第3のアプローチは,文の順序付けと文の意味の合成における単語の相互作用を考慮したDisCoCircモデルに基づいている。
論文 参考訳(メタデータ) (2023-03-04T18:00:05Z) - Distilling Text into Circuits [0.0]
DisCoCirc というフレームワークがスケッチされ,(1) は構成的かつ分布的(ベクトル的)であること,(2) 一般文に適用すること,(3) 意味間の言語的つながりを捉えること(文法)
ここでは、DisCoCircに相当量の英語の断片があることに気付きます。
論文 参考訳(メタデータ) (2023-01-25T13:56:34Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - CTC Alignments Improve Autoregressive Translation [145.90587287444976]
我々はCTCが共同のCTC/アテンションフレームワークに適用された場合、実際に翻訳に意味があることを論じる。
提案した共同CTC/アテンションモデルは6つのベンチマーク翻訳タスクにおいて純粋アテンションベースラインを上回った。
論文 参考訳(メタデータ) (2022-10-11T07:13:50Z) - A CCG-Based Version of the DisCoCat Framework [1.7219938668142956]
DisCoCatモデルは、意味論のレベルで言語の構成的側面を研究するために使用される。
本稿では,DisCoCat を Combinatory Categorial Grammar (CCG) の項目として再考する。
標準的な分類文法は双閉圏として表現でき、全ての規則は同一性をカレー/アンキュレートするものとして現れる。
次に、単語の意味を符号化するコンパクト閉圏の対称性を利用して、置換誘導規則をモデル化する。
論文 参考訳(メタデータ) (2021-05-17T10:32:18Z) - VLGrammar: Grounded Grammar Induction of Vision and Language [86.88273769411428]
共同学習枠組みにおける視覚と言語の基底文法誘導について検討する。
本稿では,複合確率文脈自由文法(pcfgs)を用いて言語文法と画像文法を同時に誘導する手法であるvlgrammarを提案する。
論文 参考訳(メタデータ) (2021-03-24T04:05:08Z) - Bridging the Modality Gap for Speech-to-Text Translation [57.47099674461832]
エンド・ツー・エンドの音声翻訳は、ある言語における音声を、エンド・ツー・エンドの方法で他の言語におけるテキストに変換することを目的としている。
既存のほとんどの手法では、音響表現と意味情報を同時に学習するために、単一のエンコーダを持つエンコーダ・デコーダ構造を用いる。
本稿では,音声とテキスト間のモダリティギャップを埋めることで,エンドツーエンドのモデル性能を向上させることを目的とした音声翻訳モデルのための音声テキスト適応手法を提案する。
論文 参考訳(メタデータ) (2020-10-28T12:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。