論文の概要: Language-independence of DisCoCirc's Text Circuits: English and Urdu
- arxiv url: http://arxiv.org/abs/2208.10281v1
- Date: Thu, 11 Aug 2022 09:32:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-28 22:17:36.546039
- Title: Language-independence of DisCoCirc's Text Circuits: English and Urdu
- Title(参考訳): DisCoCircテキスト回路の言語依存性:英語とウルドゥー語
- Authors: Muhammad Hamza Waseem, Jonathon Liu, Vincent Wang-Ma\'scianica, Bob
Coecke
- Abstract要約: DisCoCircはテキストの文法と意味を表現するためのフレームワークである。
本研究では,DisCoCirc回路を通過すると,英語とウルドゥー語の文法構造の違いがなくなることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DisCoCirc is a newly proposed framework for representing the grammar and
semantics of texts using compositional, generative circuits. While it
constitutes a development of the Categorical Distributional Compositional
(DisCoCat) framework, it exposes radically new features. In particular, [14]
suggested that DisCoCirc goes some way toward eliminating grammatical
differences between languages. In this paper we provide a sketch that this is
indeed the case for restricted fragments of English and Urdu. We first develop
DisCoCirc for a fragment of Urdu, as it was done for English in [14]. There is
a simple translation from English grammar to Urdu grammar, and vice versa. We
then show that differences in grammatical structure between English and Urdu -
primarily relating to the ordering of words and phrases - vanish when passing
to DisCoCirc circuits.
- Abstract(参考訳): DisCoCircは、合成生成回路を用いてテキストの文法と意味を表現するための新しいフレームワークである。
これはカテゴリ分散構成(DisCoCat)フレームワークの開発を構成するが、根本的に新しい機能を公開する。
特に[14]は、DisCoCircが言語間の文法的な違いをなくすための何らかの方法を示している。
本稿では、英語とウルドゥー語の制限された断片について、これが事実であることを示す。
私たちはまず、[14]で英語で行ったように、Urduの断片のためにDisCoCircを開発しました。
英語文法からウルドゥー文法への簡単な翻訳があり、その逆もある。
次に,DCoCirc回路を通過すると,単語や句の順序に関する英語とウルディプリムの文法構造の違いがなくなることを示す。
関連論文リスト
- End to end Hindi to English speech conversion using Bark, mBART and a
finetuned XLSR Wav2Vec2 [0.0]
本稿では,ヒンディー語から英語への翻訳に適したエンドツーエンド音声変換フレームワークを提案する。
自動音声認識(ASR)のためのXLSR Wav2Vec2、ニューラルネットワーク翻訳(NMT)のためのmBART、テキスト音声合成(TTS)コンポーネントといった最先端技術を統合することで、このフレームワークは言語間通信に対する統一的でシームレスなアプローチを提供する。
論文 参考訳(メタデータ) (2024-01-11T04:26:21Z) - A Pipeline For Discourse Circuits From CCG [0.0]
DisCoCircは、自然言語のテキストを、テキストのコアセマンティック情報をキャプチャするサーキットとして表現する。
DisCoCircは、短期量子コンピュータで実装可能なNLPモデルを提供することを目標としている。
論文 参考訳(メタデータ) (2023-11-29T18:46:29Z) - Adversarial Training For Low-Resource Disfluency Correction [50.51901599433536]
ディフルエンシ補正(DC)のための逆学習型シーケンスタグ付けモデルを提案する。
提案手法の利点は,3つのインド語でDCに対して評価することで,合成された非流動データに大きく依存することを示す。
また,本手法は,音声障害によって導入されたASR文字の破面的不一致の除去にも有効である。
論文 参考訳(メタデータ) (2023-06-10T08:58:53Z) - Variational Quantum Classifiers for Natural-Language Text [0.8722210937404288]
変分量子テキスト分類器(VQTC)に対する3つの潜在的アプローチについて議論する。
1つ目は、テキストをタスク固有の文重み付けを伴う独立した文のグループとして扱う重み付けされたbag-of-sencesアプローチである。
第2のアプローチは、テキストをコア参照を解決したメンバ文の統合として扱う、コア参照解決アプローチである。
一方,第3のアプローチは,文の順序付けと文の意味の合成における単語の相互作用を考慮したDisCoCircモデルに基づいている。
論文 参考訳(メタデータ) (2023-03-04T18:00:05Z) - Distilling Text into Circuits [0.0]
DisCoCirc というフレームワークがスケッチされ,(1) は構成的かつ分布的(ベクトル的)であること,(2) 一般文に適用すること,(3) 意味間の言語的つながりを捉えること(文法)
ここでは、DisCoCircに相当量の英語の断片があることに気付きます。
論文 参考訳(メタデータ) (2023-01-25T13:56:34Z) - CLSE: Corpus of Linguistically Significant Entities [58.29901964387952]
専門家が注釈を付けた言語学的に重要なエンティティ(CLSE)のコーパスをリリースする。
CLSEは74種類のセマンティックタイプをカバーし、航空券売機からビデオゲームまで様々なアプリケーションをサポートする。
言語的に代表されるNLG評価ベンチマークを,フランス語,マラティー語,ロシア語の3言語で作成する。
論文 参考訳(メタデータ) (2022-11-04T12:56:12Z) - CTC Alignments Improve Autoregressive Translation [145.90587287444976]
我々はCTCが共同のCTC/アテンションフレームワークに適用された場合、実際に翻訳に意味があることを論じる。
提案した共同CTC/アテンションモデルは6つのベンチマーク翻訳タスクにおいて純粋アテンションベースラインを上回った。
論文 参考訳(メタデータ) (2022-10-11T07:13:50Z) - Transcribing Natural Languages for The Deaf via Neural Editing Programs [84.0592111546958]
本研究の目的は,難聴者コミュニティのための自然言語文の書き起こしを目的とし,手話の発声を指示するグロス化の課題について検討することである。
以前のシーケンス・ツー・シーケンス言語モデルは、しばしば2つの異なる言語間の豊かな関係を捉えず、不満足な書き起こしにつながる。
異なる文法に拘わらず,単語の大部分を文と共有しながら,難聴コミュニケーションの容易な文を効果的に単純化することが観察された。
論文 参考訳(メタデータ) (2021-12-17T16:21:49Z) - A CCG-Based Version of the DisCoCat Framework [1.7219938668142956]
DisCoCatモデルは、意味論のレベルで言語の構成的側面を研究するために使用される。
本稿では,DisCoCat を Combinatory Categorial Grammar (CCG) の項目として再考する。
標準的な分類文法は双閉圏として表現でき、全ての規則は同一性をカレー/アンキュレートするものとして現れる。
次に、単語の意味を符号化するコンパクト閉圏の対称性を利用して、置換誘導規則をモデル化する。
論文 参考訳(メタデータ) (2021-05-17T10:32:18Z) - VLGrammar: Grounded Grammar Induction of Vision and Language [86.88273769411428]
共同学習枠組みにおける視覚と言語の基底文法誘導について検討する。
本稿では,複合確率文脈自由文法(pcfgs)を用いて言語文法と画像文法を同時に誘導する手法であるvlgrammarを提案する。
論文 参考訳(メタデータ) (2021-03-24T04:05:08Z) - Bridging the Modality Gap for Speech-to-Text Translation [57.47099674461832]
エンド・ツー・エンドの音声翻訳は、ある言語における音声を、エンド・ツー・エンドの方法で他の言語におけるテキストに変換することを目的としている。
既存のほとんどの手法では、音響表現と意味情報を同時に学習するために、単一のエンコーダを持つエンコーダ・デコーダ構造を用いる。
本稿では,音声とテキスト間のモダリティギャップを埋めることで,エンドツーエンドのモデル性能を向上させることを目的とした音声翻訳モデルのための音声テキスト適応手法を提案する。
論文 参考訳(メタデータ) (2020-10-28T12:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。