論文の概要: Evaluating DisCoCirc in Translation Tasks & its Limitations: A Comparative Study Between Bengali & English
- arxiv url: http://arxiv.org/abs/2511.08601v1
- Date: Sun, 02 Nov 2025 01:45:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-16 06:38:31.07062
- Title: Evaluating DisCoCirc in Translation Tasks & its Limitations: A Comparative Study Between Bengali & English
- Title(参考訳): 翻訳課題におけるDisCoCircの評価と限界:ベンガル語と英語の比較研究
- Authors: Nazmoon Falgunee Moon,
- Abstract要約: DisCoCircは、回路ライクな表現を含む生産規則から派生した文法ベースのフレームワークである。
ベンガル語に類似したフレームワークを開発し、英語とベンガル語間の翻訳作業に適用する。
これらの欠点に対処する可能性のある方法について議論し、実際には、DisCoCircは比較的単純な文でも苦戦していることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In [4], the authors present the DisCoCirc (Distributed Compositional Circuits) formalism for the English language, a grammar-based framework derived from the production rules that incorporates circuit-like representations in order to give a precise categorical theoretical structure to the language. In this paper, we extend this approach to develop a similar framework for Bengali and apply it to translation tasks between English and Bengali. A central focus of our work lies in reassessing the effectiveness of DisCoCirc in reducing language bureaucracy. Unlike the result suggested in [5], our findings indicate that although it works well for a large part of the language, it still faces limitations due to the structural variation of the two languages. We discuss the possible methods that might handle these shortcomings and show that, in practice, DisCoCirc still struggles even with relatively simple sentences. This divergence from prior claims not only highlights the framework's constraints in translation but also suggest scope for future improvement. Apart from our primary focus on English-Bengali translation, we also take a short detour to examine English conjunctions, following [1], showing a connection between conjunctions and Boolean logic.
- Abstract(参考訳): 著者らは、[4]において、英語のDisCoCirc(Distributed Compositional Circuits)形式を提示する。これは、言語に正確な分類論的構造を与えるために、回路のような表現を含む生産規則から派生した文法ベースのフレームワークである。
本稿では,ベンガル語に類似したフレームワークを開発するためにこのアプローチを拡張し,英語とベンガル語間の翻訳作業に適用する。
我々の研究の中心は、言語官僚主義の削減におけるDisCoCircの有効性を再評価することにある。
5] で示唆された結果とは違って, 言語の大部分でうまく機能するが, 2つの言語の構造的変化により, 制限に直面していることが示唆された。
これらの欠点に対処する可能性のある方法について議論し、実際には、DisCoCircは比較的単純な文でも苦戦していることを示す。
以前の主張とこの相違は、フレームワークの翻訳における制約を強調しているだけでなく、将来の改善のスコープも示唆している。
英語・ベンガル語翻訳に主眼を置きながら, [1] に従えば, 接続とブール論理の関連性を示す。
関連論文リスト
- BNLI: A Linguistically-Refined Bengali Dataset for Natural Language Inference [1.7688536690159165]
既存のベンガルのNLIデータセットには、アノテーションエラー、曖昧な文対、言語多様性の欠如など、いくつかの矛盾がある。
頑健な言語理解と推論モデリングをサポートするために設計されたベンガルNLIデータセットであるBNLIを紹介する。
我々は、多言語およびベンガル固有のモデルを含む最先端のトランスフォーマーベースのアーキテクチャを用いてBNLIをベンチマークし、複雑な意味関係を捉える能力を評価した。
論文 参考訳(メタデータ) (2025-11-11T22:29:14Z) - On the Entity-Level Alignment in Crosslingual Consistency [62.33186691736433]
SubSubとSubInjは、主題の英語翻訳を言語間のプロンプトに統合し、実際のリコール精度と一貫性を大きく向上させた。
これらの介入はモデルの内部ピボット言語処理を通じて概念空間における実体表現のアライメントを強化する。
論文 参考訳(メタデータ) (2025-10-11T16:26:50Z) - Think Natively: Unlocking Multilingual Reasoning with Consistency-Enhanced Reinforcement Learning [85.7304930030649]
本稿では,言語一貫性報酬と言語間思考アライメント報酬によって訓練されたM-Thinkerを提案する。
M-Thinkerは2つのマルチ言語ベンチマークで100%近い言語一貫性と優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-10-08T17:55:02Z) - The Problem of Alignment [1.2277343096128712]
大規模言語モデルは、大きなコーパスから統計的パターンとして学習されたシーケンスを生成する。
最初のトレーニングモデルが人間の価値観と一致しなくてはならない場合、他のモデルよりも一定の継続が望ましい。
ユーザとモデル間の双方向インタラクションとして,この構造化の実践について検討する。
論文 参考訳(メタデータ) (2023-12-30T11:44:59Z) - Improving Chinese Spelling Check by Character Pronunciation Prediction:
The Effects of Adaptivity and Granularity [76.20568599642799]
中国語のスペルチェック(英語: Chinese spelling check, CSC)は、中国語のテキスト中のスペルエラーを検出し修正する基本的なNLPタスクである。
本稿では,CSCを改善するために中国語発音予測(CPP)の補助的タスクを導入することを検討する。
本稿では,共有エンコーダの2つの並列デコーダ上に構築したSCOPEを提案する。
論文 参考訳(メタデータ) (2022-10-20T03:42:35Z) - CTC Alignments Improve Autoregressive Translation [145.90587287444976]
我々はCTCが共同のCTC/アテンションフレームワークに適用された場合、実際に翻訳に意味があることを論じる。
提案した共同CTC/アテンションモデルは6つのベンチマーク翻訳タスクにおいて純粋アテンションベースラインを上回った。
論文 参考訳(メタデータ) (2022-10-11T07:13:50Z) - Cross-Align: Modeling Deep Cross-lingual Interactions for Word Alignment [63.0407314271459]
提案したCross-Alignは、5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成する。
実験の結果,提案したCross-Alignは5つの言語ペアのうち4つで最先端(SOTA)のパフォーマンスを達成することがわかった。
論文 参考訳(メタデータ) (2022-10-09T02:24:35Z) - Language-independence of DisCoCirc's Text Circuits: English and Urdu [0.0]
DisCoCircはテキストの文法と意味を表現するためのフレームワークである。
本研究では,DisCoCirc回路を通過すると,英語とウルドゥー語の文法構造の違いがなくなることを示す。
論文 参考訳(メタデータ) (2022-08-11T09:32:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。