論文の概要: Unbalanced Optimal Transport for Unbalanced Word Alignment
- arxiv url: http://arxiv.org/abs/2306.04116v1
- Date: Wed, 7 Jun 2023 03:03:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-08 16:28:37.155128
- Title: Unbalanced Optimal Transport for Unbalanced Word Alignment
- Title(参考訳): 不均衡単語アライメントのための不均衡最適輸送
- Authors: Yuki Arase, Han Bao, Sho Yokoi
- Abstract要約: 本研究は, 最適輸送(OT)ファミリー, すなわち, バランス, 部分, バランスの取れないOTは, テーラーメイド技術がなくても, 自然かつ強力なアプローチであることを示す。
教師なしおよび教師なしの設定に関する実験は,単語アライメントに特化して設計された最先端技術に対して,汎用的なOTベースのアライメント手法が競合していることを示す。
- 参考スコア(独自算出の注目度): 17.08341136230076
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monolingual word alignment is crucial to model semantic interactions between
sentences. In particular, null alignment, a phenomenon in which words have no
corresponding counterparts, is pervasive and critical in handling semantically
divergent sentences. Identification of null alignment is useful on its own to
reason about the semantic similarity of sentences by indicating there exists
information inequality. To achieve unbalanced word alignment that values both
alignment and null alignment, this study shows that the family of optimal
transport (OT), i.e., balanced, partial, and unbalanced OT, are natural and
powerful approaches even without tailor-made techniques. Our extensive
experiments covering unsupervised and supervised settings indicate that our
generic OT-based alignment methods are competitive against the
state-of-the-arts specially designed for word alignment, remarkably on
challenging datasets with high null alignment frequencies.
- Abstract(参考訳): 単言語の単語アライメントは文間の意味的相互作用のモデル化に不可欠である。
特に、単語が対応する文を持たない現象であるヌルアライメントは、意味的に発散する文を扱う上で広く、かつ批判的である。
ヌルアライメントの同定は、情報不等式が存在することを示すことによって、文の意味的類似性を理解するのに有用である。
本研究は,アライメントとヌルアライメントの両方を評価する非バランスな単語アライメントを実現するために,最適なトランスポート (ot) の族,すなわちバランス付き,部分的,非バランスなotは,テーラーメイドの技術がなくても自然かつ強力なアプローチであることを示す。
教師なしおよび教師なしの設定に関する広範な実験は、我々の一般的なOTベースのアライメント手法が、単語アライメントのために特別に設計された最先端技術と競合していることを示している。
関連論文リスト
- How Transliterations Improve Crosslingual Alignment [48.929677368744606]
近年の研究では、アライメント目的を用いた多言語事前学習言語モデル(mPLM)が言語横断アライメントを改善することが示されている。
本稿では, 言語間のアライメントを明示的に評価し, 翻訳に基づくアプローチにおける重要な要素を同定し, 性能向上に寄与する。
論文 参考訳(メタデータ) (2024-09-25T20:05:45Z) - RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Third-Party Aligner for Neural Word Alignments [18.745852103348845]
本稿では,ニューラルネットワークによる単語アライメントトレーニングの監督のために,サードパーティ製単語アライメント器によって生成された単語アライメントを提案する。
実験により、我々のアプローチは第三者の監督に対して驚くほど自己補正が可能であることが示された。
我々は最先端の単語アライメント性能を達成し、最高のサードパーティアライメントよりも平均2ポイント以上低いアライメント誤り率を持つ。
論文 参考訳(メタデータ) (2022-11-08T12:30:08Z) - Non-Monotonic Latent Alignments for CTC-Based Non-Autoregressive Machine
Translation [15.309573393914462]
非自己回帰翻訳(NAT)モデルは一般的にクロスエントロピー損失で訓練される。
ラテントアライメントモデルは、CTC損失とともに全ての単調ラテントアライメントを疎外することにより、明示的なアライメントを緩和する。
我々はアライメント空間を非単調アライメントに拡張し、大域的な単語の並べ替えを可能にする。
論文 参考訳(メタデータ) (2022-10-08T07:44:28Z) - Keywords and Instances: A Hierarchical Contrastive Learning Framework
Unifying Hybrid Granularities for Text Generation [59.01297461453444]
入力テキスト中のハイブリッドな粒度意味を統一する階層的コントラスト学習機構を提案する。
実験により,本モデルがパラフレージング,対話生成,ストーリーテリングタスクにおいて,競争ベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2022-05-26T13:26:03Z) - Accurate Online Posterior Alignments for Principled
Lexically-Constrained Decoding [40.212186465135304]
本稿では,その実行において真にオンラインであり,アライメントエラー率の点で優れている新しいアライメント手法を提案する。
2つの遠い言語ペアを含む5つの言語ペアにおいて、一貫したアライメントエラー率の低下を達成する。
語彙的に制約された7つの翻訳タスクにデプロイすると、BLEUの特に制約された位置に関する大幅な改善が達成される。
論文 参考訳(メタデータ) (2022-04-02T14:37:07Z) - Automatically Identifying Semantic Bias in Crowdsourced Natural Language
Inference Datasets [78.6856732729301]
NLIデータセットに仮説を組み込んだ学習空間に"バイアスクラスタ"を見つけるために,モデル駆動で教師なしの手法を導入する。
データセットの仮説分布のセマンティックバイアスを改善するために、介入と追加のラベリングを行うことができる。
論文 参考訳(メタデータ) (2021-12-16T22:49:01Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Leveraging Neural Machine Translation for Word Alignment [0.0]
機械翻訳(MT)システムは、訓練された注意頭を用いて単語アライメントを生成することができる。
単語アライメントは理論上、いかなる注意に基づくNMTの副産物であるため、これは便利である。
アライメントスコアから単語アライメントを抽出する方法に関するさまざまなアプローチを要約し、NMTからスコアを抽出する方法を探ります。
論文 参考訳(メタデータ) (2021-03-31T17:51:35Z) - SLUA: A Super Lightweight Unsupervised Word Alignment Model via
Cross-Lingual Contrastive Learning [79.91678610678885]
超軽量非教師付き単語アライメントモデル(SLUA)を提案する。
いくつかの公開ベンチマークによる実験結果から,我々のモデルは性能が向上しても競争力を発揮することが示された。
特に、我々のモデルはバイリンガル単語の埋め込みと単語のアライメントを統一する先駆的な試みであると認識している。
論文 参考訳(メタデータ) (2021-02-08T05:54:11Z) - Rationalizing Text Matching: Learning Sparse Alignments via Optimal
Transport [14.86310501896212]
本研究では,この選択的合理化アプローチをテキストマッチングに拡張する。
目標は、下流の予測の正当化として、トークンや文などのテキストを共同で選択し、調整することである。
我々のアプローチでは、入力間の最小コストアライメントを見つけるために最適なトランスポート(OT)を採用している。
論文 参考訳(メタデータ) (2020-05-27T01:20:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。