論文の概要: Un-Doubling Diffusion: LLM-guided Disambiguation of Homonym Duplication
- arxiv url: http://arxiv.org/abs/2509.21262v2
- Date: Sun, 28 Sep 2025 07:41:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 14:13:47.637155
- Title: Un-Doubling Diffusion: LLM-guided Disambiguation of Homonym Duplication
- Title(参考訳): 非二重拡散: LLM誘導によるホモニム重複の曖昧化
- Authors: Evgeny Kaskov, Elizaveta Petrova, Petr Surovtsev, Anna Kostikova, Ilya Mistiurin, Alexander Kapitanov, Alexander Nagaev,
- Abstract要約: ホモニム(Homonym)とは、同一の綴りであるが意味の異なる単語である。
拡散モデルは単語の複数の感覚を同時に生成することができる。
そこで本研究では,異なる拡散モデルの重複率を計測し,評価を行う手法を提案する。
- 参考スコア(独自算出の注目度): 65.67239638031617
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Homonyms are words with identical spelling but distinct meanings, which pose challenges for many generative models. When a homonym appears in a prompt, diffusion models may generate multiple senses of the word simultaneously, which is known as homonym duplication. This issue is further complicated by an Anglocentric bias, which includes an additional translation step before the text-to-image model pipeline. As a result, even words that are not homonymous in the original language may become homonyms and lose their meaning after translation into English. In this paper, we introduce a method for measuring duplication rates and conduct evaluations of different diffusion models using both automatic evaluation utilizing Vision-Language Models (VLM) and human evaluation. Additionally, we investigate methods to mitigate the homonym duplication problem through prompt expansion, demonstrating that this approach also effectively reduces duplication related to Anglocentric bias. The code for the automatic evaluation pipeline is publicly available.
- Abstract(参考訳): ホモニム(Homonym)は、同一の綴りであるが異なる意味を持つ単語であり、多くの生成モデルに課題をもたらす。
ホモニムがプロンプトに現れると、拡散モデルは単語の複数の感覚を同時に生成し、ホモニム重複(homonym duplication)と呼ばれる。
この問題は、テキスト-画像モデルパイプラインの前に追加の変換ステップを含むアングロ中心バイアスによってさらに複雑になる。
結果として、原語の同義語ではない単語でさえ、同義語となり、英語への翻訳後に意味を失う可能性がある。
本稿では,VLM(Vision-Language Models)を用いた自動評価と人的評価の両方を用いて,拡散モデルの重複率を測定し,異なる拡散モデルの動作評価を行う手法を提案する。
さらに,同名の重複問題を即時拡大することで緩和する方法について検討し,アングロ中心バイアスに関連する重複を効果的に低減することを示した。
自動評価パイプラインのコードは公開されている。
関連論文リスト
- Generalized Interpolating Discrete Diffusion [65.74168524007484]
仮面拡散はその単純さと有効性のために一般的な選択である。
ノイズ発生過程の設計において、より柔軟性の高い離散拡散(GIDD)を補間する新しいファミリを一般化する。
GIDDの柔軟性をエクスプロイトし、マスクと均一ノイズを組み合わせたハイブリッドアプローチを探索し、サンプル品質を向上する。
論文 参考訳(メタデータ) (2025-03-06T14:30:55Z) - PLANNER: Generating Diversified Paragraph via Latent Language Diffusion Model [37.2192243883707]
本稿では,潜在意味の拡散と自己回帰生成を組み合わせ,流動的なテキストを生成するモデルであるPLANNERを提案する。
意味生成, テキスト補完, 要約の結果は, 高品質な長文を生成する上での有効性を示す。
論文 参考訳(メタデータ) (2023-06-05T01:36:39Z) - A Tale of Two Laws of Semantic Change: Predicting Synonym Changes with
Distributional Semantic Models [1.856334276134661]
歴史的言語文学には、同義語がどのように進化するかという2つの対立する、明らかに反対の仮説がある。
本稿では,各単語対に対する微分法則 (LD) と並列変化法則 (LPC) の相互関係を検出するための第一歩を踏み出した。
次に、分布意味論モデルを用いた問題に対する様々な計算手法を提案し、近年の語彙意味論的変化検出に関する文献にその基礎を置いている。
論文 参考訳(メタデータ) (2023-05-30T15:50:29Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Patterns of Lexical Ambiguity in Contextualised Language Models [9.747449805791092]
本稿では,単語感覚の類似度と共述度を拡張した,人間による注釈付きデータセットを提案する。
どちらの人間の判断も、多文解釈の類似性は意味の同一性とホモニミーの連続性にあることを示している。
我々のデータセットは、語彙的曖昧性の複雑さの大部分を捉えており、文脈的埋め込みのための現実的なテストベッドを提供することができる。
論文 参考訳(メタデータ) (2021-09-27T13:11:44Z) - Studying word order through iterative shuffling [14.530986799844873]
NLPベンチマークタスクの実行には,単語順序エンコードが不可欠であることを示す。
我々は、固定言語モデルの下で最も高い確率を持つ単語の袋を注文する、新しい効率的な手続きであるBISを使用する。
IBISのような推論手順のシャッフルが言語モデリングや制約付き生成にどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-09-10T13:27:06Z) - On Sampling-Based Training Criteria for Neural Language Modeling [97.35284042981675]
我々はモンテカルロサンプリング、重要サンプリング、補償部分和と呼ばれる新しい方法、およびノイズコントラスト推定を検討する。
対象のクラス後部確率を補正しさえすれば,これらすべてのサンプリング手法が同等に動作可能であることを示す。
Switchboard と LibriSpeech における言語モデリングと音声認識の実験結果が,我々の主張を支持した。
論文 参考訳(メタデータ) (2021-04-21T12:55:52Z) - Novel Aficionados and Doppelg\"angers: a referential task for semantic
representations of individual entities [0.0]
固有名詞と共通名詞の意味的区別は,それらの言語分布に反映されることを示す。
結果は、異なる個々の実体の分布表現は、共通の名詞のそれらよりも明確に区別できないことを示している。
論文 参考訳(メタデータ) (2021-04-20T22:24:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。