論文の概要: Embedding Style Beyond Topics: Analyzing Dispersion Effects Across Different Language Models
- arxiv url: http://arxiv.org/abs/2501.00828v1
- Date: Wed, 01 Jan 2025 13:17:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:16:50.720772
- Title: Embedding Style Beyond Topics: Analyzing Dispersion Effects Across Different Language Models
- Title(参考訳): トピックを超えた埋め込みスタイル:異なる言語モデル間の分散効果の分析
- Authors: Benjamin Icard, Evangelia Zve, Lila Sainero, Alice Breton, Jean-Gabriel Ganascia,
- Abstract要約: 本研究では, 組込み空間形成における書字スタイルの役割について検討した。
トピックとスタイルを交互に扱う文芸コーパスを用いて、フランス語と英語の言語モデルの感度を比較する。
- 参考スコア(独自算出の注目度): 0.0699049312989311
- License:
- Abstract: This paper analyzes how writing style affects the dispersion of embedding vectors across multiple, state-of-the-art language models. While early transformer models primarily aligned with topic modeling, this study examines the role of writing style in shaping embedding spaces. Using a literary corpus that alternates between topics and styles, we compare the sensitivity of language models across French and English. By analyzing the particular impact of style on embedding dispersion, we aim to better understand how language models process stylistic information, contributing to their overall interpretability.
- Abstract(参考訳): 本稿では,複数の最先端言語モデルにまたがる埋め込みベクトルの分散に,書き込みスタイルがどう影響するかを解析する。
初期変圧器モデルは,主にトピックモデリングに適合するが,本研究では,埋め込み空間を形成する上での書き込みスタイルの役割について検討する。
トピックとスタイルを交互に扱う文芸コーパスを用いて、フランス語と英語の言語モデルの感度を比較する。
組込み分散におけるスタイルの影響を分析することにより,言語モデルがスタイリスティックな情報をどのように処理するかをよりよく理解し,その全体的な解釈可能性に寄与することを目指す。
関連論文リスト
- Style Extraction on Text Embeddings Using VAE and Parallel Dataset [1.8067835669244101]
本研究の目的は,変分オートエンコーダ(VAE)モデルを用いて,翻訳間の文体的変動を検出し解析することである。
その結果、各翻訳は独自のスタイル分布を示し、VAEモデルを用いて効果的に識別できることを示した。
この研究は、AIベースのテキスト生成とスタイリスティック分析における、より広範な応用に対するモデルの可能性を強調している。
論文 参考訳(メタデータ) (2025-02-12T00:24:28Z) - Human-Object Interaction Detection Collaborated with Large Relation-driven Diffusion Models [65.82564074712836]
テキストと画像の拡散モデルに光を流す新しいHOI検出器であるDIFfusionHOIを紹介する。
まず、埋め込み空間における人間と物体の関係パターンの表現をインバージョンベースで学習する戦略を考案する。
これらの学習された関係埋め込みはテキストのプロンプトとして機能し、スタイア拡散モデルが特定の相互作用を記述する画像を生成する。
論文 参考訳(メタデータ) (2024-10-26T12:00:33Z) - Examining Language Modeling Assumptions Using an Annotated Literary Dialect Corpus [0.0]
19世紀のアメリカの文学的変種トークンのデータセットを,人間の注釈付き方言群タグの新たな層で提示する。
意図的な正書法変化によって生じる「方言効果」が複数の言語チャネルを取り入れていることを示す。
論文 参考訳(メタデータ) (2024-10-03T16:58:21Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Distinguishing Fictional Voices: a Study of Authorship Verification
Models for Quotation Attribution [12.300285585201767]
既訓練のオーサシップ検証モデルを用いて,引用文を符号化して構築した文字のスタイリスティックな表現について検討する。
以上の結果から,これらのモデルの一部で捉えたスタイリスティックな情報とトピック的な情報の組み合わせは,文字を正確に区別するが,引用の帰属時に意味のみのモデルよりも必ずしも改善されないことが示唆された。
論文 参考訳(メタデータ) (2024-01-30T12:49:40Z) - The Scenario Refiner: Grounding subjects in images at the morphological
level [2.401993998791928]
視覚と言語(V&L)モデルがこのような特徴を形態学レベルで捉えているかどうかを問う。
我々は、V&Lモデルと人間の判断を比較し、モデルの予測が人間の判断と異なることを発見した。
論文 参考訳(メタデータ) (2023-09-20T12:23:06Z) - Interpreting Language Models with Contrastive Explanations [99.7035899290924]
言語モデルは、音声、数字、時制、意味論など、トークンを予測するための様々な特徴を考慮しなければならない。
既存の説明手法は、これらの特徴の証拠を1つの説明に分割するが、人間の理解には理解できない。
比較的な説明は、主要な文法現象の検証において、非対照的な説明よりも定量的に優れていることを示す。
論文 参考訳(メタデータ) (2022-02-21T18:32:24Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - Probing Contextual Language Models for Common Ground with Visual
Representations [76.05769268286038]
我々は、マッチングと非マッチングの視覚表現を区別する上で、テキストのみの表現がいかに効果的かを評価するための探索モデルを設計する。
以上の結果から,言語表現だけでは,適切な対象カテゴリから画像パッチを検索する強力な信号が得られることがわかった。
視覚的に接地された言語モデルは、例えば検索においてテキストのみの言語モデルよりわずかに優れているが、人間よりもはるかに低い。
論文 参考訳(メタデータ) (2020-05-01T21:28:28Z) - Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。
実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文 参考訳(メタデータ) (2020-04-29T03:34:53Z) - Sentiment Analysis with Contextual Embeddings and Self-Attention [3.0079490585515343]
自然言語では、単語や句の意図された意味はしばしば暗黙的であり、文脈に依存する。
本稿では,文脈埋め込みと自己認識機構を用いた感情分析の簡易かつ効果的な手法を提案する。
形態学的にリッチなポーランド語とドイツ語を含む3つの言語の実験結果から、我々のモデルは最先端のモデルに匹敵するか、さらに優れています。
論文 参考訳(メタデータ) (2020-03-12T02:19:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。