Fugu-MT 論文翻訳(概要): Embedding Style Beyond Topics: Analyzing Dispersion Effects Across Different Language Models

論文の概要: Embedding Style Beyond Topics: Analyzing Dispersion Effects Across Different Language Models

arxiv url: http://arxiv.org/abs/2501.00828v1
Date: Wed, 01 Jan 2025 13:17:16 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-05 16:54:32.03458
Title: Embedding Style Beyond Topics: Analyzing Dispersion Effects Across Different Language Models
Title（参考訳）: トピックを超えた埋め込みスタイル:異なる言語モデル間の分散効果の分析
Authors: Benjamin Icard, Evangelia Zve, Lila Sainero, Alice Breton, Jean-Gabriel Ganascia,
Abstract要約: 本研究では, 組込み空間形成における書字スタイルの役割について検討した。トピックとスタイルを交互に扱う文芸コーパスを用いて、フランス語と英語の言語モデルの感度を比較する。
参考スコア（独自算出の注目度）: 0.0699049312989311
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper analyzes how writing style affects the dispersion of embedding vectors across multiple, state-of-the-art language models. While early transformer models primarily aligned with topic modeling, this study examines the role of writing style in shaping embedding spaces. Using a literary corpus that alternates between topics and styles, we compare the sensitivity of language models across French and English. By analyzing the particular impact of style on embedding dispersion, we aim to better understand how language models process stylistic information, contributing to their overall interpretability.
Abstract（参考訳）: 本稿では,複数の最先端言語モデルにまたがる埋め込みベクトルの分散に,書き込みスタイルがどう影響するかを解析する。初期変圧器モデルは,主にトピックモデリングに適合するが,本研究では,埋め込み空間を形成する上での書き込みスタイルの役割について検討する。トピックとスタイルを交互に扱う文芸コーパスを用いて、フランス語と英語の言語モデルの感度を比較する。組込み分散におけるスタイルの影響を分析することにより,言語モデルがスタイリスティックな情報をどのように処理するかをよりよく理解し,その全体的な解釈可能性に寄与することを目指す。

関連論文リスト

Training Models on Dialects of Translationese Shows How Lexical Diversity and Source-Target Syntactic Similarity Shape Learning [0.6599344783327054]
機械翻訳データの学習が小英語モデルに与える影響について検討する。我々は、24のタイポロジーおよびリソース多様性ソース言語から翻訳された英語のテキストでモデルを訓練する。
論文参考訳（メタデータ） (2026-02-18T13:59:08Z)
Personalized Image Descriptions from Attention Sequences [55.65023709100682]
異なる領域、オブジェクト、詳細をさまざまな順序で参照し、異なる言語スタイルで記述する。パーソナライズされた画像記述のための既存のモデルは、個々の視聴パターンを活用する以前の作業がなく、言語スタイルのみに焦点を当てている。我々は、パーソナライズされた視聴動作を記述生成のコアファクターとして明示的にモデル化することで、このギャップに対処する。そこで,本手法では,補助的な注意制御タスクによって誘導される言語スタイルと視聴行動の両方をキャプチャする対象埋め込みについて学習する。軽量なアダプタは,これらの埋め込みを凍結した視覚言語モデルと整合させ,再訓練を行なわずにパーソナライズすることができる。
論文参考訳（メタデータ） (2025-12-07T05:23:18Z)
Formalizing Style in Personal Narratives [1.5755923640031846]
著者が行う言語的選択のパターンとして,個人的物語のスタイルを形式化する新しいアプローチを提案する。本フレームワークは,機能言語学,コンピュータ科学,心理学的観察という3つの領域を統合している。我々はこの枠組みを、外傷後ストレス障害を持つ退役軍人のケーススタディを含む、数百の夢物語に適用する。
論文参考訳（メタデータ） (2025-10-09T06:48:06Z)
Bias Attribution in Filipino Language Models: Extending a Bias Interpretability Metric for Application on Agglutinative Languages [8.58480189544444]
言語モデルの実装に情報理論バイアス属性スコアを適応させる。フィリピンのモデルは、人、物、関係に関連する言葉によって偏見を向けられていることを示す。これらの知見は、英語と非英語のモデルが、社会デマログラフ群と偏見に関連する入力をどのように処理するかの相違を示唆している。
論文参考訳（メタデータ） (2025-06-08T18:13:18Z)
Linguistic Interpretability of Transformer-based Language Models: a systematic review [1.3194391758295114]
Transformerアーキテクチャに基づく言語モデルは、多くの言語関連タスクにおいて優れた結果をもたらす。しかし、それらの内部計算がどのように結果を達成するかは分かっていない。しかし、「解釈可能性」という一連の研究は、これらのモデル内でどのように情報がエンコードされているかを学ぶことを目的としている。
論文参考訳（メタデータ） (2025-04-09T08:00:12Z)
Style Extraction on Text Embeddings Using VAE and Parallel Dataset [1.8067835669244101]
本研究の目的は,変分オートエンコーダ(VAE)モデルを用いて,翻訳間の文体的変動を検出し解析することである。その結果、各翻訳は独自のスタイル分布を示し、VAEモデルを用いて効果的に識別できることを示した。この研究は、AIベースのテキスト生成とスタイリスティック分析における、より広範な応用に対するモデルの可能性を強調している。
論文参考訳（メタデータ） (2025-02-12T00:24:28Z)
Human-Object Interaction Detection Collaborated with Large Relation-driven Diffusion Models [65.82564074712836]
テキストと画像の拡散モデルに光を流す新しいHOI検出器であるDIFfusionHOIを紹介する。まず、埋め込み空間における人間と物体の関係パターンの表現をインバージョンベースで学習する戦略を考案する。これらの学習された関係埋め込みはテキストのプロンプトとして機能し、スタイア拡散モデルが特定の相互作用を記述する画像を生成する。
論文参考訳（メタデータ） (2024-10-26T12:00:33Z)
Examining Language Modeling Assumptions Using an Annotated Literary Dialect Corpus [0.0]
19世紀のアメリカの文学的変種トークンのデータセットを,人間の注釈付き方言群タグの新たな層で提示する。意図的な正書法変化によって生じる「方言効果」が複数の言語チャネルを取り入れていることを示す。
論文参考訳（メタデータ） (2024-10-03T16:58:21Z)
Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文参考訳（メタデータ） (2024-04-09T11:39:53Z)
Distinguishing Fictional Voices: a Study of Authorship Verification Models for Quotation Attribution [12.300285585201767]
既訓練のオーサシップ検証モデルを用いて,引用文を符号化して構築した文字のスタイリスティックな表現について検討する。以上の結果から,これらのモデルの一部で捉えたスタイリスティックな情報とトピック的な情報の組み合わせは,文字を正確に区別するが,引用の帰属時に意味のみのモデルよりも必ずしも改善されないことが示唆された。
論文参考訳（メタデータ） (2024-01-30T12:49:40Z)
The Scenario Refiner: Grounding subjects in images at the morphological level [2.401993998791928]
視覚と言語(V&L)モデルがこのような特徴を形態学レベルで捉えているかどうかを問う。我々は、V&Lモデルと人間の判断を比較し、モデルの予測が人間の判断と異なることを発見した。
論文参考訳（メタデータ） (2023-09-20T12:23:06Z)
Interpreting Language Models with Contrastive Explanations [99.7035899290924]
言語モデルは、音声、数字、時制、意味論など、トークンを予測するための様々な特徴を考慮しなければならない。既存の説明手法は、これらの特徴の証拠を1つの説明に分割するが、人間の理解には理解できない。比較的な説明は、主要な文法現象の検証において、非対照的な説明よりも定量的に優れていることを示す。
論文参考訳（メタデータ） (2022-02-21T18:32:24Z)
Sentiment analysis in tweets: an assessment study from classical to modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文参考訳（メタデータ） (2021-05-29T21:05:28Z)
Probing Contextual Language Models for Common Ground with Visual Representations [76.05769268286038]
我々は、マッチングと非マッチングの視覚表現を区別する上で、テキストのみの表現がいかに効果的かを評価するための探索モデルを設計する。以上の結果から,言語表現だけでは,適切な対象カテゴリから画像パッチを検索する強力な信号が得られることがわかった。視覚的に接地された言語モデルは、例えば検索においてテキストのみの言語モデルよりわずかに優れているが、人間よりもはるかに低い。
論文参考訳（メタデータ） (2020-05-01T21:28:28Z)
Do Neural Language Models Show Preferences for Syntactic Formalisms? [14.388237635684737]
本研究では,言語モデルが捉えた構文構造のセマンランスが,表面シンタクティックあるいは深層構文解析の様式にどの程度依存しているかについて検討する。 13の異なる言語で訓練されたBERTおよびELMoモデルに対して,有向依存木抽出のためのプローブを適用した。どちらのモデルも、SUDよりもUDを好むことが分かりました。
論文参考訳（メタデータ） (2020-04-29T11:37:53Z)
Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文参考訳（メタデータ） (2020-04-29T03:34:53Z)
Sentiment Analysis with Contextual Embeddings and Self-Attention [3.0079490585515343]
自然言語では、単語や句の意図された意味はしばしば暗黙的であり、文脈に依存する。本稿では,文脈埋め込みと自己認識機構を用いた感情分析の簡易かつ効果的な手法を提案する。形態学的にリッチなポーランド語とドイツ語を含む3つの言語の実験結果から、我々のモデルは最先端のモデルに匹敵するか、さらに優れています。
論文参考訳（メタデータ） (2020-03-12T02:19:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。