Fugu-MT 論文翻訳(概要): Achieving Semantic Consistency: Contextualized Word Representations for Political Text Analysis

論文の概要: Achieving Semantic Consistency: Contextualized Word Representations for Political Text Analysis

arxiv url: http://arxiv.org/abs/2412.04505v2
Date: Sun, 19 Jan 2025 06:54:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-22 19:37:18.980399
Title: Achieving Semantic Consistency: Contextualized Word Representations for Political Text Analysis
Title（参考訳）: 意味的一貫性の達成:政治的テキスト分析のための文脈的単語表現
Authors: Ruiyu Zhang, Lin Nie, Ce Zhao, Qingyang Chen,
Abstract要約: 本研究では,Word2Vec と BERT を比較し,異なる時間枠における意味表現の性能を評価する。その結果,BERTはWord2Vecよりもセマンティック安定性を保ちつつも微妙なセマンティックなバリエーションを認識していることがわかった。
参考スコア（独自算出の注目度）: 0.9249657468385781
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Accurately interpreting words is vital in political science text analysis; some tasks require assuming semantic stability, while others aim to trace semantic shifts. Traditional static embeddings, like Word2Vec effectively capture long-term semantic changes but often lack stability in short-term contexts due to embedding fluctuations caused by unbalanced training data. BERT, which features transformer-based architecture and contextual embeddings, offers greater semantic consistency, making it suitable for analyses in which stability is crucial. This study compares Word2Vec and BERT using 20 years of People's Daily articles to evaluate their performance in semantic representations across different timeframes. The results indicate that BERT outperforms Word2Vec in maintaining semantic stability and still recognizes subtle semantic variations. These findings support BERT's use in text analysis tasks that require stability, where semantic changes are not assumed, offering a more reliable foundation than static alternatives.
Abstract（参考訳）: 正確な単語の解釈は、政治科学のテキスト分析において不可欠であり、意味的安定性を仮定するタスクもあれば、意味的変化の追跡を狙うタスクもある。 Word2Vecのような従来の静的な埋め込みは、長期のセマンティックな変更を効果的にキャプチャするが、アンバランスなトレーニングデータによる埋め込みの変動により、短期的なコンテキストでは安定性が欠如することが多い。 BERTは、トランスフォーマーベースのアーキテクチャとコンテキスト埋め込みを特徴とするもので、よりセマンティックな一貫性を提供し、安定性が不可欠である分析に適している。本研究では,Word2Vec と BERT を20年間の人事誌記事を用いて比較し,異なる時間枠における意味表現の性能を評価する。その結果,BERTはWord2Vecよりもセマンティック安定性を保ちつつも微妙なセマンティックなバリエーションを認識していることがわかった。これらの発見は、セマンティックな変更が想定されない安定性を必要とするテキスト解析タスクにおけるBERTの使用をサポートし、静的な代替よりも信頼性の高い基盤を提供する。

関連論文リスト

Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文参考訳（メタデータ） (2024-10-14T08:45:35Z)
Unsupervised Semantic Variation Prediction using the Distribution of Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文参考訳（メタデータ） (2023-05-15T13:58:21Z)
A Survey on Contextualised Semantic Shift Detection [0.0]
セマンティックシフト検出(セマンティックシフト検出、Semantic Shift Detection、SSD)は、ターゲット語の意味における時間的変化を識別し、解釈し、評価するタスクである。本稿では,意味表現,時間認識,学習モダリティ次元を特徴とする分類フレームワークを提案する。
論文参考訳（メタデータ） (2023-04-04T09:50:19Z)
Interpreting BERT-based Text Similarity via Activation and Saliency Maps [26.279593839644836]
本稿では,事前学習したBERTモデルから推定される段落類似性を説明するための教師なし手法を提案する。一対の段落を見ると,各段落の意味を規定する重要な単語を識別し,各段落間の単語の一致を判定し,両者の類似性を説明する最も重要なペアを検索する。
論文参考訳（メタデータ） (2022-08-13T10:06:24Z)
Incorporating Dynamic Semantics into Pre-Trained Language Model for Aspect-based Sentiment Analysis [67.41078214475341]
ABSAの動的アスペクト指向セマンティクスを学ぶために,DR-BERT(Dynamic Re-weighting BERT)を提案する。具体的には、まずStack-BERT層を主エンコーダとして、文の全体的な意味を理解する。次に、軽量な動的再重み付けアダプタ(DRA)を導入して微調整する。
論文参考訳（メタデータ） (2022-03-30T14:48:46Z)
HistBERT: A Pre-trained Language Model for Diachronic Lexical Semantic Analysis [3.2851864672627618]
本稿では,英語のバランスを保ったコーパスに基づいて,事前学習したBERTベースの言語モデルHistBERTを提案する。単語類似性および意味変化解析における有望な結果を報告する。
論文参考訳（メタデータ） (2022-02-08T02:53:48Z)
WMDecompose: A Framework for Leveraging the Interpretable Properties of Word Mover's Distance in Sociocultural Analysis [0.0]
妥当性と解釈可能性のバランスをとる一般的なモデルは、Word Mover's Distance (WMD)である。 WMDecomposeは、文書レベル距離を構成語レベル距離に分解し、その後、単語をクラスタ化してテーマ要素を誘導するモデルおよびPythonライブラリである。
論文参考訳（メタデータ） (2021-10-14T13:04:38Z)
Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文参考訳（メタデータ） (2021-10-04T03:59:15Z)
A comprehensive comparative evaluation and analysis of Distributional Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文参考訳（メタデータ） (2021-05-20T15:18:06Z)
Interpretable Time-series Representation Learning With Multi-Level Disentanglement [56.38489708031278]
Disentangle Time Series (DTS)は、シーケンシャルデータのための新しいDisentanglement Enhanceingフレームワークである。 DTSは時系列の解釈可能な表現として階層的意味概念を生成する。 DTSは、セマンティック概念の解釈性が高く、下流アプリケーションで優れたパフォーマンスを実現します。
論文参考訳（メタデータ） (2021-05-17T22:02:24Z)
Statistically significant detection of semantic shifts using contextual word embeddings [7.439525715543974]
文脈的単語埋め込みと順列に基づく統計的テストを組み合わせて意味的変化を推定する手法を提案する。本手法の性能をシミュレーションで実証し,偽陽性を抑圧することにより,一貫して高精度に達成する。また,SemEval-2020 Task 1 と Liverpool FC subreddit corpus の実際のデータも分析した。
論文参考訳（メタデータ） (2021-04-08T13:58:54Z)
EDS-MEMBED: Multi-sense embeddings based on enhanced distributional semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。 M-SEの新たな分布意味類似度測定法を先行して導出する。 WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文参考訳（メタデータ） (2021-02-27T14:36:55Z)
Fake it Till You Make it: Self-Supervised Semantic Shifts for Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。 3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文参考訳（メタデータ） (2021-01-30T18:59:43Z)
On the Sentence Embeddings from Pre-trained Language Models [78.45172445684126]
本稿では,BERT埋め込みにおける意味情報が完全に活用されていないことを論じる。 BERTは常に文の非滑らかな異方性意味空間を誘導し,その意味的類似性を損なう。本稿では,非教師対象で学習した正規化フローにより,異方性文の埋め込み分布を滑らかで等方性ガウス分布に変換することを提案する。
論文参考訳（メタデータ） (2020-11-02T13:14:57Z)
Introducing Syntactic Structures into Target Opinion Word Extraction with Deep Learning [89.64620296557177]
目的語抽出のためのディープラーニングモデルに文の構文構造を組み込むことを提案する。また,ディープラーニングモデルの性能向上のために,新たな正規化手法を導入する。提案モデルは,4つのベンチマークデータセット上での最先端性能を広範囲に解析し,達成する。
論文参考訳（メタデータ） (2020-10-26T07:13:17Z)
Word Embeddings: Stability and Semantic Change [0.0]
本稿では,過去10年で最も影響力のある埋め込み技術である word2vec, GloVe, fastText のトレーニングプロセスの不安定性について実験的に検討する。本稿では,埋め込み手法の不安定性を記述する統計モデルを提案し,個々の単語の表現の不安定性を測定するための新しい指標を提案する。
論文参考訳（メタデータ） (2020-07-23T16:03:50Z)
Temporal Embeddings and Transformer Models for Narrative Text Understanding [72.88083067388155]
キャラクタ関係モデリングのための物語テキスト理解のための2つのアプローチを提案する。これらの関係の時間的進化は動的単語埋め込みによって説明され、時間とともに意味的変化を学ぶように設計されている。最新の変換器モデルBERTに基づく教師付き学習手法を用いて文字間の静的な関係を検出する。
論文参考訳（メタデータ） (2020-03-19T14:23:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。