Fugu-MT 論文翻訳(概要): A New Semisupervised Technique for Polarity Analysis using Masked Language Models

論文の概要: A New Semisupervised Technique for Polarity Analysis using Masked Language Models

arxiv url: http://arxiv.org/abs/2604.26230v1
Date: Wed, 29 Apr 2026 02:17:38 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-30 15:59:36.224253
Title: A New Semisupervised Technique for Polarity Analysis using Masked Language Models
Title（参考訳）: マスケッド言語モデルを用いた極性解析のための新しい半教師付き手法
Authors: Kohei Watanabe,
Abstract要約: マスク付き言語モデルとして word2vec を用いたLatent Semantic Scaling (LSS) の新バージョンを開発した。オリジナルの空間モデルとは異なり、与えられた文脈で発生するシードワードの予測確率として、単語や文書に極性スコアを割り当てる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: I developed a new version of Latent Semantic Scaling (LSS) employing word2vec as a masked language model. Unlike original spatial models, it assigns polarity scores to words and documents as predicted probabilities of seed words to occur in given contexts. These probabilistic polarity scores are more accurate, interpretable and consistent than those spatial polarity models can produce in text analysis. I demonstrate these advantages by applying both probabilistic and spatial models to China Daily's coverage of China and other countries during the coronavirus disease (COVID) pandemic in terms of achievement in health issues. The result suggests that more advanced masked language models would further improve the semisupervised machine learning technique.
Abstract（参考訳）: マスク付き言語モデルとして word2vec を用いたLatent Semantic Scaling (LSS) の新バージョンを開発した。オリジナルの空間モデルとは異なり、与えられた文脈で発生するシードワードの予測確率として、単語や文書に極性スコアを割り当てる。これらの確率的極性スコアは、テキスト分析で生成できる空間的極性モデルよりも正確で、解釈可能で、一貫性がある。これらの利点は、新型コロナウイルス(COVID-19)パンデミックの期間中に、中国や他国をカバーした確率モデルと空間モデルの両方を、健康面での達成の観点から適用することで示します。その結果、より高度なマスク付き言語モデルにより、半教師付き機械学習技術がさらに改善されることが示唆された。

関連論文リスト

Massively Multilingual Joint Segmentation and Glossing [43.1579568150712]
本研究は, 原文からの線形グルースとそれに対応する形態的セグメンテーションを共同で予測するニューラルモデルに関する最初の研究である。我々は,Seq2seq多言語モデルの集合であるGrossLMとPolyGlossのトレーニングコーパスを拡張した。
論文参考訳（メタデータ） (2026-01-16T00:55:35Z)
Grounding Multimodal Large Language Models with Quantitative Skin Attributes: A Retrieval Study [2.1206523992812545]
本稿では,MLLM(Multimodal Large Language Models)と量的属性利用という,有望な2つのアプローチの組み合わせについて検討する。 MLLMは、対話型フォーマットによる自然言語の診断の推論を提供する、解釈可能性の向上のための潜在的な道を提供する。 MLLM埋め込み空間は、画像からそれらの値を予測する微調整により、そのような属性でグラウンド化できることを示す。
論文参考訳（メタデータ） (2025-08-27T18:05:05Z)
Generate to Ground: Multimodal Text Conditioning Boosts Phrase Grounding in Medical Vision-Language Models [6.408114351192012]
生成テキストから画像への拡散モデルにより,ゼロショットフレーズのグラウンド化性能が向上することを示す。その結果, 医用画像領域において, 句接頭のためのより効果的なパラダイムとして, 生成的アプローチが確立された。
論文参考訳（メタデータ） (2025-07-16T13:48:32Z)
CONTESTS: a Framework for Consistency Testing of Span Probabilities in Language Models [16.436592723426305]
単語スパンに関節確率を割り当てる異なる方法で、言語モデルが同じ値を生成するかどうかは不明である。我々の研究はConTestSという新しいフレームワークを導入し、交換可能な完了順序と条件付き順序でスコアの整合性を評価する統計的テストを含む。
論文参考訳（メタデータ） (2024-09-30T06:24:43Z)
Tailoring Language Generation Models under Total Variation Distance [55.89964205594829]
ニューラルネットワーク生成の標準パラダイムは、最適化方法として最大推定(MLE)を採用する。言語生成に適用するための実践的境界を開発する。本稿では,TVD推定のトレードオフのバランスをとるためのTaiLr の目標について紹介する。
論文参考訳（メタデータ） (2023-02-26T16:32:52Z)
mFACE: Multilingual Summarization with Factual Consistency Evaluation [79.60172087719356]
抽象的な要約は、事前訓練された言語モデルと大規模データセットの可用性のおかげで、近年で新たな関心を集めている。有望な結果にもかかわらず、現在のモデルはいまだに現実的に矛盾した要約を生み出すことに苦しむ。事実整合性評価モデルを利用して、多言語要約を改善する。
論文参考訳（メタデータ） (2022-12-20T19:52:41Z)
Pre-training Multilingual Neural Machine Translation by Leveraging Alignment Information [72.2412707779571]
mRASPは、汎用多言語ニューラルマシン翻訳モデルを事前訓練するためのアプローチである。我々は,低,中,豊かな資源を含む多種多様な環境における42の翻訳方向の実験を行い,エキゾチックな言語対への変換を行った。
論文参考訳（メタデータ） (2020-10-07T03:57:54Z)
Multi-timescale Representation Learning in LSTM Language Models [69.98840820213937]
言語モデルは、非常に短いから非常に長いまでの時間スケールで単語間の統計的依存関係を捉えなければならない。我々は、長期記憶言語モデルにおけるメモリゲーティング機構が、パワーローの減衰を捉えることができるかの理論を導出した。実験の結果,自然言語で学習したLSTM言語モデルは,この理論分布を近似することがわかった。
論文参考訳（メタデータ） (2020-09-27T02:13:38Z)
XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning [68.57658225995966]
XCOPA (Cross-lingual Choice of Plausible Alternatives) は11言語における因果コモンセンス推論のための多言語データセットである。提案手法は,翻訳に基づく転送と比較して,現在の手法の性能が低下していることを明らかにする。
論文参考訳（メタデータ） (2020-05-01T12:22:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。