論文の概要: Estranged Predictions: Measuring Semantic Category Disruption with Masked Language Modelling
- arxiv url: http://arxiv.org/abs/2511.08109v1
- Date: Wed, 12 Nov 2025 01:40:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.648182
- Title: Estranged Predictions: Measuring Semantic Category Disruption with Masked Language Modelling
- Title(参考訳): Estranged Predictions: Masked Language Modelling を用いたセマンティックカテゴリー乱れの測定
- Authors: Yuxuan Liu, Haim Dubossarsky, Ruth Ahnert,
- Abstract要約: 我々は,保持率,置換率,エントロピーの3つの指標を用いて,概念的すべりの定量化を行う。
以上の結果から,特に機械レファレンスを中心に,SFは概念透過性を高めていることが明らかとなった。
対照的に、人間の用語は意味的コヒーレンスを維持し、しばしば置換的階層を固定する。
- 参考スコア(独自算出の注目度): 7.787057414368654
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper examines how science fiction destabilises ontological categories by measuring conceptual permeability across the terms human, animal, and machine using masked language modelling (MLM). Drawing on corpora of science fiction (Gollancz SF Masterworks) and general fiction (NovelTM), we operationalise Darko Suvin's theory of estrangement as computationally measurable deviation in token prediction, using RoBERTa to generate lexical substitutes for masked referents and classifying them via Gemini. We quantify conceptual slippage through three metrics: retention rate, replacement rate, and entropy, mapping the stability or disruption of category boundaries across genres. Our findings reveal that science fiction exhibits heightened conceptual permeability, particularly around machine referents, which show significant cross-category substitution and dispersion. Human terms, by contrast, maintain semantic coherence and often anchor substitutional hierarchies. These patterns suggest a genre-specific restructuring within anthropocentric logics. We argue that estrangement in science fiction operates as a controlled perturbation of semantic norms, detectable through probabilistic modelling, and that MLMs, when used critically, serve as interpretive instruments capable of surfacing genre-conditioned ontological assumptions. This study contributes to the methodological repertoire of computational literary studies and offers new insights into the linguistic infrastructure of science fiction.
- Abstract(参考訳): 本稿では,マスク言語モデリング(MLM)を用いて,人間,動物,機械といった概念的透水性を測定することで,SFが存在論的カテゴリーを不安定化する方法について検討する。
SFマスターワークス(Gollancz SFマスターワークス)と一般フィクション(NovelTM)のコーパスを参考に、我々はDarko Suvinの分散理論を、トークン予測における計算的に測定可能な偏差として運用し、RoBERTaを用いてマスク付き参照者の語彙代用を生成し、Geminiを介してそれらを分類する。
我々は、保持率、置換率、エントロピーの3つの指標を通して概念的な滑り込みを定量化し、ジャンル間のカテゴリ境界の安定性や破壊をマッピングする。
以上の結果から,サイエンスフィクションは概念的透過性を高めており,特に機械参照はクロスカテゴリーの置換や分散が顕著であることが明らかとなった。
対照的に、人間の用語は意味的コヒーレンスを維持し、しばしば置換的階層を固定する。
これらのパターンは、人文中心の論理学におけるジャンル固有の再構成を示唆している。
我々は、SFにおける離間は、確率論的モデリングによって検出可能な意味規範の制御摂動として機能し、MLMは、批判的に使用されると、ジャンル条件のオントロジ的仮定を克服できる解釈器として機能すると主張している。
本研究は,計算文学研究の方法論的レパートリーに寄与し,SFの言語的基盤に関する新たな知見を提供する。
関連論文リスト
- Hierarchical Bayesian Operator-induced Symbolic Regression Trees for Structural Learning of Scientific Expressions [3.8545239266455185]
我々は,木構造的記号表現のアンサンブルとして科学法則を表す記号回帰の階層的ベイズ的枠組みを開発する。
我々はベイズ後部濃度の最小値に近い値を確立し、シンボル回帰の文脈で最初の厳密な保証を提供する。
実験的な評価は,提案手法の最先端の競合モジュールに対する堅牢な性能を示す。
論文 参考訳(メタデータ) (2025-09-24T02:42:25Z) - Semantic Attractors and the Emergence of Meaning: Towards a Teleological Model of AGI [0.0]
このエッセイは、複雑な意味空間における意味的誘引者の概念に基づく意味的汎用知能(AGI)の理論的枠組みを開発する。
論文 参考訳(メタデータ) (2025-08-21T19:57:52Z) - Generative or Discriminative? Revisiting Text Classification in the Era of Transformers [6.119618233781921]
本稿では,近代的な生成的・差別的アーキテクチャの包括的評価について紹介する。
様々なシナリオにおいて,サンプル効率,校正,騒音の頑健性,規則性を解析した。
論文 参考訳(メタデータ) (2025-06-13T19:03:58Z) - Large Language Models as Quasi-crystals: Coherence Without Repetition in Generative Text [0.0]
エッセイは大規模言語モデル(LLM)と準結晶の類似性を提案し、局所的な制約によって生成される周期的反復を伴わないグローバルコヒーレンスを示すシステムである。
準結晶の歴史に基づいて、生成言語における代替的なコヒーレンスモード、すなわち反復や象徴的意図を伴わない制約に基づく組織を強調している。
このエッセイは、既存のメソッドを拒絶するのではなく、意味論よりも構造に根ざした解釈の新たな軸を提案することによって、大きな言語モデルに関する現在の議論を再考することを目的としている。
論文 参考訳(メタデータ) (2025-04-16T11:27:47Z) - Categorical Syllogisms Revisited: A Review of the Logical Reasoning Abilities of LLMs for Analyzing Categorical Syllogism [62.571419297164645]
本稿では,分類的シロジズムを解析するための大規模言語モデルの論理的推論能力に関する先行研究を体系的に概説する。
まず、純粋に論理的な観点から分類的シロジズムの可能なバリエーションについて検討する。
次に、既存のデータセットでテストされた基本的な設定(ムードとフィギュア)を調べます。
論文 参考訳(メタデータ) (2024-06-26T21:17:20Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - A Novel Multidimensional Reference Model For Heterogeneous Textual
Datasets Using Context, Semantic And Syntactic Clues [4.453735522794044]
本研究の目的は、異種データセットのカテゴリを用いた新しい多次元参照モデルを作ることである。
MRMの主な貢献は、シノニム、アントロニム、フォーマル、語彙語順、共起といった言語カテゴリーの索引付けに基づいて各用語でそれぞれのトークンをチェックすることである。
論文 参考訳(メタデータ) (2023-11-10T17:02:25Z) - Did the Cat Drink the Coffee? Challenging Transformers with Generalized
Event Knowledge [59.22170796793179]
Transformers Language Models (TLMs) を数学的適合のテクトダイナミックな評価のためのベンチマークで検証した。
以上の結果から, TLM は SDM に匹敵する性能が得られることが示された。
しかし、さらなる分析は、TLMがイベント知識の重要な側面を捉えていないことを一貫して示唆している。
論文 参考訳(メタデータ) (2021-07-22T20:52:26Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。