論文の概要: Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology
- arxiv url: http://arxiv.org/abs/2605.30415v1
- Date: Thu, 28 May 2026 18:00:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.151555
- Title: Domain Adaptation and Reasoning Frameworks in Language Models: A Controlled Experiment with Historical Cosmology
- Title(参考訳): 言語モデルにおけるドメイン適応と推論フレームワーク:歴史的コスモロジーを用いた制御実験
- Authors: Francesco De Bernardis,
- Abstract要約: 本研究では,歴史的宇宙論を制御環境として用いた言語モデルにおいて,ドメイン適応が説明行動にどう影響するかを考察する。
フェーズ1では、Copernican前コーパスでスクラッチから小さな言語モデルをトレーニングし、明確なヘリオセントリック参照を取り除いた。
第2相では,同じコーパス上でQLoRAを用いてより大規模な事前学習モデルを微調整し,説明的フレーミングと宇宙的姿勢の適応性について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate how domain adaptation reshapes explanatory behavior in language models using historical cosmology as a controlled setting. In Phase 1, we train a small language model from scratch on a pre-Copernican corpus from which explicit heliocentric references were removed, and evaluate whether Earth-motion or heliocentric continuations nevertheless emerge. In Phase 2, we fine-tune a larger pretrained model using QLoRA on the same corpus in order to study how adaptation modifies explanatory framing and cosmological stance. Model outputs are evaluated using an LLM-as-judge framework that labels both cosmological stance (geocentric, heliocentric, or ambiguous) and explanatory frame (premodern versus modern). In the constrained setting of Phase 1, the smaller models occasionally generate local Earth-motion continuations, but these remain globally unstable and insufficient to support coherent cosmological reasoning. In Phase 2, fine-tuning induces a large and statistically significant shift toward premodern explanatory framing, while the conditional cosmological stance distributions remain comparatively stable within those frames. As a result, increases in geocentric outputs arise primarily from redistribution over explanatory regimes rather than from direct modification of stance. These results suggest that domain adaptation may primarily reshape the linguistic frameworks from which continuations are generated, with changes in stance emerging secondarily from those shifts.
- Abstract(参考訳): 本研究では,歴史的宇宙論を制御環境として用いた言語モデルにおいて,ドメイン適応が説明行動にどう影響するかを検討する。
フェーズ1では,より明確なヘリオセントリックな参照が取り除かれた前コペルニクスコーパス上で,スクラッチから小さな言語モデルを訓練し,それにもかかわらず地球運動あるいはヘリオセントリックな継続が出現するかどうかを評価する。
第2相では、同じコーパス上でQLoRAを用いて、より大規模な事前学習モデルを微調整し、説明的フレーミングと宇宙的スタンスをどのように適応させるかを研究する。
モデル出力はLLM-as-judgeフレームワークを用いて評価され、宇宙的スタンス(地球中心、ヘリオ中心、曖昧)と説明的フレーム(前近代対現代)の両方にラベル付けされる。
フェーズ1の制約された設定では、小さなモデルは時折局所的な地球運動の継続を生成するが、これらは地球的に不安定であり、コヒーレントな宇宙論的な推論をサポートするには不十分である。
フェーズ2では、微調整は前近代的な説明的フレーミングへの大きな統計的シフトを誘導するが、条件付き宇宙的姿勢分布はこれらのフレームの中で比較的安定である。
その結果、地理的中心的なアウトプットの増加は、主に姿勢の直接的な変更ではなく、説明的体制の再分配によって生じる。
これらの結果は、ドメイン適応は、主に継続が生成される言語的枠組みを再構築し、それらのシフトから第2に現れる姿勢の変化を示唆している。
関連論文リスト
- Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency [53.28076739140119]
本稿では,視覚・言語モデル(VLM)における論理的一貫性を幾何学的・言語的双対性演算によって実現する枠組みを提案する。
SAGEは、従来のGRPO法に比べてモデルに依存しず、データ効率が良く、既存のVLMに軽量な後学習段階として適用することができる。
ビデオおよび空間推論ベンチマークの実験では、強いベースラインよりも一貫した改善が示されている。
論文 参考訳(メタデータ) (2026-05-18T10:05:21Z) - Concurrence of Symmetry Breaking and Nonlocality Phase Transitions in Diffusion Models [0.3066496319646444]
このような相転移の2つの概念が現代の拡散変圧器において同時であるかどうかを考察する。
臨界時間における非局所性と対称性のほぼ同時発生を観察する。
私たちの仕事は、実際に相転移という2つの概念を統一する最初のものです。
論文 参考訳(メタデータ) (2026-05-06T12:24:57Z) - Beyond Attention: True Adaptive World Models via Spherical Kernel Operator [0.0]
標準的な注意を置き換えるフレームワークであるSpherical Kernelを紹介します。
SKOは、エージェントの偏りのある観察周波数から真の環境遷移のダイナミクスを数学的に分離する。
経験的評価により、SKOは自己回帰言語モデリングにおいて、収束を著しく加速し、標準の注意ベースラインを上回ることが確認される。
論文 参考訳(メタデータ) (2026-02-25T21:51:34Z) - Semantic Belief-State World Model for 3D Human Motion Prediction [0.0]
本研究では,人間の動作予測を人体多様体上の潜在力学シミュレーションとして再構成するセマンティック・リーフ・ステート・ワールド・モデルを提案する。
SBWMは、モデルに基づく強化学習のために開発された信念状態の世界モデルにインスパイアされ、潜伏遷移とロールアウト中心のトレーニングを人間の動作領域に適用する。
論文 参考訳(メタデータ) (2026-01-07T02:06:26Z) - Large Language Models as Quasi-crystals: Coherence Without Repetition in Generative Text [0.0]
エッセイは大規模言語モデル(LLM)と準結晶の類似性を提案し、局所的な制約によって生成される周期的反復を伴わないグローバルコヒーレンスを示すシステムである。
準結晶の歴史に基づいて、生成言語における代替的なコヒーレンスモード、すなわち反復や象徴的意図を伴わない制約に基づく組織を強調している。
このエッセイは、既存のメソッドを拒絶するのではなく、意味論よりも構造に根ざした解釈の新たな軸を提案することによって、大きな言語モデルに関する現在の議論を再考することを目的としている。
論文 参考訳(メタデータ) (2025-04-16T11:27:47Z) - Dual-Space Invariance as a Definitive Signature of Critical States in Anderson Localization [4.680781132156346]
臨界状態は多重フラクタル構造や自己相似性を含む非エルゴード的性質である。
重要な状態を正確に特徴付けることは、これまでも大きな課題となっている。
我々は、臨界状態が位置と運動量表現の両方において双対空間不変性を維持しなければならないことを示す普遍的なメカニズムを確立する。
論文 参考訳(メタデータ) (2024-11-13T22:48:38Z) - SPARTAN: A Sparse Transformer Learning Local Causation [63.29645501232935]
因果構造は、環境の変化に柔軟に適応する世界モデルにおいて中心的な役割を果たす。
本研究では,SPARse TrANsformer World Model(SPARTAN)を提案する。
オブジェクト指向トークン間の注意パターンに空間規則を適用することで、SPARTANは、将来のオブジェクト状態を正確に予測するスパース局所因果モデルを特定する。
論文 参考訳(メタデータ) (2024-11-11T11:42:48Z) - Super-model ecosystem: A domain-adaptation perspective [101.76769818069072]
本稿では,ドメイン適応による新たなスーパーモデルパラダイムの理論的基礎を確立することを試みる。
スーパーモデルパラダイムは、計算とデータコストと二酸化炭素排出量を減らすのに役立つ。
論文 参考訳(メタデータ) (2022-08-30T09:09:43Z) - From locality to irregularity: Introducing local quenches in massive
scalar field theory [68.8204255655161]
任意の時空次元における大規模スカラー場理論における励起局所状態のダイナミクスを考察する。
フィールド質量とクエンチ正則化パラメータの値に応じて,それらの進化の異なるレギュレーションを同定する。
また、シリンダー上の大規模スカラー場理論の局所的なクエンチについて検討し、それらが可観測物の不安定でカオス的な進化を引き起こすことを示す。
論文 参考訳(メタデータ) (2022-05-24T18:00:07Z) - Discrete Variational Attention Models for Language Generation [51.88612022940496]
本稿では,言語における離散性に起因する注意機構のカテゴリー分布を考慮した離散的変動注意モデルを提案する。
離散性の特質により,提案手法の訓練は後部崩壊に支障を来さない。
論文 参考訳(メタデータ) (2020-04-21T05:49:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。