論文の概要: DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation
- arxiv url: http://arxiv.org/abs/2604.15593v1
- Date: Fri, 17 Apr 2026 00:25:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.6839
- Title: DALM: A Domain-Algebraic Language Model via Three-Phase Structured Generation
- Title(参考訳): DALM:3相構造生成によるドメイン代数型言語モデル
- Authors: Chao Li,
- Abstract要約: 本稿では,制約のないトークン生成をドメイン格子上の構造化復号化に置き換えるドメイン代数言語モデルを提案する。
我々はCDCの知識表現システムを用いてフレームワークをインスタンス化し、検証済みのドメインアノテート結晶ライブラリのトレーニングと評価について概説する。
- 参考スコア(独自算出の注目度): 3.0060310098235967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models compress heterogeneous knowledge into a single parameter space, allowing facts from different domains to interfere during generation. We propose DALM, a Domain-Algebraic Language Model that replaces unconstrained token generation with structured denoising over a domain lattice. DALM follows a three-phase generation path: it first resolves domain uncertainty, then relation uncertainty, and finally concept uncertainty, so each stage operates under explicit algebraic constraints. The framework requires only three ingredients: a lattice of domains with computable meet, join, and implication; a typing function over relations that controls inheritance across domains; and a fiber partition that localizes knowledge to domain-specific subsets. Given these ingredients, DALM yields a three-phase encoder-decoder architecture in which generation is confined to a domain fiber, cross-domain contamination is structurally prevented in closed-vocabulary mode and auditably bounded in open-vocabulary mode, and a single query can produce a domain-indexed multi-perspective answer space. We instantiate the framework with the CDC knowledge representation system and outline training and evaluation on validated domain-annotated crystal libraries. DALM reframes language generation as algebraically constrained structured denoising rather than unconstrained decoding over a flat token space.
- Abstract(参考訳): 大きな言語モデルは異種知識を単一のパラメータ空間に圧縮し、異なる領域の事実が生成中に干渉することを可能にする。
本稿では,制約のないトークン生成をドメイン格子上の構造化デノベーションに置き換えるドメイン代数言語モデルであるDALMを提案する。
DALMは3相生成経路に従い、まずドメインの不確かさを解決し、それから関係不確かさを解決し、最後に概念不確かさを概念化し、各段階は明示的な代数的制約の下で機能する。
このフレームワークは、計算可能なマッチング、結合、含意を持つドメインの格子、ドメイン間の継承を制御する関係上の型付け関数、知識をドメイン固有のサブセットにローカライズするファイバーパーティションの3つの要素しか必要としない。
これらの要素からDALMは、生成をドメインファイバに限定した3相エンコーダデコーダアーキテクチャを生成し、クロスドメイン汚染はクローズドボキャブラリモードで構造的に防止され、オープンボキャブラリモードで聴覚的にバウンドされ、単一クエリでドメインインデックス付きマルチパースペクティブ応答空間を生成することができる。
我々はCDCの知識表現システムを用いてフレームワークをインスタンス化し、検証済みのドメインアノテート結晶ライブラリのトレーニングと評価について概説する。
DALMは、言語生成をフラットトークン空間上の制約のない復号化ではなく、代数的に制約された構造化デノイングとして再編成する。
関連論文リスト
- Granular Ball Guided Stable Latent Domain Discovery for Domain-General Crowd Counting [19.18297173252027]
そこで本研究では,一般群集カウントのためのグラニュラーボールガイド型安定潜時ドメイン探索フレームワークを提案する。
提案手法はまず, サンプルをコンパクトな局所粒状球体に分類し, 擬似ドメインを推論する代表として粒状球体をクラスタ化する。
検出された潜在ドメインの上に,伝達可能な意味表現を改善する2分岐学習フレームワークを開発する。
論文 参考訳(メタデータ) (2026-03-25T09:12:35Z) - Top 10 Open Challenges Steering the Future of Diffusion Language Model and Its Variants [85.33837131101342]
本稿では,基盤基盤,アルゴリズム最適化,認知推論,統合マルチモーダルインテリジェンスという4つの柱で構成された戦略ロードマップを提案する。
この移行は、複雑な構造的推論、動的自己補正、シームレスなマルチモーダル統合が可能な次世代AIの開発に不可欠である、と我々は主張する。
論文 参考訳(メタデータ) (2026-01-20T14:58:23Z) - A Multi-Agent LLM Framework for Multi-Domain Low-Resource In-Context NER via Knowledge Retrieval, Disambiguation and Reflective Analysis [7.594209761100934]
In-context Learning (ICL) with large language model (LLMs)は、低リソースシナリオにおける名前付きエンティティ認識(NER)のための有望なパラダイムとして登場した。
KDR-Agentは、知識検索、曖昧さ、反射分析を統合した、コンテキスト内NERのための新しいマルチエージェントフレームワークである。
5つのドメインから10のデータセットを対象とした実験では、KDR-Agentが既存のゼロショットと少数ショットのICLベースラインを大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2025-11-24T13:23:34Z) - Unified Language-driven Zero-shot Domain Adaptation [55.64088594551629]
Unified Language-driven Zero-shot Domain Adaptation (ULDA)は、新しいタスクセットである。
これにより、ドメインIDの知識を明示することなく、単一のモデルを多様なターゲットドメインに適応させることができる。
論文 参考訳(メタデータ) (2024-04-10T16:44:11Z) - Multiple Noises in Diffusion Model for Semi-Supervised Multi-Domain Translation [1.9510388605988505]
マルチドメイン翻訳の課題を解決するために,MDD(Multi-Domain Diffusion)を導入する。
MDDは新しいデータオブジェクトの欠落したビューを再構築し、半教師付きコンテキストでの学習を可能にする。
マルチドメイン合成データセットBL3NDTのドメイン翻訳実験により,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-09-25T15:31:16Z) - SMC-UDA: Structure-Modal Constraint for Unsupervised Cross-Domain Renal
Segmentation [100.86339246424541]
本稿では、識別パラダイムに基づく新しい構造モード制約(SMC) UDA フレームワークを提案し、ドメイン間のブリッジとしてエッジ構造を導入する。
構造に制約のある自己学習とプログレッシブROIでは,エッジの3次元空間構造を見極めることで腎臓を分節する。
実験の結果,提案するSMC-UDAの一般化は良好であり,生成的UDA法よりも優れていた。
論文 参考訳(メタデータ) (2023-06-14T02:57:23Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Unsupervised Domain Clusters in Pretrained Language Models [61.832234606157286]
大規模事前学習型言語モデルでは,教師なしのドメインによってクラスタ化される文表現を暗黙的に学習する。
このようなモデルに基づくドメインデータ選択手法を提案する。
我々は5つの異なる領域にわたるニューラルネットワーク翻訳のためのデータ選択手法を評価する。
論文 参考訳(メタデータ) (2020-04-05T06:22:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。