論文の概要: LLMON: An LLM-native Markup Language to Leverage Structure and Semantics at the LLM Interface
- arxiv url: http://arxiv.org/abs/2603.22519v2
- Date: Mon, 30 Mar 2026 20:39:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:02.074932
- Title: LLMON: An LLM-native Markup Language to Leverage Structure and Semantics at the LLM Interface
- Title(参考訳): LLMON: LLMインターフェースで構造とセマンティクスを活用するLLMネイティブなマークアップ言語
- Authors: Michael Hind, Basel Shbita, Bo Wu, Farhan Ahmed, Chad DeLuca, Nathan Fulton, David Cox, Dan Gutfreund,
- Abstract要約: LLM ネイティブなマークアップ言語 LLMON を導入し,テキストの構造と意味的メタデータを LLM に自然な方法で伝達できるようにする。
この情報はモデルトレーニング、モデルプロンプト、推論実装で使用することができ、モデル精度、安全性、セキュリティが改善される。
- 参考スコア(独自算出の注目度): 6.499636351596393
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Textual Large Language Models (LLMs) provide a simple and familiar interface: a string of text is used for both input and output. However, the information conveyed to an LLM often has a richer structure and semantics, which is not conveyed in a string. For example, most prompts contain both instructions ("Summarize this paper into a paragraph") and data (the paper to summarize), but these are usually not distinguished when passed to the model. This can lead to model confusion and security risks, such as prompt injection attacks. This work addresses this shortcoming by introducing an LLM-native mark-up language, LLMON (LLM Object Notation, pronounced "Lemon"), that enables the structure and semantic metadata of the text to be communicated in a natural way to an LLM. This information can then be used during model training, model prompting, and inference implementation, leading to improvements in model accuracy, safety, and security. This is analogous to how programming language types can be used for many purposes, such as static checking, code generation, dynamic checking, and IDE highlighting. We discuss the general design requirements of an LLM-native markup language, introduce the LLMON markup language and show how it meets these design requirements, describe how the information contained in a LLMON artifact can benefit model training and inference implementation, and provide some preliminary empirical evidence of its value for both of these use cases. We also discuss broader issues and research opportunities that are enabled with an LLM-native approach.
- Abstract(参考訳): Textual Large Language Models (LLMs) はシンプルで親しみやすいインタフェースを提供する:入力と出力の両方にテキストの文字列を使用する。
しかし、LLMに伝達される情報は、しばしばよりリッチな構造と意味を持ち、文字列で伝達されない。
例えば、ほとんどのプロンプトには、この論文を段落に要約する)とデータ(要約する)の両方が含まれているが、モデルに渡すと区別されないことが多い。
これは、インジェクションインジェクション攻撃などのモデル混乱とセキュリティリスクにつながる可能性がある。
この研究は、LLMネイティブなマークアップ言語LLMON(LLM Object Notation、略称「レモン」)を導入することで、この欠点に対処する。
この情報はモデルトレーニング、モデルプロンプト、推論実装で使用することができ、モデル精度、安全性、セキュリティが改善される。
これは静的チェック、コード生成、動的チェック、IDEハイライトなど、多くの目的でプログラミング言語の型が利用できる方法に類似している。
LLMネイティブなマークアップ言語の一般的な設計要件について議論し、LLMONマークアップ言語を導入し、それらの設計要件を満たす方法を示し、LLMONアーティファクトに含まれる情報がモデルトレーニングと推論の実装にどのように役立つかを説明し、これらのユースケースの双方に対してその価値の予備的な実証的証拠を提供する。
また、LLMネイティブアプローチによって実現される幅広い問題や研究機会についても論じる。
関連論文リスト
- Type-Constrained Code Generation with Language Models [51.03439021895432]
本稿では,型システムを利用してコード生成を誘導する型制約デコード手法を提案する。
そこで本研究では,新しい接頭辞オートマトンと,在来型を探索する手法を開発し,LLM生成コードに適切な型付けを強制するための健全なアプローチを構築した。
提案手法は,コード合成,翻訳,修復作業において,コンパイルエラーを半分以上削減し,機能的正しさを著しく向上させる。
論文 参考訳(メタデータ) (2025-04-12T15:03:00Z) - Text-like Encoding of Collaborative Information in Large Language Models for Recommendation [58.87865271693269]
BinLLMはLarge Language Models for Recommendation (LLMRec)とシームレスに連携する新しい手法である。
BinLLMは、外部モデルからの協調的な埋め込みをバイナリシーケンスに変換する。
BinLLMは、ドット決定記法を用いてバイナリシーケンスを圧縮するオプションを提供し、過度に長い長さを避ける。
論文 参考訳(メタデータ) (2024-06-05T12:45:25Z) - Large Language Models for Data Annotation and Synthesis: A Survey [49.8318827245266]
本調査は,データアノテーションと合成のための大規模言語モデルの有用性に焦点を当てる。
LLMがアノテートできるデータタイプの詳細な分類、LLM生成アノテーションを利用したモデルの学習戦略のレビュー、データアノテーションと合成にLLMを使用する際の主な課題と制限に関する詳細な議論を含む。
論文 参考訳(メタデータ) (2024-02-21T00:44:04Z) - Learning to Prompt with Text Only Supervision for Vision-Language Models [107.282881515667]
メソッドの1つのブランチは、視覚情報を使用してプロンプトを学習することでCLIPに適応する。
別のアプローチでは、大規模な言語モデルからクラス記述を生成することで、トレーニング不要の手法を利用する。
そこで本研究では,テキストデータのみを用いてプロンプトを学習することで,両ストリームの強みを組み合わせることを提案する。
論文 参考訳(メタデータ) (2024-01-04T18:59:49Z) - If LLM Is the Wizard, Then Code Is the Wand: A Survey on How Code
Empowers Large Language Models to Serve as Intelligent Agents [81.60906807941188]
大型言語モデル(LLM)は、自然言語と形式言語(コード)の組み合わせに基づいて訓練される
コードは、標準構文、論理一貫性、抽象化、モジュール性を備えた高レベルの目標を実行可能なステップに変換する。
論文 参考訳(メタデータ) (2024-01-01T16:51:20Z) - Making Large Language Models A Better Foundation For Dense Retrieval [19.38740248464456]
デンス検索では,クエリとドキュメント間の意味的関係を表現するために,識別テキストの埋め込みを学習する必要がある。
意味理解におけるLLMの強い能力を考えると、大きな言語モデル(LLM)の使用の恩恵を受けるかもしれない。
本稿では,LLaRA (LLM adapted for dense RetrievAl) を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:10:35Z) - Bridging Code Semantic and LLMs: Semantic Chain-of-Thought Prompting for
Code Generation [22.219645213202178]
本稿では,SeCoT というコードの意味情報を抽出する "Semantic Chain-of-Thought" 手法を提案する。
本研究では,SeCoTが最先端の性能を実現し,大規模モデルやコード生成の可能性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2023-10-16T05:09:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。