論文の概要: Learning Languages with Decidable Hypotheses
- arxiv url: http://arxiv.org/abs/2011.09866v1
- Date: Thu, 15 Oct 2020 09:27:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 03:34:44.374222
- Title: Learning Languages with Decidable Hypotheses
- Title(参考訳): 決定可能な仮説を用いた言語学習
- Authors: Julian Berger, Maximilian B\"other, Vanja Dosko\v{c}, Jonathan Gadea
Harder, Nicolas Klodt, Timo K\"otzing, Winfried L\"otzsch, Jannik Peters,
Leon Schiller, Lars Seifert, Armin Wells, Simon Wietheger
- Abstract要約: 極限における言語学習において、最も一般的な仮説は、ある言語の列挙子を与えることである。
いわゆる$W$-indexは任意の計算可能可算言語を命名することができる。
我々は、任意の決定可能な言語、すなわち特徴関数のプログラムを命名できる別のシステム($C$-indices)を使用している。
- 参考スコア(独自算出の注目度): 1.2728819383164875
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In language learning in the limit, the most common type of hypothesis is to
give an enumerator for a language. This so-called $W$-index allows for naming
arbitrary computably enumerable languages, with the drawback that even the
membership problem is undecidable. In this paper we use a different system
which allows for naming arbitrary decidable languages, namely programs for
characteristic functions (called $C$-indices). These indices have the drawback
that it is now not decidable whether a given hypothesis is even a legal
$C$-index.
In this first analysis of learning with $C$-indices, we give a structured
account of the learning power of various restrictions employing $C$-indices,
also when compared with $W$-indices. We establish a hierarchy of learning power
depending on whether $C$-indices are required (a) on all outputs; (b) only on
outputs relevant for the class to be learned and (c) only in the limit as
final, correct hypotheses. Furthermore, all these settings are weaker than
learning with $W$-indices (even when restricted to classes of computable
languages). We analyze all these questions also in relation to the mode of data
presentation.
Finally, we also ask about the relation of semantic versus syntactic
convergence and derive the map of pairwise relations for these two kinds of
convergence coupled with various forms of data presentation.
- Abstract(参考訳): 極限における言語学習において、最も一般的な仮説は、ある言語の列挙子を与えることである。
いわゆる$W$-indexは、任意の計算可能可算言語を命名することができるが、会員問題でさえ決定不可能である。
本稿では,任意の決定可能な言語,すなわち特性関数のプログラム($c$-indices と呼ばれる)を命名するシステムについて述べる。
これらの指標は、与えられた仮説が法的に$C$-インデックスであっても決定できないという欠点を持っている。
本稿では,$C$-indicesを用いた学習の初回分析において,$C$-indicesを用いた各種制約の学習能力と,$W$-indicesとの比較を行った。
私たちは、$c$-インデックスが必要かどうかに応じて学習力の階層を確立する
(a)すべての出力について
b) 学習すべきクラスに関連する出力のみ
(c)最終、正しい仮説として限度内でのみ。
さらに、これらの設定はすべて$W$-indicesで学ぶよりも弱い(計算可能な言語のクラスに限定されても)。
データ提示のモードに関しても,これらの質問を全て分析する。
最後に,意味的収束と構文的収束の関係を問うとともに,これら2種類の収束の対関係の写像と,各種データ提示の形式を結合して導出する。
関連論文リスト
- Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
形式言語理論は、特に認識者に関するものである。
代わりに、非公式な意味でのみ類似したプロキシタスクを使用するのが一般的である。
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価することで、このミスマッチを補正する。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - $O_2$ is a multiple context-free grammar: an implementation-, formalisation-friendly proof [0.0]
それらを生成することができる文法の表現力に応じて言語を分類することは、計算言語学における根本的な問題である。
本稿では,各証明が検証された(すなわち,証明支援者によってチェックされる)アルゴリズムに繋がるかどうかを,MCFGを通して解析できるかどうかを体系的に研究する,計算的および証明理論的な視点から,既存の証明を解析する。
論文 参考訳(メタデータ) (2024-05-15T14:51:11Z) - How do Large Language Models Handle Multilingualism? [81.15060972112563]
本研究では,大規模言語モデル(LLM)が多言語モデルをどのように扱うかを検討する。
LLMはまずクエリを理解し、タスク解決のために多言語入力を英語に変換する。
中間層では、英語を思考に用い、自己意識とフィードフォワード構造を持つ多言語知識を取り入れている。
論文 参考訳(メタデータ) (2024-02-29T02:55:26Z) - LINC: A Neurosymbolic Approach for Logical Reasoning by Combining
Language Models with First-Order Logic Provers [60.009969929857704]
論理的推論は、科学、数学、社会に潜在的影響を与える可能性のある人工知能にとって重要なタスクである。
本研究では、LINCと呼ばれるモジュール型ニューロシンボリックプログラミングのようなタスクを再構成する。
我々は,FOLIOとProofWriterのバランスの取れたサブセットに対して,ほぼすべての実験条件下で,3つの異なるモデルに対して顕著な性能向上を観察した。
論文 参考訳(メタデータ) (2023-10-23T17:58:40Z) - Agnostic Multi-Group Active Learning [24.97598179536084]
能動的学習の観点から,この問題の変種を考察し,学習者がコレクションの各分布からどの例をラベル付けするかを判断する権限を付与する。
我々の主な課題は、不一致に基づくアクティブラーニングのような標準的なアクティブラーニング技術が、マルチグループラーニングの目的に直接適用されないことである。
既存のアルゴリズムを改良し、多群学習の非依存的な定式化のための一貫した能動的学習アルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-06-02T21:24:13Z) - Agnostic learning with unknown utilities [70.14742836006042]
現実世界の多くの問題において、決定の効用は基礎となる文脈である$x$ と decision $y$ に依存する。
我々はこれを未知のユーティリティによる不可知学習として研究する。
サンプルされた点のみのユーティリティを推定することで、よく一般化した決定関数を学習できることを示す。
論文 参考訳(メタデータ) (2021-04-17T08:22:04Z) - Safety Synthesis Sans Specification [5.874782446136914]
ハードウェアおよびソフトウェア検証の多くの状況において、これは自然な問題である、と私たちは主張する。
この問題に対する学習アルゴリズムを考案し、その時間とクエリの複雑さが、対象言語のランク、不適合性尺度、与えられた反例の最大長に関するものであることを示す。
論文 参考訳(メタデータ) (2020-11-15T21:13:17Z) - RNNs can generate bounded hierarchical languages with optimal memory [113.73133308478612]
RNNは、自然言語構文の足場を反映した境界階層言語を効率的に生成できることを示す。
Dyck-($k$,$m$)は、よくネストされた括弧($k$型)と$m$バウンドされたネスト深さの言語である。
明示的な構成により,$O(m log k)$ hidden units の RNN がメモリの指数的削減に十分であることを示す。
論文 参考訳(メタデータ) (2020-10-15T04:42:29Z) - On the Modularity of Hypernetworks [103.1147622394852]
構造化対象関数の場合、ハイパーネットワークにおけるトレーニング可能なパラメータの総数は、標準ニューラルネットワークのトレーニング可能なパラメータの数や埋め込み法よりも桁違いに小さいことを示す。
論文 参考訳(メタデータ) (2020-02-23T22:51:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。