論文の概要: Learning Tree Pattern Transformations
- arxiv url: http://arxiv.org/abs/2410.07708v1
- Date: Thu, 10 Oct 2024 08:20:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 15:25:43.553860
- Title: Learning Tree Pattern Transformations
- Title(参考訳): 木パターン変換の学習
- Authors: Daniel Neider, Leif Sabellek, Johannes Schmidt, Fabian Vehlken, Thomas Zeume,
- Abstract要約: ツリー$t$が別のツリー$t*$と構造的に異なる理由と理由を説明することは、コンピュータサイエンス全体で遭遇する問題である。
本稿では,サンプルデータから木組間の構造的差異を説明する方法について考察する。
- 参考スコア(独自算出の注目度): 5.767156832161818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Explaining why and how a tree $t$ structurally differs from another tree $t^*$ is a question that is encountered throughout computer science, including in understanding tree-structured data such as XML or JSON data. In this article, we explore how to learn explanations for structural differences between pairs of trees from sample data: suppose we are given a set $\{(t_1, t_1^*),\dots, (t_n, t_n^*)\}$ of pairs of labelled, ordered trees; is there a small set of rules that explains the structural differences between all pairs $(t_i, t_i^*)$? This raises two research questions: (i) what is a good notion of "rule" in this context?; and (ii) how can sets of rules explaining a data set be learnt algorithmically? We explore these questions from the perspective of database theory by (1) introducing a pattern-based specification language for tree transformations; (2) exploring the computational complexity of variants of the above algorithmic problem, e.g. showing NP-hardness for very restricted variants; and (3) discussing how to solve the problem for data from CS education research using SAT solvers.
- Abstract(参考訳): ツリー$t$が他のツリー$t^*$と構造的に異なる理由と理由を説明することは、XMLやJSONデータなどのツリー構造化データを理解することを含む、コンピュータ科学で遭遇する問題である。
本稿では、サンプルデータから、一対の木の構造的差異に関する説明を学べる方法について考察する: 集合 $\{(t_1, t_1^*),\dots, (t_n, t_n^*)\} ラベル付き順序付けられた木の対の値が与えられたとき、すべてのペア間の構造的差異を説明するルールの小さなセットが存在するか?
これは2つの研究課題を提起する。
(i)この文脈で「ルール」というよい概念は何か。
;そして
(ii)データセットを説明するルールの集合をアルゴリズム的に学習するにはどうすればよいのか?
本稿では,(1)木木変換のためのパターンベース仕様言語の導入,(2)アルゴリズム上の問題の変種に対する計算複雑性の探索,(3)高度に制限された変種に対するNP硬度を示す,(3)SATソルバを用いたCS教育研究のデータ問題の解法について議論する。
関連論文リスト
- Probabilistic Tree-of-thought Reasoning for Answering
Knowledge-intensive Complex Questions [93.40614719648386]
大規模言語モデル(LLM)は、知識集約的な複雑な質問にチェーン・オブ・シント(CoT)推論で答えることができる。
最近の研究は、CoT推論を強化するための外部知識の回収に向けられている。
確率的ツリー・オブ・シント推論(ProbTree)という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-11-23T12:52:37Z) - On Computing Optimal Tree Ensembles [7.424944196676223]
ランダム林や、より一般的には(決定ノブレイクダッシュ-)ツリーアンサンブルは、分類と回帰の方法として広く使われている。
最近のアルゴリズムの進歩は、そのサイズや深さなどの様々な測定に最適な決定木を計算することができる。
2つの新しいアルゴリズムと対応する下位境界を提供する。
論文 参考訳(メタデータ) (2023-06-07T13:30:43Z) - How to enumerate trees from a context-free grammar [0.0]
文脈自由文法(CFG)により生成された木を列挙する簡単なアルゴリズムを提案する。
また、このアルゴリズムが、木上のLempel-Zivコーディングのアナログを含む、より一般的な導出形式に一般化されることを示す。
論文 参考訳(メタデータ) (2023-04-30T16:40:54Z) - Learning-Augmented B-Trees [11.542679443281411]
本研究は,Treapsを用いたBST(Learning-augmented binary search tree)とB-Trees(B-Trees)を複合優先度で検討する。
その結果、各項目の深さが予測重量$w_x$で決定される単純な探索木となる。
論文 参考訳(メタデータ) (2022-11-16T22:50:40Z) - Structure-Unified M-Tree Coding Solver for MathWord Problem [57.825176412485504]
従来,数式表現の2次木構造を考慮に入れたモデルでは,性能が向上した。
本稿では、出力構造を統一するために、任意のM枝(M-tree)を持つ木を適用した構造統一M-Tree符号化(S-UMCr)を提案する。
広く使われているMAWPSとMath23Kデータセットの実験結果は、SUMC-rが複数の最先端モデルを上回るだけでなく、低リソース条件下でもはるかに優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-10-22T12:20:36Z) - Active-LATHE: An Active Learning Algorithm for Boosting the Error
Exponent for Learning Homogeneous Ising Trees [75.93186954061943]
我々は、$rho$が少なくとも0.8$である場合に、エラー指数を少なくとも40%向上させるアルゴリズムを設計し、分析する。
我々の分析は、グラフの一部により多くのデータを割り当てるために、微小だが検出可能なサンプルの統計的変動を巧みに活用することに基づいている。
論文 参考訳(メタデータ) (2021-10-27T10:45:21Z) - On the Parameterized Complexity of Polytree Learning [4.060731229044571]
データサイエンスの基本的な課題は、観測データからベイズネットワークを学ぶことである。
textscPolytree Learningは3n cdot |I|mathcalO(1)$ timeで解けることを示す。
論文 参考訳(メタデータ) (2021-05-20T11:29:12Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - Decision trees as partitioning machines to characterize their
generalization properties [2.370481325034443]
データの分割の観点から、実値の特徴について二分決定木を再検討する。
内部ノードが$N$である二分木構造のVC次元が$N log(Nell)$であることを示す。
我々は,これらの結果に基づいて,多数のデータセット上でのCARTアルゴリズムよりも優れたプルーニングアルゴリズムを詳述する。
論文 参考訳(メタデータ) (2020-10-14T19:25:58Z) - Recursive Top-Down Production for Sentence Generation with Latent Trees [77.56794870399288]
自然および合成言語に対する文脈自由文法の生成特性をモデル化する。
潜伏二分木構造にN$の葉を持つ動的プログラミングアルゴリズムを提案する。
また,Multi30kデータセットを用いたドイツ語と英語の翻訳実験を行った。
論文 参考訳(メタデータ) (2020-10-09T17:47:16Z) - On $\ell_p$-norm Robustness of Ensemble Stumps and Trees [83.81523991945018]
我々は,アンサンブルスタンプの音響検証のための効率的なプログラムベースアルゴリズムを開発した。
我々は,アンサンブル・スタンプや木を訓練するための最初の認証された防御法を,$ell_p$ノルム摂動に関して実証した。
論文 参考訳(メタデータ) (2020-08-20T03:42:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。