論文の概要: Linear Regression in p-adic metric spaces
- arxiv url: http://arxiv.org/abs/2510.00043v1
- Date: Sat, 27 Sep 2025 08:48:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.130302
- Title: Linear Regression in p-adic metric spaces
- Title(参考訳): p進距離空間における線形回帰
- Authors: Gregory D. Baker, Scott McCallum, Dirk Pattinson,
- Abstract要約: p進距離空間における機械学習の理論的基礎を示す。
結果から,機械学習における階層的データ構造を適切に扱うためには,p進測度が基本であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world machine learning problems involve inherently hierarchical data, yet traditional approaches rely on Euclidean metrics that fail to capture the discrete, branching nature of hierarchical relationships. We present a theoretical foundation for machine learning in p-adic metric spaces, which naturally respect hierarchical structure. Our main result proves that an n-dimensional plane minimizing the p-adic sum of distances to points in a dataset must pass through at least n + 1 of those points -- a striking contrast to Euclidean regression that highlights how p-adic metrics better align with the discrete nature of hierarchical data. As a corollary, a polynomial of degree n constructed to minimise the p-adic sum of residuals will pass through at least n + 1 points. As a further corollary, a polynomial of degree n approximating a higher degree polynomial at a finite number of points will yield a difference polynomial that has distinct rational roots. We demonstrate the practical significance of this result through two applications in natural language processing: analyzing hierarchical taxonomies and modeling grammatical morphology. These results suggest that p-adic metrics may be fundamental to properly handling hierarchical data structures in machine learning. In hierarchical data, interpolation between points often makes less sense than selecting actual observed points as representatives.
- Abstract(参考訳): 多くの現実世界の機械学習問題は本質的に階層的なデータを含んでいるが、伝統的なアプローチはユークリッドのメトリクスに依存しており、階層的な関係の離散的で分岐的な性質を捉えていない。
我々は、自然に階層構造を尊重するp進距離空間における機械学習の理論的基礎を提示する。
我々の主な結果は、データセット内の点までの距離の p-進和を最小化する n-次元平面が、これらの点の少なくとも n + 1 を通過しなければならないことを証明している。
圏として、残基の p-進和を最小化する次数 n の多項式は、少なくとも n + 1 個の点を通る。
さらに、次数 n の多項式が有限個の点において高次多項式を近似すると、異なる有理根を持つ差分多項式が得られる。
自然言語処理における2つの応用として,階層型分類学の解析と文法形態学のモデル化を行った。
これらの結果から,機械学習における階層的データ構造を適切に扱うためには,p進測度が基本であることが示唆された。
階層的なデータでは、点間の補間は、実際に観測された点を代表として選択するよりも意味をなさないことが多い。
関連論文リスト
- Flattening the Parent Bias: Hierarchical Semantic Segmentation in the Poincaré Ball [39.76366192826905]
親が子どもから推定されるフラットな(階層的でない)セグメンテーションネットワークは,階層的アプローチよりも高いセグメンテーション精度を有することを示す。
また,ポアンカー球モデルを用いた階層的セグメンテーションに対するより原理的なアプローチについても検討する。
論文 参考訳(メタデータ) (2024-04-04T19:50:57Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Dist2Cycle: A Simplicial Neural Network for Homology Localization [66.15805004725809]
単純複体は多方向順序関係を明示的にエンコードするグラフの高次元一般化と見なすことができる。
単体錯体の$k$-homological特徴によってパラメータ化された関数のグラフ畳み込みモデルを提案する。
論文 参考訳(メタデータ) (2021-10-28T14:59:41Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Computational Barriers to Estimation from Low-Degree Polynomials [81.67886161671379]
本研究では,隠れ構造物の存在を検知する作業において,低次構造物のパワーについて検討する。
大規模な「信号+雑音」問題に対して、任意の程度に達成可能な最良の平均二乗誤差に対して、ユーザフレンドリな下界を与える。
応用として,植込みサブマトリクスに対する低次平均2乗誤差の厳密な評価と高密度サブグラフ問題について述べる。
論文 参考訳(メタデータ) (2020-08-05T17:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。