論文の概要: Linear Regression in p-adic metric spaces
- arxiv url: http://arxiv.org/abs/2510.00043v1
- Date: Sat, 27 Sep 2025 08:48:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.130302
- Title: Linear Regression in p-adic metric spaces
- Title(参考訳): p進距離空間における線形回帰
- Authors: Gregory D. Baker, Scott McCallum, Dirk Pattinson,
- Abstract要約: p進距離空間における機械学習の理論的基礎を示す。
結果から,機械学習における階層的データ構造を適切に扱うためには,p進測度が基本であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world machine learning problems involve inherently hierarchical data, yet traditional approaches rely on Euclidean metrics that fail to capture the discrete, branching nature of hierarchical relationships. We present a theoretical foundation for machine learning in p-adic metric spaces, which naturally respect hierarchical structure. Our main result proves that an n-dimensional plane minimizing the p-adic sum of distances to points in a dataset must pass through at least n + 1 of those points -- a striking contrast to Euclidean regression that highlights how p-adic metrics better align with the discrete nature of hierarchical data. As a corollary, a polynomial of degree n constructed to minimise the p-adic sum of residuals will pass through at least n + 1 points. As a further corollary, a polynomial of degree n approximating a higher degree polynomial at a finite number of points will yield a difference polynomial that has distinct rational roots. We demonstrate the practical significance of this result through two applications in natural language processing: analyzing hierarchical taxonomies and modeling grammatical morphology. These results suggest that p-adic metrics may be fundamental to properly handling hierarchical data structures in machine learning. In hierarchical data, interpolation between points often makes less sense than selecting actual observed points as representatives.
- Abstract(参考訳): 多くの現実世界の機械学習問題は本質的に階層的なデータを含んでいるが、伝統的なアプローチはユークリッドのメトリクスに依存しており、階層的な関係の離散的で分岐的な性質を捉えていない。
我々は、自然に階層構造を尊重するp進距離空間における機械学習の理論的基礎を提示する。
我々の主な結果は、データセット内の点までの距離の p-進和を最小化する n-次元平面が、これらの点の少なくとも n + 1 を通過しなければならないことを証明している。
圏として、残基の p-進和を最小化する次数 n の多項式は、少なくとも n + 1 個の点を通る。
さらに、次数 n の多項式が有限個の点において高次多項式を近似すると、異なる有理根を持つ差分多項式が得られる。
自然言語処理における2つの応用として,階層型分類学の解析と文法形態学のモデル化を行った。
これらの結果から,機械学習における階層的データ構造を適切に扱うためには,p進測度が基本であることが示唆された。
階層的なデータでは、点間の補間は、実際に観測された点を代表として選択するよりも意味をなさないことが多い。
関連論文リスト
- GeoGNN: Quantifying and Mitigating Semantic Drift in Text-Attributed Graphs [59.61242815508687]
テキスト分散グラフ(TAG)上のグラフニューラルネットワーク(GNN)は、事前訓練された言語モデル(PLM)を使用してノードテキストを符号化し、これらの埋め込みを線形近傍アグリゲーションを通じて伝播する。
本研究は,意味的ドリフトの度合いを計測する局所PCAベースの計量を導入し,異なる凝集機構が多様体構造にどのように影響するかを解析するための最初の定量的枠組みを提供する。
論文 参考訳(メタデータ) (2025-11-12T06:48:43Z) - Directional Sign Loss: A Topology-Preserving Loss Function that Approximates the Sign of Finite Differences [0.8192907805418583]
学習した潜在空間における位相的特徴を保存することは、表現学習における根本的な課題である。
本稿では、2つの配列の対応する要素間の有限差の符号におけるミスマッチ数を近似する、効率よく微分可能な損失関数である方向符号損失()を紹介する。
本稿では、DSLの定式化と複雑性分析を行い、他の微分不可能なトポロジカル測度と比較する。
論文 参考訳(メタデータ) (2025-04-05T15:17:19Z) - Cover Learning for Large-Scale Topology Representation [1.376408511310322]
本稿では,幾何学的データセットのトポロジ的に忠実な被覆を学習する手法について述べる。
そこで得られた単純複体は, 標準トポロジカル推論手法よりも, サイズ的に優れていることを示す。
論文 参考訳(メタデータ) (2025-03-12T19:10:20Z) - Flattening the Parent Bias: Hierarchical Semantic Segmentation in the Poincaré Ball [39.76366192826905]
親が子どもから推定されるフラットな(階層的でない)セグメンテーションネットワークは,階層的アプローチよりも高いセグメンテーション精度を有することを示す。
また,ポアンカー球モデルを用いた階層的セグメンテーションに対するより原理的なアプローチについても検討する。
論文 参考訳(メタデータ) (2024-04-04T19:50:57Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Topologically Regularized Data Embeddings [15.001598256750619]
低次元埋め込みにトポロジ的事前知識を組み込むための代数的トポロジに基づく汎用的アプローチを導入する。
正規化器としてそのような位相損失関数を用いて埋め込み損失を共同最適化すると、局所的な近似だけでなく所望の位相構造も反映する埋め込みが得られることを示す。
線形および非線形次元削減法とグラフ埋め込み法を組み合わせた計算効率,堅牢性,汎用性に関する提案手法を実験的に評価した。
論文 参考訳(メタデータ) (2023-01-09T13:49:47Z) - Dist2Cycle: A Simplicial Neural Network for Homology Localization [66.15805004725809]
単純複体は多方向順序関係を明示的にエンコードするグラフの高次元一般化と見なすことができる。
単体錯体の$k$-homological特徴によってパラメータ化された関数のグラフ畳み込みモデルを提案する。
論文 参考訳(メタデータ) (2021-10-28T14:59:41Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Computational Barriers to Estimation from Low-Degree Polynomials [81.67886161671379]
本研究では,隠れ構造物の存在を検知する作業において,低次構造物のパワーについて検討する。
大規模な「信号+雑音」問題に対して、任意の程度に達成可能な最良の平均二乗誤差に対して、ユーザフレンドリな下界を与える。
応用として,植込みサブマトリクスに対する低次平均2乗誤差の厳密な評価と高密度サブグラフ問題について述べる。
論文 参考訳(メタデータ) (2020-08-05T17:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。