論文の概要: Nonlinear Data Integration via Kernel Methods for Data Collaboration Analysis
- arxiv url: http://arxiv.org/abs/2605.27219v1
- Date: Tue, 26 May 2026 16:07:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.402874
- Title: Nonlinear Data Integration via Kernel Methods for Data Collaboration Analysis
- Title(参考訳): データ協調解析のためのカーネル法による非線形データ統合
- Authors: Yamato Suetake, Yuta Kawakami, Shunnosuke Ikeda, Yuichi Takano,
- Abstract要約: データコラボレーション分析は、各データセットを、パーティ固有の難読化機能を通じて、プライバシを保存する中間表現に変換する。
既存のDC解析手法の多くは、データ難読化と統合のための線形変換に依存している。
本稿では,グラフの正規化と中心的制約を導入し,下流解析に有用な幾何学的および対象変数情報を取得する。
- 参考スコア(独自算出の注目度): 6.276434238908262
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collaborative analysis of decentralized confidential datasets is important, but direct sharing of original datasets is often restricted by privacy and institutional constraints. Data collaboration (DC) analysis transforms each dataset into privacy-preserving intermediate representations via party-specific obfuscation functions and integrates them into common collaboration representations using an anchor dataset. However, many existing DC analysis methods rely on linear transformations for data obfuscation and integration, which may increase reconstruction risk. Although nonlinear dimensionality reduction can mitigate this risk, conventional linear integration methods cannot accurately align intermediate representations produced by nonlinear transformations. Moreover, existing integration methods mainly minimize discrepancies among parties and do not explicitly incorporate geometric or target-variable information useful for downstream analysis. To overcome these limitations, we first formulate linear kernel integration (LKI) as a linear integration method and then kernelize it to obtain nonlinear kernel integration (NKI). NKI admits a globally optimal solution via kernel ridge regression and an eigenvalue problem. We also introduce graph regularization and a centering constraint so that the target representation can capture geometric and target-variable information useful for downstream analysis. Experiments on image classification tasks demonstrate that NKI improves classification accuracy over existing linear integration methods under nonlinear dimensionality reduction, with further gains from target-variable-aware graph regularization and centering. The results also show that dimensionality reduction choices substantially affect both classification accuracy and reconstruction risk.
- Abstract(参考訳): 分散化された機密データセットのコラボレーション分析は重要であるが、オリジナルのデータセットの直接的な共有は、プライバシと制度上の制約によって制限されることが多い。
データコラボレーション(DC)分析は、各データセットを、パーティ固有の難読化関数を介してプライバシー保護中間表現に変換し、アンカーデータセットを使用して共通のコラボレーション表現に統合する。
しかし、既存のDC解析手法の多くは、データ難読化と統合のための線形変換に依存しており、再構成リスクが増大する可能性がある。
非線形次元減少は、このリスクを軽減することができるが、従来の線形積分法は、非線形変換によって生成される中間表現を正確に整列することはできない。
さらに、既存の統合手法は、主に当事者間の不一致を最小限に抑え、下流分析に有用な幾何情報やターゲット変数情報を明示的に含めない。
これらの制約を克服するために、まず線形積分法として線形カーネル積分(LKI)を定式化し、次に非線形カーネル積分(NKI)を得る。
NKIはカーネルリッジ回帰と固有値問題によるグローバルな最適解を認めている。
また,グラフの正規化や中心的制約を導入し,下流解析に有用な幾何的および目標変数情報を取得する。
画像分類タスクの実験では、NKIは、非線形次元の削減の下で既存の線形積分法よりも分類精度を向上し、ターゲット変数のグラフ正規化と中心化によるさらなる向上が示されている。
また,次元性低下の選択は分類精度と復元リスクの両方に大きく影響を及ぼすことが示された。
関連論文リスト
- A Mean Curvature Approach to Boundary Detection: Geometric Insights for Unsupervised Learning [52.452902154360565]
本稿では,幾何学的機械学習に基づく新しい幾何学的フレームワークであるMean Curvature Boundary Points (MCBP)を紹介する。
MCBPはデータ多様体の固有曲率を明示的にモデル化し、原理化された多様体のパラメトリゼーションを必要としない点平均曲率を計算する。
合成および実世界のデータセットの実験により、MCBPはクラスタリング性能を一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-05-05T20:19:09Z) - Generalization Bound of Gradient Flow through Training Trajectory and Data-dependent Kernel [55.82768375605861]
我々は、カーネル法における古典的ラデマッハ複雑性と整合する勾配流の一般化を確立する。
NTKのような静的カーネルとは異なり、LPKはトレーニング軌跡全体をキャプチャし、データと最適化の両方に適応する。
論文 参考訳(メタデータ) (2025-06-12T23:17:09Z) - Outlier-aware Tensor Robust Principal Component Analysis with Self-guided Data Augmentation [21.981038455329013]
適応重み付けを用いた自己誘導型データ拡張手法を提案する。
本研究では,最先端手法と比較して精度と計算効率の両面での改善を示す。
論文 参考訳(メタデータ) (2025-04-25T13:03:35Z) - An Incremental Non-Linear Manifold Approximation Method [0.0]
本研究では, GMRA(Geometric Multi-Resolution Analysis) フレームワークを用いて, ストリーミングデータに対する漸進的非線形次元低減法を開発した。
提案手法は,クラスタマップ,PCAベクトル,ウェーブレット係数を漸進的に更新することで,リアルタイムなデータ解析と可視化を可能にする。
論文 参考訳(メタデータ) (2025-04-12T03:54:05Z) - Nonlinear Multiple Response Regression and Learning of Latent Spaces [2.6113259186042876]
教師なし設定と教師なし設定の両方で潜在空間を学習できる統一手法を提案する。
ブラックボックス」として動作する他のニューラルネットワーク手法とは異なり、我々のアプローチはより良い解釈可能性を提供するだけでなく、計算の複雑さも減少させる。
論文 参考訳(メタデータ) (2025-03-27T15:28:06Z) - Adversarial Dependence Minimization [78.36795688238155]
この研究は、線形対のデコリレーションを超越した依存最小化のための微分可能でスケーラブルなアルゴリズムを提供する。
我々は,PCAを非線形デコリレーションに拡張し,画像分類法の一般化を改良し,自己教師あり表現学習における次元的崩壊を防止する3つのアプリケーションでその実用性を実証する。
論文 参考訳(メタデータ) (2025-02-05T14:43:40Z) - Data Collaboration Analysis with Orthonormal Basis Selection and Alignment [2.928964540437144]
Data Collaboration (DC)は、複数のパーティがプライベートデータセットを公開することなく、モデルを共同でトレーニングすることを可能にする。
既存の理論は、秘密の基地と同じ部分空間にまたがる任意の標的基底は十分であると主張する。
我々は、秘密ベースとターゲットベースの両方で正規性制約を明示的に強制する新しいDCフレームワークであるOrthonormal Data Collaboration(ODC)を紹介する。
論文 参考訳(メタデータ) (2024-03-05T08:52:16Z) - Learning Linear Causal Representations from Interventions under General
Nonlinear Mixing [52.66151568785088]
介入対象にアクセスできることなく、未知の単一ノード介入を考慮し、強い識別可能性を示す。
これは、ディープニューラルネットワークの埋め込みに対する非ペアの介入による因果識別性の最初の例である。
論文 参考訳(メタデータ) (2023-06-04T02:32:12Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Linear Tensor Projection Revealing Nonlinearity [0.294944680995069]
次元の減少は高次元データの学習に有効な方法である。
本稿では,元データ情報を可能な限り多く保持しつつ,予測精度を最大化する部分空間を探索する手法を提案する。
論文 参考訳(メタデータ) (2020-07-08T06:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。