論文の概要: Robust Similarity and Distance Learning via Decision Forests
- arxiv url: http://arxiv.org/abs/2007.13843v2
- Date: Fri, 21 Aug 2020 15:41:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 08:21:59.138279
- Title: Robust Similarity and Distance Learning via Decision Forests
- Title(参考訳): 森林決定によるロバストな類似性と遠隔学習
- Authors: Tyler M. Tomita and Joshua T. Vogelstein
- Abstract要約: 距離学習のための新たな決定森林アルゴリズムを提案し,これをSimisity and Metric Random Forests(SMERF)と呼ぶ。
任意の距離を近似し、重要な特徴を識別する能力は、シミュレーションデータセット上で実証的に実証されている。
- 参考スコア(独自算出の注目度): 8.587164648430251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Canonical distances such as Euclidean distance often fail to capture the
appropriate relationships between items, subsequently leading to subpar
inference and prediction. Many algorithms have been proposed for automated
learning of suitable distances, most of which employ linear methods to learn a
global metric over the feature space. While such methods offer nice theoretical
properties, interpretability, and computationally efficient means for
implementing them, they are limited in expressive capacity. Methods which have
been designed to improve expressiveness sacrifice one or more of the nice
properties of the linear methods. To bridge this gap, we propose a highly
expressive novel decision forest algorithm for the task of distance learning,
which we call Similarity and Metric Random Forests (SMERF). We show that the
tree construction procedure in SMERF is a proper generalization of standard
classification and regression trees. Thus, the mathematical driving forces of
SMERF are examined via its direct connection to regression forests, for which
theory has been developed. Its ability to approximate arbitrary distances and
identify important features is empirically demonstrated on simulated data sets.
Last, we demonstrate that it accurately predicts links in networks.
- Abstract(参考訳): ユークリッド距離のような正準距離は、しばしばアイテム間の適切な関係を捉えられず、その後にサブパー推論と予測に繋がる。
多くのアルゴリズムが適切な距離を自動学習するために提案され、そのほとんどは特徴空間上の大域的計量を学習するために線形手法を用いている。
このような手法は、優れた理論特性、解釈可能性、それらを実装するための計算効率のよい手段を提供するが、表現能力には制限がある。
表現力を向上させるために設計されたメソッドは、線形メソッドの1つ以上の優れた特性を犠牲にしている。
このギャップを埋めるために,我々は距離学習のための,高度に表現力のある新しい決定森林アルゴリズムを提案し,これをSimisity and Metric Random Forests (SMERF) と呼ぶ。
SMERFにおける木構築手順は標準分類と回帰木の適切な一般化であることを示す。
そこで, SMERFの数学的駆動力は, 回帰林と直結して検討され, その理論が発展している。
任意の距離を近似し、重要な特徴を特定する能力は、シミュレーションデータセット上で実証的に実証されている。
最後に,ネットワーク内のリンクを正確に予測できることを実証する。
関連論文リスト
- A Top-down Graph-based Tool for Modeling Classical Semantic Maps: A Crosslinguistic Case Study of Supplementary Adverbs [50.982315553104975]
セマンティックマップモデル(SMM)は、言語横断的なインスタンスや形式からネットワークのような概念空間を構築する。
ほとんどのSMMは、ボトムアップ手順を使用して、人間の専門家によって手動で構築される。
本稿では,概念空間とSMMをトップダウンで自動生成するグラフベースの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-02T12:06:41Z) - GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - Case-based Explainability for Random Forest: Prototypes, Critics, Counter-factuals and Semi-factuals [1.0485739694839669]
説明可能なケースベース推論(XCBR)は、実例を参照してモデルの出力を解明する実践的なアプローチである。
XCBRは、最近までツリーベースモデルなど、多くのアルゴリズムであまり研究されていない。
論文 参考訳(メタデータ) (2024-08-13T07:08:54Z) - Embedding Trajectory for Out-of-Distribution Detection in Mathematical Reasoning [50.84938730450622]
数理推論におけるOOD検出にトラジェクトリボラティリティを用いたトラジェクトリベースのTVスコアを提案する。
本手法は, 数学的推論シナリオ下でのGLM上での従来のアルゴリズムよりも優れる。
提案手法は,複数選択質問などの出力空間における高密度特徴を持つアプリケーションに拡張することができる。
論文 参考訳(メタデータ) (2024-05-22T22:22:25Z) - Data-driven abstractions via adaptive refinements and a Kantorovich
metric [extended version] [56.94699829208978]
本稿では,動的システムのスマートでスケーラブルな抽象化のための適応的洗練手順を提案する。
最適構造を学ぶために、マルコフ連鎖の間のカントロビッチに着想を得た計量を定義する。
本稿では,従来の線形プログラミング手法よりも計算量が多くなることを示す。
論文 参考訳(メタデータ) (2023-03-30T11:26:40Z) - Efficient Parametric Approximations of Neural Network Function Space
Distance [6.117371161379209]
モデルパラメータとトレーニングデータの重要な特性をコンパクトに要約して、データセット全体を保存または/または反復することなく後で使用できるようにすることが、しばしば有用である。
我々は,FSD(Function Space Distance)をトレーニングセット上で推定することを検討する。
本稿では、線形化活性化TRick (LAFTR) を提案し、ReLUニューラルネットワークに対するFSDの効率的な近似を導出する。
論文 参考訳(メタデータ) (2023-02-07T15:09:23Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - Comparative Study Between Distance Measures On Supervised Optimum-Path
Forest Classification [0.0]
Optimum-Path Forest (OPF) はグラフベースの方法論と距離測度を使ってノード間の弧を作り、そのため木の集合を作る。
本研究は,オプティカム・パス林の森林分類に応用された広範囲な距離測定に関する比較研究を提案する。
論文 参考訳(メタデータ) (2022-02-08T13:34:09Z) - A Practical Index Structure Supporting Fr\'echet Proximity Queries Among
Trajectories [1.9335262420787858]
我々は、計算コストの高いメトリクスの下で、レンジと近隣クエリに$k$のスケーラブルなアプローチを提案する。
計量指標のクラスタリングに基づいて,軌跡数に線形な木構造を求める。
本研究では,多種多様な合成および実世界のデータセットに関する広範な実験により,本手法の有効性と有効性について分析する。
論文 参考訳(メタデータ) (2020-05-28T04:12:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。