論文の概要: Estimating the Performance of Entity Resolution Algorithms: Lessons
Learned Through PatentsView.org
- arxiv url: http://arxiv.org/abs/2210.01230v2
- Date: Mon, 17 Apr 2023 21:38:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 18:34:29.815631
- Title: Estimating the Performance of Entity Resolution Algorithms: Lessons
Learned Through PatentsView.org
- Title(参考訳): エンティティ解決アルゴリズムのパフォーマンスの推定: PatentsView.orgから学んだ教訓
- Authors: Olivier Binette, Sokhna A York, Emma Hickerson, Youngsoo Baek, Sarvo
Madhavan, Christina Jones
- Abstract要約: 本稿では,エンティティ・リゾリューション・アルゴリズムのための新しい評価手法を提案する。
これは米国特許商標庁の特許データ調査ツールであるPatentsView.orgによって動機付けられている。
- 参考スコア(独自算出の注目度): 3.8494315501944736
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a novel evaluation methodology for entity resolution
algorithms. It is motivated by PatentsView.org, a U.S. Patents and Trademarks
Office patent data exploration tool that disambiguates patent inventors using
an entity resolution algorithm. We provide a data collection methodology and
tailored performance estimators that account for sampling biases. Our approach
is simple, practical and principled -- key characteristics that allow us to
paint the first representative picture of PatentsView's disambiguation
performance. This approach is used to inform PatentsView's users of the
reliability of the data and to allow the comparison of competing disambiguation
algorithms.
- Abstract(参考訳): 本稿では,エンティティ解決アルゴリズムの新しい評価手法を提案する。
米国特許商標庁の特許データ調査ツールであるPatentsView.orgが、エンティティ解決アルゴリズムを用いて特許発明者を曖昧にしている。
サンプリングバイアスを考慮したデータ収集手法と性能推定器を提供する。
当社のアプローチはシンプルで実践的で原則的です -- patentsViewの曖昧なパフォーマンスの最初の代表的な絵を描くことができる重要な特徴です。
このアプローチは、PatentsViewのユーザにデータの信頼性を知らせ、競合する曖昧性アルゴリズムの比較を可能にするために使用される。
関連論文リスト
- Efficient Fairness-Performance Pareto Front Computation [51.558848491038916]
最適公正表現はいくつかの有用な構造特性を持つことを示す。
そこで,これらの近似問題は,凹凸プログラミング法により効率的に解けることを示す。
論文 参考訳(メタデータ) (2024-09-26T08:46:48Z) - Structural Representation Learning and Disentanglement for Evidential Chinese Patent Approval Prediction [19.287231890434718]
本稿では,検索に基づく分類手法を用いて,本課題の先駆的取り組みについて述べる。
本稿では,構造表現学習と絡み合いに着目したDiSPatという新しいフレームワークを提案する。
弊社のフレームワークは、特許承認の予測に関する最先端のベースラインを超越し、明確性の向上も示している。
論文 参考訳(メタデータ) (2024-08-23T05:44:16Z) - Provable Optimization for Adversarial Fair Self-supervised Contrastive Learning [49.417414031031264]
本稿では,自己教師型学習環境におけるフェアエンコーダの学習について検討する。
すべてのデータはラベル付けされておらず、そのごく一部だけが機密属性で注釈付けされている。
論文 参考訳(メタデータ) (2024-06-09T08:11:12Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - A Novel Patent Similarity Measurement Methodology: Semantic Distance and
Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。
自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。
本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T07:55:31Z) - Multivariate Systemic Risk Measures and Computation by Deep Learning
Algorithms [63.03966552670014]
本稿では,主観的最適度と関連するリスク割り当ての公平性に着目し,重要な理論的側面について論じる。
私たちが提供しているアルゴリズムは、予備項の学習、二重表現の最適化、およびそれに対応する公正なリスク割り当てを可能にします。
論文 参考訳(メタデータ) (2023-02-02T22:16:49Z) - Making Linear MDPs Practical via Contrastive Representation Learning [101.75885788118131]
マルコフ決定過程(MDP)における次元性の呪いに、低ランク表現を利用することで対処することが一般的である。
本稿では,効率的な表現学習を可能にしつつ,正規化を自動的に保証する線形MDPの代替的定義について考察する。
いくつかのベンチマークにおいて、既存の最先端モデルベースおよびモデルフリーアルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-14T18:18:02Z) - A Survey on Sentence Embedding Models Performance for Patent Analysis [0.0]
本稿では,PatentSBERTaアプローチに基づく埋め込みモデルの精度を評価するための標準ライブラリとデータセットを提案する。
patentSBERTa, Bert-for-patents, and TF-IDF Weighted Word Embeddings is the most accuracy for computing sentence embeddeds at the subclass level。
論文 参考訳(メタデータ) (2022-04-28T12:04:42Z) - Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。
手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。
この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-06T13:28:29Z) - Deep learning-based citation recommendation system for patents [5.376388266200792]
我々は,Google Big Queryサービスから約11万件の特許に関するテキスト情報とメタデータを含む,PatentNetという新しいデータセットを提案する。
従来の提案手法と比較して,提案手法はテストセット上での平均相反ランク0.2377を達成している。
論文 参考訳(メタデータ) (2020-10-21T12:18:21Z) - Fairness by Learning Orthogonal Disentangled Representations [50.82638766862974]
不変表現問題に対する新しい非絡み合い手法を提案する。
エントロピーによりセンシティブな情報に依存しない有意義な表現を強制する。
提案手法は5つの公開データセットで評価される。
論文 参考訳(メタデータ) (2020-03-12T11:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。