論文の概要: Deep learning-based citation recommendation system for patents
- arxiv url: http://arxiv.org/abs/2010.10932v1
- Date: Wed, 21 Oct 2020 12:18:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 22:57:27.817071
- Title: Deep learning-based citation recommendation system for patents
- Title(参考訳): 深層学習に基づく特許の引用推薦システム
- Authors: Jaewoong Choi, Sion Jang, Jaeyoung Kim, Jiho Lee, Janghyeok Yoona,
Sungchul Choi
- Abstract要約: 我々は,Google Big Queryサービスから約11万件の特許に関するテキスト情報とメタデータを含む,PatentNetという新しいデータセットを提案する。
従来の提案手法と比較して,提案手法はテストセット上での平均相反ランク0.2377を達成している。
- 参考スコア(独自算出の注目度): 5.376388266200792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this study, we address the challenges in developing a deep learning-based
automatic patent citation recommendation system. Although deep learning-based
recommendation systems have exhibited outstanding performance in various
domains (such as movies, products, and paper citations), their validity in
patent citations has not been investigated, owing to the lack of a freely
available high-quality dataset and relevant benchmark model. To solve these
problems, we present a novel dataset called PatentNet that includes textual
information and metadata for approximately 110,000 patents from the Google Big
Query service. Further, we propose strong benchmark models considering the
similarity of textual information and metadata (such as cooperative patent
classification code). Compared with existing recommendation methods, the
proposed benchmark method achieved a mean reciprocal rank of 0.2377 on the test
set, whereas the existing state-of-the-art recommendation method achieved
0.2073.
- Abstract(参考訳): 本研究では,ディープラーニングに基づく自動特許引用システム開発における課題に対処する。
深層学習に基づくレコメンデーションシステムは、様々な分野(映画、製品、論文引用など)で優れた性能を発揮してきたが、高品質なデータセットと関連するベンチマークモデルがないため、特許引用の妥当性は調査されていない。
これらの問題を解決するために,Google Big Queryサービスから約11万件の特許に関するテキスト情報とメタデータを含む,PatentNetという新しいデータセットを提案する。
さらに,テキスト情報とメタデータ(協調特許分類コードなど)の類似性を考慮した強力なベンチマークモデルを提案する。
従来の推奨手法と比較して,提案手法はテストセットの平均相反ランク0.2377を達成し,既存の推奨手法は0.2073を達成した。
関連論文リスト
- Embedding in Recommender Systems: A Survey [67.67966158305603]
重要な側面は、ユーザやアイテムIDといった高次元の離散的な特徴を低次元連続ベクトルに包含する技法である。
埋め込み技術の適用は複雑なエンティティ関係を捉え、かなりの研究を刺激している。
この調査では、協調フィルタリング、自己教師付き学習、グラフベースのテクニックなどの埋め込み手法を取り上げている。
論文 参考訳(メタデータ) (2023-10-28T06:31:06Z) - Impression-Aware Recommender Systems [57.38537491535016]
新たなデータソースは、レコメンデーションシステムの品質を改善する新しい機会をもたらす。
研究者はインプレッションを使ってユーザーの好みを洗練させ、推奨システム研究の現在の制限を克服することができる。
本稿ではインプレッションを用いたレコメンデーションシステムに関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-08-15T16:16:02Z) - Improving Recommendation Relevance by simulating User Interest [77.34726150561087]
不活発な項目のランクを反復的に減らすことにより、リコメンデーション"レコメンデーション"が、簡単かつ透過的に維持可能であることを観察する。
この研究の背景にある基本的なアイデアは、オンラインレコメンデーションシステムの文脈で特許を取得している。
論文 参考訳(メタデータ) (2023-02-03T03:35:28Z) - Estimating the Performance of Entity Resolution Algorithms: Lessons
Learned Through PatentsView.org [3.8494315501944736]
本稿では,エンティティ・リゾリューション・アルゴリズムのための新しい評価手法を提案する。
これは米国特許商標庁の特許データ調査ツールであるPatentsView.orgによって動機付けられている。
論文 参考訳(メタデータ) (2022-10-03T21:06:35Z) - Tag-Aware Document Representation for Research Paper Recommendation [68.8204255655161]
本稿では,ユーザによって割り当てられたソーシャルタグに基づいて,研究論文の深い意味表現を活用するハイブリッドアプローチを提案する。
提案手法は,評価データが極めて少ない場合でも研究論文の推薦に有効である。
論文 参考訳(メタデータ) (2022-09-08T09:13:07Z) - The Harvard USPTO Patent Dataset: A Large-Scale, Well-Structured, and
Multi-Purpose Corpus of Patent Applications [8.110699646062384]
ハーバードUSPTO特許データセット(HUPD)について紹介する。
450万件以上の特許文書があり、HUPDは同等のコーパスの2倍から3倍の大きさだ。
各アプリケーションのメタデータとすべてのテキストフィールドを提供することで、このデータセットは研究者が新しいNLPタスクセットを実行することを可能にする。
論文 参考訳(メタデータ) (2022-07-08T17:57:15Z) - A Survey on Sentence Embedding Models Performance for Patent Analysis [0.0]
本稿では,PatentSBERTaアプローチに基づく埋め込みモデルの精度を評価するための標準ライブラリとデータセットを提案する。
patentSBERTa, Bert-for-patents, and TF-IDF Weighted Word Embeddings is the most accuracy for computing sentence embeddeds at the subclass level。
論文 参考訳(メタデータ) (2022-04-28T12:04:42Z) - Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。
手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。
この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-06T13:28:29Z) - TTRS: Tinkoff Transactions Recommender System benchmark [62.997667081978825]
TTRS - Tinkoff Transactions Recommender Systemベンチマークを示す。
この金融取引ベンチマークには、約1万人のユーザーと、14ヶ月で1000以上の商業ブランドの間で200万以上のインタラクションが含まれている。
また,現在普及しているRecSys手法を次の期間の推薦タスクで総合的に比較し,その性能を様々な指標や推奨目標に対して詳細に分析する。
論文 参考訳(メタデータ) (2021-10-11T20:04:07Z) - Learning Neural Textual Representations for Citation Recommendation [7.227232362460348]
サブモジュラースコアリング機能において,シームズとトリプルトネットワークを併用した文書(センテンス-BERT)の深部表現を用いた引用推薦手法を提案する。
我々の知る限りでは、これは引用推薦のタスクに対して、ディープ表現とサブモジュラー選択を組み合わせるための最初のアプローチである。
論文 参考訳(メタデータ) (2020-07-08T12:38:50Z) - PONE: A Novel Automatic Evaluation Metric for Open-Domain Generative
Dialogue Systems [48.99561874529323]
オープンドメイン生成対話システムの評価には3つの方法がある。
体系的な比較が欠如しているため、どの指標がより効果的であるかは明らかでない。
本稿では,人間の判断との相関性を大幅に改善できる,新しい,実現可能な学習基準を提案する。
論文 参考訳(メタデータ) (2020-04-06T04:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。