論文の概要: Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval
- arxiv url: http://arxiv.org/abs/2506.13496v2
- Date: Tue, 17 Jun 2025 19:39:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-19 13:10:45.371103
- Title: Hierarchical Multi-Positive Contrastive Learning for Patent Image Retrieval
- Title(参考訳): 特許画像検索のための階層型多目的コントラスト学習
- Authors: Kshitij Kavimandan, Angelos Nalmpantis, Emma Beauxis-Aussalet, Robert-Jan Sips,
- Abstract要約: 特許画像は、特許のイノベーションに関する情報を伝える技術図である。
現在の方法は、ロカルノ国際分類システムで定義されたような特許の階層的関係を無視している。
検索プロセスにおいて,その関係を導き出すために,LISPの分類を利用した階層的多陽性のコントラスト損失を導入する。
- 参考スコア(独自算出の注目度): 0.2970959580204573
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patent images are technical drawings that convey information about a patent's innovation. Patent image retrieval systems aim to search in vast collections and retrieve the most relevant images. Despite recent advances in information retrieval, patent images still pose significant challenges due to their technical intricacies and complex semantic information, requiring efficient fine-tuning for domain adaptation. Current methods neglect patents' hierarchical relationships, such as those defined by the Locarno International Classification (LIC) system, which groups broad categories (e.g., "furnishing") into subclasses (e.g., "seats" and "beds") and further into specific patent designs. In this work, we introduce a hierarchical multi-positive contrastive loss that leverages the LIC's taxonomy to induce such relations in the retrieval process. Our approach assigns multiple positive pairs to each patent image within a batch, with varying similarity scores based on the hierarchical taxonomy. Our experimental analysis with various vision and multimodal models on the DeepPatent2 dataset shows that the proposed method enhances the retrieval results. Notably, our method is effective with low-parameter models, which require fewer computational resources and can be deployed on environments with limited hardware.
- Abstract(参考訳): 特許画像は、特許のイノベーションに関する情報を伝える技術図である。
特許画像検索システムは,膨大なコレクションを検索し,最も関連性の高い画像を検索することを目的としている。
近年の情報検索の進歩にもかかわらず、特許画像は技術的な複雑さと複雑な意味情報のために依然として重大な課題を呈しており、ドメイン適応のために効率的な微調整を必要としている。
現在の方法では、ロカルノ国際分類(lic)システムで定義されたような、特許の階層的な関係を無視しており、それは、広範囲のカテゴリ(例えば、"furnishing")をサブクラス(例、"seats"、"beds")に分類し、さらに特定の特許設計に分類するものである。
本研究では,その検索過程において,その関係を導き出すために,LISPの分類を利用した階層的マルチ陽性のコントラスト損失を導入する。
提案手法では,各特許画像に複数の正のペアをバッチ内に割り当て,階層的分類に基づく類似度スコアが変化する。
DeepPatent2データセットを用いた様々な視覚モデルとマルチモーダルモデルによる実験結果から,提案手法が検索結果を向上することを示す。
特に,本手法は,少ない計算資源を必要とせず,限られたハードウェアで環境に展開できる低パラメータモデルで有効である。
関連論文リスト
- Patent Figure Classification using Large Vision-language Models [7.505532091249881]
大規模視覚言語モデル (LVLM) は、多くのコンピュータビジョンの下流タスクにおいて大きなパフォーマンスを示している。
本稿では,特許図形視覚質問応答(VQA)と分類におけるLVLMの有効性について検討し,ゼロショットと少数ショットの学習シナリオに着目した。
LVLMを用いた多数のクラスを計算効率よく処理するために,新しいトーナメントスタイルの分類戦略を提案する。
論文 参考訳(メタデータ) (2025-01-22T09:39:05Z) - Large Language Model Informed Patent Image Retrieval [0.0]
本稿では,特許画像特徴学習のための言語インフォームドな分散型マルチモーダルアプローチを提案する。
提案手法は, mAP +53.3%, Recall@10 +41.8%, MRR@10 +51.9%による画像に基づく特許検索において, 最先端ないし同等の性能を実現する。
論文 参考訳(メタデータ) (2024-04-30T08:45:16Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification [26.85734804493925]
本稿では,特許分類に関する特許に関する情報を包括的に検討する統合フレームワークを提案する。
まず,その意味表現を導出するためのICC符号相関学習モジュールを提案する。
最後に、IPC符号のセマンティクスを含む特許文書の文脈情報と、予測を行うために利用者のシーケンシャルな選好を割り当てる。
論文 参考訳(メタデータ) (2023-08-10T07:02:24Z) - Event-based Dynamic Graph Representation Learning for Patent Application
Trend Prediction [45.0907126466271]
本稿では,特許出願傾向予測のためのイベントベースのグラフ学習フレームワークを提案する。
特に,当社の手法は,企業および特許分類コードの両方の記憶可能な表現に基づいて構築されている。
論文 参考訳(メタデータ) (2023-08-04T05:43:32Z) - Classification of Visualization Types and Perspectives in Patents [9.123089032348311]
我々は、特許画像の可視化タイプと視点の分類に最先端のディープラーニング手法を採用する。
我々は、画像の観点から弱いラベル付きデータを提供するデータセットから、階層的な一連のクラスを導出する。
論文 参考訳(メタデータ) (2023-07-19T21:45:07Z) - Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。
本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。
提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文 参考訳(メタデータ) (2023-05-20T17:01:52Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。