論文の概要: $\textit{Rank, Chunk and Expand}$: Lineage-Oriented Reasoning for Taxonomy Expansion
- arxiv url: http://arxiv.org/abs/2505.13282v1
- Date: Mon, 19 May 2025 16:06:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.719441
- Title: $\textit{Rank, Chunk and Expand}$: Lineage-Oriented Reasoning for Taxonomy Expansion
- Title(参考訳): $\textit{Rank, Chunk and Expand}$: 分類学拡張のための線形指向推論
- Authors: Sahil Mishra, Kumar Arjun, Tanmoy Chakraborty,
- Abstract要約: LORexは、効率的な分類学拡張のための識別的ランキングと生成的推論を組み合わせたプラグアンドプレイフレームワークである。
LORexの精度は12%向上し,Wu & Palmerの類似度は5%向上した。
- 参考スコア(独自算出の注目度): 17.673293240849787
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Taxonomies are hierarchical knowledge graphs crucial for recommendation systems, and web applications. As data grows, expanding taxonomies is essential, but existing methods face key challenges: (1) discriminative models struggle with representation limits and generalization, while (2) generative methods either process all candidates at once, introducing noise and exceeding context limits, or discard relevant entities by selecting noisy candidates. We propose LORex ($\textbf{L}$ineage-$\textbf{O}$riented $\textbf{Re}$asoning for Taxonomy E$\textbf{x}$pansion), a plug-and-play framework that combines discriminative ranking and generative reasoning for efficient taxonomy expansion. Unlike prior methods, LORex ranks and chunks candidate terms into batches, filtering noise and iteratively refining selections by reasoning candidates' hierarchy to ensure contextual efficiency. Extensive experiments across four benchmarks and twelve baselines show that LORex improves accuracy by 12% and Wu & Palmer similarity by 5% over state-of-the-art methods.
- Abstract(参考訳): 分類学は、レコメンデーションシステムやWebアプリケーションに不可欠な階層的な知識グラフである。
1)識別的モデルでは表現限界や一般化に苦しむ一方,(2) 生成的手法ではすべての候補を一度に処理し,ノイズを導入し,文脈制限を超過するか,あるいはノイズの多い候補を選択することによって関連エンティティを破棄する。
LORex ($\textbf{L}$ineage-$\textbf{O}$riented $\textbf{Re}$asoning for Taxonomy E$\textbf{x}$pansion は、識別的ランク付けと生成的推論を併用し、効率的な分類拡張を行うためのプラグアンドプレイフレームワークである。
従来の方法とは異なり、LORexは候補項を分類してバッチに分類し、ノイズをフィルタリングし、候補階層を推論して選択を反復的に精製し、文脈的効率を確保する。
4つのベンチマークと12のベースラインにわたる大規模な実験により、LORexは精度を12%向上し、Wu & Palmerは最先端の手法よりも5%向上した。
関連論文リスト
- VR-RAG: Open-vocabulary Species Recognition with RAG-Assisted Large Multi-Modal Models [33.346206174676794]
オープン・ボキャブラリ・バードの種認識に重点を置いており、その目的は、その記述に基づいて種を分類することである。
CUB-200-2011のような伝統的なベンチマークは、クローズド語彙パラダイムで評価されている。
設定条件下での評価における現在のシステムの性能は、オープン語彙のドロップと密接に一致していることが、大きなマージンで示されている。
論文 参考訳(メタデータ) (2025-05-08T20:33:31Z) - QuanTaxo: A Quantum Approach to Self-Supervised Taxonomy Expansion [17.865428778692557]
分類学拡張のための革新的な量子インスパイアされたフレームワークであるQuanTaxoを紹介する。
QuanTaxo は古典的な埋め込みモデルよりも優れていることを示す。
また,広範囲なアブレーションとケーススタディを通じてQuanTaxoの優位性を強調した。
論文 参考訳(メタデータ) (2025-01-23T18:40:02Z) - Bidirectional Logits Tree: Pursuing Granularity Reconcilement in Fine-Grained Classification [89.20477310885731]
本稿では,粒度分類タスクにおけるグラニュラリティコンペティションの課題について述べる。
既存のアプローチは通常、共通のベースエンコーダから抽出された共有特徴に基づいて、独立した階層認識モデルを開発する。
グラニュラリティ再構成のための双方向ロジットツリー(BiLT)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-17T10:42:19Z) - CodeTaxo: Enhancing Taxonomy Expansion with Limited Examples via Code Language Prompts [40.52605902842168]
textscCodeTaxoは、コード言語プロンプトを通じて大きな言語モデルを活用する新しいアプローチである。
異なるドメインの5つの実世界のベンチマークの実験では、textscCodeTaxoはすべての評価指標に対して一貫して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-08-17T02:15:07Z) - AGRaME: Any-Granularity Ranking with Multi-Vector Embeddings [53.78802457488845]
我々は,多ベクトル埋め込みを利用して粒度の異なるレベルにランク付けする,任意の粒度ランキングの考え方を紹介した。
検索強化世代におけるポストホック励振付加への命題レベルのランク付けの適用を実証する。
論文 参考訳(メタデータ) (2024-05-23T20:04:54Z) - Chain-of-Layer: Iteratively Prompting Large Language Models for Taxonomy Induction from Limited Examples [34.88498567698853]
Chain-of-Layerは、特定のエンティティセットから誘導されるように設計された、コンテキスト学習フレームワークである。
実世界の4つのベンチマークにおいて,Chain-of-Layerが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-02-12T03:05:54Z) - IDEAL: Influence-Driven Selective Annotations Empower In-Context
Learners in Large Language Models [66.32043210237768]
本稿では,影響駆動型選択的アノテーション手法を提案する。
アノテーションのコストを最小限に抑えつつ、コンテキスト内サンプルの品質を向上させることを目的としている。
様々なベンチマークで提案手法の優位性を確認する実験を行った。
論文 参考訳(メタデータ) (2023-10-16T22:53:54Z) - Towards Visual Taxonomy Expansion [50.462998483087915]
本稿では,分類拡張タスクに視覚的特徴を導入し,VTE(Visual Taxonomy Expansion)を提案する。
テキストと視覚のセマンティクスをクラスタリングするためのテキストハイパーネミー学習タスクとビジュアルプロトタイプ学習タスクを提案する。
提案手法を2つのデータセットで評価し,有意な結果を得た。
論文 参考訳(メタデータ) (2023-09-12T10:17:28Z) - Producing Usable Taxonomies Cheaply and Rapidly at Pinterest Using
Discovered Dynamic $\mu$-Topics [7.937868672569834]
我々は、ピインセプションを用いた興味の分類を作成するための新しいアプローチを提案する。
発見プロセス自体は、これらの$mu$-topicsを、関連するクエリ、ピン、ユーザと動的に接続する。
ピンセプトは、ユーザーの興味のすべての領域をカバーし、ユーザーの興味の特異性を自動的に調整し、様々な種類の分類学を作成するのに適している。
論文 参考訳(メタデータ) (2023-01-29T19:27:08Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - TaxoEnrich: Self-Supervised Taxonomy Completion via Structure-Semantic
Representations [28.65753036636082]
本稿では,既存の分類学における意味的特徴と構造的情報の両方を効果的に活用する新しい分類学補完フレームワークを提案する。
分類エンリッチは,(1)概念の意味的意味と分類学的関係を,強力な事前学習言語モデルに基づいて組み込んだ分類記述型埋め込み,(2)分類の構造情報を符号化して候補位置表現を学習する分類認識シーケンシャルエンコーダの4つの構成要素から構成される。
異なるドメインからの4つの大規模な実世界のデータセットの実験は、TaxoEnrichがすべての評価指標の中で最高のパフォーマンスを達成し、過去の最先端よりも大きなマージンでパフォーマンスを向上していることを示している。
論文 参考訳(メタデータ) (2022-02-10T08:10:43Z) - Can Taxonomy Help? Improving Semantic Question Matching using Question
Taxonomy [37.57300969050908]
セマンティックな質問マッチングのためのハイブリッド手法を提案する。
深層学習に基づく質問から得られた質問クラスで最先端のディープラーニングモデルを強化することにより、提案された2層分類を英語の質問に使用します。
論文 参考訳(メタデータ) (2021-01-20T16:23:04Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - Deep Learning feature selection to unhide demographic recommender
systems factors [63.732639864601914]
行列分解モデルは意味的知識を含まない因子を生成する。
DeepUnHideは、協調フィルタリングレコメンデータシステムにおいて、ユーザとアイテムファクタから、人口統計情報を抽出することができる。
論文 参考訳(メタデータ) (2020-06-17T17:36:48Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。