論文の概要: Beyond Single-Score Ranking: Facet-Aware Reranking for Controllable Diversity in Paper Recommendation
- arxiv url: http://arxiv.org/abs/2604.16329v1
- Date: Wed, 11 Mar 2026 07:55:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.891877
- Title: Beyond Single-Score Ranking: Facet-Aware Reranking for Controllable Diversity in Paper Recommendation
- Title(参考訳): シングルスコアランキングを超えて:紙レコメンデーションにおける制御可能な多様性のためのFacet-Awareのランク付け
- Authors: Duan Ming Tao,
- Abstract要約: SciFACE(SciFACE)は、2つの独立した側面をモデル化するフレームワークで、背景(どのような問題を研究するか)と方法(どのように解決するか)をモデル化する。
CSFでは、SciFACEはバックグラウンドで70.63 NDCG@20(SPECTERより5.9ポイント)、メソッド上で49.06 NDCG@20(SPECTERより31.1ポイント)に達する。
励振前訓練のないFaBLEと比較して、SciFACEは5,891個のラベル付きペアと40K個の合成オーグメンテーションを併用しながら、メソッドNDCG@20を4.1ポイント改善する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current paper recommendation systems output a single similarity score that mixes different notions of relatedness, so users cannot specify why papers should be similar. We present SciFACE (Scientific Faceted Cross-Encoder), a reranking framework that models two independent facets: Background (what problem is studied) and Method (how it is solved). SciFACE trains two separate cross-encoders on 5,891 real seed-candidate paper pairs labeled by GPT-4o-mini with facet-specific criteria and validated against human judgments. On CSFCube, SciFACE reaches 70.63 NDCG@20 on Background (5.9 points above SPECTER) and 49.06 NDCG@20 on Method (31.1 points above SPECTER), competitive with state-of-the-art results. Compared with FaBLE without citation pre-training, SciFACE improves Method NDCG@20 by 4.1 points while using 5,891 labeled pairs versus 40K synthetic augmentations. These results show that high-quality grounded facet labels can be more data-efficient than large-scale synthetic augmentation for learning fine-grained scientific similarity.
- Abstract(参考訳): 現在の論文推薦システムは,関連性の異なる概念を混合した単一の類似度スコアを出力する。
本稿では,SciFACE(Scientific Faceted Cross-Encoder)について述べる。
SciFACEは、GPT-4o-miniでラベル付けされた5,891個の実種候補紙対に2つの異なるクロスエンコーダを訓練し、人間の判断に対して検証した。
CSFCubeでは、SciFACEはバックグラウンドで70.63 NDCG@20(SPECTERより5.9ポイント)、メソッド上で49.06 NDCG@20(SPECTERより31.1ポイント)に達し、最先端の結果と競合する。
励振前訓練のないFaBLEと比較して、SciFACEは5,891個のラベル付きペアと40K個の合成オーグメンテーションを併用しながら、メソッドNDCG@20を4.1ポイント改善する。
これらの結果から, 高品質な接地ファセットラベルは, 微細な科学的類似性を学習するための大規模合成拡張よりも, よりデータ効率が高いことが示された。
関連論文リスト
- SciCoQA: Quality Assurance for Scientific Paper--Code Alignment [53.70401063640645]
SciCoQAは,学術出版物と論文の相違を検出するためのデータセットである。
我々のデータセットは611の紙コード不一致(81のリアル、530の合成)で構成されており、様々な計算科学分野にまたがっている。
評価における最高の性能モデルである GPT-5 は、実世界の紙コード差の45.7%しか検出できない。
論文 参考訳(メタデータ) (2026-01-19T10:04:33Z) - RPC-Bench: A Fine-grained Benchmark for Research Paper Comprehension [65.81339691942757]
RPC-Bench(RPC-Bench)は、高品質なコンピュータサイエンス論文のレビュー・リビューの交換から構築された大規模質問応答ベンチマークである。
我々は、科学研究の流れに沿ったきめ細かい分類を設計し、モデルがなぜ、何、どのように学術的な文脈で質問するかを理解し、答える能力を評価する。
論文 参考訳(メタデータ) (2026-01-14T11:37:00Z) - AGNES: Adaptive Graph Neural Network and Dynamic Programming Hybrid Framework for Real-Time Nanopore Seed Chaining [0.0]
ナノ孔シークエンシングにより、リアルタイムの長読DNAシークエンシングが可能で、読み取りは10キロ塩基を超える。
12~15パーセントの固有エラー率は、リードアライメントにおいて重要な計算上の課題を提示する。
本稿では,グラフニューラルネットワークと古典動的プログラミングを組み合わせた適応型シードチェインのためのハイブリッドフレームワークRawHash3を提案する。
論文 参考訳(メタデータ) (2025-10-15T08:05:43Z) - NAIPv2: Debiased Pairwise Learning for Efficient Paper Quality Estimation [58.30936615525824]
本稿では,紙の品質評価のための非バイアスで効率的なフレームワークであるNAIPv2を提案する。
NAIPv2は、レビューアレーティングの不整合を低減するために、ドメイン年グループ内でペアワイズ学習を採用している。
これはペアワイズ比較に基づいてトレーニングされるが、デプロイ時に効率的なポイントワイズ予測を可能にする。
論文 参考訳(メタデータ) (2025-09-29T17:59:23Z) - GANDiff FR: Hybrid GAN Diffusion Synthesis for Causal Bias Attribution in Face Recognition [0.0]
GANDiff FRは、人口動態や環境要因を正確に制御し、再現可能な厳密さで偏見を計測し、説明し、低減する最初の合成フレームワークである。
我々は5つのコホートにまたがる1万の人種的バランスのとれた顔を、自動検出と人的レビューによって合成する。
一致する操作ポイントの下でArcFace、CosFace、AdaFaceをベンチマークすると、AdaFaceはグループ間のTPR格差を60%削減する。
GANDiff FR は、純粋な GAN と比較して約20%の計算オーバーヘッドがあるにもかかわらず、3倍の属性条件付き変種が得られる。
論文 参考訳(メタデータ) (2025-08-15T09:05:57Z) - Evaluating Hybrid Retrieval Augmented Generation using Dynamic Test Sets: LiveRAG Challenge [8.680958290253914]
本稿では,動的テストセット上での検索強化生成システム(RAG)の評価を行うLiveRAG Challenge 2025を提案する。
我々の最後のハイブリッドアプローチはスパース (BM25) と高密度 (E5) の検索手法を組み合わせたものである。
RankLLaMA を用いたニューラルリランクでは MAP は0.523 から 0.797 に向上するが,計算コストは禁忌である。
論文 参考訳(メタデータ) (2025-06-27T21:20:43Z) - JointMatch: A Unified Approach for Diverse and Collaborative
Pseudo-Labeling to Semi-Supervised Text Classification [65.268245109828]
半教師付きテキスト分類(SSTC)は、ラベルのないデータを活用する能力によって注目を集めている。
擬似ラベルに基づく既存のアプローチは、擬似ラベルバイアスと誤り蓄積の問題に悩まされる。
我々は、最近の半教師付き学習からアイデアを統一することでこれらの課題に対処する、SSTCの総合的なアプローチであるJointMatchを提案する。
論文 参考訳(メタデータ) (2023-10-23T05:43:35Z) - MarginMatch: Improving Semi-Supervised Learning with Pseudo-Margins [73.17295479535161]
MarginMatchは、一貫性の正規化と擬似ラベルを組み合わせた新しいSSLアプローチである。
トレーニングが進むにつれて、擬似ラベル付きモデル上でのモデルの振る舞いを分析し、低品質な予測が隠蔽されることを確かめる。
CIFAR-100では,クラス毎に25ラベル,STL-10では3.78%,クラス毎に4ラベルで3.25%の誤差率向上を実現した。
論文 参考訳(メタデータ) (2023-08-17T15:19:04Z) - Label-Aware Hyperbolic Embeddings for Fine-grained Emotion
Classification [11.973115466838717]
きめ細かい感情分類(FEC)は難しい課題である。
FECはラベル間の微妙なニュアンスを扱う必要がある。
既存のモデルの多くはユークリッド空間におけるテキスト分類の問題にのみ対応している。
ハイプエモ(HypEmo)は, ハイプエモ(HypEmo)という, ハイプエモ(HypEmo)という, ハイプエモ(HypEmo)という, ハイプエモ(HypEmo)という, ハイプエモ(HypEmo
論文 参考訳(メタデータ) (2023-06-26T16:28:33Z) - Blind Face Restoration: Benchmark Datasets and a Baseline Model [63.053331687284064]
Blind Face Restoration (BFR) は、対応する低品質 (LQ) 入力から高品質 (HQ) の顔画像を構築することを目的としている。
EDFace-Celeb-1M (BFR128) と EDFace-Celeb-150K (BFR512) と呼ばれる2つのブラインドフェイス復元ベンチマークデータセットを最初に合成する。
最先端の手法は、ブラー、ノイズ、低解像度、JPEG圧縮アーティファクト、それらの組み合わせ(完全な劣化)の5つの設定でベンチマークされる。
論文 参考訳(メタデータ) (2022-06-08T06:34:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。