論文の概要: Selection, Not Salience: The Shape and Limits of Personalization in Social Highlighting
- arxiv url: http://arxiv.org/abs/2606.10398v1
- Date: Tue, 09 Jun 2026 04:18:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.316947
- Title: Selection, Not Salience: The Shape and Limits of Personalization in Social Highlighting
- Title(参考訳): 選択とサリエンス : 社会的ハイライトにおけるパーソナライゼーションの形状と限界
- Authors: Kazuki Nakayashiki, Keisuke Watanabe,
- Abstract要約: 読み上げ高度にまたがるパーソナライゼーションの形状と限界をマッピングする。
測定可能なパーソナライズは主に選択層に現れる。
共有されたサリエンス層を超えて行くことは、個人を集約することによってより良くアプローチされる。
- 参考スコア(独自算出の注目度): 1.8620637029128544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Does personalizing what a reader sees pay off, and where does it stop? Using a social web highlighter and a co-readership identity control (the same document highlighted by many users, which holds document and topic fixed and asks whether a person's own history predicts their marks better than another reader's does), we map the shape and limits of personalization across reading altitudes. At the document altitude we give the clean, leakage-free, identity-controlled measurement that prior next-document evaluations could only upper-bound: a person's history identifies which documents in a co-reading neighborhood are theirs, with an own-versus-other gap of +0.169 against community negatives and +0.119 against topic-matched hard negatives (both highly significant); a content-based arm suggests the signal is not purely title-driven but is largely thematic. This is comparable to the span-level selection signal (+0.14) from our prior work: the selection signal is of comparable magnitude across altitudes (+0.12 to +0.17), most of it stable topic preference. At the sentence altitude, a two-stage personalized auto-highlight (an impersonal model proposes candidates, a personal model re-ranks them) does not improve on its impersonal baseline: two off-the-shelf zero-shot LLMs, including a frontier model, predict highlight locations worse than a lead baseline, and personal re-ranking is beaten by the salience order even on the highest-recall candidate pool, so the null is not merely a Stage-1 ceiling artifact. Measurable personalization appears primarily at the selection layer: modest (~+0.13), topic-dominated, with no reliable gain at the salience layer. We also surface a control-in-negatives bias that inflated our document gap to a spurious +0.227 until audited. Going beyond the shared salience layer may be better approached by aggregating individuals than by personalizing them harder.
- Abstract(参考訳): 読者の支払いをパーソナライズし、どこで止まるのか?
ソーシャル・ウェブ・ハイライトとコリーダーシップ・アイデンティティ・コントロール(多くのユーザが強調するのと同じ文書で、文書やトピックを固定し、自分の履歴が他の読者よりも良いマークを予測できるかを尋ねる)を用いて、読み上げ高度におけるパーソナライゼーションの形状と限界をマップする。
文書の高度では、次の文書の事前評価が上向きにしかできない、クリーンでリークのないアイデンティティ制御された測定値を与える: 人の歴史は、共読地区のどの文書が彼らのものであるかを識別する。
これは、我々の以前の研究のスパンレベル選択信号(+0.14)に匹敵するものであり、選択信号は高度(+0.12から+0.17)で同等の大きさである。
文高では、2段階のパーソナライズされたオートハイライト(個人モデルは候補を提案するが、個人モデルはそれらを再ランクする)は、その非対人ベースラインを改善しない:フロンティアモデルを含む2つのオフ・ザ・シェルフゼロショットLCMは、リードベースラインよりも悪いハイライト位置を予測し、トップリコール候補プールでも個人再ランクはサリエンスオーダーによって打ち負かされるため、ヌルは単にステージ1天井アーティファクトではない。
測定可能なパーソナライゼーションは、主に選択層に現れる: モデスト(~+0.13)、トピックが支配的であり、サリエンス層では確実な利得がない。
また、監査まで文書ギャップを+0.227に膨らませるコントロール・イン・負のバイアスも生じました。
共有されたサリエンス層を超えて行くことは、個人を人格化することよりも、個人を集約することでアプローチする方がよいかもしれない。
関連論文リスト
- Personal Salience: Highlighting Is Social, but Individuality Lives in Selection [1.8620637029128544]
我々は、ある人の履歴が他の読者よりも自分の目印を予測できるかどうかを問う。
我々は、一般的なサリエンス(構造)、群衆サリエンス(他者がマークしたもの)、個人サリエンス(個人残量)を分離する。
私たちの結果はリークフリーで、密集した群衆を使い、モデルマッチングコントロールを使用します。
論文 参考訳(メタデータ) (2026-06-08T04:44:51Z) - Let the Results Speak: A Replication-First Paradigm for LLM Behavioral Benchmarking [22.825786049667602]
本稿では,1つのヒト・ラタのコンセンサスに有効性を確保するために,複製第一パラダイムを提案する。
楽器を4つの特性で認証する - Kランの信頼性、アーキテクチャ的に異なる審査員間のクロスインストラクトレプリケーション、以前のトレーニングコホートからの審査員による歴史的フットプリントキャリブレーション、事前登録された予測。
本研究は, 自己発達型データ駆動による情緒的伴奏で, 次元は事前に決められず, 手順は9次元に安定化する。
論文 参考訳(メタデータ) (2026-05-27T03:41:11Z) - NearID: Identity Representation Learning via Near-identity Distractors [116.71529576796605]
既存のビジョンエンコーダは、オブジェクトのアイデンティティを背景コンテキストと絡み合わせることで、信頼性の低い表現やメトリクスを生み出します。
我々は、この脆弱性に対処するための最初の原則付きフレームワークをNear-identity distractorsを使って紹介する。
我々は、厳密なマージンベースの評価プロトコルとともに、NearIDデータセット(19KのID、316Kの一致したコンテキストインタプリタ)を提示する。
論文 参考訳(メタデータ) (2026-04-02T12:33:14Z) - Large-scale online deanonymization with LLMs [58.46277616551135]
大規模なデ匿名化を実現するために,大規模言語モデルを用いることができることを示す。
当社のエージェントは、完全なインターネットアクセスによって、Hacker NewsユーザーとHistropic Interviewer参加者を高精度に識別することができる。
論文 参考訳(メタデータ) (2026-02-18T19:02:50Z) - CLUE: Non-parametric Verification from Experience via Hidden-State Clustering [64.50919789875233]
隠れアクティベーションの軌跡内の幾何的に分離可能なシグネチャとして解の正しさが符号化されていることを示す。
ClUE は LLM-as-a-judge ベースラインを一貫して上回り、候補者の再選において近代的な信頼に基づく手法に適合または超えている。
論文 参考訳(メタデータ) (2025-10-02T02:14:33Z) - Is Active Persona Inference Necessary for Aligning Small Models to Personal Preferences? [16.12440288407791]
人気のトレンドは、現在のユーザの会話にプレフィックスを追加して、好みの配布を操ることである。
ほとんどのメソッドは、前の例の選好ペアで個人的な選好を受動的にモデル化する。
モデルが嗜好記述を積極的に推測する利点があるかどうかを問う。
次に、微調整された1-8Bサイズのモデルが、個人の好みを推測し調整する上で、いかに効果的かをテストする。
論文 参考訳(メタデータ) (2025-05-19T15:39:48Z) - Uncovering the Sociodemographic Fabric of Reddit [5.915947588383603]
本稿では,Reddit上での社会デマログラフ推論の原理的枠組みを紹介する。
我々は、年齢、性別、およびパルチザン関連に関する85万以上のユーザー自己宣言を活用している。
ROC AUCでは,最先端の分類性能を最大19%向上させる。
論文 参考訳(メタデータ) (2025-02-07T16:11:39Z) - Dissecting Human and LLM Preferences [80.55271307662365]
人間は誤りに敏感ではなく、自分の姿勢を支持する反応を好んでおり、モデルが限界を認めている場合、明確な嫌悪を示します。
GPT-4-Turboのような先進的なLCMは、より正確さ、明快さ、無害さを強調している。
嗜好に基づく評価は意図的に操作可能であることを示す。
論文 参考訳(メタデータ) (2024-02-17T14:34:31Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。