論文の概要: Personal Salience: Highlighting Is Social, but Individuality Lives in Selection
- arxiv url: http://arxiv.org/abs/2606.09024v1
- Date: Mon, 08 Jun 2026 04:44:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.698188
- Title: Personal Salience: Highlighting Is Social, but Individuality Lives in Selection
- Title(参考訳): 個人のサリエンス:ハイライトは社会的だが、個人は選択に生きている
- Authors: Kazuki Nakayashiki, Keisuke Watanabe,
- Abstract要約: 我々は、ある人の履歴が他の読者よりも自分の目印を予測できるかどうかを問う。
我々は、一般的なサリエンス(構造)、群衆サリエンス(他者がマークしたもの)、個人サリエンス(個人残量)を分離する。
私たちの結果はリークフリーで、密集した群衆を使い、モデルマッチングコントロールを使用します。
- 参考スコア(独自算出の注目度): 1.8620637029128544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social highlighters let people mark passages that matter to them. We ask how much of an individual is recoverable from these naturalistic traces, using a co-readership identity control (the same document highlighted by many users) that holds document and topic fixed and asks whether a person's own history predicts their marks better than another reader's does. We separate generic salience (structure), crowd salience (what others marked), and personal salience (the individual residual). First, highlighting is social: which sentences you mark is predicted far better by the crowd than by structure or by a personal model, and even a well-estimated crowd, an information-privileged baseline that sees others' marks on the same document, beats a frontier LLM twin built from your other-document history; the within-document personal signal is at most a whisper (own-vs-other gap +0.017 by an embedding scorer, small but significant). Second, in sharp contrast, individuality lives in selection: asked which of the already-salient passages are yours, your own history is a strong, leakage-free predictor (gap +0.14). A topic decomposition shows this is largely stable thematic preference: it shrinks ~6-8x against a topically-matched peer, and a thin residual cannot be separated from finer topic. The non-obvious part is an asymmetry: under the same scorer the individual signal is ~6-8x weaker in salience than in selection. Methodologically, naive history-conditioning evaluations leak (the target's own marks enter the profile in ~42% of pairs, inflating personal scores by up to +0.15 AP) and small crowds overstate personalization; our results are leakage-free, use a dense crowd, and a model-matched control. Highlights carry a genuine individual signature, but a thin layer over a strong shared one, surfacing far more in which salient things a person selects than in what is salient.
- Abstract(参考訳): ソーシャルなハイライトは、自分にとって重要な通路をマークできる。
このような自然主義的トレースから、どれだけの個人が回復できるかを問うため、文書やトピックを固定した共読型IDコントロール(多くのユーザが強調しているのと同じ文書)を使用し、自分の履歴が他の読者よりも良いマークを予測できるかどうかを問う。
我々は、一般的なサリエンス(構造)、群衆サリエンス(他者がマークしたもの)、個人サリエンス(個人残量)を分離する。
まず強調するのはソーシャルだ:どの文章をマークするかは、構成や個人モデルよりも群衆によってはるかに良く予測され、また、同じ文書に他人のマークを表示して、他の文書から作られたフロンティアのLLMツインを破る、十分に見積もられたベースラインである、情報に恵まれた人々でさえも、最も多くは、文書内個人信号がささやき(own-vs-other gap +0.017 by a embedded scorer, small but significant)。
第二に、シャープな対照的に、個性は選択に生きている: 既に空いている通路のどれがあなたのものであるかを尋ねると、あなたの歴史は強く、漏れのない予測器(gap +0.14)です。
トピック分解は、このことが主に安定な主題的嗜好であることを示している: 局所的に整合したピアに対して ~6-8x を縮小し、薄い残留物はより細かいトピックから分離できない。
非可観測部は非対称性であり、同じスコアラーの下では、個々の信号は選択よりも塩分濃度が6~8倍弱くなる。
方法としては, 個人的スコアを+0.15 APまで膨らませ, 個人的個人化を極小集団に委ねる, 密集した群集, モデル整合制御を用いて, 個人的個人化を図った。
ハイライトは、本物の個別のサインを持っているが、強い共有のサインの上に薄い層があり、その層は、人が選択するものよりも、塩分の多いものの方がはるかに多い。
関連論文リスト
- From Self to Other: Evaluating Demographic Perspective-Taking in LLM Hate Speech Annotation [5.762370982168011]
パーソナ条件付き大規模言語モデル(特定の階層的アイデンティティーを採用するよう促されるモデル)は、スケールにおける様々な視点をシミュレートする方法として提案されている。
人間の社会的判断の3つの側面として, (i) 異なる集団のペルソナが人間的な方法(グループ間不一致)に異同するか否か, (ii) コンテンツが自身のアイデンティティ(グループ内での感受性)をターゲットとした場合に, より敏感になるかどうか, (iii) 他集団の反応を正確に予測できるかどうか (viarious prediction) を評価した。
以上の結果から, モデルが3次元全てを連続的に捉えることはなく, 性能はモデル依存であり, 確実に出現しないことが明らかとなった。
論文 参考訳(メタデータ) (2026-06-04T15:09:58Z) - ReLay: Personalized LLM-Generated Plain-Language Summaries for Better Understanding, but at What Cost? [54.44351107428039]
大規模言語モデル(LLMs)は、Plain Language Summaries(PLS)をパーソナライズするための新しい機会を提供する
パーソナライズが有効か、どの戦略が最も効果的か、そしてパーソナライズと安全のバランスをとるかは、まだ不明である。
ReLayは、静的(専門家による)およびインタラクティブな設定の両方で、50人のレイ参加者から300人の参加者--PLSペアのデータセットを紹介します。
ReLayには、ユーザ特性、健康情報のニーズ、情報検索行動、理解結果、対話ログ、品質評価が含まれている。
論文 参考訳(メタデータ) (2026-05-01T07:11:12Z) - NearID: Identity Representation Learning via Near-identity Distractors [116.71529576796605]
既存のビジョンエンコーダは、オブジェクトのアイデンティティを背景コンテキストと絡み合わせることで、信頼性の低い表現やメトリクスを生み出します。
我々は、この脆弱性に対処するための最初の原則付きフレームワークをNear-identity distractorsを使って紹介する。
我々は、厳密なマージンベースの評価プロトコルとともに、NearIDデータセット(19KのID、316Kの一致したコンテキストインタプリタ)を提示する。
論文 参考訳(メタデータ) (2026-04-02T12:33:14Z) - Large-scale online deanonymization with LLMs [58.46277616551135]
大規模なデ匿名化を実現するために,大規模言語モデルを用いることができることを示す。
当社のエージェントは、完全なインターネットアクセスによって、Hacker NewsユーザーとHistropic Interviewer参加者を高精度に識別することができる。
論文 参考訳(メタデータ) (2026-02-18T19:02:50Z) - Whose Preferences? Differences in Fairness Preferences and Their Impact on the Fairness of AI Utilizing Human Feedback [8.04095222893591]
我々は、人種、年齢、政治的スタンス、教育水準、LGBTQ+アノテーターのアイデンティティによって、公平さの選好に大きなギャップを見いだす。
また、テキストで言及された人口統計は、ユーザーがモデレーションにおいて個人の公平さをどう知覚するかに大きな影響を及ぼすことを示した。
論文 参考訳(メタデータ) (2024-06-09T19:42:25Z) - Understanding writing style in social media with a supervised
contrastively pre-trained transformer [57.48690310135374]
オンラインソーシャルネットワークは、ヘイトスピーチから偽情報の拡散まで、有害な行動の場として機能している。
本稿では, 4.5 x 106テキストの公開資料から得られた大規模コーパスに基づいて学習したStyle Transformer for Authorship Representations (STAR)を紹介する。
512個のトークンからなる8つのドキュメントからなるサポートベースを使用して、著者を最大1616人の著者のセットから、少なくとも80%の精度で識別することができる。
論文 参考訳(メタデータ) (2023-10-17T09:01:17Z) - Unifying Data Perspectivism and Personalization: An Application to
Social Norms [10.480094567764606]
13kのアノテーションと210kの社会的規範の判断による対立に関するソーシャルメディア投稿のコーパスについて検討する。
本稿では,アノテータのモデリングにパーソナライズ手法を適用し,社会的規範の知覚を予測する上での有効性を比較した。
論文 参考訳(メタデータ) (2022-10-26T07:43:26Z) - The Tail Wagging the Dog: Dataset Construction Biases of Social Bias
Benchmarks [75.58692290694452]
社会的偏見と、データセット構築時に選択された選択から生じる非社会的偏見を比較し、人間の目では識別できないかもしれない。
これらの浅い修正は、様々なモデルにまたがるバイアスの程度に驚くべき影響を及ぼす。
論文 参考訳(メタデータ) (2022-10-18T17:58:39Z) - My tweets bring all the traits to the yard: Predicting personality and
relational traits in Online Social Networks [4.095574580512599]
本研究は,オンラインソーシャルネットワーク(OSN)における全体像プロファイルの予測モデルを提供することを目的とする。
我々はまずOSNアカウントから幅広い機能を抽出する機能エンジニアリング手法を考案した。
そして,抽出した特徴に基づいて,ユーザの心理的特徴のスコアを予測する機械学習モデルを設計した。
論文 参考訳(メタデータ) (2020-09-22T20:30:56Z) - On Predicting Personal Values of Social Media Users using
Community-Specific Language Features and Personal Value Correlation [14.12186042953335]
この研究は、シンガポールのユーザーの個人的価値を分析し、Facebookデータを用いて個人的価値を予測する効果的なモデルを開発することに焦点を当てている。
提案したスタックモデルには,基本モデルのタスク固有層とクロススティッチ層モデルからなる相関関係が組み込まれている。
論文 参考訳(メタデータ) (2020-07-16T04:36:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。