論文の概要: From Word Sequences to Behavioral Sequences: Adapting Modeling and Evaluation Paradigms for Longitudinal NLP
- arxiv url: http://arxiv.org/abs/2601.07988v1
- Date: Mon, 12 Jan 2026 20:38:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:18.943161
- Title: From Word Sequences to Behavioral Sequences: Adapting Modeling and Evaluation Paradigms for Longitudinal NLP
- Title(参考訳): 単語列から行動列へ:縦型NLPのモデリングと評価パラダイムへの適応
- Authors: Adithya V Ganesan, Vasudha Varadarajan, Oscar NE Kjell, Whitney R Ringwald, Scott Feltman, Benjamin J Luft, Roman Kotov, Ryan L Boyd, H Andrew Schwartz,
- Abstract要約: 文献レベルの評価は, 生態学的に有効なモデリングと評価と比較して, かなり異なる結果が得られ, 時には逆の結論がもたらされることが示唆された。
NLP のワードシーケンス評価から $textitbehavior-sequence$ パラダイムへの移行を動機とする,より広範な議論に関連付ける。
- 参考スコア(独自算出の注目度): 10.614902538213638
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While NLP typically treats documents as independent and unordered samples, in longitudinal studies, this assumption rarely holds: documents are nested within authors and ordered in time, forming person-indexed, time-ordered $\textit{behavioral sequences}$. Here, we demonstrate the need for and propose a longitudinal modeling and evaluation paradigm that consequently updates four parts of the NLP pipeline: (1) evaluation splits aligned to generalization over people ($\textit{cross-sectional}$) and/or time ($\textit{prospective}$); (2) accuracy metrics separating between-person differences from within-person dynamics; (3) sequence inputs to incorporate history by default; and (4) model internals that support different $\textit{coarseness}$ of latent state over histories (pooled summaries, explicit dynamics, or interaction-based models). We demonstrate the issues ensued by traditional pipeline and our proposed improvements on a dataset of 17k daily diary transcripts paired with PTSD symptom severity from 238 participants, finding that traditional document-level evaluation can yield substantially different and sometimes reversed conclusions compared to our ecologically valid modeling and evaluation. We tie our results to a broader discussion motivating a shift from word-sequence evaluation toward $\textit{behavior-sequence}$ paradigms for NLP.
- Abstract(参考訳): NLPは通常、文書を独立して順序付けされていないサンプルとして扱うが、縦断的な研究では、この仮定はまれである: 文書は著者の中にネストされ、時間内に順序付けされ、人によってインデックス付けされ、時間順に$\textit{behavioral sequences}$を形成する。
ここでは,NLPパイプラインの4つの部分を更新する縦断的モデリングと評価のパラダイムの必要性を実証し,提案する。(1) 人に対する一般化に整合した評価分割(「\textit{cross-sectional}$」),(2) 人内ダイナミクスから人間差を分離する精度測定(「\textit{prospective}$」),(3) 歴史を既定で組み込むためのシーケンス入力(「$\textit{coarseness}$」),(4) ヒストリー上の潜時状態(「プール」,「明示的ダイナミックス」,あるいは「インタラクションベースモデル」)。
従来のパイプラインによって引き起こされる問題と,PTSD症状の重大度と組み合わせた17kの日誌のデータセットの改善を実証し,従来の文書レベルの評価は,我々の生態学的に妥当なモデリングと評価と比較して,著しく異なる結果が得られ,時には逆の結論がもたらされることを示した。
NLP のパラダイムとして,単語列評価から $\textit{behavior-sequence} への移行を動機とする,より広範な議論に関連付ける。
関連論文リスト
- CoKe: Customizable Fine-Grained Story Evaluation via Chain-of-Keyword Rationalization [90.15027447565427]
思考の連鎖(CoT)は、モデルの予測を導くのに役立つ自由テキストの説明を生成する。
自己一貫性(SC: Self-Consistency)は、複数の生成された説明に対する予測を疎外する。
我々は、$textbfC$hain-$textbfo$f-$textbfKe$ywords (CoKe)を提案する。
論文 参考訳(メタデータ) (2025-03-21T13:37:46Z) - Localizing Factual Inconsistencies in Attributable Text Generation [74.11403803488643]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
QASemConsistencyは、人間の判断とよく相関する事実整合性スコアを得られることを示す。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - BBScoreV2: Learning Time-Evolution and Latent Alignment from Stochastic Representation [23.765789561546715]
自動回帰生成モデルは、特に長いテキストシーケンスのモデリングと評価において、様々な言語タスクにおいて重要な役割を果たす。
本研究では、変換器をベースとしたモデル埋め込みをプロセスに組み込むことで、元来の順序のないモデル出力から順序付けられた潜在表現が得られることを観察する。
BBVScore2は,BBV2の有効性に対する直感的かつ定量的な支援を提供する。
論文 参考訳(メタデータ) (2024-05-28T02:33:38Z) - Higher-Order DeepTrails: Unified Approach to *Trails [7.270112855088838]
人間の振る舞いを分析し、理解し、記述することは、Webブラウジングやトラフィックナビゲーションなど、異なる設定で有利である。
本稿では,従来,シーケンス内の高次依存関係のモデル化に用いられてきた自動回帰言語モデルを用いて,シーケンス全体を解析することを提案する。
提案手法は,HypTrails,MixedTrails,さらにはSubTrailsなど,従来の作業で導入された異なる設定に容易に適用可能であることを示す。
論文 参考訳(メタデータ) (2023-10-06T06:54:11Z) - Document-Level Relation Extraction with Sentences Importance Estimation
and Focusing [52.069206266557266]
文書レベルの関係抽出(DocRE)は、複数の文の文書から2つのエンティティ間の関係を決定することを目的としている。
我々はDocREのための文重要度スコアと文集中損失を設計するSIEF(Sentence Estimation and Focusing)フレームワークを提案する。
2つのドメインの実験結果から、SIEFは全体的なパフォーマンスを改善するだけでなく、DocREモデルをより堅牢にします。
論文 参考訳(メタデータ) (2022-04-27T03:20:07Z) - Stretching Sentence-pair NLI Models to Reason over Long Documents and
Clusters [35.103851212995046]
自然言語推論(NLI)は,文ペア間の意味的関係を推定するフレームワークとして,NLPコミュニティによって広く研究されている。
我々は、NLIモデルの実アプリケーションへの直接ゼロショット適用性について、訓練された文ペア設定を超えて検討する。
本研究では,ContractNLIデータセット上で,フルドキュメント上で動作し,最先端のパフォーマンスを実現するための新たなアグリゲーション手法を開発した。
論文 参考訳(メタデータ) (2022-04-15T12:56:39Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Multi-View Sequence-to-Sequence Models with Conversational Structure for
Abstractive Dialogue Summarization [72.54873655114844]
テキスト要約は、NLPにおいて最も困難で興味深い問題の1つである。
本研究では、まず、異なる視点から構造化されていない日々のチャットの会話構造を抽出し、会話を表現するマルチビューシーケンス・ツー・シーケンスモデルを提案する。
大規模対話要約コーパスの実験により,本手法は,自動評価と人的判断の両面から,従来の最先端モデルよりも有意に優れた性能を示した。
論文 参考訳(メタデータ) (2020-10-04T20:12:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。