論文の概要: Conditional Hypothesis Generation for LLM-Based Text Analysis with Researcher-Specified Covariates
- arxiv url: http://arxiv.org/abs/2606.03029v1
- Date: Tue, 02 Jun 2026 02:07:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.689291
- Title: Conditional Hypothesis Generation for LLM-Based Text Analysis with Researcher-Specified Covariates
- Title(参考訳): 研究者特定共変量を用いたLLMテキスト解析のための条件付き仮説生成
- Authors: Paiheng Xu, Jing Liu, Wei Ai,
- Abstract要約: 本稿では,関係するサブグループ間の差異を考慮に入れた条件付き仮説生成手法を提案する。
2つの課題が生じる: 対象部分群は不足し、差の向きは部分群をまたいで逆になる。
本稿では,符号逆転を検出するための2つのエコノメトリインスパイア法を提案する。
- 参考スコア(独自算出の注目度): 11.185598864391103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A core goal of computational social science is to discover interpretable differences in how language varies across outcomes of interest, such as political affiliation or instructional quality. Recent LLM-based hypothesis generation methods describe such differences in natural language, but select for globally discriminative patterns without accounting for covariates that shape the data based on researchers' domain knowledge. When covariates are ignored, selected patterns can reflect confounds rather than differences of substantive interest. We introduce conditional hypothesis generation, a framework that incorporates researcher-specified covariates to steer hypothesis discovery toward differences that hold within relevant subgroups. Two challenges arise: the target subgroup may be underrepresented (stratum imbalance), and the direction of a difference may reverse across subgroups (sign reversal). We propose two econometrics-inspired methods: one introduces feature--covariate interactions to detect sign reversals, and the other applies within-stratum demeaning and inverse-frequency reweighting to equalize underrepresented strata. Synthetic experiments show each method outperforms global baselines in its targeted setting, and expert evaluation on two real-world datasets confirms that covariate-aware generation surfaces more useful hypotheses within relevant subgroups.
- Abstract(参考訳): 計算社会科学の中核的な目的は、言語が関心の結果、例えば政治的アフィリエイトや教育的品質によってどのように変化するかにおいて、解釈可能な相違を見出すことである。
近年のLLMに基づく仮説生成手法では、自然言語の違いを記述しているが、研究者のドメイン知識に基づいてデータを形成する共変量を考慮することなく、グローバルな識別パターンを選択する。
共変分が無視されるとき、選択されたパターンは、実体的関心の違いよりも、矛盾を反映することができる。
条件付き仮説生成は、研究者が特定した共変体を組み込んだフレームワークで、関連するサブグループ内で保持される相違に対して仮説発見を推し進める。
2つの課題が生じる: 対象部分群が不足(階層的不均衡)し、差分方向が部分群をまたいで逆転する(符号反転)。
本稿では,手話の逆転を検出するための特徴-共変量相互作用を導入し,また,非表現的層を等化するために,内層重み付けと逆周波数再重み付けを適用した。
合成実験では、それぞれの手法が目標設定においてグローバルベースラインよりも優れており、2つの実世界のデータセットのエキスパート評価により、共変量認識生成曲面が関連するサブグループ内でより有用な仮説を示す。
関連論文リスト
- Differential Subgroup Discovery: Characterizing Where Two Populations Differ, and Why [36.94047915240195]
特徴空間内での2つの集団の相違点の理解について検討する。
異なる部分群は、人口レベルのギャップが最も顕著な特徴空間の領域を明らかにする。
論文 参考訳(メタデータ) (2026-04-30T11:31:42Z) - Beyond Interaction Effects: Two Logics for Studying Population Inequalities [2.710807780228189]
導出と導出の選択は、解釈可能性と柔軟性のトレードオフを反映していることを示す。
我々の枠組みは不平等研究に特に関係しており、社会的なサブ人口間でどのように治療効果が変化するかを理解することは実質的に中心的である。
論文 参考訳(メタデータ) (2025-12-26T19:25:39Z) - Quantifying Fairness in LLMs Beyond Tokens: A Semantic and Statistical Perspective [24.54292750583169]
大規模言語モデル(LLM)は、しばしば固有のバイアスを伴う応答を生成し、現実のアプリケーションにおける信頼性を損なう。
LLMにおけるグループレベルの公平性を評価するための新しい統計フレームワークであるFiSCo(Fine-fine Semantic Comparison)を提案する。
モデル出力を意味的に異なるクレームに分解し、グループ間およびグループ間の類似性を比較するために統計的仮説テストを適用する。
論文 参考訳(メタデータ) (2025-06-23T18:31:22Z) - On Reference (In-)Determinacy in Natural Language Inference [62.904689974282334]
我々は、自然言語推論(NLI)タスクにおける基準決定性(RD)仮定を再考する。
我々は、現在のNLIモデルは、入力前提と仮説が異なるコンテキストを参照できる事実検証のような下流アプリケーションでは失敗するのを観察する。
NLI例における参照曖昧性を特定するための診断ベンチマークであるRefNLIを紹介する。
論文 参考訳(メタデータ) (2025-02-09T06:58:13Z) - Picking on the Same Person: Does Algorithmic Monoculture lead to Outcome
Homogenization? [90.35044668396591]
機械学習における繰り返しのテーマはアルゴリズムによるモノカルチャーである。同じシステム、またはコンポーネントを共有するシステムは、複数の意思決定者によってデプロイされる。
意思決定者がトレーニングデータや特定のモデルなどのコンポーネントを共有すれば、より均一な結果が得られます。
我々はこの仮説をアルゴリズムフェアネスベンチマークで検証し、トレーニングデータの共有がホモジェナイゼーションを確実に悪化させることを示した。
結果の均質化に関する哲学的分析と社会的な課題を、デプロイされた機械学習システムに含めることに着目して結論付ける。
論文 参考訳(メタデータ) (2022-11-25T09:33:11Z) - Modelling Heterogeneity Using Bayesian Structured Sparsity [0.0]
観察間で異なる変数の効果を推定する方法は、政治科学において重要な問題です。
本稿では,複雑な現象(同様の現象を離散群に展開する観測)を回帰分析に組み込む共通の方法を提案する。
論文 参考訳(メタデータ) (2021-03-29T19:54:25Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - Learning Causal Semantic Representation for Out-of-Distribution
Prediction [125.38836464226092]
因果推論に基づく因果意味生成モデル(CSG)を提案し,その2つの要因を別々にモデル化する。
CSGはトレーニングデータに適合させることで意味的因子を識別できることを示し、この意味的識別はOOD一般化誤差の有界性を保証する。
論文 参考訳(メタデータ) (2020-11-03T13:16:05Z) - LOGAN: Local Group Bias Detection by Clustering [86.38331353310114]
コーパスレベルでバイアスを評価することは、モデルにバイアスがどのように埋め込まれているかを理解するのに十分ではない、と我々は主張する。
クラスタリングに基づく新しいバイアス検出手法であるLOGANを提案する。
毒性分類および対象分類タスクの実験は、LOGANが局所領域のバイアスを特定することを示している。
論文 参考訳(メタデータ) (2020-10-06T16:42:51Z) - L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。
新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。
ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文 参考訳(メタデータ) (2020-05-22T15:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。