論文の概要: JudgeMeNot: Personalizing Large Language Models to Emulate Judicial Reasoning in Hebrew
- arxiv url: http://arxiv.org/abs/2604.18041v1
- Date: Mon, 20 Apr 2026 10:05:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.80326
- Title: JudgeMeNot: Personalizing Large Language Models to Emulate Judicial Reasoning in Hebrew
- Title(参考訳): judgeMeNot: ヘブライ語における司法推論をエミュレートする大規模言語モデルをパーソナライズする
- Authors: Itay Razumenko, Arnon Sturm, Nir Grinberg,
- Abstract要約: 生の司法判断を命令調整データに変換する合成・有機的監視パイプラインを導入する。
われわれのアプローチと最先端のパーソナライズ手法を3つのタスクと設定で比較した。
特に, モデル生成した出力は, 人間の判断と区別がつかず, 効率の良いパーソナライゼーションの実現可能性を強調している。
- 参考スコア(独自算出の注目度): 2.4915542959367403
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite significant advances in large language models, personalizing them for individual decision-makers remains an open problem. Here, we introduce a synthetic-organic supervision pipeline that transforms raw judicial decisions into instruction-tuning data, enabling parameter-efficient fine-tuning of personalized models for individual judges in low-resource settings. We compare our approach to state-of-the-art personalization techniques across three different tasks and settings. The results show that Causal Language Modeling followed by synthetically generated instruction-tuning significantly outperforms all other baselines, providing significant improvements across lexical, stylistic, and semantic similarity. Notably, our model-generated outputs are indistinguishable from the reasoning of human judges, highlighting the viability of efficient personalization, even in low-resource settings.
- Abstract(参考訳): 大規模言語モデルの大幅な進歩にもかかわらず、個々の意思決定者向けにパーソナライズすることは未解決の問題である。
本稿では,生の司法判断を命令調整データに変換し,低リソース環境下での個々の裁判官に対するパーソナライズされたモデルのパラメータ効率の高い微調整を可能にする合成有機組織監視パイプラインを提案する。
われわれのアプローチと最先端のパーソナライズ手法を3つのタスクと設定で比較した。
その結果、因果言語モデリングに続き、合成的に生成された命令チューニングは、他のすべてのベースラインよりも大幅に優れており、語彙的、スタイリスティック、セマンティックな類似性において大幅に改善されていることがわかった。
特に, モデル生成出力は, 低リソース環境においても, 効率的なパーソナライゼーションの実現可能性を強調し, 人間の判断と区別できない。
関連論文リスト
- Persona-judge: Personalized Alignment of Large Language Models via Token-level Self-judgment [21.677859755364334]
ペルソナ・ジャッジ(Persona-judge)は、トレーニング不要なパーソナライズされたアライメントと、目に見えない好みのアライメントを可能にする、新しい差別的パラダイムである。
Persona-judgeは、パーソナライズされたアライメントに対して、スケーラブルで、計算的に効率的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-17T05:50:13Z) - Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions [65.89403417819764]
設計選択が言語モデル能力に与える影響を定量化する。
モデルサイズとトレーニングトークンの数以外の機能を組み込むことで、下流のパフォーマンスを予測する能力が3~28%向上する。
論文 参考訳(メタデータ) (2025-03-05T19:46:04Z) - ComPO: Community Preferences for Language Model Personalization [122.54846260663922]
ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。
ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文 参考訳(メタデータ) (2024-10-21T14:02:40Z) - Unsupervised Human Preference Learning [7.959043497459107]
大きな言語モデルは印象的な推論能力を示しているが、パーソナライズされたコンテンツを提供するのに苦労している。
文脈内学習やパラメータ効率のよい微調整といった既存の手法は、人間の嗜好の複雑さを捉えるには不十分である。
そこで本研究では,より大規模で事前学習されたモデルを示す自然言語規則を生成するために,小パラメータモデルを選好エージェントとして活用する手法を提案する。
論文 参考訳(メタデータ) (2024-09-30T17:51:01Z) - Direct Judgement Preference Optimization [79.54459973726405]
我々は、他のモデルのアウトプットを評価し、批判するために、生成的判断として大きな言語モデル(LLM)を訓練する。
我々は,異なるユースケースに対する選好ペアの収集に3つのアプローチを採用し,それぞれが異なる視点から生成判断を改善することを目的としている。
提案モデルは,位置や長さの偏りなどの固有バイアスに強く対応し,実践者が指定した評価プロトコルに柔軟に適用し,下流ジェネレータモデルを改善する上で有用な言語フィードバックを提供する。
論文 参考訳(メタデータ) (2024-09-23T02:08:20Z) - Personalized Large Language Models [1.0881867638866944]
本稿では,大規模言語モデル(LLM)のパーソナライズ手法について検討する。
その結果、パーソナライズされた微調整は、非パーソナライズされたモデルと比較してモデル推論を改善することが示された。
感情認識とヘイトスピーチ検出のためのデータセットの実験は、パーソナライズされた方法で一貫したパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2024-02-14T15:55:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。