論文の概要: Classifying complex documents: comparing bespoke solutions to large
language models
- arxiv url: http://arxiv.org/abs/2312.07182v1
- Date: Tue, 12 Dec 2023 11:38:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-13 16:27:44.395597
- Title: Classifying complex documents: comparing bespoke solutions to large
language models
- Title(参考訳): 複雑な文書の分類:大規模言語モデルとの比較
- Authors: Glen Hopkins, Kristjan Kalm
- Abstract要約: 我々の目的は、12の州と267の郡から9つのサブカテゴリを使って3万件の公庁舎の記録を2つの異なるレベルに分類することである。
具体的には、細調整された大規模言語モデル(LLM)が、カスタムトレーニングモデルの精度を達成できるかどうかを検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Here we search for the best automated classification approach for a set of
complex legal documents. Our classification task is not trivial: our aim is to
classify ca 30,000 public courthouse records from 12 states and 267 counties at
two different levels using nine sub-categories. Specifically, we investigated
whether a fine-tuned large language model (LLM) can achieve the accuracy of a
bespoke custom-trained model, and what is the amount of fine-tuning necessary.
- Abstract(参考訳): ここでは、複雑な法的文書の集合に対する最良の自動分類手法を探索する。
我々の目的は、12の州と267の郡から3万件の公庁舎の記録を9つのサブカテゴリを使って2つの異なるレベルで分類することである。
具体的には,微調整された大言語モデル (llm) が独自に学習したモデルの精度を達成できるか,また,必要な微調整量について検討した。
関連論文リスト
- Exploring Large Language Models and Hierarchical Frameworks for
Classification of Large Unstructured Legal Documents [0.6349503549199403]
我々は,大規模法律文書の分類と,深層学習に基づく階層的枠組みによる構造情報の欠如について検討する。
具体的には、文書を分割して、カスタムの微調整された大規模言語モデルの最後の4層から埋め込みを抽出する。
提案手法は,従来の最先端手法に比べて平均2ポイント程度の性能向上を実現している。
論文 参考訳(メタデータ) (2024-03-11T16:24:08Z) - BYOC: Personalized Few-Shot Classification with Co-Authored Class
Descriptions [2.076173115539025]
LLMを用いた少数ショットテキスト分類のための新しい手法を提案する。
わずかな例ではなく、LLMは各クラスの健全な特徴を記述して誘導される。
例、質問、回答は、分類プロンプトを形成するために要約される。
論文 参考訳(メタデータ) (2023-10-09T19:37:38Z) - Prompt Algebra for Task Composition [131.97623832435812]
素早いチューニングを伴うビジュアル言語モデルを基本分類器として検討する。
合成分類器の性能向上のための制約付きプロンプトチューニングを提案する。
UTZapposでは、最高のベースモデルに対する分類精度を平均8.45%向上させる。
論文 参考訳(メタデータ) (2023-06-01T03:20:54Z) - Classification of US Supreme Court Cases using BERT-Based Techniques [0.0]
我々は、米国最高裁判所判決または最高裁判所データベース(SCDB)のためのBERTに基づくいくつかの分類手法の実験を行った。
次に、長いドキュメントのSOTAモデルと結果を比較します。
その結果,15のカテゴリで80%,細粒度279のカテゴリで60%の精度が得られた。
論文 参考訳(メタデータ) (2023-04-17T22:53:54Z) - Large Language Models in the Workplace: A Case Study on Prompt
Engineering for Job Type Classification [58.720142291102135]
本研究では,実環境における職種分類の課題について検討する。
目標は、英語の求職が卒業生やエントリーレベルの地位に適切かどうかを判断することである。
論文 参考訳(メタデータ) (2023-03-13T14:09:53Z) - Enhancing Classification with Hierarchical Scalable Query on Fusion
Transformer [0.4129225533930965]
本稿では,学習可能な独立クエリ埋め込みによる階層的手法により,きめ細かい分類を向上する手法を提案する。
階層構造の概念を利用して、あらゆるレベルにわたってスケーラブルなクエリの埋め込みを学びます。
本手法は, 細粒度分類において, 従来の手法よりも11%の精度で性能を向上できる。
論文 参考訳(メタデータ) (2023-02-28T11:00:55Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - Out-of-Category Document Identification Using Target-Category Names as
Weak Supervision [64.671654559798]
Out-of-category Detection は、文書が不適格(またはターゲット)カテゴリと意味的関連性に応じて区別することを目的としている。
対象のカテゴリの1つに属する文書の信頼性を効果的に測定する,カテゴリ外検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-24T21:01:25Z) - LeQua@CLEF2022: Learning to Quantify [76.22817970624875]
LeQua 2022は、テキストデータセットで'を定量化する方法を評価するための新しい実験室である。
本研究の目的は、バイナリ設定とシングルラベルのマルチクラス設定の両方において、学習方法の比較評価のための設定を提供することである。
論文 参考訳(メタデータ) (2021-11-22T14:54:20Z) - Evaluation of Neural Network Classification Systems on Document Stream [0.5068448669777386]
我々は,NNに基づく文書分類システムの準最適学習事例における効率を解析する。
評価は,実験室におけるシステム性能を評価するための基準事例,文書ストリーム処理に関連する特定の困難をシミュレートする2例,これらすべての困難を組み合わせた現実的事例の4つに分けられた。
論文 参考訳(メタデータ) (2020-07-15T08:52:39Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。