論文の概要: Using generative AI to support standardization work -- the case of 3GPP
- arxiv url: http://arxiv.org/abs/2408.12611v1
- Date: Thu, 8 Aug 2024 09:18:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-01 17:12:14.449210
- Title: Using generative AI to support standardization work -- the case of 3GPP
- Title(参考訳): ジェネレーティブAIを使って標準化作業を支援する - 3GPPの場合
- Authors: Miroslaw Staron, Jonathan Strom, Albin Karlsson, Wilhelm Meding,
- Abstract要約: テキスト要約のジェネリックモデルは、ドメインエキスパートやデリゲートのアセスメントとよく相関していることを示す。
標準化グループのためのより良い議論資料を提供するためには、ドメイン固有のモデルが必要である。
- 参考スコア(独自算出の注目度): 2.0999222360659604
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Standardization processes build upon consensus between partners, which depends on their ability to identify points of disagreement and resolving them. Large standardization organizations, like the 3GPP or ISO, rely on leaders of work packages who can correctly, and efficiently, identify disagreements, discuss them and reach a consensus. This task, however, is effort-, labor-intensive and costly. In this paper, we address the problem of identifying similarities, dissimilarities and discussion points using large language models. In a design science research study, we work with one of the organizations which leads several workgroups in the 3GPP standard. Our goal is to understand how well the language models can support the standardization process in becoming more cost-efficient, faster and more reliable. Our results show that generic models for text summarization correlate well with domain expert's and delegate's assessments (Pearson correlation between 0.66 and 0.98), but that there is a need for domain-specific models to provide better discussion materials for the standardization groups.
- Abstract(参考訳): 標準化プロセスは、意見の相違点を特定し、解決する能力に依存するパートナー間の合意に基づいて構築される。
3GPPやISOのような大規模な標準化組織は、不一致を正しくかつ効率的に識別し、議論し、合意に達することができる作業パッケージのリーダーに依存しています。
しかし、この仕事は労働集約的でコストがかかる。
本稿では,大規模言語モデルを用いて類似点,相違点,議論点を同定する問題に対処する。
デザインサイエンス研究において、我々は3GPP標準における複数のワークグループをリードする組織の1つと協働する。
私たちのゴールは、言語モデルがよりコスト効率が高く、より高速で、より信頼性の高いものにすることで、標準化プロセスをどのようにサポートできるかを理解することです。
本結果から,テキスト要約のための汎用モデルは,ドメインエキスパートとデリゲートのアセスメント(ピアソンの0.66と0.98の相関関係)とよく相関するが,標準化グループのためのより良い議論資料を提供するためには,ドメイン固有モデルが必要であることが示唆された。
関連論文リスト
- Networks of Networks: Complexity Class Principles Applied to Compound AI Systems Design [63.24275274981911]
多くの言語モデル推論コールからなる複合AIシステムは、ますます採用されている。
本研究では,提案した回答の生成と正当性検証の区別を中心に,ネットワークネットワーク(NoN)と呼ばれるシステムを構築した。
我々は,Kジェネレータを備えた検証器ベースの判定器NoNを導入し,"Best-of-K"あるいは"judge-based"複合AIシステムのインスタンス化を行う。
論文 参考訳(メタデータ) (2024-07-23T20:40:37Z) - Generative Judge for Evaluating Alignment [84.09815387884753]
本稿では,これらの課題に対処するために,13Bパラメータを持つ生成判断器Auto-Jを提案する。
我々のモデルは,大規模な実環境シナリオ下でのユーザクエリとLLM生成応答に基づいて訓練されている。
実験的に、Auto-Jはオープンソースモデルとクローズドソースモデルの両方を含む、強力なライバルのシリーズを上回っている。
論文 参考訳(メタデータ) (2023-10-09T07:27:15Z) - A Critical Review of Large Language Models: Sensitivity, Bias, and the
Path Toward Specialized AI [0.0]
本稿では,テキストデータ中のSDGの検出における,特殊なコンパイル言語モデルとOpenAIのGPT-3.5のような汎用モデルの比較の有効性について検討する。
この研究は、LLMの能力とドメイン固有の専門知識と解釈可能性の必要性のバランスを見つけるために、さらなる研究を奨励することで締めくくっている。
論文 参考訳(メタデータ) (2023-07-28T09:20:22Z) - Towards the Scalable Evaluation of Cooperativeness in Language Models [1.7875811547963403]
我々は, PLMのマルチエージェント行動を理解し, 形成することを目的としている。
クラウドワーカーと言語モデルの両方で、特定の構造でシナリオを生成します。
インストラクションをチューニングしたモデルは、スケールアップ時に協調的と見なされるような振る舞いをする傾向にある。
論文 参考訳(メタデータ) (2023-03-16T15:34:23Z) - News Summarization and Evaluation in the Era of GPT-3 [73.48220043216087]
GPT-3は,大規模な要約データセット上で訓練された微調整モデルと比較する。
我々は,GPT-3サマリーが圧倒的に好まれるだけでなく,タスク記述のみを用いることで,現実性に乏しいようなデータセット固有の問題に悩まされることも示している。
論文 参考訳(メタデータ) (2022-09-26T01:04:52Z) - Elaboration-Generating Commonsense Question Answering at Scale [77.96137534751445]
一般的な感覚を必要とする質問応答では、言語モデル(例えばGPT-3)が背景知識を表すテキストを生成するために使われてきた。
より小さな言語モデルを微調整して有用な中間コンテキストを生成します。
私たちのフレームワークは、2つの言語モデルの更新 – 開発中のジェネレータと応答予測器 – を交互に行います。
論文 参考訳(メタデータ) (2022-09-02T18:32:09Z) - Document-level Relation Extraction with Context Guided Mention
Integration and Inter-pair Reasoning [18.374097786748834]
文書レベルの関係抽出(DRE)は、2つの実体間の関係を認識することを目的としている。
これまでの研究では、言及の統合についてはほとんど研究されていないが、これは問題となるかもしれない。
本稿では,コンテキストガイドメンション統合とペア間推論という2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2022-01-13T08:00:23Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。