Fugu-MT 論文翻訳(概要): Evaluating the Capabilities of LLMs for Supporting Anticipatory Impact Assessment

論文の概要: Evaluating the Capabilities of LLMs for Supporting Anticipatory Impact Assessment

arxiv url: http://arxiv.org/abs/2401.18028v2
Date: Mon, 20 May 2024 23:34:39 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-22 18:41:35.655012
Title: Evaluating the Capabilities of LLMs for Supporting Anticipatory Impact Assessment
Title（参考訳）: 予測影響評価支援のためのLCMの能力評価
Authors: Mowafak Allaham, Nicholas Diakopoulos,
Abstract要約: 我々は、微調整完了モデルにより、社会におけるAIの高品質な影響を生み出す可能性を示す。我々は,コヒーレンス,構造,妥当性,妥当性について検討した。命令ベースモデルが生み出す影響は,特定のカテゴリのインパクトの生成にギャップがあることが判明した。
参考スコア（独自算出の注目度）: 3.660182910533372
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Gaining insight into the potential negative impacts of emerging Artificial Intelligence (AI) technologies in society is a challenge for implementing anticipatory governance approaches. One approach to produce such insight is to use Large Language Models (LLMs) to support and guide experts in the process of ideating and exploring the range of undesirable consequences of emerging technologies. However, performance evaluations of LLMs for such tasks are still needed, including examining the general quality of generated impacts but also the range of types of impacts produced and resulting biases. In this paper, we demonstrate the potential for generating high-quality and diverse impacts of AI in society by fine-tuning completion models (GPT-3 and Mistral-7B) on a diverse sample of articles from news media and comparing those outputs to the impacts generated by instruction-based (GPT-4 and Mistral-7B-Instruct) models. We examine the generated impacts for coherence, structure, relevance, and plausibility and find that the generated impacts using Mistral-7B, a small open-source model fine-tuned on impacts from the news media, tend to be qualitatively on par with impacts generated using a more capable and larger scale model such as GPT-4. Moreover, we find that impacts produced by instruction-based models had gaps in the production of certain categories of impacts in comparison to fine-tuned models. This research highlights a potential bias in the range of impacts generated by state-of-the-art LLMs and the potential of aligning smaller LLMs on news media as a scalable alternative to generate high quality and more diverse impacts in support of anticipatory governance approaches.
Abstract（参考訳）: 社会における人工知能(AI)技術の潜在的なネガティブな影響に関する洞察を得ることは、予想されるガバナンスアプローチを実装する上での課題である。このような洞察を生み出すための1つのアプローチは、新興技術の望ましくない結果の範囲を考案し探求する過程で専門家を支援し、ガイドするために、LLM(Large Language Models)を使用することである。しかし、このようなタスクに対するLCMの性能評価は、生成した影響の一般的な品質だけでなく、生成した影響の種類やバイアスも調査するなど、依然として必要である。本稿では, メディアからの多種多様な記事に対して, 微調整完了モデル(GPT-3, Mistral-7B) を用いて, 社会におけるAIの高品質で多様な影響を生み出す可能性を示し, インストラクションベースモデル(GPT-4, Mistral-7B-Instruct) による影響と比較する。我々は, コーヒーレンス, 構造, 妥当性, 信頼性について検討し, メディアからの影響を微調整した小型オープンソースモデルMistral-7Bによる影響は, GPT-4のようなより有能で大規模なモデルで生成された影響と同程度に質的に評価される傾向にあることを示した。さらに, 命令ベースモデルによる影響は, 微調整モデルと比較して, ある種の影響カテゴリーの生成にギャップがあることが判明した。この研究は、最先端のLLMが生み出す影響範囲における潜在的なバイアスと、予想されるガバナンスアプローチを支援するために、より高品質で多様な影響を生み出すためのスケーラブルな代替手段として、より小さなLLMをニュースメディアに整合させる可能性を強調している。

関連論文リスト

Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation Benchmark [62.58869921806019]
GPT-4oに基づくタスク分解評価フレームワークを提案し、新しいトレーニングデータセットを自動構築する。我々は、GPT-4oの評価能力を7BオープンソースMLLM、MiniCPM-V-2.6に効果的に蒸留するための革新的なトレーニング戦略を設計する。実験結果から,我々の蒸留したオープンソースMLLMは,現在のGPT-4oベースラインよりも有意に優れていた。
論文参考訳（メタデータ） (2024-11-23T08:06:06Z)
HarmLevelBench: Evaluating Harm-Level Compliance and the Impact of Quantization on Model Alignment [1.8843687952462742]
本稿では,現在の脱獄技術とLLM脆弱性評価のギャップに対処することを目的としている。私たちの貢献は、複数の害レベルにわたるモデル出力の有害性を評価するために設計された、新しいデータセットの作成を含む。 Vicuna 13B v1.5モデルをターゲットとした、最先端の脱獄攻撃の包括的なベンチマークを提供する。
論文参考訳（メタデータ） (2024-11-11T10:02:49Z)
Towards Leveraging News Media to Support Impact Assessment of AI Technologies [3.2566808526538873]
インパクトアセスメント(IA)の専門家主導のフレームワークは、AI技術が公衆の社会的行動、政策、そして、AIの認識とその使用に関する影響を形作る文化的、地理的文脈に与える影響を、必然的に見落としてしまう可能性がある。本研究は、世界30カ国にまたがる266のニュースドメインから報告されたAIのネガティブな影響に対する微調整LDMの可能性を探るものである。
論文参考訳（メタデータ） (2024-11-04T19:12:27Z)
DAG-aware Transformer for Causal Effect Estimation [0.8192907805418583]
因果推論は、医療、経済学、社会科学などの分野における重要な課題である。本稿では,これらの課題を克服する因果推論のためのトランスフォーマーを用いた新しい手法を提案する。我々のモデルの中核となる革新は、注意機構に直接因果非巡回グラフ(DAG)を統合することである。
論文参考訳（メタデータ） (2024-10-13T23:17:58Z)
Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文参考訳（メタデータ） (2024-08-24T18:28:19Z)
Comprehensive Reassessment of Large-Scale Evaluation Outcomes in LLMs: A Multifaceted Statistical Approach [64.42462708687921]
評価の結果、スケーリング、トレーニングタイプ、アーキテクチャなどの要因がLLMのパフォーマンスに大きな影響を与えていることが明らかになった。本研究は, これらのLCMの徹底的な再検討に着手し, 現状評価手法における不整合性に着目した。これには、ANOVA、Tukey HSDテスト、GAMM、クラスタリング技術などが含まれる。
論文参考訳（メタデータ） (2024-03-22T14:47:35Z)
Robustness and Generalization Performance of Deep Learning Models on Cyber-Physical Systems: A Comparative Study [71.84852429039881]
調査は、センサーの故障やノイズなど、様々な摂動を扱うモデルの能力に焦点を当てている。我々は,これらのモデルの一般化と伝達学習能力を,アウト・オブ・ディストリビューション(OOD)サンプルに公開することによって検証する。
論文参考訳（メタデータ） (2023-06-13T12:43:59Z)
Predictability and Surprise in Large Generative Models [8.055204456718576]
大規模プレトレーニングは、有能で汎用的な生成モデルを作成するための技術として登場した。本稿では,そのようなモデルの直観的特性を強調し,この特性の政策的含意について論じる。
論文参考訳（メタデータ） (2022-02-15T23:21:23Z)
Unpacking the Expressed Consequences of AI Research in Broader Impact Statements [23.3030110636071]
本稿では,2020 Neural Information Processing Systems カンファレンスで記述された文のサンプルのテーマ分析の結果を紹介する。私たちが特定するテーマは、結果の表現方法と影響の領域に関連するカテゴリに分類されます。結果を踏まえて、将来のイテレーションでより広範なインパクトステートメントをどのように実装して、潜在的な目標とよりよく一致させることができるか、という視点を提供します。
論文参考訳（メタデータ） (2021-05-11T02:57:39Z)
Heterogeneous Demand Effects of Recommendation Strategies in a Mobile Application: Evidence from Econometric Models and Machine-Learning Instruments [73.7716728492574]
本研究では,モバイルチャネルにおける様々なレコメンデーション戦略の有効性と,個々の製品に対する消費者の実用性と需要レベルに与える影響について検討する。提案手法では, 有効性に有意な差が認められた。我々は,ユーザ生成レビューのディープラーニングモデルに基づいて,製品分化(アイソレーション)をキャプチャする新しいエコノメトリ機器を開発した。
論文参考訳（メタデータ） (2021-02-20T22:58:54Z)
ML-Doctor: Holistic Risk Assessment of Inference Attacks Against Machine Learning Models [64.03398193325572]
機械学習(ML)モデルに対する推論攻撃により、敵はトレーニングデータやモデルパラメータなどを学ぶことができる。私たちは、メンバシップ推論、モデル反転、属性推論、モデル盗難の4つの攻撃に集中しています。私たちの分析では、MLモデルオーナがモデルをデプロイするリスクを評価することができる、モジュール化された再使用可能なソフトウェアであるML-Doctorに依存しています。
論文参考訳（メタデータ） (2021-02-04T11:35:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。