Fugu-MT 論文翻訳(概要): BigScience: A Case Study in the Social Construction of a Multilingual Large Language Model

論文の概要: BigScience: A Case Study in the Social Construction of a Multilingual Large Language Model

arxiv url: http://arxiv.org/abs/2212.04960v1
Date: Fri, 9 Dec 2022 16:15:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-19 12:55:06.130777
Title: BigScience: A Case Study in the Social Construction of a Multilingual Large Language Model
Title（参考訳）: BigScience:多言語大言語モデルの社会構築における事例研究
Authors: Christopher Akiki and Giada Pistilli and Margot Mieskes and Matthias Gall\'e and Thomas Wolf and Suzana Ili\'c and Yacine Jernite
Abstract要約: BigScience Workshopは、学際研究の1年半にわたる価値駆動型イニシアチブだった。本稿では,BigScienceの協調研究に焦点をあて,大規模参加研究の課題を振り返る。
参考スコア（独自算出の注目度）: 11.366450629112459
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The BigScience Workshop was a value-driven initiative that spanned one and half years of interdisciplinary research and culminated in the creation of ROOTS, a 1.6TB multilingual dataset that was used to train BLOOM, one of the largest multilingual language models to date. In addition to the technical outcomes and artifacts, the workshop fostered multidisciplinary collaborations around large models, datasets, and their analysis. This in turn led to a wide range of research publications spanning topics from ethics to law, data governance, modeling choices and distributed training. This paper focuses on the collaborative research aspects of BigScience and takes a step back to look at the challenges of large-scale participatory research, with respect to participant diversity and the tasks required to successfully carry out such a project. Our main goal is to share the lessons we learned from this experience, what we could have done better and what we did well. We show how the impact of such a social approach to scientific research goes well beyond the technical artifacts that were the basis of its inception.
Abstract（参考訳）: BigScience Workshopは、1年半にわたる学際的な研究を経て、これまでで最大の多言語モデルの1つであるBLOOMのトレーニングに使用された1.6TBのマルチリンガルデータセットであるROTSを開発した。技術的な成果やアーティファクトに加えて、大規模なモデルやデータセット、分析に関する複数の分野のコラボレーションが促進された。この結果、倫理から法律、データガバナンス、モデリングの選択、分散トレーニングまで幅広い研究論文が出版された。本稿では,bigscienceの共同研究の側面に注目し,大規模参加型研究の課題を振り返って,参加者の多様性とプロジェクト成功に必要な課題について考察する。私たちの主な目標は、この経験から学んだ教訓、よりよいことをできたこと、うまくやったことを共有することです。このような社会的アプローチが科学的研究に与える影響が、その発端となった技術的成果に大きく及んでいることを示す。

関連論文リスト

Towards Artificial Intelligence Research Assistant for Expert-Involved Learning [64.7438151207189]
大規模言語モデル (LLMs) と大規模多モードモデル (LMMs) は科学研究における変革的ツールとして登場している。 textbfExpert-involved textbfLearning (ARIEL)のためのtextbfARtificial textbfIntelligence Research Assistantを提案する。
論文参考訳（メタデータ） (2025-05-03T14:21:48Z)
The 1st EReL@MIR Workshop on Efficient Representation Learning for Multimodal Information Retrieval [49.587042083937426]
我々は,Web Conference 2025で初めてのEReL@MIRワークショップを提案し,参加者に新しいソリューションの探求を依頼する。このワークショップは、学術と産業の両方の研究者が議論し、洞察を共有し、コラボレーションを促進するためのプラットフォームを提供することを目的としている。
論文参考訳（メタデータ） (2025-04-21T01:10:59Z)
Personalized Multimodal Large Language Models: A Survey [127.9521218125761]
マルチモーダル大言語モデル(MLLM)は、最先端の性能と複数のデータモダリティを統合する能力により、ますます重要になっている。本稿では,パーソナライズされたマルチモーダルな大規模言語モデルに関する包括的調査を行い,そのアーキテクチャ,トレーニング方法,アプリケーションに焦点をあてる。
論文参考訳（メタデータ） (2024-12-03T03:59:03Z)
What is the Role of Large Language Models in the Evolution of Astronomy Research? [0.0]
ChatGPTや他の最先端の大規模言語モデル(LLM)は、急速に複数のフィールドを変換している。これらのモデルは、一般に広大なデータセットに基づいて訓練され、人間のようなテキスト生成能力を示す。
論文参考訳（メタデータ） (2024-09-30T12:42:25Z)
MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
このデータセットには、スキーマ図、シミュレーション画像、マクロ/顕微鏡写真、実験的可視化などの図が含まれている。我々は,6つのプロプライエタリモデルと10以上のオープンソースモデルを評価し,科学的フィギュアキャプションと複数選択質問のベンチマークを開発した。データセットとベンチマークは、さらなる研究をサポートするためにリリースされる予定だ。
論文参考訳（メタデータ） (2024-07-06T00:40:53Z)
A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文参考訳（メタデータ） (2024-06-16T08:03:24Z)
MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。 MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文参考訳（メタデータ） (2024-06-10T15:19:09Z)
Efficient Large Language Models: A Survey [45.39970635367852]
この調査は、効率的な大規模言語モデル研究の体系的で包括的なレビューを提供する。文献を3つの主要なカテゴリからなる分類学で整理し、異なるが相互に相互に繋がる効率的なLLMのトピックを網羅する。この調査で特集された論文を整理するGitHubリポジトリも作成しました。
論文参考訳（メタデータ） (2023-12-06T19:18:42Z)
A Comprehensive Overview of Large Language Models [68.22178313875618]
大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文参考訳（メタデータ） (2023-07-12T20:01:52Z)
The BigScience ROOTS Corpus: A 1.6TB Composite Multilingual Dataset [36.98035382552118]
BigScienceワークショップは、大きな言語モデルを価値駆動の業務として研究し、訓練することを目的として設立された。本稿では,BigScienceがROOTSコーパス(Responsible Open-science Open-Collaboration Text Sources)を組み立てるために行ったデータ作成とキュレーションの取り組みについて述べる。
論文参考訳（メタデータ） (2023-03-07T14:25:44Z)
Industry-Academia Research Collaboration in Software Engineering: The Certus Model [13.021014899410684]
ソフトウェアエンジニアリングでスケーラブルで効果的な研究コラボレーションを構築することは、非常に難しいことで知られています。本稿では,参加型知識創造の文化を実現するための,産学連携の成功要因を理解することを目的とする。
論文参考訳（メタデータ） (2022-04-23T10:16:23Z)
Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。本稿では154K文書から622Kサンプルのデータセットを作成する。
論文参考訳（メタデータ） (2020-02-02T03:54:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。