Fugu-MT 論文翻訳(概要): Decoding the End-to-end Writing Trajectory in Scholarly Manuscripts

論文の概要: Decoding the End-to-end Writing Trajectory in Scholarly Manuscripts

arxiv url: http://arxiv.org/abs/2304.00121v1
Date: Fri, 31 Mar 2023 20:33:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-04 19:39:17.118876
Title: Decoding the End-to-end Writing Trajectory in Scholarly Manuscripts
Title（参考訳）: 書字における終末記述軌跡の復号化
Authors: Ryan Koo, Anna Martin, Linghe Wang, Dongyeop Kang
Abstract要約: そこで本研究では,意図,著作者行動,および記述データの情報タイプに応じて,学術的な記述行動の分類を行う新しい分類法を提案する。学術論文の分類学は,認知書記理論に動機付けられ,一般的な書記の流れを辿るために,分類のレベルが3つ含まれている。 ManuScriptは、書道の直線性と非直線性を捉えることによって、学術的な書道の完全な図面を提供する。
参考スコア（独自算出の注目度）: 7.294418916091011
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Scholarly writing presents a complex space that generally follows a methodical procedure to plan and produce both rationally sound and creative compositions. Recent works involving large language models (LLM) demonstrate considerable success in text generation and revision tasks; however, LLMs still struggle to provide structural and creative feedback on the document level that is crucial to academic writing. In this paper, we introduce a novel taxonomy that categorizes scholarly writing behaviors according to intention, writer actions, and the information types of the written data. We also provide ManuScript, an original dataset annotated with a simplified version of our taxonomy to show writer actions and the intentions behind them. Motivated by cognitive writing theory, our taxonomy for scientific papers includes three levels of categorization in order to trace the general writing flow and identify the distinct writer activities embedded within each higher-level process. ManuScript intends to provide a complete picture of the scholarly writing process by capturing the linearity and non-linearity of writing trajectory, such that writing assistants can provide stronger feedback and suggestions on an end-to-end level. The collected writing trajectories are viewed at https://minnesotanlp.github.io/REWARD_demo/
Abstract（参考訳）: 学術的な執筆は、合理的に健全な構成と創造的な構成の両方を計画し生産するための方法論的な手順に従う複雑な空間を提示する。大規模言語モデル(LLM)を含む最近の研究は、テキスト生成と修正作業でかなりの成功を収めているが、LLMは学術的な執筆に不可欠な文書レベルで構造的かつ創造的なフィードバックを提供することに苦慮している。本稿では,意図,著作者行動,および記述データの情報タイプに応じて,学術的な記述行動の分類を行う新しい分類法を提案する。 ManuScriptも提供しています。これは、私たちの分類の単純化されたバージョンで注釈付けされたオリジナルのデータセットで、ライターのアクションとそれらの背後にある意図を示しています。認知的ライティング理論に動機づけられ、科学論文の分類学は、一般的なライティングフローを追跡し、それぞれの高レベルなプロセスに埋め込まれた異なるライティングアクティビティを識別するために、3段階の分類を含む。 ManuScriptは、文章の行程の線形性と非線形性を捉えることによって、学術的な記述過程の完全な図面を提供しようとしている。収集された書き込み軌跡はhttps://minnesotanlp.github.io/REWARD_demo/で見ることができる。

関連論文リスト

Exposía: Academic Writing Assessment of Exposés and Peer Feedback [56.428320613219306]
高等教育における文章とフィードバックアセスメントを結びつける最初の公開データセットであるExposaを提示する。我々はExposaを使って,(1)提案の自動スコアリング,(2)学生レビューの2つのタスクに対して,最先端のオープンソース大言語モデル(LLM)をベンチマークする。
論文参考訳（メタデータ） (2026-01-10T11:33:26Z)
Meow: End-to-End Outline Writing for Automatic Academic Survey [24.749855249116802]
組織的かつ忠実なアウトラインを効率的に生成するフレームワークであるMeowを提案する。まず、紙のメタデータから階層的なアウトラインを生成するエンドツーエンドのタスクとして、アウトラインを定式化する。次に、arXiv、bioRxiv、medRxivからの高品質な調査データセットをキュレートし、アウトライン品質評価のための体系的な評価指標を確立する。
論文参考訳（メタデータ） (2025-09-19T07:20:53Z)
Help Me Write a Story: Evaluating LLMs' Ability to Generate Writing Feedback [57.200668979963694]
我々は1,300のストーリーからなる新しいテストセットを提示し、故意に執筆問題を紹介した。本研究では,この作業においてよく用いられるLCMの性能を,自動評価と人的評価の両方を用いて検討する。
論文参考訳（メタデータ） (2025-07-21T18:56:50Z)
WritingBench: A Comprehensive Benchmark for Generative Writing [87.48445972563631]
writeBenchは、6つのコア書き込みドメインと100の技術的記述を含む大規模言語モデル(LLM)を評価するために設計されたベンチマークである。本稿では、LCMがインスタンス固有の評価基準を動的に生成することを可能にするクエリ依存評価フレームワークを提案する。このフレームワークは、基準対応スコアリングのための微調整された批評家モデルによって補完され、スタイル、フォーマット、長さの評価を可能にする。
論文参考訳（メタデータ） (2025-03-07T08:56:20Z)
ScholaWrite: A Dataset of End-to-End Scholarly Writing Process [12.170448539143909]
ScholaWriteデータセットは、完全な原稿のエンドツーエンドの学術的な記述プロセスのキーストロークコーパスである。データセットには5つのプレプリントから得られたキーストロークデータが含まれており、合計62万件のテキスト変更とアノテーションが4ヶ月にわたる論文執筆に費やされている。
論文参考訳（メタデータ） (2025-02-05T05:57:37Z)
Online Writer Retrieval with Chinese Handwritten Phrases: A Synergistic Temporal-Frequency Representation Learning Approach [53.189911918976655]
DOLPHINは,相乗的時間周波数解析による手書き表現の向上を目的とした新しい検索モデルである。 OLIWER(OLIWER)は,1,731人から670,000以上の中国語の字句を含む大規模オンライン作家検索データセットである。本研究は,手書き表現の質向上における点サンプリング周波数と圧力特性の重要性を強調した。
論文参考訳（メタデータ） (2024-12-16T11:19:22Z)
BookWorm: A Dataset for Character Description and Analysis [59.186325346763184]
本稿では,短い事実プロファイルを生成する文字記述と,詳細な解釈を提供する文字解析という2つのタスクを定義する。本稿では,Gutenbergプロジェクトからの書籍と,人間による記述と分析のペアリングを行うBookWormデータセットを紹介する。その結果,検索に基づくアプローチは両タスクにおいて階層的アプローチよりも優れていた。
論文参考訳（メタデータ） (2024-10-14T10:55:58Z)
Agents' Room: Narrative Generation through Multi-step Collaboration [54.98886593802834]
本稿では,物語の執筆を特殊エージェントが取り組んだサブタスクに分解する,物語理論に触発された世代フレームワークを提案する。エージェントの部屋は,専門的評価者が好むストーリーをベースラインシステムより生成することを示す。
論文参考訳（メタデータ） (2024-10-03T15:44:42Z)
Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.74296438621836]
Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。 Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文参考訳（メタデータ） (2024-08-22T15:29:08Z)
Capturing Style in Author and Document Representation [4.323709559692927]
著者と文書の埋め込みをスタイリスティックな制約で学習する新しいアーキテクチャを提案する。本稿では,Gutenbergプロジェクトから抽出した文芸コーパス,Blog Authorship,IMDb62の3つのデータセットについて評価を行った。
論文参考訳（メタデータ） (2024-07-18T10:01:09Z)
Navigating the Path of Writing: Outline-guided Text Generation with Large Language Models [8.920436030483872]
本稿では,Large Language Models (LLMs) をユーザ整列テキスト生成のガイドとして,明示的なアウトラインを用いたLinging Pathを提案する。我々のアプローチは、構造化された記述計画と推論パスからインスピレーションを得て、書き込みプロセス全体を通してユーザの意図を捉え、反映することに重点を置いています。
論文参考訳（メタデータ） (2024-04-22T06:57:43Z)
Can Authorship Representation Learning Capture Stylistic Features? [5.812943049068866]
本研究では,サロゲートオーサシップ予測タスクで学習した表現が,実際に書体に敏感であることを示す。結果として、著者の表現は、時間とともに話題が漂うような、ある種のデータシフトに対して堅牢であることが期待できる。我々の発見は、スタイル転送のようなスタイル表現を必要とする下流アプリケーションへの扉を開くかもしれない。
論文参考訳（メタデータ） (2023-08-22T15:10:45Z)
Exploitation and exploration in text evolution. Quantifying planning and translation flows during writing [0.13108652488669734]
執筆過程において,計画(探索)と翻訳(探索)のサブサイクルを定量化する手法を導入する。このデータセットは、革新的なバージョニングソフトウェアを通じて、テキストの構築におけるすべてのステップを記録できる一連のワークショップから生まれました。
論文参考訳（メタデータ） (2023-02-07T17:52:33Z)
PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文参考訳（メタデータ） (2022-09-30T11:08:39Z)
Letter-level Online Writer Identification [86.13203975836556]
我々は文字レベルのオンラインライタIDという新たな問題に焦点をあてる。主な課題は、しばしば異なるスタイルで手紙を書くことである。我々はこの問題をオンライン書記スタイルのばらつき(Var-O-Styles)と呼ぶ。
論文参考訳（メタデータ） (2021-12-06T07:21:53Z)
Learning to Select Bi-Aspect Information for Document-Scale Text Content Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文参考訳（メタデータ） (2020-02-24T12:52:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。