論文の概要: Self-Consistency for LLM-Based Motion Trajectory Generation and Verification
- arxiv url: http://arxiv.org/abs/2603.29301v1
- Date: Tue, 31 Mar 2026 06:08:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.18435
- Title: Self-Consistency for LLM-Based Motion Trajectory Generation and Verification
- Title(参考訳): LLMに基づく運動軌跡生成と検証のための自己整合性
- Authors: Jiaju Ma, R. Kenny Jones, Jiajun Wu, Maneesh Agrawala,
- Abstract要約: 自己整合性は自然言語推論タスクにおけるLLMの性能向上に有効な手法であることが証明されている。
本研究では,視覚領域に自己整合性を適用する方法について検討する。
- 参考スコア(独自算出の注目度): 34.941540610330655
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-consistency has proven to be an effective technique for improving LLM performance on natural language reasoning tasks in a lightweight, unsupervised manner. In this work, we study how to adapt self-consistency to visual domains. Specifically, we consider the generation and verification of LLM-produced motion graphics trajectories. Given a prompt (e.g., "Move the circle in a spiral path"), we first sample diverse motion trajectories from an LLM, and then identify groups of consistent trajectories via clustering. Our key insight is to model the family of shapes associated with a prompt as a prototype trajectory paired with a group of geometric transformations (e.g., rigid, similarity, and affine). Two trajectories can then be considered consistent if one can be transformed into the other under the warps allowable by the transformation group. We propose an algorithm that automatically recovers a shape family, using hierarchical relationships between a set of candidate transformation groups. Our approach improves the accuracy of LLM-based trajectory generation by 4-6%. We further extend our method to support verification, observing 11% precision gains over VLM baselines. Our code and dataset are available at https://majiaju.io/trajectory-self-consistency .
- Abstract(参考訳): 自己整合性は、軽量で教師なしの方法で自然言語推論タスクにおけるLLM性能を改善する効果的な手法であることが証明されている。
本研究では,視覚領域に自己整合性を適用する方法について検討する。
具体的には,LLM生成モーショングラフィックトラジェクトリの生成と検証について検討する。
プロンプト(例えば "Move the circle in a spiral path")が与えられたら、まず LLM から様々な運動軌跡をサンプリングし、クラスタリングによって一貫した軌跡の群を同定する。
我々の重要な洞察は、プロンプトに付随する形状の族を、幾何変換の群(例えば、剛性、類似性、アフィン)と組み合わせたプロトタイプの軌跡としてモデル化することである。
2つの軌道は、変換群によって許容されるワープの下で他方に変換できるならば、一貫したと見なすことができる。
候補変換群間の階層的関係を利用して,形状ファミリを自動的に復元するアルゴリズムを提案する。
提案手法はLLMに基づく軌道生成の精度を4-6%向上させる。
VLMベースラインよりも11%精度の高いゲインを観測し,検証を支援するため,本手法をさらに拡張する。
私たちのコードとデータセットはhttps://majiaju.io/trajectory-self-consistency で公開されています。
関連論文リスト
- Self-Rewarding Sequential Monte Carlo for Masked Diffusion Language Models [58.946955321428845]
本研究は自己回帰型モンテカルロ(SMC)を提示する。
提案アルゴリズムは,既存のMDLMのほとんどが信頼性に基づくサンプリング戦略に依存している点に起因している。
粒子重み付けのための自己回帰信号として軌道レベルの信頼性を導入する。
論文 参考訳(メタデータ) (2026-02-02T09:21:45Z) - Concise Geometric Description as a Bridge: Unleashing the Potential of LLM for Plane Geometry Problem Solving [50.05273675575345]
PlaneThought Problem Solving (PGPS) は幾何学図と問題テキスト記述に基づく平面幾何学的問題を解決することを目的としている。
大規模言語モデル(LLM)は強力な推論能力を有しており、PGPSへの直接的な応用は視覚図の処理能力の欠如によって妨げられている。
視覚図の幾何学的記述を生成するためにMLLMインタープリタを訓練し、既製のLCMを用いて推論を行う。
論文 参考訳(メタデータ) (2026-01-29T02:03:33Z) - LLM-ML Teaming: Integrated Symbolic Decoding and Gradient Search for Valid and Stable Generative Feature Transformation [20.899800063233]
本稿では,LLMのシンボル生成とMLの勾配ステアリング検索を組み合わせたチーム編成フレームワークを提案する。
実験の結果、チーム分けポリシは、ダウンストリームのパフォーマンスを5%改善し、エラーケースのほぼ半分を削減できることがわかった。
論文 参考訳(メタデータ) (2025-06-10T08:10:16Z) - Improving Consistency in Large Language Models through Chain of Guidance [9.040736633675136]
Chain of Guidance (CoG)は、大規模言語モデル(LLM)から高度に一貫した出力を生成する多段階プロンプト技術である。
我々は、一貫した入出力ペアからなる合成データセットを用いて、一貫した正しい出力を生成する。
我々の微調整モデルは、ベースモデルに比べて2倍以上の一貫性があり、微調整プロセスで使用されていないデータセットに対して一貫した出力を生成することにより、強力な一般化能力を示す。
論文 参考訳(メタデータ) (2025-02-21T20:41:37Z) - Improving Autoregressive Visual Generation with Cluster-Oriented Token Prediction [52.09472099976885]
IARは、LLMベースのビジュアル生成モデルのトレーニング効率と生成品質を向上させる改良された自動回帰ビジュアル生成方法である。
提案手法は,モデルのトレーニング効率と性能を100Mから1.4Bに継続的に向上させ,同じFIDを達成しながらトレーニング時間を半減させる。
論文 参考訳(メタデータ) (2025-01-01T15:58:51Z) - Transformer Block Coupling and its Correlation with Generalization in LLMs [3.007031501305338]
トークン埋め込みの軌跡をトランスフォーマーブロックを通過して解析し、ジャコビアン行列を通してこれらの軌跡に沿って系を線形化する。
我々は,多言語モデルにおけるtextbftransformer ブロックの結合現象を明らかにし,トークンと深さをまたいだ頂点特異ベクトルの結合を特徴とする。
さらに,これらの特性が学習中にどのように出現するかを考察し,結合の進行,線形性の向上,トークン軌道の層ワイド指数的成長を観察する。
論文 参考訳(メタデータ) (2024-07-10T16:30:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。