論文の概要: Sage Deer: A Super-Aligned Driving Generalist Is Your Copilot
- arxiv url: http://arxiv.org/abs/2505.10257v1
- Date: Thu, 15 May 2025 13:08:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.318712
- Title: Sage Deer: A Super-Aligned Driving Generalist Is Your Copilot
- Title(参考訳): Sage Deer:スーパーアラインド・ドライビング・ジェネラリストはコパイロット
- Authors: Hao Lu, Jiaqi Tang, Jiyao Wang, Yunfan LU, Xu Cao, Qingyong Hu, Yin Wang, Yuting Zhang, Tianxin Xie, Yunpeng Zhang, Yong Chen, Jiayu. Gao, Bin Huang, Dengbo He, Shuiguang Deng, Hao Chen, Ying-Cong Chen,
- Abstract要約: 本稿では,スーパーアライン・ゲネラリストのDRivingエージェントであるSAGE DeeRを構築することを目的とする。
異なる人の好みや偏見に応じて異なる反応を達成する。
ユーザの生理的指標を判断するために、マルチビューとマルチモード入力を理解することができる。
- 参考スコア(独自算出の注目度): 37.700397272685905
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The intelligent driving cockpit, an important part of intelligent driving, needs to match different users' comfort, interaction, and safety needs. This paper aims to build a Super-Aligned and GEneralist DRiving agent, SAGE DeeR. Sage Deer achieves three highlights: (1) Super alignment: It achieves different reactions according to different people's preferences and biases. (2) Generalist: It can understand the multi-view and multi-mode inputs to reason the user's physiological indicators, facial emotions, hand movements, body movements, driving scenarios, and behavioral decisions. (3) Self-Eliciting: It can elicit implicit thought chains in the language space to further increase generalist and super-aligned abilities. Besides, we collected multiple data sets and built a large-scale benchmark. This benchmark measures the deer's perceptual decision-making ability and the super alignment's accuracy.
- Abstract(参考訳): インテリジェントな運転コックピットは、インテリジェントな運転の重要な部分であり、異なるユーザの快適さ、インタラクション、安全性のニーズに適合する必要がある。
本稿では,スーパーアライン・ゲネラリストのDRivingエージェントであるSAGE DeeRを構築することを目的とする。
Sage Deer氏は3つのハイライトを達成している。 1) スーパーアライメント: 異なる人の好みやバイアスに応じて異なる反応を達成する。
2)一般論: ユーザの生理的指標, 顔の感情, 手の動き, 身体の動き, 運転シナリオ, 行動決定を判断するために, マルチビューとマルチモード入力を理解することができる。
(3)自己選択:言語空間における暗黙の思考連鎖を誘発し、一般論と超整合能力をさらに増大させる。
さらに、複数のデータセットを収集し、大規模なベンチマークを構築しました。
このベンチマークは、鹿の知覚的意思決定能力とスーパーアライメントの精度を測定する。
関連論文リスト
- Sentient Agent as a Judge: Evaluating Higher-Order Social Cognition in Large Language Models [75.85319609088354]
SAGE(Sentient Agent as a Judge)は、大規模言語モデルの評価フレームワークである。
SAGEは人間のような感情の変化や内的思考をシミュレートするSentient Agentをインスタンス化する。
SAGEは、真に共感的で社会的に適応的な言語エージェントへの進捗を追跡するための、原則付き、スケーラブルで解釈可能なツールを提供する。
論文 参考訳(メタデータ) (2025-05-01T19:06:10Z) - QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds [51.05639500325598]
ペットに匹敵するアジリティで多様なコマンドに従うように設計されたQuadrupedGPTを紹介します。
エージェントは多種多様なタスクを処理し,複雑な指示を行う能力を示し,多種多様四重化エージェントの開発に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-06-24T12:14:24Z) - Personalized Autonomous Driving with Large Language Models: Field Experiments [11.429053835807697]
LLMベースのフレームワークであるTalk2Driveを導入し、自然言語コマンドを実行可能なコントロールに翻訳する。
これは、LLMを現実世界の自動運転車にデプロイする、最初の種類のマルチシナリオフィールド実験である。
提案するメモリモジュールは、パーソナライズされた好みを考慮し、さらに65.2%のテイクオーバ率を低下させる。
論文 参考訳(メタデータ) (2023-12-14T23:23:37Z) - Promptable Behaviors: Personalizing Multi-Objective Rewards from Human
Preferences [53.353022588751585]
本稿では,ロボットエージェントの多種多様な嗜好に対する効率的なパーソナライズを促進する新しいフレームワークであるPromptable Behaviorsを紹介する。
我々は、異なるタイプの相互作用を活用することによって、人間の嗜好を推測する3つの異なる方法を紹介した。
本稿では,ProcTHOR と Robothor のナビゲーションタスクをパーソナライズしたオブジェクトゴールナビゲーションおよびエスケープナビゲーションタスクにおいて,提案手法の評価を行う。
論文 参考訳(メタデータ) (2023-12-14T21:00:56Z) - Hulk: A Universal Knowledge Translator for Human-Centric Tasks [69.8518392427151]
我々は、最初のマルチモーダルな人間中心ジェネラリストモデルであるハルクを提示する。
2Dビジョン、3Dビジョン、スケルトンベース、そしてタスク固有の微調整なしで視覚言語タスクに対処する。
Hulkは11のベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-12-04T07:36:04Z) - A Language Agent for Autonomous Driving [31.359413767191608]
本稿では,人間のような知性を自律運転システムに統合するためのパラダイムシフトを提案する。
当社のアプローチはAgent-Driverと呼ばれ,汎用ツールライブラリを導入して,従来の自律走行パイプラインを変革する。
LLM(Large Language Models)によって駆動されるエージェントドライブには直感的な常識と堅牢な推論能力が備わっています。
論文 参考訳(メタデータ) (2023-11-17T18:59:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。