VideoWorld: Exploring Knowledge Learning from Unlabeled Videos [119.4] この研究は、深層生成モデルが視覚入力のみから複雑な知識を学習できるかどうかを考察する。
我々は、未ラベルのビデオデータに基づいて訓練された自動回帰ビデオ生成モデルであるVideoWorldを開発し、ビデオベースのGoとロボット制御タスクにおける知識獲得能力をテストする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:44:18 GMT)
SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines [118.8] 大規模言語モデル(LLM)は、数学、物理学、計算機科学などの学問分野において顕著な熟練性を示している。
しかしながら、人間の知識は200以上の専門分野を含み、既存のベンチマークの範囲をはるかに超えている。
285分野にわたる大学院レベルの知識と推論能力を評価するベンチマークであるSuperGPQAを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:35:52 GMT)
DSPNet: Dual-vision Scene Perception for Robust 3D Question Answering [107.0] 3次元質問回答(3D QA)では、テキストによって記述された位置の3Dシーンを理解し、周囲の環境を判断し、その状況下での質問に答える必要がある。
既存の手法は通常、純粋な3次元点雲からのグローバルなシーン認識に依存しており、マルチビュー画像からのリッチな局所テクスチャの詳細の重要性を見落としている。
本稿では,DSPNet(Dual-vision Scene Perception Network)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:13:53 GMT)
ExpertPrompting: Instructing Large Language Models to be Distinguished Experts [97.3] 本稿では,エキスパートとして回答する大規模言語モデルの可能性を引き出すために,ExpertPromptingを提案する。
我々はGPT-3.5を使って新しい命令追跡データを作成し、ExpertLLaMAと呼ばれる競合するオープンソースのチャットアシスタントを訓練する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:28:39 GMT)
DelTA: An Online Document-Level Translation Agent Based on Multi-Level Memory [96.4] 大規模言語モデル(LLM)のための文書レバレッジ翻訳エージェントであるDelTAを紹介する。
DelTAは、様々な粒度とスパンにまたがる情報を格納するマルチレベルメモリ構造を備えている。
実験結果から,DelTAは翻訳の一貫性や品質において,強いベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:50:44 GMT)
OTTER: A Vision-Language-Action Model with Text-Aware Visual Feature Extraction [95.6] Vision-Language-Action(VLA)モデルは、視覚的な観察と言語指示に基づいてロボット行動を予測することを目的としている。
既存のアプローチでは、視覚的特徴と言語的特徴が独立して下流ポリシーに供給されるため、微調整済みの視覚言語モデル(VLM)が必要である。
本稿では,テキスト認識による視覚的特徴抽出によって既存のアライメントを活用する新しいVLAアーキテクチャOTTERを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:44:48 GMT)
Protecting multimodal large language models against misleading visualizations [94.7] そこで本研究では,MLLMの性能向上のための6つの推論時間手法を提案する。
この方法は、誤解を招く可視化の性能を15.4から19.6ポイント向上させる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:26:45 GMT)
NVILA: Efficient Frontier Visual Language Models [90.4] 我々は、効率と精度の両方を最適化するために設計されたオープンビジュアル言語モデル(VLM)のファミリであるNVILAを紹介する。
VILA上に構築したモデルアーキテクチャは,まず空間分解能と時間分解能をスケールアップし,次に視覚トークンを圧縮することによって改善する。
我々は、NVILAのライフサイクル全体を通して、トレーニングや微調整から展開までの効率を高めるための体系的な調査を行っている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:57:01 GMT)
GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control [88.9] 本稿では,正確なカメラ制御と時間的3次元一貫性を備えた生成ビデオモデルGEN3Cを提案する。
以上の結果から,従来の作業よりも精密なカメラ制御と,スパースビューの新規ビュー合成の最先端結果が得られた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:59:50 GMT)
Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction [88.2] 大規模で未処理のデータセットでマルチモーダル生成モデルをトレーニングすることで、ユーザは有害で安全でない、議論の余地のない、文化的に不適切なアウトプットにさらされる可能性がある。
我々は、安全な埋め込みと、より安全な画像を生成するために、潜伏空間の重み付け可能な総和による修正拡散プロセスを活用する。
安全と検閲のトレードオフを特定し、倫理的AIモデルの開発に必要な視点を提示します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:45:55 GMT)
Training a Generally Curious Agent [86.8] PAPRIKAは,言語モデルによる一般的な意思決定機能の開発を可能にする微調整手法である。
PAPRIKAで微調整されたモデルは、学習した意思決定能力を全く見えないタスクに効果的に移行できることを示す実験結果が得られた。
これらの結果は、新しいシーケンシャルな意思決定問題を自律的に解決できるAIシステムへの有望な道のりを示唆している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:53:52 GMT)
On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.8] 本研究では,(マルチモーダル)自己教師型表現学習のデータ予測タスクにおいて,連続領域における識別確率モデルについて検討する。
我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。
MISが要求する条件付き確率密度の和を近似する新しい非パラメトリック手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:36:02 GMT)
Kimi k1.5: Scaling Reinforcement Learning with LLMs [84.2] 我々は、強化学習で訓練された最新のマルチモーダル言語モデル、Kimi k1.5の訓練実践について報告する。
長いコンテキストスケーリングと改善されたポリシー最適化手法が、我々のアプローチの鍵となる要素である。
本システムは,複数のベンチマークやモダリティに対して,最先端の推論性能を実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:16:32 GMT)
HunyuanVideo: A Systematic Framework For Large Video Generative Models [82.4] HunyuanVideoは、革新的なオープンソースのビデオファンデーションモデルだ。
データキュレーション、高度なアーキテクチャ設計、プログレッシブモデルスケーリング、トレーニングが組み込まれている。
その結果,13億以上のパラメータを持つビデオ生成モデルの訓練に成功した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:48:15 GMT)
Opportunistic Routing in Wireless Communications via Learnable State-Augmented Policies [80.8] 本稿では,大規模無線通信ネットワークにおけるパケットベースの情報ルーティングの課題に対処する。
機会的ルーティングは、無線通信の放送特性を利用して、最適な転送ノードを動的に選択する。
ネットワーク内のソースノードが処理する全情報の最大化を目的とした,状態拡張(SA)に基づく分散最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:44:56 GMT)
Convergence Rates for Softmax Gating Mixture of Experts [78.4] 機械学習モデルの効率性とスケーラビリティを向上するための効果的なフレームワークとして、Mixture of Expert (MoE)が登場した。
MoEの成功の中心は、適応的なソフトマックスゲーティングメカニズムであり、各専門家の入力に対する関連性を決定する責任を負い、それぞれの重みを動的に専門家に割り当てる。
標準ソフトマックスゲーティングまたはその変種を備えたMoEの下で,パラメータ推定と専門家推定の収束解析を行い,密度とスパースゲーティングと階層ソフトマックスゲーティングを含む。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:11:24 GMT)
Towards Understanding Text Hallucination of Diffusion Models via Local Generation Bias [76.9] 本稿では,拡散モデルが個々のシンボルを正しく生成するが,それらを意味のない方法で組み立てるテキスト幻覚に焦点を当てる。
このような現象は,ネットワークの局所的生成バイアスに起因すると考えられる。
また、ハイパーキューブ上の2層学習パリティポイントを含む特定のケースのトレーニングダイナミクスを理論的に解析する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:28:50 GMT)
TimeRefine: Temporal Grounding with Time Refining Video LLM [76.0] ビデオの時間的接地は、テキストのプロンプトが与えられたビデオの中で、関連する時間的境界をローカライズすることを目的としている。
我々は時間的接地タスクを時間的精錬タスクとして再構成する。
我々は、予測セグメントが基底真理からさらに逸脱した場合、モデルをよりペナルティ化する補助予測ヘッドを組み込む。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:06:15 GMT)
StableToolBench: Towards Stable Large-Scale Benchmarking on Tool Learning of Large Language Models [74.9] ToolBenchから進化したベンチマークであるStableToolBenchを紹介します。
仮想APIサーバには、キャッシングシステムとAPIシミュレータが含まれており、APIステータスの変更を緩和するための補完となる。
安定評価システムは、GPT-4を自動評価器として使用し、評価中のランダム性を排除し、解決可能なパスと勝利率を設計する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:39:03 GMT)
PowerAttention: Exponentially Scaling of Receptive Fields for Effective Sparse Attention [73.3] 大きな言語モデル(LLM)は、長いコンテキストを処理する場合の注意機構の二次的な複雑さによって、効率のボトルネックに直面します。
本稿では,効果的かつ完全なコンテキスト拡張を容易にする新しいスパークアテンション設計であるPowerAttentionを紹介する。
実験によると、PowerAttentionは既存の静的スパースアテンションメソッドを5sim 40%$で上回っている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:24:11 GMT)
Effective LLM Knowledge Learning via Model Generalization [73.2] 大規模言語モデル(LLM)は、広範囲な世界知識を含む膨大なドキュメントに基づいて訓練されている。
自己回帰的な事前学習を通じて知識がどのように獲得されるかは、まだよく理解されていない。
本稿では,LLM知識学習の理解と改善に焦点をあてる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:56:20 GMT)
GuardSplat: Efficient and Robust Watermarking for 3D Gaussian Splatting [70.8] 3D Gaussian Splatting (3DGS)は最近、様々なアプリケーションのための印象的な3Dアセットを作成した。
既存の透かし方式は、セキュリティ、キャパシティ、可視性を考慮した3DGSレンダリングパイプラインには適していない。
本稿では、3DGS資産の著作権を効果的に保護する革新的で効率的なフレームワークであるGuardSplatを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:10:52 GMT)
LaRA: Benchmarking Retrieval-Augmented Generation and Long-Context LLMs -- No Silver Bullet for LC or RAG Routing [70.4] 本稿では,RAGとLC LLMを厳格に比較するための新しいベンチマークであるLaRAを提案する。
LaRAは4つのQAタスクカテゴリと3種類の自然発生長文の2326のテストケースを含んでいる。
RAGとLCの最適選択は,モデルのパラメータサイズ,長文機能,コンテキスト長,タスクタイプ,取得したチャンクの特性など,複雑な相互作用に依存する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:48:25 GMT)
SEOE: A Scalable and Reliable Semantic Evaluation Framework for Open Domain Event Detection [70.2] オープンドメインイベント検出のためのスケーラブルで信頼性の高いセマンティックレベルの評価フレームワークを提案する。
提案フレームワークはまず,現在7つの主要ドメインをカバーする564のイベントタイプを含む,スケーラブルな評価ベンチマークを構築した。
次に,大言語モデル(LLM)を自動評価エージェントとして活用し,意味的類似ラベルのきめ細かい定義を取り入れた意味的F1スコアを計算する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:37:05 GMT)
MagicDrive-V2: High-Resolution Long Video Generation for Autonomous Driving with Adaptive Control [68.7] MagicDrive-V2は、MVDiTブロックと時空間条件エンコーディングを統合し、マルチビュービデオ生成と正確な幾何学的制御を可能にする新しいアプローチである。
これは、解像度が3.3倍、フレーム数が4.4倍のマルチビュー駆動ビデオ合成を可能にする(現在のSOTAと比較)。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:24:34 GMT)
Towards Robust Universal Information Extraction: Benchmark, Evaluation, and Solution [66.1] 既存の堅牢なベンチマークデータセットには2つの重要な制限がある。
単一の情報抽出(IE)タスクに対して、限られた範囲の摂動しか生成しない。
LLM(Large Language Models)の強力な生成機能を考慮すると、ruIE-Benchと呼ばれるRobust UIEのための新しいベンチマークデータセットを導入する。
データのうち、 textbf15% しかトレーニングしない場合、3つの IE タスクに対して、平均 textbf7.5% の相対的なパフォーマンス改善につながることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:39:29 GMT)
Not-Just-Scaling Laws: Towards a Better Understanding of the Downstream Impact of Language Model Design Decisions [65.9] 設計選択が言語モデル能力に与える影響を定量化する。
モデルサイズとトレーニングトークンの数以外の機能を組み込むことで、下流のパフォーマンスを予測する能力が3~28%向上する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:46:04 GMT)
ZAugNet for Z-Slice Augmentation in Bio-Imaging [65.5] ZAugNetは、生物画像のz分解能を高めるための高速で正確で自己教師型のディープラーニング手法である。
連続スライス間の非線形距離を実行することで、ZAugNetは各イテレーションで分解能を効果的に倍にする。
ZAugNet+は任意の距離で連続的な予測を可能にする拡張版である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:50:35 GMT)
Improving LLM Safety Alignment with Dual-Objective Optimization [65.4] 大規模言語モデル(LLM)の既存のトレーニング時間安全アライメント技術は、ジェイルブレイク攻撃に対して脆弱なままである。
本研究では,DPOの目的を2つの構成要素にまとめる安全アライメントの改善について提案する。(1) 安全でない世代が部分的に発生しても拒否を促す頑健な拒絶訓練,(2) 有害な知識の未学習。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:01:05 GMT)
An Undetectable Watermark for Generative Image Models [65.3] 生成画像モデルに対する検出不能な最初の透かし方式を提案する。
特に、検出不能な透かしは、効率的に計算可能なメートル法で画質を劣化させることはない。
提案手法は,擬似乱数誤り訂正符号を用いて拡散モデルの初期潜時間を選択する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:06:53 GMT)
Unified Human Localization and Trajectory Prediction with Monocular Vision [64.2] MonoTransmotionはトランスフォーマーベースのフレームワークで、モノクロカメラのみを使用して、ローカライゼーションと予測タスクを共同で解決する。
両タスクを統合フレームワークで共同でトレーニングすることにより,ノイズの多い入力による実環境シナリオにおいて,我々の手法がより堅牢であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:18:39 GMT)
Deblur-Avatar: Animatable Avatars from Motion-Blurred Monocular Videos [64.1] 本研究では,モーションブルモノクロビデオ入力から高忠実でアニマタブルな3次元アバターをモデリングするための新しいフレームワークを提案する。
被曝時の人体運動軌跡を明示的にモデル化することにより、鋭く高品質な人体アバターを再構築するために、軌跡と3Dガウスアンを共同で最適化する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:32:31 GMT)
Number Cookbook: Number Understanding of Language Models and How to Improve It [64.0] 大規模言語モデル(LLM)は、基本的な数値的な理解と処理において予期せぬ誤りを犯しながら、複雑な推論タスクの増大を解決することができる。
本稿では,LLMの数値理解と処理能力(NUPA)について包括的に検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:52:30 GMT)
RoboSense: Large-scale Dataset and Benchmark for Egocentric Robot Perception and Navigation in Crowded and Unstructured Environments [62.6] 我々は3種類のセンサー(Camera, LiDAR, Fisheye)をベースとした自我中心型マルチセンサデータ収集プラットフォームを構築した。
大規模なマルチモーダルデータセットであるRoboSenseは、エゴセントリックなロボット知覚を促進するために構築されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:14:34 GMT)
CTC-DRO: Robust Optimization for Reducing Language Disparities in Speech Recognition [61.9] グループ分散ロバストな最適化(グループDRO)は、最悪のグループ損失を最小限に抑えてこの問題に対処するが、グループ損失がグループ間の性能差を誤って表すと失敗する。
CTC-DROは群重み更新をスムースにすることで群DRO目標の欠点に対処し,一貫した高損失群に対する過剰エンハンシスを防ぐ。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:25:07 GMT)
AutoG: Towards automatic graph construction from tabular data [60.9] 本稿では,グラフ構築問題を形式化し,効果的な解法を提案する。
既存の自動工法は特定の場合にのみ適用できる。
本稿では,グラフ構築手法の形式化と評価を行うデータセットについて述べる。
第2に,高品質なグラフスキーマを自動生成するLLMベースのソリューションAutoGを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:38:57 GMT)
EgoLife: Towards Egocentric Life Assistant [60.5] 我々はEgoLifeを紹介した。EgoLifeは、AIを使ったウェアラブルグラスを通じて、個人の効率を向上するエゴセントリックなライフアシスタントを開発するプロジェクトだ。
我々は、6人の参加者が1週間一緒に暮らし、マルチモーダル・エゴセントリックなビデオキャプチャーにAIグラスを使用して日々の活動を継続的に記録し、同期された3人称ビデオ参照を行う総合的なデータ収集研究を行った。
この取り組みの結果、EgoLifeデータセットは、集中的なアノテーションを備えた300時間のエゴセントリック、対人、マルチビュー、マルチモーダルの日常生活データセットである。
私たちはEgoLifeQAを紹介します。EgoLifeQAは、長いコンテキスト、ライフ指向の質問応答タスクのスイートで、提供するように設計されています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:54:16 GMT)
Exploiting Vulnerabilities in Speech Translation Systems through Targeted Adversarial Attacks [59.9] 本稿では,非知覚的音声操作による音声翻訳システム構築手法について検討する。
本研究では,(1)ソース音声への摂動注入,(2)ターゲット翻訳を誘導する対向音楽の生成という2つの革新的なアプローチを提案する。
我々の実験では、注意深く作られた音声摂動は、ターゲットとなる有害な出力を生成するために翻訳モデルを誤解させる可能性があるが、敵対的な音楽はこの目標をより隠蔽的に達成する。
この研究の意味は、直ちにセキュリティ上の懸念を越えて、ニューラル音声処理システムの解釈可能性と堅牢性に光を当てることである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:07:49 GMT)
The Box is in the Pen: Evaluating Commonsense Reasoning in Neural Machine Translation [59.1] 本稿では,ニューラルマシン翻訳の常識推論能力を評価するためのテストスイートを提案する。
ソース文と2つのコントラスト翻訳を含む1200のトリプルを手作業で作成します。
実験と解析により,ニューラルマシン翻訳は3種類のあいまいさの常識的推論において不十分であることが示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:41:03 GMT)
Rethinking Video Tokenization: A Conditioned Diffusion-based Approach [58.2] underlinetextbfConditioned underlinetextbfDiffusion-based video underlinetextbfTokenizer
Ourmethodは1ステップのサンプリングだけでビデオ再構成作業における最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:59:19 GMT)
RIDE: Enhancing Large Language Model Alignment through Restyled In-Context Learning Demonstration Exemplars [57.7] 調整調整は、大きな言語モデル(LLM)が倫理的かつ有用な振る舞いを確実にするために不可欠である。
本稿では,LLMアライメントを向上させるために,ICL(In-context Learning)を用いた低コストでチューニング不要な手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:38:19 GMT)
Enhancing Spoken Discourse Modeling in Language Models Using Gestural Cues [56.4] 本研究では,人間の動作系列と言語を用いたジェスチャーの協調モデリングにより,音声談話モデルの改善が期待できるかどうかを考察する。
ジェスチャーを言語モデルに統合するために,まずVQ-VAEを用いて3次元の人間の動作シーケンスを離散的なジェスチャートークンに符号化する。
その結果,ジェスチャを組み込むことで,3つのタスクのマーカー予測精度が向上した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:10:07 GMT)
ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning [55.2] 我々は、チャート領域における既製のマルチモーダル言語モデル(MLLM)の能力をベンチマークする。
ChartXは18種類のチャートタイプ,7つのチャートタスク,22のディシプリナトピック,高品質なチャートデータを含むマルチモーダルな評価セットである。
我々は、解釈可能なパターンに強く依存するマルチモーダルタスクに対する新しい視点を提供するため、ChartVLMを開発した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:41:21 GMT)
LLM as GNN: Graph Vocabulary Learning for Text-Attributed Graph Foundation Models [54.8] Text-Attributed Graphs (TAG) は、現実のシナリオにおいてユビキタスである。
大規模言語モデル(LLMs)とグラフニューラルネットワーク(GNNs)をTAGsに統合する努力にもかかわらず、既存のアプローチは分離されたアーキテクチャに悩まされている。
本稿では,グラフ語彙学習に基づくTAGのための汎用GFMであるPromptGFMを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:45:22 GMT)
CLIP is Strong Enough to Fight Back: Test-time Counterattacks towards Zero-shot Adversarial Robustness of CLIP [54.7] 分類損失を最大化しようとする悪意のある摂動が、誤った画像に繋がることを示す。
本稿では,CLIPの事前学習したビジョンエンコーダを用いて,推論中の敵画像に対する攻撃を行い,ロバスト性を実現することを提案する。
私たちのパラダイムはシンプルで、トレーニング不要で、テスト時にCLIPを敵攻撃から防御する最初の方法を提供します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:51:59 GMT)
Q-Eval-100K: Evaluating Visual Quality and Alignment Level for Text-to-Vision Content [53.7] テキスト間コンテンツヒンジを評価するには、視覚的品質とアライメントの2つの重要な側面がある。
テキスト間コンテンツ(Q-EVAL-100K)の視覚的品質とアライメントレベルを評価するためのデータセットを提案する。
本稿では,Q-Eval-Scoreを提案する。Q-Eval-Scoreは視覚的品質とアライメントの両方を評価できる統一モデルであり,長文のアライメントを処理できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:50:05 GMT)
BHViT: Binarized Hybrid Vision Transformer [53.4] モデルバイナライゼーションは畳み込みニューラルネットワーク(CNN)のリアルタイムおよびエネルギー効率の計算を可能にした。
本稿では,バイナライズフレンドリーなハイブリッドViTアーキテクチャであるBHViTとそのバイナライズモデルを提案する。
提案アルゴリズムは,バイナリ ViT 手法間でSOTA 性能を実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:25:37 GMT)
Curating Demonstrations using Online Experience [52.6] また,Demo-SCOREは手作業によるキュレーションを伴わずに,効果的に準最適動作を識別できることが示唆された。
Demo-SCOREは、全てのオリジナルのデモンストレーションで訓練された基本方針と比較して、結果のポリシーにおいて15~35%以上の絶対的な成功率を達成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:58:16 GMT)
ProReflow: Progressive Reflow with Decomposed Velocity [52.2] フローマッチングは、拡散モデルの拡散過程を数ステップまたは1ステップ生成のために直線に再フローすることを目的としている。
局所的な時間ステップで拡散モデルを段階的に再フローし,拡散全体を進行させるプログレッシブ・リフローを導入する。
また,フローマッチングにおける方向整合の重要性を強調し,位置整合性を考慮したV-Predictionを導入する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:50:53 GMT)
Affordance-Guided Reinforcement Learning via Visual Prompting [51.4] Keypoint-based Affordance Guidance for Improvements (KAGI) は、視覚言語モデル(VLM)によって形成される報酬を自律的なRLに活用する手法である。
自然言語記述によって指定された実世界の操作タスクにおいて、KAGIは自律的なRLのサンプル効率を改善し、30Kのオンライン微調整ステップでタスク完了を成功させる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:53:17 GMT)
Neural DNF-MT: A Neuro-symbolic Approach for Learning Interpretable and Editable Policies [51.0] 本稿では、エンドツーエンドポリシー学習のためのニューラルDNF-MTと呼ばれるニューラルシンボリックアプローチを提案する。
ニューラルDNF-MTモデルの微分可能な性質は、訓練にディープアクター批判アルゴリズムを使用することを可能にする。
決定論的ポリシーの2値表現をどのように編集し、ニューラルモデルに組み込むかを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:04:40 GMT)
ChemVLM: Exploring the Power of Multimodal Large Language Models in Chemistry Area [50.2] textbfChemVLMは、化学応用のためのオープンソースの化学マルチモーダル大規模言語モデルである。
ChemVLMは、テキストと視覚の化学情報の両方を理解する能力を高めるために、慎重にキュレートされたバイリンガルデータセットで訓練されている。
我々はChemVLMを、様々なタスクにおいて、オープンソースおよびプロプライエタリな多モーダルな大規模言語モデルに対してベンチマークする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:43:44 GMT)
Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.0] 大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:24:55 GMT)
DiRe-JAX: A JAX based Dimensionality Reduction Algorithm for Large-scale Data [49.8] DiRe-JAXは、UMAPやtSNEといった従来の手法が直面する課題に対処するために設計された、新しい次元削減ツールキットである。
このツールキットは、最先端の UMAP や tSNE 実装と比較して、データ内のローカル構造とグローバル構造の両方を保存する上で、かなり有望である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:56:01 GMT)
Transformers Use Causal World Models in Maze-Solving Tasks [49.7] 我々は迷路解決タスクで訓練されたトランスフォーマーで世界モデルを特定する。
機能を抑圧するよりも、機能をアクティベートする方が簡単であることが分かりました。
位置符号化方式は、モデルの残留ストリーム内でのワールドモデルがどのように構成されているかに影響を与えるように見える。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:16:16 GMT)
Data Sharing, Privacy and Security Considerations in the Energy Sector: A Review from Technical Landscape to Regulatory Specifications [49.6] 脱炭、分散化、デジタル化は双子のエネルギー遷移を駆動する3つの重要な要素である。
本稿では, 技術と規制の両面を統合することで, エネルギーシステムに関するデータ関連問題を包括的に検討する。
この問題は、(i)エネルギエンドユーザーと利害関係者間のデータ共有(ii)エンドユーザのプライバシ、(iii)サイバーセキュリティの3つのカテゴリに分類される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:23:56 GMT)
DarwinLM: Evolutionary Structured Pruning of Large Language Models [49.6] 大規模言語モデル(LLM)は様々なNLPタスクで大きな成功を収めた。
構造化プルーニングは、モデルを圧縮し、エンドツーエンドのスピード改善を直接提供する、効果的なソリューションを提供する。
本研究では,構造化プルーニングの訓練手法であるDarwinLMを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:50:16 GMT)
LION-FS: Fast & Slow Video-Language Thinker as Online Video Assistant [49.5] また,「Fast & Slow Video-Language Thinker」は,リアルタイム・能動的・時間的・文脈的・正確な応答を実現するオンネバイドアシスト「LION-FS」である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:52:34 GMT)
Long-Sequence Recommendation Models Need Decoupled Embeddings [49.4] 我々は、既存の長期推薦モデルにおいて無視された欠陥を識別し、特徴付ける。
埋め込みの単一のセットは、注意と表現の両方を学ぶのに苦労し、これら2つのプロセス間の干渉につながります。
本稿では,2つの異なる埋め込みテーブルを別々に学習し,注意と表現を完全に分離する,DARE(Decoupled Attention and Representation Embeddings)モデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:48:49 GMT)
COARSE: Collaborative Pseudo-Labeling with Coarse Real Labels for Off-Road Semantic Segmentation [49.3] COARSEはオフロードセマンティックセグメンテーションのための半教師付きドメイン適応フレームワークである。
我々は、協調的な擬似ラベル戦略によって強化された、補完的なピクセルレベルとパッチレベルのデコーダでドメインギャップをブリッジする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:25:54 GMT)
Navigating Intelligence: A Survey of Google OR-Tools and Machine Learning for Global Path Planning in Autonomous Vehicles [49.2] ROMIEと呼ばれる自律的な採鉱ロボットには,グローバルパスプランニングが不可欠である。
Q-Learningは最適な戦略であり、データセット全体の最適解から平均1.2%しか逸脱せず、優れた効率を示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:12:22 GMT)
Information scrambling and entanglement dynamics in Floquet Time Crystals [49.2] 本研究では, 乱れたシステムにおける情報伝達の指標として, 時間外相関器(OTOC)のダイナミクスとエントロピーの絡み合いについて検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:43:14 GMT)
Fidelity Aware Multipath Routing for Multipartite State Distribution in Quantum Networks [49.2] 本稿では,分散率と忠実度を向上した量子ネットワーク上での絡み合ったマルチパーティイト状態の分散問題を考察する。
本稿では,マルチパスルーティングプロトコルを提案するとともに,分散Greenberger-Horne-Zeilinger(GHZ)状態の速度と忠実度の観点から,その性能を単一パスルーティングと比較する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:00:11 GMT)
Emptiness Instanton in Quantum Polytropic Gas [49.2] この問題は、気体の基底状態における空の間隔の自然発生の確率を決定することである。
虚空時間における流体力学方程式の解法により、空のインスタントンの解析形式を導出する。
この解は、等角体論における相関関数に類似した積分表現として表される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:35:12 GMT)
On-Policy Self-Alignment with Fine-grained Knowledge Feedback for Hallucination Mitigation [47.4] 幻覚は、大きな言語モデルが応答生成時の知識の境界から逸脱する振る舞いを示すときに起こる。
従来の学習に基づく手法はモデルを微調整しようとするが、非政治的なサンプリングと粗い粒度のフィードバックによって制限される。
RLFHは、LLMが自らの知識境界と自己正しい生成挙動を積極的に探求することを可能にする、政治上の自己調整手法である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:34:06 GMT)
CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition [47.1] 本稿では,RGB-D屋内位置認識のための新しいアルゴリズムであるCSCPRを提案する。
位置認識のためのRGBドメインに主にフォーカスする従来のアプローチとは異なり、CSCPRはRGB-Dデータを扱うように設計されている。
クロスソースおよびクロススケールなRGB-Dポイントクラウドを扱うためにCoCを適用し、再ランク付けのための2つの新しいモジュールを導入します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:32:49 GMT)
Process-based Self-Rewarding Language Models [47.1] 大規模言語モデルは、様々な下流タスクで優れたパフォーマンスを示し、複数のシナリオで広く適用されてきた。
人間の嗜好データは、人間のパフォーマンスの上限に制約されるLCMの性能をさらに向上させるために訓練に使用される。
本稿では,LLM-as-a-Judgeとステップワイズ優先最適化を導入した,言語モデルのためのプロセスベースの自己回帰パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:58:44 GMT)
Seldonian Reinforcement Learning for Ad Hoc Teamwork [47.1] ほとんどのオフラインRLアルゴリズムは最適なポリシーを返すが、望ましくない振る舞いに関する統計的保証は提供しない。
本研究では,セルドン最適化に触発された新しいオフラインRL手法を提案する。
エージェントは事前調整なしに新しいチームメイトと協力する必要があります。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:37:02 GMT)
Addressing Overprescribing Challenges: Fine-Tuning Large Language Models for Medication Recommendation Tasks [47.0] 医療レコメンデーションシステムは、患者の臨床データに基づいて、パーソナライズされた効果的な薬物の組み合わせを提供する可能性について、医療機関内で注目を集めている。
既存の手法は、多様な電子健康記録(EHR)システムに適応する際の課題に直面する。
本稿では,Language-Assisted Medication Recommendation (LAMO)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:28:16 GMT)
The Last Iterate Advantage: Empirical Auditing and Principled Heuristic Analysis of Differentially Private SGD [46.7] ノイズカットされた勾配勾配(DP-SGD)の簡易なプライバシー解析法を提案する。
各種トレーニング手順に適用したプライバシー監査の結果を予測できることを実験的に示す。
既存のプライバシー監査攻撃は、視覚と言語の両方のタスクにおける分析によって制限されていることを実証的に示しています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:39:17 GMT)
Solving the Catastrophic Forgetting Problem in Generalized Category Discovery [46.6] Generalized Category Discovery (GCD)は、ラベルなしデータセット内の既知のカテゴリと新しいカテゴリの混合を識別することを目的としている。
最近の最先端手法SimGCDは、既知のクラスデータからの知識を、偏りのある学習を通して、新しいクラスの学習に転送する。
本稿では,従来の手法にシームレスに統合された新しい学習手法であるLegoGCDを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:26:07 GMT)
A Practical Memory Injection Attack against LLM Agents [46.4] MINJAは、クエリと出力観察を通してエージェントとのみ対話することで、悪意のあるレコードをメモリバンクに注入することができる。
MINJAは、任意のユーザがエージェントメモリに影響を与え、LLMエージェントの実践的なリスクを強調します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:53:24 GMT)
Implicit Diffusion: Efficient Optimization through Stochastic Sampling [46.0] パラメータ化拡散により暗黙的に定義された分布を最適化するアルゴリズムを提案する。
本稿では,これらのプロセスの1次最適化のための一般的なフレームワークについて紹介する。
エネルギーベースモデルのトレーニングや拡散の微調整に応用する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:22:24 GMT)
The Large-Scale Structure of Entanglement in Quantum Many-body Systems [45.0] 本研究では,多体系の熱力学的限界は,有限サイズ系では検出が難しい絡み合い特性を明らかにすることができることを示す。
特に、Dgeq 2$次元の任意のギャップのある物質相、たとえ自明なものであっても、最も強い二部構造を持つモデルを含むことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:01:05 GMT)
Spectral truncation of out-of-time-ordered correlators in dissipative system [45.0] 時間外秩序付き相関器(OTOC)は、量子カオスと情報の揺らぎを診断するための強力なツールとして登場した。
本研究では,DMKRをパラダイムモデルとして,オープン量子系におけるOTOCのスペクトル分解について検討する。
本研究は, 散逸性量子系のOTOCを理解するための定量的枠組みを提供し, オープン量子プラットフォームにおける実験的探索のための新たな道筋を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:22:25 GMT)
Cross-modal Causal Relation Alignment for Video Question Grounding [45.0] ビデオQG(Video question grounding)では、質問に答え、関連するビデオセグメントを同時に推論して回答をサポートする必要がある。
既存のビデオQG手法は、通常、急激な相互モーダルな相関に悩まされ、意図された問題と一致した支配的な視覚シーンを特定することに失敗する。
本稿では,CRA(Cross-modal Causal Relation Alignment)と呼ばれる新しいビデオQGフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:36:32 GMT)
Provable Benefits of Task-Specific Prompts for In-context Learning [44.8] 本研究では,グローバルなタスク分布を条件付きタスク分布の結合に分割できる新しい設定について考察する。
次に,タスク固有のプロンプトと予測ヘッドを用いて,一層アテンションモデルを用いて条件付きタスク分布に関連する事前情報を学習する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:18:33 GMT)
Top-K Maximum Intensity Projection Priors for 3D Liver Vessel Segmentation [44.7] 我々は,各投影方向に沿って積分を置き換えることでCT再構成を模倣するトップk最大強度投影の概念を導入する。
我々はこれらのトップk最大射影を用いて拡散モデルを作成し,3次元肝血管木を生成する。
我々は,3D-ircadb-01データセットを用いた3D肝・血管のセグメンテーションを評価し,Diceの交叉,係数オーバーユニオン(IoU),感度スコアを先行研究と比較した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:43:01 GMT)
Reasoning to Attend: Try to Understand How <SEG> Token Works [44.3] 我々は、$texttSEG>$ tokenが画像とテキストのペア内のセマンティックな類似性に寄与していることを示す。
本稿では,高活性点の誘導の下で,LMMの高強度な$textbfREA$soning機能を実現するREADを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:55:51 GMT)
Verifiable and Provably Secure Machine Unlearning [44.1] 機械学習は、トレーニング後の機械学習モデルのトレーニングデータセットからポイントを取り除くことを目的としている。
未学習システムの保証を正式に把握するために,検証可能な未学習の暗号的定義を初めて提示する。
我々は,3種類の非学習手法のプロトコルを実装し,線形回帰,ロジスティック回帰,ニューラルネットワークの実現可能性を検証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:30:22 GMT)
KiVA: Kid-inspired Visual Analogies for Testing Large Multimodal Models [43.9] 本稿では,大型マルチモーダルモデル(LMM)における視覚的類似推論について,大人や子供と比較して検討する。
我々は,視覚的類似推論に基づくLMMのテストを行うために,日常オブジェクトの4300の視覚的変換のベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:07:12 GMT)
MAS-GPT: Training LLMs to Build LLM-based Multi-Agent Systems [43.4] 我々は、MASを生成言語タスクとして再定義することで、MASを構築するプロセスを簡単にする。
一貫性のあるクエリ-MASペアからなる高品質なデータセットを作成する。
生成されたMASは、ユーザクエリをシームレスに処理し、高品質なレスポンスを提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:27:59 GMT)
Property Enhanced Instruction Tuning for Multi-task Molecule Generation with Large Language Models [43.4] 分子関連タスクのための大規模言語モデルを改善するための2段階のフレームワークPEITを提案する。
最初のステップでは、PEIT-GENと呼ばれるモデルを事前訓練するために、テキスト記述、SMILES、生化学的特性をマルチモーダル入力として使用します。
2番目のステップでは、既存のオープンソースLCMを合成データで微調整し、PEIT-LLMは分子キャプション、テキストベースの分子生成、分子特性予測、新たに提案したマルチ制約分子生成タスクを処理できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:08:32 GMT)
POMDP-Driven Cognitive Massive MIMO Radar: Joint Target Detection-Tracking In Unknown Disturbances [43.0] この研究は、トラッキングと検出タスクを強化するために、部分的に観測可能なマルコフ決定プロセスフレームワークの適用について検討する。
提案手法では,ノイズ統計に関するアプリオリ知識を必要としないオンラインアルゴリズムを用いる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:05:23 GMT)
Task-optimal data-driven surrogate models for eNMPC via differentiable simulation and optimization [42.7] 特定の制御タスクにおいて最適な性能を示すために,クープマンシュロゲートモデルのエンドツーエンド学習法を提案する。
我々は,既存の経済非線形モデル予測制御(eNMPC)のケーススタディにおいて,他のトレーニングアルゴリズムと比較することにより,本手法の性能を評価する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:54:52 GMT)
Enhancing Non-English Capabilities of English-Centric Large Language Models through Deep Supervision Fine-Tuning [42.2] 本稿では、モデルの内部層にさらなる監視を取り入れ、ワークフローをガイドする深層監視微調整法(DFT)を提案する。
提案手法は,非英語入力処理における最終生成結果だけでなく,内部表現の精度も保証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:10:07 GMT)
Rethinking Synthetic Data definitions: A privacy driven approach [42.1] 合成データは、AI開発におけるデータ要求の増加に対するコスト効率のよいソリューションである。
従来の合成データ型の分類は、新しい世代技術に合わない。
我々は、規制政策立案を支援するために、プライバシー評価をより良く支援する合成データタイプをグループ化する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:54:13 GMT)
Breaking Class Barriers: Efficient Dataset Distillation via Inter-Class Feature Compensator [42.0] クラス間特徴補償器(INFER)は、クラス固有のデータラベルフレームワークを超越した革新的な蒸留手法である。
INFERは、蒸留中のクラス間相互作用を強化し、蒸留データの有効性と一般化性を高める。
実際にINFERは、ベンチマークデータセット間で最先端のパフォーマンスを実証している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:35:41 GMT)
State Space Models are Provably Comparable to Transformers in Dynamic Token Selection [41.6] 状態空間モデル(SSM)に基づくディープニューラルネットワークは、シーケンスモデリングにおいて大きな注目を集めている。
SSMは入力に応じて重要なトークンを抽出する際にトランスフォーマーに匹敵することを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:15:19 GMT)
LoLCATs: On Low-Rank Linearizing of Large Language Models [41.6] Low-rank Linear Conversion via Attention Transfer (LoLCATs) は、メモリと計算量を大幅に削減して線形化品質を向上させる単純な2段階法である。
LoLCATsは、線形化品質、トレーニング効率、スケーラビリティを大幅に改善する。
我々はLlama 3 8B と Mistral 7B v0.1 から最先端のサブクアッドラティック LLM を作成し、5ショット MMLU に対して20以上の改善点を得た。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:57:04 GMT)
Rebalanced Multimodal Learning with Data-aware Unimodal Sampling [39.8] We propose a novel MML approach called underlineData-aware underlineUnimodal underlineSampling(method)。
学習状況に基づいて、強化学習(RL)に基づくデータ認識アンモダルサンプリング手法を提案する。
本手法は,プラグインとして既存のほとんどすべてのマルチモーダル学習手法にシームレスに組み込むことができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:19:31 GMT)
Constrained many-body phases in a $\mathbb{Z}_2$-Higgs lattice gauge theory [39.6] 単位充填時のソフトコアボソニック物質に結合した1次元のmathbbZ$格子ゲージ理論について検討する。
解析的摂動的アプローチの組み合わせにより、ゲージ場を媒介とする共振ペアホッピングによって駆動されるリッチ位相図が発見された。
多数のゆらぎを持つ束縛状態の存在は、ハイブリッドボソン量子ビット量子シミュレーションプラットフォームにおける実験的な実現を動機付けている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:00:07 GMT)
HeTGB: A Comprehensive Benchmark for Heterophilic Text-Attributed Graphs [38.8] グラフニューラルネットワーク(GNN)は、ホモフィリーを前提とした関係データのモデリングに成功している。
多くの実世界のグラフはヘテロフィリーを示し、連結ノードは異なるカテゴリに属したり、多様な属性を持つ。
Heterophilic Text-attributed Graph Benchmark (HeTGB) は、多様なドメインから5つの実世界の異種グラフデータセットからなる新しいベンチマークである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:00:32 GMT)
CDS: Data Synthesis Method Guided by Cognitive Diagnosis Theory [38.3] 大規模言語モデル(LLM)は大きな進歩を遂げているが、タスクの複雑さが増し、高いパフォーマンス要求が継続的改善の必要性を浮き彫りにしている。
いくつかの手法は、列車モデルの評価結果に基づいて、先進LLMによって生成された合成データを利用する。
本稿では,認知診断理論(CDT)にインスパイアされた診断プロセスを取り入れた認知診断合成(CDS)手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:39:05 GMT)
Developing and Utilizing a Large-Scale Cantonese Dataset for Multi-Tasking in Large Language Models [37.9] 8500万人以上のネイティブスピーカーを持っているにもかかわらず、カントン語は依然として低リソース言語だと考えられている。
オープンソースコーパス、香港固有のフォーラム、ウィキペディア、Common Crawlデータなど、さまざまなソースからCantoneseのテキストを収集します。
我々は、言語フィルタリング、品質フィルタリング、コンテンツフィルタリング、非複製ステップを通じて厳密なデータ処理を行い、高品質なカントンコーパスの構築に成功した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:53:07 GMT)
ChaI-TeA: A Benchmark for Evaluating Autocompletion of Interactions with LLM-based Chatbots [37.8] 本稿では,ChaI-TeA: CHat InTEraction Autocomplete; LLMに基づくインタラクションのための自動評価フレームワークを提案する。
フレームワークにはタスクの正式な定義が含まれており、適切なデータセットとメトリクスが組み合わされている。
フレームワークを使って、適切なデータセットとメトリクスと共にタスクを正式に定義した後、定義したオートコンプリートタスクで9つのモデルをテストします。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:49:36 GMT)
Advantage-Guided Distillation for Preference Alignment in Small Language Models [37.2] そこで本研究では,小言語モデルのアライメントプロセスの指針として,教師のLLMを活用することを提案する。
実験の結果、これらの2つの手法は、SLMのアライメントを良好に改善し、より大きなものとの性能ギャップを狭めることを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:46:28 GMT)
CycleResearcher: Improving Automated Research via Automated Review [37.0] 本稿では,オープンソースの後学習型大規模言語モデル(LLM)を,自動研究とレビューの全サイクルを遂行する自律エージェントとして活用する可能性について検討する。
これらのモデルをトレーニングするために、現実の機械学習研究とピアレビューダイナミクスを反映した2つの新しいデータセットを開発した。
その結果,CycleReviewerは平均絶対誤差(MAE)を26.89%削減して有望な性能を達成できた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:36:05 GMT)
Enhancing Autonomous Driving Safety with Collision Scenario Integration [36.8] 衝突データから学習するためのトレーニングフレームワークであるSafeFusionを提案する。
SafeFusionは、模倣学習を過度に検討する代わりに、トレーニング中に安全指向のメトリクスを統合して、衝突回避学習を可能にする。
また、多様な高品質なシナリオを生成するスケーラブルなデータ生成パイプラインであるCollisionGenを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:08:43 GMT)
Deterministic Global Optimization of the Acquisition Function in Bayesian Optimization: To Do or Not To Do? [36.8] 決定論的大域的解法(MAiNGO)の利点とデメリットを,従来の局所的解法や大域的解法と比較して検討した。
CPU効率の面では,MAiNGOのタイムリミットを設定し,最適点を最適とした。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:05:26 GMT)
MVP-Shot: Multi-Velocity Progressive-Alignment Framework for Few-Shot Action Recognition [36.4] MVP-Shotは、セマンティック関連アクション機能をマルチ速度レベルで学習し、調整するフレームワークである。
MVFAモジュールは、サポートからのフィーチャと、異なる速度スケールのクエリビデオの類似度を測定する。
PSTモジュールは、チャネルと時間領域の機能相互作用を通じて、速度調整されたテキスト情報をビデオ機能に注入する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:43:07 GMT)
Acoustic phonon phase gates with number-resolving phonon detection [36.3] 量子音響学におけるイテナントフォノンは、超伝導量子ビットと組み合わせることで、量子光学のアプローチに対する魅力的な代替手段を提供する。
超伝導トランスモン量子ビットからのフォノン状態の周波数依存散乱を用いたフォノン位相制御を実装した。
フォノン位相を測定するために使用される音響干渉計は、ノイズフロアに制限されたHong-Ou-Mandel干渉可視度98.1%を達成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:56:35 GMT)
Dynamic Neural Surfaces for Elastic 4D Shape Representation and Analysis [36.2] 本研究では, 時間とともに変形・進化する遺伝子ゼロ次元表面の統計的解析のための枠組みを提案する。
動的球面ニューラルサーフェス (D-SNS) を導入する。
4次元の人間と顔のデータセット上でのフレームワークの効率を実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:02:59 GMT)
Intrinsic and Extrinsic Factor Disentanglement for Recommendation in Various Context Scenarios [35.7] レコメンデーションシステムでは、ユーザー行動のパターンは異なる文脈で大きく変化する可能性がある。
これは、ユーザの行動は、ユーザの嗜好を反映する内在的要因と、異なる文脈で異なる可能性のある外部インセンティブを反映する外在的要因の2つのタイプによって共同で決定されるためである。
本稿では,様々な文脈を考慮した外在的要因と内在的要因を同時に区別する一般的なフレームワークである内在的・外在的遠近的勧告(IEDR)モデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:08:53 GMT)
BRIDGE: Bootstrapping Text to Control Time-Series Generation via Multi-Agent Iterative Optimization and Diffusion Modelling [35.2] 時系列生成(TSG、Time-Series Generation)は、シミュレーション、データ拡張、および反事実分析に広く応用された、顕著な研究分野である。
我々は、テキストが意味的な洞察、ドメイン情報、インスタンス固有の時間パターンを提供し、TSGをガイドし改善することができると論じている。
BRIDGEはテキスト制御型TSGフレームワークで,テキスト記述とセマンティックプロトタイプを統合し,ドメインレベルのガイダンスをサポートする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:04:37 GMT)
Introduction to Online Control [34.8] オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:25:34 GMT)
Rewarding Doubt: A Reinforcement Learning Approach to Confidence Calibration of Large Language Models [34.6] LLM(Large Language Models)の安全かつ信頼性の高い使用には、その回答に対する信頼性の正確な表現が必要である。
本稿では,LLMキャリブレーションのためのReinforcement Learning (RL) アプローチを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:23:16 GMT)
Mixture of Experts Made Intrinsically Interpretable [34.4] 我々は,emphintrinsically interpretableとして設計されたMixture-of-Experts (MoE)言語モデルである textbfMoE-X を提案する。
我々のアプローチは、言語モデルにおいて、スパースアクティベーションを持つより広いネットワークが解釈可能な要因を捉える傾向にあるという観察に動機づけられている。
MoE-X は GPT-2 よりもパープレキシティが良く、解釈性はスパースオートエンコーダ (SAE) ベースのアプローチを超えている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:40:54 GMT)
Fractal Calibration for long-tailed object detection [33.2] 実世界のデータセットは不均衡な分布を辿り、希少なカテゴリーのオブジェクト検出において大きな課題を生じさせる。
近年の研究では、データセットのクラスを利用する再重み付けと再サンプリング手法の開発によってこの問題に対処している。
FRActal CALibration (FRACAL) を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:57:48 GMT)
Statistical Advantages of Perturbing Cosine Router in Mixture of Experts [32.7] The cosine router in Mixture of Experts (MoE)は、最近、従来のリニアルータに代わる魅力的な代替品として登場した。
我々は,MoEにおけるコサインルータの包括的解析が欠如していることを示す。
摂動コサインルーティングMOEにおけるモデルパラメータと専門家の予測速度が有意に向上したことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:05:55 GMT)
Label-Efficient LiDAR Semantic Segmentation with 2D-3D Vision Transformer Adapters [32.2] BALViTは、凍結視覚モデルを利用して強力なLiDARエンコーダを学習するためのアモーダル機能エンコーダである。
コードとモデルは、http://balvit.cs.uni-freiburg.deで公開しています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:30:49 GMT)
Generative Social Choice [32.0] オープンエンドの民主的プロセスの設計手法である生成的社会的選択を紹介する。
プロセス表現は、オラクルクエリへのアクセスが与えられたときに保証されることを証明します。
我々は,これらのクエリが大規模言語モデルを用いて概ね実装可能であることを実証的に検証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:43:15 GMT)
Parallelized Planning-Acting for Efficient LLM-based Multi-Agent Systems [31.9] マルチエージェントシステムのための並列化計画実行フレームワークを提案する。
提案するフレームワークは、同時計画と動作を可能にする割り込み可能な実行を備えたデュアルスレッドアーキテクチャを備えている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:53:10 GMT)
Mocap-2-to-3: Lifting 2D Diffusion-Based Pretrained Models for 3D Motion Capture [31.8] Mocap-2-to-3は複雑な3D動作を2Dポーズに分解する新しいフレームワークである。
我々は2次元データを活用し,多様なシナリオにおける3次元運動再構成を向上する。
実世界のデータセット上でのモデルの性能を評価する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:32:49 GMT)
The Devil Is in the Details: Tackling Unimodal Spurious Correlations for Generalizable Multimodal Reward Models [31.8] マルチモーダル・リワードモデル(MM-RM)は,大規模言語モデル(LLM)と人間の嗜好の整合に不可欠である。
MM-RMは、不動の突発的相関に依存するため、アウト・オブ・ディストリビューションデータへの一般化に苦慮することが多い。
本稿では,この問題を動的にトレーニングサンプルを再重み付けすることで軽減する,ショートカット対応MM-RM学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:37:41 GMT)
MCiteBench: A Benchmark for Multimodal Citation Text Generation in MLLMs [31.8] MLLM(Multimodal Large Language Models)は多様なモダリティを統合するために進歩しているが、幻覚に悩まされることが多い。
既存の作業は、主にテキストのみのコンテンツのための引用を生成することに焦点を当て、マルチモーダルコンテキストの課題と機会を見下ろしている。
MLLMのマルチモーダル引用テキスト生成能力の評価と解析を目的とした,最初のベンチマークであるMCiteBenchを紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:28:29 GMT)
A Linear Theory of Multi-Winner Voting [31.5] 本稿では,複数投票ルールと比例公理を統一する一般線形フレームワークを提案する。
統一表現(JR)、拡張JR(EJR)、強化された変種(PJR+、EJR+)などの重要な比例公理もこの線形構造に収まる。
我々の手法は、Thiele法や順序付き平均規則を含む様々なルールのクラスに対して、ほぼ最適に保証される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:44:56 GMT)
Computational Analysis of Degradation Modeling in Blind Panoramic Image Quality Assessment [31.5] ブラインドパノラマ画像品質評価(BPIQA)は、最近、視覚品質コミュニティに新たな挑戦をもたらした。
簡単なデータベースはBPIQAモデルとBIQAモデルのパフォーマンスのギャップを狭めるが、BPIQAの開発とは無関係である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:15:31 GMT)
BrainNet-MoE: Brain-Inspired Mixture-of-Experts Learning for Neurological Disease Identification [31.5] Lewy body dementia (LBD)はアルツハイマー病に次いで2番目に多い神経変性性認知症である
私たちの研究は、脳のモデリングと診断のためにBrainNet-MoEと呼ばれるシステムレベルの人工ニューラルネットワークをモデル化する先駆的な取り組みを表している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:19:49 GMT)
DSVD: Dynamic Self-Verify Decoding for Faithful Generation in Large Language Models [31.2] 本稿では,動的自己検証復号法(DSVD)を提案する。リアルタイム幻覚検出と効率的な誤り訂正により生成信頼性を向上させる新しい復号法である。
私たちの研究は、生成中のリアルタイムの自己検証が、実用的なデプロイ性を犠牲にすることなく、より信頼できる言語モデルへの実行可能なパスを提供することを証明しています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:45:50 GMT)
Zero-Knowledge Proof-based Verifiable Decentralized Machine Learning in Communication Network: A Comprehensive Survey [31.1] マシンラーニングに対する分散型アプローチは、信頼性と妥当性に関する課題を導入します。
我々はZKP-VML(Zero-Knowledge Proof-based Verifiable Machine Learning)の総合的なレビューを行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:52:30 GMT)
A Survey on Self-play Methods in Reinforcement Learning [30.6] エージェントとコピーや過去のバージョンとの相互作用を特徴とするセルフプレイは、近年、強化学習において注目されている。
本稿では,マルチエージェント強化学習フレームワークやゲーム理論の基本概念を含む,自己プレイの予備的概念を明らかにする。
統合されたフレームワークを提供し、このフレームワーク内で既存のセルフプレイアルゴリズムを分類する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:03:08 GMT)
Schedule On the Fly: Diffusion Time Prediction for Faster and Better Image Generation [30.6] 多段階の逆拡散過程は、高品質な画像を段階的に生成するための一種の連鎖と見なすことができる。
Time Prediction Diffusion Model (TPDM) はプラグイン・アンド・プレイのTime Prediction Module (TPM) を用いており、各デノナイジングステップにおける現在の潜時特性に基づいて次のノイズレベルを予測する。
TPDMは審美スコア5.44と人選好スコア29.59を達成し、より優れたパフォーマンスを達成するために約50%のデノナイジングステップを使用する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:17:18 GMT)
Improving Data Efficiency via Curating LLM-Driven Rating Systems [30.2] データ選択のための多変量対応スコアキュレーション手法DS2を紹介する。
スコア遷移行列を通じてエラーパターンを体系的にモデル化することにより、DS2はLSMベースのスコアを補正し、選択したデータサンプルの多様性を促進する。
このアプローチは、キュレートされたサブセット(元のデータセットのわずか3.3%)が、さまざまなマシンアライメントベンチマークで、フルスケールデータセット(300kサンプル)より優れていることを示している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:56:10 GMT)
A Little Depth Goes a Long Way: The Expressive Power of Log-Depth Transformers [29.8] 最近の理論的結果から、変換器は計算深度が有界であるため、長い入力長で逐次推論問題を表現できないことが示されている。
深さ$Theta(log n)$は正規言語認識とグラフ接続の2つの重要な問題を表現することができる。
我々の理論は、これらの問題を表現するために、入力長さでどのように深さが成長するかを定量的に予測し、深さのスケーリングは、幅のスケーリングやチェーンのステップよりも効率的であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:26:25 GMT)
DuplexMamba: Enhancing Real-time Speech Conversations with Duplex and Streaming Capabilities [29.7] 本稿では,マンバをベースとした音声とテキストの対話のためのマルチモーダル・デュプレックスモデルを提案する。
DuplexMambaは同時入力処理と出力生成を可能にし、動的に調整してリアルタイムストリーミングをサポートする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:36:34 GMT)
Can We Talk Models Into Seeing the World Differently? [29.6] 視覚言語モデル(VLM)は、言語プロンプトを通じて視覚コンテンツにアクセスする直感的な方法を提供する。
我々は、特によく研究されている視覚のみの偏見(テクスチャ対形状偏見)と、グローバル情報に対する局所的な優位性)について検討する。
驚くべきことに、マルチモダリティだけで、モデルの振る舞いに重要な影響を与えることが証明されます。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:01:00 GMT)
Afford-X: Generalizable and Slim Affordance Reasoning for Task-oriented Manipulation [29.5] 我々は1,496のタスクと119kの画像からなる大規模データセットであるLVIS-Affを導入し、知覚からの可視性推論の一般化性を高めることを目的とした。
我々は,Verbizable AttentionとBi-Fusionモジュールを組み込んだ,エンドツーエンドのトレーニング可能な価格推論モデルであるAfford-Xを開発した。
本研究は,タスク指向操作のためのローカルデバイスに展開可能な,効率的で汎用的な推論モデルの可能性を示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:44:53 GMT)
Near-infrared Image Deblurring and Event Denoising with Synergistic Neuromorphic Imaging [29.4] 我々は、NIRイメージングとイベントベース技術を組み合わせた、低照度イメージングのための新しいフレームワークを開発した。
我々は、スペクトル一貫性と高次相互作用により、NIR画像と可視事象のクロスモーダルな特徴を利用する。
本研究は、高忠実度低照度イメージングとニューロモルフィック推論の道を開くため、NIR画像と事象の両方を強化するための衝動を与える。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:54:00 GMT)
Bridging Synthetic-to-Real Gaps: Frequency-Aware Perturbation and Selection for Single-shot Multi-Parametric Mapping Reconstruction [29.1] 医用画像再構成のための周波数認識摂動・選択法(FPS)を提案する。
摂動は不確実性の中でドメイン不変の特徴学習を活性化し、選択は摂動の中で最適な解を洗練させる。
健常者5名,虚血性脳梗塞患者94名,髄膜腫患者46名を対象に,FPSの優位性と臨床応用性を実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:10:11 GMT)
Positive-Unlabeled Diffusion Models for Preventing Sensitive Data Generation [28.9] 拡散モデルは強力な生成モデルであるが、しばしばユーザが望まない機密データを生成する。
本研究では,ラベルなし・機密データを用いたセンシティブなデータ生成を防止するために,正のラベル付き拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:17:48 GMT)
Chunking the Critic: A Transformer-based Soft Actor-Critic with N-Step Returns [28.8] SAC(Soft Actor-Critic)は批判的ネットワークに依存している。
N-returnsフレームワークを安定かつ効率的に統合したTransformer-based Critic Network for SACを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:47:36 GMT)
Sim2Real within 5 Minutes: Efficient Domain Transfer with Stylized Gaussian Splatting for Endoscopic Images [28.8] 内膜介入は良性病変と悪性病変の両方に出現する技術である。
実際には,術前領域と術中領域の整列は,テクスチャの相違により複雑になる。
本稿では,スタイライズされたガウススプラッティングに基づく効率的なドメイン転送手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:41:05 GMT)
Explaining Vision-Language Similarities in Dual Encoders with Feature-Pair Attributions [28.5] CLIPモデルは、2種類の入力を共有埋め込み空間にマッピングし、それらの類似性を予測します。
しかし、その成功にもかかわらず、これらのモデルがどのように2つの入力を比較するかは理解されていない。
一般的な1次特徴属性法は、デュアルエンコーダに対する限られた洞察しか提供できない。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:15:39 GMT)
StdGEN: Semantic-Decomposed 3D Character Generation from Single Images [28.3] StdGENは、単一の画像から意味的に高品質な3D文字を生成する革新的なパイプラインである。
3分で体、衣服、毛髪などの分離した意味成分を持つ複雑な3D文字を生成する。
StdGENは、使えるセマンティック分解された3D文字を提供し、幅広いアプリケーションに対して柔軟なカスタマイズを可能にする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:51:07 GMT)
Detecting Adversarial Data using Perturbation Forgery [28.2] 逆検出は、自然データと逆データの間の分布とノイズパターンの相違に基づいて、データフローから逆データを特定し、フィルタリングすることを目的としている。
不均衡および異方性雑音パターンを回避した生成モデルに基づく新しい攻撃
本研究では,ノイズ分布,スパースマスク生成,擬似逆数データ生成を含む摂動フォージェリを提案し,不明瞭な勾配ベース,生成型および物理的逆数攻撃を検出可能な逆数検出器を訓練する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:30:54 GMT)
HiGrad: Uncertainty Quantification for Online Learning and Stochastic Approximation [27.8] 勾配降下(SGD)は、ストリームやデータサイズが非常に大きい設定において、オンライン学習において非常に一般的なアプローチである。
本稿では,オンライン学習のための統計的推論を行う手法として,HiGradを提案する。
メソッドを実装するためにRパッケージの texttthigrad が開発された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:34:50 GMT)
LoBAM: LoRA-Based Backdoor Attack on Model Merging [27.6] モデルマージ(Model merging)は、異なるタスクに微調整された複数のモデルを統合して、複数のドメインにまたがる汎用モデルを作成する、新たなテクニックである。
既存の研究は、かなりの計算資源を仮定することで、そのような攻撃のリスクを実証しようとするものである。
最小限のトレーニングリソースで高い攻撃成功率を得る方法であるLoBAMを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:34:47 GMT)
The Illusion of State in State-Space Models [27.6] ステートスペースモデル(SSM)は、大きな言語モデルを構築するための代替アーキテクチャとして考えられる。
我々は,SSMが変圧器のような非リカレントモデルに類似した制約があることを示し,実世界の状態追跡問題を解く能力を制限する可能性があることを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:00:57 GMT)
RiskAgent: Autonomous Medical AI Copilot for Generalist Risk Prediction [27.5] 本稿では,幅広い医療リスク予測を行うためのリスクエージェントシステムを提案する。
RiskAgentは、心臓血管疾患や癌など、様々な複雑な疾患の387以上のリスクシナリオをカバーしている。
我々は、リスク予測に特化した最初のベンチマークMedRiskを構築した。その中には、154の疾患、86の症状、50の専門性、24の臓器システムを含む12,352の質問が含まれている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:46:51 GMT)
Targeted Distillation for Sentiment Analysis [27.3] 本稿では, 高度大言語モデル (LLM) をターゲットとした蒸留により, 強い感情分析能力を実現するコンパクトモデルを提案する。
本手法は蒸留目標を感情関連知識とタスクアライメントの2つの重要な構成要素に分解する。
本ベンチマーク実験は,本モデルがモデルサイズと性能のバランスを効果的に保ち,既存の小規模LLMと比較して高い競争力を示すことを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:45:25 GMT)
FedPalm: A General Federated Learning Framework for Closed- and Open-Set Palmprint Verification [26.8] フェデレートラーニング(FL)は、パームプリント検証のためのプライバシー保護分散ラーニングパラダイムを提供する。
本稿では,クローズドセットとオープンセットの2つのシナリオを定義し,評価する。
我々は,局所的な適応性とグローバルな一般化のバランスをとる統一FLフレームワークであるFedPalmを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:49:42 GMT)
StickMotion: Generating 3D Human Motions by Drawing a Stickman [26.5] 本稿では,多条件シナリオ用に設計された効率的な拡散型ネットワークであるStickMotionを紹介する。
我々は,手書きのステッカーを異なるデータセットフォーマットで自動生成するアルゴリズムを開発した。
拡散過程に統合し,可能な全ての条件の組み合わせの出力を得る多条件モジュールを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:16:14 GMT)
Towards Trustworthy Federated Learning [26.3] 本稿では,フェデレートラーニング(FL)における3つの重要な課題に対処するための包括的枠組みを開発する。
ビザンチン攻撃に対するシステムの防御を改善するため,両面のノーム・ベース・スクリーニング機構を開発した。
また、ローカルクライアントの生データが好奇心をそそる関係者によって推測されるのを防ぐために、差分プライバシーベースのスキームも採用しています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:25:20 GMT)
Baichuan-M1: Pushing the Medical Capability of Large Language Models [26.0] 医療応用に特化して最適化された大規模言語モデルであるBaichuan-M1を紹介する。
既存のモデルで事前訓練を続ける従来のアプローチとは異なり、Baichuan-M1は医療能力の向上に重点を置いてゼロから訓練されている。
我々のモデルは20兆のトークンで訓練され、一般的な能力と医療の専門知識のバランスをとるための、さまざまな効果的な訓練方法が組み込まれています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:23:04 GMT)
From Informal to Formal -- Incorporating and Evaluating LLMs on Natural Language Requirements to Verifiable Formal Proofs [25.7] 本稿では,形式的推論の即時適用シナリオである形式的検証に焦点を当てる。
我々は5つの形式仕様言語で18kの高品質な命令応答ペアを構築した。
フォーマルなデータによる微調整は、数学、推論、コーディング能力も強化する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:26:49 GMT)
Look, Listen, and Answer: Overcoming Biases for Audio-Visual Question Answering [25.6] 本稿では,公開データセット(MUSIC-AVQA)のテストスプリット内での質問の表現と,分割された質問に対する分散シフトの導入という,2つのステップで構築された新しいデータセットMUSIC-AVQA-Rを提案する。
実験の結果、このアーキテクチャはMUSIC-AVQA-Rの最先端性能を実現し、特に9.32%の大幅な改善が得られた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:09:07 GMT)
iNews: A Multimodal Dataset for Modeling Personalized Affective Responses to News [25.4] iNewsは、ニュースの見出しに対する主観的な感情的な反応をキャプチャする新しいデータセットだ。
当社のデータセットは、2,899件のマルチモーダルなFacebookニュース投稿を対象とした291件の英国人参加者のアノテーションで構成されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:09:53 GMT)
Feature Matching Intervention: Leveraging Observational Data for Causal Representation Learning [25.3] FMI(Feature Matching Intervention)は、完全な介入を模倣するためにマッチング手順を使用する。
因果グラフを定義し、構造因果モデルを潜在特徴空間に拡張する。
特徴マッチング手法はこれらの因果潜在グラフの完全な介入をエミュレートする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:14:43 GMT)
Beyond Content Relevance: Evaluating Instruction Following in Retrieval Models [25.3] 本研究では,コンテンツ関連性を超えた各種検索モデルの指示追従能力について検討した。
6つの文書レベル属性にまたがる新しい検索評価ベンチマークを開発した。
その結果,命令対応検索データセットの微調整モデルでは性能が向上するが,ほとんどのモデルでは命令順守に欠けることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:10:57 GMT)
UniFlow: A Foundation Model for Unified Urban Spatio-Temporal Flow Prediction [25.2] 都市インフラの最適化と交通災害対応管理には,都市時流予測が不可欠である。
従来のアプローチは、グリッドベースのデータまたはグラフベースのデータに合わせた、別々のモデルに依存してきた。
本稿では,グリッドベースのグラフベースデータを統一した一般都市流予測モデルを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:18:41 GMT)
Gradient Deconfliction via Orthogonal Projections onto Subspaces For Multi-task Learning [25.0] 本稿では,他のタスク固有の勾配にまたがる部分空間(GradOPS)への直交射影による勾配分解を提案する。
提案手法は,複数のデータセット上のタスク間で異なるトレードオフ戦略を持つ複数の最先端ソリューションを効果的に見つけることができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:13:08 GMT)
Full-DoF Egomotion Estimation for Event Cameras Using Geometric Solvers [24.9] 統合されたフレームワーク内での回転速度と翻訳速度の両方を推定するために,いくつかの解法を提案する。
角速度と直線速度の両方のフルDoFエゴモーションパラメータを、センサの余分な測定や動きの前処理を必要とせずに回収できることを実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:39:51 GMT)
Constrained Gaussian Wasserstein Optimal Transport with Commutative Covariance Matrices [24.9] 本稿では, 知覚認識による損失圧縮, 生成主成分分析, ディープジョイント・ソース・チャネル符号化の3種類の制約について考察する。
上記の3つの制約の下で達成可能な平均2乗誤差の最小値について明示的な結果を得る。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:56:48 GMT)
Towards Effective Time-Aware Language Representation: Exploring Enhanced Temporal Understanding in Language Models [24.8] 本稿では,時間的ニュース記事の収集を前提として事前学習した,新しいタイムアウェア言語モデルであるBiTimeBERT 2.0を紹介する。
BiTimeBERT 2.0は3つの革新的な事前学習目標を通じて時間情報を組み込む。
BiTimeBERT 2.0は、幅広い時間的タスクにまたがって大幅に改善され、広範囲の時間的範囲にまたがるデータセットに優れることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:27:57 GMT)
Learning to Negotiate via Voluntary Commitment [24.8] 自律エージェントの部分的なアライメントとコンフリクトは、現実世界のアプリケーションにおいて混合モチベーションシナリオをもたらす。
我々は,エージェントが自発的に将来の計画にコミットできる,コミットメントゲームの一種であるMarkov Commitment Games (MCGs)を提案する。
混合モチベーションの課題に対する実験結果から,より高速な経験的収束と,本手法の帰納率の向上が示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:55:10 GMT)
Handling Spatial-Temporal Data Heterogeneity for Federated Continual Learning via Tail Anchor [24.7] フェデレートされた連続学習(FCL)により、各クライアントはタスクストリームからその知識を継続的に更新することができる。
本稿では,訓練可能なタイルアンカーと凍結した出力特性を混合して特徴空間における位置を調節するフェデレートタイルアンカー (FedTA) を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:25:09 GMT)
DrugAgent: Automating AI-aided Drug Discovery Programming through LLM Multi-Agent Collaboration [24.7] DrugAgentは、薬物発見タスクのための機械学習(ML)プログラミングを自動化するマルチエージェントフレームワークである。
以上の結果から,DragonAgentは最上位のベースラインを一貫して上回っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:54:30 GMT)
CodeIF: Benchmarking the Instruction-Following Capabilities of Large Language Models for Code Generation [24.1] 我々は、コード生成シナリオ内でタスク指向の命令に従うために、LLM(Large Language Models)の能力を評価するために設計された最初のベンチマークであるCodeIFを紹介する。
我々はLLMによる広範囲な実験を行い、これらの課題の要求を満たす上での強みと限界を分析した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:09:06 GMT)
CoSDH: Communication-Efficient Collaborative Perception via Supply-Demand Awareness and Intermediate-Late Hybridization [24.0] 本稿では,供給需要の認識と中間段階のハイブリダイゼーションに基づく,コミュニケーション効率の高い協調認識フレームワークを提案する。
シミュレーションと実世界のシナリオを含む複数のデータセットの実験は、mymethodnameが最先端の検出精度と最適な帯域幅のトレードオフを達成することを実証している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:02:04 GMT)
CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-scale Reinforcement Learning in Autonomous Driving [23.7] 軌道計画は自動運転に不可欠であり、複雑な環境で安全かつ効率的な航法を確保する。
本稿では、強化学習を用いてマルチモーダル軌道を生成するtextbfConsistent textbfauto-textbfregressive textbfPlannerについて紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:36:27 GMT)
Exploring the Potential of Large Language Models as Predictors in Dynamic Text-Attributed Graphs [23.7] 我々は,動的グラフの予測タスクに大規模言語モデル (LLM) を考案した。
協調LLMを利用したマルチエージェントシステムであるGraphAgent-Dynamic (GAD) フレームワークを提案する。
GADはグローバルおよびローカルの要約エージェントを組み込んでドメイン固有の知識を生成し、ドメイン間の転送可能性を高める。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:28:11 GMT)
Inference-Scale Complexity in ANN-SNN Conversion for High-Performance and Low-Power Applications [23.5] 人工ニューラルネットワーク(ANN)の代替としてスパイキングニューラルネットワーク(SNN)が登場した
推論スケールの複雑さのみを考慮した効率的なANN-SNN変換フレームワークを提案する。
我々のアルゴリズムは既存の手法よりも優れており、実用性と効率性を強調している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:21:26 GMT)
REGRACE: A Robust and Efficient Graph-based Re-localization Algorithm using Consistency Evaluation [23.4] ループ閉包は、ドリフトを補正し、一貫した地図を作成するのに不可欠である。
高精度な位置認識のための高密度点雲を用いた現在の手法は、計算コストの高いスキャン・スキャン・スキャン比較のため、うまくスケールしない。
我々は、スケーラビリティと再ローカライゼーションにおける視点差のこれらの課題に対処する新しいアプローチであるREGRACEを紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:32:38 GMT)
Conditional Hallucinations for Image Compression [23.3] 画像圧縮の損失では、モデルは詳細を幻覚させるか、配布外サンプルを生成するという課題に直面します。
本稿では,コンテンツに基づく幻覚の度合いを動的にバランスさせる新しい圧縮手法を提案する。
本研究では,最先端画像圧縮法より優れた条件付き幻覚圧縮モデル(ConHa)を開発した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:03:26 GMT)
LGR2: Language Guided Reward Relabeling for Accelerating Hierarchical Reinforcement Learning [23.0] 階層強化学習(HRL)における非定常性を緩和する新しい枠組みを提案する。
私たちは、低レベルの政策行動の変化の影響を受けない、言語誘導された高レベルの報酬を使用します。
ロボットナビゲーションと操作環境の難易度は70%を超えています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:34:08 GMT)
Dynamic Sparse Training versus Dense Training: The Unexpected Winner in Image Corruption Robustness [22.9] 動的スパーストレーニングは、頑健さの正確性の観点から、Dense Trainingを一貫して上回ります。
この結果から, ダイナミックスパーストレーニングの新たなメリットと, 新たな可能性が明らかとなった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:37:07 GMT)
NTR-Gaussian: Nighttime Dynamic Thermal Reconstruction with 4D Gaussian Splatting Based on Thermodynamics [22.8] NTR-ガウス法は温度を熱放射の一種として扱い、対流熱伝達や放射熱散逸などの要素を取り入れている。
NTR-Gaussian は熱再構成における比較法を著しく上回り、温度誤差を摂氏1度以内で予測した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:24:13 GMT)
Optimal Decision Tree Pruning Revisited: Algorithms and Complexity [22.6] 我々は,サブツリーの更新と育成の基本的な作業に焦点をあてる。
サブツリー置換に間に合うように最適プルーニングを行うことができるが、サブツリーの更新にはNP完全である。
例えば、サブツリーの上昇は小さなドメインサイズでは難しいが、$D2d cdot |I|O(1)$timeでは、$|I|$が入力サイズである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:02:46 GMT)
The MASK Benchmark: Disentangling Honesty From Accuracy in AI Systems [22.5] 正直性を直接測定する大規模人選データセットを提案する。
より大規模なモデルは我々のベンチマークで高い精度を得るが、より正直になることはない。
表現工学的介入のような単純な手法は、誠実さを向上させることができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:59:23 GMT)
PromAssistant: Leveraging Large Language Models for Text-to-PromQL [22.4] 本稿では,広く使用されているメトリクス監視システムであるPrometheusが提供するメトリッククエリDSLであるPromQLに注目した。
本稿では,PromQLフレームワークであるPromAssistantを提案する。
PromAssistantは、メトリッククエリと分析のためのDSL生成フレームワークを開拓しました。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:22:01 GMT)
COSINT-Agent: A Knowledge-Driven Multimodal Agent for Chinese Open Source Intelligence [22.2] オープンソースインテリジェンス(OSINT)は多様なマルチモーダルデータの統合と推論を必要とする。
中国におけるOSINTの課題に対処するための知識駆動型マルチモーダルエージェントであるCOSINT-Agentを紹介する。
COSINT-Agentの中心は、COSINT-MLLMとEES-KGを橋渡しする革新的なEES-Matchフレームワークである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:16:15 GMT)
Online Bidding under RoS Constraints without Knowing the Value [22.2] オンライン広告における入札の問題は、広告主が予算や返品制限に固執しながら価値を最大化することを目的としている。
本稿では、このトレードオフを慎重に管理する新しいアッパー信頼境界(UCB)スタイルのアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:25:54 GMT)
A 262 TOPS Hyperdimensional Photonic AI Accelerator powered by a Si3N4 microcomb laser [22.2] フォトニックニューラルネットワーク(PNN)は、時間、波長、空間を含む複数の物理的次元の相互作用を生かしている。
我々は、262TOPSの超高計算パワーでテンソル乗算を実行できる、新しい多次元アレイ導波路グレーティングルータ(AWGR)ベースのフォトニックAIアクセラレータを実験的に実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:41:03 GMT)
Online Scheduling for LLM Inference with KV Cache Constraints [22.2] 大規模言語モデル(LLM)推論は、レイテンシとリソース利用を最適化するための効率的なスケジューリングを必要とする集約的なプロセスである。
KVキャッシュのメモリを効果的に管理しながら、推論遅延を最小限に抑える新しいスケジューリングアルゴリズムを提案する。
我々の成果は、より持続的で費用対効果の高いLLMデプロイメントへの道筋を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:43:01 GMT)
Unifying Causal Representation Learning with the Invariance Principle [21.4] 因果表現学習は、高次元観測から潜伏因果変数を復元することを目的としている。
本稿では,多くの因果表現学習手法が,それらの表現を固有のデータ対称性と方法論的に整合させることを示す。
本稿では、因果変数の発見における因果仮定の役割を明らかにし、データ対称性の保存に焦点を移す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:42:53 GMT)
Promote, Suppress, Iterate: How Language Models Answer One-to-Many Factual Queries [21.3] 1対多の事実クエリに答えるためには、言語モデル(LM)が同時に知識をリコールし、以前の回答を繰り返すことを避ける必要がある。
複数のデータセットとモデルにまたがって、プロモート・then-suppressメカニズムを特定し、モデルが最初にすべての回答をリコールし、その後に生成されたものを抑圧する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:22:47 GMT)
Human Implicit Preference-Based Policy Fine-tuning for Multi-Agent Reinforcement Learning in USV Swarm [21.2] MARL(Multi-Agent Reinforcement Learning)は,エージェント間の協調や競争に関わる複雑な問題を解くことを約束している。
本稿では,エージェントレベルフィードバックシステムを用いて,MARLに対する強化学習(Reinforcement Learning with Human Feedback, RLHF)アプローチを提案する。
本手法は,マルチエージェントシステムにおいて,公平性と性能の整合性を保ちながら重要な課題に対処し,USV Swarmポリシーを効果的に改善する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:33:18 GMT)
Path-Adaptive Matting for Efficient Inference Under Various Computational Cost Constraints [21.2] 本稿では,画像コンテキストと計算コスト制約に基づいて動的にネットワークパスを調整するPath-Adaptive Matting(PAM)を提案する。
5つの画像マッチングデータセットの実験により、提案したPAMフレームワークは、計算コストの制約の範囲で競合性能を達成することを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:56:42 GMT)
ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points [21.1] ArcProは、ポイントクラウドから構造化された3D抽象化を復元するアーキテクチャプログラム上に構築された学習フレームワークである。
我々は,非構造化点クラウドからアーキテクチャプログラムへのマッピングを確立するために,ポイントプログラムペア上でエンコーダ・デコーダを訓練する。
提案手法による推論は非常に効率的で, 信頼性が高く, 忠実な3次元抽象化を実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:49:18 GMT)
AI for Science: Current progress and pathways forward [20.9] 人工知能と科学研究の急速な融合は、しばしばAI for Science(科学のためのAI)と呼ばれ、分野を越えて発見の風景を再構築している。
この研究は、研究におけるより広範なAI統合を促進し、科学的な発見と分野横断のイノベーションを促進することを目的としている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:29:05 GMT)
Error Correction Code Transformer: From Non-Unified to Unified [20.9] 従来のデコーダは、特定のデコードアルゴリズムに適した固定ハードウェア回路として設計されていた。
本稿では、複数の線形ブロックコードを扱うことができる、コードに依存しないトランスフォーマーベースのデコードアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:01:38 GMT)
SePer: Measure Retrieval Utility Through The Lens Of Semantic Perplexity Reduction [20.7] 本稿では、RAGフレームワーク内の情報ゲインのレンズを通して、検索品質を測定する自動評価手法を提案する。
検索の利便性を,検索後の意味的難易度を低減する程度で定量化する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:24:54 GMT)
The Noisy Path from Source to Citation: Measuring How Scholars Engage with Past Research [20.6] 本稿では,大規模な引用忠実度を定量化する計算パイプラインを提案する。
論文の全文を用いて、パイプラインは引用論文における引用と引用論文における対応するクレームを識別する。
準実験を用いて「電話効果」を確立する - 引用論文が原主張に忠実度が低い場合、引用論文と原文を引用する将来の論文は原文に忠実度が低い。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:32:35 GMT)
Multi-View Depth Consistent Image Generation Using Generative AI Models: Application on Architectural Design of University Buildings [20.6] 生成AIモデルを用いた新しい3段階一貫した画像生成フレームワークを提案する。
バックボーンとしてControlNetを使用し、アーキテクチャ靴箱モデルのマルチビュー入力に対応するように最適化する。
実験により,提案フレームワークは,一貫したスタイルと構造コヒーレンスを持つマルチビューアーキテクチャ画像を生成することができることを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:16:09 GMT)
Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders [20.6] Sparse Autoencoders (SAE) を用いてGemma-2-2b残ストリームから特徴を抽出する。
解釈可能な特徴と効率的な特徴の両方を識別し,その意味と妥当性を解析する。
提案手法は, さまざまなモデルからのテキストと人文コンテンツとの相違点について, 貴重な知見を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:33:52 GMT)
Unveiling Simplicities of Attention: Adaptive Long-Context Head Identification [20.5] クエリによっては,局所的情報と長文的情報の間に注目の頭が揺れることが分かる。
ローカルキーのみを用いて、長文処理においてどのヘッドが重要かを予測することが可能であることを実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:14:16 GMT)
Iterative Value Function Optimization for Guided Decoding [20.2] ガイド付き復号法、特に価値誘導法は、ヒューマンフィードバックからの強化学習に代わる費用対効果を提供する。
値関数の精度は、不正確さが最適下決定につながるため、値誘導復号には不可欠である。
既存の手法は、最適な値関数を正確に見積もることに苦慮し、より効果的な制御に繋がる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:12:25 GMT)
LLMs can be Dangerous Reasoners: Analyzing-based Jailbreak Attack on Large Language Models [20.2] 既存のjailbreakメソッドには、複雑なプロンプトエンジニアリングと反復最適化の2つの大きな制限がある。
本稿では,LLMの高度な推論能力を活用し,有害コンテンツを自律的に生成する効率的なジェイルブレイク攻撃手法であるAnalyzing-based Jailbreak(ABJ)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:43:33 GMT)
PriFFT: Privacy-preserving Federated Fine-tuning of Large Language Models via Function Secret Sharing [20.1] 微調整された大規模言語モデル(LLM)は、機密性のあるトレーニングデータを公開するリスクにより、プライバシ上の懸念を提起する。
近年の研究では、FLのモデル更新から敵がまだプライベート情報を推測できることが示されている。
プライバシ保護フェデレーションファインチューニング機構であるPriFFTを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:41:57 GMT)
Grams: Gradient Descent with Adaptive Momentum Scaling [20.0] $mathbfG$radient Descent with $mathbfA$daptive $mathbfM$omentum $mathbfS$caling ($mathbfGrams)
Gramsは、ディープラーニングにおける更新の方向と大きさを分離する最適化アルゴリズムである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:29:42 GMT)
LCV2I: Communication-Efficient and High-Performance Collaborative Perception Framework with Low-Resolution LiDAR [19.7] V2I(Van-to-Infrastructure)は、インフラのセンサーによって収集されたデータを活用して、車両の知覚能力を高める。
ライダーは協調的な知覚においてよく使われるセンサーであり、インテリジェントな車両やインフラに広く備わっている。
低コストなV2Iを実現するためには、LiDARのコスト削減が不可欠である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:33:16 GMT)
Deep Augmentation: Dropout as Augmentation for Self-Supervised Learning [19.5] Deep Augmentationは、ニューラルネットワークのターゲット層にドロップアウトまたはPCA変換を適用する方法である。
レイヤ間で均一にドロップアウトを適用することで、パフォーマンスが一貫して向上しないことを示す。
また, 停止段階の操作は, 拡張として効果的にドロップアウト機能を確保するために重要であることも示している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:30:05 GMT)
Universal logical operations with a dynamical qubit in Floquet code [19.3] 超伝導量子プロセッサ上でFloquet-Bacon-Shor符号を実験的に実装する。
我々は,従来の静的論理量子ビットとともに,データ量子ビットの3ドル3セント格子内に動的論理量子ビットをエンコードする。
この結果は、スケーラブルで資源効率の良いFT量子計算のためのFloquet符号の可能性を強調した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:55:10 GMT)
State-offset Tuning: State-based Parameter-Efficient Fine-Tuning for State Space Models [19.3] ステートスペースモデル(SSM)はトランスフォーマーの効率的な代替品として登場した。
Prompt TuningやPrefix-Tuningのようなプロンプトベースのメソッドは、SSMではうまく機能しない。
本稿では,プロンプトベースの手法の代替として,状態ベースの手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:44:42 GMT)
Find First, Track Next: Decoupling Identification and Propagation in Referring Video Object Segmentation [19.2] ビデオオブジェクトのセグメンテーションの参照は、自然言語プロンプトを使用して、ビデオ内の対象オブジェクトをセグメンテーションし、追跡することを目的としている。
本研究では、マスクの伝搬からターゲットの識別を分離する新しい分離されたフレームワークであるFindTrackを紹介する。
FindTrackは、公開ベンチマークで既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:32:49 GMT)
Mixtraining: A Better Trade-Off Between Compute and Performance [19.2] MixTrainingは、複数のSSLおよびSLエポックを統合混合トレーニングフェーズ内でインターリーブする、新しいフレームワークである。
SSLとSLのシナジーを強化し、精度を改善し、共有ステップを統合して計算オーバーヘッドを削減する。
実験により、MixTrainingは従来のパイプラインに比べて優れた計算性能のトレードオフを提供することが示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:40:47 GMT)
DoraCycle: Domain-Oriented Adaptation of Unified Generative Model in Multimodal Cycles [19.1] 本研究では,テキスト・ツー・テキスト・トゥ・テキストと画像・ツー・テキスト・トゥ・画像という2つのマルチモーダル・サイクルを統合したDoraCycleを提案する。
モデルは、両方のエンドポイントが同じモダリティを共有するサイクルエンドポイントで計算されるクロスエントロピー損失によって最適化される。
特定のアイデンティティのような新しいペアの知識を含むタスクでは、小さなペアのイメージテキスト例と大規模な未ペアデータの組み合わせが十分である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:26:58 GMT)
IC-Mapper: Instance-Centric Spatio-Temporal Modeling for Online Vectorized Map Construction [19.0] IC-Mapperは2つの主要なコンポーネントで構成されるインスタンス中心のオンラインマッピングフレームワークである。
空間次元から歴史的グローバルマップの点サンプリングを行い、現在のフレームに対応するインスタンスの検出結果と統合して、地図のリアルタイム展開と更新を行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:28:34 GMT)
CHOP: Mobile Operating Assistant with Constrained High-frequency Optimized Subtask Planning [18.8] 制約付き高周波最適化計画(CHOP)を用いた新しいモバイルアシスタントアーキテクチャを提案する。
提案手法は,人計画サブタスクをベースベクトルとしてGUIシナリオ計画におけるVLMの欠如を克服する。
当社のアーキテクチャを20アプリにわたる英語と中国語のコンテキストで評価し、有効性と効率の両面で大幅に改善したことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:56:16 GMT)
Self-Consistency Falls Short! The Adverse Effects of Positional Bias on Long-Context Problems [18.6] 大規模言語モデル(LLM)の性能向上のために,自己整合性(SC)が実証されている。
SCの利点が長文設定に一般化されるという仮定に挑戦する。
SCは改善に失敗するだけでなく、長文タスクのパフォーマンスを積極的に低下させる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:19:56 GMT)
Towards Understanding Multi-Round Large Language Model Reasoning: Approximability, Learnability and Generalizability [18.5] マルチラウンド自動回帰モデルの近似,学習可能性,一般化特性について検討する。
有限コンテキストウィンドウを持つ変換器はチューリング計算可能関数のステップに対する普遍近似器であることを示す。
我々はPAC学習をシーケンス生成に拡張し、シーケンス長がモデルのコンテキストウィンドウを超えた場合でも、マルチラウンド生成が学習可能であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:50:55 GMT)
DFREC: DeepFake Identity Recovery Based on Identity-aware Masked Autoencoder [18.4] DFRECは、ディープフェイク画像からソースとターゲットの顔のペアを復元し、ディープフェイク識別追跡を容易にすることを目的としている。
DFRECはFaceForensics++, CelebaFS, FFHQ-E4Sデータセットに対して6つの異なる高忠実顔スワッピング攻撃に対して評価する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:40:41 GMT)
NodeReg: Mitigating the Imbalance and Distribution Shift Effects in Semi-Supervised Node Classification via Norm Consistency [18.1] ノード表現のノルムの整合性を確保することで、これらの2つの問題がGNNに与える影響を大幅に低減できることがわかった。
本稿ではノード表現ノルムの整合性を強制するノードRegという正規化最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:06:16 GMT)
Predicting Practically? Domain Generalization for Predictive Analytics in Real-world Environments [18.1] 本稿では,複雑な分布シフトを扱うための領域一般化手法を提案する。
提案手法は分散ロバスト最適化フレームワーク上に構築され,仮説上の最悪の分布に対してモデル性能を最適化する。
本稿では,情報システム (IS) 設計研究の進展における提案手法の広範な意味について論じる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:21:37 GMT)
"Impressively Scary:" Exploring User Perceptions and Reactions to Unraveling Machine Learning Models in Social Media Applications [18.0] ソーシャルメディア利用者の認知と行動が機械学習モデルに一度暴露されるとどのように変化するかを検討することを目的としている。
ユーザスタディ(N=21)を実施して、参加者は、モデルが出力するものと、モデルがInstagramやTikTokで使用された時期の両方に気づいていないことが分かった。
その結果,8人の被験者で長期の行動変化が観察された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:51:52 GMT)
Enhancing Visual Forced Alignment with Local Context-Aware Feature Extraction and Multi-Task Learning [17.9] 本稿では,視覚強制アライメント(VFA)に対する新しいアプローチを紹介する。
発話とそれに対応する唇の動きを正確に同期させることを目的としている。
本稿では,ローカルなコンテキスト認識機能抽出器を統合し,マルチタスク学習を用いてグローバルなコンテキスト特徴とローカルなコンテキスト特徴の両方を洗練する新しいVFA手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:13:19 GMT)
Adversarial Training for Multimodal Large Language Models against Jailbreak Attacks [17.8] MLLM訓練期間中のジェイルブレイク攻撃に対する防御を目的とした,最初の対人訓練パラダイムを提示する。
エンド・ツー・エンドのATフレームワークであるProEAT(Projection Layer Against Adversarial Training)を紹介する。
ProEATは最先端の防御性能を達成し、テキストと画像のモダリティの平均マージン+34%で既存のベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:13:35 GMT)
Your Finetuned Large Language Model is Already a Powerful Out-of-distribution Detector [17.3] 我々は,事前学習された大言語モデル(LLM)と,その微調整された変種との比率を,アウト・オブ・ディストリビューション(OOD)検出の基準として再検討する。
その結果,OOD検出基準として有効である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:51:23 GMT)
WVEmbs with its Masking: A Method For Radar Signal Sorting [17.2] ニューラルネットワークへの正規化入力としてパルス記述語(PDW)を処理する新しい埋め込み手法を提案する。
この方法では、インターリーブレーダ信号の分布に適応し、元の信号の特徴を自明から有用にランク付けする。
提案手法は,高粒度,試料レベルのパルスソートを実現するため,効率的なエンドツーエンド手法であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:47:55 GMT)
Adversarial Example Based Fingerprinting for Robust Copyright Protection in Split Learning [17.1] 本研究では,指紋を有効かつ堅牢な著作権保護に活用する分割学習モデルの最初の著作権保護手法を提案する。
これは、MNISTで100%、CIFAR-10で98%、ImageNetで100%の顕著な指紋認証成功率(FVSR)で示される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:07:16 GMT)
Bonsai: Gradient-free Graph Distillation for Node Classification [17.0] グラフ蒸留は、GNNのスケーラブルなトレーニングを可能にするための有望な道として登場した。
本研究は, 現行のグラフ蒸留技術において, 重大な欠点を明らかにするものである。
本稿では,テキスト計算木がメッセージパッシングGNNの基本処理単位を形成するという観察により,新しいグラフ蒸留法であるボンサイについて述べる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:09:46 GMT)
Counting Guidance for High Fidelity Text-to-Image Synthesis [16.8] テキストから画像への拡散モデルは、与えられた入力プロンプトに対して高忠実度コンテンツを作成するのに苦労することがある。
入力プロンプトに基づいて正しい対象数を正確に生成できるように拡散モデルを改善する手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:52:00 GMT)
Improving Neutral Point of View Text Generation through Parameter-Efficient Reinforcement Learning and a Small-Scale High-Quality Dataset [16.7] ニュートラル・ポイント・オブ・ビュー(NPOV)を用いたセンシティブな話題に対する質問に答える「LLM」機能を改善するためのデータセットの構築と訓練方法の評価について述べる。
データセットであるSHQ-NPOVデータセットは、300の高品質な人書き四重項で構成されており、センシティブなトピックに関するクエリ、回答、NPOVレーティング、および様々な視点を解明するソーステキストへのリンクである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:32:47 GMT)
Online Planning for Multi-UAV Pursuit-Evasion in Unknown Environments Using Deep Reinforcement Learning [16.7] マルチUAV追跡回避は、UAV群知能にとって重要な課題である。
本研究では,協調戦略学習における部分的可観測性に対処するために,回避者予測強化ネットワークを導入する。
我々は、2段階の報酬改善を通じて実現可能な政策を導出し、ゼロショット方式で実四重項にポリシーを展開する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:55:45 GMT)
A Survey of Foundation Models for Environmental Science [16.4] ファンデーションモデルは、多様なデータソースを統合することによって、変革的な機会を提供する。
我々は、学際的なコラボレーションを促進し、環境科学における持続可能なソリューションのための最先端の機械学習の統合を促進することを目的としている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:33:31 GMT)
The Signed Two-Space Proximity Model for Learning Representations in Protein-Protein Interaction Networks [16.4] 複雑なタンパク質-タンパク質相互作用(PPI)の正確な予測は、生物学的プロセスの復号に不可欠である。
署名されたPPIネットワークに対して,S2-SPM(Signed Two-Space Proximity Model)を提案する。
我々のアプローチは、極端なタンパク質プロファイルを表すアーチタイプを識別することを可能にする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:08:58 GMT)
DongbaMIE: A Multimodal Information Extraction Dataset for Evaluating Semantic Understanding of Dongba Pictograms [16.4] DongbaMIEは、Dongba pictographsのセマンティック理解と抽出のための最初のマルチモーダルデータセットである。
23,530の文レベルと2,539の段落レベルのイメージを含み、対象、行動、関係、属性の4つの意味的次元をカバーする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:20:53 GMT)
Strong Structural Bounds for MaxSAT: The Fine Details of Using Neuromorphic and Quantum Hardware Accelerators [16.3] 量子アニールやニューロモルフィックチップのようなハードウェアアクセラレーターは、ハミルトンの基底状態を見つけることができる。
それまでの研究は、構文的・構造的特性ではなく、エンコーディングのサイズにのみ関係していた。
我々は、MaxSAT、Max2SAT、およびハードウェアアクセラレータの基盤となる2次非制約バイナリ最適化問題(QUBO)の間の構造認識の低減を確立する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:04:19 GMT)
CMMLoc: Advancing Text-to-PointCloud Localization with Cauchy-Mixture-Model Based Framework [16.2] ポイントクラウドのローカライゼーションの目的は、大都市環境におけるテキスト記述を用いた3次元位置の同定である。
我々は、不確実性を意識した$textbfC$auchy-$textbfM$ixture-$textbfM$odelである$textbfCMMLocを提案する。
CMMLocは既存の手法より優れており、KITTI360Poseデータセット上で最先端の結果が得られる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:11:25 GMT)
Empirical Coordination of Separable Quantum Correlations [16.0] 経験的調整は量子システムの自然な枠組みである。
カスケードネットワークに着目して最適な調整率を確立する。
量子協調ゲームにおける結果の結果について論じる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:21:36 GMT)
Market-based Architectures in RL and Beyond [15.8] 「我々は、国家自体を商品と呼ばれるいくつかの軸に分解する新しいタイプの市場ベースアルゴリズムを導入する。」
市場ベースのアルゴリズムは、AIにおける現在の多くの課題に対処する可能性がある、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:09:29 GMT)
A generative approach to LLM harmfulness detection with special red flag tokens [15.8] 我々はレッドフラッグトークン(rf>)と呼ばれる特別なトークンでモデルの語彙を拡張することを提案する。
本発明の安全性訓練方法は、会話中に常に有害な生成分類器にLLMを効果的に増強する。
また、入力プロンプトだけでなく、生成された各回答を評価し、サンプリングベースの攻撃に対してより強力な防御を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:31:47 GMT)
Beyond Canonicalization: How Tensorial Messages Improve Equivariant Message Passing [15.7] 制約なく任意のアーキテクチャと統合可能な,ローカル参照フレーム(ローカル標準化)に基づくフレームワークを提案する。
任意の次元のユークリッド空間における幾何学的データに対するメッセージパッシングに適用する。
我々は、テンソルメッセージの優位性を実証し、通常のベクトル回帰および他の標準的な3Dポイントクラウドタスクの競合結果に対する最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:35:35 GMT)
On the Convergence of Adam-Type Algorithm for Bilevel Optimization under Unbounded Smoothness [15.7] 本稿では,単ループのAdam-type法であるAdamBOについて紹介する。
バイレベルを含む各種機械学習タスクについて実験を行った。
リカレントニューラルネットワーク(RNN)とトランスフォーマーによる定式化。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:16:59 GMT)
Revisiting Random Walks for Learning on Graphs [15.6] 我々は、グラフ上のランダムウォークが機械可読レコードを生成する、グラフ上の機械学習のための単純なモデルクラスを再考する。
我々はこれらの機械をランダムウォークニューラルネットワーク(RWNN)と呼んでいる。
確率におけるグラフ関数の普遍近似を可能としながら、RWNNを同型不変として設計できることが示される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:02:28 GMT)
MDP Geometry, Normalization and Reward Balancing Solvers [15.6] 本稿では,マルコフ決定過程(MDP)の自然な正規化手順による新しい幾何学的解釈を提案する。
このMDPの利点保存変換は、私たちがReward Balancingと呼ぶアルゴリズムのクラスを動機付けます。
本稿では、このクラスにおけるいくつかのアルゴリズムの収束解析を行い、特に、未知の遷移確率のMDPに対して、最先端のサンプル複雑性の結果を改善することができることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:40:42 GMT)
EnigmaToM: Improve LLMs' Theory-of-Mind Reasoning Capabilities with Neural Knowledge Base of Entity States [15.6] 理論・オブ・ミンド(ToM)は人間の相互作用の基本であるが、Large Language Models(LLM)の課題である。
Enigma(エニグマ)の神経知識ベースを統合することでToM推論を強化する新しいニューロシンボリックフレームワークであるEnigmaToMを提案する。
ToMi, HiToM, FANToM などの複数のベンチマークによる実験結果から, EnigmaToM は様々な大きさの LLM における ToM 推論を大幅に改善することが示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:13:05 GMT)
Learning High-Degree Parities: The Crucial Role of the Initialization [15.5] 本稿では,通常のニューラルネットワーク上での勾配勾配降下に対して,学習性は初期重み分布に依存することを示す。
ほぼ完全なパリティの正の値は$sigma=O(d-1)$とされ、よりシャープなしきい値現象に関する疑問が指摘される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:37:17 GMT)
Adapting Pre-Trained Vision Models for Novel Instance Detection and Segmentation [15.4] 新たなインスタンス検出と計算(NIDS)は、新しいオブジェクトインスタンスを検出し、セグメンテーションすることを目的としている。
我々は、オブジェクトの提案生成、インスタンステンプレートと提案領域の両方の埋め込み生成、インスタンスラベル割り当ての埋め込みマッチングを含む統一的でシンプルで効果的なフレームワーク(NIDS-Net)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:48:25 GMT)
LiFT: Leveraging Human Feedback for Text-to-Video Model Alignment [15.1] 本稿では,T2Vモデルアライメントにヒトのフィードバックを利用するLiFTを提案する。
我々はまず,約10kの人間のアノテーションからなるヒューマンレーティングHRAを構築し,それぞれがスコアとそれに対応する論理を含む。
そこで我々は,報酬関数を効果的に学習するために,報酬モデルLiFT-Criticを訓練する。
最後に、学習した報酬関数を利用して、報酬重み付き確率を最大化し、T2Vモデルを整列する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:43:42 GMT)
Cite Before You Speak: Enhancing Context-Response Grounding in E-commerce Conversational LLM-Agents [15.0] In-context Learning(ICL)とMulti-UX-Inference(MUI)を利用した「引用体験」を実現する。
この引用生成パラダイムを組み込むことで,実世界のデータに対するLLM応答の基底化が13.83%向上することが実証された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:58:35 GMT)
Data Poisoning Attacks to Locally Differentially Private Range Query Protocols [14.9] 地理的な位置からの動きを追跡するトラジェクトリデータは、現実世界のアプリケーションを改善するために不可欠である。
ローカルディファレンシャルプライバシ(LDP)は、個人が自分の軌跡データを共有する前に局所的に摂動できるようにするソリューションを提供する。
プライバシー上の利点にもかかわらず、LDPプロトコルはデータ中毒攻撃に対して脆弱であり、攻撃者は偽のデータを注入して集約された結果を操作する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:40:34 GMT)
SymmetricDiffusers: Learning Discrete Diffusion on Finite Symmetric Groups [14.9] 本稿では,S_n$以上の複雑な分布を学習するタスクを単純化する離散拡散モデルを提案する。
有限群上のランダムウォークの理論に基づいて拡散長を選択するための経験的ガイドラインを提供する。
本モデルでは,4桁画像のソート,ジグソーパズル,旅行セールスマン問題などの課題に対して,最先端ないし同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:22:12 GMT)
Train for the Worst, Plan for the Best: Understanding Token Ordering in Masked Diffusions [14.9] 仮面拡散モデル (MDMs) は、離散領域にまたがる生成的モデリングのための有望な代替手法として登場した。
適応推論は、事前訓練されたMDMの精度を7$%から90$%に向上させ、ARMを7times$のパラメータで上回ります。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:19:48 GMT)
Extrapolation Merging: Keep Improving With Extrapolation and Merging [14.8] 大規模言語モデル(LLM)は、異なる下流タスクを実行するために命令の微調整を必要とする。
モデルマージは、異なるモデルのパラメータを組み合わせることでパフォーマンスを向上させることを目的としている。
本稿では,余分な計算資源やデータを必要とすることなく,モデル性能の向上を継続するパラダイムであるExtrapolation Mergingを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:28:22 GMT)
Personalized Federated Fine-tuning for Heterogeneous Data: An Automatic Rank Learning Approach via Two-Level LoRA [14.8] PF2LoRAは、2レベルLORAによる新しいアンフェマティックなランク学習アプローチに基づいて構築された、パーソナライズされたファインチューニングアルゴリズムである
自然言語理解および生成タスクに関する実験により,PF2LoRAが既存のファインチューニング手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:41:03 GMT)
Uni-Renderer: Unifying Rendering and Inverse Rendering Via Dual Stream Diffusion [14.8] レンダリングと逆レンダリングはコンピュータビジョンとグラフィックスにおいて重要なタスクである。
本稿では、2つの条件生成タスクとしてレンダリングと逆レンダリングを共同でモデル化するデータ駆動手法を提案する。
トレーニングと推論のコードをオープンソースとして公開し、この分野のさらなる研究と開発を後押しします。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:09:23 GMT)
Evolutionary Prediction Games [14.8] 本研究では,ユーザグループ間の自然な選択の原動力として,学習の役割を捉えた進化的予測ゲームを紹介し,研究する。
i) 無制限のデータと計算の環境では、学習は適合者の生存を強くする傾向があり、(ii) より現実的な環境では、共存の機会が出現する傾向にある。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:24:55 GMT)
Decentralized Low-Rank Fine-Tuning of Large Language Models [14.8] 我々は,Low-Rank Adaptation (LoRA)に基づく大規模言語モデル(LLM)のための分散微調整アルゴリズムであるDec-LoRAを提案する。
BERT と LLaMA の実験により,Dec-LoRA は様々な条件下で集中型 LoRA に匹敵する性能を示した。
これらの結果は、分散環境におけるスケーラブルな微調整のためのDec-LoRAの可能性を強調している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:09:09 GMT)
Position: Model Collapse Does Not Mean What You Think [14.6] モデル崩壊の研究は、実際には8つの異なるモデル崩壊の定義に矛盾することがあると論じる。
モデル崩壊の予測された主張は、現実の条件に合わない仮定や条件に依存すると結論付けている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:47:17 GMT)
NeuGrasp: Generalizable Neural Surface Reconstruction with Background Priors for Material-Agnostic Object Grasp Detection [14.6] NeuGraspは、材料に依存しないグリップ検出に背景の事前情報を活用するニューラルサーフェス再構成法である。
我々は,NeuGraspが同等の復元品質を維持しつつ,把握における最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:57:37 GMT)
DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping [14.5] 汎用ロボットは任意のシナリオで多様な物体を把握できなければならない。
私たちのソリューションはDexGraspVLAです。これは、事前訓練されたビジョンランゲージモデルをハイレベルタスクプランナとして利用する階層的なフレームワークです。
本手法は, 数千の未確認物体, 照明, 背景の組み合わせで90%以上の成功率を達成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:23:09 GMT)
Golden Cudgel Network for Real-Time Semantic Segmentation [14.5] リアルタイムセマンティックセグメンテーションのためのGolden Cudgel Network(GCNet)を提案する。
GCNetはトレーニングに垂直のマルチ畳み込みと水平のマルチパスを使用し、推論のために単一の畳み込みにパラメータ化され、パフォーマンスとスピードの両方を最適化する。
実験の結果、GCNetはCityscapes、CamVid、Pascal VOC 2012データセットのパフォーマンスと速度において、既存の最先端モデルよりも優れています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:59:23 GMT)
SurgiSAM2: Fine-tuning a foundational model for surgical video anatomy segmentation and detection [14.5] 手術シーン理解のためのSAM 2の評価には,臓器・組織の意味的セグメンテーション機能について検討した。
微調整されたSAM 2モデルであるSurgiSAM 2はセグメンテーション性能を大幅に改善した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:18:32 GMT)
Exploring Code Language Models for Automated HLS-based Hardware Generation: Benchmark, Infrastructure and Analysis [14.5] LLM(Large Language Model)は、PythonやC++などのプログラミング言語に使用される。
本稿では,LLMを利用してHLS(High-Level Synthesis)ベースのハードウェア設計を行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:07:23 GMT)
Early-Stopped Mirror Descent for Linear Regression over Convex Bodies [14.3] 加法的ガウス雑音下での高次元線形回帰の設定について検討する。
その結果,未拘束の早期停止ミラー降下の最悪のリスクは,少なくとも凸体に拘束される最小2乗推定器のリスクであることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:59:31 GMT)
Deep Learning-based MRI Reconstruction with Artificial Fourier Transform Network (AFTNet) [14.1] 複合価値ディープラーニングフレームワーク-Artificial Fourier Transform Network (AFTNet)を導入する。
AFTNetは、ドメイン変換における画像逆問題の解決に容易に利用できる。
AFTNetは既存のアプローチに比べ,MRIの高速化に優れることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:27:43 GMT)
Deep Understanding of Sign Language for Sign to Subtitle Alignment [14.0] 入力字幕を前処理するために、英国手話の文法規則を利用する。
信号の時間的位置を予測するためのモデルを最適化するために、選択的アライメント損失を設計する。
音声対応ラベルよりも高精度な、洗練された擬似ラベルによる自己学習を行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:13:40 GMT)
CREStE: Scalable Mapless Navigation with Internet Scale Priors and Counterfactual Guidance [13.9] CREStEは完全なマップレスナビゲーション問題に対処するための表現と報酬を学ぶ。
我々はCREStEを6つの異なる都市環境におけるキロメートル規模のナビゲーションタスクで評価した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:42:46 GMT)
Biased Heritage: How Datasets Shape Models in Facial Expression Recognition [13.8] 画像に基づく表情認識システムにおいて,データセットから訓練されたモデルへのバイアス伝搬について検討する。
本稿では,複数の階層群を有する複数クラス問題に特化して設計された新しいバイアス指標を提案する。
その結果,FERデータセットの一般的な人口収支よりも,感情特異的な人口動態パターンの防止が優先されるべきであることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:25:22 GMT)
Is Pre-training Applicable to the Decoder for Dense Prediction? [13.5] これは、3つの革新的な設計を通じて"事前訓練されたエンコーダ$times$プレトレーニングされたデコーダ"のコラボレーションを促進する。
事前トレーニングされたエンコーダと事前トレーニングされたデコーダを単純に結合することで、$times$Netは自身を非常に有望なアプローチと区別する。
合理化された設計にもかかわらず、$times$Netはモノクロ深度推定やセマンティックセグメンテーションといったタスクにおいて高度なメソッドよりも優れている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:16:28 GMT)
Alice in Wonderland: Simple Tasks Showing Complete Reasoning Breakdown in State-Of-the-Art Large Language Models [13.5] 大規模言語モデル(LLM)は、しばしばスケーリング法則に従う強力な一般化を持つ基礎モデルの例として記述される。
ここでは、強い関数を主張する全てのSOTAモデルの一般化と基本的推論の劇的な分解を示す。
また、間違った解法において強い過信感を観察し、妥当な音響的説明のような折り畳みの形で表現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:58:08 GMT)
Towards Effective and Sparse Adversarial Attack on Spiking Neural Networks via Breaking Invisible Surrogate Gradients [13.5] スパイキングニューラルネットワーク(SNN)は、勾配に基づく敵攻撃に対して脆弱である。
本稿では,SGとモデル間のロバストな接続を確立するために,革新的な電位依存サロゲート勾配(PDSG)法を提案する。
また,バイナリダイナミックイメージを効果的に攻撃するためのスパースダイナミックアタック(SDA)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:52:55 GMT)
PacketCLIP: Multi-Modal Embedding of Network Traffic and Language for Cybersecurity Reasoning [13.5] PacketCLIPは、パケットデータと自然言語のセマンティクスを組み合わせたマルチモーダルフレームワークである。
セマンティック推論と効率的な分類を統合し、暗号化されたネットワークフローにおける異常の堅牢な検出を可能にする。
95%の平均AUCを達成し、ベースラインを11.6%上回り、モデルサイズを92%減らす。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:58:58 GMT)
Efficient Neural SDE Training using Wiener-Space Cubature [13.4] モンテカルロシミュレーションをバイパスし,改良する新しいトレーニング手法を提案する。
We extended results in the theory of Wiener-space cubature to almost the expected objective functional by a weighted sum of deterministic ODE solution。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:10:51 GMT)
BANet: Bilateral Aggregation Network for Mobile Stereo Matching [13.4] 最先端のステレオマッチング手法は、通常、コストのかかる3D畳み込みを使用して、全コストのボリュームを集約する。
本稿では,2次元畳み込みのみを用いて,鋭いエッジと細かな細部を持つ高品質な結果を生成する,移動体ステレオマッチングのための新しい双方向アグリゲーションネットワーク(BANet)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:33:08 GMT)
Efficient Sparse PCA via Block-Diagonalization [13.4] スパースPCAを効率的に近似する新しいフレームワークを提案する。
既製のスパースPCAアルゴリズムを利用することができ、計算速度を大幅に向上させることができる。
本手法は,平均近似誤差0.61%を維持しながら,平均速度係数100.50を達成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:31:22 GMT)
Decoupling the components of geometric understanding in Vision Language Models [13.2] 我々は、最先端の視覚言語モデル(VLM)が単純な幾何学的概念を理解できるかどうかを評価する。
本研究は、米国における成人のモデルパフォーマンスと、アマゾンの先住民集団による正式な教育を受けていない成人の先行研究とを比較した。
また、VLMの幾何学的理解は人間の理解よりも不安定であり、タスクが精神的回転を必要とする場合、堅牢ではないことも見出した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:09:19 GMT)
Defining and Characterizing Reward Hacking [13.2] 期待されるプロキシリターンを増やすことで、期待される真のリターンを決して削減できないのであれば、プロキシはハック不可能である、と私たちは言います。
重要な洞察は、報酬の線形性は、不安定を非常に強い条件にするということである。
この結果から,報酬関数を用いて狭いタスクを指定し,AIシステムと人的価値の整合を図った。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:08:30 GMT)
Vision-Language Models Struggle to Align Entities across Modalities [13.1] クロスモーダルなエンティティリンクは、マルチモーダルコード生成のような現実世界のアプリケーションに必要な基本的なスキルである。
我々のベンチマークであるMATEは5.5kの評価インスタンスで構成されており、視覚シーンはテキスト表現と一致している。
現状のビジョン・ランゲージ・モデル(VLM)と人間をこの課題で評価し,VLMが人間と比べ有意に苦労していることを見いだした。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:36:43 GMT)
AttackSeqBench: Benchmarking Large Language Models' Understanding of Sequential Patterns in Cyber Attacks [13.1] 我々は,サイバー脅威インテリジェンス(CTI)レポートにおいて,攻撃シーケンスの理解と推論を行うLarge Language Models(LLM)能力を評価するためのベンチマークであるAttackSeqBenchを紹介する。
本ベンチマークでは,3つの質問応答(QA)タスクを対象とし,各タスクは,相手行動の粒度の違いに焦点をあてる。
サイバー攻撃のシーケンシャルなパターンを分析する上での、その強みと限界を強調しながら、高速思考とスロー思考の両方で広範な実験と分析を行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:25:21 GMT)
CipherPrune: Efficient and Scalable Private Transformer Inference [12.9] 暗号化プロトコルを使用したプライベートトランスフォーマー推論は、プライバシ保護機械学習のための有望なソリューションを提供する。
しかしながら、実行時のオーバーヘッド(効率上の問題)と、長時間の入力を処理する上での課題に依然として直面している。
我々は、効率的でスケーラブルなプライベート推論フレームワークであるcipheritCipherPruneを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:18:29 GMT)
Helix: Serving Large Language Models over Heterogeneous GPUs and Network via Max-Flow [12.8] Helixは、ヘテロジニアスGPUクラスタで動作する、高レイテンシで低スループットの大規模言語モデル(LLM)のための分散システムである。
Helixはスループットを最大3.3倍改善し、既存のアプローチと比較して、それぞれ66%、デコード遅延を最大24%削減する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:00:57 GMT)
GNNMerge: Merging of GNN Models Without Accessing Training Data [12.6] モデルのマージは、オリジナルのトレーニングデータにアクセスすることなく、複数のトレーニングされたモデルを単一のモデルに統合する方法として、機械学習において注目されている。
既存のアプローチはコンピュータビジョンやNLPのような領域で成功を示しており、グラフニューラルネットワーク(GNN)への応用は未解明のままである。
タスクに依存しないノード埋め込みアライメント戦略を用いてGNNをマージするGNNMergeを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:02:29 GMT)
AdaSin: Enhancing Hard Sample Metrics with Dual Adaptive Penalty for Face Recognition [12.6] 本稿では,新しい難易度指標として,サンプルの埋め込み特徴と接地トラスクラス中心との間の角度の正弦を導入するアダプティブ・シン(AdaSin)損失関数を提案する。
AdaSinは他の最先端手法よりも精度が高い。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:11:13 GMT)
Transformers for molecular property prediction: Domain adaptation efficiently improves performance [12.6] 本研究の目的は,分子特性予測における変圧器モデルの限界について検討し,克服することである。
本稿では,事前学習データセットのサイズと多様性がトランスフォーマーモデルの性能に及ぼす影響について検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:40:09 GMT)
Enhancing the Accuracy and Comprehensibility in Architectural Tactics Detection via Small Model-Augmented Prompt Engineering [12.6] アーキテクチャ戦略(AT)は、ソフトウェアシステムの非機能要件に対処する。
我々は,ATs検出の精度と理解性を高めるため,小型モデル拡張プロンプトフレームワークであるPrmt4TDを提案する。
Prmt4TDは,ATsバランスデータセットの精度(emphF1スコア)が13%-23%向上したことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:47:22 GMT)
Distilling Dataset into Neural Field [12.6] 本稿では,データセット蒸留のための新しいパラメータ化フレームワークであるDistilling datasetをニューラルネットワーク(DDiF)に生成する手法を提案する。
神経野のユニークな性質のため、DDiFは情報を効果的に保存し、様々な形のデータを容易に生成する。
DDiFは、画像領域を超えて、ビデオ、オーディオ、および3Dボクセルを含む、いくつかのベンチマークデータセットで優れたパフォーマンスを実現することを実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:33:29 GMT)
Task-Agnostic Attacks Against Vision Foundation Models [12.5] 機械学習の実践者が利用可能なトレーニング済みのビジョン基礎モデルを採用するのが、標準のプラクティスになっている。
このような基盤モデルに対する攻撃の研究と、複数の下流タスクに対するその影響は、いまだに明らかにされていない。
本研究は,基本モデルを用いて得られた特徴表現を極大に破壊することにより,タスク非依存の敵例を定式化する汎用フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:15:14 GMT)
How simple can you go? An off-the-shelf transformer approach to molecular dynamics [12.4] 本稿では,分子動力学の「オフ・ザ・シェルフ」トランスフォーマーアーキテクチャを用いたレシピを提案する。
少数のステップを微調整した後、いくつかのベンチマークで最先端の結果を示す。
提案モデルでは, 大規模構造物における脱落エネルギーの増加を示す一方で, 小型構造物のエネルギー保存型NVEシミュレーションについて概説する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:04:46 GMT)
Personalize Your LLM: Fake it then Align it [12.4] CHAMELEONは、自己生成した個人嗜好データと表現編集を利用する、スケーラブルで効率的なパーソナライズ手法である。
実験の結果,CHAMELEONは個人選好に効率よく適応し,指導訓練モデルを改善し,平均40%のパーソナライズベースラインを上回り,2つのパーソナライズベースラインを達成できた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:59:19 GMT)
Temporal Separation with Entropy Regularization for Knowledge Distillation in Spiking Neural Networks [12.4] スパイキングニューラルネットワーク(SNN)は、離散スパイクベースの情報伝達を通じて計算効率を著しく向上させる。
推論エネルギー消費を減らす可能性にもかかわらず、SNNとArtificial Neural Networks(ANN)のパフォーマンスギャップは持続する。
本稿では,時間的分離とエントロピー正則化を特徴とする新しいロジット蒸留法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:37:41 GMT)
L2R: Learning to Reduce Search Space for Generalizable Neural Routing Solver [12.4] 構成的ニューラル最適化(NCO)は、手作りのルールに頼ることなく複雑なルーティング問題を解決する能力によって、研究の注目を集めている。
既存のNCO手法は、計算の複雑さと構造パターンの非効率な捕捉により、大規模問題に一般化する際の課題に直面している。
建設的NCOプロセスの各ステップにおいて,少数の有望な候補ノードを適応的に選択する,学習に基づく探索空間削減手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:25:09 GMT)
The Power of Active Multi-Task Learning in Reinforcement Learning from Human Feedback [12.4] 人間のフィードバックからの強化学習は、大きな言語モデルの性能向上に寄与している。
我々は、RLHFをコンテキストデュエルバンディット問題として定式化し、共通の線形表現を仮定する。
我々は、$varepsilon-$optimalを達成するために、ソースタスクのサンプルの複雑さを著しく低減することができることを証明した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:09:08 GMT)
Canonical normalizing flows for manifold learning [12.2] そこで本研究では,新しい目的によって変換行列を強制し,顕著で非退化的な基底関数をほとんど持たない正準多様体学習フロー法を提案する。
正準多様体の流れは潜在空間をより効率的に利用し、データを表現するために顕著で異なる次元を自動生成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:27:05 GMT)
Psy-Copilot: Visual Chain of Thought for Counseling [12.0] Psy-COTは、治療セッション中に大きな言語モデル(LLM)の思考過程を視覚化するように設計されたグラフである。
Psy-Copilotは人間の心理療法士の相談を支援するために設計された会話型AIアシスタントである。
Psy-Copilotは、精神療法士を置き換えるのではなく、AIと人間のセラピストとのコラボレーションを促進するように設計されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:23:15 GMT)
Bi-Fact: A Bidirectional Factorization-based Evaluation of Intent Extraction from UI Trajectories [11.9] Bi-Factは意図を原子的な事実に分解し、精度とリコールを評価するために双方向比較を行う。
実験は、既存の指標と比較して、Bi-Factの人的判断との相関が優れていることを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:54:25 GMT)
MMBind: Unleashing the Potential of Distributed and Heterogeneous Data for Multimodal Learning in IoT [11.9] 分散および異種IoTデータに対するマルチモーダル学習のための新しいデータバインディング手法であるMBBindを提案する。
MMBindは、データの不完全性やドメインシフトの度合いによって、最先端のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:08:49 GMT)
A Predict-Then-Optimize Customer Allocation Framework for Online Fund Recommendation [11.6] 中心的な課題は、制約の下で潜在的顧客と資金を一致させることだ。
従来のレコメンデーション・レコメンデーション・レコメンデーション・レコメンデーションは、ファンドマッチング問題に複数の制約を課す際に固有の欠点がある。
顧客行動に基づいた予測収益予測を目的とした予測資金配分フレームワークであるPTOFAを設計する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:16:36 GMT)
A self-supervised cyclic neural-analytic approach for novel view synthesis and 3D reconstruction [11.6] 本稿では、高品質なニューラルネットワークレンダリング出力と分析手法からの正確な幾何学的洞察を組み合わせた自己教師付き循環型ニューラルネットワークパイプラインを提案する。
我々のソリューションは、新しいビュー合成のためのRGBとメッシュ再構成を改善し、特にトレーニングデータセットとは全く異なるアンサンプされた領域や領域で改善する。
以上の結果から,新規な3次元画像のレンダリングや3次元画像の再構成が大幅に向上していることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:28:01 GMT)
Enhancing Abnormality Grounding for Vision Language Models with Knowledge Descriptions [11.5] 本稿では,医学的異常検出と局所化におけるVLM性能向上のための新しいアプローチを提案する。
医療概念を基本的な属性と一般的な視覚パターンに分解することに注力する。
提案手法を0.23B Florence-2ベースモデルで評価し,より大きな7B LLaVAベースの医療用VLMと同等の性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:02:33 GMT)
Neural Descriptors: Self-Supervised Learning of Robust Local Surface Descriptors Using Polynomial Patches [11.5] 本稿では3次元表面から幾何学的特徴を抽出するための自己教師付き学習手法を提案する。
提案手法は,合成データ生成と,サンプリング不変の特徴を学習するためのニューラルアーキテクチャを組み合わせる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:15:14 GMT)
Oblivious Digital Tokens [11.4] コンピュータ装置は、通常、ユニークな測定可能な振る舞いを示すか、秘密の知識を証明することによって、自分自身を識別する。
サイバー・コンフリクトの間、デジタルリソースを保護するために赤十字国際委員会が最近提案したデジタルエンブレムの文脈において、この問題が自然に発生するかを示す。
この新たな重要かつオープンな問題に対処するために、我々はOblivious Digital Token (ODT)と呼ばれる新しいプリミティブを定義します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:34:31 GMT)
Dynamic Hologram Generation with Automatic Differentiation [11.3] 我々は、時間とともにスムーズに変化する光トラップアレイを生成するための、自動微分に基づく戦略を開発した。
本手法と空間光変調器を組み合わせることにより,実実験における粒子の動的操作を期待できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:03:42 GMT)
Psy-Insight: Explainable Multi-turn Bilingual Dataset for Mental Health Counseling [11.3] Psy-Insightは、メンタルヘルス指向の説明可能な最初のマルチタスクバイリンガルデータセットである。
私たちのアノテーションには、心理療法、感情、戦略、トピックラベル、ターンレベルの推論とセッションレベルのガイダンスが含まれています。
実験により、Psy-Insight上でのLLMのトレーニングにより、モデルが会話スタイルを模倣するだけでなく、基礎となる戦略やカウンセリングの推論を理解することができることが示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:44:21 GMT)
Combined Physics and Event Camera Simulator for Slip Detection [11.3] 本稿では,ロボットアームのカメラグリッパー構成を用いてスリップデータを生成するシミュレーションパイプラインを提案する。
セットアップをいつでも変更でき、繰り返しのプロセスを単純化し、任意に大きなデータセットを生成することができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:50:21 GMT)
All-atom Diffusion Transformers: Unified generative modelling of molecules and materials [11.2] All-atom Diffusion Transformer (ADiT) は、周期的材料と非周期的分子システムの両方を共同生成するための統合潜在拡散フレームワークである。
QM9とMP20データセットの実験では、共同で訓練されたADiTが物質だけでなく現実的で有効な分子を生成することが示されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:35:44 GMT)
VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning [11.1] 低消費電力ロボットに効率的な空間推論を組み込んだ視覚言語ナビゲーション(VL-Nav)システムを提案する。
ロボットを誘導するための単一の画像レベルの特徴類似性に依存する従来の手法とは異なり、本手法は画素単位の視覚言語機能と好奇心駆動探索を統合している。
VL-Navは、全体の成功率86.3%に達し、以前の手法を44.15%上回った。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:11:08 GMT)
MUSE-Net: Missingness-aware mUlti-branching Self-attention Encoder for Irregular Longitudinal Electronic Health Records [11.1] データ駆動型疾患予測のための縦型EHRのモデル化における課題に対処するため、ミススティングネスを意識したmUlti-branching Self-Attention(MUSE-Net)を提案する。
提案するMUSE-Netは,(1)データ計算に価値マスクが欠けているマルチタスクプロセス(MGP),(2)データ不均衡問題に対処するマルチブランチアーキテクチャ,(3)時間認識型自己保持エンコーダの4つのモジュールから構成される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:39:47 GMT)
Narrowing the Gap between Adversarial and Stochastic MDPs via Policy Optimization [11.1] 対人的マルコフ決定過程における学習の問題を考える。
本稿では,APO-MVPと呼ばれるアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:07:22 GMT)
Small but Mighty: Enhancing Time Series Forecasting with Lightweight LLMs [11.1] 本稿では,SMETimesについて述べる。SMETimesは,3B以下のパラメータのSLMを,効率的かつ正確な時系列予測を行うための最初の体系的な研究である。
統計的特徴によって数値時系列をテキスト意味論でブリッジする統計的に強化されたプロンプト機構; 学習可能なパラメータを通して時間パターンと言語モデルトークン空間を整列する適応型融合埋め込みアーキテクチャ。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:27:36 GMT)
An Optimization Algorithm for Multimodal Data Alignment [11.0] Kernel CCAにインスパイアされた最適化アルゴリズムを導入し,Nのモダリティ間の類似性を最大化するとともに,いくつかの制約を課す。
この研究は、検索や分類など、様々な推論タスクにおけるデータ表現の改善への影響を実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:07:07 GMT)
Active 6D Pose Estimation for Textureless Objects using Multi-View RGB Frames [10.9] RBG画像からテクスチャレス物体の6次元ポーズを推定することはロボティクスにおいて重要な問題である。
RGB画像のみを用いてテクスチャレス物体の6次元ポーズを推定するための包括的能動的知覚フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:28:32 GMT)
SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Safe Reinforcement Learning [10.8] 視覚言語アクションモデル(VLA)に安全性を統合する新しいアルゴリズムであるSafeVLAを提案する。
SafeVLAは、シミュレーション環境で大規模な制約付き学習を採用することで、安全性とタスクパフォーマンスのバランスをとる。
SafeVLAは安全性とタスク性能の両方において最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:16:55 GMT)
Use of Air Quality Sensor Network Data for Real-time Pollution-Aware POI Suggestion [10.8] 本論文では,POIのリアルタイムな汚染対応レコメンデーションを提供するプライバシ保護モバイルアプリであるAirSense-Rを紹介する。
AirSenceセンサーネットワークからのライブの空気質データをユーザの好みと組み合わせることで、このシステムは健康に配慮した意思決定を可能にする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:48:05 GMT)
Revisiting the Role of Relearning in Semantic Dementia [10.7] 失った知識の再学習は、意味認知症などの慢性認知疾患では広く支持されていない。
従来の研究では、深い線形人工知能ニューラルネットワークが人間に似た意味学習の段階を示すことが示されている。
深層線形ネットワークを用いて、特定の萎縮ではなく、疾患進行中の再学習がSDに関連する行動パターンを引き起こすという仮説を検証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:28:38 GMT)
Bridging Molecular Graphs and Large Language Models [10.6] 大規模言語モデル(LLM)は例外的な一般化能力を示しているが、分子構造のようなグラフデータを処理する能力は依然として限られている。
本稿では,LLMトークンにグラフトークンをアライメントする効率的なソリューションであるGraph2Tokenを提案する。
分子分類および回帰タスクに関する大規模な実験により,提案したGraph2Tokenの有効性が示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:15:38 GMT)
Transformer-Based Power Optimization for Max-Min Fairness in Cell-Free Massive MIMO [10.6] 本稿では,ユーザとアクセスポイントの位置のみを用いて,最適なアップリンクとダウンリンクの電力を共同で予測するトランスフォーマーニューラルネットワークを提案する。
実験結果から, ほぼ最適性能が得られた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:49:06 GMT)
Periodontal Bone Loss Analysis via Keypoint Detection With Heuristic Post-Processing [10.6] 本研究では, 深層学習キーポイントと物体検出モデル YOLOv8-pose の局所的骨損失ランドマークの自動同定への応用について検討した。
YOLOv8-poseは193個の注釈付き根尖部X線写真に微調整された。
画像中の平均歯の大きさに基準を定め, キーポイント検出基準であるPRCK(Relative Correct Keypoints)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:34:29 GMT)
Dashing for the Golden Snitch: Multi-Drone Time-Optimal Motion Planning with Multi-Agent Reinforcement Learning [10.6] 本稿では,マルチエージェント強化学習を用いた分散型ポリシネットワークを時間-最適マルチドローン飛行に適用する。
飛行効率と衝突回避のバランスをとるために,最適化手法に着想を得たソフト衝突防止機構を導入する。
大規模シミュレーションでは, 単流体システムと比較して性能のトレードオフはわずかに小さいものの, 衝突速度が低い状態で, 最適に近い性能を維持することが示されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:35:47 GMT)
External Reliable Information-enhanced Multimodal Contrastive Learning for Fake News Detection [10.6] ERIC-FNDは、フェイクニュース検出のための情報強化型マルチモーダルコントラスト学習フレームワークである。
実験は、X(Twitter)とWeiboという、さまざまな言語で一般的に使用されている2つのデータセットで行われます。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:07:38 GMT)
Robust Learning of Diverse Code Edits [10.6] ソフトウェアエンジニアリングのアクティビティは、しばしば既存のコードへの編集を伴います。
コード言語モデル(LM)には、さまざまなタイプのコード編集要求を処理する能力がない。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:39:04 GMT)
A Reverse Mamba Attention Network for Pathological Liver Segmentation [10.5] 本稿では、視覚状態空間モデルの能力を向上させる新しいアーキテクチャであるRMA-Mambaを紹介する。
Vision Mamba(VMamba)とRMAのターゲット機能の改良を統合することで、アーキテクチャは複数のスケールにわたる優れた機能学習を実現する。
RMA-Mambaの病的肝セグメンテーション領域における効果を実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:18:00 GMT)
CodeIF-Bench: Evaluating Instruction-Following Capabilities of Large Language Models in Interactive Code Generation [10.4] 大規模言語モデルの命令追従能力を評価するためのベンチマークであるベンチを紹介する。
ベンチには、現実世界のソフトウェア開発要件に沿った9つの検証可能な命令が組み込まれています。
ベンチを用いた9つの顕著なLCMの評価を行い, 実験結果から, 基本プログラミング能力と命令追従能力の相違が明らかとなった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:47:02 GMT)
Laminator: Verifiable ML Property Cards using Hardware-assisted Attestations [10.3] 業界では、さまざまなプロパティのトレーニングデータセットとモデルを記述するために、モデルカードと検証可能なツールを採用しています。
我々はこれらの種類のカードを集合的に参照するためにMLプロパティカードという用語を作成した。
悪意のあるモデルプロバイダがMLプロパティカードに偽情報を含まないようにするには、検証が必要である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:05:14 GMT)
Interactive Segmentation and Report Generation for CT Images [10.2] 本稿では,3次元病変の報告のためのインタラクティブなフレームワークを提案する。
3次元CT医療画像にインタラクティブなセグメンテーションと構造化されたレポートを統合するのは,今回が初めてである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:18:27 GMT)
Solving Inverse Problem for Multi-armed Bandits via Convex Optimization [10.2] 行動モデリングのための神経科学・心理学研究で広く用いられている多腕包帯(IMAB)の逆問題について考察する。
まず、IMAB問題は一般の凸問題ではなく、変数変換によって凸問題に緩和できることを示す。
我々は,IMAB問題に対して,IMAB問題に対するグローバルな解決策を提供する条件と,計算時間を短縮するための近似について論じる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:13:02 GMT)
3DGS.zip: A survey on 3D Gaussian Splatting Compression Methods [10.1] 3次元ガウス散乱(3DGS)は実時間放射場レンダリングの最先端技術として登場している。
レンダリング速度と画像の忠実さの利点にもかかわらず、3DGSはその大きなストレージとメモリ要求によって制限されている。
本調査では3DGSをより効率的にするために開発された圧縮・圧縮技術について詳細に検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:44:52 GMT)
High-Quality Virtual Single-Viewpoint Surgical Video: Geometric Autocalibration of Multiple Cameras in Surgical Lights [10.0] カメラの視野における外科医の障害のため、閉塞のないビデオ生成は困難である。
これまでの作業では、複数のカメラを手術用照明に装着することでこの問題に対処してきた。
本稿では,このアライメントタスクを自動化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:45:32 GMT)
AI-Enabled Conversational Journaling for Advancing Parkinson's Disease Symptom Tracking [9.9] PATRIKAは、パーキンソン病(PwPD)に特化して設計されたAI対応のプロトタイプである。
このシステムは、協調会話の原則、臨床面接シミュレーション、パーソナライゼーションを取り入れ、より効果的でユーザフレンドリーなジャーナリング体験を作り出す。
調査の結果,PATRIKAはジャーナリングを双方向のインタラクションに転換した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:14:25 GMT)
Implicit U-KAN2.0: Dynamic, Efficient and Interpretable Medical Image Segmentation [9.9] Implicit U-KAN 2.0は、MultiKANと2階のNODEを組み込んだ暗黙のディープニューラルネットワークであり、解釈性と性能を改善している。
我々は、様々な2Dと1つの3Dデータセットに関する広範な実験を行い、我々のモデルは既存のセグメンテーションネットワークより一貫して優れていることを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:31:05 GMT)
Benchmarking Dynamic SLO Compliance in Distributed Computing Continuum Systems [9.8] 大規模アーキテクチャにおけるサービスレベルオブジェクト(SLO)は、その異種性やさまざまなサービス要件のために困難である。
神経科学の新しい手法であるActive Inferenceのベンチマークを、3つの確立された強化学習アルゴリズムに対して提示する。
アクティブ推論はDCCSにおけるSLOコンプライアンスを保証するための有望なアプローチであり、低メモリ使用率、安定したCPU利用、高速収束を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:56:26 GMT)
Olympus: A Jumping Quadruped for Planetary Exploration Utilizing Reinforcement Learning for In-Flight Attitude Control [9.8] 本稿では,火星の重力に合わせた跳躍脚ロボットOlympusの設計,シミュレーション,学習に基づく姿勢制御について述べる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:01:56 GMT)
FANS -- Formal Answer Selection for Natural Language Math Reasoning Using Lean4 [9.7] FANS: Lean4を用いた自然言語数学推論のための形式的アンサー選択法を提案する。
LLMの算数推論能力を高めるためにLean4を使用した最初のフレームワークである。
LLMのNL数学能力を強化し、その正解をコンピュータで検証できるソリューションを提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:34:53 GMT)
Generalized toric codes on twisted tori for quantum error correction [9.6] 北エフトーリック符号は、フォールトトレラント量子計算における誤り訂正の先駆的候補の1つとして広く考えられている。
2次元のトポロジカルCSSコードを効率的に解析するためのリング理論的手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:00:05 GMT)
OkraLong: A Flexible Retrieval-Augmented Framework for Long-Text Query Processing [9.6] LLM(Large Language Models)は、長文クエリを効率的に処理する際の課題である。
我々は,処理ワークフロー全体を柔軟に最適化する新しいフレームワークであるOkraLongを提案する。
OkraLongは回答の正確性を高めるだけでなく、さまざまなデータセットで費用対効果を達成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:13:38 GMT)
Reduced Spatial Dependency for More General Video-level Deepfake Detection [9.5] 本稿では,複数の空間的摂動クラスタから共通の時間的整合性を統合した空間依存削減法を提案する。
大規模なベンチマークとアブレーション研究は、我々のアプローチの有効性と合理性を示している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:51:55 GMT)
Beyond H&E: Unlocking Pathological Insights with Polarization via Self-supervised Learning [9.3] 病理組織学はデジタル病理学の基礎であり、ヘマトキシリンとエオシン染色が診断および予後評価のための金の標準となっている。
H&Eイメージングは細胞や組織構造を効果的に強調するが、複屈折や組織異方性への感受性に欠ける。
偏光イメージングとH&Eを統合したデュアルモード融合フレームワークであるPolarHEを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:00:19 GMT)
RD Efficient FPGA Deployment of Learned Image Compression: Knowledge Distillation and Hybrid Quantization [9.2] Learnable Image Compression (LIC)は、RD効率で標準化されたビデオコーデックを上回る性能を示す。
既存のハードウェア実装の多くは、RD効率に遅延を優先順位付けし、ハードウェア設計空間を広範囲に調査している。
本稿では,RD効率を損なうことなく,特定のハードウェアプラットフォームの設計の調整の負担をモデル次元にシフトする,新しい設計パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:59:32 GMT)
It's My Data Too: Private ML for Datasets with Multi-User Training Examples [9.2] まず、マルチ属性モデルに基づいて、ユーザレベルのDPを慎重に定義する。
コントリビューションバウンディング問題に対するグリーディベースラインアルゴリズムを提案する。
異なる手法と基準を用いて選択したサブセットを最適化するベースラインアルゴリズムの変種について検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:02:09 GMT)
XLSTM-HVED: Cross-Modal Brain Tumor Segmentation and MRI Reconstruction Method Using Vision XLSTM and Heteromodal Variational Encoder-Decoder [9.1] 我々は,XLSTM-HVEDモデルを導入し,ヘテロモーダルエンコーダ・デコーダ・フレームワークをVision XLSTMモジュールと統合し,欠落したMRIモダリティを再構築する。
このアプローチの主な革新は、モーダル機能の統合を改善する自己意識変動(SAVE)モジュールである。
BraTS 2024データセットを用いた実験では、モダリティが欠落している場合の処理において、既存の先進的手法を著しく上回ります。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:09:25 GMT)
Monitoring Decoding: Mitigating Hallucination via Evaluating the Factuality of Partial Response during Generation [9.1] 大規模な言語モデルは幻覚に影響を受けやすいため、真に正しくない内容を生成する。
このようなリスクを軽減する既存の方法は、しばしば複数の全世代をサンプリングすることに依存する。
生成プロセスを動的に監視する新しいフレームワークであるモニタリングデコーディングを導入する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:51:03 GMT)
Generative Adversarial Networks for High-Dimensional Item Factor Analysis: A Deep Adversarial Learning Algorithm [9.1] 本稿では,アイテムファクタ解析のためのVAEの改良として,AVBアルゴリズムを提案する。
AVBは補助判別器ネットワークを組み込んで、推定プロセスを2人対戦ゲームとして再構成する。
さらに強化されたアルゴリズムとして、IwaVB(Importance-weighted Adversarial Variational Bayes)を提案し、IwaE(Importance-weighted Autoencoders)と比較した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:11:42 GMT)
Simultaneous nonreciprocal and ultra-strong coupling in cavity magnonics [9.0] フォトニック結晶中の銅シリンダーをイットリウム鉄ガーネットシリンダーに置き換えることで、1.18GHzの超強結合強度と10.9%の結合効率が得られる。
非相互マイクロ波透過は、ジャイロ磁気効果とファラデー効果による時間反転対称性の破れによってフォトニックバンドギャップ内に現れる。
この研究は、ハイブリッドキャビティ・マグノニクスシステムにおける高度な非相互デバイスの基礎を確立し、量子情報処理とマイクロ波分離に有望な応用を期待する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:52:01 GMT)
WarmFed: Federated Learning with Warm-Start for Globalization and Personalization Via Personalized Diffusion Models [9.0] フェデレートラーニング(FL)は、プライバシリークのない統一グローバルモデルを実現するために、複数のクライアントの間で顕著な分散学習パラダイムである。
FLとは対照的に、パーソナライズド・フェデレーション・ラーニングはパーソナライズド・モデルを達成するために各クライアントにサービスを提供することを目的としている。
サーバで単一のグローバルモデルを開発するか、パーソナライズに対応するために、クライアントでパーソナライズされたモデルを育むかの選択肢です。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:10:04 GMT)
PROVGEN: A Privacy-Preserving Approach for Outcome Validation in Genomic Research [9.0] 本稿では,ゲノムデータセット共有のためのプライバシ保護手法であるPROVGENを紹介する。
我々のアプローチはゲノムデータをバイナリ空間にエンコードし、2段階のプロセスを適用する。
提案手法は, GWAS結果の誤り検出において, 既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:02:30 GMT)
Optimizing for the Shortest Path in Denoising Diffusion Model [8.9] 最短経路拡散モデル(ShortDF)は、復調誤差の最小化を目的とした最短経路問題である。
複数の標準ベンチマークの実験により、ShortDFは拡散時間(またはステップ)を大幅に短縮することが示された。
この研究は、インタラクティブな拡散ベースのアプリケーションへの道を開き、高速なデータ生成の基礎を確立します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:47:36 GMT)
JamMa: Ultra-lightweight Local Feature Matching with Joint Mamba [8.9] 我々は,1つのGPU上に収束し,推論における性能・効率バランスを著しく向上する,超軽量なMambaベースのマッチング器JamMaを提案する。
特徴マッチングのためのMambaの可能性を解き明かすため,JEGOというスキャンマージ戦略を用いたJoint Mambaを提案し,(1)高周波数相互干渉を実現するために2つの画像のジョイントスキャン,(2)シーケンス長を削減するためのスキップステップによる効率的なスキャン,(3)グローバル受容場,(4)Omnidirectional特徴表現を実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:12:51 GMT)
Online Convex Optimisation: The Optimal Switching Regret for all Segmentations Simultaneously [8.9] スイッチング後悔は、トライアルシーケンスの任意のセグメンテーションに対して定義され、各セグメンテーションの静的後悔の和に等しい。
我々のアルゴリズムは非常に効率的で、時間軸の対数的な空間と時間単位の複雑さを持つ。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:49:25 GMT)
Critical dynamics and its interferometry in the one-dimensional p-wave-paired Aubry-André-Harper model [8.7] 一次元の準周期的なp波対を持つオーブリー・アンドルー・ハーパー模型の臨界ダイナミクスに焦点をあてる。
2つの台地は, 片方向およびラウンドトリップのクエンチプロトコルを用いて, 適度なクエンチ速度を持つ臨界ダイナミクスに本質的に影響を及ぼす。
2つのKZサブレジムの旋回点を定量的に決定するために、首の位置がどのように使用できるかを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:07:56 GMT)
LAPTOP-Diff: Layer Pruning and Normalized Distillation for Compressing Diffusion Models [8.7] 圧縮拡散モデル(LAPTOP-Diff)のための層プレーニングと正規化蒸留を提案する。
提案したLAPTOP-Diffを用いてSDXLとSDM-v1.5のU-Netを圧縮し,PickScoreの50%のプルーニング比で4.0%の低下を達成した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:28:29 GMT)
Benchmarking LLMs and LLM-based Agents in Practical Vulnerability Detection for Code Repositories [8.6] JitVulは、各関数をその脆弱性導入とコミットの修正にリンクする脆弱性検出ベンチマークである。
思考・行動・観察と相互言語的文脈を活用するReAct Agentsは,良性のあるコードと区別する上で,LLMよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:22:24 GMT)
$μ^2$-SGD: Stable Stochastic Optimization via a Double Momentum Mechanism [8.4] 目的が滑らかな関数に対する期待である凸最適化問題を考察する。
運動量の概念に関連する2つの最近のメカニズムを組み合わせた新しい勾配推定法を提案する。
これらの手法はノイズのない場合とノイズの多い場合の両方に対して最適な収束率が得られることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:51:11 GMT)
Trajectory Prediction for Autonomous Driving: Progress, Limitations, and Future Directions [8.4] 本稿では,近年の軌跡予測手法のかなりの部分を概観し,既存の解を分類するための分類法を考案する。
さらに,軌道予測における活発な研究領域について論じ,提案する研究課題に対処し,残りの研究ギャップと課題を強調した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:38:51 GMT)
GuardDoor: Safeguarding Against Malicious Diffusion Editing via Protective Backdoors [8.3] GuardDoorは、イメージオーナとモデルプロバイダ間のコラボレーションを促進する、新しくて堅牢な保護メカニズムである。
本手法は,画像前処理操作に対するロバスト性を向上し,大規模展開にスケーラブルであることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:21:44 GMT)
Interactive Data Harmonization with LLM Agents [8.2] 本稿では,LLMに基づく推論,対話型ユーザインタフェース,データ調和プリミティブのライブラリを組み合わせたシステムであるHarmoniaを紹介する。
これは、データセットを標準フォーマットにマッピングする再利用可能なパイプラインをインタラクティブに作成するのに役立つ。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:33:41 GMT)
SMAC-R1: The Emergence of Intelligence in Decision-Making Tasks [8.1] 本稿では,DeepSeek-Coder-v2.5-236Bから抽出したQwen2.5-7B-Base LLMに基づくSMAC-R1を紹介する。
オフライン学習プロセスにおける行動クローン後のオンライン強化学習と同様に、私たちのパイプラインでは、エージェントがDeepSeek LLMを利用して決定ツリーコードを生成する。
従来の23のSMACタスクと10の新たに設計されたタスクで実験を行い、提案手法が高品質で解釈可能な決定木を作成できることを実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:49:51 GMT)
Feature Point Extraction for Extra-Affine Image [8.0] 大規模アフィン変換では, 特徴抽出の安定性は急速に低下する。
本稿では,AISFTに対する改善を示す手法を提案する。
現在は、外付け画像の最も高速な特徴抽出方法として位置づけられている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:16:26 GMT)
Reusing Historical Trajectories in Natural Policy Gradient via Importance Sampling: Convergence and Convergence Rate [8.0] 本研究では,重要度勾配サンプリングを用いて,歴史軌道を再利用した自然政策の変種について検討する。
勾配サンプリングの予測器のバイアスは勾配無視可能であり, 結果のアルゴリズムは収束し, 過去の軌道の再利用は収束率の向上に役立つことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:14:25 GMT)
What to align in multimodal contrastive learning? [7.7] 単一マルチモーダル空間におけるモダリティ間の通信を可能にするコントラスト型マルチモーダル学習戦略を導入する。
我々の理論的分析は、情報の共有、相乗的、ユニークな用語がこの定式化から自然に現れることを示している。
後者では、CoMMは複雑なマルチモーダル相互作用を学び、7つのマルチモーダルベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:48:23 GMT)
Bounding Evidence and Estimating Log-Likelihood in VAE [7.6] 本稿では,データのエビデンスを効率的に近似できる,汎用的で効果的な上限を導入する。
我々は,他の最先端の上界との比較を含む,我々のアプローチに関する広範な理論的,実験的研究を行っている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:04:58 GMT)
LS-HAR: Language Supervised Human Action Recognition with Salient Fusion, Construction Sites as a Use-Case [7.6] 本稿では,LS-HAR という言語指導法を用いて,ヒューマンアクション認識(HAR)に新たなアプローチを導入する。
特徴表現を最適化するために,スケルトンモダリティを条件とした言語モデルに対して学習可能なプロンプトを用いる。
建設現場での実際のロボット応用に適した新しいデータセットを導入し、VolvoConstActというビジュアル、スケルトン、深度のデータモダリティを特徴とする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:41:20 GMT)
RVAFM: Re-parameterizing Vertical Attention Fusion Module for Handwritten Paragraph Text Recognition [7.6] 我々はRe- parameterizing Vertical Attention Fusion Module (RVAFM)という新しいモジュールを提案する。
RVAFMは、トレーニングと推論の段階でモジュールの構造を分離する。
文字誤り率(CER)は4.44%、単語誤り率(WER)は14.37%である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:41:59 GMT)
SpiritSight Agent: Advanced GUI Agent with One Look [7.5] 理想的なグラフィカルユーザインタフェース(GUI)エージェントは、高い精度、低レイテンシ、互換性を実現することが期待されている。
最近のビジョンベースアプローチは、高度なビジョン言語モデルを活用することで、有望であることを示している。
本稿では,GUIナビゲーションタスクに優れた視覚ベースのエンドツーエンドGUIエージェントであるtextbfSpiritSight$を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:30:22 GMT)
Token-Level Privacy in Large Language Models [7.4] 本稿では,文脈情報と意味情報を統合するトークンレベルの新しいプライバシ保護機構であるdchi-stencilを紹介する。
意味的ニュアンスと文脈的ニュアンスの両方を取り入れることで、dchi-stencilはプライバシとユーティリティの堅牢なバランスを実現する。
この研究は、現代の高リスクアプリケーションにおけるプライバシ保護NLPの新しい標準を設定するためのdchi-stencilの可能性を強調している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:27:25 GMT)
Trim My View: An LLM-Based Code Query System for Module Retrieval in Robotic Firmware [7.3] 本稿では, 2次分解法, 除算法, LLM による関数要約の組み合わせが, 経済的なエンジン構築にどのように役立つかを示す。
我々は,この手法を3つの基盤となるオープンソースLLMを用いてインスタンス化し,ロボットファームウェアのモジュール識別の有効性を測定した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:40:17 GMT)
Survey Respondent Surrogates? Probing Objective and Subjective Silicon Population [7.3] 大規模言語モデル(LLM)は、社会調査における人間の反応をシミュレートし、信頼できる予測を生成する可能性を秘めている。
GPTにより生成したシリコン試料の集団パラメータを同定するサンプリング分布を生成するために,繰り返しサンプリングを用いる。
以上の結果から、GPTの人口分布は、性別と平均年齢の点で、2020年の米国人口と一致していることがわかった。
GPTの立位スコアの点推定は極めて矛盾しており、特定のイデオロギーに対する明確な傾きを示していない。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:44:53 GMT)
Disentangling the Complex Multiplexed DIA Spectra in De Novo Peptide Sequencing [7.2] Data-Independent Acquisition (DIA) は、高強度ピークをサンプリングするだけでなく、すべてのペプチドをカバーする感度を向上させるために導入された。
デノボペプチドシークエンシングにおけるDIAデータの有用性は明らかになっていない。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:46:26 GMT)
MobileViM: A Light-weight and Dimension-independent Vision Mamba for 3D Medical Image Analysis [7.1] この原稿は3次元医用画像の効率的なセグメンテーションのための合理化アーキテクチャであるMobileViMを提示する。
我々は,視覚マンバを基盤とした新しい次元非依存機構と二方向トラバースアプローチを考案した。
これらの拡張により、MobileViMは1つのグラフィックス処理ユニットで毎秒90フレームを超えるセグメンテーション速度を達成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:21:38 GMT)
Document Classification using File Names [7.1] 迅速な文書分類は、デジタル法医学や大規模メディア分類といった、時間に敏感ないくつかの応用において重要である。
重厚なディープラーニングモデルに依存する従来のアプローチは、膨大な入力データセットとドキュメント全体の分析に関連する計算リソースに対する高い推論時間のために、不足している。
本稿では,TF-IDF特徴抽出に基づくトークン化手法と組み合わせた軽量教師付き学習モデルを用いて,ファイル名のみに基づいて文書を高精度かつ効率的に分類する手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:11:50 GMT)
Scalable Co-Clustering for Large-Scale Data through Dynamic Partitioning and Hierarchical Merging [7.1] クラスタの行と列を同時にクラスタリングすることで、よりきめ細かいグループを明らかにします。
既存のクラスタリング手法はスケーラビリティが悪く、大規模なデータを扱うことができない。
本稿では,高次元大規模データセットにおける複雑なパターンを明らかにするために,新しい,スケーラブルなコクラスタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:30:02 GMT)
One-Shot Imitation under Mismatched Execution [7.1] プロンプトとしての人間のデモは、ロボットに長距離操作のタスクをプログラムするための強力な方法だ。
これらのデモをロボット実行可能なアクションに変換することは、運動スタイルや身体能力のミスマッチの実行による重大な課題を呈する。
本稿では,人間とロボットのタスク実行を最適な輸送コストで自動調整する新しいフレームワークRHyMEを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:07:20 GMT)
zsLLMCode: An Effective Approach for Code Embedding via LLM with Zero-Shot Learning [7.0] 本稿では,大言語モデル(LLM)と文埋め込みモデルを用いて,新たなゼロショット手法であるzsLLMCodeを提案する。
その結果,最先端の教師なしアプローチに対する提案手法の有効性と優位性を実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:42:35 GMT)
DeePen: Penetration Testing for Audio Deepfake Detection [7.0] ディープフェイクは個人、組織、社会全体に重大なセキュリティリスクをもたらす。
私たちは、DeePenと呼ばれる体系的なテスト手法を導入します。
我々の手法は、対象のディープフェイク検出モデルへの事前の知識やアクセスなしに動作します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:58:33 GMT)
Conformal Transformations for Symmetric Power Transformers [6.9] 線形注意を持つ変圧器はソフトマックスベースの変圧器よりも計算上の優位性があるが、しばしば劣化性能に悩まされる。
本稿では,データ依存型乗算ゲーティングを用いてキャパシティを解放し,データ依存型回転埋め込みを用いて情報を適応的に記憶する共形シンポウ変換器を提案する。
LongCrawl64データセットの予備実験では、共形シンポウはシンポウトランスフォーマーの限界を克服し、スケールしたトレーニングと評価コンテキストにわたって堅牢なパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:50:53 GMT)
Deepfake-Eval-2024: A Multi-Modal In-the-Wild Benchmark of Deepfakes Circulated in 2024 [6.9] Deepfake-Eval-2024は、2024年にソーシャルメディアとディープフェイク検出プラットフォームユーザーから収集された、幅内ディープフェイクからなる新しいディープフェイク検出ベンチマークである。
ベンチマークには、52の異なる言語で88の異なるウェブサイトからさまざまなメディアコンテンツが含まれている。
その結果,Deepfake-Eval-2024で評価すると,オープンソースのDeepfake検出モデルの性能は急激に低下することがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:24:16 GMT)
Framing the Game: How Context Shapes LLM Decision-Making [6.8] 大規模言語モデル(LLM)は、意思決定をサポートするために、さまざまなコンテキストにまたがってデプロイされるようになっている。
既存の評価は遅延モデル能力を効果的に調査するが、コンテキストフレーミングが合理的な意思決定に与える影響をしばしば見落としている。
本稿では,重要な特徴にまたがって評価インスタンスを体系的に変化させる新しい評価フレームワークを導入し,非常に多様なシナリオを生成するためのウィグレットを手続き的に生成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:03:28 GMT)
Many-Body Localization and Particle Statistics in Disordered Bose-Hubbard Model [6.8] 不安定なボース・ハッバードモデルにおける多体局在の安定性に対する粒子統計の影響について検討した。
我々は、低エネルギー領域における不安定なBose-Hubbardモデルと複雑な乱れたスピンチェーンモデルとを接続する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:01:57 GMT)
DA-STGCN: 4D Trajectory Prediction Based on Spatiotemporal Feature Extraction [6.8] 本稿では,2つの注意機構を統合した革新的なグラフ畳み込みネットワークであるDA-STGCNを提案する。
本モデルでは,自己アテンションアプローチにより隣接行列を再構成し,ノード相関の捕捉性を高める。
その結果, 平均変位誤差 (Attention) と最終変位誤差 (FDE) の20%と30%の低減を実現し, 現行の4次元軌道予測法よりも顕著な改善が見られた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:42:49 GMT)
Unsupervised Topic Models are Data Mixers for Pre-training Language Models [6.8] 大規模言語モデル(LLM)のためのトピックベースのデータ混合戦略を提案する。
DataWeaveは、セマンティックに類似したドキュメントをグループ化するために、マルチステージクラスタリングプロセスを採用している。
我々は、サイエンスとリレーションシップのトピックが特に効果的であることを確認し、最も実質的なパフォーマンス改善をもたらす。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:23:22 GMT)
Deep Learning-Based Diffusion MRI Tractography: Integrating Spatial and Anatomical Information [6.7] 拡散MRI法は、脳内の白質経路を非侵襲的に可視化することを可能にする。
神経科学や臨床分野で重要な役割を担い、脳の接続性や神経疾患の研究を促進する。
深層学習法は、ホワイトマターのカバレッジを改善するためにトラクトグラムを改善するために応用されてきたが、しばしば過剰な偽陽性接続を発生させることに費やされる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:02:35 GMT)
Distributed Differentially Private Data Analytics via Secure Sketching [6.6] 本稿では,微分プライベートデータ解析の分散モデルである線形変換モデルを紹介する。
線形変換は差分プライバシーに非常に有用であることを示し、入力データの線形スケッチの計算を可能にする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:59:23 GMT)
Statistical Limits in Random Tensors with Multiple Correlated Spikes [6.6] 確率行列理論のツールを用いてマルチスパイクテンソルモデルを研究する。
本研究では, 位相遷移現象を解析し, 対応する最適化問題の臨界点を求める。
本稿では,方程式系を解くことで,階数=r$重みの新たな推定法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:37:54 GMT)
4D Radar Ground Truth Augmentation with LiDAR-to-4D Radar Data Synthesis [6.6] GT-Augは、LiDARに基づく物体検出の一般的な方法である。
4DR GT-Aug を用いた 4D レーダグラウンド・トゥルース・オーグメンテーションを提案する。
提案手法はまずLiDARデータを拡張し,LiDAR-to-4D Radarデータ合成(L2RDaS)モジュールを介して4D Radarデータに変換する。
そうすることで、4D Radarのデータ分布を生み出します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:16:46 GMT)
SSR: A Swapping-Sweeping-and-Rewriting Optimizer for Quantum Circuit Transformation [6.6] 本稿ではQCT回路の深さを最小化するスワッピング・スウィーピング・アンド・リライトアルゴリズムを提案する。
実験の結果,QCT回路の深さを26.68%,平均12.18%,ベンチマーク回路全体の深さを著しく低減できることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:52:14 GMT)
Towards Understanding Distilled Reasoning Models: A Representational Approach [6.6] 我々は、Qwen系列モデルとその微調整された変種についてクロスコーダを訓練する。
この結果から,クロスコーダは自己回帰や検証など,多種多様な推論に対応する特徴を学習できることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:40:19 GMT)
Active operator learning with predictive uncertainty quantification for partial differential equations [6.5] 本研究では,訓練中に観測されたモデル誤差に校正された予測的不確実性推定を用いたディープオペレータネットワーク(DeepONets)の不確実性定量化手法を開発した。
不確実性フレームワークは、既存のアンサンブルアプローチとは対照的に、単一のネットワークを使用して動作し、トレーニングと推論中に最小限のオーバーヘッドを導入する。
一連の偏微分方程式(PDE)問題に対する不確実性を考慮したモデルの評価を行い、モデル予測が偏りがなく、非歪で、PDEに対する解を正確に再現していることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:48:14 GMT)
DTU-Net: A Multi-Scale Dilated Transformer Network for Nonlinear Hyperspectral Unmixing [6.4] 非線形ハイパースペクトルアンミキシングのためのDilated Transformerベースのアンミキシングネットワークを提案する。
デコーダは線形と非線形の混合シナリオの両方に対応するように設計されている。
その解釈性は、終端員、存在量、非線形係数の間の関係を明示的にモデル化することによって強化される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:56:33 GMT)
Tiny Robotics Dataset and Benchmark for Continual Object Detection [6.4] 小型ロボットプラットフォームにおける物体検出システムの連続学習能力を評価するための新しいベンチマークを提案する。
この結果は,小型ロボットにおける物体検出のための堅牢で効率的な連続学習戦略を開発する上での課題を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:49:21 GMT)
Multiaccuracy and Multicalibration via Proxy Groups [6.3] 本稿では,プロキシ・センシティブな属性を用いて,真のマルチ精度とマルチキャリブレーションの作用可能な上限を導出する方法を示す。
また、マルチ精度とマルチキャリブレーションを満たすためのモデル調整は、真の、しかし未知の、センシティブなグループに対するこれらの違反を著しく軽減することを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:41:11 GMT)
GlucoLens: Explainable Postprandial Blood Glucose Prediction from Diet and Physical Activity [6.3] 食後の血糖値が正常値を超えることを特徴とする先天性高血糖は,2型糖尿病の進行を示す重要な指標である。
GlucoLensは、食事、活動、および最近のグルコースパターンからPAUCおよび高血糖を予測するための、説明可能な機械学習アプローチである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:10:14 GMT)
TEDDY: A Family Of Foundation Models For Understanding Single Cell Biology [6.3] 既存の基礎モデルでは、ダウンストリームアプリケーションにおいてタスク固有のモデルよりもわずかに改善されるか、改善されない。
トレーニング前のデータセットを1億1600万セルにスケールアップしました。
我々は,トランスフォーマーをベースとした6つの単一セルファウンデーションモデル,7000万,1億6000万,4億のパラメータからなるTEDDYモデルのファミリーを訓練した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:24:57 GMT)
On the Acquisition of Shared Grammatical Representations in Bilingual Language Models [6.3] 第二言語でトレーニングを始めると、モノリンガル言語モデルに何が起こるのかを尋ねる。
共有多言語表現の証拠を見つけるために,人間の文法表現を研究するために用いられる構造プライミングに目を向ける。
我々は、この非対称性が人間の構造的プライミング効果に関する仮説を形成するかもしれないと論じる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:27:58 GMT)
Prediction of Halo Coronal Mass Ejections Using SDO/HMI Vector Magnetic Data Products and a Transformer Model [6.2] 本稿では,ハロコロナ質量放出(CME)の発生を予測するために,DeepHaloという変圧器モデルを提案する。
本モデルでは,データサンプルの時系列を含むアクティブ領域(AR)とプロファイルを入力として扱う。
我々は,2010年11月から2023年8月までの期間に,ハロCMEやARに関連するノンハロCMEを含むCMEのリストをまとめる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:31:06 GMT)
AI Governance through Markets [6.1] 我々は、市場ベースのメカニズムがAI開発に効果的なインセンティブをもたらすと論じている。
市場ガバナンスの新たなベクターとして,保険,監査,調達,デューディリジェンスという4つについて検討する。
本稿では、規制当局、経済学者、機械学習研究者に対して、AIガバナンスに対する市場ベースのアプローチの調査と実装を奨励する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:20:03 GMT)
Floorplan-SLAM: A Real-Time, High-Accuracy, and Long-Term Multi-Session Point-Plane SLAM for Efficient Floorplan Reconstruction [6.1] フロアプランの再構築は、信頼性の高い屋内ロボットナビゲーションと高レベルのシーン理解に不可欠な構造的前提を提供する。
平面抽出,ポーズ推定,バックエンド最適化をシームレスに行うことで,フロアプラン再構築をマルチセッションSLAMシステムに密に統合するFloorplan-SLAMを提案する。
Floorplan-SLAM は平面抽出, 推定精度, フロアプランの再現精度, 性能において, 最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:09:16 GMT)
Identifying Ising and percolation phase transitions based on KAN method [6.1] 本稿では,Kolmogorov-Arnold Network を用いて生構成を学習モデルに入力する手法を提案する。
その結果,KAはパーコレーションモデルの臨界点を実際に予測できることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:49:22 GMT)
Simplicial SMOTE: Oversampling Solution to the Imbalanced Learning Problem [6.0] 本稿では,幾何学的近傍の単体錯体の単純さから抽出する新しい手法であるSimplicial SMOTEを提案する。
我々はSMOTEが幾つもの一般的な幾何的サンプリング法より優れていることを実験的に実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:47:41 GMT)
Convergence Analysis of Federated Learning Methods Using Backward Error Analysis [6.0] 本稿では,各種フェデレート学習アルゴリズムの暗黙正則化手法を提案する。
暗黙の正則化器がその収束を妨げていることを示す。
同様に、暗黙の正規化器であるFedSAM SCAFFOLDを計算し、それらがよりよく収束する理由を説明する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:26:48 GMT)
Unleashing HyDRa: Hybrid Fusion, Depth Consistency and Radar for Unified 3D Perception [5.9] 多様な3次元知覚タスクのための新しいカメラレーダ融合アーキテクチャであるHyDRaを紹介する。
我々のハイト・アソシエーション・トランスフォーマー・モジュールは、すでに視界のレーダー機能を利用して、より堅牢で正確な深度予測を行う。
HyDRaは64.2 NDS (+1.8) と58.4 AMOTA (+1.5) のカメラレーダー融合のための新しい最先端技術を実現している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:35:06 GMT)
Exploration Implies Data Augmentation: Reachability and Generalisation in Contextual MDPs [5.9] より多くの状態におけるトレーニングは、実際に一般化を改善することができるが、学習された値関数の精度を下げるコストがかかる可能性があることを示す。
本稿では,各エピソードの冒頭に探索フェーズを実装したExplore-Goを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:47:17 GMT)
SoftMatcha: A Soft and Fast Pattern Matcher for Billion-Scale Corpus Searches [5.8] 本稿では,単語埋め込みと曲面レベルのマッチングを緩和することにより,意味的かつ効率的なパターンマッチングを実現する新しいアルゴリズムを提案する。
提案手法は,数十億のコーパスを1秒以内で探索できることを実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:53:11 GMT)
A Systematic Survey on Debugging Techniques for Machine Learning Systems [5.7] 機械学習(ML)ソフトウェアは、従来のソフトウェアと比較してユニークな課題を提起する。
MLシステムのテスト、診断、修復のための様々な方法が提案されている。
しかし、開発者のニーズを満たす重要な研究方向を示す全体像はまだ公開されていない。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:57:20 GMT)
When Radiation Meets Linux: Analyzing Soft Errors in Linux on COTS SoCs under Proton Irradiation [5.7] Linux on commercial off-the-shelf (COTS) system-on-chip (SoC) in spaceborne computingは、ソフトエラーのような放射線誘発障害に対する感受性を継承する。
現代のCOTSは、アグレッシブトランジスタスケーリングが臨界電荷閾値を減少させ、ソフトエラーを引き起こすことにより、この問題を悪化させる。
Linuxのモノリシックアーキテクチャはこれらのリスクを増幅する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:21:34 GMT)
SoK: Knowledge is All You Need: Last Mile Delivery for Automated Provenance-based Intrusion Detection with LLMs [5.7] 本稿では,PIDSを活用知識の種類に応じて分類することで,破壊的なイノベーションを示す。
私たちはまた、このフレームワーク上に構築されたベストプラクティスシステムであるOmniSecを紹介します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:08:12 GMT)
Pretrained LLMs as Real-Time Controllers for Robot Operated Serial Production Line [5.6] 本研究では,大規模言語モデル(LLM),特に GPT-4 を,製造システム,特に移動ロボットスケジューリングを制御するための,単純で適応可能なソリューションとして用いることの実現可能性について検討する。
ロボットによる連続生産ラインにおいて,移動ロボットを異なるマシンに割り当てるLLMベースの制御フレームワークを導入し,システムスループットの観点からその性能を評価する。
MARL(Multi-Agent Reinforcement Learning)のような最先端の手法と同等のパフォーマンスを実現するが、大規模なリトレーニングを必要とせずに、同等のスループットを提供するという、明確な利点を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:43:49 GMT)
Atom Cavity Encoding for NP-Complete Problems [5.5] 我々は、カープの21個のNP完全問題の大部分を含む、多数のNP完全問題に対する符号化スキームを提案する。
このような計算問題を, 原子数の線形コストで, 原子キャビティ・システムによって符号化できることが判明した。
本研究は,NP完全問題の解法において,原子空洞系の実用的な量子的優位性を求めるための重要なガイダンスを提供することを期待している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:37:45 GMT)
REVERSIM: An Open-Source Environment for the Controlled Study of Human Aspects in Hardware Reverse Engineering [5.5] ハードウェアリバースエンジニアリング(英: Hardware Reverse Engineering, HRE)は、集積回路を解析するための技術である。
ReverSimは、主要なHREサブプロセスをモデル化し、標準化された認知テストを統合するソフトウェア環境である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:26:46 GMT)
Transformer-Based Spatio-Temporal Association of Apple Fruitlets [5.5] 異なる日と異なるカメラのポーズから収集したステレオ画像にリンゴ果実を関連付けるトランスフォーマーベースの手法を提案する。
市販リンゴ果樹園で収集したデータからF1スコア92.4%を達成できることを実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:36:26 GMT)
When Claims Evolve: Evaluating and Enhancing the Robustness of Embedding Models Against Misinformation Edits [5.4] 本稿では,6つの一般的な実世界の誤情報編集の分類を導入し,有効で自然なクレーム変動を生成する摂動フレームワークを提案する。
標準の埋め込みモデルはユーザによる編集に苦労するが、LCMの埋め込みは高い計算コストで堅牢性を向上する。
本研究は,クレームマッチングシステムに実用的な改良を加え,より信頼性の高い偽情報の事実チェックを可能にした。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:47:32 GMT)
PCM Selector: Penalized Covariate-Mediator Selection Operator for Evaluating Linear Causal Effects [5.3] 因果効果を推定する新しい2段階のペナル化回帰手法を提案する。
PCMセレクタは因果効果の一貫性またはバイアスの少ない推定器を提供する。
さらに、PCMセレクタは、バックドア基準よりも因果効果の正確な推定精度を得るために、中間変数に対する変数選択手順を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:05:29 GMT)
Taxation Perspectives from Large Language Models: A Case Study on Additional Tax Penalties [5.2] 付加的な税罰の正当性を予測するためのLCMの能力を評価するために設計された新しいベンチマークPLATを紹介する。
6つの LLM を用いて行った実験では,その基礎となる能力は限定的であり,特に包括的理解を必要とする矛盾する問題に対処する場合に限られていることが判明した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:24:20 GMT)
Characterizing dynamical behaviors in topological open systems with boundary dissipations [5.1] リンドブラッドマスター方程式により記述された境界散逸を伴うSu-Schrieffer-Heegerモデルの力学について検討する。
長期間の減衰力学を調べた結果,弱発散領域と強発散領域の動的双対性現象が明らかになった。
位相的に非自明な領域において、熱力学限界における境界局在化ダーク状態の存在を同定する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:51:34 GMT)
DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance [5.1] 本稿では,複数のビューやビデオシーケンスをまたいだ運転シーン生成を支援する条件拡散モデルであるDualDiffを提案する。
微粒な前景オブジェクトの合成を改善するために,FGM (Foreground-Aware Mask) denoising loss関数を提案する。
また,関連する情報を動的に優先順位付けし,ノイズを抑えるために,意味融合注意(Semantic Fusion Attention,SFA)機構を開発した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:31:45 GMT)
Honest to a Fault: Root-Causing Fault Attacks with Pre-Silicon RISC Pipeline Characterization [4.8] 本研究の目的は、回路レベルからAI/MLアプリケーションソフトウェアへの障害伝播をトレースしながら、RISC-V命令セットとパイプラインステージ内の障害の影響を特徴づけ、診断することである。
この分析により、制御されたクロックグリッチパラメータによって新たな脆弱性を発見し、特にRISC-Vデコードステージをターゲットにした。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:08:12 GMT)
CRAFT: Characterizing and Root-Causing Fault Injection Threats at Pre-Silicon [4.8] 本研究は, プレシリコンレベルにおいて, 制御されたインジェクション攻撃を行うための包括的方法論を提案する。
駆動アプリケーションとして、クリティカルな誤分類のために、AI/MLアプリケーションにクロックグリッチアタックを使用します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:17:46 GMT)
WIP: Assessing the Effectiveness of ChatGPT in Preparatory Testing Activities [4.7] ChatGPTをソフトウェアテストカリキュラムに統合し、その有効性を評価する。
この研究は、AIが徐々にソフトウェアテスト教育に導入され、技術進歩のペースを維持することを示唆している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:51:24 GMT)
Vision-based Geo-Localization of Future Mars Rotorcraft in Challenging Illumination Conditions [4.7] Geo-LoFTRは画像登録のための幾何学支援ディープラーニングモデルである。
提案方式は, 照明やスケールの変動による局所化精度において, 従来のMbLよりも優れていた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:09:24 GMT)
SpinML: Customized Synthetic Data Generation for Private Training of Specialized ML Models [4.7] 本研究では,サーバがカスタマイズした合成画像データを生成するSpinMLを提案する。
SpinMLは、ユーザが参照イメージの細粒度でオブジェクトレベルのコントロールを提供し、生成された合成データのプライバシとユーティリティを交換することができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:05:09 GMT)
TAG: A Decentralized Framework for Multi-Agent Hierarchical Reinforcement Learning [4.6] 完全に分散化された階層型マルチエージェントシステムを構築するためのフレームワークであるTAME Agent Framework (TAG)を紹介する。
TAGは疎結合を維持しながらレベル間の情報フローを標準化し、多様なエージェントタイプをシームレスに統合する。
この結果から,分散階層型組織は学習速度と最終性能を両立させ,TAGをスケーラブルなマルチエージェントシステムにとって有望な方向と位置づけた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:48:42 GMT)
LDPM: Towards undersampled MRI reconstruction with MR-VAE and Latent Diffusion Prior [4.5] 拡散モデルを用いてMRI再構成を解こうとする研究もあるが、これらの手法はピクセル空間で直接動作する。
リッチな視覚的背景を持つ自然画像に事前学習した潜時拡散モデルでは,MRI再構成における高い計算コストの問題を解くことが期待されている。
LDPM法(Latent Diffusion Prior-based Undersampled MRI reconstruction)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:16:27 GMT)
PGAD: Prototype-Guided Adaptive Distillation for Multi-Modal Learning in AD Diagnosis [4.5] 欠失はアルツハイマー病(AD)の診断において大きな問題となる。
既存のほとんどのメソッドは完全なデータのみをトレーニングし、ADNIのような現実世界のデータセットに不完全なサンプルが多数含まれていることを無視している。
本稿では,不完全なマルチモーダルデータをトレーニングに直接組み込んだPGAD(Prototype-Guided Adaptive Distillation)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:39:31 GMT)
Flow-based Bayesian filtering for high-dimensional nonlinear stochastic dynamical systems [4.4] 正規化フローを統合したフローベースベイズフィルタ(FBF)を提案する。
このフレームワークは、フローの正規化によって提供される可逆変換を用いて、効率的な密度推定とサンプリングを容易にする。
数値実験によりFBFの精度と効率が向上した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:42:40 GMT)
Improving 6D Object Pose Estimation of metallic Household and Industry Objects [4.3] 6Dオブジェクトのポーズ推定は,金属オブジェクトに適用した場合の精度の低下に悩まされる。
我々は,産業アプリケーションにおけるリフレクションや特異なハイライトといった課題に対処することで,最先端技術の改善を図った。
我々の新しいBOP互換データセットは、様々な照明および背景条件下で様々な金属オブジェクトを特徴付け、幾何学的および視覚的手がかりを提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:35:15 GMT)
CPT-Boosted Wav2vec2.0: Towards Noise Robust Speech Recognition for Classroom Environments [4.3] We study the effective of continued pretraining (CPT) in adapting Wav2vec2.0 to the classroom domain。
この点においてCPTは強力なツールであり、Wav2vec2.0ベースのモデルのワードエラー率(WER)を10%以上削減することを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:32:04 GMT)
Dicke superradiant enhancement of the heat current in circuit QED [4.1] Dicke superradiant emissionのような集団効果は、量子デバイスの性能を高めることができる。
本研究では, 冷湯と熱湯の間に流れる熱流を, N$ qubitsのアンサンブルを通して調査した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:47:49 GMT)
Rethinking Few-Shot Medical Image Segmentation by SAM2: A Training-Free Framework with Augmentative Prompting and Dynamic Matching [4.1] 我々は,従来のスライス・バイ・スライス・パラダイムから離れて,3次元医用画像のボリュームをビデオシーケンスとして概念化する。
単一のラベル付きサポートイメージに対して広範なデータ拡張を行い、クエリボリュームの各フレームに対して、最も類似したサポートイメージをアルゴリズムで選択する。
ベンチマーク数ショットの医用画像セグメンテーションデータセットの最先端性能を実証し、精度とアノテーション効率を大幅に改善した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:12:13 GMT)
Multi-Agent DRL for Queue-Aware Task Offloading in Hierarchical MEC-Enabled Air-Ground Networks [4.1] モバイルエッジコンピューティング(MEC)対応エアグラウンドネットワークは6Gの重要なコンポーネントである。
本稿では,MEC対応空地統合ネットワーク(MAGIN)における全エネルギー問題に取り組む。
ベータ分布 (MAPPO-BD) を用いた多高度政策最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:12:40 GMT)
From Learning to Optimize to Learning Optimization Algorithms [4.1] 我々は、古典的アルゴリズムが従うが、これまでは、学習の最適化(L2O)には使われていない重要な原則を特定します。
我々は,データ,アーキテクチャ,学習戦略を考慮した汎用設計パイプラインを提供し,古典最適化とL2Oの相乗効果を実現する。
我々は,新しい学習強化BFGSアルゴリズムを設計し,テスト時に多くの設定に適応する数値実験を行うことにより,これらの新原理の成功を実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:17:25 GMT)
Inferring Mood-While-Eating with Smartphone Sensing and Community-Based Model Personalization [4.0] 本研究では,メキシコと8カ国の大学生の2つのデータセットを用いて,日常の食事行動と気分について検討する。
以上の結果から,一般的な気分推定モデルでは,食事時など特定の文脈におけるパフォーマンスが低下していることが示唆された。
以上の結果から,MEXデータセットは63.8%(F1スコア62.5),MULデータセットは88.3%(F1スコア85.7)と推定できた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:05:04 GMT)
VerilogCoder: Autonomous Verilog Coding Agents with Graph-based Planning and Abstract Syntax Tree (AST)-based Waveform Tracing Tool [4.0] We propose VerilogCoder, a system of multiple Artificial Intelligence (AI) agent for Verilog code generation。
提案手法は、構文的に94.2%、機能的に正当なVerilogコードを生成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:23:52 GMT)
See What You Are Told: Visual Attention Sink in Large Multimodal Models [4.0] 大規模マルチモーダルモデル(LMM)は、トランスフォーマーデコーダにおけるテキストと視覚トークン間の注意機構を活用することで、イメージを「見る」。
最近の知見は、LMMは特定の視覚トークンに常に高い注意重みを割り当てる異常な傾向にあることを示している。
本稿では、画像中心の頭部における注意を再分配する視覚的注意再分配(VAR)について紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:55:07 GMT)
PARAMANU-GANITA: Can Small Math Language Models Rival with Large Language Models on Mathematical Reasoning? [3.9] 本研究では,SLM(Small Generative Language Model)のドメイン特化事前学習が,ドメイン特化トークン化とCoT(Chain-of-Thought)命令の微調整が競合性能に与える影響について検討した。
パラマヌ・ガニータ(Paramanu-Ganita)は2億8800万のパラメータを持つ新規デコーダのみのオートレグレッシブSLMを数学で紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:17:28 GMT)
Exploring specialization and sensitivity of convolutional neural networks in the context of simultaneous image augmentations [3.9] 本稿では,入力データ拡張による内部推測について検討する枠組みを提案する。
ネットワーク動作の内部的変化は、ばらつきによって測定された活性化変化に反映される。
開発フレームワークは、複雑な環境での生物学的ニューラルネットワークの研究に移行できる可能性があると仮定する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:09:01 GMT)
Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs [3.8] 実験では、モデルを微調整して安全でないコードを出力し、それをユーザに開示する。
結果として得られるモデルは、コーディングとは無関係な幅広いプロンプトに対して不一致に作用する。
この効果は様々なモデルで観測されるが、GPT-4oやQwen2.5-Coder-32B-Instructでは最も強い。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:15:50 GMT)
Improved Robust Estimation for Erdős-Rényi Graphs: The Sparse Regime and Optimal Breakdown Point [3.8] 我々は、ErdHos-R'enyiランダムグラフのエッジ密度を強く推定する問題を、$G(n, dcirc/n)$で検討する。
我々のアルゴリズムは2乗の総和階層に基づいている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:45:17 GMT)
Enhancing Vietnamese VQA through Curriculum Learning on Raw and Augmented Text Representations [3.7] Visual Question Answering (VQA)は、テキスト入力と視覚入力をまたいだ推論を必要とするマルチモーダルタスクである。
従来の手法は、広範囲の注釈付きデータセット、計算コストの高いパイプライン、大規模な事前訓練されたモデルに大きく依存することが多い。
パラフレーズベースの機能拡張モジュールと動的カリキュラム学習戦略を組み合わせたトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:12:16 GMT)
Beyond Next Word Prediction: Developing Comprehensive Evaluation Frameworks for measuring LLM performance on real world applications [3.7] 大規模言語モデル (LLM) には多くのユースケースがあり、すでにかなりの数の企業採用を獲得している。
本稿では,従来のゲームおよびツールベースのアーキテクチャに基づく,より包括的な評価フレームワークの基礎を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:44:38 GMT)
Cryptographic Verifiability for Voter Registration Systems [3.7] 有権者登録制度は、ほとんどの高い得票率の選挙の重要な要素である。
本研究は,投票者登録システムに対する暗号検証性を導入する。
投票者登録に強い妥当性をもたらす最初のシステムであるVRLogを紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:51:04 GMT)
Automatic Drywall Analysis for Progress Tracking and Quality Control in Construction [3.6] 建設産業におけるデジタル化が不可欠となり、建物のすべての関連する情報に、集中的に簡単にアクセスできるようになった。
本稿では,現場カメラシステムによる構築の進捗と品質評価を可能にする画像ベース自動ドライウォール解析手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:49:32 GMT)
De-skilling, Cognitive Offloading, and Misplaced Responsibilities: Potential Ironies of AI-Assisted Design [3.6] UXにフォーカスしたサブレディットから120以上の記事や議論を分析しました。
以上の結果から,実践者は繰り返し作業の削減と創造性の向上に楽観的であることが示唆された。
UX専門家は、AIの役割を即時生産性の向上を超えて批判的に評価すべきである、と私たちは主張する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:47:16 GMT)
BEVMOSNet: Multimodal Fusion for BEV Moving Object Segmentation [3.6] 本稿では,カメラ,LiDAR,レーダーを利用した最初のエンドツーエンドマルチモーダル融合であるBEVMOSNetを紹介し,鳥眼ビュー(BEV)における移動物体を正確に予測する。
IoUスコアが36.59%向上したのに対し、BEV-MoSegはビジョンベースである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:03:46 GMT)
AIArena: A Blockchain-Based Decentralized AI Training Platform [3.6] 我々は,AI開発とアライメントを,オンチェーンインセンティブ機構を通じて民主化するように設計された分散AIトレーニングプラットフォームであるAIArenaを提案する。
我々は、公開ベースブロックチェーンSepolia testnet上でAIArenaをインスタンス化し、実装し、実世界のアプリケーションでAIArenaが実現可能であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:38:00 GMT)
Towards Continuous Experiment-driven MLOps [3.5] MLモデルの最適化と進化に対するサポートが不十分で、制限がある。
これらの問題に対処する実験駆動型MLOpsアプローチを提案する。
ExtremeXP1プロジェクトでその実現と応用を通じて、我々のアプローチを実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:41:37 GMT)
Improving the Temporal Resolution of SOHO/MDI Magnetograms of Solar Active Regions Using a Deep Generative Model [3.5] 我々は、太陽・半球観測衛星(SOHO)に搭載されたMichelson Doppler Imager(MDI)により収集された太陽活動領域(AR)のLOS磁図の時間分解能を改善するために、GenMDIと呼ばれる新しい深部生成モデルを提案する。
MDIマグネティックグラムの空間超解像を主眼とする従来の研究とは異なり、我々の手法は時間超解像を行うことができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:22:55 GMT)
Incentivizing Truthful Collaboration in Heterogeneous Federated Learning [3.4] フェデレーテッド・ラーニング(FL)は、複数のクライアントが生データの代わりに勾配更新を共有することによって、一緒に学習する分散コラボレーティブ・ラーニング手法である。
データの不均一性がクライアントの更新操作インセンティブに与える影響について検討する。
我々は、FedSGDプロトコルの下で修正された更新の送信を確実に非インセンティブ化する支払いルールを開発する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:32:01 GMT)
One-shot manipulation of coherence in dynamic quantum resource theory [3.3] 近年、動的量子資源の研究への関心が高まっている。
本稿では,超チャネル理論を用いて量子コヒーレンスの動的資源理論を記述する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:36:31 GMT)
A Multi-Sensor Fusion Approach for Rapid Orthoimage Generation in Large-Scale UAV Mapping [3.3] グローバル測位システム(GPS)、慣性計測ユニット(IMU)、4Dミリ波レーダとカメラを統合したマルチセンサUAVシステムにより、この問題に対する効果的な解決策を提供することができる。
予め最適化された特徴マッチング手法を導入し、マッチング速度と精度を向上させる。
実験の結果,提案手法は短時間で正確な特徴マッチングを実現できることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:11:07 GMT)
Mitigating the Stability-Plasticity Dilemma in Adaptive Train Scheduling with Curriculum-Driven Continual DQN Expansion [3.3] 継続学習エージェントは、より複雑な振る舞いを開発するために、以前の経験に基づいて構築される。
しかし、これらのシステムをスケールすることは、特に以前のポリシーの保存と現在の環境への新しいポリシーの適応のバランスをとる上で大きな課題となる。
このバランスは安定性・塑性ジレンマと呼ばれ、特に列車スケジューリング問題のような複雑なマルチエージェント領域で顕著である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:27:17 GMT)
Timber! Poisoning Decision Trees [3.2] 我々は、決定木をターゲットにした最初のホワイトボックス中毒攻撃であるTimberを紹介します。
我々の攻撃は、有効性、効率性、あるいはその両方において、既存のベースラインを上回っていることを示す。
また、2つの代表的防衛が我々の攻撃の効果を軽減することができるが、効果的に阻止することができないことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:12:27 GMT)
Vortex Motion Induced Losses in Tantalum Resonators [3.2] タンタル(Ta)ベースの共振器の損失は、低マイクロ波パワーとミリケルビン温度の2レベルシステムによって支配されている。
熱活性化マイクロ波損失の発生源として渦運動による損失を同定した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:22:48 GMT)
Machine Learning for Estimation and Control of Quantum Systems [3.1] 本稿では、機械学習による量子推定と制御に関するいくつかの重要なトピックについてレビューする。
本稿では,量子状態推定のためのニューラルネットワークに基づく学習,量子システムの最適制御のための勾配学習,量子システムの学習制御のための進化計算,量子ロバスト制御のための機械学習,量子制御のための強化学習について論じる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:16:21 GMT)
From Infants to AI: Incorporating Infant-like Learning in Models Boosts Efficiency and Generalization in Learning Social Prediction Tasks [3.1] 新たな概念の学習における初期概念の利用は,学習の効率化と学習の効率化につながることを示す。
その結果, 概念が人間的な方法で学習された場合, 出現する表現の方が有用であることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:40:19 GMT)
GenCeption: Evaluate Vision LLMs with Unlabeled Unimodal Data [3.1] MLLM(Multimodal Large Language Models)は通常、高価な注釈付きマルチモーダルベンチマークを用いて評価される。
本稿では,新しいアノテーションのない評価手法であるGenCeptionの概要と検証を行う。
モダリティ間のセマンティック・コヒーレンスを測定するために一元データのみを必要とし、逆にMLLMの幻覚傾向を評価する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:42:27 GMT)
Generative Learning of Densities on Manifolds [3.1] 拡散モデルと多様体学習を組み合わせた生成モデリングフレームワークを提案する。
このアプローチは拡散マップを用いて、高次元データ(周囲)空間の低次元(ラテント)空間を発見できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:29:06 GMT)
Scale-Invariant Object Detection by Adaptive Convolution with Unified Global-Local Context [3.1] 本稿では,効率的なDetモデルに基づくSAC-Net(Switchable Atrous Convolutional Network)を用いたオブジェクト検出モデルを提案する。
提案したSAC-Netは,マルチスケールオブジェクト検出タスクの性能向上を実現するために,低レベル機能と高レベル機能の両方の利点をカプセル化している。
ベンチマークデータセットを用いた実験により,提案したSAC-Netは,精度の点で最先端モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:36:27 GMT)
Video Super-Resolution: All You Need is a Video Diffusion Model [3.1] 本稿ではDiffusion Posterior Samplingフレームワークに基づく汎用ビデオ超解像アルゴリズムを提案する。
実世界の物理を学習する強力なモデルは、先行知識として様々な動きパターンを容易に扱うことができると論じる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:37:51 GMT)
Weaker LLMs' Opinions Also Matter: Mixture of Opinions Enhances LLM's Mathematical Reasoning [3.0] 大規模言語モデル(LLM)は、特に数学において、公式な推論能力への関心を高めている。
そこで本研究では,より弱いLLMからの意見の混合(MoO)を利用して,(相対的に)強いLLM推論を強化するポストトレーニング手法を提案する。
その結果,LLMの考え方を取り入れることで,数学的推論が平均5%向上し,推論作業における多様な視点の価値が浮き彫りになることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:42:39 GMT)
Transformer Block Coupling and its Correlation with Generalization in LLMs [3.0] トークン埋め込みの軌跡をトランスフォーマーブロックを通過して解析し、ジャコビアン行列を通してこれらの軌跡に沿って系を線形化する。
我々は,多言語モデルにおけるtextbftransformer ブロックの結合現象を明らかにし,トークンと深さをまたいだ頂点特異ベクトルの結合を特徴とする。
さらに,これらの特性が学習中にどのように出現するかを考察し,結合の進行,線形性の向上,トークン軌道の層ワイド指数的成長を観察する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:47:05 GMT)
Construction and Decoding of Quantum Margulis Codes [2.9] 量子マーグリス符号(quantum Margulis codes, QLDPC codes)は、量子マーグリスの古典的なLDPC構成から派生した2ブロック群代数フレームワークである。
量子マーグリス符号は、分極雑音下で復号化する場合、線形複雑性を持つ標準のmin-sumデコーダを用いて効率よく復号化可能であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:11:22 GMT)
"Till I can get my satisfaction": Open Questions in the Public Desire to Punish AI [2.9] AIの処罰に対する大衆の期待は極めて過小評価されている。
我々は心理学、人間とコンピュータ、ロボットの相互作用、哲学、AI倫理から研究を合成する。
我々は、AI害の犠牲者をいかに最大限に満たせるかを確立するために、学際的な研究プログラムを要求します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:59:21 GMT)
An Optimal Cascade Feature-Level Spatiotemporal Fusion Strategy for Anomaly Detection in CAN Bus [2.8] 本研究では,本問題の本質的な性質に基づくモデルを構築し,全ての支配的パターンを網羅する。
提案モデルでは,F1スコアと精度が向上し,これまでに提示された全てのモデルの中で最高の性能を示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:45:03 GMT)
Do ImageNet-trained models learn shortcuts? The impact of frequency shortcuts on generalization [2.8] 周波数ショートカットは、モデルが正しい分類に強く依存する特定の周波数パターンを指す。
以前の研究では、小さな画像データセットでトレーニングされたモデルは、しばしばそのようなショートカットを利用することが示されている。
より効率的に周波数ショートカットを大規模に解析する手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:03:34 GMT)
To reset, or not to reset -- that is the question [2.7] テキストブックの量子誤差補正は、測定後にキュービットがリセットされることを要求する。
多くの最先端の量子誤り補正実験は、非リセットアプローチを選択している。
非リセットはリセットプロシージャと機能的に等価であり、高速で簡単である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:45:50 GMT)
Nonclassicality and sub-Planck structures of photon subtracted compass states [2.7] 我々は光子置換コンパス状態(PSCS)の非古典的性質について議論する。
位相空間における状態の変位により光子サブトラクションが感度の低下を起こさないことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:00:15 GMT)
Capability-Aware Shared Hypernetworks for Flexible Heterogeneous Multi-Robot Coordination [2.7] 本稿では,単一アーキテクチャが各ロボットと現在の状況に動的に適応できるように,能力認識型共有ハイパーネットワークス(CASH)を提案する。
CASHは、ローカルな観察とロボットの個人的および集団的能力に基づいて、各ロボットに適応可能な共有意思決定戦略を符号化する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:37:52 GMT)
Network Causal Effect Estimation In Graphical Models Of Contagion And Latent Confounding [2.7] 多くのネットワーク研究の鍵となる疑問は、観測された単位間の相関は、主に感染や潜伏によるものであるかである。
ネットワーク因果効果の推定手法を提案する。
実世界のネットワークを用いて,合成データによる手法の有効性と仮定の有効性を評価する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:48:34 GMT)
"Only ChatGPT gets me": An Empirical Analysis of GPT versus other Large Language Models for Emotion Detection in Text [2.6] 本研究では,大規模言語モデル(LLM)のテキストによる人間の感情の検出と理解能力について検討する。
GoEmotionsデータセットの最先端モデルとの比較を含む方法論を用いて,感情分析システムとしてのLLMの有効性を評価することを目的とする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:47:49 GMT)
Advancing Highway Work Zone Safety: A Comprehensive Review of Sensor Technologies for Intrusion and Proximity Hazards [2.5] ハイウェイの作業区域は事故が頻発する重要な地域であり、労働者が重機に近づき、交通が進行しているためである。
センサー技術とモノのインターネットの技術の進歩により、これらの安全上の問題に対処する有望なソリューションが登場しつつある。
本稿では,ハイウェイ作業ゾーンの安全性向上のためのセンサ技術の適用に関する既存研究を体系的にレビューする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:23:06 GMT)
A Physical Coherence Benchmark for Evaluating Video Generation Models via Optical Flow-guided Frame Prediction [2.5] 本稿では,生成されたビデオの物理コヒーレンスを評価するためのベンチマークPhyCoBenchを紹介する。
われわれのベンチマークでは、120のプロンプトが7つのカテゴリの物理原理をカバーし、ビデオコンテンツで観察できる重要な物理法則を捉えている。
本稿では,光学フローと映像フレームをカスケード的に生成する拡散モデルであるPhyCoPredictorを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:27:57 GMT)
A Conceptual Model for Attributions in Event-Centric Knowledge Graphs [2.5] 本稿では,本論文の原著の延長として,特定の視点でのみ有効である事実の表現を可能にする属性を導入する。
本研究では,視点に依存した情報の表現を可能にする概念モデルを開発する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:51:46 GMT)
Using CognitIDE to Capture Developers' Cognitive Load via Physiological Activity During Everyday Software Development Tasks [2.4] IntelliJベースのIDEプラグインであるCognitIDEを用いて,開発者の生理活動データを収集,マップ,可視化する研究を提案する。
フィージビリティスタディでは、参加者がソフトウェア開発者の日々の作業のシミュレーションを4回完了した。
CotantIDEは1時間のデータ収集セッションでうまく使えた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:19:41 GMT)
FlexiFly: Interfacing the Physical World with Foundation Models Empowered by Reconfigurable Drone Systems [2.3] ファンデーションモデル(FM)は、デジタルメディアを生成できる巨大な人間のような能力を示している。
我々は,FMのズームインを可能にするプラットフォームであるFlexiFlyを提案し,関連する領域を解析する。
FlexiFlyによってFMとLLMの多様なタスクを最大85%以上の成功で完了させることができる実際のスマートホームデプロイメントを実演します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:11:38 GMT)
PAIR: A Novel Large Language Model-Guided Selection Strategy for Evolutionary Algorithms [2.3] 本稿では、PAIR(Preference-Aligned individual Reciprocity)を紹介する。
PAIRは人間に似た配偶者選択をエミュレートし、進化的アルゴリズム(EA)におけるペアリングプロセスにインテリジェンスを導入する
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:45:56 GMT)
Active Learning for Deep Learning-Based Hemodynamic Parameter Estimation [2.3] 循環動態パラメータは、心臓血管疾患の診断、予後、治療計画において重要な役割を果たす。
CFDの結果を迅速に推定する手段として,ディープラーニング手法が採用されている。
本稿では,サロゲートモデルのトレーニングに必要なCFDシミュレーション数を削減するためのアクティブラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:35:54 GMT)
Knowledge Augmentation in Federation: Rethinking What Collaborative Learning Can Bring Back to Decentralized Data [2.2] 我々は知識中心のパラダイムであるemphKnowledge Augmentation in Federation(KAF)を提案する。
我々は,共同作業を通じて地域知識を高める方法に焦点をあてる。
本稿では, 知識拡張, 知識フィルタリング, ラベル, 特徴空間の補正手法について述べる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:26:54 GMT)
A Multimodal Framework for Topic Propagation Classification in Social Networks [2.2] 本稿では,ソーシャルネットワークにおける話題拡散の予測モデルを提案する。
本稿では,PageRankアルゴリズムにユーザ関係の広さとユーザ権限という2つの新しい指標を導入する。
従来のトピックビューメトリクスを,より正確なコミュニケーション特性尺度に置き換え,トピックによるユーザインタラクショントレースの測定を改良する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:12:23 GMT)
Paths and Ambient Spaces in Neural Loss Landscapes [2.2] ニューラルネットワークのロスランドスケープにロストンネルを埋め込む新しい手法を提案する。
これらの損失トンネルの性質の探索は、その長さと構造に関する新たな洞察を与える。
次にベイズニューラルネットワークにアプローチを適用し,部分空間推論を改善する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:57:34 GMT)
An Analytical Theory of Power Law Spectral Bias in the Learning Dynamics of Diffusion Models [2.2] 拡散モデル学習中に学習した分布がどのように進化するかを理解するための分析フレームワークを開発した。
任意のデータを用いた1層または2層線形デノイザ設定における重みの勾配-流れの正確な解を導出した。
これらの解により、閉形式で生成された分布とKLの発散を訓練によって導出できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:50:38 GMT)
Coordinated Multi-Armed Bandits for Improved Spatial Reuse in Wi-Fi [2.1] 空間再利用(SR)の最適化を推進するためのオンライン学習に基づく協調型ソリューションについて検討する。
特に、複数の意思決定エージェントが既存のネットワークからSRパラメータを同時に設定するマルチエージェントマルチアーマッドバンド(MA-MAB)の設定に着目する。
協調MABによって実現されたAIネイティブSRは、現在のWi-Fi操作よりもネットワーク性能を向上させることができることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:19:05 GMT)
Towards Visual Discrimination and Reasoning of Real-World Physical Dynamics: Physics-Grounded Anomaly Detection [2.1] 本稿では,産業用異常検出のための大規模実世界物理地上ビデオデータセットである物理異常検出データセットを紹介する。
このデータセットには、22の現実世界のオブジェクトカテゴリにわたる6400以上のビデオが含まれており、ロボットアームやモーターと相互作用し、47種類の異常を示す。
我々は,非教師付きAD,弱い教師付きAD,ビデオ理解ADの3つの条件下で,最先端の異常検出手法をベンチマークした。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:49:08 GMT)
Regularization-based Framework for Quantization-, Fault- and Variability-Aware Training [2.1] 正規化に基づく量子化対応トレーニングフレームワークは、CIFAR-10とImageNet上での競合結果を達成する。
当社のフレームワークは,フォールトおよび可変性を考慮した微調整,固定重み付きフォールト(固定重み付きビット)の緩和,デバイス抵抗のばらつきを可能にする。
本研究は,低消費電力非理想ハードウェアにおいて,量子化とロバスト性を考慮したトレーニングを行うための一般化可能なフレームワークを構築した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:03:39 GMT)
O-RAN xApps Conflict Management using Graph Convolutional Networks [2.1] グラフ畳み込みネットワーク(GCN)に基づく新しいデータ駆動型XApps Conflict and Root Cause Analysis Engine(GRACE)を導入する。
3種類のコンフリクト(直接、間接、暗黙)を検出し、根本原因(xApps)をピンポイントする。
提案手法は、競合インスタンスの数が40%から10%の高度に不均衡なデータセットでテストされた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:07:29 GMT)
FairSense-AI: Responsible AI Meets Sustainability [2.0] テキストと画像の両方のバイアスを検出し緩和するフレームワークであるFairSense-AIを紹介する。
LLM(Large Language Models)とVLM(Vision-Language Models)を活用することで、FairSense-AIは微妙な偏見やステレオタイピングの形式を明らかにする。
FairSense-AIは、MIT AI Risk RepositoryやNIST AI Risk Management Frameworkといったフレームワークと連携する、AIリスク評価コンポーネントを統合する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:24:43 GMT)
GenColor: Generative Color-Concept Association in Visual Design [2.0] テキスト・ツー・イメージ・モデルにより生成された画像を利用した意味的共鳴色をマイニングするための生成的アプローチを提案する。
コンセプトインスタンシングは、拡散モデルを用いて生成サンプルを生成し、テキスト誘導画像セグメンテーションは、画像内の概念関連領域を特定し、主にアクセント色を伴う色関連抽出を行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:29:12 GMT)
Building Safe GenAI Applications: An End-to-End Overview of Red Teaming for Large Language Models [2.0] LLM(Large Language Models)の急速な成長は、プライバシー、セキュリティ、倫理上の懸念を生じさせる。
研究者は最近、レッドチームによる攻撃的なアプローチでこれらの取り組みを補完した。
本稿では,LLMレッド・チームリング文学の簡潔かつ実践的な概要について述べる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:41:38 GMT)
You Are the Best Reviewer of Your Own Papers: The Isotonic Mechanism [1.8] ノイズレビュースコアの精度を高めるためにイソトニックメカニズムを導入する。
複数の論文を提出した著者は、評価された品質の順に論文をランク付けする必要がある。
調整されたスコアは 生のスコアよりも正確です
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:46:11 GMT)
Designing Speech Technologies for Australian Aboriginal English: Opportunities, Risks and Participation [1.8] オーストラリアでは、先住民コミュニティと英語話者との強制的な接触の結果、接触後の言語品種が出現した。
これらの接触型は広く使われているが、言語技術ではサポートされていない。
このギャップは、これらの品種を用いた先住民社会の市民社会と経済社会への参加の障壁となる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:07:39 GMT)
Open-Source Large Language Models as Multilingual Crowdworkers: Synthesizing Open-Domain Dialogues in Several Languages With No Examples in Targets and No Machine Translation [1.7] 大規模言語モデルを用いて複数のターゲット言語でオープンドメイン対話データを生成するパイプラインを提案する。
生成した対話の開放性を高め,実生活を模倣するために,話者が関与する会話の種類に応じた発話イベントの概念を追加した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:52:14 GMT)
Machine Learning in Biomechanics: Key Applications and Limitations in Walking, Running, and Sports Movements [1.7] この章は、歩行(ウォーキングとランニング)とスポーツバイオメカニクスにおける、最近で有望な機械学習アプリケーションの概要を提供する。
バイオメカニカルにおける課題に対処する機械学習手法の可能性を探究し、中心的な限界を強調している。
歩行およびスポーツバイオメカニクスにおける機械学習の可能性を完全に活用するための学際的アプローチの重要性を強調している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:10:11 GMT)
Enhancing Conversational Agents with Theory of Mind: Aligning Beliefs, Desires, and Intentions for Human-Like Interaction [1.7] オープンソースの言語モデル(LLaMA)は、ToM関連の情報をキャプチャして保存することができる。
ToM関連成分(信念、欲求、意図など)の明示的な操作が、応答アライメントを高めることができるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:41:45 GMT)
Finite-sample valid prediction of future insurance claims in the regression problem [1.7] 本稿では,共形予測を有効化するための一般的な機械学習戦略として,共形予測を活用することで,3つの課題を同時に解決する。
また、事前指定されたカバレッジの確率レベルで有限サンプルの妥当性を保証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:47:08 GMT)
TakuNet: an Energy-Efficient CNN for Real-Time Inference on Embedded UAV systems in Emergency Response Scenarios [1.7] TakuNetは、Deep-wise convolutionsや早期のダウンサンプリングステムといったテクニックを採用した、新しい軽量アーキテクチャである。
パラメータの最小値にもかかわらず、緊急時の航空画像の分類において、最先端の精度を達成する。
リソース制約のあるプラットフォーム上でのリアルタイムAI処理や、緊急シナリオにおけるドローンの適用性向上に適している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:00:34 GMT)
Leap: Inductive Link Prediction via Learnable TopologyAugmentation [1.7] LEArnable ToPology Augmentationに基づく帰納的リンク予測手法であるLEAPを提案する。
7つの実世界の等質グラフと異質グラフの実験は、LEAPがSOTA法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:03:59 GMT)
Emergent Continuous Time Crystal in Dissipative Quantum Spin System without Driving [1.6] タイムクリスタル(英: Time Crystals)は、時間次元への基本的な自然対称性の破れを延長する物質の非平衡相である。
ここでは、外部コヒーレントまたは非コヒーレント駆動を伴わない2次元散逸型ハイゼンベルクスピン系の非平衡位相図を探索する。
極限周期定常状態の出現は、この時間に依存しない多体系の連続時間変換対称性を破り、それらを連続時間結晶として分類する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:19:41 GMT)
Is On-Device AI Broken and Exploitable? Assessing the Trust and Ethics in Small Language Models [1.6] オンデバイス人工知能(AI)の信頼性と倫理的意味を調査するための第1報について述べる。
以上の結果から,デバイス上のSLMは信頼性が著しく低く,特にステレオタイプ,不公平,プライバシブリーチング行動が顕著であることがわかった。
本研究は、デバイス上でのSLMの倫理的保護が欠如していることを示し、有害なコンテンツを生成する能力を強調した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:18:08 GMT)
Deterministic generation of multi-qubit entangled states among distant parties using indefinite causal order [1.6] 複数のネットワークノードにまたがる$N$-qubitの絡み合った状態を生成するためのプロトコルを提案する。
その結果,提案プロトコルは長距離エンタングルメント生成の効率を著しく向上させることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:40:19 GMT)
Decoupled Recommender Systems: Exploring Alternative Recommender Ecosystem Designs [1.5] 我々は、レコメンデーションアルゴリズムが提供されるプラットフォームから切り離されるような構成の結果について研究する。
これは"フレンドリーな近所のアルゴリズムストア"や"ミドルウェア"モデルと呼ばれることもある。
我々は、アルゴリズムの選択を取り入れたレコメンデーションエコシステムのモデルを作成し、そのような設計の結果を調べる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:42:37 GMT)
Fast Jet Tagging with MLP-Mixers on FPGAs [1.5] 実時間ジェットタグ作成における分散ミクサーモデルの革新的利用について検討し,FPGAのような資源制約のあるハードウェアへの実現可能性を確立する。
大型ハドロン衝突型加速器を模擬したデータセットの最先端性能を実現する。
非置換不変アーキテクチャは、スマートな機能優先順位付けと効率的なFPGAデプロイメントを可能にし、パーティクルコリダでのリアルタイムデータ処理における機械学習のための新しいベンチマークを設定する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:37:47 GMT)
Prompt-enhanced Network for Hateful Meme Classification [1.5] ソーシャルメディアは、メディアプラットフォームに憎しみのあるミームが溢れている。
我々は,Penを開発した。Penは,素早い学習アプローチに基づくネットワークフレームワークである。
我々はPenが手動のプロンプト法を超越し,より優れた一般化と分類精度を示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:52:25 GMT)
LexGenie: Automated Generation of Structured Reports for European Court of Human Rights Case Law [1.5] LexGenieは、ユーザ特定トピックに関するケースローの全ボディを使用して構造化レポートを作成するように設計された、自動パイプラインである。
トピックごとに関連するパスを検索し、クラスタ化し、整理し、各セクションの構造化されたアウトラインと凝集性コンテンツを生成する。
専門家による評価は、効率的でスケーラブルな法的な分析を促進する構造化レポートを作成する上で、LexGenieの有用性を確認している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:49:28 GMT)
GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization [1.4] 軽量なXFeat特徴抽出器から高密度かつ堅牢なキーポイント記述器を3DGSに統合する2段階の手順を提案する。
第2段階では、レンダリングベースの光度ワープ損失を最小限に抑え、初期ポーズ推定を洗練させる。
広く使われている屋内および屋外データセットのベンチマークは、最近のニューラルレンダリングベースのローカライゼーション手法よりも改善されていることを示している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:11:44 GMT)
On the Utility of Equivariance and Symmetry Breaking in Deep Learning Architectures on Point Clouds [1.4] 本稿では,点雲を扱うモデルの性能に影響を及ぼす要因について考察する。
我々は、異なるタスクで成功を導く同変および非同変アーキテクチャの鍵となる側面を識別する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:26:17 GMT)
Unified Mind Model: Reimagining Autonomous Agents in the LLM Era [1.4] 大規模言語モデル(LLM)は、最近、ドメイン、タスク、言語間で顕著な機能を示した。
我々は,自律エージェントの迅速な作成を促進するためのガイダンスを提供する,新しい理論認知アーキテクチャである統一マインドモデル(UMM)を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:49:44 GMT)
Differential Machine Learning for Time Series Prediction [1.4] 本稿では、差分学習によるニューラルネットワーク予測を強化する新しい手法を提案する。
我々は,共有LSTMセルを用いて,両データストリームを同時に処理する差分長短期メモリ(Diff-LSTM)ネットワークを開発した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:36:57 GMT)
PyGen: A Collaborative Human-AI Approach to Python Package Creation [1.3] Pygenは、研究者、技術者、ホビイストに、Pythonで書かれた中核的で有用なソフトウェアツールとして抽象的なアイデアを人生に持ち込むための自動化プラットフォームである。
最先端の言語モデルとオープンソースのコード生成技術を組み合わせることで、Pygenはツール開発のマニュアルオーバーヘッドを大幅に削減した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:11:13 GMT)
KLiNQ: Knowledge Distillation-Assisted Lightweight Neural Network for Qubit Readout on FPGA [1.3] 本稿では,知識蒸留により最適化された軽量ニューラルネットワークを活用した新しい量子ビット読み出しアーキテクチャKLiNQを提案する。
提案手法は,Qubit状態の判別精度91%を維持しながら,ベースラインに比べてモデルサイズを約99%削減する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:28:16 GMT)
HoT: Highlighted Chain of Thought for Referencing Supporting Facts from Inputs [1.2] 事実と非事実の言明が混ざり合った反応は、人間が自分の決定を正確かつ正確に検証することの難しさを浮き彫りにする。
提案するHighlighted Chain-of-Thought Prompting(HoT)は,大規模言語モデルに対して,クエリで提供される事実をベースとしたXMLタグによる応答を生成する技術である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:57:16 GMT)
Handling Uncertainty in Health Data using Generative Algorithms [1.2] 本稿では、生成AIを用いたクラス不均衡を緩和する新しいパイプラインであるRIGAを紹介する。
RIGAは、cGAN、VQVAE、VQGANといったモデルを利用してバランスの取れたサンプルを生成し、分類性能を向上させる。
このアプローチは、XGBoostのような従来の分類器を強化し、ベイズ構造学習を改善し、表現不足クラスのための現実的な合成データを生成することにより、MLモデルの堅牢性を強化する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:04:30 GMT)
Predicting Team Performance from Communications in Simulated Search-and-Rescue [1.2] 会話データを分析して、チームの特性とチームの成果との相関を識別する。
本研究は,これらの推論により,チームリング結果の変動を説明できることを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:20:27 GMT)
Quantum Weak Measurement Amplifies Dispersion Signal of Rydberg Atomic System [1.2] 本稿では,Rydberg原子マイクロ波検出システムの分散信号を増幅する手法を提案する。
このスキームは、技術的ノイズの影響を効果的に軽減し、理論上の原子ショットノイズによって設定された限界に近い測定精度を達成するために使用できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:54:44 GMT)
Analyzing the Safety of Japanese Large Language Models in Stereotype-Triggering Prompts [1.2] 本研究では, ステレオタイプ・トリガリング・プロンプトに応答する際の日本語大言語モデルの安全性について検討した。
年齢・性別・属性別に分類した301の社会集団用語と12のステレオタイプ誘導テンプレートを組み合わせることで,3,612のプロンプトを構築した。
以上の結果から,日本原産モデルであるLSM-jpは,拒絶率が最も低く,他のモデルと比較して毒性や負の反応が生じる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:43:02 GMT)
Approximation and Generalization Capacities of Parametrized Quantum Circuits for Functions in Sobolev Spaces [1.2] パラメタライズド量子回路(パラメタライズド量子回路、PQC)は、固定ゲートとパラメタライズドゲートの両方からなる量子回路である。
PQCs は連続函数の空間、$p$可積分函数、および$Hk$ソボレフ空間を特定の距離で近似できることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:31:10 GMT)
Prompt-Matcher: Leveraging Large Models to Reduce Uncertainty in Schema Matching Results [1.1] 本稿では,大規模言語モデルの特定のプロンプトを用いた細粒度対応検証に基づく新しい手法を提案する。
本手法は,(1)対応選択アルゴリズム,(2)対応検証,(3)確率分布の更新の3つの主成分からなる反復ループである。
本稿では,計算効率においてブルートアルゴリズムを著しく上回る新しい$(1-1/e)$-approximationアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:15:58 GMT)
A privacy-preserving, distributed and cooperative FCM-based learning approach for cancer research [1.1] 筆者らは,パーティクルスワーム最適化に基づくファジィ認知マップを,プライバシ保護方式で分散学習するための革新的な方法論を紹介した。
この方法は癌検出問題に適用され、フェデレートラーニングプロセスによりモデルの性能が向上することが証明される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:51:06 GMT)
Two-Stream Thermal Imaging Fusion for Enhanced Time of Birth Detection in Neonatal Care [1.1] 出生時刻(ToB)を正確に検出するために、画像とビデオ分析のパワーを組み合わせた2ストリーム融合システムを提案する。
本システムは,短いビデオクリップ内での出生検出において,95.7%の精度と84.8%のリコールを実現する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:52:52 GMT)
Qieemo: Speech Is All You Need in the Emotion Recognition in Conversations [1.1] マルチモーダルアプローチは多様なモダリティの融合による恩恵を受け、認識精度が向上する。
提案するQieemoフレームワークは,自然なフレームアライメントと感情的特徴を含む事前学習された自動音声認識(ASR)モデルを効果的に活用する。
IEMOCAPデータセットの実験結果は、Qieemoがそれぞれ3.0%、1.2%、および1.9%の絶対的な改善でベンチマークアンモダル、マルチモーダル、セルフ教師付きモデルを上回っていることを示している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:02:30 GMT)
Probabilistic Insights for Efficient Exploration Strategies in Reinforcement Learning [1.0] 有限時間予算内で希少状態に達する確率に対する並列シミュレーションの影響を解析する。
探索の多様性と時間割当のバランスをとるために,最適な並列シミュレーション数を同定する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:53:32 GMT)
Self is the Best Learner: CT-free Ultra-Low-Dose PET Organ Segmentation via Collaborating Denoising and Segmentation Learning [1.0] ポジトロン・エミッション・トモグラフィ(PET)における臓器の分画は、がんの定量化において重要な役割を担っている。
低線量PET(LDPET)は、放射線被曝を減らすことでより安全な代替手段を提供する。
既存のPETオルガンセグメンテーション法はCTアノテーションに依存しており、モダリティミスマッチの問題を見落としている。
本研究では,新しいCTフリー超LDPET臓器分割パイプラインであるLDOSを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:36:56 GMT)
Affordably Fine-tuned LLMs Provide Better Answers to Course-specific MCQs [0.9] 我々は,大規模言語モデル (LLM) がハードウェア制約や改良技術に関して,マルチチョイス質問 (MCQ) にどのように答えるかを検討する。
我々は,プログラム言語(PL)コースから162人の学部レベルのMCQに回答するために,汎用的な事前学習 LLM を用いて,この空間を探索する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:18:31 GMT)
A Criterion for Extending Continuous-Mixture Identifiability Results [0.9] 確率変数の連続混合に対して、カーネルベースの識別可能性の結果を新しいカーネル分布に拡張する。
この基準は、関連するカーネルのモーメント生成関数やラプラス変換の関数関係に基づいており、離散変数と連続変数の両方の連続混合に適用することができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:19:29 GMT)
Rational Tuning of LLM Cascades via Probabilistic Modeling [0.9] 大規模言語モデル(LLM)の連立性能分布の確率的モデルを提案する。
グリッドサーチを用いた信頼性閾値の選択と比較して,提案手法はカスケードの長さとコストエラー曲線の所望の解像度に関して,実行時のスケーリングを大幅に改善する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:23:10 GMT)
Preliminary Report: Enhancing Role Differentiation in Conversational HCI Through Chromostereopsis [0.9] テキストベースのAIインタフェースにおける会話の役割を視覚的に識別するための新しいアプローチとして,色コントラストによる深度知覚を誘発する知覚現象であるクロモステレオプシスを活用することを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:40:10 GMT)
Multi-Agent Systems Powered by Large Language Models: Applications in Swarm Intelligence [0.9] 本研究では,大規模言語モデル(LLM)のマルチエージェントシミュレーションへの統合を,エージェントのハードコードプログラムをLLM駆動のプロンプトに置き換えることにより検討する。
提案手法は群集知能の分野での複雑なシステムの2つの例(アリコロニー採餌と鳥の群れ)の文脈で実証されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:13:27 GMT)
SoK: Microservice Architectures from a Dependability Perspective [0.8] マイクロサービスアーキテクチャは、モノリシックアプリケーションを、軽量な通信スキームを使用して対話する小さなサービスに分割する。
マイクロサービスアーキテクチャが抱える既知の障害と脆弱性、それに対処する最近の科学的文献について調べる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:12:58 GMT)
Modular Compilation for Quantum Chiplet Architectures [0.8] チップレットベースの量子コンピュータに最適化された完全並列化コンパイルパイプラインSEQCを提案する。
SEQCは回路忠実度が最大36%向上し、実行時間が最大1.92倍になった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:29:48 GMT)
Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System [0.8] 本研究は,3つの検査手法を用いて,逆チューリングテストによりローグエージェントを検出し,マルチエージェントシミュレーションにより知覚的アライメントを解析する。
GEMINI 1.5 Pro と llama-3.3-70B, Deepseek r1 モデルを用いて, 抗ジェイルブレイクシステムを開発した。
GEMINI 1.5 Proの94%の精度など、検出能力は強いが、長時間の攻撃を受けた場合、システムは永続的な脆弱性に悩まされる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:17:18 GMT)
Tec-Habilidad: Skill Classification for Bridging Education and Employment [0.7] 本稿では,スキル抽出と分類のためのスペイン語データセットを開発する。
知識、スキル、能力を区別するアノテーションの方法論を提供する。
また、スキル分類のための堅牢なソリューションを進めるためのディープラーニングベースラインも提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:05:42 GMT)
FLARE: Fusing Language Models and Collaborative Architectures for Recommender Enhancement [0.7] Flareは、Perceiverネットワークを使用した協調フィルタリングモデルと言語モデルを統合する、新しいハイブリッドシーケンスレコメンデータである。
我々はよく使われるBert4Recベースラインを再検討し、Bert4Recが以前報告された数値より大幅に上回っていることを示す。
本稿ではまた,Frareが特有なクオリティ作成を支援する能力を示し,ユーザがフィードバックを提供し,レコメンデーションを洗練できるようにする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:46:26 GMT)
An Improved Quantum Algorithm of the Multislice Method [0.7] マルチサイス法は透過電子顕微鏡における電子回折と画像シミュレーションのための重要なアルゴリズムである。
本研究では,改良された量子アルゴリズムを開発した。
マルチ制御量子ゲートを用いずに位相シフト量子回路を再構成し,計算効率を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:55:17 GMT)
Beyond Trial-and-Error: Predicting User Abandonment After a Moderation Intervention [0.7] 現在のコンテンツモデレーションは、リアクティブで試行錯誤的なアプローチに従っている。
我々は、モデレーターが実装前に行動の影響を予測できるように、積極的に予測的なアプローチを導入する。
Reddit上でのオンラインコミュニティの大規模な禁止に対する16,540人のユーザーの反応を調査した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:22:04 GMT)
Review of Machine Learning for Micro-Electronic Design Verification [0.7] マイクロエレクトロニクス設計の検証はデバイス開発において重要なボトルネックとなっている。
1990年代後半以降、機械学習(ML)は検証効率を高めるために提案されてきた。
本稿では,マイクロエレクトロニクス設計の機能検証のための動的手法におけるMLの適用について検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:41:09 GMT)
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model [0.7] Segment Anything Model (SAM) は様々な視覚的タスクに対して強力な汎用性を示している。
ポストトレーニング量子化(PTQ)は、効率的なデプロイメントのための効果的な戦略として登場した。
本稿では,SAM の高精度かつハードウェア効率の高い PTQ 手法である AHCPTQ を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:04:45 GMT)
Safe LLM-Controlled Robots with Formal Guarantees via Reachability Analysis [0.7] 本稿では,Large Language Models (LLM) 制御ロボットを対象とした,データ駆動型リーチビリティ解析に基づく安全保証フレームワークを提案する。
我々のアプローチは、明示的な分析モデルに頼ることなく、安全でない行動に対する厳密な安全保証を提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:23:15 GMT)
A Survey on LLM Test-Time Compute via Search: Tasks, LLM Profiling, Search Algorithms, and Relevant Frameworks [0.6] この調査は、タスク定義を統一し、LLMプロファイリングとサーチ手順のモジュラー定義を提供する包括的な技術的レビューを提供する。
これらの定義は、従来の検索アルゴリズムから逸脱した点を強調しながら、様々なLLM推論フレームワークの正確な比較を可能にする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:22:23 GMT)
An Adaptive Underwater Image Enhancement Framework via Multi-Domain Fusion and Color Compensation [0.6] 水中光学イメージングは、光吸収、散乱、色歪みによって著しく劣化する。
本稿では,照明補償,マルチドメインフィルタリング,動的色補正を統合した適応型拡張フレームワークを提案する。
ベンチマークデータセットを用いた実験結果から,コントラスト強化,色補正,構造保存における最先端手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:19:56 GMT)
TopoMortar: A dataset to evaluate image segmentation methods focused on topology accuracy [0.6] TopoMortarは、トポロジーに焦点を当てた画像セグメンテーション手法を評価するために特別に設計された最初のデータセットである。
TopoMortar 上で clDice が最も位相的に正確なセグメンテーションを達成したことを示す。
また,データ拡張や自己蒸留といった単純な手法により,クロスエントロピーDice損失がほとんどのトポロジ損失関数を超える可能性があることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:42:41 GMT)
BEVDriver: Leveraging BEV Maps in LLMs for Robust Closed-Loop Driving [0.6] 大規模言語モデル(LLM)には推論能力と自然言語理解がある。
CARLAにおける終端閉ループ駆動のためのLLMモデルであるBEVDriverを紹介する。
LangAutoベンチマークでは、私たちのモデルはSoTAの手法と比較して、ドライビングスコアで最大18.9%高いパフォーマンスを実現しています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:27:32 GMT)
A dataset-free approach for self-supervised learning of 3D reflectional symmetries [0.6] 我々は,入力オブジェクト自体にのみデータセット解析を必要とせず,単一のオブジェクトの対称性を検出することを学習する自己教師モデルについて検討する。
基礎的真理ラベルの必要性を除去する自己教師型学習戦略を設計する。
私たちのモデルはより効率的で効果的で、最小限の計算資源とデータリソースで動作します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:36:48 GMT)
Perceptual Motor Learning with Active Inference Framework for Robust Lateral Control [0.5] 本稿では、高自動走行車(HAV)における横方向制御を強化するために、アクティブ推論(AIF)と統合された新しい知覚運動学習フレームワークを提案する。
PMLは知覚と行動のシームレスな統合を強調し、動的環境における効率的な意思決定を可能にする。
弊社のアプローチは、ディープラーニングをアクティブな推論原則と統合し、HAVが最小限のデータで車線維持を行い、異なる環境にまたがる広範な再訓練を行なわないようにする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:27:57 GMT)
MIRROR: A Novel Approach for the Automated Evaluation of Open-Ended Question Generation [0.5] 自動質問生成システムによって生成される質問に対する評価プロセスを自動化する新しいシステムMIRRORを提案する。
その結果,MIRRORと呼ばれるフィードバックに基づく手法を用いることで,人間の評価指標,すなわち妥当性,適切性,新規性,複雑性,文法性のスコアが向上した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:16:01 GMT)
Preserving Cultural Identity with Context-Aware Translation Through Multi-Agent AI Systems [0.4] 言語は文化的アイデンティティの基盤となっているが、グローバル化と主要言語の優位性により、3000近い言語が絶滅の危機にさらされている。
既存のAI駆動翻訳モデルは効率を優先するが、しばしば文化的ニュアンス、慣用的な表現、歴史的重要性を捉えない。
本稿では,言語コミュニティにおける文化適応型翻訳のための多言語AIフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:43:59 GMT)
Tackling Few-Shot Segmentation in Remote Sensing via Inpainting Diffusion Model [0.4] 数ショットのセグメンテーションタスクでは、モデルは通常、豊富なアノテーションを持つベースクラスで訓練され、後に限られた例を持つ新しいクラスに適応する。
本稿では,拡散モデルを利用して新しいクラスオブジェクトを多種多様に生成する簡単な手法を提案する。
イメージインペイントタスクとして問題をフレーミングすることにより,様々な環境下での新規クラスの可視例を合成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:08:51 GMT)
Visualising Policy-Reward Interplay to Inform Zeroth-Order Preference Optimisation of Large Language Models [0.4] 勾配の代わりに関数評価を用いたゼロ次最適化(ZO)は、メモリ使用量を減らすが、高次元モデルでは緩やかな収束に悩まされる。
LLMの優先度最適化のために設計された新しいZOアルゴリズムZOPrOを紹介する。
本手法は,一階法に匹敵する収束時間を実現しつつ,報酬信号の連続的な向上を実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:49:48 GMT)
Efficient detection of entanglement by stimulated disentanglement [0.4] 極端に時間エネルギーの絡み合った双光子(オクターブ散乱スペクトル 113THz)を作る
我々は、Delta(t_2)Delta(E_1+E_2)approx!2!cdot!10-13h$の時間差とエネルギーの相対的な不確かさを測り、古典的境界を12等級で破る。
提案したコヒーレントSFGは、時間とエネルギーの両方の誤った一致を理想的に拒否するため、標準手法と比較してSNRを劇的に向上させる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:17:36 GMT)
Deep ARTMAP: Generalized Hierarchical Learning with Adaptive Resonance Theory [0.3] Deep ARTMAPは、自己一貫性のあるモジュラARTアーキテクチャを一般化したARTMAPアーキテクチャの新たな拡張である。
Deep ARTMAPは分割クラスタリング機構として動作し、各モジュール内でカスタマイズ可能な粒度を持つ任意の数のモジュールをサポートする。
柔軟性が大幅に向上し、幅広いデータ変換と学習モダリティが利用できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:23:17 GMT)
The optical and infrared are connected [0.3] 本稿では、物理過程間の微妙な相関を利用して、赤外線(IR) WISE測光を正確に予測するデータ駆動モデルを提案する。
このモデルでは、WISEのすべての測光バンドに対して1ドル(約1万2000円)の精度と、良好な色が得られる。
現状のSED適合法では, 同等の予測ができないことがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:00:01 GMT)
Enhancing Collective Intelligence in Large Language Models Through Emotional Integration [0.3] 本研究では,大規模言語モデル (LLM) への感情的多様性の統合を,集団知能を高めるために検討する。
群衆現象の人間の知恵に触発され、GoogleのGoEmotionsデータセットとローランド適応(LoRA)を用いてDarkIdol-Llama-3.1-8Bモデルを微調整し、感情的に多様な応答をシミュレートした。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:42:48 GMT)
Light drag in an Optomechanical system [0.3] 光学系における光引き抜き効果を初めて示す。
この因子の起源は、光学的に誘起される透明性と結びついた非線形効果から生じる。
光のドラッグをオプトメカニカルシステムで操作し制御する能力は、性能を向上した新しい光学デバイスやシステムの設計に有用かもしれない。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:06:59 GMT)
Less is more? Rewards in RL for Cyber Defence [0.2] 我々は、スパース報酬機能がより効果的なサイバー防衛エージェントの訓練を可能にするかどうかを評価する。
確立されたサイバージムに適応することにより,2つのスパース報酬機構を提案し,評価する。
以上の結果から,スパルス報酬,特に未妥協のネットワーク状態に対する肯定的な強化は,より効果的なサイバー防衛エージェントの訓練を可能にすることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:53:39 GMT)
Leveraging Taxonomy Similarity for Next Activity Prediction in Patient Treatment [0.2] 次活動予測(Next-active-Prediction:NAP)は、医師が治療計画を支援するための有望な手法として用いられる。
患者データの使用は、その知識集約性、高い変動性、医療データの不足など、多くの課題を生んでいる。
本稿では、グラフに符号化された知識を用いて、治療プロセスにおける次の活動の予測を改善し、説明する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:19:17 GMT)
Enhancing Cybersecurity in Critical Infrastructure with LLM-Assisted Explainable IoT Systems [0.2] 本稿では,オートエンコーダを用いた数値異常検出とLarge Language Models(LLM)を併用して,事前処理と解釈性を向上するハイブリッドフレームワークを提案する。
KDDCup99 10%補正データセットの実験結果から,LLM支援前処理パイプラインは異常検出性能を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:53:07 GMT)
Towards Better Open-Ended Text Generation: A Multicriteria Evaluation Framework [0.2] オープンエンドテキスト生成は自然言語処理において顕著な課題となっている。
復号法は、いくつかの指標で優れ、他の指標では性能が劣ることが多い。
本稿では,この多基準フレームワークにおける新たなランキング戦略を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:24:29 GMT)
Augmentation-Based Deep Learning for Identification of Circulating Tumor Cells [0.2] CTCは液体生検において重要なバイオマーカーであり、がん患者の管理に非侵襲的なツールを提供する。
伝統的に、DEPArrayが取得したデジタル画像は手動で解析されるため、プロセスは時間がかかり、変動しがちである。
血液サンプル中の白血球とCTCを区別するディープラーニングに基づく分類パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:39:15 GMT)
Pruning Deep Neural Networks via a Combination of the Marchenko-Pastur Distribution and Regularization [0.2] 視覚変換器(ViT)は、画像分類のためのディープラーニング分野において、強力なモデルのクラスとして登場した。
重みと特異ベクトルのスパーシフィケーションに基づいて事前学習したDNNを刈り取るためのRandom Matrix Theory(RMT)に基づく新しい手法を提案する。
我々は,RTTを用いたプルーニングを用いて,精度1%未満の精度で,VTモデルのパラメータ数を30~50%削減できることを実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:57:19 GMT)
Towards Resilient and Sustainable Global Industrial Systems: An Evolutionary-Based Approach [0.1] 本稿では,産業システムの自動設計における新しい複雑な最適化問題を提案する。
これは、CO2排出量、輸送時間、コストを最小限に抑えるソリューションを見つけることを目的としている。
提案手法は、複雑な製造とサプライチェーンの課題を伴うあらゆる産業事例に適用できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:10:32 GMT)
Federated Learning for Predicting Mild Cognitive Impairment to Dementia Conversion [0.1] 本研究では,認知症変換のための予測モデルを,機密データを共有せずに訓練するために,フェデレートラーニング(FL)を用いたプライバシ向上ソリューションを提案する。
Wesimulated and comparison two network architectures, Peer to Peer (P2P) and client-server, to enable collaborative learning。
その結果,FLは集中型機械学習に匹敵する予測性能を示し,各臨床現場では局所データを共有せずに同様の性能を示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:29:23 GMT)
Replicating Human Social Perception in Generative AI: Evaluating the Valence-Dominance Model [0.1] マルチモーダル生成型AIシステムは、人間の社会的知覚の重要な側面を再現できることを示す。
発見は、AIによる意思決定と人間とAIのインタラクションに関する重要な疑問を提起する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:35:18 GMT)
Impact of Level 2/3 Automated Driving Technology on Road Work Zone Safety [0.1] 本稿では,高速道路の高速作業環境におけるレベル2/3自動走行技術が道路安全に与える影響について検討する。
研究によると、自動走行技術がワークゾーンの安全性に与える影響は複雑である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:26:53 GMT)
Quantum metasurfaces as probes of vacuum particle content [0.1] 原子の2次元サブ波長配列からなる量子ミラー
電磁場真空の絡み合った空間部分領域から粒子含有量を観測するための最初の実用的プラットフォーム。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:04:20 GMT)
VoiceGRPO: Modern MoE Transformers with Group Relative Policy Optimization GRPO for AI Voice Health Care Applications on Voice Pathology Detection [0.1] 本研究は,グループ相対ポリシー最適化(GRPO)を用いたMixture-of-Experts Transformersとして,新しいAI技術を紹介する。
モデル安定性と性能を向上させるため、強化学習にインスパイアされた高度な訓練パラダイムを採用する。
合成音声病理モデルを用いて実験を行った結果,提案モデルでは診断精度,F1スコア,ROC-AUCが有意に向上した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:52:57 GMT)
An Aspect Extraction Framework using Different Embedding Types, Learning Models, and Dependency Structure [0.1] アスペクトベースの感情分析の重要な構成要素はアスペクト抽出である。
本稿では,単語と音声のパート・オブ・音声タグに異なる種類の埋め込みを用いたアスペクト抽出モデルを提案する。
また、文のアスペクト位置をよりよく捉えるために、依存性解析出力に基づく木の位置符号化を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:57:48 GMT)
Mineral segmentation using electron microscope images and spectral sampling through multimodal graph neural networks [0.0] 本稿では,マルチモーダル走査型電子顕微鏡(SEM)画像のデータ融合に基づくセグメント化のための新しいグラフニューラルネットワーク手法を提案する。
以上の結果から,BSE ピクセルの1%に EDS データを提供することで,正確なセグメンテーションが実現できた。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:55:26 GMT)
Incoherent Approximation of Leakage in Quantum Error Correction [0.0] 量子エラー訂正符号は一般に計算部分空間の量子状態遷移(漏れ)を考慮しない。
本稿では,量子チャネル上の部分空間ツイリング近似(STA)を導入し,計算と漏洩部分空間間の不整合を保存する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:47:33 GMT)
nuHOPS: A quantum trajectory method for highly excited environments in non-Markovian open quantum dynamics [0.0] 非マルコフ量子力学に対する純状態階層(HOPS)アプローチの大幅な改善を導入する。
提案手法は, 量子軌道に依存するため, ダイナミクスを効率的に得ることができ, システムサイズも大きい。
キャビティ内で超放射的に崩壊する多くのエミッタのパラダイム的な例としてディックモデルを用いて、その真のパワーを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:44:15 GMT)
Z-basis measurements using mixed parity and direct readout [0.0] スピン量子ビットアーキテクチャにおける一般的な実装は、二重量子ドットに閉じ込められた電荷のパウリ排他に基づく読み出しスキームであり、一方のドットはアンシラ量子ビットとして機能する。
ここでは,3量子スピンレジスタとパウリ排他型リードアウトを用いて,トモグラフィで構築したレジスタ全体のz基底測定を行い,物理的オーバーヘッドを排除した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:33:47 GMT)
Which books do I like? [0.0] ISAACはフィクション読者が文学的好みを認識し、楽しい本を見つけるのを支援するパイプラインである。
ISAACは4つのステップで構成されている: ユーザが書籍のレーティングを提供し、AIエージェントが提供された書籍を調査、注釈付けし、本を楽しむパターンがユーザによってレビューされ、AIエージェントは新しい本を推薦する。
その結果,既存の手法よりもISAACが優れていることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:31:49 GMT)
What is a Digital Twin Anyway? Deriving the Definition for the Built Environment from over 15,000 Scientific Publications [0.0] この研究は、52人の専門家を含む専門家による調査から得られた知見と比較した。
テキスト周波数分析とN-gram解析を用いてDigital Twinsの主要成分を抽出した。
DTコンポーネントの解析により,HPRT(High-Performance Real-Time)DTとLTDS(Long-Term Decision Support)DT(Long-Term Decision Support)DTの2種類のDTタイプが明らかになった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:04:24 GMT)
Weak continuous measurements require more work than strong ones [0.0] 我々は、非理想的(弱または非効率)な測定を捉えることができる量子計測プロセスのモデルを分析する。
意外なことに、射影測定に向かって収束するシーケンスは、等価な強度測定よりも作業コストがはるかに大きいことが判明した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:30:38 GMT)
Variance-Aware Loss Scheduling for Multimodal Alignment in Low-Data Settings [0.0] 画像テキストアライメントのための視覚言語モデルのトレーニングは通常、堅牢なパフォーマンスを達成するために大きなデータセットを必要とする。
本稿では,モデルのアライメント予測における統計的変動(不確実性)に基づいて,コントラスト損失の重み付けを動的に調整する分散型損失スケジューリング手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:46:08 GMT)
Universal Narrative Model: an Author-centric Storytelling Framework for Generative AI [0.0] 著者を将来の物語デザインの中心に配置するオープンスタンダードであるユニバーサル・ナラティブ・モデル(UNM)を提案する。
客観的な物語モデルに従って著者の意図を符号化することにより、UNMは物語の移植性と、生成システムに対する意図に基づく制約を可能にする。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:29:15 GMT)
Towards an Emotion-Aware Metaverse: A Human-Centric Shipboard Fire Drill Simulator [0.0] 本稿では,船舶の緊急時に乗組員を準備するために設計された,感情を意識したMetaverseアプリケーション:VR(Virtual Reality)消火訓練シミュレータについて述べる。
シミュレータはリアルタイムで感情を検出し、ストレス下での訓練者の反応を評価し、学習結果を改善する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:58:53 GMT)
Time-bin Phase and Polarization based QKD systems performance analysis over 16Km Aerial Fibers [0.0] 地上14Kmと空中16Kmの混合繊維上での時間ビン位相と分極に基づくQKDシステムの性能を,プラグアンドプレイの商用QKDシステムを用いて解析した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:12:04 GMT)
Tight and self-testing multipartite quantum Bell inequalities from the renormalization group [0.0] 我々は'tight connectors'の概念を提案し、いくつかの単純な規則に従って収縮すると、強量子ベルの不等式が生じる。
我々は、コレレータ形式の量子ベル不等式を$N$-partite で生成する、厳密で完全自己テストコネクタの大規模な解析ファミリを提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:20:56 GMT)
Three tiers of computation in transformers and in brain architectures [0.0] ヒトおよびトランスフォーマーベース言語モデル(LM)における能力の出現を示す。
人間は、算術的または論理的推論タスクを実行するために、言語を熱心に処理するが、特定の訓練を必要とする。
LMは以前のシステムにはない言語能力を持っているが、論理処理に苦慮している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:47:09 GMT)
Theory of fractional quantum Hall liquids coupled to quantum light and emergent graviton-polaritons [0.0] 有限電場勾配を持つ単一モードキャビティにおける$nu=1/3$ラウリン状態のダイナミクスについて検討する。
FQH状態の位相的シグネチャは、非局所変調空洞真空変動に対して頑健である。
FQH相の中で低エネルギー励起スペクトルを探索することにより、新しい中性準粒子であるグラビトン・ポラリトンを同定する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:10:44 GMT)
The impact of AI and peer feedback on research writing skills: a study using the CGScholar platform among Kazakhstani scholars [0.0] 本研究は、CGScholarプラットフォームを用いたカザフスタンの学術著作開発におけるAIとピアフィードバックの影響について研究する。
この研究は、AIツールとピアフィードバックプロセスへの親しみが参加者のオープンネスにどのように影響するかを調べることを目的としている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:34:25 GMT)
The Serendipity of Claude AI: Case of the 13 Low-Resource National Languages of Mali [0.0] この研究は、マリの13の国語でクロードAIの翻訳性能を評価した。
この研究によると、Claude AIは、非常に控えめな言語リソースを持つ言語に対して堅牢に機能している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:55:47 GMT)
The Dirac equation in General Relativity and the 3+1 formalism [0.0] 一般相対性理論におけるディラック方程式について概説する。
一般相対性理論の3+1形式の場合、ディラック方程式とその関連する応力-エネルギーテンソルの形式を導出する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:32:46 GMT)
Temporal CW polarization-tomography of photon pairs from the biexciton radiative cascade: theory and experiment [0.0] 半導体量子ドットからのバイエキシトン・エキシトン放射カスケード中に放出される光子対の分極の時間的相関について検討した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:49:49 GMT)
Synthetic Data Augmentation for Enhancing Harmful Algal Bloom Detection with Machine Learning [0.0] 有害なアルガルブルーム(HAB)は水生生物や公衆衛生に深刻な脅威を与え、世界的な経済的損失をもたらしている。
本研究では,HABモニタリングシステムを強化するための合成データ拡張法について検討した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:50:04 GMT)
States Violating Both Locality and Noncontextuality Inequalities in Quantum Theory [0.0] CHSHの不等式は、量子論における局所性をテストするために用いられる。
KCBSの不等式は、量子論における非文脈性をテストするために用いられる。
特定の量子状態は、これらの不等式を個々に違反することが知られている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:04:12 GMT)
Spatial correlations and entanglement in a hybrid system of N fermion pairs with harmonic interaction [0.0] 本研究は,2種の相互作用種の調和性に制限されたフェルミオンの対をN$で構成したシステムの異なる二分割にまたがる基底状態の絡み合いについて検討した。
強い誘惑的な状態のフェルミオンは閉じ込められた領域に局在する傾向にあり、一方、パウリの排除は同一粒子間の空間的反発を誘導する。
強い反発状態において、システムは2つの空間的に異なる領域に相分離する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:18:37 GMT)
Solving Combinatorial Optimization Problems with a Block Encoding Quantum Optimizer [0.0] Block ENcoding Quantum (BEQO) は、ブロック符号化を用いてコスト関数を表現するハイブリッド量子ソルバである。
以上の結果から,BENQOはQAOAよりも有意に優れた性能を示し,VQEと各種のパフォーマンス指標を比較検討した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:34:11 GMT)
Simulation-Based Performance Evaluation of 3D Object Detection Methods with Deep Learning for a LiDAR Point Cloud Dataset in a SOTIF-related Use Case [0.0] Intended Functionality (SOTIF) の安全性は、センサー性能の限界とディープラーニングに基づく物体検出の欠如に対処する。
本稿では,LiDARポイントクラウドデータセット上での3次元オブジェクト検出手法の適用性と性能評価について検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:32:32 GMT)
Simulation-Based Application of Safety of The Intended Functionality to Mitigate Foreseeable Misuse in Automated Driving Systems [0.0] ADS(Automated Driving Systems)の開発は、交通産業に革命をもたらす可能性がある。
重要な課題の1つは、ADSが人間のドライバーによる予測ミスス(FM)の場合に安全であることを保証することである。
人間ドライバーによるFMは、ドライバーがADSの意図した機能を誤って解釈し、有害な行動を引き起こす潜在的な運転シナリオを指す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:16:49 GMT)
Scaling Crowdsourced Election Monitoring: Construction and Evaluation of Classification Models for Multilingual and Cross-Domain Classification Settings [0.0] 本稿では,まず情報的報告を識別し,それらを異なる情報タイプに分類する2段階の分類手法を提案する。
我々はXLM-RoBERTaのような多言語変換モデルとSBERTのような多言語埋め込みを用いた分類実験を行う。
その結果,F1スコアは0ショットで59%,少数ショットで63%であった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:17:18 GMT)
Sarcasm Detection as a Catalyst: Improving Stance Detection with Cross-Target Capabilities [0.0] 本論文は,スタンス検出(SD)のための皮肉を用いている。
また、Cross-Target SDを実行することで、新たなターゲット上でSDモデルをトレーニングするためのアノテートデータ不足にも対処している。
提案手法では,BERTモデルとRoBERTaモデルを微調整し,さらにディープラーニング層を結合する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:27:16 GMT)
Role of Databases in GenAI Applications [0.0] Generative AI(GenAI)は、インテリジェントなコンテンツ生成、自動化、意思決定を可能にすることで、産業を変革している。
本稿では,GenAIにおけるデータベースの重要性を考察し,適切なデータベースアーキテクチャを選択することの重要性を強調した。
データベースの役割を会話コンテキスト(キーバリュー/ドキュメントデータベース)、状況コンテキスト(リレーショナルデータベース/データレイクハウス)、意味コンテキスト(ベクトルデータベース)に分類する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:32:21 GMT)
Rice Grain Size Measurement using Image Processing [0.0] 米粒の質は、その大きさと黒さから決定できる。
米粒径を測る従来の手法は手作業による検査である。
本研究では,画像処理に基づくアプローチを提案し,展開した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 06:16:13 GMT)
Rethinking Deep Clustering Paradigms: Self-Supervision Is All You Need [0.0] 自己スーパービジョンと擬似スーパービジョンのトレードオフは、3つの主要な問題を引き起こす可能性がある。
共同トレーニングは特徴ランダム性と特徴ドリフトを引き起こすが、独立したトレーニングは特徴ランダム性と特徴ツイストを引き起こす。
疑似スーパービジョンに代わる新たな戦略を,第2ラウンドの自己スーパービジョントレーニングに置き換えた新しいパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:44:35 GMT)
Restoring thermalization in long-range quantum magnets with staggered magnetic fields [0.0] 強遠距離反強磁性体にスタッガー磁場を印加することで,初期状態の大規模化に寄与することを示す。
自己整合平均場理論と正確な対角化を用いて、エネルギースペクトルは離散部分空間からなるが、集合的に密度スペクトルを形成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:18:17 GMT)
Reflecting on Potentials for Post-Growth Social Media Platform Design [0.0] 私は、成長が現代のソーシャルメディアプラットフォーム全体のデザインにどのように影響するかを概説する。
次に、プラットフォーム設計にポスト成長レンズを適用することがなぜ生産的になるのかを探求します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:17:47 GMT)
Realization of a crosstalk-free two-ion node for long-distance quantum networking [0.0] トラップされた原子イオンは、量子リピータノードを構築するための主要な物理プラットフォームの一つである。
長距離トラップイオン量子ネットワークでは、クロストークのないデュアルタイプの量子ビットを持つことが不可欠である。
本稿では,テレコム互換かつクロストークフリーな量子ネットワークノードの試作実装について報告する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:29:51 GMT)
RTFusion: A depth estimation network based on multimodal fusion in challenging scenarios [0.0] 本稿では,深度推定精度とロバスト性を向上させるマルチモーダル深度推定モデルRTFusionを提案する。
このモデルは、相互補完的アライメント(MCA)モジュールからなる独自の融合機構であるEGFusionを組み込んでいる。
MS2およびViViD++データセットの実験では、提案モデルが高品質な深度マップを一貫して生成していることが示されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:35:14 GMT)
Quantum-limited amplification without instability [0.0] 量子制限された大利得増幅を動的不安定性に近づかなくても達成できる代替の一般戦略を考える。
我々は、伝送において理想的な単一モードのスキューズ操作を実現するための、特定の実現に焦点を当てる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:28:58 GMT)
Quantum-Inspired Privacy-Preserving Federated Learning Framework for Secure Dementia Classification [0.0] 本稿では,認知症分類のための量子インスピレーション暗号技術とフェデレーション学習を統合した新しいフレームワークを提案する。
このフレームワークは、低所得国と中所得国でAI駆動型認知症診断へのアクセスを民主化する上で重要な意味を持つ。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:49:31 GMT)
Quantum of action in entangled relativity [0.0] 絡み合った相対性理論は一般相対性理論よりも普遍次元定数や単位の点で経済的である。
特に、$hbar$は、このフレームワークにおいて$G$に比例する。
我々は、太陽系と中性子星において、$hbar$と$G$の変動レベルを評価する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:48:41 GMT)
Quantum key distribution rates from non-symmetric conic optimization [0.0] これは、凸非線型函数、すなわち(量子)相対エントロピーの最小化に依存する、難しい最適化問題である。
標準円錐最適化技術は、非対称円錐であるため、相対エントロピーコーンを扱うことができず、標準アルゴリズムは対称錐しか扱えない。
ここでは、このアルゴリズムを鍵レートの計算問題に適用し、それらを下げるための効率的な手法を得る。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:59:15 GMT)
Quantum encoder for fixed Hamming-weight subspaces [0.0] 固定ハミング重み$k$の部分空間に$d=binomnk$valuedの実データベクトルまたは複素データベクトルの正確な$n$-qubit計算基底振幅エンコーダを提示する。
本稿では,粒子弦対称性を含む問題に対する変分量子アルゴリズムの性能向上について述べる。
本研究は,量子化学,量子機械学習,制約付き$k$最適化などの分野に応用可能な量子データ圧縮のための汎用的なフレームワークを構成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:02:29 GMT)
Quantum convolutional neural networks for jet images classification [0.0] 本稿では,高エネルギー物理学における量子機械学習の性能について述べる。
このタスクには量子畳み込みニューラルネットワーク(QCNN)を使用し、その性能を古典的なノイズレスシミュレータを用いてCNNと比較する。
以上の結果から,適切な設定のQCNNの方が,CNNよりも優れた性能を示す傾向が示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:51:45 GMT)
Quantum computation with indefinite causal structures [0.0] プロセス行列は P-CTC の線形特定の場合に対応し,計算能力は P-CTC よりも上界にあることを示す。
さらに、因果不等式を犯すことができるが、しかしながら、一定のオーバーヘッドしか持たない因果順序量子回路でシミュレートできる過程の族を示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:17:13 GMT)
Quantum Magic in Quantum Electrodynamics [0.0] 非安定剤性(Non-stabilizerness) -- マジック -- は、古典的コンピュータに対する特定の量子状態の計算上の優位性を指す。
電子とミューオンを含む2-to-2散乱プロセスを用いて,量子電磁力学におけるマジック状態の生成について検討した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:32:06 GMT)
Quantum Electrodynamics of graphene Landau levels in a deep-subwavelength hyperbolic phonon polariton cavity [0.0] 本研究では, グラフェンランダウの量子電気力学に関する理論的枠組みを構築した。
ポーラリトンの発生について論じ、共鳴量子真空効果の寄与を純粋に静電相互作用の寄与と区別する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:24:06 GMT)
Quantification of Tenseness in English and Japanese Tense-Lax Vowels: A Lagrangian Model with Indicator $θ_1$ and Force of Tenseness Ftense(t) [0.0] 閉母音の調音における舌と顎の動的相互作用を記述するためのラグランジアン方程式に基づくモデルを提案する。
このモデルにより, 音韻・音韻研究における重要な要素として, さらなる探索が期待できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:22:33 GMT)
Protocols for inter-module two-qubit gates mediated by time-bin encoded photons [0.0] 本稿では,Fock-state または Time-bin qubits を介する長距離2量子ゲートの実装プロトコルを提案する。
時間ビン量子ビットの損失は隠蔽されているだけでなく、およそバックアクションフリーであることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:13:28 GMT)
Prog-QAOA: Framework for resource-efficient quantum optimization through classical programs [0.0] 現在の量子最適化アルゴリズムでは、元の問題を二進最適化問題として表現し、量子デバイスに適した等価コストハミルトニアンに変換する必要がある。
目的関数を計算し、制約を認証するための古典的プログラムを設計し、後に量子回路にコンパイルする。
我々は、このアイデアをトラベリングセールスマン問題やMax-K$-Cutといった最適化タスクに活用し、関連するすべてのコスト対策に関して最適に近い回路を得る。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:10:55 GMT)
Privacy is All You Need: Revolutionizing Wearable Health Data with Advanced PETs [0.0] 本稿では,ウェアラブルデバイスのためのプライバシ・エンハンシング・テクノロジー(PET)フレームワークを提案する。
フェデレートされた学習、軽量な暗号手法、選択的にデプロイされたブロックチェーン技術を統合する。
当社のフレームワークは、データユーティリティとパフォーマンスを維持しながら、プライバシのリスクを最大70%削減します。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 12:01:22 GMT)
Predicting Space Tourism Demand Using Explainable AI [0.0] 本稿では,宇宙旅行需要予測の課題に対処するための,説明可能な信頼性の高い人工知能フレームワークを提案する。
本研究では,データにおける広範囲な依存関係を学習可能な,SpaceNetという新しい機械学習ネットワークを開発した。
調査の結果,旅行価格,年齢,年収,性別,死亡確率は,旅行希望の有無を決定する上で重要な特徴であることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:18:31 GMT)
Performance Comparison of Large Language Models on Advanced Calculus Problems [0.0] この研究は、ChatGPT 4o、1.5 Proを使ったGemini Advanced、Copilot Pro、Claude 3.5 Sonnet、Meta AI、Mistral AI、Perplexityなど、モデルの正確性、信頼性、問題解決能力を評価することを目的としている。
結果は、モデルのパフォーマンスにおける重要なトレンドとパターンを強調し、その長所と短所の両方を明らかにします。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:26:12 GMT)
Optimizing Gate Decomposition for High-Level Quantum Programming [0.0] マルチコントロール量子ゲートは、高レベルの量子プログラミングにおいて自然に発生する。
本稿では,多制御量子ゲートを最適化する新しい手法を提案する。
我々はCNOTゲート数を大幅に削減した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:20:55 GMT)
Optimal Performance of an Asymmetric Quantum Harmonic Otto Engine and Refrigerator [0.0] オットーサイクルの2つの断熱過程の間に生じる非対称性について検討し、急激な膨張と急激な圧縮の事例に着目した。
Omega関数を用いた非対称オットーサイクルの性能効率と係数を導出する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:45:55 GMT)
Non-equilibrium thermodynamics of precision through a quantum-centric computation [0.0] TURは、熱力学的量で低いゆらぎを達成するには、最小のエントロピー生成が必要であることを示した。
時間依存駆動プロトコルに基づく横フィールドIsingモデルでTURをシミュレートする。
線形応答系内の作業統計における量子シグネチャを同定し,高温限界におけるTUR飽和を観測する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:55:47 GMT)
Non-Gaussianities in Collider Metric Binning [0.0] 2つの事象間の距離を厳密に定義するための計量は、粒子コライダー物理学のデータ空間多様体の性質を研究するために用いられる。
距離分布のビン・バイ・ビン統計の非ガウス性に関するロバストな測度を定義する。
我々は、量子色力学からのジェットのシミュレーションデータにおいて、パルトン-ハドロン遷移に対する感度を示し、そのエネルギーが増加するにつれて事象の多様体は拡張対称性を享受することを示した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:00:00 GMT)
Noetherian Conservation Laws for Photons in Curved Spacetime [0.0] 対称を持たない曲面背景上の単一光子に対してローレンツ共変双弦波関数と波動方程式を定式化する。
この方程式に対する10次元保存則の存在を示し、これらの保存則の背景8が大域的,ゲージ不変な ADM 様の量であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:52:21 GMT)
Neural quantum kernels: training quantum kernels with quantum neural networks [0.0] 本稿では,量子カーネル構築のための量子ニューラルネットワークのトレーニングを提案する。
我々は、ニューラルネットワークを構築するためのいくつかの戦略を提案し、量子ニューラルネットワーク(QNN)をトレーニングするためのスケーラブルな方法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:44:40 GMT)
Neural Models of Task Adaptation: A Tutorial on Spiking Networks for Executive Control [0.0] このチュートリアルでは、タスクスイッチングのダイナミクスをシミュレートするスパイキングニューラルネットワーク(SNN)を構築するためのステップバイステップのアプローチを示す。
このモデルには、横方向の抑制、適応的なシナプス重み、生理的関連範囲における正確なパラメータ化など、生物学的に現実的な特徴が組み込まれている。
このチュートリアルに従うことで、認知過程や神経適応を研究するための生物学的にインスパイアされたSNNモデルを開発、拡張することができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:44:34 GMT)
Multimodal Stock Price Prediction: A Case Study of the Russian Securities Market [0.0] 本稿では,キャンドルスティック時系列とニュースフローデータを組み合わせたマルチモーダルアプローチを用いて,金融資産価格の予測問題に対処する。
モスクワ証券取引所で取引されたロシア株176株と、ロシアの金融ニュース記事79,555株の時系列を含む、ユニークなデータセットが収集された。
実験の結果, テキストのモダリティを組み込むことでMAPEの値が55%減少した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:20:32 GMT)
Multilayered Aspects of Casimir Energy [0.0] 平面並列多層構造に対するカシミールエネルギーとカシミール力を計算するためのロバストな定式化を与える。
我々の式は、キラル媒質やワイル半金属など、より一般的な状況に適用できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:35:18 GMT)
More than Memes: A Multimodal Topic Modeling Approach to Conspiracy Theories on Telegram [0.0] ドイツ語のテレグラムチャンネルにおける陰謀論の分析にマルチモーダル・トピック・モデリングを適用した。
我々は、モダリティを横断するトピックの対称性と交叉を分析することによって、一様および多様のトピックモデルに対する洞察を提供する。
本稿では,陰謀論のコミュニケーションにおけるテキスト・ビジュアル・ディスキュレイティブ・ストラテジーの分析のための概念的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:55:52 GMT)
Medusa 84 SiH -- A novel high Selectivity Electron Beam Resist for Diamond Quantum Technologies [0.0] 本稿では,アレッシストGmbH(ドイツ)によるMedusa 84 SiHの新規電子ビームレジストによる単結晶ダイヤモンドのナノ構造解析を行った。
ダイヤモンドエッチングの最小選択性は6$pm$1である。
粘着促進シリコン層を用いると、製造歩留まりは最大98%となる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:50:00 GMT)
Measuring and identifying factors of individuals' trust in Large Language Models [0.0] LLM(Large Language Models)は、人間のように見える会話の交換を行う。
LLMに対する個人の信頼度を測定する新しいフレームワークとして、TILLMI(Trust-In-LLMs Index)を紹介した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:52:43 GMT)
Local analysis of a single impurity on a graphene Josephson Junction [0.0] 本研究では,短距離不純物が短距離グラフェンジョセフソン接合の電子系に及ぼす影響について検討する。
Dirac-Bogoliubov-De Gennes 法では局所密度状態を分析し,その部分ギャップエネルギー依存性により弾性散乱過程と非弾性散乱過程の区別が可能となる。
状態の局所密度の空間的依存性は、サブギャップ不純物誘起境界状態をもたらす顕微鏡過程の感度プローブであることが観察された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:38:39 GMT)
Limits of nonlinear and dispersive fiber propagation for photonic extreme learning [0.0] スペクトル符号化, 読み出し, ノイズのパラメータとともに, 伝搬力学の精度がどう影響するかを考察する。
異常および正常な分散状態において, それぞれ91%以上, 93%以上の検定精度が観察された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:25:58 GMT)
Leveraging Large Language Models to Develop Heuristics for Emerging Optimization Problems [0.0] 組合せ最適化問題は、しばしば効率的な解を生成するアルゴリズムに依存する。
人工知能の最近の進歩は、進化の枠組みを通じて生成を自動化する可能性を実証している。
本研究では,問題固有の記述を組み込んだコンテキスト進化型ヒューリスティックスフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:22:49 GMT)
Learning to learn with an evolutionary strategy applied to variational quantum algorithms [0.0] 変分量子アルゴリズム(VQA)は、コスト関数を最小化するために古典的手法を用いて最適化されたパラメータ化量子回路を用いる。
LLES(Learning to Learn with an Evolutionary Strategy)という新しい最適化手法を導入する。
LLESは最適化を学習問題として扱い、繰り返しニューラルネットワークを用いてVQAパラメータを反復的に提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:54:08 GMT)
LEWIS (LayEr WIse Sparsity) -- A Training Free Guided Model Merging Approach [0.0] LEWIS(Layer Wise Sparsity)は、ガイド付きモデルマージフレームワークである。
階層的なタスク固有の知識を保持することによって、既存のマージ手法をガイドする。
コード命令追従モデルと数解モデルの性能改善によるLEWISの有効性を実証した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:09:59 GMT)
LADDER: Self-Improving LLMs Through Recursive Problem Decomposition [0.0] LADDERは、大規模言語モデルが問題解決能力を自律的に改善できるフレームワークである。
数学的統合の課題において, LADDERの有効性を実証する。
また、TTRLを導入し、推論時にテスト問題の変種について強化学習を行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:50:24 GMT)
IoT Integration Protocol for Enhanced Hospital Care [0.0] 病院医療強化のためのIoT統合プロトコルについて紹介する。
このプロトコルは、IoTデバイスの可能性を活用して、患者の監視を最適化し、リモートケアを有効にし、臨床的意思決定をサポートすることを目的としている。
IoTを医療計画や患者のケア計画にシームレスに統合することで、病院は患者中心のケアとリアルタイムデータ洞察のより高いレベルを達成することができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:07:48 GMT)
Introduction to Artificial Consciousness: History, Current Trends and Ethical Challenges [0.0] 人工意識(AC)は近年人気を博している。
この研究は、ACの主なトピックと現在のトレンドを概観する。
主な結論は、ACは科学的な進歩には不可欠であり、避けられないように見えるが、この革新的な研究経路の遠い影響に対処するためには、真剣な努力が必要であるということである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 09:34:36 GMT)
Intermediate-Task Transfer Learning: Leveraging Sarcasm Detection for Stance Detection [0.0] ソーシャルメディア上のスタンス検出は、社会的ビジネスや政治的応用に影響を及ぼす顕著な関心領域として浮上している。
サーカディック言語とフィギュラティブ言語が組み込まれていることは、SDモデルの性能に大きな影響を及ぼす。
本論文は,SDに適したSarcasm Detection Inter-task Transfer Learningを用いてこの問題に対処する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:30:53 GMT)
Impact of decoherence on the fidelity of quantum gates leaving the computational subspace [0.0] 一般マルチビット演算の平均ゲート忠実度を、散逸率と対応するリンドブラッドジャンプ演算子の観点から示す。
これらの結果は、量子コンピュータをスケールアップしながら量子ゲートのエラー予算を理解するのに有用である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:01:47 GMT)
ILLC: Iterative Layer-by-Layer Compression for Enhancing Structural Faithfulness in SpArX [0.0] 議論的なXAIアプローチは、隠れたノードを議論として解釈することで、より透明な方法でディープニューラルネットワークの内部推論プロセスを表現するために提案されている。
既存の圧縮手法は全てのレイヤを一度に単純化し、高い累積情報損失をもたらす。
本稿では,各層を別々に圧縮し,次層の低減誤差を即時補償する反復層間圧縮手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:43:49 GMT)
Human-in-the-loop Reasoning For Traffic Sign Detection: Collaborative Approach Yolo With Video-llava [0.0] 本稿では,映像解析と推論を組み合わせる手法を提案する。
ビデオラバの誘導と推論能力により,YOLOの信号検出能力が向上する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:26:13 GMT)
Human Preferences for Constructive Interactions in Language Model Alignment [0.0] 構築的相互作用に関連する言語的属性が、AIの訓練に使用される人間の嗜好データにどのように反映されるかを検討した。
その結果,利用者は個人のストーリーテリングにおける高い評価を拒絶しながら,不適切な回答を常に好んでいることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:08:41 GMT)
Hopfield Networks Meet Big Data: A Brain-Inspired Deep Learning Framework for Semantic Data Linking [0.0] 本稿では,機械学習をホップフィールドネットワークと統合し,データセット間のセマンティック関連属性を識別・リンクする,脳にインスパイアされた分散認知フレームワークを提案する。
我々のアーキテクチャは Hadoop Distributed File System (HDFS) でMapReduce上に実装されており、深いホップフィールドネットワークを連想記憶機構として活用している。
実験により、ホップフィールドメモリの連想インプリントは時間とともに強化され、関連するデータセットが文脈的に意味のあるままであることが示されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:53:22 GMT)
Heisenberg and Heisenberg-Like Representations via Hilbert Space Bundle Geometry in the Non-Hermitian Regime [0.0] シュル「オーディンガー」表現とハイゼンベルク表現の同値性を示す。
また、一般化ヴィエルベイン形式主義に基づくハイゼンベルク的な表現も提示する。
このアプローチは、動的メートル法を持つレジームや、時間依存ハミルトニアンによって支配されるシステムにまで拡張される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:10:07 GMT)
HARMONIC: Cognitive and Control Collaboration in Human-Robotic Teams [0.0] 本稿では,人間ロボットチーム(HRT)に適用された汎用ロボット制御システムと,OntoAgent認知フレームワークを統合した認知ロボティックアーキテクチャであるHARMONICを紹介する。
また,HRTにおける協調作業に必要なメタ認知,自然言語コミュニケーション,説明可能性機能を組み込んだロボットの認知戦略を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 03:08:12 GMT)
Graph-Aware Isomorphic Attention for Adaptive Dynamics in Transformers [0.0] 変換器の注意機構をグラフ演算として再構成する。
スパース GIN-Attention はスパース GIN を用いた微調整手法である。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:19:16 GMT)
Graph-Augmented LSTM for Forecasting Sparse Anomalies in Graph-Structured Time Series [0.0] 本稿では,時系列間の関係グラフをLSTM予測モデルに明示的に統合するグラフ拡張時系列予測手法を提案する。
我々は,Yahoo Webscope S5 異常データセットとMETR-LAトラフィックセンサネットワークの2つのベンチマークデータセットに対するアプローチを評価する。
その結果,F1スコアは最良基準値に対して最大10%向上した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:37:52 GMT)
Genuine Quantum effects in Dicke-type Models at large atom numbers [0.0] 我々は、バランスのとれた非バランスなDickeモデルにおいて、真の量子効果の発生と平均場物理学を超えて検討する。
我々は、新しい開系力学法を用いて、大きいが有限の$N$で生き残る量子効果を示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:19:52 GMT)
Generalized Uncertainty Principle For Quantum Dynamics [0.0] 我々は、伝統的な限界を広げるハイゼンベルクの不確実性原理の拡張を導入する。
我々は観測対象の同時精度と変化率に限界を定めている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:03:31 GMT)
Find Matching Faces Based On Face Parameters [0.0] ユーザは、望むパートナーで望む顔パラメータを対話的に選択できる。
Jeevansathi.comからダウンロードされた画像とともに生成された画像は、顔検出および特徴抽出モデルにより処理される。
生成した画像のベクトル埋め込みと記憶されたベクトル埋め込みとの間に類似性探索を行う。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:50:28 GMT)
Fault-Tolerant Qudit Gate Optimization in Solid-State Quantum Memory [0.0] 本研究は、153Eu:Y2SiO5における高次元キューディットメモリの枠組みを示す。
我々は,固体量子メモリに最適化されたキューディット誤り訂正方式を開発した。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:06:39 GMT)
Entanglement generation and scaling from noisy quenches across a quantum critical point [0.0] 逆場イジング鎖の絡み合いの力学に及ぼす雑音の影響について検討する。
その結果, クエンチは近傍と隣り合うスピンの絡み合いを生じ, ノイズは絡み合いの量を減少させることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:19:23 GMT)
Enhancing the Performance of Quantum Neutral-Atom-Assisted Benders Decomposition [0.0] 本稿では、混合整数線形プログラム(MILP)を解くためのハイブリッドベンダー分解フレームワークについて、これまでの研究の強化について述べる。
マスター問題は、擬似非拘束バイナリ最適化(QUBO)モデルとして再構成され、自動変換技術を用いて中性原子量子プロセッサ上で解決される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:02:06 GMT)
English K_Quantization of LLMs Does Not Disproportionately Diminish Multilingual Performance [0.0] 本稿では,多言語のパフォーマンスを犠牲にして,英語タスクのパフォーマンスが維持されたかどうかを考察する。
k_quantizationに関するすべての実験は、重要でない結果を得た。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:26:59 GMT)
Dynamics in Hamiltonian Lattice Gauge Theory: Approaching the Continuum Limit with Partitionings of SU$(2)$ [0.0] 系の物理状態に投影する有限要素法に基づいてペナルティ項を定義する方法を示す。
また、このフレームワークでは、一定のコストで$gto0$の制限がアプローチ可能であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:20:08 GMT)
Dynamic Scheduling of a Multiclass Queue in the Halfin-Whitt Regime: A Computational Approach for High-Dimensional Problems [0.0] コールセンタのマルチクラス待ち行列モデルについて検討する。
マネジャーは、保有コストと有限地平線上の放棄コストの予想総量を最小化しようと試みている。
本稿では,元来のコールセンタースケジューリング問題に対するポリシーを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:24:01 GMT)
Domain Consistent Industrial Decarbonisation of Global Coal Power Plants [0.0] 機械学習と最適化技術(MLOPT)は、産業システムの脱炭を加速する大きな可能性を秘めている。
しかし、産業環境におけるMLOPTの実践的応用は、ドメインコンプライアンスの欠如とシステム固有の一貫性の欠如によってしばしば妨げられる。
本稿では,ドメインの専門知識とデータ駆動手法を統合したHuman-in-the-loop(HITL)制約に基づく最適化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:00:39 GMT)
Directly Follows Graphs Go Predictive Process Monitoring With Graph Neural Networks [0.0] 本研究では,予測プロセス監視(PPM)の代替手法について検討する。
各プロセスをDFG(Direct-Follows-graph)表現に変換することで,予測タスクにグラフニューラルネットワーク(GNN)を適用することが可能になる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 05:30:26 GMT)
Dirac Equation Solution with Generalized tanh-Shaped Hyperbolic Potential: Application to Charmonium and Bottomonium Mass Spectra [0.0] 一般化されたタンプ形双曲ポテンシャルにおけるディラック方程式の解析解を提案する。
本研究はGTHPを重クォーコニウム系を記述するための強力なツールとして検証した。
この研究は、複雑な相互作用を持つフェルミオン系の研究の足掛かりとなる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:34:55 GMT)
Digital Divides in Scene Recognition: Uncovering Socioeconomic Biases in Deep Learning Systems [0.0] シーン分類における深部畳み込みニューラルネットワーク(dCNN)のバイアスについて検討する。
私たちは、ユーザー投稿のホーム写真やAirbnbのリスティングなど、グローバルおよび米国のソースから100万近い画像を使用します。
分析の結果,事前訓練したdCNNでは分類精度が低く,分類信頼性が低く,攻撃的なラベルを割り当てる傾向が高かった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 21:31:31 GMT)
Dependence of Krylov complexity on the initial operator and state [0.0] この記事では、クリロフ複雑性力学と初期作用素あるいは状態の間の関係を明らかにする。
クリロフ複雑性は、ハミルトニアンの固有基底における初期条件の逆参加比(IPR)に単調に依存する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:24:27 GMT)
Deictic Codes, Demonstratives, and Reference: A Step Toward Solving the Grounding Problem [0.0] 参照修正のプロセスはボトムアップで非概念的でなければならないので、概念的内容の輪を破り、世界に触れることができます。
我々は、我々のアカウントがパットナムとクリプキの「新しい」参照に関する業績に関する基本的な洞察を捉えていると主張している。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 13:34:49 GMT)
DeepGrav: Anomalous Gravitational-Wave Detection Through Deep Latent Features [0.0] この研究は、重力波異常検出のための新しい深層学習に基づくアプローチを導入している。
ResNetにインスパイアされた畳み込みニューラルネットワークアーキテクチャを使用している。
NSF HDR A3D3: Detecting Anomalous Gravitational Wave Signals competition。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:14:22 GMT)
Deep Learning without Global Optimization by Random Fourier Neural Networks [0.0] 本稿では、ランダムな複雑な指数関数活性化関数を利用するディープニューラルネットワークの新しいトレーニングアルゴリズムを提案する。
提案手法では,マルコフ連鎖モンテカルロサンプリング法を用いてネットワーク層を反復的に訓練する。
複雑な指数的活性化関数を持つ残留ネットワークの理論的近似速度を一貫して達成する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:01:35 GMT)
Deep Causal Behavioral Policy Learning: Applications to Healthcare [0.0] 多様な非ランダム化医療環境におけるダイナミックな臨床行動体制を研究するための深層学習に基づくアプローチを提案する。
提案手法は,ディープラーニングアルゴリズムを用いて,高次元臨床行動経路の分布を学習する。
LCBMを用いて学習した行動政策の新たな解釈として,患者の治療に使用される複雑で暗黙的な知識を効率的に符号化する手法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:24:58 GMT)
Data-driven identification of nonlinear dynamical systems with LSTM autoencoders and Normalizing Flows [0.0] 本研究では,システム同定のための深層学習に基づく高度な非線形手法を提案する。
ダッフィング系とローレンツ系と,シリンダー上の流れや2次元蓋駆動キャビティ問題などの流体流について考察する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:58:59 GMT)
Data augmentation with automated machine learning: approaches and performance comparison with classical data augmentation methods [0.0] 最先端のアプローチは、自動化機械学習(AutoML)の原則にますます依存している。
本稿では,AutoMLに基づくデータ拡張技術に関する総合的な調査を紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 22:04:18 GMT)
DO-IQS: Dynamics-Aware Offline Inverse Q-Learning for Optimal Stopping with Unknown Gain Functions [0.0] Inverse Optimal Stopping (IOS) problem, based on the stop expert trajectories, is aimed to recovery the optimal stop region through continuation and stop gain function approximation。
現在の最先端の逆強化学習法は、最適な停止問題によって生じる特定の課題を考慮できない。
これらの課題は、最適停止のためのDynamics-Aware Offline Inverse Q-Learning(DO-IQS)によって解決される。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:01:17 GMT)
Counterdiabatic Driving with Performance Guarantees [0.0] 変分非依存型CD拡張法の提案と解析を行う。
拡張順序で指数関数的に収束することを示す。
特に、量子速度制限によって決定される時間は、所望の基底状態を作成するのに十分であることを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:24:41 GMT)
Chaos destroys the excited state quantum phase transition of the Kerr parametric oscillator [0.0] 外部駆動とシステムの非線形性の間の相互作用から生じるカオスが、励起状態量子相転移(ESQPT)を破壊することを示す。
本研究は, より大きな非線形性を持つ新しいパラメトリック発振器の設計における理論モデルの解析の重要性を実証するものである。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:53:29 GMT)
Censor Resistant Instruction Independent Obfuscation for Multiple Programs [0.0] 本研究は,複数プログラムの難読化を実現する命令デコリレーションとして,難読化に関するこれまでの研究を基盤とし,最適化するものである。
センサ耐性計算の特性をさらに向上する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 07:57:33 GMT)
Category-level Meta-learned NeRF Priors for Efficient Object Mapping [0.0] 3次元オブジェクトマッピングでは、カテゴリレベルの事前は効率的なオブジェクト再構成と標準ポーズ推定を可能にする。
我々は、カテゴリレベルの先行とオブジェクトレベルのNeRFを統合する、事前ベースで効率的なニューラルネットワークオブジェクトマップであるPrenoMを紹介する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:02:19 GMT)
Can Frontier LLMs Replace Annotators in Biomedical Text Mining? Analyzing Challenges and Exploring Solutions [0.0] 大規模言語モデル(LLM)は、教師付きデータに頼ることなく、コンテキスト内学習を通じて様々な自然言語処理(NLP)タスクを実行することができる。
バイオメディカルコーパスにおけるLSMの課題は3つある。
以上の結果から,フロンティアLSMは最先端(SOTA)BERTモデルの性能に近づいたり、超えたりできることがわかった。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 08:37:10 GMT)
Bringing AI Participation Down to Scale: A Comment on Open AIs Democratic Inputs to AI Project [0.0] 2023年、Open AIs Democratic Inputsプログラムは、生成AIへの公的参加のための手順を設計するための10のチームに資金を提供した。
このパースペクティブでは、プロジェクトの結果をレビューし、いくつかのチームとのインタビューと、参加演習を行った私たち自身の経験を描いています。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:55:49 GMT)
Bridging magic and non-Gaussian resources via Gottesman-Kitaev-Preskill encoding [0.0] 連続変数系における非安定化状態と非ガウス状態の基本的な関係を確立する。
符号化されたGKP状態に対する連続変数ウィグナー関数の負性は、マジック測度と一致することを示す。
また、安定化器 R'enyi エントロピーの連続変数表現も提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 01:59:49 GMT)
Bounds for the reduced relative entropies [0.0] 還元されたツァリス相対エントロピーが定義され、いくつかの結果が与えられる。
特に、還元されたTsallis相対エントロピーの凸性を得る。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 00:39:31 GMT)
Bounding the computational power of bosonic systems [0.0] 古典的コンピュータ上では指数時間で普遍ボソニック量子計算をシミュレートできることを示す。
また,その離散変数に対するボゾン量子コンピュータの指数計算的優位性を支持する論証も提示する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:33:51 GMT)
Blue repulsive potential for dysprosium Bose-Einstein condensates [0.0] 量子気体の短流体反発電位は、新しい系を実現し、新しい現象を研究することができる。
ダイオキシン類の偏光率のスカラー成分とテンソル成分の両方を測定するために,スペクトルフィルタダイオードレーザーシステムを用いた。
ボース=アインシュタイン凝縮体を操作するのに適したポテンシャル強度の実装について, 散乱寿命が1秒を超えることを実証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:18:59 GMT)
Benchmarks for quantum communication via gravity [0.0] 我々は、重力の異なるモデルの下で相互作用する機械振動子間の量子状態の伝達の制限と境界を確立する。
これは重力の量子的特徴のテストを可能にするベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:21:31 GMT)
Beginner's Lecture Notes on Quantum Spin Chains, Exact Diagonalization and Tensor Networks [0.0] 強い相関を持つ多体系の物理に読者を導入することを目的として、これらのノートは数値的手法に焦点を当てている。
テンソルネットワーク手法の簡単な紹介も含んでいる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 14:51:58 GMT)
BEADS: A Canonical Visualization of Quantum States for Applications in Quantum Information Processing [0.0] BEADS表現と呼ばれる量子ビット系の一般化位相空間表現を導入する。
これにより、任意の量子状態を直感的で分かりやすい方法で視覚化することができる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:04:13 GMT)
Autonomous Recognition of Erroneous Raw Key Bit Bias in Quantum Key Distribution [0.0] 生鍵におけるビット値の比率に関して起こり得るエラーの種類を示す。
このタイプのエラーを自律的に認識するメカニズムが与えられる。
また、このタイプのエラーに対する対策として、2つの対策を実施できる。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 23:51:06 GMT)
Automated Attendee Recognition System for Large-Scale Social Events or Conference Gathering [0.0] 入口ゲートと出口ゲートに設置したカメラを用いたクラウドベースの自動アテンダンストラッキングシステムを提案する。
搭載されたカメラは継続的にビデオを撮影し、ビデオデータをクラウドサービスに送り、リアルタイムの顔検出と認識を行う。
このシステムは、顔の障害のない個人に対して100%の精度を達成し、カメラの視野に現れるすべての参加者を正常に認識する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:03:21 GMT)
Attentive Reasoning Queries: A Systematic Method for Optimizing Instruction-Following in Large Language Models [0.0] 本稿では,新しい構造化推論手法であるAttentive Reasoning Queries (ARQs)を提案する。
ARQは、ドメイン特化推論ブループリントを通じて、大規模言語モデルにおける命令追跡を大幅に改善する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 17:03:48 GMT)
Assessing Correctness in LLM-Based Code Generation via Uncertainty Estimation [0.0] LLM生成符号の正確性のプロキシとして不確実性推定を検討する。
自然言語生成からコード生成領域への2つの最先端技術を適用する。
これらの手法を用いて計算した不確実性と正確性との間には強い相関関係があることが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 18:24:41 GMT)
Anti Kibble-Zurek behavior in the quantum XY spin-1/2 chain driven by correlated noisy magnetic field and anisotropy [0.0] 量子相転移の非断熱力学において、キブル・ズレークのパラダイムは、トポロジカルな欠陥の平均数は、クエンチ時間スケールを持つ普遍的なパワー則として抑制されていることを記述している。
ここでは、相関(色)ノイズの存在下での駆動横場/異方性量子$XY$モデルにおける欠陥発生について検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:35:49 GMT)
Analytical results for laser models producing a beam with sub-Poissonian photon statistics and coherence scaling as the Heisenberg limit [0.0] それぞれのレーザーシステムの力学を特徴付け、標準レーザー理論からの直観のいくつかをここで適用することができる。
しかし、通常のレーザーとは異なり、ハイゼンベルク制限レーザーのアンサンブルを構成する純粋な状態は実質的に位相圧縮されている。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:07:52 GMT)
Analogical Reasoning Inside Large Language Models: Concept Vectors and the Limits of Abstraction [0.0] 関数ベクトル(FV)は単純な入力変化に不変ではないことを示し、純粋概念以上を捉えることを示唆する。
我々は「匿名」のような動詞の概念に対して不変概念ベクトル(CV)を符号化する小さな注意ヘッドの集合をローカライズする。
CVは最終的な出力とは独立して動作する特徴検出器として機能する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:59:08 GMT)
An Improved Pure Fully Connected Neural Network for Rice Grain Classification [0.0] 深層学習により、イネの自動分類が可能となり、精度と効率が向上した。
第一段階の訓練に基づく古典モデルは、類似した外的特徴を持つ米品種の区別が困難である可能性がある。
本研究では,米粒分類の観点から,深層学習モデルの分類能力を高めるための2つの微妙な方法を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 02:10:14 GMT)
Advancing Multimodal In-Context Learning in Large Vision-Language Models with Task-aware Demonstrations [0.0] LVLM(Large Vision-Language Models)の重要な機能として,マルチモーダルインコンテキスト学習(ICL)が登場している。
我々はマルチモーダル ICL の根底にあるコアメカニズムに光を当て、ロバストなインコンテキストのデモシーケンスを構成する上で、タスクマッピングが重要な要素であると認識した。
タスク認識機能を備えた軽量で強力なデコーダのみの変換器である textitSabER を提案する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:33:10 GMT)
AI-Driven Multi-Stage Computer Vision System for Defect Detection in Laser-Engraved Industrial Nameplates [0.0] 本稿では,レーザーで刻まれた名札を検査し,検証するAI駆動型コンピュータビジョンシステムの概念実証について述べる。
このシステムは91.33%の精度と100%のリコールを達成し、欠陥のあるネームプレートが一貫して検出され、対処されることを保証する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 11:19:17 GMT)
A Quantum Good Authentication Protocol [0.0] 本稿では、対称鍵分布のための量子フォトニックチャネルを組み込んだ新しいネットワークプロトコルを提案する。
このプロトコルは強力なハッシュ関数を使用して、元のメッセージをハッシュし、宛先におけるデータ整合性を高める。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 20:30:34 GMT)
A Novel Multi-Criteria Local Latin Hypercube Refinement System for Commutation Angle Improvement in IPMSMs [0.0] 電流および電圧戦略あたりのリアルタイム最大トルクは、軌道および最適通勤角、ガンマを求めるために示される。
また, マルチクレーター型局所ラテンハイパーキューブ精錬システム(MLHR)を用いて, 磁気容量の低減を行い, 最適化プロセスの改善を図った。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 10:47:06 GMT)
A Multi Affine Geometric Framework for Quantum Nonlocality. Unifying Berry Phases, Entanglement, and Coherence [0.0] 古典的および量子力学的法則を統一する多アフィン幾何学的枠組みを開発する。
二重アフィン結合における発散が自然に量子干渉や非局所相関を引き起こすことを示す。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:34:58 GMT)
A Generative System for Robot-to-Human Handovers: from Intent Inference to Spatial Configuration Imagery [0.0] 本稿では,人間同士のインタラクションをエミュレートする,ロボット同士のオブジェクトハンドオーバのための新しいシステムを提案する。
提案システムは,人間によるハンドオーバ意図の推測,空間的ハンドオーバ構成の想像に焦点をあてる。
実験結果から,本手法は人間の手口を効果的に解釈し,流動的な人間的なハンドオーバを実現することが示唆された。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 15:13:54 GMT)
A Generative Approach to High Fidelity 3D Reconstruction from Text Data [0.0] 本研究では,テキスト・画像生成をシームレスに統合する完全自動パイプライン,様々な画像処理技術,反射除去と3次元再構成のためのディープラーニング手法を提案する。
安定拡散のような最先端の生成モデルを活用することで、この手法は自然言語の入力を多段階のワークフローを通じて詳細な3Dモデルに変換する。
このアプローチは、意味的コヒーレンスを維持すること、幾何学的複雑さを管理すること、詳細な視覚情報を保存することなど、生成的再構築における重要な課題に対処する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 16:54:15 GMT)
A Comprehensive Framework for Reliable Legal AI: Combining Specialized Expert Systems and Adaptive Refinement [0.0] 本稿では,専門家システムと知識に基づくアーキテクチャを組み合わせた新しい枠組みを提案する。
このフレームワークは特殊なモジュールを利用し、それぞれが特定の法的領域に焦点を当て、構造化された運用ガイドラインを取り入れて意思決定を強化する。
提案されたアプローチは、既存のAIモデルよりも大幅に改善され、法的タスクのパフォーマンスが向上し、よりアクセシブルで手頃な価格の法律サービスを提供するスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 04:32:02 GMT)
A Bridge to Nowhere: A Healthcare Case Study for Non-Reformist Design [0.0] 広義の領域における構造的損害を軽減し, 設計の公正性を高めるために, 非整形設計のための4つのテネセットを提案する。
非改革主義改革の廃止主義的枠組みが、事前の承認の害を軽減する代替介入の明確化にどのように役立つかを検討する。
論文参考訳(メタデータ) (Wed, 05 Mar 2025 19:22:12 GMT)