Speech-Hands: A Self-Reflection Voice Agentic Approach to Speech Recognition and Audio Reasoning with Omni Perception [142.5] 我々は,外部の音声知覚をいつ信頼するか,いつ外部の音声知覚を相談するかを知るという,一貫したスキルを学習する音声認識フレームワークを導入する。
音声認識と外部の音声理解タスクの両方でオムニモデルを鼻で微調整することは、しばしば性能を低下させる。
これを解決するために、我々のフレームワークであるSpeech-Handsは、問題を明示的な自己回帰決定として再考する。この学習可能なプリミティブは、モデルが欠陥のある外部候補によって脱線されるのを防ぐのに有効である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:06:50 GMT)
Fast-ThinkAct: Efficient Vision-Language-Action Reasoning via Verbalizable Latent Planning [97.3] 我々は,動詞化可能な潜在推論により,コンパクトかつ高性能な計画を実現する効率的な推論フレームワークであるFast-ThinkActを提案する。
様々な具体的操作と推論ベンチマークの実験により、Fast-ThinkActは最大89.3%の推論遅延で強いパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:59:59 GMT)
MAD: Motion Appearance Decoupling for efficient Driving World Models [94.4] 本稿では,一般的な映像モデルを制御可能な運転世界モデルに変換する,効率的な適応フレームワークを提案する。
鍵となるアイデアは、外見合成からモーションラーニングを分離することである。
私たちのMAD-LTXモデルであるLTXへのスケーリングは、すべてのオープンソース競合より優れています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:52:23 GMT)
Tuning-free Visual Effect Transfer across Videos [91.9] RefVFXは、参照ビデオからターゲットビデオや画像への複雑な時間効果をフィードフォワード形式で転送するフレームワークである。
本稿では,三重項の大規模データセットを導入し,各三重項は参照効果ビデオ,入力画像,および対応する出力ビデオから構成される。
RefVFXは視覚的に一貫した時間的コヒーレントな編集を行い、目に見えない効果カテゴリをまたいで一般化し、量的指標と人的嗜好の両方においてプロンプトのみのベースラインを上回ります。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:31:07 GMT)
DPWriter: Reinforcement Learning with Diverse Planning Branching for Creative Writing [78.7] 強化学習(RL)に基づく大規模言語モデル(LLM)の強化は、しばしば出力の多様性を低下させる。
本稿では,半構造化長鎖(CoT)を中心に構成されたRLフレームワークを提案する。
本稿では,多様性の多様性に基づいて,計画段階での分岐を戦略的に導入する横計画分岐手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:30:20 GMT)
SLAM-LLM: A Modular, Open-Source Multimodal Large Language Model Framework and Best Practice for Speech, Language, Audio and Music Processing [77.9] SLAM-LLMは、カスタマイズされたマルチモーダル言語モデル(MLLM)をトレーニングするために設計されたオープンソースのフレームワークである。
異なるエンコーダ、プロジェクタ、LCM、パラメータ効率の良い微調整プラグインのモジュール構成を提供する。
これには、ASR(Automatic Speech Recognition)、AAC(Automated Audio Captioning)、MC(Music Captioning)といった高性能なチェックポイントが含まれている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:25:36 GMT)
The AI Hippocampus: How Far are We From Human Memory? [77.0] インプリシットメモリは、事前訓練されたトランスフォーマーの内部パラメータに埋め込まれた知識を指す。
明示メモリは、動的でクエリ可能な知識表現でモデル出力を増大させるように設計された外部ストレージと検索コンポーネントを含んでいる。
エージェントメモリは、自律エージェント内に永続的、時間的に拡張されたメモリ構造を導入する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:24:08 GMT)
Routing with Generated Data: Annotation-Free LLM Skill Estimation and Expert Selection [70.7] RGDは、ルータが生成されたクエリと回答のみに基づいてトレーニングされる、困難な設定である。
クエリ・アンサー・ルータ(クエリとラベルの両方を用いて)とクエリのみのルータを4つのベンチマークと12のモデルで評価する。
コンセンサス投票によってモデルの正しさを推定し,階層クラスタリングによるモデル固有のスキルニッチを識別する新しいクエリ専用ルータであるCASCALを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:43:32 GMT)
AmbShield: Enhancing Physical Layer Security with Ambient Backscatter Devices against Eavesdroppers [69.6] AmbShieldは自然分布のAmBDを利用して正規チャネルを強化し、eavesdropperを分解するAmBD支援PSSスキームである。
AmbShieldでは、AmBDはランダムに後方散乱して盗聴者の干渉を発生させるフレンドリーなジャマーとして利用され、受動的リレーは所望の信号を後方散乱して正当な装置の容量を高める。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:56:50 GMT)
Large Multimodal Models for Embodied Intelligent Driving: The Next Frontier in Self-Driving? [68.8] この記事では、この課題に取り組むために、新しいセマンティクスとポリシーの二重駆動型ハイブリッド決定フレームワークを紹介します。
このフレームワークは、意味理解と認知表現のためのLMMと、リアルタイムポリシー最適化のための深層強化学習(DRL)を統合している。
本研究は,車線変更計画作業におけるフレームワークの性能優位性を検証するための事例研究である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:39:32 GMT)
PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records [67.7] パーソナライズされたGUIエージェント(PersonalAlign)の階層的意図的アライメントに注目した。
PersonalAlignは、曖昧な指示で省略された好みを解決するために、長期的なユーザレコードを永続的なコンテキストとして活用する必要がある。
GPT-5, Qwen3-VL, UI-TARSなどのGUIエージェントをAndroidIntent上で評価する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:12:48 GMT)
M3CoTBench: Benchmark Chain-of-Thought of MLLMs in Medical Image Understanding [66.8] CoT(Chain-of-Thought)推論は、ステップバイステップの中間推論を奨励することによって、大規模言語モデルの強化に有効であることが証明されている。
医用画像理解のための現在のベンチマークでは、推論パスを無視しながら最終回答に重点を置いている。
M3CoTBenchは、透明で信頼性が高く、診断的に正確な医療用AIシステムの開発を促進することを目的としている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:19:06 GMT)
RPC-Bench: A Fine-grained Benchmark for Research Paper Comprehension [65.8] RPC-Bench(RPC-Bench)は、高品質なコンピュータサイエンス論文のレビュー・リビューの交換から構築された大規模質問応答ベンチマークである。
我々は、科学研究の流れに沿ったきめ細かい分類を設計し、モデルがなぜ、何、どのように学術的な文脈で質問するかを理解し、答える能力を評価する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:37:00 GMT)
Learning Whole-Body Human-Humanoid Interaction from Human-Human Demonstrations [63.8] D-STAR(D-STAR)は,行動すべき場所から行動すべき場所を乱す階層的な政策である。
広範かつ厳密なシミュレーションを通じて、我々のフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:37:06 GMT)
Patient-Similarity Cohort Reasoning in Clinical Text-to-SQL [63.6] CLINはMIMICIV v3.1の633のエキスパートアノテートタスクのベンチマークである。
我々はChain-of-Thoughtセルフリファインメントの下で22のプロプライエタリモデルとオープンソースモデルを評価した。
最近の進歩にもかかわらず、パフォーマンスは臨床的な信頼性には程遠い。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:12:06 GMT)
Transition Matching Distillation for Fast Video Generation [63.1] 本稿では,ビデオ拡散モデルを効率の良い数ステップ生成器に蒸留するための新しいフレームワークであるTransition Matching Distillation (TMD)を提案する。
TMDは拡散モデルの多段階認知軌道と数段階の確率遷移過程とを一致させる。
TMDは、生成速度と視覚的品質の間の柔軟性と強力なトレードオフを提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:30:03 GMT)
RISER: Orchestrating Latent Reasoning Skills for Adaptive Activation Steering [62.6] 本稿では,アクティベーション空間における大規模言語モデル(LLM)推論を適応的に制御するプラグイン・アンド・プレイ介入フレームワークを提案する。
RISERは再利用可能な推論ベクトルのライブラリを構築し、軽量ルータを使用して各入力に対して動的に構成する。
ルーターは、タスクレベルの報酬の下で強化学習を通じて最適化され、緊急かつ構成的な方法で潜在する認知的プリミティブを活性化する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:04:33 GMT)
Integrating Diverse Assignment Strategies into DETRs [61.6] ラベル割り当ては、特にDETRスタイルのフレームワークにおいて、オブジェクト検出器において重要なコンポーネントである。
我々は,任意のDETR型検出器に多様な割り当て戦略をシームレスに統合する,フレキシブルで軽量なフレームワークであるLoRA-DETRを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:28:54 GMT)
CaMeLs Can Use Computers Too: System-level Security for Computer Use Agents [61.0] AIエージェントは、悪意のあるコンテンツがエージェントの行動をハイジャックして認証情報を盗んだり、金銭的損失を引き起こすような、インジェクション攻撃に弱い。
CUAのためのシングルショットプランニングでは、信頼できるプランナーが、潜在的に悪意のあるコンテンツを観察する前に、条件付きブランチで完全な実行グラフを生成する。
このアーキテクチャ分離は命令インジェクションを効果的に防止するが、ブランチステアリング攻撃を防ぐには追加の対策が必要であることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:06:35 GMT)
Breaking the Limits of Open-Weight CLIP: An Optimization Framework for Self-supervised Fine-tuning of CLIP [60.0] TuneCLIPはCLIPモデルの自己教師型微調整フレームワークである。
モデルアーキテクチャとスケールをまたいだパフォーマンスを継続的に改善します。
SigLIP (ViT-B/16) のような主要なオープンウェイトモデルが増加し、ImageNetと関連するアウト・オブ・ディストリビューション・ベンチマークで最大で2.5%向上した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:38:36 GMT)
Omni-R1: Towards the Unified Generative Paradigm for Multimodal Reasoning [59.9] 本稿では、中間画像を生成することにより、多様なマルチモーダル推論スキルを統一する統合生成多モーダル推論を提案する。
我々はこのパラダイムを、2段階のSFT+RLフレームワークであるOmni-R1でインスタンス化する。
Omni-R1-Zeroは、テキストのみの推論データからステップワイドな視覚化をブートストラップすることで、マルチモーダルアノテーションの必要性を解消する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:57:33 GMT)
COMPOSE: Hypergraph Cover Optimization for Multi-view 3D Human Pose Estimation [58.5] スパース多視点からの3次元ポーズ推定は、行動認識、スポーツ分析、人間とロボットの相互作用にとって重要な課題である。
ハイパーグラフ問題として多視点ポーズ対応マッチングを定式化する新しいフレームワークComposEを提案する。
COMPOSEは,従来の最適化手法よりも平均23%,自己教師付きエンドツーエンド学習手法より最大11%の精度向上を実現している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:50:17 GMT)
Towards Open Environments and Instructions: General Vision-Language Navigation via Fast-Slow Interactive Reasoning [58.3] Vision-Language Navigationは、エージェントが言語命令に基づいてターゲット場所へナビゲートできるようにすることを目的としている。
最近の研究は、迅速で遅い認知システムによって、人間は安定したポリシーを生成できることを示している。
本稿では,動的対話型高速スロー推論フレームワークであるlow4fast-VLNを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:22:16 GMT)
DeepResearchEval: An Automated Framework for Deep Research Task Construction and Agentic Evaluation [56.9] DeepResearchEvalは、ディープリサーチタスク構築とエージェント評価のための自動化フレームワークである。
タスク構築のために,多様なユーザプロファイルに固定された現実的で複雑な研究タスクを生成するペルソナ駆動パイプラインを提案する。
評価には,タスク固有の評価次元,基準,重みを動的に導出する適応的ポイントワイド品質評価と,引用が欠落した場合でもWeb検索によるレポート文の自動抽出と検証を行うアクティブ・ファクト・チェッキングの2つの要素からなるエージェントパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:38:31 GMT)
LSRIF: Logic-Structured Reinforcement Learning for Instruction Following [56.5] 命令論理を明示的にモデル化するロジック構造化学習フレームワーク LSRIF を提案する。
実験の結果、LSRIFは命令追従と一般的な推論に大きな改善をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:51:23 GMT)
Programming over Thinking: Efficient and Robust Multi-Constraint Planning [54.8] SCOPEは、クエリ固有の推論をジェネリックコード実行から切り離すフレームワークである。
SCOPEは、コストとレイテンシを下げながら最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:58:07 GMT)
V-DPM: 4D Video Reconstruction with Dynamic Point Maps [53.8] ダイナミックポイントマップ(DPM)は動的な3Dコンテンツを表す。
映像入力のためのDPMを表現力の最大化として定式化する方法を示す。
我々は,最近の強力な3D再構成器であるVGGT上にこれらのアイデアを実装した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:03:42 GMT)
SERM: Self-Evolving Relevance Model with Agent-Driven Learning from Massive Query Streams [53.8] 本稿では,2つの相補的マルチエージェントモジュールからなる自己進化関連モデル(SERM)を提案する。
我々はSERMを大規模産業環境で評価し、毎日数十億のユーザリクエストを処理している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:31:16 GMT)
Structured Knowledge Representation through Contextual Pages for Retrieval-Augmented Generation [53.8] PAGERは、RAGのためのページ駆動の自律的知識表現フレームワークである。
関連文書を反復的に検索して洗練し、各スロットをポップアップさせ、最終的にコヒーレントなページを構成する。
実験の結果、PAGERはすべてのRAGベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:44:31 GMT)
AI-NativeBench: An Open-Source White-Box Agentic Benchmark Suite for AI-Native Systems [52.7] 我々は、Model Context Protocol(MCP)とAgent-to-Agent(A2A)標準に基づいて、アプリケーション中心でホワイトボックスのAI-NativeベンチマークスイートであるAI-NativeBenchを紹介する。
エージェントスパンを分散トレース内の第一級市民として扱うことにより,本手法は,単純な機能以上の工学的特性の粒度解析を可能にする。
この研究は、モデル能力の測定から信頼性の高いAI-Nativeシステムへの移行を導く最初の体系的な証拠を提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:32:07 GMT)
Image2Garment: Simulation-ready Garment Generation from a Single Image [52.4] 実画像から材料組成と布質特性を推定する視覚言語モデルを提案する。
次に、これらの属性を対応する物理ファブリックパラメータにマッピングする軽量な予測器をトレーニングします。
実験により, 材料組成推定および布質特性予測において, 推定器の精度が向上することが確認された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:47:33 GMT)
Coordinated Pandemic Control with Large Language Model Agents as Policymaking Assistants [51.3] 本研究では,地域間で協調的かつ積極的なパンデミック制御を支援する多言語モデル (LLM) の多言語政策作成フレームワークを提案する。
実世界のデータ、パンデミックの進化シミュレータ、エージェント間の構造的コミュニケーションを統合することで、エージェントは反現実的な介入シナリオを共同で探索することができる。
実際のパンデミックの結果と比較すると、それぞれの州レベルで累積感染と死亡率を最大63.7%、死亡率40.1%まで下げる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:59:44 GMT)
OpenVoxel: Training-Free Grouping and Captioning Voxels for Open-Vocabulary 3D Scene Understanding [51.2] オープンな3Dシーン理解タスクのためのグループ化と字幕化のための訓練不要なアルゴリズムであるOpenVoxelを提案する。
提案手法は,最近の研究,特に複合参照表現セグメンテーション(RES)タスクに比較して,優れた性能を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:45:57 GMT)
Affostruction: 3D Affordance Grounding with Generative Reconstruction [50.6] Affostructionは、部分的な観察から完全な幾何学を再構築する生成フレームワークであり、その全形状に余裕がある。
空き地での19.1 aIoUと3次元再構築のための32.67 IoUを達成し、完全な形状の正確な空き地予測を可能にする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:33:12 GMT)
What Do LLM Agents Know About Their World? Task2Quiz: A Paradigm for Studying Environment Understanding [50.4] 大規模言語モデル(LLM)エージェントは、複雑な意思決定やツール使用タスクにおいて顕著な能力を示した。
本研究では,タスク実行と世界状態理解の分離を目的とした決定論的かつ自動評価パラダイムであるTask-to-Quiz(T2Q)を提案する。
実験の結果,タスク成功は環境理解の指標として不十分な場合が多く,現在の記憶機構はエージェントが環境の基底モデルを取得するのに有効ではないことが明らかとなった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:09:11 GMT)
Automating Supply Chain Disruption Monitoring via an Agentic AI Approach [49.8] 我々は、自律的に監視し、分析し、拡張されたサプライネットワークにまたがる破壊に応答する、最小限の教師付きエージェントAIフレームワークを導入する。
F1スコアは0.962から0.991の間であり、破壊1回あたり0.0836ドルのコストで平均3.83分でエンドツーエンドの分析を行う。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:28:31 GMT)
SlidesGen-Bench: Evaluating Slides Generation via Computational and Quantitative Metrics [49.1] SlidesGen-Benchは、3つのコア原理のレンズを通してスライド生成を評価するために設計されたベンチマークである。
まず、視覚領域で解析を行い、端末出力をレンダリングとして扱い、基礎となる生成法に非依存なままにする。
次に,3次元のスライド(コンテンツ,美学,編集可能性)を定量的に評価する計算手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:50:30 GMT)
MAXS: Meta-Adaptive Exploration with LLM Agents [48.0] MaxSはLarge Language Model (LLM) Agentsをベースにしたメタ適応推論フレームワークである。
MAXSは、いくつかのステップを進む推論パスを拡張するために、ルックアヘッド戦略を採用している。
ステップの一貫性のばらつきとステップ間のトレンドスロープを組み合わせることで、安定で一貫性があり、高い値の推論ステップを共同で選択する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:48:00 GMT)
Distribution-Aligned Sequence Distillation for Superior Long-CoT Reasoning [48.0] DASD-4B-Thinkingは軽量で高機能で完全なオープンソース推論モデルである。
これは、数学、科学的推論、コード生成の挑戦的なベンチマークにおいて、同等規模のオープンソースのモデル間でSOTA性能を達成する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:43:17 GMT)
ProFit: Leveraging High-Value Signals in SFT via Probability-Guided Token Selection [47.4] 監督された微調整は、大規模言語モデルと人間の意図を結びつけるための戦略である。
従来のSFTは、単一の参照応答にアライメントを強制することで、言語の一対多の性質を無視することが多い。
本稿では,表面面のオーバーフィッティングを防止するために,低確率トークンを選択的にマスクするProFitを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:50:40 GMT)
SAM3-DMS: Decoupled Memory Selection for Multi-target Video Segmentation of SAM3 [46.0] Segment Anything 3 (SAM3)は、ビデオ内の特定のターゲットを堅牢に検出、セグメント、追跡する強力な基盤を確立している。
本研究では,個々のオブジェクトのメモリ選択を微粒化することで,学習不要な分離戦略であるSAM3-DMSを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:52:14 GMT)
Beyond the final layer: Attentive multilayer fusion for vision transformers [45.6] タスク関連情報は、最後のレイヤにのみエンコードされるのではなく、ネットワーク階層に分散されていることを示す。
視覚変換器のすべての層から動的に表現を融合する注意的探索機構を適用する。
このメカニズムは、ターゲットタスクの最も関連性の高いレイヤを特定し、低レベルの構造的キューと高レベルのセマンティック抽象化を組み合わせることを学習する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:50:09 GMT)
TEMPO: A Realistic Multi-Domain Benchmark for Temporal Reasoning-Intensive Retrieval [44.9] 既存の時間的QAベンチマークは、ニュースコーパスからの事実検索クエリに焦点を当てている。
13ドメインにわたる時間的推論と推論集約検索を組み合わせた最初のベンチマークであるTEMPOを紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:45:20 GMT)
VIGIL: Defending LLM Agents Against Tool Stream Injection via Verify-Before-Commit [44.2] オープン環境で動作するLLMエージェントは、間接的なプロンプトインジェクションによるエスカレーションリスクに直面している。
制約的分離から検証前コミットプロトコルへパラダイムをシフトするフレームワークである textbfVIGIL を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:19:43 GMT)
TimeSAE: Sparse Decoding for Faithful Explanations of Black-Box Time Series Models [43.9] 我々は、スパースオートエンコーダ(SAE)のデュアルレンズと因果性を用いて、時系列データのためのブラックボックスモデルを説明するためのフレームワークを提供する。
Sparse Autoencoderの概念に基づいて、ブラックボックスモデル説明のためのフレームワークであるTimeSAEを紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:13:32 GMT)
Measuring the benefits of lying in MARA under egalitarian social welfare [42.5] 平等主義的社会福祉の後、一組のエージェントに資源が分配される場合、その効用が最小限であることが判明したエージェントの有用性を最大化することが目的である。
本稿では、この状況を解析し、遺伝的アルゴリズムを用いて、異なる状況下での嘘の利点を評価する実践的研究を行う。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:36:26 GMT)
Epistemology gives a Future to Complementarity in Human-AI Interactions [42.4] 相補性とは、AIシステムによって支えられた人間は、意思決定プロセスにおいて単独でより優れる、という主張である。
我々は,人間とAIの相互作用が信頼できる過程であることを示す証拠として,相補性の歴史的事例が機能すると主張している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:04:28 GMT)
$A^3$-Bench: Benchmarking Memory-Driven Scientific Reasoning via Anchor and Attractor Activation [41.7] A3$-Benchは、デュアルスケールのメモリ駆動のアクティベーションを通じて科学的推論を評価するために設計されたベンチマークである。
まず、SAPMプロセスを用いて、ドメイン間での2,198の科学推論問題に注釈を付ける。
第2に,アンカーとアトラクタを利用したデュアルスケールメモリ評価フレームワークと,メモリアクティベーション率を測定するためのAAUI(Anchor-Attractor utilization Index)指標を導入する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:17:41 GMT)
A Posteriori Certification Framework for Generalized Quantum Arimoto-Blahut Algorithms [41.2] 本稿では,一般化量子Arimoto-Blahut (QAB) アルゴリズムに対する後続認証の視点を紹介する。
我々は、凸性とかなり弱い数値検証条件の下で、QAB反復が大域最小化器に収束することを示す大域収束定理を証明した。
応用として、チャネルの量子相対エントロピーを計算するための認定反復スキームを開発する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:10:41 GMT)
When Single-Agent with Skills Replace Multi-Agent Systems and When They Fail [40.7] マルチエージェントAIシステムは複雑な推論に有効であることが証明されている。
スキルのライブラリから選択した単一のエージェントで、同様のモジュラリティのメリットを達成できますか?
本研究では,スキル選択のスケーリング行動を調査し,印象的なパターンを観察する。
図書館のサイズだけでなく,類似のスキル間のセマンティック・コンフューザビリティが,この劣化に中心的な役割を果たしていることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:18:10 GMT)
SubTokenTest: A Practical Benchmark for Real-World Sub-token Understanding [40.5] 実用的なユーティリティ駆動タスクによるサブトークン理解を評価するベンチマークであるSubTokenTestを紹介した。
我々のベンチマークには、4つのドメインにわたる10のタスクが含まれており、複雑な推論からパフォーマンスを分離することでトークン化関連の障害を分離する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:45:08 GMT)
GUI-Eyes: Tool-Augmented Perception for Visual Grounding in GUI Agents [39.8] GUIタスクにおける能動的視覚知覚のための強化学習フレームワークであるGUI-Eyesを提案する。
我々は、意思決定を粗い探索ときめ細かい接地に分解する進歩的認識戦略を導入する。
ScreenSpot-Proベンチマークでは、GUI-Eyes-3Bは3kラベルのサンプルのみを使用して44.8%のグラウンド精度を達成した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:27:28 GMT)
MORE: Multi-Objective Adversarial Attacks on Speech Recognition [39.8] Whisperのような大規模自動音声認識(ASR)モデルは、様々な現実世界のアプリケーションで採用を広げている。
したがって、小さな入力の摂動に対する堅牢性は、リアルタイム環境における信頼性の高い性能を維持するために重要である。
認識精度と推論効率を両立させる多目的反復倍増促進攻撃MOREを導入する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:50:21 GMT)
A Scoping Review of the Ethical Perspectives on Anthropomorphising Large Language Model-Based Conversational Agents [39.5] 人間以外の存在が人間に似た性質を持つ人類形態化は、大きな言語モデル(LLM)に基づく会話エージェント(CA)の台頭により、ますます健全になっている。
このスコーピングレビューは、LLMベースのCAを5つのデータベースと3つのプレプリントリポジトリで人類学的に指向した研究をマッピングする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:03:11 GMT)
Very-High-Frequency Gravitational Waves from Multi-Monodromy Inflation [39.1] 本研究は, 多段アクシオンモノドロミーインフレーションにおいて, 過渡段階の終端付近での中断が重力波背景のスパイクを引き起こすことを示した。
これらの重力波は周波数範囲にあり、アインシュタイン望遠鏡のような提案された地球型検出器に振幅がアクセス可能である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:49:04 GMT)
CSSG: Measuring Code Similarity with Semantic Graphs [38.6] プログラム依存グラフを用いたCSSG(Code similarity using Semantic Graphs)を提案する。
CodeContests+データセットの実験によると、CSSGはモノリンガルとクロスランガルの両方の設定下で、類似の少ないコードを区別することで、既存のメトリクスを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:20:24 GMT)
The Algorithmic Gaze: An Audit and Ethnography of the LAION-Aesthetics Predictor Model [38.5] 視覚的生成画像モデルを学習するためにデータセットのキュレートに広く用いられている美的評価モデル、LAP(LaION Aesthetic Predictor)について検討する。
LAPは女性に言及するキャプションで画像をフィルターし、男性に言及するキャプションやLGBTQ+に言及するキャプションで画像をフィルタリングする。
このようにして、この美的評価モデルのアルゴリズム的な視線は、西洋美術史に見られる帝国的・男性的な視線を補強する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:59:44 GMT)
Efficient Paths and Dense Rewards: Probabilistic Flow Reasoning for Large Language Models [37.4] CoT-Flowは、個別の推論ステップを継続的確率的フローとして再認識するフレームワークである。
CoT-Flowは推論効率と推論性能のバランスが優れていることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:52:05 GMT)
Dobrushin Coefficients of Private Mechanisms Beyond Local Differential Privacy [36.3] 我々は、カーネルのPML保証の観点から、収縮の達成可能な境界を導出する。
結果は、ビネットの不等式の適用により、一般的な$f$-divergencesに拡張する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:03:42 GMT)
Toward Understanding Unlearning Difficulty: A Mechanistic Perspective and Circuit-Guided Difficulty Metric [36.3] circuit-guided Unlearning Difficulty (CUD) は、回路レベルの信号を用いて各サンプルに連続的な難易度スコアを割り当てるメトリクスである。
難易度の機械的シグネチャを示す重要な回路レベルのパターンを同定する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:55:58 GMT)
Disentangle Object and Non-object Infrared Features via Language Guidance [35.6] 赤外線物体検出のための新しい視覚言語表現学習パラダイムを提案する。
リッチ・セマンティック・インフォメーションを用いた追加のテキスト・インフォメーションは、オブジェクトと非オブジェクトの特徴の絡み合いを導くために研究される。
提案手法は,Mtextsuperscript3FD (83.7% mAP),FLIR (86.1% mAP) の2つのベンチマークにおいて優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:59:54 GMT)
Ability Transfer and Recovery via Modularized Parameters Localization [35.1] 大規模な言語モデルは、特定のドメイン、言語、またはスキルのパフォーマンスを改善するために、継続的に事前訓練または微調整することができる。
本稿では,アクティベーションの違いによって能力関連チャネルをローカライズし,対応するパラメータのみを選択的に転送するACTを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:42:39 GMT)
MHLA: Restoring Expressivity of Linear Attention via Token-Level Multi-Head [35.0] 線形アテンションは効率的な代替手段を提供するが、その直接的なアプリケーションはしばしば性能を低下させる。
本稿では,トークン次元に沿って分割されたヘッド内での注意を演算することで,この多様性を保ったマルチヘッド線形注意(MHLA)を提案する。
我々は,MHLAがソフトマックスアテンションの表現力の多くを回復しながら線形複雑性を維持していることを証明し,その有効性を複数の領域にわたって検証した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:12:54 GMT)
DeTracker: Motion-decoupled Vehicle Detection and Tracking in Unstabilized Satellite Videos [34.6] DeTrackerは、不安定な衛星ビデオに適した共同検出・追跡フレームワークである。
我々は,衛星プラットフォームの動きと真の物体の動きを分離するGlobal-Local Motion Decoupling (GLMD)モジュールを導入する。
また,多方向および多速度プラットフォーム動作をシミュレートする新しいベンチマークデータセットであるSDM-Car-SUを構築した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:22:44 GMT)
GaussianFluent: Gaussian Simulation for Dynamic Scenes with Mixed Materials [34.5] GaussianFluentは動的オブジェクト状態の現実的なシミュレーションとレンダリングのためのフレームワークである。
生成モデルによって導かれる内部ガウスを密度化することによって内部を合成する。
最適化された連続損傷材料ポイント法(CD-MPM)を統合し、極めて高速で脆性破壊シミュレーションを可能にする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:59:52 GMT)
Beyond Accuracy: Evaluating Grounded Visual Evidence in Thinking with Images [34.3] 我々は、忠実な視覚的推論を評価するために設計されたプロセス検証可能なベンチマークであるViEBenchを提案する。
専門家による視覚的エビデンスを含む200個の高解像度画像を合成し、ViEBenchは難易度でタスクを知覚と推論の次元に分類する。
実験の結果,(1)VLMは無関係な領域に接するにもかかわらず,正しい最終回答を導き出すことができ,(2)正しい証拠を見つけることはできるが,正確な結論に至らなかった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:25:15 GMT)
Controlled Self-Evolution for Algorithmic Code Optimization [33.8] 自己進化的手法は、反復的な"生成-検証-精細"サイクルを通じてコード生成を強化する。
既存のアプローチでは、限られた予算内で優れた複雑さを持つソリューションを見つけることができません。
本稿では3つのキーコンポーネントからなる制御自己進化(CSE)を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:53:44 GMT)
Unifying Search and Recommendation in LLMs via Gradient Multi-Subspace Tuning [33.7] Gradient Multi-Subspace Tuning (GEMS)は、検索とレコメンデーションタスクを統合する新しいフレームワークである。
GEMSは検索タスクとレコメンデーションタスクの両方において、最先端のベースラインを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:03:07 GMT)
PersonaPlex: Voice and Role Control for Full Duplex Conversational Speech Models [33.3] 本稿では,ハイブリッドシステムプロンプトを組み込んだ二重会話音声モデルであるPersonaPlexを紹介する。
PersonaPlexは、ペア化されたプロンプトとユーザエージェントによる会話の大規模な合成データセットに基づいてトレーニングされている。
実験の結果,ペルソナプレックスは強い役割条件付き行動,音声条件付き音声,自然な会話応答性を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:47:46 GMT)
On-Device Large Language Models for Sequential Recommendation [33.2] 大きな言語モデル(LLM)は、シーケンシャルなレコメンデーションタスクのためにユーザの振る舞いをモデル化する特別な機能を提供する。
しかし、そのメモリフットプリントと計算オーバーヘッドにより、リソース制限されたデバイスへのデプロイメントはリスクの高い提案となる。
逐次的なレコメンデーションタスクのために,LCMをデバイス上で効率よく,かつ正確なデプロイを実現するために設計された,最初のタスク適応型圧縮フレームワークOD-LLMを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:22:08 GMT)
Terminally constrained flow-based generative models from an optimal control perspective [32.9] フローベースモデルを用いた端末最適制御(TOCFlow)は,事前学習したフローに対する幾何対応のサンプリング時間誘導手法である。
制御ペナルティが増加するにつれて、制御されたプロセスは基準分布を回復するが、ペナルティが消えるにつれて、終端法則は制約多様体への一般化されたワッサーシュタイン射影に収束する。
等式,不等式,大域的統計的制約にまたがる3つの高次元科学的課題におけるTOCFlowの評価を行った。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:32:15 GMT)
Annealed Relaxation of Speculative Decoding for Faster Autoregressive Image Generation [32.8] 2つの重要な洞察に基づいて構築された投機的復号化のアニール緩和であるCOOL-SDを提案する。
実験によりCOOL-SDの有効性が検証され、速度品質トレードオフにおける従来の手法よりも一貫した改善が示された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:35:21 GMT)
SpatialJB: How Text Distribution Art Becomes the "Jailbreak Key" for LLM Guardrails [32.5] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃に対して脆弱である。
LLMは有害な出力をフィルタリングするために自己回帰的でトークン・バイ・推論に依存している。
本研究では,有害なコンテンツを検出せずにガードレールをバイパスできる空間JBを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:47:49 GMT)
UserLM-R1: Modeling Human Reasoning in User Language Models with Multi-Reward Reinforcement Learning [32.5] 推論機能を備えた新しいユーザ言語モデルであるUserLM-R1を提案する。
まず,静的な役割と,多様なシナリオに適応するための動的シナリオ特異的な目標を兼ね備えた包括的ユーザプロファイルを構築した。
そこで我々は,応答を生成する前に,高品質な合理性を生成するためのゴール駆動意思決定政策を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:42:01 GMT)
Class Adaptive Conformal Training [32.3] コンフォーマル予測は不確実性定量化のための原則化された枠組みを提供する。
クラス適応型コンフォーマルトレーニング(CaCT)は,分布仮説を作らずに,クラス条件で予測セットを形作ることを学習する。
CaCTは、コンフォーマルなトレーニング方法よりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:41:23 GMT)
SimMerge: Learning to Select Merge Operators from Similarity Signals [32.2] モデルマージにより、複数の大規模言語モデル(LLM)を単一のモデルに統合し、パフォーマンスを維持できる。
本稿では,モデル間のコストのかかるタスクに依存しない類似性信号を用いて,最適なマージを選択する,没入型予測マージ選択手法を提案する。
その結果,チェックポイントカタログが大きく,評価予算が厳しい場合には,マージ方法の学習が,拡張性のあるモデル構成への実践的な経路であることが示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:30:00 GMT)
VideoAR: Autoregressive Video Generation via Next-Frame & Scale Prediction [31.2] VideoARは、ビデオ生成のための最初の大規模なVisual Autoregressiveフレームワークであり、マルチスケールの次世代の予測と自動回帰モデリングを組み合わせたものである。
VideoARは、フレーム内VARと因果次フレーム予測を統合することで、空間的および時間的依存関係をアンハングルする。
実証的な結果として、VideoARは、自動回帰モデル間の解像度を改善し、UCF-101上のFVDを99.5から88.6に改善し、10倍以上の推論ステップを減らし、拡散ベースのVBenchスコア81.74に到達した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:12:54 GMT)
CogRail: Benchmarking VLMs in Cognitive Intrusion Perception for Intelligent Railway Transportation Systems [29.4] 我々は、キュレートされたデータセットと認知駆動型質問応答アノテーションを統合した新しいベンチマーク、CogRailを紹介した。
このベンチマークに基づいて、我々は最先端のビジュアル言語モデルの体系的な評価を行う。
本稿では,3つの中核的タスク,位置知覚,移動予測,脅威分析を統合したファインチューニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:36:26 GMT)
MCGA: A Multi-task Classical Chinese Literary Genre Audio Corpus [28.1] マルチタスク古典中国語文学音声コーパス(MCGA)
ASR(Automatic Speech Recognition)、S2TT(A Speech-to-Text Translation)、SEC(A Speech Emotion Captioning)、SU(Spoken Question Answering)、SR(A Speech Reasoning)の6つのタスクにまたがる多様な文学ジャンルを含んでいる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:05:16 GMT)
ShortCoder: Knowledge-Augmented Syntax Optimization for Token-Efficient Code Generation [28.0] コード生成効率を最適化する知識注入フレームワークであるShortCoderを提案する。
ShortCoderはHumanEvalの最先端メソッドを一貫して上回る。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:57:31 GMT)
Enhancing Large Language Models for Time-Series Forecasting via Vector-Injected In-Context Learning [27.9] 時系列予測(TSF)はこの目標を達成するための重要な手段である。
LLM4TSFは予測性能と計算オーバーヘッドという2つの課題に直面している。
インコンテキスト学習(ICL)にヒントを得て,LVICLを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:32:42 GMT)
SRT: Accelerating Reinforcement Learning via Speculative Rollout with Tree-Structured Cache [27.2] Tree-Structured Cache (SRT) を用いた投機的ロールアウトは、オンライン強化学習(RL)を高速化するためのモデルレスアプローチである。
SRTは、トレーニングステップ全体で同じプロンプトに対するロールアウトの実証的な類似性を利用して、以前生成された継続をプロンプトごとのツリー構造キャッシュに格納する。
継続して生成とステップのレイテンシを低減し、トーケン毎の推論コストを低減し、ロールアウト時に最大228倍のウォールタイムタイムスピードアップを達成する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:34:48 GMT)
Thinking Long, but Short: Stable Sequential Test-Time Scaling for Large Reasoning Models [26.8] この研究は、新しいシーケンシャルなテスト時間スケーリング手法Min-Seekを提案する。
モデル精度は、広範囲の帰納的思考に対して著しく向上する。
シーケンシャルスケーリングの精度を安定させ、長さを微調整する必要がない。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:30:55 GMT)
When Rules Fall Short: Agent-Driven Discovery of Emerging Content Issues in Short Video Platforms [26.8] マルチモーダル LLM エージェントを用いた自動問題発見手法を提案する。
提案手法は,潜在的な新たな問題を含むショートビデオを自動的にリコールし,2段階のクラスタリング戦略を適用する。
これらのクラスタから更新されたアノテーションポリシーを生成し、新たな問題へのカバレッジを拡大する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:37:55 GMT)
Chain-of-Memory: Lightweight Memory Construction with Dynamic Evolution for LLM Agents [26.4] 外部メモリシステムは、Large Language Model (LLM)エージェントが永続的な知識を維持し、長期にわたる意思決定を行うために重要である。
既存のパラダイムは一般に2段階のプロセスに従っている。
我々は,高度な利用と組み合わせた軽量構造へのパラダイムシフトを提唱する新しいフレームワークであるCoM(Chain-of-Memory)を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:42:15 GMT)
DR-LoRA: Dynamic Rank LoRA for Mixture-of-Experts Adaptation [26.2] Mixture-of-Experts (MoE) はLarge Language Models (LLM) のスケーリングのパラダイムとして注目されている。
DR-LoRAと呼ばれる動的ランクのLoRAフレームワークを提案し、タスク固有の要求に基づいて微調整中に専門家のLoRAランクを動的に増加させる。
複数のベンチマークの実験では、DR-LoRAは同じパラメータ予算の下で標準のLoRAと静的アロケーション戦略を一貫して上回っている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:04:55 GMT)
SkinFlow: Efficient Information Transmission for Open Dermatological Diagnosis via Dynamic Visual Encoding and Staged RL [26.1] LVLM(General-purpose Large Vision-Language Models)は「びまん性注意」による皮膚科学にしばしば影響を及ぼす
本稿では,視覚情報伝達効率の最適化として診断を扱うフレームワークであるSkinFlowを紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:21:07 GMT)
Resolving Predictive Multiplicity for the Rashomon Set [25.6] モデルの「羅生門集合」も同様の精度を得るが、個々の予測では分岐する。
本稿では,ラーショモン集合の構成員に対する予測の不整合を低減するための3つのアプローチを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:02:54 GMT)
TaxoBell: Gaussian Box Embeddings for Self-Supervised Taxonomy Expansion [25.6] 分類学は様々な領域にまたがる構造化知識表現のバックボーンを形成する。
既存の自動手法は点ベースのベクトル埋め込みに依存している。
Boxの埋め込みは、封じ込めと不整合を可能にすることで、有望な代替手段を提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:08:37 GMT)
SCE-SLAM: Scale-Consistent Monocular SLAM via Scene Coordinate Embeddings [25.3] モノクロビジュアルSLAMは、インターネットビデオからの3D再構成と、リソース制約のあるプラットフォーム上での自律的なナビゲーションを可能にする。
本研究では,シーン座標埋め込みによるスケール一貫性を維持するエンドツーエンドSLAMシステムであるSCE-SLAMを提案する。
提案手法は,KITTIの絶対軌道誤差を最大8.36m削減する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:57:08 GMT)
Beyond Consensus: Perspectivist Modeling and Evaluation of Annotator Disagreement in NLP [25.1] アノテーションの不一致は、特に毒性の検出やスタンス分析のような主観的で曖昧なタスクに対して、NLPで広く見られる。
まず、データ、タスク、アノテータ要素にまたがる不一致の原因のドメインに依存しない分類を提示する。
次に,予測対象とプール構造によって定義された共通フレームワークを用いてモデリング手法を合成する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 01:26:29 GMT)
Learning to Trust Experience: A Monitor-Trust-Regulator Framework for Learning under Unobservable Feedback Reliability [25.0] 保存不能信頼性(EIUR)下におけるてんかんの認識可能性について検討した。
標準的な堅牢な学習は安定して収束するが、高信頼で体系的に間違った信念を形成する。
本稿では,メタ認知制御の実践的対応として,学習者の内的力学における内在的証拠から経験的信頼性を推定する第2の内観的制御ループを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:52:14 GMT)
SCALER:Synthetic Scalable Adaptive Learning Environment for Reasoning [24.8] 強化学習(Reinforcement Learning, RL)は、大規模言語モデルの推論能力を高めるための原則的な方法である。
実際には、RLの進捗は、タスクの難しさがモデル能力と整合しなくなると遅くなります。
本稿では,適応環境設計による効果的な学習信号を維持する枠組みを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:43:32 GMT)
Frequency Error-Guided Under-sampling Optimization for Multi-Contrast MRI Reconstruction [24.2] マルチコントラストMRIは,完全サンプリング参照スキャンからの補完情報を活用することで,有望な方向として現れる。
既存のアプローチには,(1)表面的参照融合戦略,(2)参照コントラストによって提供される補完情報の不十分な利用,(3)固定アンダーサンプリングパターンの3つの大きな制限がある。
本稿では,これらの問題に対処するための,効率よく解釈可能な周波数誤差誘導再構成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:40:34 GMT)
BalDRO: A Distributionally Robust Optimization based Framework for Large Language Model Unlearning [24.1] BalDROは、バランスのとれたLLMアンラーニングのための、新しくて効率的なフレームワークである。
我々は、BalDRO-GとBalDRO-DVの2つの効率的な変種を通してBalDROをインスタンス化する。
TOFUとMUSEの実験では、BalDROは品質の忘れ方とモデルユーティリティの両方を大幅に改善している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:15:10 GMT)
Searth Transformer: A Transformer Architecture Incorporating Earth's Geospheric Physical Priors for Global Mid-Range Weather Forecasting [23.7] YanTianは、世界規模の中距離気象予報モデルである。
欧州中レージ気象予報センターの高解像度予測よりも精度が高い。
計算コストは通常の自己回帰微調整の約200倍のコストがかかる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:20:17 GMT)
Mi:dm 2.0 Korea-centric Bilingual Language Models [23.6] 韓国中心のAIを推進するために特別に設計されたバイリンガルな大規模言語モデル(LLM)であるMi:dm 2.0を紹介する。
このモデルは、朝鮮社会に固有の価値観、推論パターン、常識知識を統合することで、韓国のテキスト処理を越えている。
Mi:dm 2.0ラインナップはMITライセンス下でリリースされ、広範な研究と商用利用をサポートする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 01:28:29 GMT)
Benchmarking Post-Training Quantization of Large Language Models under Microscaling Floating Point Formats [23.6] マイクロスケーリング浮動小数点 (MXFP) は,大規模言語モデル (LLM) のための有望な低精度フォーマットとして登場した。
様々なポストトレーニング量子化(PTQ)アルゴリズムが提案されているが、主に整数量子化に焦点を当てている。
この研究は、MXFPフォーマットでPTQを体系的に調査し、7つのPTQアルゴリズム、15の評価ベンチマーク、3つのLLMファミリを含む。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:16:55 GMT)
Semantic Differentiation for Tackling Challenges in Watermarking Low-Entropy Constrained Generation Outputs [23.2] SeqMarkは意味分化を伴うシーケンスレベルの透かしアルゴリズムである。
出力品質、透かし検出性、認識不能性のバランスをとる。
一般的なトークンレベルの透かしアルゴリズムの欠点を改善する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:00:19 GMT)
GeoMotionGPT: Geometry-Aligned Motion Understanding with Large Language Models [23.2] 両モジュラリティが統一幾何基底を共有する場合、アライメントが最も効果的であると主張する。
我々は、Gumbel-Softmaxを用いたデコーダのみの量子化器を用いて、微分可能なトレーニングとバランスの取れたコードブックの使用について検討する。
我々のフレームワークは現在の最先端手法よりも20%の性能向上を実現している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:19:38 GMT)
Afri-MCQA: Multimodal Cultural Question Answering for African Languages [23.2] Afri-MCQAは、12カ国の15のアフリカ言語にわたる7.5万のQ&Aペアをカバーする、初の多言語文化質問回答ベンチマークである。
このベンチマークは、テキストと音声のモダリティに並列な英語とアフリカ語のQ&Aペアを提供しており、完全にネイティブスピーカーによって作成されている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:03:28 GMT)
ViSIL: Unified Evaluation of Information Loss in Multimodal Video Captioning [23.1] Video Summary Information Loss (ViSIL) スコアは、視覚言語モデル(VLM)推論モデルを用いて、要約によって取得されていない映像情報を定量化する情報理論フレームワークである。
以上の結果から,VSILスコアは映像質問応答タスクにおける人間とVLMのパフォーマンスと統計的に有意な相関を示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:14:47 GMT)
EvoFSM: Controllable Self-Evolution for Deep Research with Finite State Machines [23.1] EvoFSMは、明示的な有限状態マシンを進化させ、適応性と制御の両方を達成する構造化自己進化フレームワークである。
EvoFSMは、小さな制約された操作によってFSMを洗練し、また、再利用可能な事前および障害パターンとして成功したトラジェクトリを蒸留する自己進化メモリも組み込む。
特に、EvoFSMはDeepSearchベンチマークで58.0%の精度に達する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:19:13 GMT)
Bipartite Mode Matching for Vision Training Set Search from a Hierarchical Data Server [22.6] 階層型データサーバと双方向モードマッチングアルゴリズム(BMM)を併用して,ソースモードとターゲットモードの整列を行う。
既存のトレーニングセット検索アルゴリズムと比較して、一致したサーバモードが、ターゲットドメインとのドメインギャップを一定に小さくするトレーニングセットを構成することを示す。
検索したトレーニングセットでトレーニングされたモデルは、他のトレーニングされたモデルよりも精度が高い。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:55:14 GMT)
MVSS: A Unified Framework for Multi-View Structured Survey Generation [22.1] マルチビュー構造化サーベイ生成フレームワークであるMVSSを提案する。
引用接地された階層木、構造化比較表、およびサーベイテキストを生成し、調整する。
76のコンピュータサイエンスに関する実験では、MVSSは組織や根拠における既存の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:11:39 GMT)
Rethinking LLM-Driven Heuristic Design: Generating Efficient and Specialized Solvers via Dynamics-Aware Optimization [21.4] 本研究では,コンバージェンス・アウェア・ヒューリスティックス(DASH, Dynamics-Aware Heuristics)を提案する。
DASHは、さまざまな問題スケールにわたる最先端のベースラインのソリューション品質を越えながら、ランタイム効率を3倍以上改善します。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:06:42 GMT)
Video-MSR: Benchmarking Multi-hop Spatial Reasoning Capabilities of MLLMs [21.3] Video-MSRは、動的ビデオシナリオにおけるマルチホップ空間推論を評価するために設計された最初のベンチマークである。
当社のベンチマークでは,3,052の高品質ビデオインスタンスと4,993の質問応答ペアを,スケーラブルで視覚的なパイプラインで構築した。
本稿は,マルチホップ空間指導データの有効性を実証し,将来的な研究の基盤としてビデオMSRを確立した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:24:47 GMT)
Advancing ESG Intelligence: An Expert-level Agent and Comprehensive Benchmark for Sustainable Finance [21.3] ESGAgentは、特定のツールセットによって強化された階層型マルチエージェントシステムで、詳細なESG分析を生成する。
本稿では, 原子間共通感覚質問から, 総合的, 詳細な分析まで, 310件の企業サステナビリティレポートから得られた評価指標について述べる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:29:01 GMT)
Interpretable Probability Estimation with LLMs via Shapley Reconstruction [21.2] PRISM: シェープ測度による確率再構成は、確率推定に透明性と精度をもたらすフレームワークです。
実験では,PRISMにより直接的プロンプトよりも予測精度が向上することを示した。
ケーススタディでは、個々の要因が最終見積もりをどう形成するかを可視化し、LCMに基づく意思決定支援システムの信頼構築を支援する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:45:36 GMT)
FairGE: Fairness-Aware Graph Encoding in Incomplete Social Networks [21.1] FairGE (Fair Graph) は、不完全なソーシャルネットワークにおけるGTのためのフェアネス対応フレームワークである。
これはスペクトルグラフ理論を通じて直接公正性を符号化する。
これは、最先端のベースラインと比較して、統計的平等と機会の平等の両方において少なくとも16%改善されている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:33:05 GMT)
LiteEmbed: Adapting CLIP to Rare Classes [20.9] LiteEmbedはCLIPのパーソナライズのための軽量フレームワークである。
LiteEmbedは、CLIPの語彙内のテキスト埋め込みのサブスペース誘導最適化を実行する。
分類、検索、セグメンテーション、検出タスクにまたがるCLIPのオリジナルテキスト機能をシームレスに置き換える。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:53:11 GMT)
Bridging Semantic Understanding and Popularity Bias with LLMs [20.6] 本稿では,Large Language Model (RecLLM) を用いたレコメンデーションにより,人気バイアスの意味的理解のギャップを埋める新しいフレームワークを提案する。
FairLRMは人気バイアスをアイテムサイドとユーザサイドのコンポーネントに分解する。
FairLRMはフェアネスとレコメンデーションの精度を大きく向上させる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:37:37 GMT)
SCaLE: Switching Cost aware Learning and Exploration [20.5] 本研究は,オンライン凸最適化における計量移動コストの基本的な問題に対処する。
非有界な環境の一般クラスに対して、分布非依存の線形動的後悔を実現する最初のアルゴリズム SCaLE を提供する。
本稿では,固有値エラーによる後悔と固有ベイシス摂動による後悔を別々に定量化する新しいスペクトル後悔分析法を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:14:58 GMT)
Revisiting Human-vs-LLM judgments using the TREC Podcast Track [20.3] 我々は,大規模言語モデル (LLM) と人間専門家のユーザ合意に関する分析を行う。
この結果は2002年のSormunenのこれまでの知見を補強し、単一のアセスメントを頼りにすることでユーザ合意の低さにつながった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:08:29 GMT)
Query, Decompose, Compress: Structured Query Expansion for Efficient Multi-Hop Retrieval [19.4] 大規模言語モデル(LLM)は、クエリ拡張にますます採用されている。
DeCoR(Decompose and Compress for Retrieval)は構造化情報処理を基盤としたフレームワークである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:55:49 GMT)
Position on LLM-Assisted Peer Review: Addressing Reviewer Gap through Mentoring and Feedback [19.1] AI研究の急速な拡大により、レビューギャップが強化され、ピアレビューの持続可能性が脅かされ、低品質評価のサイクルが持続する。
高品質なピアレビューの中核となる原則を基礎とした2つの補完システムを提案する。
この人間中心のアプローチは、レビュアーの専門知識を強化し、より持続可能な学術的なエコシステムの構築に貢献することを目的としている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:32:35 GMT)
Hidden States as Early Signals: Step-level Trace Evaluation and Pruning for Efficient Test-Time Scaling [19.1] 大規模言語モデル(LLM)は、複数のトレースを生成することによって、テスト時間スケーリングを通じて推論能力を向上することができる。
長い推論トレースと多重サンプリングの組み合わせは、相当な計算とエンドツーエンドのレイテンシをもたらす。
隠れ状態を用いて推論ステップを評価する新しいプルーニングフレームワークであるStep-level Trace Evaluation and Pruningを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:54:55 GMT)
The Imperfective Paradox in Large Language Models [19.1] 本研究では,過去の進歩的側面が,達成のためのものではなく,活動のイベント実現を伴っている不完全なパラドックスについて検討する。
多様なセマンティッククラスでこの区別を探索するために設計された診断データセットであるImperfectiveNLIを紹介する。
広汎なテレロジカルバイアス: 目標志向のイベントの完了を体系的に幻覚させるモデル。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:57:16 GMT)
LCF3D: A Robust and Real-Time Late-Cascade Fusion Framework for 3D Object Detection in Autonomous Driving [18.9] 歩行者、サイクリスト、その他の車両などの正確な3Dオブジェクトの正確な位置決めは、自動運転に不可欠である。
LCF3Dは、RGB画像上の2Dオブジェクト検出器とLiDAR点雲上の3Dオブジェクト検出器を組み合わせた、新しいセンサー融合フレームワークである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:19:37 GMT)
KG-ViP: Bridging Knowledge Grounding and Visual Perception in Multi-modal LLMs for Visual Question Answering [18.9] KG-ViPはシーングラフとコモンセンスグラフを融合してMLLMを強化する統一フレームワークである。
KG-ViPフレームワークの中核は、クエリをセマンティックブリッジとして利用して、両方のグラフを段階的に統合する、新しい検索/融合パイプラインである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:16:11 GMT)
To Retrieve or To Think? An Agentic Approach for Context Evolution [18.9] エージェント・コンテクスト・エボリューション(ACE)は、人間のメタ認知にインスパイアされたフレームワークであり、既存の知識で新たなエビデンスや理由を求めるかどうかを決定する。
ACEは中央のオーケストレータエージェントを雇い、多数決によって戦略的に意思決定を行う。
私たちの研究は、複雑で知識集約的なタスクのための文脈進化生成に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:14:05 GMT)
Beyond Seen Bounds: Class-Centric Polarization for Single-Domain Generalized Deep Metric Learning [18.8] 単ドメイン一般化深度学習(SDG-DML)は、テスト中のカテゴリシフトとドメインシフトの両面での2つの課題に直面している。
一般化可能なDMLモデルを学ぶために,ドメイン分布を動的に拡張・制約する新しいDMLフレームワークであるCenterPolarを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:44:46 GMT)
Displacement-Squeeze receiver for BPSK displaced squeezed vacuum states surpassing the coherent-states Helstrom bound under imperfect conditions [18.5] BPSK置換真空状態(S-BPSK)を識別するための変位印加受信機(DSR)
すべての信号エネルギー N に対して、左[P_textHBtextDSS, 2P_textHBtextDSS right]$ は、等しい事前条件と理想条件の下で、$P_texterrtextDSR を示す。
非単位効率, 暗数, 位相拡散, 受波体熱雑音下での性能を定量化し, MAPしきい値適応はこれらの非理想性に対して堅牢性を提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:05:26 GMT)
MM-BRIGHT: A Multi-Task Multimodal Benchmark for Reasoning-Intensive Retrieval [18.5] MM-BRIGHTは推論集約検索のための最初のマルチモーダルベンチマークである。
我々のデータセットは29の技術的領域にまたがる2,803の現実世界のクエリで構成されています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:31:54 GMT)
MMR-GRPO: Accelerating GRPO-Style Training through Diversity-Aware Reward Reweighting [18.2] 本稿では,MMR-GRPOを提案する。
MMR-GRPOは、平均47.9%のトレーニングステップと70.2%のウォールクロック時間を必要とする一方で、同等のピークパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:35:19 GMT)
The PROPER Approach to Proactivity: Benchmarking and Advancing Knowledge Gap Navigation [18.0] ほとんどの言語ベースのアシスタントはリアクティブなQ&Aパラダイムに従っており、ユーザは自身のニーズを明示的に表現する必要がある。
次元生成エージェント(DGA)と応答生成エージェント(RGA)を組み合わせた新しい2エージェントアーキテクチャであるProPerを紹介する。
RGAは明示的および暗黙的な次元のバランスをとり、タイムリーかつ積極的な介入でパーソナライズされた応答を調整する。
以上の結果から,ProPerはすべての領域における品質スコアと勝利率を改善し,シングルターン評価において最大84%,マルチターンインタラクションにおいて一貫した優位性を実現した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:13:01 GMT)
RAM-SD: Retrieval-Augmented Multi-agent framework for Sarcasm Detection [17.8] RAM-SDは、Sarcasm Detectionのための検索拡張マルチエージェントフレームワークである。
2)メタプランナはサルクサム型を分類し,事前定義された集合から最適な推論計画を選択し,(3)特殊エージェントのアンサンブルは相補的で多視点的な分析を行う。
RAM-SDは4つの標準ベンチマークで評価され、最先端のマクロF1の77.74%を達成し、GPT-4o+CoCベースラインの7.01を上回った。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:19:40 GMT)
PrivLEX: Detecting legal concepts in images through Vision-Language Models [17.8] PrivLEXは、法的概念に沿った最初の解釈可能なプライバシー分類器である。
PrivLEXは、解釈可能な分類を提供するためにゼロショットのVLM概念の検出に依存している。
画像に存在する個人データの概念を識別するPrivLEXの能力を実証する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:51:48 GMT)
Trustworthy Longitudinal Brain MRI Completion: A Deformation-Based Approach with KAN-Enhanced Diffusion Model [17.8] 縦断的脳MRIは、寿命の研究には不可欠であるが、高い摂食率は、しばしば欠落データにつながる。
深層生成モデルは研究されてきたが、ほとんどは画像強度に頼っている。
我々は,コンモゴロフ・アルノルドネットワーク(KAN)を拡張した拡散モデルであるDF-DiffComを紹介した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:41:40 GMT)
SafeTalkCoach: Diversity-Driven Multi-Agent Simulation for Parent-Teen Health Conversations [17.6] SafeTalkCoachは、性的健康に関する親子の会話をシミュレートするマルチエージェント対話生成フレームワークである。
私たちの目標は、SafeTalkCoachフレームワークとデータセットが、AI研究と健康コミュニケーションのプラクティスの両方をサポートすることです。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:58:00 GMT)
MathMixup: Boosting LLM Mathematical Reasoning with Difficulty-Controllable Data Synthesis and Curriculum Learning [17.5] MathMixupは、高品質で難易度の高い数学的推論問題を生成する新しいデータ合成パラダイムである。
本研究では,MathMixupとそのカリキュラム学習戦略が大規模言語モデルの数学的推論性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:28:42 GMT)
GI-Bench: A Panoramic Benchmark Revealing the Knowledge-Experience Dissociation of Multimodal Large Language Models in Gastrointestinal Endoscopy Against Clinical Standards [17.5] 我々は,パノラマ性消化管内視鏡のワークフローにおけるMLLM(Multimodal Large Language Models)の評価を行った。
細粒度病変を20種類含むGI-Benchを作成した。
モデルでは、人間に比べて言語的可読性に優れたレポートを生成する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:26:26 GMT)
DatBench: Discriminative, Faithful, and Efficient VLM Evaluations [17.2] 経験的評価は、基礎モデルにおける研究の進展を導く主要なコンパスとして機能する。
評価が満足すべき3つのデシラタを提案する。モダリティと応用への忠実さ、品質の異なるモデル間の識別可能性、計算効率である。
私たちはDatBench-Fullをリリースした。DatBench-Fullは9つのVLM機能にまたがる33のデータセットからなるクリーンな評価スイートであり、DatBenchは平均13倍のスピードアップを達成する識別サブセットである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:10:23 GMT)
Small but Mighty: Dynamic Wavelet Expert-Guided Fine-Tuning of Large-Scale Models for Optical Remote Sensing Object Segmentation [17.2] 本稿では,WEFTと呼ばれるトレーニング可能なパラメータの少ない動的ウェーブレットエキスパート誘導ファインチューニングパラダイムを提案する。
我々のWEFTは、3つのORSIデータセット上で21の最先端(SOTA)メソッドより優れているだけでなく、カモフラージュ、自然、医療シナリオにおいて最適な結果が得られる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:11:50 GMT)
FairGU: Fairness-aware Graph Unlearning in Social Network [17.1] フェアネスを意識したグラフアンラーニングフレームワークであるFairGUを紹介する。
FairGUは、有効データ保護戦略を備えた専用のフェアネス対応モジュールを統合している。
FairGUは、最先端のグラフアンラーニング手法よりも一貫して優れていることを実証する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:21:39 GMT)
Why not Collaborative Filtering in Dual View? Bridging Sparse and Dense Models [17.0] 協調フィルタリングは現代のレコメンデーターシステムの基盤となっている。
密埋め込みのセマンティック表現性とスパース相互作用パターンの構造的信頼性を統合した統合フレームワークSaD(Sparse and Dense)を提案する。
これら2つの視点を整合させることで、より優れたグローバルSNRが得られることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:47:07 GMT)
DSL-R1: From SQL to DSL for Training Retrieval Agents across Structured and Unstructured Data with Reinforcement Learning [16.9] DSL-R1は、論理的推論とセマンティックマッチングを相乗化する統合フレームワークである。
本稿では,ルールベースの実行フィードバックと検索品質報酬を併用してDSL生成を最適化する強化学習機構を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:04:54 GMT)
When to Invoke: Refining LLM Fairness with Toxicity Assessment [16.8] 大規模言語モデル(LLM)は、オンラインモデレーションシステムにおける毒性評価にますます利用されている。
本研究では, 早期誘導毒性評価によりLCMの公平性を高める推論時フレームワークであるFairToTを提案する。
ベンチマークデータセットの実験では、FairToTは安定的で信頼性の高い毒性予測を維持しながら、グループレベルの格差を低減する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:35:56 GMT)
KryptoPilot: An Open-World Knowledge-Augmented LLM Agent for Automated Cryptographic Exploitation [16.4] KryptoPilot(クリプトパイロット)は、オープンソースの知識強化型LLMエージェントである。
我々は、KryptoPilotがInterCode-CTFの完全な解決率を達成し、NYU-CTFベンチマークにおける暗号化課題の56~60%を解決し、ライブコンペティションにおける33の暗号課題のうち26の解決に成功したことを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:02:40 GMT)
Empathy Applicability Modeling for General Health Queries [16.4] 本稿では、感情反応や解釈の適用性の観点から、患者クエリを分類する理論駆動型アプローチである共感適応フレームワーク(EAF)を紹介する。
EAFは、応答生成前の共感のニーズを特定するためのフレームワークを提供し、予測共感モデリングのベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:47:02 GMT)
LLMs Meet Isolation Kernel: Lightweight, Learning-free Binary Embeddings for Fast Retrieval [16.3] 大規模言語モデル(LLM)は近年,テキスト表現の大幅な進歩を実現している。
埋め込みは通常高次元であり、かなりのストレージと検索オーバーヘッドをもたらす。
本稿では,LLM埋め込みをバイナリ埋め込みに変換する学習自由な手法であるEmphIsolation Kernel Embedding(IKE)を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:54:09 GMT)
Learning to Decode in Parallel: Self-Coordinating Neural Network for Real-Time Quantum Error Correction [16.3] 我々は,SOTAの精度と実時間量子誤り訂正に必要なスループットを同時に達成する,最初のスケーラブルでニューラルネットベースの並列デコーディングフレームワークを提案する。
我々は,本手法を用いて,1ラウンドあたり1us以内で最大25個の面符号を復号できる1個のTPU v6eを実証した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:04:25 GMT)
Bayesian Robust Financial Trading with Adversarial Synthetic Market Data [16.0] アルゴリズムトレーディングは、トレーディング決定を行うための機械学習モデルに依存している。
インサンプルのパフォーマンスは高いが、これらのモデルは、進化する現実世界の市場体制に直面すると劣化することが多い。
本稿では,マクロ条件付き生成モデルとロバストなポリシー学習を統合したベイズロバストフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:15:46 GMT)
Adaptive Requesting in Decentralized Edge Networks via Non-Stationary Bandits [16.0] 複数のクライアント、アクセスノード(AN)、サーバからなるエッジネットワークにおいて、時間に敏感なクライアントの情報鮮度を最適化することを目的とした分散協調要求問題について検討する。
我々は、報酬を顧客によるANの選択による情報削減の年齢と定義し、この問題を静止しないマルチアームバンディットとして定式化する。
この分散された部分的に観測可能な環境では、結果として得られる報酬プロセスは履歴に依存し、クライアント間で結合され、期待される報酬の急激な変化と漸進的な変化を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:16:54 GMT)
Is Grokking Worthwhile? Functional Analysis and Transferability of Generalization Circuits in Transformers [16.0] 本研究は,知識同化と伝達における一般化回路の役割を評価するための研究である。
我々は、暗記された原子の事実を自然に確立された推論経路に統合する過程であると主張している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:40:35 GMT)
Efficient Camera-Controlled Video Generation of Static Scenes via Sparse Diffusion and 3D Rendering [15.8] 生成モデルは、非常にリアルなクリップを生成することができるが、計算的に非効率であり、ほんの数秒間、数分のGPU時間を必要とすることが多い。
本稿では,静的シーンのカメラコンディショニング映像生成のための新しい戦略について検討する。
提案手法は, 幾何整合性を確保しつつ, 数百フレームにわたる生成コストを補正する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:50:06 GMT)
Deep Incomplete Multi-View Clustering via Hierarchical Imputation and Alignment [15.4] 本稿では,階層的な命令処理と4つのキーコンポーネントのアライメントを統合する,新しいディープIMVCフレームワークを提案する。
ベンチマーク実験により、我々のフレームワークは、様々なレベルの欠落下で優れたパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:46:00 GMT)
Vision Foundation Models for Domain Generalisable Cross-View Localisation in Planetary Ground-Aerial Robotic Teams [15.1] 我々は、機械学習を用いて、限られた視野の単眼の地上RGB画像を入力として、局所的な空域マップに自分自身をローカライズするローバーについて検討する。
機械学習手法における重要な考慮事項は、トレーニングに適した接地位置ラベルを持つ実空間データが不足していることである。
クロスビュー・ローカライズされたデュアルエンコーダディープニューラルネットワークを用いた空中地図におけるローバーのローカライズ手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:11:05 GMT)
ReflexDiffusion: Reflection-Enhanced Trajectory Planning for High-lateral-acceleration Scenarios in Autonomous Driving [14.9] ReflexDiffusionは、反射調整により拡散に基づく軌道プランナーを強化する推論段階のフレームワークである。
最先端(SOTA)法よりも14.1%向上した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:03:29 GMT)
Explicating Tacit Regulatory Knowledge from LLMs to Auto-Formalize Requirements for Compliance Test Case Generation [14.8] 本稿では,自動形式化とコンプライアンステスト生成のためのフレームワークであるRAFTを提案する。
金融、自動車、電力分野における実験は、RAFTが専門家レベルのパフォーマンスを達成することを示している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:31:42 GMT)
Identity-Robust Language Model Generation via Content Integrity Preservation [14.6] 本稿では,コア応答品質の同一性に依存した劣化について検討する。
このミスマッチに触発された我々は、アイデンティティ・ロバスト生成のための軽量でトレーニング不要なフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:25:29 GMT)
MoCha:End-to-End Video Character Replacement without Structural Guidance [14.6] MoChaは、ビデオキャラクタをユーザが提供するアイデンティティに置き換えるためのフレームワークである。
条件対応のRoPEを導入し,RLをベースとしたポストトレーニングステージを採用する。
我々は,Unreal Engine 5 (UE5)で構築された高忠実なレンダリングデータセット,現在のポートレートアニメーション技術で合成された表現駆動データセット,既存のビデオマスクペアから派生した拡張データセットの3つの特別なデータセットを設計する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:17:20 GMT)
Improving Symbolic Translation of Language Models for Logical Reasoning [14.5] 小さな言語モデル(LM)は、しばしば自然言語(NL)を一階述語論理(FOL)に変換するのに苦労する。
既存のアプローチは通常、これらのエラーを修正するために自己イテレーションに依存するが、そのような方法は基礎となるモデルの能力に大きく依存する。
本稿では,予測を述語生成とFOL翻訳の2段階に分割し,モデル動作の制御性を高めるインクリメンタル推論を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:47:14 GMT)
Draw it like Euclid: Teaching transformer models to generate CAD profiles using ruler and compass construction steps [14.3] 本稿では,コンピュータ支援設計(CAD)プロファイルを生成する新しい手法を提案する。
これらのシーケンスは、デザイナによって提供される幾何学から始まり、最終プロファイルのポイントと曲線をステップ単位で構築する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:17:34 GMT)
STEMVerse: A Dual-Axis Diagnostic Framework for STEM Reasoning in Large Language Models [14.3] 大規模言語モデル(LLM)の推論能力の分析を目的とした診断フレームワークを提案する。
私たちは、主流ベンチマークから2万以上のSTEM問題を、統一された"Discipline $times$ Cognition"機能空間に再集約します。
実験結果から,STEM推論における構造的故障パターンが明らかになった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:17:12 GMT)
Lean Clients, Full Accuracy: Hybrid Zeroth- and First-Order Split Federated Learning [13.9] Split Federated Learning (SFL)は、リソース制約のあるエッジデバイスと計算量の多いサーバとの協調トレーニングを可能にする。
通信オーバーヘッドはSFLの中心的な問題であり、補助的なネットワークで緩和することができる。
HERON-SFLは、サーバ上の一階(FO)最適化を維持しながら、ローカルクライアントトレーニングのためのゼロ階(ZO)最適化を統合する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:17:49 GMT)
A continental-scale dataset of ground beetles with high-resolution images and validated morphological trait measurements [13.9] 地上の甲虫は生態系の健康にとって重要な生物指標である。
ナショナル・エコロジー・オブザーバネットワーク(NEON)は、アメリカ全土のカラビッド標本を広範囲に収集している。
大陸とハワイにまたがる30の地点から,高分解能イメージングにより13,200 NEON カラビドをデジタル化したデータセットを作成した。
データセットは、デジタルで測定された各標本の長さと幅を含み、AIを用いた自動形質抽出の基礎を確立する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:44:54 GMT)
$D^2Prune$: Sparsifying Large Language Models via Dual Taylor Expansion and Attention Distribution Awareness [13.6] 大規模言語モデル(LLM)は、その膨大な計算要求のため、重大なデプロイメント上の課題に直面している。
本稿では,これらの制約に対処するため,新しいプルーニング法である$D2Prune$を提案する。
D2Prune$ は、様々な LLM でSOTA メソッドを一貫して上回る。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:17:35 GMT)
Towards Robust Cross-Dataset Object Detection Generalization under Domain Specificity [13.5] 本研究では, クロスデータセットオブジェクト検出(CD-OD)について, 設定特異性のレンズを用いて検討する。
ベンチマークを、さまざまな日常シーンと、狭い環境に関連付けられた設定固有のデータセットで、設定に依存しないデータセットにグループ化する。
同じ設定タイプ内での転送は比較的安定であり、設定タイプ間での転送は実質的に減少し、しばしば非対称である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:03:11 GMT)
PrivacyReasoner: Can LLM Emulate a Human-like Privacy Mind? [13.5] 本稿では、現実世界のニュースに応答して、個々のユーザがプライバシの懸念をどう形成するかをシミュレートするAIエージェント設計であるPRAを紹介する。
現実のHacker Newsに関する議論の実験では、プライバシに関する予測において、PRAがベースラインエージェントより優れていることが示されている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:47:06 GMT)
Mixture of Distributions Matters: Dynamic Sparse Attention for Efficient Video Diffusion Transformers [13.4] サンプリング不要な動的アテンションフレームワークMOD-DiTを提案する。
2段階のプロセスを通じて、注意パターンの進化を正確にモデル化する。
従来のスパースアテンションアプローチの計算的制限を克服する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:25:39 GMT)
GlovEgo-HOI: Bridging the Synthetic-to-Real Gap for Industrial Egocentric Human-Object Interaction Detection [13.3] 本稿では,産業用EHOIの新しいベンチマークデータセットであるGlovEgo-HOIと,Glove-HeadモジュールとKeypoint-Headモジュールを統合したモデルであるGlovEgo-Netを紹介する。
さらなる研究を促進するため、GlovEgo-HOIデータセット、拡張パイプライン、事前トレーニングされたモデルをGitHubプロジェクトでリリースしています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:52:20 GMT)
Fragmented Topological Excitations in Generalized Hypergraph Product Codes [13.3] 本研究では,最近提案された一般構成法により得られたコード群中のフラクトントポロジカルな順序について検討する。
我々は、安定化器の幾何学に基づいて、対応する正確に解けるスピンモデル(英語版)をテクトサーソプレックスモデル(英語版)と呼ぶ。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:14:46 GMT)
HGATSolver: A Heterogeneous Graph Attention Solver for Fluid-Structure Interaction [13.3] 流体-構造相互作用(FSI)システムは、異なる物理領域、流体と固体を含み、異なる偏微分方程式によって制御され、動的界面で結合される。
学習に基づく解法はコストのかかる数値シミュレーションに代わる有望な代替手段を提供するが、既存の手法は統合されたフレームワーク内でのFSIの不均一なダイナミクスを捉えるのに苦労している。
この課題は、インターフェイス結合によるドメイン間の応答の不整合と、流体と固体領域間の学習困難の相違によりさらに悪化し、予測中に不安定になる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:38:02 GMT)
Exploring Organizational Readiness and Ecosystem Coordination for Industrial XR [13.2] 拡張現実(XR)は、産業支援、訓練、変革的メンテナンスの可能性を秘めている。
しかし、職業価値とハードウェアの成熟が証明されたにもかかわらず、広く採用が遅れた。
本研究では,17名の専門家インタビューの質的生態系分析を通じて,この現象を考察する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:21:53 GMT)
Zero-Error List Decoding for Classical-Quantum Channels [13.1] リスト復号化の設定において、純状態古典量子チャネルのゼロエラー能力について検討する。
リストサイズ2と固定リストサイズ毎の逆バウンドに対する達成可能性を提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:00:02 GMT)
Antisocial behavior towards large language model users: experimental evidence [13.0] 大規模言語モデル(LLM)は、彼らが引き起こした社会的反応に懸念を抱いている。
2段階のオンライン実験では、参加者は、LLMサポートの有無に関わらず、前もってリアルタイムタスクを完了した仲間の利益を減らすために、自身の寄付の一部を費やすことができた。
参加者は平均して、モデルにのみ依存する人々の36%の利益を壊した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:02:22 GMT)
SafePlanner: Testing Safety of the Automated Driving System Plan Model [12.8] SafePlannerは、自動運転システムのプランモデルにおける安全クリティカルな欠陥を特定するためのフレームワークである。
構造的に意味のあるテストシナリオを生成し、有害な計画行動を検出する。
83.63パーセントの機能を達成し、63.22パーセントの意思決定をプランモデルでカバーし、バグ発見と効率の両方においてベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:14:00 GMT)
Do Sparse Autoencoders Identify Reasoning Features in Language Models? [12.7] 大規模言語モデル(LLM)において,スパースオートエンコーダ(SAE)が真の推論特徴を識別するかどうかを検討する。
我々はまず、$ell_$-regularized SAEsが本質的に低次元パターンに偏っているという単純な理論分析を通して示す。
このバイアスに触発され,機能活性化が推論過程を反映しているか,あるいは表層言語的相関を反映しているかを検証するために,ファルシフィケーション指向評価フレームワークを導入する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:46:18 GMT)
TeachPro: Multi-Label Qualitative Teaching Evaluation via Cross-View Graph Synergy and Semantic Anchored Evidence Encoding [12.6] 5つの重要な教科を体系的に評価する多言語学習フレームワークであるTeachProを提案する。
まず,3つのコアコンポーネントを統合するDmension-Anchored Evidenceを提案する。
次に,学生のコメントを表現できるクロスビューグラフ合成ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:27:57 GMT)
PhyRPR: Training-Free Physics-Constrained Video Generation [12.5] ビデオ生成のためのトレーニング不要な3段階パイプラインを提案する。
textitPhyulineReason--textitPhyulinePlan--textitPhyulineRefine
textitPhyReasonは、物理状態推論のための大規模なマルチモーダルモデルと、合成のためのイメージジェネレータを使用する。
textitPhyPlanは、制御可能な粗い動きの足場を決定的に合成する。
textit
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:41:56 GMT)
BrainSegNet: A Novel Framework for Whole-Brain MRI Parcellation Enhanced by Large Models [12.5] MRIによる全脳のパーセレーションは、脳を多数の小さな不規則な形状の領域に分割する複雑さのため、非常に難しい課題である。
伝統的にテンプレート登録法が用いられてきたが、近年の進歩はより高速なパーセレーションのために深層学習に移行している。
本稿では,SAMを正確に95領域に適応させる新しいフレームワークであるBrainSegNetを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:58:36 GMT)
Population-Aligned Audio Reproduction With LLM-Based Equalizers [12.4] 我々は、自然言語のプロンプトを等化設定にマッピングするLarge Language Model (LLM)ベースの代替手法を導入する。
提案モデルでは,テキスト内学習とパラメータ効率の優れた微調整技術を用いて,個体群が優先する等化設定を確実に整合させる。
これらの結果から,LLMは「人工等化器」として機能し,よりアクセシブルでコンテキスト認識,エキスパートレベルの音声チューニング手法の開発に寄与することが示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:51:36 GMT)
OrthoGeoLoRA: Geometric Parameter-Efficient Fine-Tuning for Structured Social Science Concept Retrieval on theWeb [12.3] 完全な微調整は計算的かつエネルギー集約的であり、Web4Goodエコシステム内の小さな機関や非営利団体では禁止される可能性がある。
そこでOrthoGeoLoRA を導入し,SVD のような形式を$W = BAtop$ とする。
また,ヨーロッパ言語社会科学シソーラスの階層的概念検索のためのベンチマークも提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:34:40 GMT)
STaR: Sensitive Trajectory Regulation for Unlearning in Large Reasoning Models [12.1] 本稿では、推論プロセスを通じて堅牢なプライバシ保護を実現するパラメータフリー・推論時アンラーニングフレームワークを提案する。
R-TOFUベンチマークの実験は、STaRが最小限のユーティリティ損失で包括的で安定したアンラーニングを実現することを示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:35:23 GMT)
DepRadar: Agentic Coordination for Context Aware Defect Impact Analysis in Deep Learning Libraries [12.1] DepRadarは、DLライブラリのアップデートにおけるきめ細かい欠陥と影響分析のためのエージェント調整フレームワークである。
静的解析とDL固有のドメインルールを統合し、欠陥推論とクライアント側のトレースを行う。
122のクライアントプログラムにおいて、DepRadarは90%のリコールと80%の精度で影響を受けるケースを特定し、他のベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:41:39 GMT)
Enhancing Spatial Reasoning in Large Language Models for Metal-Organic Frameworks Structure Prediction [12.0] 大型言語モデル (LLM) は結晶生成において有望であるが、MOFへの応用はMOFの高原子量化によって妨げられている。
ブロックレベルのMOF構造予測に特化して適応した最初のLLMフレームワークであるMOF-LLMを紹介する。
提案手法は,正確なMOF構造予測のためのQwen-38Bモデルの空間推論能力を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:45:07 GMT)
Mass Distribution versus Density Distribution in the Context of Clustering [11.8] 密度分布は、その基本的な限界、すなわち高密度バイアスを持つことを示す。
本稿では,全クラスタの総質量を最大化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:55:35 GMT)
MedVL-SAM2: A unified 3D medical vision-language model for multimodal reasoning and prompt-driven segmentation [11.8] 本稿では,レポート生成,VQA,マルチパラダイムセグメンテーションをサポートする統合された3次元医療マルチモーダルモデルを提案する。
MedVL-SAM2は、画像レベルの推論とピクセルレベルの認識を3D医療画像用に調整された凝集性アーキテクチャによって統合する。
我々の統合アーキテクチャは、レポート生成、VQA、複数の3Dセグメンテーションタスクにまたがって最先端のパフォーマンスを提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:21:00 GMT)
SITA: Learning Speaker-Invariant and Tone-Aware Speech Representations for Low-Resource Tonal Languages [11.7] SITAは、事前訓練されたwav2vecスタイルのエンコーダに対して、話者不変性とトーン認識を強制する軽量な適応レシピである。
音色を効果的に表現できない多言語エンコーダであるHmongを主眼として評価した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:42:27 GMT)
Burn-After-Use for Preventing Data Leakage through a Secure Multi-Tenant Architecture in Enterprise LLM [11.5] 本研究は, 安全なマルチテナントアーキテクチャ (SMTA) と新しい概念であるバーン・アフター・ユース (BAU) を組み合わせたものである。
BAUは、使用後に自動的に破棄される短命な会話コンテキストを強制することによって、データの機密性を導入する。
その結果,SMTAとBAUが連携して厳密な隔離,セッションの短命性,強い機密性保証,非永続性,企業LLMの政策整合性などを実施できることが示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:29:48 GMT)
Do Transformers Understand Ancient Roman Coin Motifs Better than CNNs? [11.0] 本稿では,コイン上の意味要素を識別するタスクにViT(Vision Transformer)ディープラーニングアーキテクチャを適用した最初の例である。
ViTモデルは、新しく訓練されたCNNモデルよりも正確であることが判明した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:30:49 GMT)
Multi-Modal LLM based Image Captioning in ICT: Bridging the Gap Between General and Industry Domain [10.8] 本稿では、ICTにおけるドメイン固有画像キャプチャーモデル(DICModel)の訓練のための多段階プログレッシブトレーニング戦略を提案する。
実験の結果,7Bパラメータしか持たないDICModelは,32Bパラメータを持つ他の最先端モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:01:46 GMT)
GeoRA: Geometry-Aware Low-Rank Adaptation for RLVR [10.8] RL更新部分空間の異方性と圧縮性を利用したGeoRAを提案する。
GeoRAは、幾何学的ミスアライメントによる最適化ボトルネックを緩和する。
主要な数学ベンチマークで確立された低ランクのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:41:34 GMT)
UniHash: Unifying Pointwise and Pairwise Hashing Paradigms for Seen and Unseen Category Retrieval [10.8] 本稿では,統一ハッシュ(UniHash)を提案する。
UniHashは2つの相補的なブランチで構成されている: ポイントワイドパラダイムに従うセンターベースのブランチとペアワイドパラダイムに従うペアワイドブランチである。
分岐間の双方向の知識伝達を可能にし、ハッシュコードの識別性と一般化を改善するため、新しいハッシュコード学習法が導入された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:43:48 GMT)
A Deep Dive into OpenStreetMap Research Since its Inception (2008-2024): Contributors, Topics, and Future Trends [10.7] OpenStreetMap (OSM) は、先駆的なボランティア地理情報(VGI)プロジェクトから、グローバルな多分野研究ネクサスへと移行した。
本研究はOSM研究ランドスケープの文献的・体系的分析を行い,その発達軌跡と鍵駆動力について検討する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:13:48 GMT)
LISP -- A Rich Interaction Dataset and Loggable Interactive Search Platform [10.6] 対話型情報検索(IIR)における人間の探索行動研究のための再利用可能なデータセットと関連インフラを提案する。
このデータセットは、61人の参加者からの詳細なインタラクションログと、知覚速度、トピック固有の関心、検索専門知識、人口統計情報など、ユーザ特性を組み合わせたものだ。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:49:13 GMT)
LLM for Large-Scale Optimization Model Auto-Formulation: A Lightweight Few-Shot Learning Approach [10.4] LEAN-LLM-OPTは大規模なOPTimizationオートフォーミュレーションのためのワークフローフレームワークである。
モデリングタスクを構造化されたサブタスクに分解し、機械的なデータ処理操作を補助ツールにオフロードする。
大規模最適化モデリングタスクにおいて高い性能を達成し、最先端のアプローチと競合する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:09:57 GMT)
CAST: Character-and-Scene Episodic Memory for Agents [10.4] 本稿ではドラマティック理論に着想を得たキャラクタ・アンド・シーン型メモリアーキテクチャ(CAST)を提案する。
CASTは3Dシーンを構築し、それを文字プロファイルに整理し、文字のイベントを要約してエピソード記憶を表現する。
CASTは、さまざまなデータセットのベースラインよりも平均8.11% F1と10.21% J(LLM-as-a-Judge)が改善されている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:06:16 GMT)
Full Disclosure, Less Trust? How the Level of Detail about AI Use in News Writing Affects Readers' Trust [10.2] 発見によると、すべてのAI開示が透明性のジレンマを引き起こすのではなく、より透明性を求める読者の欲求とAI支援ニュースコンテンツに対する信頼とのトレードオフを反映している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:45:45 GMT)
Dialogue Telemetry: Turn-Level Instrumentation for Autonomous Information Gathering [10.1] 本稿では,各質問応答交換後に2つのモデルに依存しない信号を生成する測定フレームワークである対話テレメトリ(DT)を紹介する。
我々は,大規模言語モデル(LLM)に基づくシミュレーションを用いて,制御された検索・救助(SAR)に触発されたインタビューにおけるDTの有効性を検証する。
DTは解釈可能なターンレベルのインスツルメンテーションを提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:39:52 GMT)
Video Joint-Embedding Predictive Architectures for Facial Expression Recognition [10.0] 本稿では,映像統合型予測アーキテクチャ(V-JEPA)の顔表情認識(FER)への応用について紹介する。
V-JEPAは、マスキング領域の埋め込みからマスクされた領域の埋め込みを予測することによって学習する。
我々は、RAVDESSとCREMA-Dデータセットを使用して浅い分類器を訓練し、RAVDESSの最先端性能を達成し、CREMA-Dの他の視覚ベースの手法よりも優れた性能を発揮する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:48:11 GMT)
Reward Learning through Ranking Mean Squared Error [10.0] レーティングに基づくRL(R4)のランク付き回帰学習手法を提案する。
その中核として、R4は、教師が提供する評価を順序的目標として扱う、新しいランク付け平均二乗誤差(rMSE)損失を採用している。
ロボットロコモーションベンチマークにおいて、R4が既存の評価基準と嗜好に基づくRL法と一貫して一致し、性能が向上することが実証された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:18:12 GMT)
Pairing-free Group-level Knowledge Distillation for Robust Gastrointestinal Lesion Classification in White-Light Endoscopy [9.9] PaGKDはグループレベルで活動し、より完全で互換性のある知識をモダリティにわたって蒸留する。
4つの臨床データセットの実験により、PaGKDは一貫して、最先端の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:24:18 GMT)
Private Links, Public Leaks: Consequences of Frictionless User Experience on the Security and Privacy Posture of SMS-Delivered URLs [9.8] Short Message Service(SMS)は本質的に安全ではなく、多くのレポートがメッセージのインターセプションとデータリークを文書化している。
我々は、3300万件以上の電話番号から抽出された322万件以上のSMS配信URLについて調査を行った。
我々は177のサービスに影響を及ぼす701のエンドポイントにおけるPII(Personally Identible Information)の露出を同定し、検証する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:12:10 GMT)
CLARE: Continual Learning for Vision-Language-Action Models via Autonomous Adapter Routing and Expansion [9.8] CLAREは、視覚-言語-アクションモデルによる模範のない連続学習のためのフレームワークである。
CLAREは,従来のタスクを壊滅的に忘れることなく,新しいタスクにおいて高いパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:23:42 GMT)
Exploring Reliable Spatiotemporal Dependencies for Efficient Visual Tracking [9.6] STDTrackは、信頼性のある時間的依存関係を軽量トラッカーに統合する先駆的なフレームワークである。
本稿では,時間的プロパゲートトークンを導入し,フレーム単位の特徴抽出をガイドする。
異なるサイズのオブジェクトに動的に適応するマルチスケール予測ヘッドを開発した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:22:05 GMT)
GIFT: Unlocking Global Optimality in Post-Training via Finite-Temperature Gibbs Initialization [9.4] 統合後トレーニングフレームワーク内でのスーパービジョンファインチューニング(SFT)の再構築と,有限温度によるギブズ初期化(GIFT)の提案
GIFTは、有限温度のエネルギーポテンシャルとして監督を取り入れ、訓練後のパイプライン全体を通して客観的な一貫性を確保するための分散ブリッジを確立する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:13:57 GMT)
From Conflicts to Collisions: A Two-Stage Collision Scenario-Testing Approach for Autonomous Driving Systems [9.1] 中間探索対象として衝突関連コンフリクトの概念を導入する。
本稿では,まずコンフリクトを検索し,実際の衝突を誘発するためにこれらのコンフリクトシナリオを変更可能な2段階シナリオテストフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:24:22 GMT)
When to Trust: A Causality-Aware Calibration Framework for Accurate Knowledge Graph Retrieval-Augmented Generation [9.1] Knowledge Graph Retrieval-Augmented Generation (KG-RAG) は知識グラフから構造化知識を取り入れることでRAGパラダイムを拡張している。
既存のKG-RAGモデルは、しばしば非常に過信であり、検索されたサブグラフが不完全または信頼できない場合でも、高い信頼度を予測する。
KG-RAGのための因果認識フレームワークであるCa2KGを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:22:59 GMT)
Where Knowledge Collides: A Mechanistic Study of Intra-Memory Knowledge Conflict in Language Models [9.0] 言語モデル(LM)では、同じ事象に関する一貫性のない情報がモデルのパラメトリックな知識に符号化されると、メモリ内知識の衝突が発生する。
我々は、機械的解釈可能性法を用いて、事前学習データからの知識の相反が、LM内にエンコードされる場所と方法を特定する。
本研究は,言語モデルの特定の内部成分が,事前学習から相反する知識を符号化する役割を担っているという証拠の蓄積に寄与する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:45:52 GMT)
Now You See Me, Now You Don't: A Unified Framework for Expression Consistent Anonymization in Talking Head Videos [8.9] 顔ビデオの匿名化は、多くのコンピュータビジョンの下流タスクにおけるビデオの分析を可能にしながら、プライバシーの保護を目的としている。
本稿では,顔画像の識別を合理化するための新しい統一フレームワークであるAnon-NETを提案する。
我々は高レベル認識と動き認識属性表現の伝達によって導かれる拡散ベース生成モデルにより顔にペンキを塗る。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:42:44 GMT)
Examining DOM Coordinate Effectiveness For Page Segmentation [8.8] Webページは、日々の人的消費のために利用可能なデータの基盤を形成します。
既存の作業、Webページを利用したドキュメントオブジェクトモデル(DOM)は、しばしばDOMから通知される座標からクラスタ化ベクターを導出します。
本研究は,WebページセグメンテーションにおけるDOMコーディネートの影響を詳細に把握するために,DOMコーディネートを提案し,検討する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:05:42 GMT)
Contrastive Geometric Learning Unlocks Unified Structure- and Ligand-Based Drug Design [8.6] 統一医薬品設計のためのコントラスト幾何学学習(ConGLUDe)について紹介する。
ConGLUDeは予測された構造とリガンドベースのトレーニングを統合する。
仮想スクリーニングと標的漁業をサポートし、タンパク質-リガンド複合体と大規模生物活性データで共同で訓練されている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:45:08 GMT)
M$^3$Searcher: Modular Multimodal Information Seeking Agency with Retrieval-Oriented Reasoning [8.5] M$3$Searcherはモジュラーマルチモーダル情報検索エージェントである。
M$3$Searcherは検索指向の多目的報酬で最適化されている。
MMSearchVQAは、検索中心のRLトレーニングをサポートするマルチモーダルマルチホップデータセットである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:27:40 GMT)
EvasionBench: Detecting Evasive Answers in Financial Q&A via Multi-Model Consensus and LLM-as-Judge [8.5] EvasionBenchを紹介します。3万のトレーニングサンプルと1,000人の人手によるテストサンプルで構成されています。
2つの強いアノテータが衝突し、審査員がラベルを解消する境界ケースを抽出する。
トレーニングされたモデルEva-4B(4Bパラメータ)は81.3%の精度でベースを25ポイント上回っている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:26:43 GMT)
DYCP: Dynamic Context Pruning for Long-Form Dialogue with LLMs [8.5] 大きな言語モデル(LLM)は、対話の長さが大きくなるにつれて応答遅延が増加し、応答品質が低下する。
我々は,クエリ時に関連メモリを動的に分割・取得する,軽量なコンテキスト管理手法であるDyCPを紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:26:22 GMT)
From Performance to Practice: Knowledge-Distilled Segmentator for On-Premises Clinical Workflows [8.4] 本稿では,高パフォーマンスセグメンテーションモデルを拡張性のあるコンパクトな学生モデルファミリに変換するためのデプロイメント指向フレームワークを提案する。
提案手法は,既存の臨床システムとのアーキテクチャ互換性を維持しつつ,体系的な容量削減を実現している。
その結果、知識蒸留は、研究グレードのセグメンテーションモデルを保守可能で展開可能なコンポーネントに変換するための実用的で信頼性の高い経路を提供することを示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:44:30 GMT)
Multimodal Signal Processing For Thermo-Visible-Lidar Fusion In Real-time 3D Semantic Mapping [8.4] 本稿では,熱情報を用いた3次元点雲マップを意味的に拡張する新しい手法を提案する。
このシステムは、この融合した画像ストリーム上にリアルタイムのLiDAR点雲を投影する。
次に、熱チャネル内の熱源の特徴を分割して、温度目標を即座に識別し、この温度情報を最終3Dマップのセマンティック層として適用する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:46:57 GMT)
A one-step generation model with a Single-Layer Transformer: Layer number re-distillation of FreeFlow [8.2] フローマッチング法は拡散モデルの反復生成過程を数ステップまたは1ステップに圧縮することを目的としている。
SLT(Single-Layer Transformer)を提案する。28層教師の深度的特徴進化を近似するために,1つの共有DiTブロックを用いる。
教師モデルの2つのランダムサンプリングに匹敵する時間予算内では,100以上のノイズスクリーニングを行い,高品質なサンプルを生成する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:05:24 GMT)
Stable and Explainable Personality Trait Evaluation in Large Language Models with Internal Activations [8.2] 大規模言語モデルにおける安定かつ説明可能な性格特性評価のための内的アクティベーション補間法(PVNI)
PVNIは、対照的な方向を使ってモデルの内部アクティベーションからペルソナベクトルを抽出する。
これはベクトルに沿って補間することで対応する中性スコアをアンカー軸として推定する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:48:59 GMT)
Human-AI Co-design for Clinical Prediction Models [8.1] 我々は,AIエージェントを用いて,完全に解釈可能な臨床予測モデルの開発を加速する,反復的ヒューマン・イン・ザ・ループ・フレームワークであるHACHIを紹介する。
2つの現実的予測タスクにおいて、HACHIは既存のアプローチを上回り、新しい臨床関連概念を表面化し、臨床現場や期間にわたってモデルの一般化性を向上させる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:04:34 GMT)
CEI: A Unified Interface for Cross-Embodiment Visuomotor Policy Learning in 3D Space [8.0] クロス・エボデーメント・インタフェース(CEI)は、クロス・エボデーメント・ラーニングのためのフレームワークである。
CEIは勾配に基づく最適化を通じてロボットの軌道を整列させ、その後、目に見えないロボットアームとエンドエフェクターの観察とアクションを合成する。
実験では、CEIはシミュレーションにおいて、データとポリシーをFranka Pandaロボットからtextbf16の異なる実施形態に転送する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:07:11 GMT)
Spectral Complex Autoencoder Pruning: A Fidelity-Guided Criterion for Extreme Structured Channel Compression [7.9] 本稿では,個々の出力チャネルのレベルにおける機能的冗長度を測定するリコンストラクションベースの基準を提案する。
複素相互作用場を周波数領域に変換し、低容量オートエンコーダを訓練して正規化スペクトルを再構成する。
複素相互作用場のスペクトル再構成忠実度は、アグレッシブ圧縮下でのチャネルレベルの冗長性の効果的なプロキシであることがわかった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:34:18 GMT)
POWDR: Pathology-preserving Outpainting with Wavelet Diffusion for 3D MRI [7.9] POWDRは、条件付きウェーブレット拡散モデルに基づく3次元MRIのための病理保存アウトペイントフレームワークである。
提案手法はウェーブレット領域の条件付けを利用して,遅延拡散モデルでよく見られる高周波ディテールとぼやけを増大させる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:20:13 GMT)
Online Trajectory Optimization for Arbitrary-Shaped Mobile Robots via Polynomial Separating Hypersurfaces [7.9] 新たな軌道最適化手法は、ロボットの構成と分離した超平面を共同で最適化することで衝突を強制する。
本研究では,関数によってパラメータ化された非線型分離超平面を導入することにより,その制限を不当に除去する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:07:48 GMT)
Clozing the Gap: Exploring Why Language Model Surprisal Outperforms Cloze Surprisal [7.6] クローズタスクに対する人間の反応を利用するか、言語モデル(LM)からの確率を使用するかの2つの方法で、単語がどれだけ予測可能かを定量化できる。
LM確率の利点に関する3つの仮説の証拠を提示する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:38:54 GMT)
Query Languages for Machine-Learning Models [7.3] 重み付き有限構造の2つの論理について論じる。
これらの論理で表現できるニューラルネットワークに対するクエリの例を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:15:09 GMT)
On Fun for Teaching Large Programming Courses [7.3] 正面設定で何百人もの学生にソフトウェア開発の基礎を教えることはコスト効率が良い。
大きな講堂では、学生は簡単に退屈し、気を散らし、遠ざけられることができる。
本稿では,基礎的なプログラミングとソフトウェア開発の概念を反映した,10の身体的楽しみのカタログについて紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:58:24 GMT)
Beyond Simulations: What 20,000 Real Conversations Reveal About Mental Health AI Safety [7.3] 本報告では,自殺リスク評価,有害コンテンツ生成,拒絶堅牢性,敵対的ジェイルブレイクを対象とする4つの安全テストセットの複製について述べる。
次に、目的とするAIと2万以上の現実世界のユーザ会話に関する生態監査を提案し、実施する。
自殺/NSSIにまたがる有効または有害なコンテンツを生成する汎用LLMよりも、目的に構築されたAIの方がはるかに少ないが、自殺/NSSIのテストセットの失敗率は現実世界のデプロイメントよりもはるかに高かった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:32:26 GMT)
Bears, all bears, and some bears. Language Constraints on Language Models' Inductive Inferences [7.3] 発達的証拠は、子供(4歳以上)が一般的な言明("Bears are daxable")、普遍的に定量化されたNP("All bears are daxable")、そして無限に複数のNP("some bears are daxable")を区別することを示している。
これらの微妙な違いが、視覚言語モデルのような汎用的な統計的学習者において、元の実験を複製することによって生じるかどうかを検証する。
一連のプレコンディショニングテスト(画像内のカテゴリの不正な識別と、それに続く感性)を経て、最初の実験で、モデルと人間の行動アライメントが見つかった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:16:10 GMT)
Challenges and Research Directions for Large Language Model Inference Hardware [7.2] 最近のAIトレンドによってさらに悪化している主な課題は、計算よりもメモリと相互接続である。
ハイバンド幅はFlashのような帯域幅で10倍のメモリ容量を持ち、プロセッシング・ナアー・メモリと高メモリ帯域で3Dメモリ・ロジック・スタックリングを行う。
スピードアップ通信への低レイテンシ相互接続。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:37:46 GMT)
A$^2$TG: Adaptive Anisotropic Textured Gaussians for Efficient 3D Scene Representation [7.1] 既存のアプローチではプリミティブ毎に固定された正方形のテクスチャが割り当てられており、非効率なメモリ使用とシーンの可変性への適応性が制限されている。
適応的異方性テクスチャ付きガウス(A$2$TG)を導入し,各プリミティブに異方性テクスチャを組み込むことでテクスチャ化されたガウスを一般化する。
本手法では,テクスチャの解像度とアスペクト比を協調的に決定するために,勾配誘導型適応法を用いて,一様でないディテールアロケーションを実現する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:26:55 GMT)
A pipeline for enabling path-specific causal fairness in observational health data [7.1] 我々は、経路特異的因果フェアネスに焦点を当て、バイアスが発生する社会的・医療的文脈をよりよく検討する。
構造フェアネスモデルを観察医療環境にマッピングし、因果フェアモデルをトレーニングするための一般化可能なパイプラインを作成する。
この研究は、直接的および間接的な医療バイアスに対処する因果公正機械学習モデルをトレーニングするためのモデルに依存しないパイプラインを提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:57:34 GMT)
Monte-Carlo Tree Search with Neural Network Guidance for Lane-Free Autonomous Driving [6.7] 車線のない交通環境により、車両は車線維持に制限されることなく道路の側面の容量をよりよく活用することができる。
我々は、車線自由交通における単エージェント自動運転のためのモンテカルロ木探索(MCTS)計画手法を検討する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:35:21 GMT)
CallShield: Secure Caller Authentication over Real-Time Audio Channels [6.6] CallShieldは音声の書き起こし、インターネット接続、信頼されたインフラに頼ることなく、音声層で完全に動作する。
我々は,ライブ8kHz音声の40ミリ秒フレーム内に,ビットごとの埋め込みと回復を可能にするリアルタイムなニューラル透かし技術を導入する。
CallShieldは、発信者認証のためにセキュアで軽量な対称キープロトコルを採用しており、信頼された連絡先間でペアで共有される秘密に依存している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:01:35 GMT)
Relaxation Process During Complex Time Evolution In Two-Dimensional Integrable and Chaotic CFTs [6.6] 共形場理論(2d CFT)における局所一次作用素の挿入を伴う真空状態の複素時間発展について検討する。
この複雑な時間進化は、ローレンツの時間進化と、ポストセレクトされた測定によって誘導されるユークリッドの時間進化から構築された複合過程と見なすことができる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:51:01 GMT)
A New Convergence Analysis of Plug-and-Play Proximal Gradient Descent Under Prior Mismatch [6.5] 本稿では,タスクデータに対する異なる勾配分布に基づいてミスマッチをトレーニングした場合に,プラグアンドプレイ降下(-PGD)に対する新しい収束理論を提案する。
我々の知る限りでは、これは事前推論の下での初めての収束証明-PGDである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:47:31 GMT)
Seeking Human Security Consensus: A Unified Value Scale for Generative AI Value Safety [6.5] ジェネレーティブAIは、価値と倫理に関するリスクを最前線にもたらす。
我々は、国際的に包括的で回復力のある統一価値枠組み、GenAI Value Safety Scale(GVS-Scale)を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:22:34 GMT)
The Promptware Kill Chain: How Prompt Injections Gradually Evolved Into a Multi-Step Malware [6.5] 大規模言語モデル(LLM)ベースのシステムは、既存のセキュリティフレームワークが不十分に対処する新たなアタックサーフェスを作成している。
我々は,LSMをベースとしたアプリケーションを対象とした攻撃が,thisttpromptwareと呼ばれるマルウェア群を構成することを提案し,これらの脅威を解析するための5段階のキルチェーンモデルを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:57:04 GMT)
CLIDD: Cross-Layer Independent Deformable Description for Efficient and Discriminative Local Feature Representation [6.5] CLIDD (Cross-Layer Independent Deformable Description) は、独立な特徴階層から直接サンプリングすることで、優れた特徴性を実現する手法である。
リアルタイム性能を確保するため,ハードウェア対応のカーネル融合戦略を実装した。
軽量アーキテクチャとトレーニングプロトコルを統合するスケーラブルなフレームワークを開発する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:03:01 GMT)
Global Optimization By Gradient from Hierarchical Score-Matching Spaces [6.4] この研究は、制約のない一般的な階層的最適化目的として、様々な複雑な制約を持つ全ての最適化問題を解く。
これは大域的最適化と拡散に基づく生成モデルとの深い関係を明らかにする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:26:01 GMT)
Bidirectional Decoding for Concatenated Quantum Hamming Codes [6.3] スケーリングに要する時間を要する量子符号のハード決定デコーダを導入する。
独立したビットフリップノイズ下での量子ハミング符号 [15,3] に対して、双方向デコーダはしきい値を改善する。
この結果により,低オーバーヘッド型フォールトトレラント量子計算の競争性を高めることができる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:09:37 GMT)
XLinear: A Lightweight and Accurate MLP-Based Model for Long-Term Time Series Forecasting with Exogenous Inputs [6.2] 本研究では,MultiLayer Perceptrons上に構築された軽量時系列予測モデルであるXLinearを提案する。
XLinearは、内因性変数から派生したグローバルトークンを、変数と相互作用するための中心的なハブとして使用し、これらの信号を統合して内因性系列を予測する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:21:29 GMT)
Hybrid guided variational autoencoder for visual place recognition [6.2] 視覚的位置認識(VPR)は、これまで見られた場所に基づいて画像の位置を推定する。
この研究は、イベントベース視覚センサとイベントベース誘導変分オートエンコーダ(VAE)を組み合わせることで、ロボット工学におけるこれらの制限を克服する。
VAEは、新しい屋内VPRデータセットの16箇所の視覚的特徴を、他の最先端のアプローチに匹敵する分類性能で切り離すことに成功しました。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:33:53 GMT)
Why are there many equally good models? An Anatomy of the Rashomon Effect [6.1] ほぼ同等のパフォーマンスを達成する複数の異なるモデルの存在である羅生門効果は、統計学と統計学の基本的な現象として現れている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:15:47 GMT)
OUTLINEFORGE: Hierarchical Reinforcement Learning with Explicit States for Scientific Writing [5.9] 本稿では,科学的概要構築を長期計画問題とする強化学習フレームワークを提案する。
また、文書計画、入力利用、参照忠実度、概要組織、コンテンツレベルの事実精度を評価する学術論文生成のためのベンチマークも導入する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:37:26 GMT)
Rigorous and Generalized Proof of Security of Bitcoin Protocol with Bounded Network Delay [5.9] Bitcoinプロトコルのセキュリティの証明は厳格に行われ、一部で単純化されている。
相手がブロックの送信を時間$$で遅らせることができる計算モデルを考える。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:33:19 GMT)
Data Scaling for Navigation in Unknown Environments [5.9] 模擬学習によるナビゲーションポリシーをトレーニングで見えない環境に一般化することは、依然として大きな課題である。
データ量とデータの多様性が、エンド・ツー・エンドの地図のないビジュアルナビゲーションにおける現実世界の一般化にどのように影響するかを、我々は初めて大規模に研究した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:44:39 GMT)
See More, Store Less: Memory-Efficient Resolution for Video Moment Retrieval [5.8] 本稿では,高情報解像度を維持しながらメモリ効率を向上させるフレームワークであるSMORE(See MORE, store less)を提案する。
SMORE (1) は,ユーザ意図に沿ったセマンティクスを符号化するためにクエリ誘導キャプションを使用し,(2) 関連するセグメントをハイライトするためにクエリ認識の重要度変調を適用し,(3) キーコンテンツを保存するためにフレームを適応的に圧縮する。
実験的検証により、SMOREはQVHighlights、Charades-STA、ActivityNet-Captionsベンチマークで最先端のパフォーマンスを達成することが明らかになった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:28:11 GMT)
Information Access of the Oppressed: A Problem-Posing Framework for Envisioning Emancipatory Information Access Platforms [5.8] オンライン情報アクセスプラットフォームは、権威的な捕獲のターゲットです。
この問題は、パウロ・フレイアの解放教育理論のレンズを通して探求する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:15:26 GMT)
How well LLM-based test generation techniques perform with newer LLM versions? [5.8] LLMのアプローチは、すべてのテスト有効性指標において、従来の最先端のアプローチよりも優れていることを示す。
テスト生成がより効率的であるプログラムクラスをまずターゲットとし,LLM要求数を削減する方法を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:46:32 GMT)
How Human Motion Prediction Quality Shapes Social Robot Navigation Performance in Constrained Spaces [5.7] 動的・空間的制約のある環境でのロボットナビゲーションに焦点をあてる。
ロボットナビゲーション性能に及ぼす人間の動作予測品質の影響について検討する。
主な発見は、広く採用されている平均変位誤差が、ロボットナビゲーション性能の信頼できる予測器ではないことの証拠である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:34:34 GMT)
Quantum Latin squares of order $6m$ with all possible cardinalities [5.7] 量子ラテン平方次数$n$(QLS$(n)$)は$ntimes n$配列である。
2つの単位ベクトル $|urangle, |vranglein MathcalH_n$ が実数 $$ が存在して $|urangle=ei|vrangle$ となると同一視される。
QLS$(n)$ の濃度 $c$ は、同値の別個のベクトルの数である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:09:42 GMT)
The Real Menace of Cloning Attacks on SGX Applications [5.7] 72のSGXをベースとしたクローン攻撃の可能性について検討し,解析を行った。
以上の結果から,解析された提案のうち約20%がクローン攻撃に対する安全性が低いことが明らかとなった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:16:51 GMT)
SpikeVAEDiff: Neural Spike-based Natural Visual Scene Reconstruction via VD-VAE and Versatile Diffusion [5.5] 神経活動から自然の視覚シーンを再構築することは、神経科学とコンピュータビジョンにおける重要な課題である。
We present SpikeVAediff, a novel two-stage framework that a Very Deep Variational Autoencoder (VDVAE) and the Versatile Diffusion model。
第1段階では、VDVAEはニューラルスパイク信号を潜在表現にマッピングすることで、低分解能の予備再構成を生成する。
第2段階では、回帰モデルはニューラルスパイク信号をCLIP-VisionとCLIP-Textの機能にマッピングし、Versatile Diffusionがイメージ・ツー・イメージ生成を通じて画像を洗練できるようにする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:38:12 GMT)
Differential Privacy for Transformer Embeddings of Text with Nonparametric Variational Information Bottleneck [5.5] 本稿では,変換器埋め込みのノイズの多いバージョンを共有することで,テキストデータを共有するためのプライバシ保護手法を提案する。
非パラメトリック変分プライバシー(NVDP)は、有用なデータ共有と強力なプライバシー保護の両方を保証する。
一般言語理解評価(GLUE)ベンチマークでNVDPを検証した結果,ノイズレベルの変化は,プライバシと精度のトレードオフとして有用であることがわかった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:01:54 GMT)
Radiomics-Integrated Deep Learning with Hierarchical Loss for Osteosarcoma Histology Classification [5.4] 本研究は、モデルトレーニングにおける追加入力として放射能特徴を用いることを提案する。
画像から導出されているにもかかわらず、そのようなマルチモーダル入力は分類性能を効果的に向上させることを示した。
このような階層的な損失は、2つのタスク間のトレーニング可能な重み付けにより、クラスごとのパフォーマンスを大幅に改善できることが示される。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:09:34 GMT)
Enhancing Imbalanced Electrocardiogram Classification: A Novel Approach Integrating Data Augmentation through Wavelet Transform and Interclass Fusion [5.3] 不均衡心電図データ(ECG)は、心臓血管診断情報の自動処理と解釈においてアルゴリズムの有効性とレジリエンスを損なう。
本稿では,ECG分析におけるクラス不均衡とノイズ関連課題の両面に同時に対処するECG分類器について述べる。
診断精度は99%, 98%, 97%, 98%, 96%, 92%, 93%, 正常, AF, I-AVB, LBBB, RBBB, PAC, PVC, STD, STEで達成した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:09:13 GMT)
From Snow to Rain: Evaluating Robustness, Calibration, and Complexity of Model-Based Robust Training [5.3] 本研究では,学習したニュアンス変動モデルを利用して現実的な汚職を発生させるモデルに基づく学習手法のファミリーについて検討する。
未知空間におけるランダムなカバレッジと逆方向の洗練を組み合わせた新しいハイブリッド戦略について検討した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:49:44 GMT)
On the Hardness of Computing Counterfactual and Semifactual Explanations in XAI [5.2] 多くの場合、説明の生成は計算的に困難であることが示される。
我々は、XAIコミュニティと、AIにおける説明の規制を求める政策立案者との関係について論じる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:02:24 GMT)
NanoSD: Edge Efficient Foundation Model for Real Time Image Restoration [5.1] NanoSDは、エッジデバイス上でのリアルタイム視覚生成と復元に適した汎用拡散基盤モデルファミリーである。
アーキテクチャのバランス、機能ルーティング、潜在空間の保存が、デバイス上での真のレイテンシをいかに形作るかを示す。
ドロップインバックボーンとして使用する場合、NanoSDは画像超解像、画像劣化、顔の復元、単眼深度推定など、最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:30:53 GMT)
Discrete Solution Operator Learning for Geometry-Dependent PDEs [5.0] DiSOLは、解法を古典的な離散化を反映する学習可能な段階に分解する。
幾何学に依存したポアソン、対流拡散、線形弾性、および熱伝導問題全体にわたって、DiSOLは安定かつ正確な予測を生成する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:34:49 GMT)
Analyzing GitHub Issues and Pull Requests in nf-core Pipelines: Insights into nf-core Pipeline Repositories [4.9] Nextflowのnfコアコミュニティは、厳格なテスト、ドキュメント、ガバナンスガイドラインに従う標準化されたピアレビューパイプラインをキュレートする。
本稿では,これらのパイプラインから25,173件の問題を抽出し,繰り返し発生する課題,管理実践,認識困難を明らかにする。
パイプライン開発と統合、バグ修正、ゲノムデータの統合、CI設定の管理、バージョン更新の処理など、13の主要な課題を特定します。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:34:00 GMT)
DeepInflation: an AI agent for research and model discovery of inflation [4.7] textbfDeepInflationは、インフレーション宇宙論の研究とモデル発見のために設計されたAIエージェントである。
textbfDeepInflationは、Large Language Models (LLM) とシンボリックレグレッション(SR)エンジンと検索強化世代(RAG)ナレッジベースを統合している。
textbfDeepInflationは、宇宙生物学における新しい世代の自律科学発見エンジンのプロトタイプとして機能する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:41:01 GMT)
Disentangling Task Conflicts in Multi-Task LoRA via Orthogonal Gradient Projection [4.7] Low-Rank Adaptation (LoRA)と組み合わせたマルチタスク学習(MTL)が,大規模言語モデル(LLM)のパラメータ効率向上のための有望な方向として登場した。
複数のタスクにまたがる単一のアダプタを共有することで、ストレージオーバーヘッドを大幅に削減できる。
このアプローチは、個別タスクからの差分更新がシングルタスクの微調整と比較して個々のタスクのパフォーマンスを低下させるという、負の転送に悩まされる。
そこで我々は,LoRAの2部構造に適した勾配投影法であるOrtho-LoRAを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:36:22 GMT)
Improving Chain-of-Thought for Logical Reasoning via Attention-Aware Intervention [4.6] 非インタラクティブなエンドツーエンドフレームワークは、モデル自体に推論が現れることを可能にする。
本研究は,数発のプロンプトに構造情報を導入することで,論理的推論演算子に整合したパターンのアテンションヘッドのサブセットを活性化することを示す。
本研究では,AAI(Attention-Aware Intervention)を提案する。AAI(Attention-Aware Intervention)は,その論理パターンによって認識される選択された頭部の注意点を重み付けする推論時間介入手法である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:10:10 GMT)
MedRedFlag: Investigating how LLMs Redirect Misconceptions in Real-World Health Communication [4.6] 患者からの現実の健康に関する質問は、しばしば意図せずに偽の仮定や前提を埋め込む。
このようなケースでは、安全な医療コミュニケーションは通常、暗黙の誤解に対処し、基礎となる患者のコンテキストに応答する、リダイレクトを伴う。
本研究では,大規模言語モデル(LLM)が現実の健康問題に埋め込まれた誤った前提にどのように反応するかを検討する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:23:02 GMT)
LP-LLM: End-to-End Real-World Degraded License Plate Text Recognition via Large Multimodal Models [4.5] LPR(Real-world License Plate Recognition)は、モーションボケ、低解像度、複雑な照明などの深刻な劣化によって大きな課題に直面している。
画像復元モデルの画素レベルの最適化目標は、文字認識のセマンティックな目標と不一致である。
本稿では,Qwen3-VLに基づくエンドツーエンド構造対応マルチモーダル推論フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:32:55 GMT)
AviationLMM: A Large Multimodal Foundation Model for Civil Aviation [4.4] 本稿では,民間航空のための大規模マルチモーダル基盤モデルであるAviationLMMのビジョンを紹介する。
本稿では, 地上音声, 監視, オンボードテレメトリ, ビデオ, 構造化テキストなどのマルチモーダル入力を取り入れたモデルアーキテクチャについて述べる。
データ取得、アライメントと融合、事前訓練、推論、信頼性、プライバシー、欠落したモダリティに対する堅牢性、合成シナリオ生成など、対処すべき重要な研究機会を特定します。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:10:33 GMT)
Equi-ViT: Rotational Equivariant Vision Transformer for Robust Histopathology Analysis [4.4] 等価な畳み込みカーネルをViTアーキテクチャのパッチ埋め込みステージに統合するEqui-ViTを提案する。
Equi-ViTは、画像の向きによって、良好な回転整合パッチ埋め込みと安定した分類性能を実現する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:03:20 GMT)
A Systematic Security Analysis for Path-based Traceability Systems in RFID-Enabled Supply Chains [4.2] トレーサビリティシステムは商品のリコールと偽造、改ざん、盗難などの問題を緩和する。
トレーサビリティシステムは サプライチェーン攻撃に対する防御機構だ
この記事では、これらの欠陥、それらを特定した方法論、およびトレーサビリティソリューションを大規模に評価する最初のセキュリティ評価について報告する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:52:45 GMT)
Efficient Clustering in Stochastic Bandits [4.2] 固定された信頼設定の下でBandit Clustering(BC)問題について検討する。
目的は、シーケンシャルサンプリングを通じてデータシーケンス(アーム)の集合をクラスタにまとめることである。
本稿では,各時間ステップで最適な値に向かって1ステップずつの効率的な帯域クラスタリングアルゴリズム(EBC)を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:05:58 GMT)
High-fidelity lunar topographic reconstruction across diverse terrain and illumination environments using deep learning [4.2] この研究は、より堅牢なスケール回復スキームを取り入れた、以前に提案されたDLフレームワークを基盤としている。
様々なスケール、形態学、地質学的年齢の月の地形を確実に再構築する。
これらの結果は、DLベースのアプローチは、高度な探査ミッションを支援するために広範囲な月面データセットを活用する可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:21:09 GMT)
Blue Teaming Function-Calling Agents [4.2] 我々は,3つの異なる攻撃に対して,機能呼び出し機能を有するオープンソースLLMのロバスト性を評価する。
以上の結果から,これらのモデルがデフォルトでは安全ではないこと,防衛が現実のシナリオでまだ利用できないこと,などが分かる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:53:16 GMT)
"Where is My Troubleshooting Procedure?": Studying the Potential of RAG in Assisting Failure Resolution of Large Cyber-Physical System [4.1] Retrieval Augmented Generation (RAG) は、演算子を検索タスクで補助するツールの開発を可能にする。
本稿では,Fincantieriで利用可能なトラブルシューティング手順の分析から得られた一連の実験結果について述べる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:28:56 GMT)
Towards Realistic Synthetic Data for Automatic Drum Transcription [4.0] 本稿では,ペアオーディオ-MIDIトレーニングデータの必要性を回避するために,ADT(Automatic Drum Transcription)の新たなパラダイムを提案する。
我々の主な貢献は、ラベルなし音源からの1発ドラムサンプルの多種多様なコーパスを自動的にキュレートする半教師付き手法である。
次に、このコーパスを用いて、MIDIファイルのみから高品質なデータセットを合成し、シーケンス対シーケンスの転写モデルをトレーニングする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:39:05 GMT)
Bias Dynamics in BabyLMs: Towards a Compute-Efficient Sandbox for Democratising Pre-Training Debiasing [4.0] 事前訓練された言語モデル(LM)は、ここ数年で、社会的な採用とトレーニングコストの両方で大きく成長した。
我々は、低コストのプロキシモデルを用いて、プレモデルデバイアス研究の民主化を目指す。
具体的には,小小・可変コーパスで学習したコンパクトBERTライクなBabyLMについて検討する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:12:40 GMT)
Test-Time Detoxification without Training or Learning Anything [3.9] 大規模な言語モデルでは、良心的な入力であっても有害なテキストや不適切なテキストを生成し、大規模にデプロイされた場合のリスクを生成することができる。
入力埋め込みに対する完了毒性の勾配を近似する試験時間手順を導入する。
これは、入力埋め込みへのアクセスのみを必要とするゼロ階最適化、毒性スコアリング機能、モデルの前方評価によって達成される。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:54:23 GMT)
Exploring Fine-Tuning for Tabular Foundation Models [3.9] 本研究は,タブラル基礎モデル(TFM)におけるファインチューニングに関する最初の総合的研究である。
我々は、ゼロショット、メタラーニング、スーパーバイザード(SFT)、パラメータ効率(PEFT)アプローチを比較し、不均衡、サイズ、次元といったデータセット要素が結果にどのように影響するかを分析する。
本研究は, 性能, キャリブレーション, 公平性について検討し, 微調整が有効である時期と限界について検討した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:40:46 GMT)
SysPro: Reproducing System-level Concurrency Bugs from Bug Reports [3.8] システムレベルのバグを再現するには、入力データとシステム呼び出しの正確なインターリーブ順序の両方が必要である。
既存のツールは、システムコールレベルで特定のインターリーブを管理することができないため、これらのバグを再現するには不十分です。
本稿では,バグレポートから関連するシステムコール名を自動抽出し,ソースコード内の位置情報を識別するSysProを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:40:08 GMT)
Too Helpful to Be Safe: User-Mediated Attacks on Planning and Web-Use Agents [3.8] 我々は、不正なユーザーを騙して信頼できないコンテンツや攻撃者が制御するコンテンツをエージェントに中継する、ユーザー介在型攻撃について研究する。
サンドボックス環境における12の商業エージェントの系統的評価を行う。
以上の結果から,エージェントはデフォルトでは安全でありすぎることが示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:29:13 GMT)
Distributed Exact Quantum Amplitude Amplification Algorithm for Arbitrary Quantum States [3.6] 本研究では,任意の振幅分布を持つ量子状態に対して,正確な振幅増幅を実現することの課題に焦点をあてる。
分散量子振幅増幅アルゴリズム(DEQAAA)を提案する。
DEQAAAは量子ゲート数と回路深さの両方において、量子ビット数スケールとして顕著な優位性を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:54:27 GMT)
LSR-Net: A Lightweight and Strong Robustness Network for Bearing Fault Diagnosis in Noise Environment [3.6] ノイズの多い環境下で高精度でリアルタイムな故障診断が可能な軽量で強靭なネットワーク(LSR-Net)を提案する。
適応型プルーニングをDMに適用し,ノイズの強度が強い場合にデノナイジング能力を向上させる。
また,提案モデルがベンチマークモデルよりも高い反雑音能力を示し,計算複雑性も低かった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:25:41 GMT)
KTCF: Actionable Recourse in Knowledge Tracing via Counterfactual Explanations for Education [3.5] KT(Knowledge Tracing)は、学生のモデリングタスクにおいて、その優れた性能と教育応用の可能性から認識されている。
カウンターファクチュアルな説明は、行動可能な会話を提供し、本質的に因果的かつ局所的であり、教育関係者が、しばしば非専門家である者を理解するのが容易である。
KTCF,知識概念関係を考慮したKTの反実的説明生成手法,および反実的説明を教育指導に変換する後処理方式を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:51:54 GMT)
SAM-Aug: Leveraging SAM Priors for Few-Shot Parcel Segmentation in Satellite Time Series [3.4] そこで本研究では,少数のランドカバーマッピングを改善するためのアノテーション効率のよい新しいフレームワークSAM-Augを提案する。
提案手法は, 時間列から雲のない合成画像を構築し, SAMを教師なしで適用する。
PASTIS-Rベンチマークの実験では5%のラベル付き設定でSAM-Augの有効性と堅牢性を示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:18:04 GMT)
Merged Bitcoin: Proof of Work Blockchains with Multiple Hash Types [3.4] このようなプロトコルのセキュリティ領域は、すべてのハッシュタイプに対する51%の攻撃の AND であってはならないことが証明されている。
マージされたBitcoinは、複数の異なるハッシュタイプを使ってブロック間のリンクを形成するBitcoinプロトコルである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:46:12 GMT)
Policy-Based Reinforcement Learning with Action Masking for Dynamic Job Shop Scheduling under Uncertainty: Handling Random Arrivals and Machine Failures [3.3] 本稿では、不確実性の下で動的ジョブショップスケジューリング問題を解決するための新しいフレームワークを提案する。
提案手法は,スケジュール環境を表現するためにColoured Timed Petri Netsを用いて,モデルに基づくパラダイムに従う。
我々は,動的JSSPベンチマークの実験を行い,提案手法が従来型の最小化とルールベースのアプローチを,メイスパンの観点から一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:53:46 GMT)
A Risk-Stratified Benchmark Dataset for Bad Randomness (SWC-120) Vulnerabilities in Ethereum Smart Contracts [3.3] 本稿では,Bad Randomness脆弱性を検証した1,752個のスマートコントラクトのベンチマークデータセットを提案する。
我々は, 利用可能性に基づくリスクレベルを, High_RISK (保護なし), medium_RISK (マイナ・エクスロイタブルのみ), LOW_RISK (オーナー・エクスロイタブルのみ), SAFEの4つに分類する。
私たちのデータセットはRNVulDetの51倍の大きさで、初めて機能レベルの検証とリスク階層化を提供します。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:49:56 GMT)
Compress to Focus: Efficient Coordinate Compression for Policy Optimization in Multi-Turn GUI Agents [3.2] マルチターンGUIエージェントは、相互作用履歴が蓄積されるにつれて、厳しいコンテキストインフレーションに悩まされる。
既存の戦略は、切り離しによって長期的コンテキストを犠牲にするか、トークンプルーニングを通じて空間構造を妥協するかのいずれかである。
マルチターンGUIエージェントに対して,視覚的圧縮とポリシー最適化を併用した効率的なポリシー最適化フレームワークであるCCPOを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:52:57 GMT)
Understanding or Memorizing? A Case Study of German Definite Articles in Language Models [3.2] 我々は、性別やケースによって異なる独特な記事に対する質問について研究する。
勾配に基づく解法であるGRADIENDを用いて,ジェンダーケース固有の記事遷移のパラメータ更新方向を学習する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:31:41 GMT)
Design Methodology of Hydraulically-driven Soft Robotic Gripper for a Large and Heavy Object [3.2] 本稿では, 大型で重い物体(直径約10~20kg, 直径20~30cm)をつかむ油圧駆動型ソフトロボットグリップについて述べる。
既存のソフトグリップは数百kPaの圧力で空気を作動させており、そのような大型で重い物体に十分な出力力を発生させることはできない。
指屈曲角度の20kg物体把握と閉ループ制御に関する実験結果について報告する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:09:53 GMT)
SPOT-Face: Forensic Face Identification using Attention Guided Optimal Transport [3.0] SPOT-Faceは、クロスドメインの法医学的な顔識別のために設計された超ピクセルグラフベースのフレームワークである。
我々の枠組みは、法医学的な調査において、頭蓋骨とスケッチを顔に合わせるのに非常に効果的であることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:02:21 GMT)
Predicting When to Trust Vision-Language Models for Spatial Reasoning [3.0] VLM(Vision-Language Models)は、マルチモーダルタスクにまたがる印象的な機能を示すが、体系的な空間的推論の失敗を示す。
独立な幾何学的検証によってVLM予測を検証可能な視覚に基づく信頼度推定フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 22:00:28 GMT)
Adoption and Evolution of Code Style and Best Programming Practices in Open-Source Projects [2.9] 本稿では,GITHUB 上で人気の 1,036 のオープンソース JAVA プロジェクトを分析し,コードスタイルとプログラミングの実践が時間とともにどのように採用され,進化するかを考察する。
JavadocとNamingの違反が最も一般的です。
また、GOOGLE Javaスタイルガイドには、最新の静的解析ツールが欠落することが多いカテゴリで、かなりの数の違反があったこともわかりました。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:48:47 GMT)
DeepLight: A Sobolev-trained Image-to-Image Surrogate Model for Light Transport in Tissue [2.9] 本稿では,ソボレフトレーニングを用いた組織内光輸送のためのサロゲートモデルを提案する。
この結果から,光輸送代理モデルのソボレフトレーニングは,微分精度の向上だけでなく,分布内および分布外サンプルの一般化誤差の低減を図っている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:40:02 GMT)
DScheLLM: Enabling Dynamic Scheduling through a Fine-Tuned Dual-System Large language Model [2.9] 本稿では,マルチシステム(高速スロー)推論アーキテクチャにおいて,微調整された大規模言語モデルを活用する動的スケジューリング手法DScheLLMを提案する。
動的イベントを処理するために、統合された大きな言語モデルベースのフレームワークが構築されている。
標準的なジョブショップスケジューリングベンチマークの実験的評価は、高速思考モードが高品質なスケジュールを効率的に生成できることを実証している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:02:22 GMT)
From Hawkes Processes to Attention: Time-Modulated Mechanisms for Event Sequences [2.9] MTPP (Marked Temporal Point Processs) は、医療、社会、商業、金融の分野で自然に発生する。
我々は,クエリ,キー,値のプロジェクションを学習可能な型ごとのニューラルカーネルを用いて,Hawks Attentionと呼ばれる新しいアテンション演算子を提案する。
一般的なMTPPに加えて、時系列予測などの特定の時間構造にも容易に注意機構が適用できる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:47:37 GMT)
Overcoming the No-Go Theorem Yields a Rich Dissipative Phase Diagram in the Open Quantum Rabi Model [2.8] 明示的な$mathbfA2$ 項は、トーマス=ライヒ=クーン和則(英語版)(Thomas-Reich-Kuhn sum rule)によって要求される。
異方性(Anisotropy)は、散逸的量子系におけるno-go定理を克服するための一般的で堅牢なメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:07:24 GMT)
Point Tracking as a Temporal Cue for Robust Myocardial Segmentation in Echocardiography Videos [2.8] 心エコービデオにおける心筋セグメンテーションは、低コントラスト、ノイズ、解剖学的変動のために難しい課題である。
従来のディープラーニングモデルは、フレームを独立して処理し、時間的情報を無視したり、メモリベースの機能伝搬に依存したりする。
時間的キューとしてポイントトラッキングを統合するトランスフォーマーベースのセグメンテーションフレームワークであるPoint-Segを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:23:36 GMT)
Frame of Reference: Addressing the Challenges of Common Ground Representation in Situational Dialogs [2.7] 音声対話において、共通場は重要な役割を担い、対話者は、一貫性のある対話を維持するために、実体、出来事、関係の共有参照を維持する必要がある。
我々は、状況対話において、共有コンテキスト内のエンティティへのリレーショナル参照を通じて、共通基盤を確立し、活用するモデルの能力を評価する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:45:22 GMT)
SoK: Enhancing Cryptographic Collaborative Learning with Differential Privacy [2.6] 共同学習(CL)では、複数のパーティがプライベートデータセット上で機械学習モデルを共同でトレーニングする。
セキュアにトレーニングされたモデルでさえ、モデル出力から記憶されたデータを抽出することを目的とした推論攻撃に対して脆弱である。
出力プライバシーを確保し、推論攻撃を軽減するため、差分プライバシー(DP)はトレーニング中に校正ノイズを注入する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:09:29 GMT)
Creating a Hybrid Rule and Neural Network Based Semantic Tagger using Silver Standard Data: the PyMUSAS framework for Multilingual Semantic Annotation [2.6] 5つの異なる言語を用いたルールベースシステムにおいて,最も大きなセマンティックタグ付け評価を行う。
単言語モデルと多言語モデルの両方で、単言語モデルと多言語モデルを比較し、評価する。
トレーニングされたデータ、中国の評価データセット、そしてすべてのコードがオープンリソースとしてリリースされた。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:31:21 GMT)
Comparative Assessment of Concrete Compressive Strength Prediction at Industry Scale Using Embedding-based Neural Networks, Transformers, and Traditional Machine Learning Approaches [2.6] 本研究は, 約70,000の圧縮強度試験記録からなる産業規模のデータセットを活用する。
線形回帰、決定木、ランダム森林、トランスフォーマーベースニューラルネットワーク、埋め込み型ニューラルネットワークなど、複数の予測アプローチを評価し比較する。
その結果、埋め込みベースのニューラルネットワークは従来の機械学習やトランスフォーマーベースのモデルよりも一貫して優れており、平均28日間の予測誤差は約2.5%に達することが示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:58:05 GMT)
In-Browser Agents for Search Assistance [2.5] ウェブ検索におけるAI支援の需要とユーザーデータのプライバシーの必要性の間には、緊張関係がある。
ブラウザ内で実行可能な代替手段を提供するブラウザエクステンションを提示する。
以上の結果から,このプライバシ保護アプローチは個人の行動に適応する上で極めて有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:18:54 GMT)
From SERPs to Agents: A Platform for Comparative Studies of Information Interaction [2.5] 本稿では、Webベースのユーザ学習のためのオープンソースのシステムUXLabを紹介する。
そのコアはWebベースのダッシュボードで、複雑な実験的な設計の完全なコード構成を可能にする。
ユーザ行動とRAGと自律エージェントを比較したマイクロケーススタディを通じてUXLabの価値を実証する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:47:57 GMT)
Achieving the Heisenberg limit using fault-tolerant quantum error correction [2.4] ハイゼンベルク極限(英: Heisenberg limit, HL)は、量子力学によって許される極限である。
ハイゼンベルク極限は一般にノイズの存在下では到達できない。
量子エラー補正(QEC)は様々なシナリオでHLを回復することができる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:50:24 GMT)
LARGE: A Locally Adaptive Regularization Approach for Estimating Gaussian Graphical Models [2.4] グラフ推定のための局所適応正規化法(LARGE)を開発した。
LARGEは、グラフ推定と選択を改善するためにノードワイズチューニングパラメータを適応的に学習するアプローチである。
実際のfMRIデータセットから脳の接続性を推定し,本手法の実用性を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:37:50 GMT)
Improving CMA-ES Convergence Speed, Efficiency, and Reliability in Noisy Robot Optimization Problems [2.2] 我々は、適応サンプリングCMA-ES(AS-CMA)と呼ばれるCMA-ES最適化アルゴリズムのサプリメントを導入する。
AS-CMAは、予測ソート困難に基づいてサンプリング時間を候補に割り当て、一貫した精度を達成する。
我々は,AS-CMAをエキソスケルトン最適化実験に導入し,アルゴリズムの挙動が期待と一致していることを発見した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:12:18 GMT)
SpectraQuery: A Hybrid Retrieval-Augmented Conversational Assistant for Battery Science [2.2] 本稿では,ハイブリッド自然言語クエリフレームワークSpectraQueryを紹介する。
これはリレーショナルラマン分光データベースとベクトルインデクシングされた科学文献コーパスを統合している。
これは、数値的な証拠と機械的な説明を統一する引用された答えを生み出している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:01:46 GMT)
Regulatory gray areas of LLM Terms [2.2] 大規模言語モデル(LLM)は学術研究パイプラインに統合されつつある。
本稿では,5大LCMプロバイダのサービス条件の比較分析を行う。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:17:16 GMT)
A Marketplace for AI-Generated Adult Content and Deepfakes [2.1] AI生成コンテンツのための人気のあるコミュニティ主導のプラットフォームであるCivitaiは、Bountiesと呼ばれる収益化機能を運用している。
プラットフォームローンチ後14ヶ月の間に収集した,公開可能なすべての報奨金要求の経時的分析を行った。
報奨金の市場は、ユーザーがAIモデルを学習していないコンテンツに向けて操縦できるツールによって支配されていることが分かっています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:33:14 GMT)
Single-Round Clustered Federated Learning via Data Collaboration Analysis for Non-IID Data [2.1] クラスタ化されたフェデレートラーニング(CFL)は、類似のクライアントをグループ化してクラスタレベルのモデルをトレーニングすることで、パフォーマンスを向上させることができる。
ほとんどのCFLアプローチは、クラスタ推定とモデル更新のために複数の通信ラウンドに依存しています。
データコラボレーションに基づくクラスタ化フェデレーション学習(DC-CFL)を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:14:44 GMT)
Knowledge Boundary Discovery for Large Language Models [2.0] 大規模言語モデル(LLM)の知識境界を探索する強化学習に基づくフレームワークを提案する。
知識境界は, LLMが自信を持って解答できる質問(知識境界)と, 解答できない質問(知識境界)の2種類を自動生成することによって定義する。
KBD が LLM の知識境界を検出するためには,非自明な解答や解答不能な質問を自動的に見つけ出す必要がある。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:19:13 GMT)
LatencyPrism: Online Non-intrusive Latency Sculpting for SLO-Guaranteed LLM Inference [2.0] LLMレイテンシは、ユーザエクスペリエンスと運用コストを極めて決定します。
我々は,最初のゼロ侵入型マルチプラットフォーム遅延推論システムPrismを提示する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:46:59 GMT)
Hot-Start from Pixels: Low-Resolution Visual Tokens for Chinese Language Modeling [1.9] 低分解能な視覚入力が文字レベルモデリングの代替となるかどうかを検討する。
我々のデコーダは個々の文字のグレースケール画像を受け取り、解像度は8×8$ピクセルである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:34:37 GMT)
MPCI-Bench: A Benchmark for Multimodal Pairwise Contextual Integrity Evaluation of Language Model Agents [1.9] エージェント設定におけるプライバシ動作を評価するための,最初のマルチモーダルペアワイズコンテキスト統合ベンチマークであるMPCI-Benchを紹介する。
MPCI-Benchは、同じ視覚源から派生した対の正と負のインスタンスから構成される。
エージェントCIに関する今後の研究を促進するために,MPCI-Benchをオープンソースとして公開します。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:26:19 GMT)
Malware Classification using Diluted Convolutional Neural Network with Fast Gradient Sign Method [1.9] 本研究では,マルウェア分類のための拡散畳み込みニューラルネットワーク (FGSM DICNN) を用いた高速勾配符号法を提案する。
DICNNには、受容野を増加させる希薄な畳み込みが含まれており、モデルが長距離にわたって分散したマルウェアパターンをキャプチャすることができる。
提案したFGSM DICNNモデルは99.44%の精度を実現し、Custom Deep Neural Network (DCNN)のような既存のアプローチよりも優れている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:35:08 GMT)
TurboADMM: A Structure-Exploiting Parallel Solver for Multi-Agent Trajectory Optimization [1.6] 密接な相互作用ネットワークを用いたマルチエージェント軌道最適化では、大きな結合QPを制御速度で解く必要がある。
汎用QPソルバ(OSQP, MOSEK)を使用する場合、通常はマルチエージェント問題をモノリシックに扱う。
本稿では,3つの相補的成分の体系的共設計により,エージェント数における線形複雑度を経験的に近似する専用単機QP解法であるTurboADMMを紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:11:44 GMT)
Provable Acceleration of Distributed Optimization with Local Updates [1.6] 分散最適化では、各エージェントは2つの通信ラウンド間で1つのローカル更新を行い、その隣同士でソリューションを同期する。
フェデレートラーニングにおける複数のローカルアップデートの使用の成功に触発されて、分散最適化にローカルアップデートを組み込むことは、近年注目を集めている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:40:59 GMT)
Self-reflection in Automated Qualitative Coding: Improving Text Annotation through Secondary LLM Critique [1.6] 大規模言語モデル(LLM)は、大規模なデータセットの高度な定性的な符号化を可能にする。
簡単な一般化可能な2段階のワークフローを提示する: LLMは人間設計のコードブックを適用し、二次LPM批評家は各正のラベルに対して自己回帰を行う。
我々は,Apache Software Foundationのプロジェクト評価に関する議論において,3,000件以上の高コンテンツメールに対する6つの定性的なコードに対して,このアプローチを評価した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 22:27:13 GMT)
A Machine Learning Approach Towards Runtime Optimisation of Matrix Multiplication [1.5] 本稿では,ADSALA (Architecture and Data-AwareStructure Linear Algebra) ソフトウェアライブラリを構築するための概念実証手法を提案する。
本手法では,与えられたGEMMタスクに対して最適なスレッド数を自動的に選択するために,オンザフライでの機械学習モデルを用いる。
2ソケットのIntel Cascade Lakeと2ソケットのAMD Zen 3をベースとした2つの異なるHPCノードアーキテクチャのテスト結果は、25%から40%のスピードアップを示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:28:54 GMT)
Eigenstate Thermalization and Spectral Imprints of the Hamiltonian in Local Observables [1.4] 固有状態熱化仮説は孤立量子系における熱化を説明する。
スピン-1/2$ XXZ 鎖における積分性からカオスへの交叉について検討する。
統合可能性からカオスへとシステムを駆動する局所摂動を導入することで、標準のETHインジケータと固有状態エントロピーを追跡する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:15:50 GMT)
Introducing a Novel Systems Thinking approach inspired by STPA: Road Safety Intervention design case study [1.4] イギリス運輸省が公表した最新の暫定統計によると、イギリスは2024年に1,633人が死亡した。
本稿では,リスクが動的に進化し,継続的に監視される複雑な社会技術システムとして,道路安全を管理すべきであると論じる。
1)道路安全に影響を与える利害関係者のリスト、2)これらの利害関係者間の相互作用をモデル化する、3)死亡要因と認識される可能性のある前提をリスト化する、4)システムライフサイクル全体にわたってこれらの仮定を監視する、という4つのステップで構成されています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:19:34 GMT)
Parallelizable memory recurrent units [1.3] 本稿では、非線形RNNの永続的メモリ能力とSSMの並列化計算を組み合わせたメモリリカレントユニット(MRU)を新たに導入する。
BMRUは長期依存型タスクにおいて良好な結果が得られ、状態空間モデルと組み合わせて並列化可能で過渡的ダイナミクスと永続メモリを備えたハイブリッドネットワークを構築することができることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:01:11 GMT)
Value-Aware Numerical Representations for Transformer Language Models [1.3] トランスフォーマーベースの言語モデルは、しばしば数学的推論ベンチマークにおいて強力な結果を得る。
中心的な制限は、数値が数値を明示的にエンコードしないシンボルトークンとして処理されることである。
本稿では,標準的なトークン化入力を専用のプレフィックストークンで拡張する値認識数値表現を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:59:14 GMT)
Time-Dynamic Circuits for Fault-Tolerant Shift Automorphisms in Quantum LDPC Codes [1.3] 量子低密度パリティチェック(qLDPC)符号は、低オーバーヘッド論理量子メモリを実現するための有望なアプローチとして登場した。
近年の理論的発展は、qLDPC符号の論理ゲートの普遍的なセットを完成させるためのビルディングブロックとしてシフト自己同型を確立している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 22:40:25 GMT)
AI Survival Stories: a Taxonomic Analysis of AI Existential Risk [1.2] 我々は、AIシステムが人類に脅威をもたらすという2つの前提的議論を分析する。
これら2つの前提を用いて、生存物語の分類を構築します。
我々は分類学を用いて P(doom) の粗い見積もりを生成する
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:13:05 GMT)
Hidden Monotonicity: Explaining Deep Neural Networks via their DC Decomposition [1.2] 説明可能性を高めるために, 単調性は2つの方法で利用できることを示す。
まず、トレーニングされたReLUネットワークを2つの単調部と凸部に分解する。
第二に、2つの単調ニューラルネットワークの差分としてモデルをトレーニングすると、強い自己説明性特性を持つシステムが得られることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:50:16 GMT)
Pruning as Evolution: Emergent Sparsity Through Selection Dynamics in Neural Networks [1.1] 我々は、集団の進化過程としてニューラルプルーニングを定式化し、選択力学を導出し、フィットネスを局所的な学習信号に結びつける。
その結果、進化的選択は、トレーニング中に明示的なプルーニングスケジュールなしで測定可能な精度とスパーシティのトレードオフを生み出すことが示された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:48:50 GMT)
Advancing Model Refinement: Muon-Optimized Distillation and Quantization for LLM Deployment [1.1] 大規模言語モデル(LLM)は、高度な自然言語処理を可能にするが、リソース制約のあるエッジデバイス上でのデプロイメント上の課題に直面している。
本稿では,GPTQに基づく量子化,ローランク適応(LoRA),特殊データ蒸留プロセスを組み合わせた統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:50:30 GMT)
CLiMB: A Domain-Informed Novelty Detection Clustering Framework for Scientific Discovery [1.1] CLiMBはドメイン・インフォームド・クラスタリングのためのドメイン・インフォームド・フレームワークである。
未知の構造物の探査から事前の知識を利用する。
CLiMBは、既知の銀河系のサブストラクチャの回復において90%のシードカバレッジを持つ0.829の調整されたランダムインデックスを達成している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:21:05 GMT)
Strategies of cooperation and defection in five large language models [1.0] 大規模言語モデル(LLM)は、人間の意思決定をサポートするためにますます多くデプロイされている。
本報告では, 受刑者のジレンマにおいて, 5つの先行モデルが有意義な戦略を生み出すかどうかを考察する。
我々の実験は、現在のLLMが相互協力を瞬時に行う方法に光を当てた。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:13:23 GMT)
Geometry- and Topology-Informed Quantum Computing: From States to Real-Time Control with FPGA Prototypes [1.0] この本は、幾何学的に第一に、量子情報認識システムを通じてハードウェアを意識した経路を提供する。
パート1はバックボーンを開発し、進化は曲線空間上の運動として、測定は統計として読むことができる。
パート2は、回路をデータフローグラフとして再編成し、測定結果を解析し、集約し、小さな線形代数更新に還元する。
パート3は、マルチキュービット構造と絡み合いを、テレポーテーションを含む幾何学と計算として扱う。
パート4は、トポロジカルエラー補正とリアルタイムデコーディングに焦点を当てている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:18:29 GMT)
Detecting Batch Heterogeneity via Likelihood Clustering [1.0] バッチエフェクトはゲノム診断の主要な共同創設者である。
ベイジアンモデル証拠に従ってサンプルをクラスタリングすることで,両方の制約に対処する手法を提案する。
本手法は,標準相関法や次元縮小法と比較して,クラスタリング精度が優れている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 01:49:21 GMT)
Efficient State Preparation for Quantum Machine Learning [0.9] 本稿では,量子システムの行列積状態表現について紹介する。
所望の状態を符号化する回路の構築にどのように使用されるかを示す。
この符号化は分類精度を損なうことなく、古典的敵攻撃に対する堅牢性を高めている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:43:50 GMT)
ReGraM: Region-First Knowledge Graph Reasoning for Medical Question Answering [0.9] ReGraMは、領域優先の知識グラフ推論フレームワークである。
ReGraMが強いベースライン(KGARevion)を一貫して上回ることを示す。
また、これらの改善の原動力は、地域構築とホップワイズ推論の整合性にあることも示している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:33:14 GMT)
Self-Supervised Animal Identification for Long Videos [0.8] 我々は,動物識別をグローバルクラスタリングタスクとして再編成する,効率的で自己管理的な手法を提案する。
私たちのフレームワークは1000以上のラベル付きフレームでトレーニングされた教師付きベースラインと一致または超えます。
この研究により、消費者階級のハードウェア上で、実用的で高精度な動物識別が可能になる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:53:59 GMT)
High-Performance Serverless Computing: A Systematic Literature Review on Serverless for HPC, AI, and Big Data [0.8] 本稿は,2018年から2025年にかけて発行された122の論文について,系統的な文献レビューを行う。
サーバレスパラダイムを使用して、クラウド、ハイパフォーマンスコンピューティング、ハイブリッド環境にわたる計算集約型アプリケーションの開発とデプロイ、オーケストレーションを行う。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:10:20 GMT)
A Novel Contrastive Loss for Zero-Day Network Intrusion Detection [0.8] 機械学習は、ネットワーク侵入の検出において最先端の結果を達成した。
しかし、ゼロデイアタック(ゼロデイアタック)という新しいアタッククラスに直面すると、パフォーマンスは著しく低下する。
本研究は、他の対照的な学習に基づくアプローチの利点を維持することができる、新しい対照的な損失関数を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 22:20:38 GMT)
Formally Verifying Noir Zero Knowledge Programs with NAVe [0.7] 我々は、Noirプログラミング言語のためのオープンソースの形式検証器を作成する。
Noirプログラムが適切に制約されているかどうかを確認するために使用できる。
我々は,4種類のNoirプログラムに対して検証を行い,評価を行った。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:56:17 GMT)
IMSAHLO: Integrating Multi-Scale Attention and Hybrid Loss Optimization Framework for Robust Neuronal Brain Cell Segmentation [0.7] 我々は,頑健で適応的な神経細胞分割のための新しいディープラーニングフレームワーク,IMSAHLOを提案する。
本フレームワークは81.4%の精度,マクロF1スコア82.7%の精度,マイクロF1スコア83.3%の精度,難密でスパースなケースでは99.5%の精度を実現している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:43:33 GMT)
How Diplomacy Reshapes Online Discourse:Asymmetric Persistence in Online Framing of North Korea [0.7] 本研究は,高利害関係の外交サミットが,オンライン談話における敵の枠をどう形成するかを考察する。
我々はReddit上でのディファレンス・イン・ディファレンス(DiD)設計を用いて米国と北朝鮮の首脳外交を分析した。
外交に対するフレーミング反応における短期的非対称的持続性を明らかにした。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:59:56 GMT)
Verifying Physics-Informed Neural Network Fidelity using Classical Fisher Information from Differentiable Dynamical System [0.6] 物理インフォームドニューラルネットワーク(PINN)は、微分方程式を解き、物理システムをモデル化するための強力なツールとして登場した。
本稿では、PINNがシステムの完全な動的挙動をいかにうまく捉えているかを示す新しい実験フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:20:54 GMT)
Depth-Wise Representation Development Under Blockwise Self-Supervised Learning for Video Vision Transformers [0.6] 我々は、エンコーダによるマスク付き自動符号化ビデオビジョン変換器にブロックワイズ学習を適用した。
我々は,深さ方向の陰極性,ブロック間類似性,パッチレベルの診断を解析する。
これらの結果から, 残差への寄与として, 遅延ブロック飽和と界面形成が示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:12:43 GMT)
GAP-Net: Calibrating User Intent via Gated Adaptive Progressive Learning for CTR Prediction [0.6] GAP-Netは、マイクロレベルの機能からマクロレベルのビューまで、情報を段階的に洗練する"トリプルゲーティング"アーキテクチャを確立する統一フレームワークである。
最先端のベースラインよりも大幅に改善され、相互作用ノイズや意図の漂流に対して優れた堅牢性を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:43:24 GMT)
N-EIoU-YOLOv9: A Signal-Aware Bounding Box Regression Loss for Lightweight Mobile Detection of Rice Leaf Diseases [0.6] N EIoU YOLOv9は信号認識ボックス回帰損失に基づく軽量検出フレームワークである。
提案した損失は,非単調焦点と非結合幅と高さ最適化を組み合わせることで局所化勾配を推定する。
このデザインは農業病の画像でよく見られる小・低コントラストターゲットに対して特に有効である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:13:36 GMT)
Beyond Strict Rules: Assessing the Effectiveness of Large Language Models for Code Smell Detection [0.5] コードの臭いは、ソフトウェアの保守性に影響を与える可能性のあるコード品質の問題の兆候である。
本稿では,30のJavaプロジェクトにおいて,9つのコードの臭いを検出するための4つの大規模言語モデル(LLM)の有効性を評価する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:08:35 GMT)
From Symbolic to Natural-Language Relations: Rethinking Knowledge Graph Construction in the Era of Large Language Models [0.4] シンボリックな関係記述から自然言語的な関係記述への移行を提唱する。
最小限の構造的バックボーンを維持しつつ,より柔軟でコンテキストに敏感な表現を可能にするハイブリッド設計原則を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 01:49:24 GMT)
How Many Human Judgments Are Enough? Feasibility Limits of Human Preference Evaluation [0.4] 優先信号がプロンプト間で拡散している場合、比例アロケーションは最小値最適であることを示す。
以上の結果から,非決定的あるいは否定的な評価結果が,モデル等価性よりも低パワー評価を反映していることが示唆された。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:34:58 GMT)
Feedback-Based Mobile Robot Navigation in 3-D Environments Using Artificial Potential Functions Technical Report [0.4] 本稿では,障害物の多い3次元動作計画のためのナビゲーション機能の構築と解析について述べる。
提案したナビゲーション関数は、局所最小化を避けながら、ターゲットに固有の非退化障害を許容する。
障害物リッチ3次元環境における数値シミュレーションにより, 実験結果を検証した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 09:41:19 GMT)
The Geometry of Thought: Disclosing the Transformer as a Tropical Polynomial Circuit [0.3] ソフトマックスアテンションの熱帯限界を捉えることで、熱帯マトリックス生成物に変換できることが示される。
これにより、Transformerのフォワードパスが動的プログラミングの繰り返しを効果的に実行していることが分かる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:05:42 GMT)
Navigating Ethical AI Challenges in the Industrial Sector: Balancing Innovation and Responsibility [0.3] この章では、AIを活用した産業革新が本質的に倫理とどのように交わるかを論じている。
倫理的産業AIソリューションの進展に伴い、我々は、倫理的原則を産業AIシステムに組み込むことの重要性を強調している。
この章はまた、AIが倫理的かつ責任ある産業進歩のイネーブラーとして機能する未来に向けて、産業研究と開発を導くための実用的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:32:21 GMT)
A measurement-based protocol for the generation of delocalised quantum states of a mechanical system [0.2] 非ガウス力学状態は、マクロ量子物理学の量子エンハンスドセンシングとテストの鍵となる資源である。
本稿では、光学出力のガイガー光検出を条件に、共振器の非局在非古典状態の計測に基づくプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:27:28 GMT)
Dissecting Judicial Reasoning in U.S. Copyright Damage Awards [0.2] 著作権損害賠償の法的理由付けは 計算法的分析にとって 重要な課題だ
連邦裁判所は1976年の著作権法に従い、その解釈と要素重み付けは司法管轄区域によって大きく異なる。
本稿では,RST(Rhetorical Structure Theory)とエージェントワークフローを統合した,新しい談話に基づくLarge Language Model(LLM)手法を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:09:16 GMT)
Diffusion-Driven Deceptive Patches: Adversarial Manipulation and Forensic Detection in Facial Identity Verification [0.2] この研究は、顔の生体認証システムに侵入するための敵対パッチの生成、精製、評価のためのエンドツーエンドパイプラインを提供する。
顔画像に修正パッチを適用し、自然な視覚特性を維持しながら認識システムを回避する能力をテストする。
このパイプラインは、対向条件下での顔認証と表情認識におけるアイデンティティ分類、キャプション結果、および脆弱性の変化を評価する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:12:54 GMT)
Late Breaking Results: Quamba-SE: Soft-edge Quantizer for Activations in State Space Models [0.2] Quamba-SEは、ステートスペースモデル活性化量子化のためのソフトエッジ量子化器である。
適応的なスケールは3つあり、小さな値の高精度、通常の値の標準スケール、外れ値の低精度である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:52:08 GMT)
Constraint- and Score-Based Nonlinear Granger Causality Discovery with Kernels [0.2] カーネルベースの手法は時系列変数間の非線形因果関係を同定するために用いられる。
技術カーネルに基づくGranger Causalityアプローチの2つの状態が理論的に統一可能であることを示す。
また,この統合に基づく手法を導入し,本手法が因果同定を改善することを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:48:53 GMT)
LLMs Got Rhythm? Hybrid Phonological Filtering for Greek Poetry Rhyme Detection and Generation [0.2] LLM(Large Language Models)は、韻律検出や生成のような音韻論的に基底的な現象に対処する。
本稿では,LLMと決定論的音韻論的アルゴリズムを組み合わせて,正確な韻律識別・分析・生成を実現するハイブリッドシステムを提案する。
我々は,Anemoskala と Interwar Poetry corpora から派生した4万以上の韻律を重要かつ厳格に浄化したコーパスを,今後の研究を支援するためにリリースする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:05:17 GMT)
Beyond Rule-Based Workflows: An Information-Flow-Orchestrated Multi-Agents Paradigm via Agent-to-Agent Communication from CORAL [0.2] 本稿ではエージェント・ツー・エージェント(A2A)通信を用いた情報フロー型マルチエージェントパラダイムを提案する。
汎用ベンチマークGAIAに対する我々のアプローチを,代表的ワークフローベースMASをベースラインとして評価した。
本手法は63.64%の精度を達成し, OWL の55.15% を8.49 % に上回り, トークン消費に匹敵する性能を示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 21:35:51 GMT)
Personalized Multimodal Feedback Using Multiple External Representations: Strategy Profiles and Learning in High School Physics [0.1] 複数の外部表現(MER)とパーソナライズされたフィードバックは物理学習を支援するが、パーソナライズされたフィードバックがMERを効果的に統合する方法の証拠は限られている。
16~24週間の高校理科における観察研究を,言語,図形,数学的形態の検証と入念なフィードバックを提供するコンピュータベースプラットフォームを用いて行った。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:25:44 GMT)
AI-Powered Augmented Reality as a Threat Vector for Human Manipulation [0.1] この章では、AIが生成する拡張現実のパワーと柔軟性についてレビューする。
説得、操作、影響に使用する際のリスクを調査する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:04:58 GMT)
Network-Based Quantum Computing: an efficient design framework for many-small-node distributed fault-tolerant quantum computing [0.1] 分散フォールトトレラント量子計算を効率的に実現するために,ネットワークベースの量子計算(NBQC)を提案する。
本手法は,実用的なベンチマークタスクにおいて,回路ベースの手法よりも短い実行時間を達成できることを数値的に示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:58:31 GMT)
DP-FEDSOFIM: Differentially Private Federated Stochastic Optimization using Regularized Fisher Information Matrix [0.1] DP-FLは、プライバシーを守るために導入された圧倒的なノイズのために、厳格なプライバシー予算の下で緩やかな収束に苦しむ。
本稿では,サーバサイドの2次最適化フレームワークであるDP-FedSOFIMを提案する。
分析の結果,サーバサイドのプレコンディショニングは後処理定理によって(エプシロン,デルタ)差分プライバシーを保っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:11:28 GMT)
A saturation-absorption rubidium magnetometer with multilevel optical Bloch-equation modeling for intermediate-to-high fields [0.1] 精密磁場計測のための原子センサSASHMAGについて述べる。
センサーは超微細なパスチェン-バック系で動作し、超微細な相互作用とゼーマン相互作用は分離される。
この強磁場依存状態におけるスペクトルの解釈のために,我々は包括的多レベル光ブロッホ方程式モデルを開発した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:29:40 GMT)
Confident Learning for Object Detection under Model Constraints [0.1] エッジデバイス上での農業雑草検出は、モデルキャパシティ、計算リソース、リアルタイム推論レイテンシに厳しい制約が課される。
本稿では,データ品質の欠陥を反復診断し,修正することにより検出性能を向上させるデータ中心型フレームワークであるMDDCを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:32:08 GMT)
Stuttering-Aware Automatic Speech Recognition for Indonesian Language [0.0] 本稿では,繰り返しや長文を流布テキストに注入することにより,音声を合成するデータ拡張フレームワークを提案する。
本稿では,この合成データを用いて,移動学習を用いたインドネシアのWhisperモデルの微調整を行う。
実験により,このターゲット合成露光は,流速セグメントの性能を維持しながら,破れた音声の認識誤差を一定に低減することを示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:30:02 GMT)
LLM-Based Agentic Systems for Software Engineering: Challenges and Opportunities [0.0] 本論文は,LLMに基づくマルチエージェントシステムの新しいパラダイムを体系的にレビューする。
言語モデルの選択、SE評価ベンチマーク、最先端のエージェントフレームワーク、通信プロトコルなど、幅広いトピックを掘り下げる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:28:30 GMT)
Transient fields in oblique scattering from an infinite planar dielectric interface -- a qubit lattice simulation [0.0] 初期値アルゴリズムを用いて、有界パルスの斜め散乱に起因する電磁場の時間依存性の進化を調べる。
様々なガウスエンベロープパルスは、全内部反射に必要な入射角が下方にある状態にあると考えられる。
これらのヒューゲン波面の強さは入射パルスの幅に依存する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:18:42 GMT)
Towards a Metadata Schema for Energy Research Software [0.0] 本研究では,要求分析に基づくエネルギー研究ソフトウェアのためのメタデータスキーマを開発し,ユーザテストにより評価する。
以上の結果から, このスキーマは, エネルギー研究者のニーズを満たしつつ, 形式化と相互運用の必要性のバランスを保っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:03:18 GMT)
Toward Spectral Engineering of Squeezed Light in High-Gain PDC [0.0] 高利得状態におけるパラメトリック下降速度によって生じる励起光のスペクトル特性について検討した。
非ポッド化構成ではスペクトル純度が利得とともに上昇するのに対し、アポッド化構成は非単トン依存を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:22:18 GMT)
Three questions on the future of quantum science and technology [0.0] 量子科学技術の現状と今後の展開について述べる。
量子科学技術の現状と今後の展開について述べる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:31:32 GMT)
The Hypocrisy Gap: Quantifying Divergence Between Internal Belief and Chain-of-Thought Explanation via Sparse Autoencoders [0.0] モデルの内部推論と最終生成との相違を定量化するために、偽犯罪ギャップを導入する。
数学的に、スパース線形プローブによって導出された内的真理信念を、潜在空間における最終的な生成軌跡と比較することにより、モデルが不誠実な振る舞いをする傾向を定量化し、検出する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:40:40 GMT)
The Hessian of tall-skinny networks is easy to invert [0.0] Hx=b$ ここで、$H$はディープネットのヘシアンである。
この方法は、ヘッセンの逆ベクトル積を、ヘッセンの逆積を格納することなく計算する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:23:45 GMT)
The Digital Divide in Geriatric Care: Why Usability, Not Access, is the Real Problem [0.0] 2050年までに世界の高齢化人口が16%に急速に増加し、デジタルヘルスソリューションの応用の必要性が高まっている。
この研究は、ユーザエクスペリエンス(UX)の貧弱な設計が、アクセスよりも主要な採用障壁であると主張している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:31:15 GMT)
Syllabic Agglutinative Tokenizations for Indonesian LLM: A Study from Gasing Literacy Learning System [0.0] 本稿では,インドネシアの大規模言語モデルに対する新しい音節ベースのトークン化手法を提案する。
我々は,バイトペア符号化を適用する前に,インドネシア語のテキストを音節境界で分割するトークン化フレームワークを開発した。
まずルールベースセグメンテーションを用いて高周波音節を同定し,3500個のトークンからなるコンパクトな語彙を構築する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:47:24 GMT)
StegoStylo: Squelching Stylometric Scrutiny through Steganographic Stitching [0.0] スティロメトリーは、著作権と盗作に関する調査を支援し、有害なコンテンツの検出を支援し、文学作品の歴史的文脈を提供する。
スティロメトリは著者認証のツールとして使われ、主張された著者から本質的なテキストが生まれるかどうかを確認する。
本稿では, ステガノグラフィーと対角的スタイメトリーを併用することにより, テガノグラフィーと対角的スタイメトリー分析を両立させる方法について検討する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:49:20 GMT)
Stationary perturbation theory without sums over intermediate states: Supersymmetric Expansion Algorithm [0.0] レイリー・シュルディンガー摂動理論の結果は、最近提案された超対称展開アルゴリズムを用いて容易に得ることができることを示す。
我々の形式主義は中間状態の和を避け、関与する超対称ハミルトニアンのエッジ状態の確率密度によって重み付けられた積分の観点からエネルギーと固有状態を直接補正する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:38:10 GMT)
Spectral Distribution of Exceptional Points in Lattices with Localized Loss [0.0] 導波路アレイにおける例外点(EP)のランドスケープは、幾何学に依存したパリティ効果によって決定されることを示す。
本研究は, 有限非エルミート格子の対称性破壊機構を明らかにし, 頑健な光学構造設計のための新しいガイドラインを提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:59:50 GMT)
Sparse quantum state preparation with improved Toffoli cost [0.0] 量子状態の生成は、量子コンピューティングにおける最も基本的なタスクの1つである。
我々は、$n$ qubitsでスパース量子状態を作成するアプローチを提案する。
速度アップは、アイソメトリの発見と実装のための効率的なアルゴリズムを設計することで達成される。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:28:27 GMT)
SiliconHealth: A Complete Low-Cost Blockchain Healthcare Infrastructure for Resource-Constrained Regions Using Repurposed Bitcoin Mining ASICs [0.0] 我々は、古いBitcoinマイニングアプリケーション専用集積回路(ASIC)を、安全で低コストでエネルギー効率の良い医療記録システムを構築するために再利用できることを実証した。
提案アーキテクチャでは、4階層の階層型ネットワークが採用されており、Antminer S19 Pro (90+ TH/s) の地域病院、Antminer S9 (14 TH/s) の都市保健センター、Lucky Miner LV06 GH/s, 13W の農村クリニックがある。
本稿では,SHA-256マイニングASICを暗号証明ジェネレータとして利用する決定論的ハードウェアフィンガープリント(DHF)パラダイムを紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:21:37 GMT)
Scale Invariance Breaking and Discrete Phase Invariance in Few-Body Problems [0.0] 量子力学におけるスケール不変性は、いくつかの方法で破られることがある。
連続スケールの不変性は、結合定数の小さな窓において離散位相不変性に分解可能であることを示す。
離散位相不変性を示す少数体問題の3つの例を示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:00:00 GMT)
Residual Power Flow for Neural Solvers [0.0] 本研究は,Residual Power Flow (RPF) の定式化を提案する。
RPFはKirchhoffの法則に基づいて残関数を定式化し、操作条件の不実現性を定量化する。
ニューラルソルバを用いてRPFを学習し、その速度を活用することを提案する。
運用上の課題を解決するため、予測-仮説-最適化(PO)アプローチでニューラルソルバを統合する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:56:25 GMT)
Reservoir-Engineered Refrigeration of a Superconducting Cavity with Double-Quantum-Dot Spin Qubits [0.0] 超伝導マイクロ波空洞の貯留層冷凍に関する解析的考察を行った。
DQDを分光素子としてではなく、調整可能なエンジニアリングされた貯水池として扱うことで、人口、コヒーレンス、ライン幅、およびデトゥニングのゲート制御が、光子発生死の効果的なプロセスをどのように定義しているかを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:31:19 GMT)
Relation Extraction Capabilities of LLMs on Clinical Text: A Bilingual Evaluation for English and Turkish [0.0] 本稿では,大言語モデル(LLM)を英語とトルコ語の両方で臨床関係抽出タスクに適用した最初の総合的バイリンガル評価について述べる。
我々は、複数のコンテキスト内学習(ICL)とCoT(Chain-of-Thought)アプローチを含む、多様なプロンプト戦略の評価を行う。
提案手法は従来の微調整モデルより一貫して優れていることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:49:46 GMT)
Quantum properties of heavy-fermion pairs at a lepton collider with polarised beams [0.0] 偏光ビームとのレプトン-レプトン衝突で発生する$tbar t$や$+-$のような重フェルミオン対の量子的性質について検討する。
スピン相関、絡み合い、ベル不等式違反、および純度や魔法のような理論的な測度に着目し、ビーム偏光がスピン密度行列の構造をどのように形成するかを分析する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:28:49 GMT)
Quantum graphs of homomorphisms [0.0] 量子グラフのカテゴリ$mathsfqGph$
量子グラフ $[G,H]$ is nonempty iff the $(G,H)$-homomorphism game has a win quantum strategy。
すべての有限反射量子グラフは、量子チャネルの可溶性量子グラフである。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:36:43 GMT)
Quantum Optical Inspired Models for Unitary Black Hole Evaporation [0.0] 単一ブラックホール(BH)蒸発の光学的インスピレーションモデルについて述べる。
i)放射されたホーキング放射(HR)の熱的性質を概ね保存すること(ii)、(iii)初期質量の約半分に蒸発した時にBHから流出した情報を再生するページ曲線を再現すること(iii)である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:27:42 GMT)
Project Aletheia: Verifier-Guided Distillation of Backtracking for Small Language Models [0.0] 小言語モデル(SLM、Small Language Models)は、プライベートなデバイス上でのデプロイメントには魅力的である。
本稿では,エラー修復の過程を伝達するトレーニングプロトコルであるVerifier-Guided Distillationを紹介する。
潜在検証動作が小さなモデルに現れる可能性を示し、時折停止し、矛盾を検知し、以前の仮定を修正できるようにします。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:39:08 GMT)
Probing the Chaos to Integrability Transition in Double-Scaled SYK [0.0] 本稿では,Berkooz,Brukner,Jia,Mamroudのモデルを分析し,二重スケールSYKモデルと可積分弦ハミルトニアンを補間する。
このモデルは、自由エネルギーにおいてkinkによって与えられる一階相転移を示す。
遷移点における和数の変化は、一階の遷移と一致して観測する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:08:01 GMT)
Private LLM Inference on Consumer Blackwell GPUs: A Practical Guide for Cost-Effective Local Deployment in SMEs [0.0] 中小企業はますます、クラウドLLM APIに代わるものを求めている。
専用クラウドGPUインスタンスは、プライバシを改善するが、保証と継続的なコストが制限される。
NVIDIAのBlackwellコンシューマGPUのシステマティックな評価を行う。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:49:07 GMT)
Private Accountability in the Age of Artificial Intelligence [0.0] 私は公民権保護と人工知能(AI)の差し迫った対立を探求する
AIの真の約束は、我々が明らかにする情報に当てはまるのではなく、技術、財産、公民権の相互作用に関する疑問に当てはまる。
民間産業と公民権の関係を調べることで、このプロセスにおける新しい世代の説明責任を開発できるかもしれない。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:24:30 GMT)
Preliminary Tests of the Anticipatory Classifier System with Hindsight Experience Replay [0.0] 本稿では,予測システム(ACS2)とHindsight Experience Replay(HER)機構を新たに統合したACS2HERを紹介する。
本稿では,エージェントが目標達成に失敗した場合に,後見学習を誘発する特定のアーキテクチャ変異体を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:43:36 GMT)
Permutation Matching Under Parikh Budgets: Linear-Time Detection, Packing, and Disjoint Selection [0.0] 一般アルファベット$$に対して置換(ジャンブル/アベリア)パターンマッチングを研究する。
本稿では、PとTの現在の窓とのパリカーベクトル差の維持に基づく一貫したスライドウインドウ・フレームワークを提案する。
We show that MFSP can be solve in O(n + ) time through a two-pointer feasibility maintenance algorithm。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:46:45 GMT)
PSSF: Early osteoarthritis detection using physical synthetic knee X-ray scans and AI radiomics models [0.0] 変形性関節症は 世界中で 障害の主な原因です
X線スキャンは、主にプライバシーと制度上の制約のために入手が難しいことが多い。
本研究は、制御可能なX線スキャンを生成する物理ベースの合成シミュレーションフレームワーク(PSSF)を紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:54:20 GMT)
PCN-Rec: Agentic Proof-Carrying Negotiation for Reliable Governance-Constrained Recommendation [0.0] PCN-Rec(PCN-Rec)は、自然言語による推論を決定論的執行から切り離す、証明付きネゴシエーションパイプラインである。
MovieLens-100Kでは、PCN-Recが98.55%のパスレートを達成した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:00:00 GMT)
Optimizing the Landscape of LLM Embeddings with Dynamic Exploratory Graph Analysis for Generative Psychometrics: A Monte Carlo Study [0.0] 本研究では、埋め込みを探索可能なランドスケープとして再編成し、動的探索グラフ解析(DynEGA)を横埋め込み座標に適用する。
大規模モンテカルロシミュレーションでは,OpenAIのテキスト埋め込み3-小モデルを用いて,五次元の壮大なナルシシズムを表す項目を埋め込んだ。
その結果,全エントロピーフィット指数 (TEFI) と正規化相互情報 (NMI) が,埋め込みランドスケープにおける競合する最適化トラジェクトリに繋がることが明らかとなった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:40:14 GMT)
Online parameter estimation for the Crazyflie quadcopter through an EM algorithm [0.0] クワッドコプターは4回転式ドローンで、この論文で研究されている。
クワッドコプターシステムにランダムノイズが付加され、ドローンシステムへの影響が研究される。
拡張カルマンフィルタは、センサからのノイズ観測に基づいて状態を推定するために使用されている。
その結果,オンラインパラメータ推定はオフラインパラメータ推定よりも若干大きな収束値を持つことがわかった。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:26:40 GMT)
Non-invertible circuit complexity from fusion operations [0.0] ニールセンの幾何学的アプローチを量子回路の複雑さに拡張し、非可逆ゲートを組み込む。
これらは、トポロジカルな欠陥の融合から自然に生じ、超選択セクター間の遷移を可能にする。
我々は、融合操作を完全な正のトレース保存量子チャネルとして認識する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 14:56:54 GMT)
Multi-level quantum emitter in an optical waveguide: paradoxes and resolutions [0.0] マルチレベル量子システムと局所偏光の単一モード光導波路との光双極子相互作用について検討する。
等方性量子エミッタは、エミッタ位置での導波路偏光の偏光に依存するため、反射あるいは光に透過することができる。
4レベル系の例も考慮され、光子数の非破壊パリティ測定として機能している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 20:29:24 GMT)
Multi-Teacher Ensemble Distillation: A Mathematical Framework for Probability-Domain Knowledge Aggregation [0.0] 我々は,マルチテラーアンサンブル知識蒸留のための公理的・演算的枠組みを開発した。
特定の集約公式を規定するのではなく、有効な知識集約演算子を管理する5つのコア公理を定義する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:10:36 GMT)
Mind the Gap: Why Neural Memory Fails Under Semantic Density [0.0] 現在のAIシステムは、この分離を欠き、ニューラルウェイトだけで両方の機能を試みている。
オンラインニューラルメモリの'安定性ギャップ'を識別する。
崩壊はN=5の事実を高密度で示している。
また、本運用システムでは、スキーマドリフトとバージョンあいまいさを主要な障害モードとみなしています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:55:23 GMT)
Mikasa: A Character-Driven Emotional AI Companion Inspired by Japanese Oshi Culture [0.0] 私は日本の押文化に触発された感情的なAIである三笠を紹介します。
ミカサは、安定した性格と、パートナーとして明確に定義された関係を持つコヒーレントな性格としてデザインされている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:23:40 GMT)
Mechanistic principles of exciton-polariton relaxation [0.0] 上方偏光子の励起から続く励起子-偏光子緩和過程の機械的理解を提供する。
我々は,同じフォノン変動同期効果が極性緩和経路において中心的な役割を果たすことを示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 01:44:52 GMT)
Many-Body Effects in Dark-State Laser Cooling [0.0] 2光子ダークステートレーザー冷却(英: two-photon dark-state laser cooling)は、捕獲されたイオンを運動量子基底状態に近づけるためのワークホースである。
ラマンレーザーによって駆動される$$$レベルの構造を持つイオンに対して、弱い結合と強い結合の間のイオン数依存の交差を同定する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:31:42 GMT)
Localization of quantum states within subspaces [0.0] 量子系のフルヒルベルト空間の与えられた部分空間内の量子状態の局所化確率に対して正確な定義が提案される。
状態の対応する局所化成分を明示的に同定し、いくつかの数学的性質を確立する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:24:39 GMT)
Linear Complexity Self-Supervised Learning for Music Understanding with Random Quantizer [0.0] 本稿では,音楽情報検索(MIR)タスクに適用した場合のファンデーションのモデルサイズ削減に焦点をあてる。
本研究は,まず音声認識に応用したSessionMixingと,ランダムな量子化プロセスを組み合わせたブランチフォーマーアーキテクチャを組み合わせたものである。
我々のアーキテクチャは,他の最先端モデルと比較して,競争性能が向上することを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:23:31 GMT)
Light-induced Magnetization by Quantum Geometry [0.0] 量子幾何学から生じる逆ファラデーと逆コットン-ムートン効果のメカニズムを提案する。
ボルツマン輸送理論に基づく半古典的枠組みの中で、電子系における光誘起磁化を記述する一般的な形式主義を確立する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:13:08 GMT)
Lex Reformatica: Five Principles of Policy Reform for the Technological Age [0.0] 25年前、Joel Reidenberg氏は、技術自体が法律や規制だけでなく、情報社会のコミュニティに規則を課していると主張した。
今日では、Reidenberg氏の洞察を再考し、その初期の時代の結果を調べる必要がある、さまざまな課題に直面しています。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:43:57 GMT)
Leveraging Large Language Models to Extract and Translate Medical Information in Doctors' Notes for Health Records and Diagnostic Billing Codes [0.0] 本論文では,オープンウェイトなLarge Language Models (LLMs) を用いて医師ノートから臨床情報を抽出し,クラウドベースのサービスに依存しないICD-10-CM診断コードに変換する。
複数のオープンウェイトモデルを評価するために、Ollama、LangChain、コンテナ化された環境を使用して、プライバシを重視したパイプラインが開発された。
その結果、厳密なスキーマ適用は100%近いコンプライアンスを達成したが、より小さなモデルでは、特定の診断符号の正確な生成は困難であることが判明した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:21:12 GMT)
LemonadeBench: Evaluating the Economic Intuition of Large Language Models in Simple Markets [0.0] 我々は、経済直観、長期計画、不確実性の下での意思決定を評価するための最小限のベンチマークであるLemonadeBench v0.5を紹介する。
モデルは、期限切れの商品で在庫を管理し、価格を設定し、営業時間を選択し、小さなビジネスオーナーが毎日直面する30日間のタスクで利益を最大化しなければならない。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:54:02 GMT)
Learning Volterra Kernels for Non-Markovian Open Quantum Systems [0.0] 我々はオープン量子系に対する非マルコフ運動方程式を同定するためのデータ駆動フレームワークを開発した。
学習者の善意を確立します
論文参考訳(メタデータ) (Wed, 14 Jan 2026 02:09:49 GMT)
Learning About Learning: A Physics Path from Spin Glasses to Artificial Intelligence [0.0] ホップフィールドモデルは、もともとスピングラス物理学にインスパイアされたもので、統計力学、ニューラルネットワーク、そして現代の人工知能の交差点で中心的な位置を占めている。
我々はホップフィールドモデルを、学部統計物理学、力学系、線形代数、計算方法からコアトピックを自然に統一する、教育学的にリッチなフレームワークとして提示する。
この研究は、学生が研究、産業、社会の中心となる計算ツールを理解し、適用し、批判的に関わるのを助けることを目的としている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:36:51 GMT)
Lattice fermion simulation of spontaneous time-reversal symmetry breaking in a helical Luttinger liquid [0.0] 我々は最近開発された「タンジェントフェルミオン」法を拡張し、1次元格子上にヘリカルルッティンガー液体のハミルトニアンを識別する。
正弦分散のフェルミオン拡散障害は、ハミルトニアンの時間反転対称性を保ちながら、接分散を扱うことによって回避される。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:32:20 GMT)
LPCAN: Lightweight Pyramid Cross-Attention Network for Rail Surface Defect Detection Using RGB-D Data [0.0] 本稿では,現在のビジョンに基づくレール欠陥検出手法の限界に対処する。
本稿では,RGB-Dデータを利用した軽量ピラミッドクロスアテンションネットワーク(LPCANet)を提案する。
LPCANetは990万のパラメータ、2.50GのFLOP、162.60fpsの推論速度で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:35:09 GMT)
LLMs can Compress LLMs: Adaptive Pruning by Agents [0.0] ポストトレーニングプルーニングは、性能を保ちながら計算コストを削減するための有望なアプローチとして現れている。
我々はエージェント誘導プルーニングを導入し、ファンデーションモデルが適応プルーニングエージェントとして機能する。
我々はQ3モデル(4Bおよび8Bパラメータ)の約45%の間隔で評価を行い、構造化プルーニングベースラインよりも大幅に改善されたことを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:45:36 GMT)
Knowledge-Embedded and Hypernetwork-Guided Few-Shot Substation Meter Defect Image Generation Method [0.0] 変電所メータは電力グリッドの安定運用の監視と確保において重要な役割を担っている。
クラックやその他の物理的欠陥の検出は、しばしば、注釈付きサンプルの深刻な不足によって妨げられる。
本研究では,条件付き知識埋め込みとHypernetwork-Guided Controlを安定拡散パイプラインに統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 07:21:57 GMT)
Iterative Differential Entropy Minimization (IDEM) method for fine rigid pairwise 3D Point Cloud Registration: A Focus on the Metric [0.0] 著者らは、厳密な対角3次元点雲登録のための新しい微分エントロピーに基づく計量を導入した。
提案手法は密度差, ノイズ, ホール, 部分重なりがあっても有効であり, RMSEが常に最適にアライメントするとは限らない。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:16:51 GMT)
Is it possible to determine unambiguously the Berry phase solely from quantum oscillations? [0.0] ベリー位相とゼーマン効果の相互作用が位相決定を複雑にすることを示す。
また、フェルミレベルの磁場依存性という、未承認の別のメカニズムについても論じる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:29:15 GMT)
Irreversible Kinetics Emerges from Bayesian Inference over Admissible Histories [0.0] 非可逆運動学の確率的定式化は、エネルギー散逸作用と観測制約から構築されたギブス型測度によって漸進的にヒストリーが重み付けされ、テータの不確実性を伴う。
これは、7つの異なるフォワード・イン・タイムの例と、大域的に制約された最小作用原理を通したスパース観測からの未知の履歴の逆数で示される。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:43:53 GMT)
Interprofessional and Agile Development of Mobirobot: A Socially Assistive Robot for Pediatric Therapy Across Clinical and Therapeutic Settings [0.0] 本稿では,外傷,骨折,うつ病から回復した子どもの移動を支援するために開発された社会支援ロボットMobirobotを提案する。
このロボットは、シンプルなセットアップ、適応可能なエクササイズルーチン、インタラクティブなガイダンス、モチベーションダイアログ、モニタリングとノーコードシステムフィードバックのためのグラフィカルユーザインターフェース(GUI)を備えている。
現在、受容性、ユーザビリティ、そして認識される治療的利益を評価するために、実現可能性の研究が進行中である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:55:04 GMT)
Improving Implicit Hate Speech Detection via a Community-Driven Multi-Agent Framework [0.0] 本研究は、暗黙的に憎しみに満ちた音声に対する文脈的検出フレームワークを提案する。
中央モデレーターエージェントと動的に構築されたコミュニティエージェントからなるマルチエージェントシステムとして実装されている。
我々のアプローチは、公開知識ソースから社会文化的文脈を統合する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:20:32 GMT)
Horizon Activation Mapping for Neural Networks in Time Series Forecasting [0.0] Horizon Activation Mapping (HAM)は、grad-CAMにインスパイアされた視覚的解釈可能性である。
Hamは、粒度のモデル選択、検証セットの選択、異なるニューラルネットワークモデルファミリ間の比較に使用することができる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:10:20 GMT)
High-Resolution Spectroscopy of $^{173}$Yb$^{+}$ Ions [0.0] 本報告では, 効率的なレーザー冷却, 状態調製, および, 捕捉された173rmYb+$イオンの検出について報告する。
この遷移における171rmYb+$と173rmYb+$の間の同位体移動は1.4Hzの不確実性によって決定される。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:54:39 GMT)
Hierarchical time crystals [0.0] 離散時間結晶と連続時間結晶の結合系が同時に2倍の時間対称性の破れを引き起こすことを示す。
サブシステムのうちの1つは、動的生成器には存在せず、むしろ動的に現れる創発的な離散時間対称性を破る。
階層型時間結晶は頑健であり、基本的に異なるカップリングスキームのために出現し、幅広いシステムパラメータにわたって持続することを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:00:00 GMT)
Herzberg-Teller coupling in coherent multidimensional spectroscopy: analytical response functions for multilevel systems [0.0] コヒーレント多次元分光法は、分子および固体系におけるビブロニック効果の詳細な研究を可能にする。
本稿では,Herzberg-Teller(non-Condon)結合の存在下での多次元非線形応答関数の明示的解析式を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:22:51 GMT)
Hallucination Detection and Mitigation in Large Language Models [0.0] LLM(Large Language Models)とLRM(Large Reasoning Models)は、金融や法律のような高額な領域に変革をもたらす。
幻覚を起こそうとする傾向は、事実的に不正確な、または、サポートされていないコンテンツを発生させ、重大な信頼性のリスクを生じさせる。
本稿では,根本原因認識による継続的改善サイクル上に構築された幻覚管理のための包括的枠組みを紹介する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:19:37 GMT)
Geometric Stability: The Missing Axis of Representations [0.0] 我々は$geometric$ $stabilityを導入し、摂動下での表現幾何学の信頼性を定量化する。
7つの領域における2,463以上の構成から、安定性と類似性は実証的に非相関性を示す。
安全監視のため、安定性は機能的な幾何学的カナリアとして機能し、CKAよりも2ドル近い速度で構造的なドリフトを検出する。
モデル選択においては、安定性は転送可能性から解離し、転送最適化が生じる幾何学的税制を明らかにする。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:15:22 GMT)
Geometric Hybrid Poincaré Sphere with Variable Poles [0.0] 独立に制御可能なスピン角運動量(SAM)と軌道角運動量(OAM)を持つ構造光子状態を記述するための統一的な幾何学的枠組みを提案する。
従来の高次ポアンカレ球とは異なり、GHPSは極をポアンカレ球面(PS)と軌道ポアンカレ球面(OPS)上の任意の基底の直積として定義することで構成される。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:29:44 GMT)
Generation of Large Coherent-State Superpositions in Free-Space Optical Pulses [0.0] 非ガウス量子状態の生成は、量子情報処理の鍵となる要件である。
自由空間光パルスにおける大振幅圧縮コヒーレント状態重ね合わせの実験結果について報告する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:12:43 GMT)
Future-as-Label: Scalable Supervision from Real-World Outcomes [0.0] 時が自由な監督を生み出す: 現実の出来事に関する予測は、検証可能な結果に解決する。
我々は、実世界の予測に時間をかけて検証可能な報酬で強化学習を拡張した。
我々は、因果的にマスキングされた情報から確率予測を行うために言語モデルを訓練する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 22:14:08 GMT)
From Prompt to Protocol: Fast Charging Batteries with Large Language Models [0.0] 本研究では, 効率の良いバッテリ充電を実現するために, グラデーションフリーのLCM駆動閉ループ方式を2つ導入する。
現実的な高速充電のシナリオでは、P2OとP2Pはどちらも、最先端のマルチステップ定電流(CC)ベースラインよりも4.2%改善されている。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:58:20 GMT)
From Noise to Insights: Enhancing Supply Chain Decision Support through AI-Based Survey Integrity Analytics [0.0] 本研究では、教師付き機械学習アプローチを用いて信頼性の低い調査入力をフィルタリングする軽量なAIベースのフレームワークを提案する。
前処理とラベルエンコーディングの後、ランダムフォレストとベースラインモデルの両方が、偽の反応と真偽の反応を区別するように訓練された。
最適性能モデルは92.0%の精度を達成し, パイロット実験と比較して検出精度が向上した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:23:50 GMT)
Fractional Revival Dynamics in Kerr-Type Systems: Angular Momentum Moments and Classical Analogs [0.0] ウェーブパケットの復活と分数再生は、非線形エネルギースペクトルを持つ系で発生する暗示量子干渉現象である。
角運動量観測器における分数的回復ダイナミクスについて検討し, モーメントの時間的発展の明示的な表現を導出する。
第2に、量子回復現象の古典的アナログと、代表的古典系における量子分数再生と再帰挙動の間の構造的類似性について検討する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:58:30 GMT)
Explainable Deep Learning for Pediatric Pneumonia Detection in Chest X-Ray Images [0.0] 肺炎は世界中で小児の致死率と死亡率の主要な原因となっている。
本研究は,小児肺炎の自動検出のための2つの最先端畳み込みニューラルネットワーク(CNN)アーキテクチャを比較した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:21:32 GMT)
Evaluating Self-Correcting Vision Agents Through Quantitative and Qualitative Metrics [0.0] Vision-Language Agents (VLA) は複雑な視覚タスクを実行可能なツールベースの計画に分解することができる。
最近のベンチマークでは反復的自己補正の評価が始まっているが、その量的制限と支配的な推論ボトルネックはいまだに不十分である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:17:11 GMT)
Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization [0.0] FPGAのようなリソース制約のあるエッジデバイスにディープニューラルネットワーク(DNN)をデプロイするには、レイテンシ、電力、ハードウェアリソース使用量の間で注意深くバランスする必要がある。
本稿では2つの最適化を通じてこれらの課題に対処する包括的フレームワークであるSparseLUTを提案する。
まず、加算器を介して複数のPolyLUTサブニューロンを集約し、LUT消費量を2.0x-13.9x削減し、推論遅延を1.2x-1.6x削減するアーキテクチャ拡張を提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:59:06 GMT)
Energy-Entropy Regularization: The True Power of Minimal Looped Transformers [0.0] 最近の研究は、ループトランスフォーマーは標準的なディープアーキテクチャよりも優れた推論能力を持っていることを示唆している。
本稿では,Tsallisエントロピーとハミルトン力学を利用して損失景観の幾何学を変換する新しいトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:56:35 GMT)
Efficient Multilingual Dialogue Processing via Translation Pipelines and Distilled Language Models [0.0] 本稿では,NLPAI4Health 2025共有タスク用に開発された,Kl33n3xの多言語対話要約と質問応答システムについて述べる。
このアプローチでは、Indic言語から英語への前方翻訳、2.55Bパラメータの蒸留言語モデルを用いたマルチタスクテキスト生成、ソース言語への逆変換という3段階のパイプラインを採用している。
このシステムは、マラソン(86.7% QnA)、タミル(86.7% QnA)、ヒンディー(80.0% QnA)など、競技のタスクで強い勝利率を達成した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 01:02:06 GMT)
Effects of personality steering on cooperative behavior in Large Language Model agents [0.0] 大規模言語モデル(LLM)におけるパーソナリティステアリングが協調行動に及ぼす影響を,Prisoner's Dilemmaゲームを用いて検討した。
以上の結果から,すべてのモデルにおける協力を促進する要因として,一致性が重要であることが示唆された。
露骨な人格情報は協力を増すが、搾取に対する脆弱性も引き起こす。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 12:54:25 GMT)
Duality and measurement: the Copenhagen reconciliation [0.0] 双対性は、モニズムではなく、量子力学のコペンハーゲンの解釈を特徴づけている。
我々は、マルチパースペクティブスキーマを通して構成された量子理論の二重アスペクト読影を再保証する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:51:34 GMT)
Do people expect different behavior from large language models acting on their behalf? Evidence from norm elicitations in two canonical economic games [0.0] 我々は、大きな言語モデルが自分自身の代わりに行動するとき、人々が異なる期待を持っているかどうかを調査する。
我々は、Krupka-Weberノルムエレケーションタスクを用いて、社会的適切度評価のシフトを検出する。
結果は,資源分割の方法を決定する機械に対して異なる規範を適用するが,その規範を強制する機械には反対しないことを示唆している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:07:00 GMT)
Distortion maps for elliptic curves over finite fields [0.0] 有限体上の楕円曲線に対する歪み写像の存在に関する考察を提案する。
文献の結果を再検討し、詳細な証拠を提供する。
また、新たな視点も提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 22:24:15 GMT)
Dissipative State Engineering of Complex Entanglement with Markovian Dynamics [0.0] 本稿では,スピン系におけるマルコフ力学を用いて,クラスタ状態のような複雑な絡み合い構造の散逸発生について検討する。
工学的Liouvillian散逸がスピン間の局所イジング相互作用で支配されるとき、クラスター状態が定常状態として現れる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 16:14:14 GMT)
Detail Loss in Super-Resolution Models Based on the Laplacian Pyramid and Repeated Upscaling and Downscaling Process [0.0] 超高分解能画像の高周波数詳細化のための2つの手法を提案する。
ラプラシアのピラミッドに基づく細部損失は、超解像と詳細像を別々に生成して制御することによってモデルを導出する。
繰り返しのアップスケーリングとダウンスケーリングは、詳細損失の有効性を増幅します。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 11:57:15 GMT)
Democracy and Distrust in an Era of Artificial Intelligence [0.0] AIにおける3つのトレンド-民営化、予測、自動化の台頭は、マイノリティに同様のリスクをもたらすと私は考えています。
私は人工知能の時代において司法審査の理論がどのように見えるか概説する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:40:36 GMT)
Deep Operator Networks for Surrogate Modeling of Cyclic Adsorption Processes with Varying Initial Conditions [0.0] 偏微分方程式の解は、初期条件を対応する解体にマッピングする作用素として解釈できるからである。
目的は、過渡的なPDEの繰り返し解を必要とする温度-真空スウィング吸着(TVSA)のような循環過程の収束を加速することである。
異種初期条件からなる混合学習データセットを構築し,対応する解演算子を近似するためにDeepONetsを訓練する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 13:56:25 GMT)
Deep Learning-based Binary Analysis for Vulnerability Detection in x86-64 Machine Code [0.0] 本稿では,x86-64マシンコードから直接特徴抽出の実現可能性について検討する。
マシンコードはより効率的で軽量なモデルを可能にし、分解時に失われる可能性のあるすべての情報を保存できることを示している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 04:52:47 GMT)
Cost and accuracy of long-term memory in Distributed Multi-Agent Systems based on Large Language Models [0.0] 本研究では,ベクトルベースのメモリフレームワークであるmem0と,グラフベースの知識グラフであるGraphitiを比較した。
その結果、mem0はGraphitiの効率を著しく上回り、読み込み時間の短縮、リソース消費の低減、ネットワークオーバーヘッドの最小化を実現している。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:03:59 GMT)
Contrastive Bi-Encoder Models for Multi-Label Skill Extraction: Enhancing ESCO Ontology Matching with BERT and Attention Mechanisms [0.0] 細密労働市場分析は、構造化されていない求人広告をESCOのような標準化されたスキルにマッピングすることにますます依存している。
本稿では,手動でラベル付けされたジョブ・アド・トレーニングデータを必要としないゼロショットスキル抽出フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:43:45 GMT)
Consensus-Driven Group Recommendation on Sparse Explicit Feedback: A Collaborative Filtering and Choquet-Borda Aggregation Framework [0.0] 本稿ではコンセンサス駆動型ハイブリッドグループレコメンデーションフレームワークを提案する。
近所のコラボレーティブ・フィルタリングとファジィ・アグリゲーションを統合し、合意、公正さ、そして疎遠さをサポートする。
実世界のデータセットを用いた実験結果から,提案手法はグループレベルのコンセンサス,満足度,公正性を向上し,バランスの取れたノベルティを維持した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 03:49:35 GMT)
Cluster Workload Allocation: Semantic Soft Affinity Using Natural Language Processing [0.0] 本稿では,自然言語処理を用いたクラスタシステムのためのセマンティックな意図駆動型スケジューリングパラダイムを提案する。
このシステムは、スケジューラ拡張子を介して統合されたLarge Language Cluster Model (LLM)を使用して、ソフトアフィニティの好みに対する自然言語アロケーションヒントアノテーションを解釈する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 08:36:21 GMT)
Characterization of Silicon-Membrane TES Microcalorimeters for Large-Format X-ray Spectrometers with Integrated Microwave SQUID Readout [0.0] シリコン窒化物イオン絶縁体(SOI)ウェハを用いて作製したSi膜上に懸濁した遷移端センサ(TES)検出器の電気・熱的特性について述べる。
集積化と焦点面面積の効率的な利用との互換性は、効率的な軟X線分光計への道を提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:01:34 GMT)
Can LLMs interpret figurative language as humans do?: surface-level vs representational similarity [0.0] 人的参加者と4つの命令調整 LLM は、6つの言語的特徴を表す240の対話に基づく文を評価した。
その結果、人間とLLMは表面レベルでは人間と一致していたが、表現レベルでは大きなばらつきが見られた。
GPT-4は人間の表現パターンを最もよく近似し、全てのモデルは文脈に依存し、社会的な表現に苦しむ。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:13:00 GMT)
Breaking the Orthogonality Barrier in Quantum LDPC Codes [0.0] 量子低密度パリティチェック (LDPC) 符号は, 大きく, 通常の距離上限を持たない。
BP復号と低複雑さ後処理アルゴリズムを組み合わせることで, 脱分極チャネル上でのフレーム誤り率を10~8ドル以下に抑えることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 18:26:06 GMT)
Beyond Optimization: Harnessing Quantum Annealer Dynamics for Machine Learning [0.0] 古典データをイジング・ハミルトニアンにエンコードし、量子アニール上で進化させ、その結果の確率分布を特徴写像として分類するモデルを提案する。
Digitsデータセットを用いた量子アニールマシンの実験は、MNISTのシミュレーションとともに、短いアニール時間がより高い分類精度をもたらす一方で、より長い時間は精度を低下させるがサンプリングコストを低下させることを示した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 23:49:45 GMT)
Background cancellation for frequency-selective quantum sensing [0.0] 量子センシングの主な課題は、弱い時間依存信号の検出である。
本稿では、時間独立的な相互作用と絡み合いを利用して、受動性、可変、しきい値の周波数フィルタとして機能する量子センサを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 19:00:38 GMT)
Ascertaining higher-order quantum correlations in high energy physics [0.0] 統計累積と中心モーメントに対する新しいタイプのクレーター=ホルン不等式が定式化されている。
高次相関の存在を示す3次制約の重大な違反が、ハイパーオン-反ハイペロン系に存在することが判明した。
特に、この違反は、時間的事象のキネマティックな汚染に対する$bar$ペアの高エネルギーシステムにおいてより顕著である。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 06:19:19 GMT)
Architecture inside the mirage: evaluating generative image models on architectural style, elements, and typologies [0.0] ジェネレーティブ・人工知能(GenAI)のテキスト・トゥ・イメージ・システムは、ますます建築画像の生成に利用されている。
我々は、30のアーキテクチャ的プロンプトを用いた5つの広く使われているGenAI画像プラットフォームを、スタイル、タイプ、およびコード化要素を用いて評価した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 05:13:04 GMT)
AquaFeat+: an Underwater Vision Learning-based Enhancement Method for Object Detection, Classification, and Tracking [0.0] この研究はAquaFeat+を提案する。AquaFeat+は自動視覚タスクに特化して機能を強化するために設計されたプラグアンドプレイパイプラインである。
このアーキテクチャには、色補正、階層的特徴強調、適応的残留出力のためのモジュールが含まれており、最終アプリケーションの損失関数によってエンドツーエンドにトレーニングされ、直接ガイドされる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:38:41 GMT)
Analysis of voice recordings features for Classification of Parkinson's Disease [0.0] 早期診断は患者の生活の質の悪化を緩和するために不可欠である。
近年の研究では、患者の音声記録の使用が早期診断に役立つことが示されている。
本稿では,さまざまなタイプの機械学習モデルと特徴選択法を組み合わせることで疾患を検出することを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:59:07 GMT)
Aeon: High-Performance Neuro-Symbolic Memory Management for Long-Horizon LLM Agents [0.0] 大規模言語モデル(LLM)は、自己注意の2次計算コストと「中道の失われた」現象によって制約される。
我々は,静的ストアではなく,管理OSリソースとしてメモリを再定義するニューロシンボリック認知オペレーティングシステムであるAeonを提案する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 15:23:22 GMT)
A perturbative non-Markovian treatment to low-temperature spin decoherence [0.0] 我々は,核スピン浴に結合した電子スピンを扱うために,非マルコフ時間畳み込みマスター方程式を開発した。
ab初期電子構造パラメータをデコヒーレンスダイナミクスに直接関連付けることにより、低温限界における純粋なデフォーカスを考慮に入れたフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 17:35:40 GMT)
A note on invariants of mixed-state topological order in 2D [0.0] 2次元では、強い対称性に対応する$C*$-tensor圏が近似双対性を満たす状態から生じる。
ブレイドされた$C*$-テンソル圏の$S$-行列と位相的ねじれは、有限深さの量子チャネルの下で単調な量であることを示す。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 22:38:26 GMT)
A game-theoretic probability approach to loopholes in CHSH experiments [0.0] ゲーム理論の確率を用いた情報的・タイミング的視点からCHSHの不等式について検討する。
我々はScientistsとNatureの間のシーケンシャルな隠れ変数ゲームを構築した。
これにより、Scientistsの運用的な勝利戦略と、実験的に観察されたCHSH違反のゲーム理論の確率論的解釈が得られる。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 10:14:53 GMT)
A Decompilation-Driven Framework for Malware Detection with Large Language Models [0.0] 本稿では,大規模言語モデル (LLM) が,実行可能コードを良性か悪性かのどちらかとして分類する際の有効性を評価する。
Ghidra disassemblerを使って、最初にWindows実行ファイルをCコードに分解する自動パイプラインを導入する。
我々は、キュレートされたマルウェアと良質なデータセットに基づいて訓練された微調整モデルが、バニラモデルよりも大幅に優れていることを実証した。
論文参考訳(メタデータ) (Wed, 14 Jan 2026 00:00:26 GMT)