Driving on Registers [95.3] DrivoRは、エンドツーエンドの自動運転のためのシンプルで効率的なトランスフォーマーベースのアーキテクチャである。
提案手法は、事前訓練された視覚変換器(ViT)上に構築され、マルチカメラ機能をコンパクトなシーン表現に圧縮するカメラ対応レジスタトークンを導入している。
この結果から,純変圧器アーキテクチャと目標トークン圧縮を組み合わせることで,高精度で適応的なエンド・ツー・エンド・ドライブを実現するのに十分であることが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:28:24 GMT)
VideoAuto-R1: Video Auto Reasoning via Thinking Once, Answering Twice [88.9] CoT推論(Chain-of-thinkt)は、ビデオ理解タスクにおけるマルチモーダルな大規模言語モデルのための強力なツールとして登場した。
本稿では,ビデオ理解フレームワークであるVideoAuto-R1を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:00:59 GMT)
VerseCrafter: Dynamic Realistic Video World Model with 4D Geometric Control [83.9] VerseCrafterは、4D対応のビデオワールドモデルであり、カメラとオブジェクトのダイナミクスの両方を明示的で一貫性のある制御を可能にする。
当社のアプローチは,静的な背景点雲を通じて世界状態をエンコードする,新しい4次元幾何制御表現を中心にしている。
これらの4D制御は、事前訓練されたビデオ拡散モデルのための条件付け信号にレンダリングされ、高忠実でビュー一貫性のあるビデオを生成することができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:28:52 GMT)
Mesh4D: 4D Mesh Reconstruction and Tracking from Monocular Video [81.4] Mesh4Dはモノクル4Dメッシュ再構成のためのフィードフォワードモデルである。
私たちの重要な貢献は、単一のパスでアニメーションシーケンス全体をエンコードするコンパクトな潜在空間です。
提案手法は, 3次元形状と変形を再現する上で, 従来の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:59:56 GMT)
Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framework for State-of-the-Art Multimodal Retrieval and Ranking [80.5] 本稿では,Qwen3-VL-EmbeddingとQwen3-VL-Rerankerモデルシリーズを紹介する。
Qwen3-VL-Embeddingモデルでは、意味的にリッチな高次元ベクトルを生成するためのマルチステージトレーニングパラダイムを採用している。
Qwen3-VL-Rerankerはクエリ-ドキュメントペアの詳細な関連性推定を行う。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:36:06 GMT)
Plenoptic Video Generation [80.3] PlenopticDreamerは、同期時間記憶を維持するために生成幻覚を同期するフレームワークである。
中心となる考え方は、マルチインアウトのビデオ条件付きモデルを自己回帰的にトレーニングすることだ。
トレーニングでは,コンバージェンス向上のためのコンテキストスケーリング,エラー蓄積による幻覚への自己条件付け,拡張ビデオ生成をサポートする長時間ビデオコンディショニング機構が組み込まれている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:58:32 GMT)
Forging Spatial Intelligence: A Roadmap of Multi-Modal Data Pre-Training for Autonomous Systems [75.8] 自動運転車とドローンは、マルチモーダル搭載センサーデータから真の空間情報を必要とする。
本稿では,この目標に向かって進む中核的な技術群を同定し,マルチモーダル・プレトレーニングのためのフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:52:40 GMT)
Reinforced Efficient Reasoning via Semantically Diverse Exploration [73.4] 検証可能な報酬(RLVR)による強化学習は,大規模言語モデル(LLM)の推論の強化に有効であることが証明された。
本研究では,LLMのための意味的多様性探索,すなわちROSEによる効率的な推論手法を提案する。
本手法は,意味エントロピーに基づく分岐戦略と$varepsilon$-exploration機構を組み込んだものである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:56:44 GMT)
How to Set the Learning Rate for Large-Scale Pre-training? [73.0] 我々はこの調査を2つの異なる研究パラダイムであるフィッティングとトランスファーに定式化する。
フィッティングパラダイムでは,探索係数のスケーリング法則を導入し,O(n3) から O(n*C_D*C_) への探索複雑性を予測モデルにより効果的に低減する。
我々は、$Transferの原則をMixture of Experts (MoE)アーキテクチャに拡張し、モデル深さ、重量減衰、トークン水平線を含む適用範囲を広げる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:55:13 GMT)
Adversarial Yet Cooperative: Multi-Perspective Reasoning in Retrieved-Augmented Language Models [72.4] 本稿ではAdrialversa Reasoning RAG(ARR)というReasoner-Verifierフレームワークを提案する。
ReasonerとVerifierは、回収された証拠を推論し、プロセス認識の利点によってガイドされながら、互いの論理を批判する。
複数のベンチマーク実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:57:03 GMT)
Talk2Move: Reinforcement Learning for Text-Instructed Object-Level Geometric Transformation in Scenes [69.5] 本研究では,シーン内のオブジェクトのテキストによる空間変換を行うフレームワークであるTalk2Moveを紹介する。
Talk2Moveでは,さまざまなロールアウトを通じて幾何学的アクションを探索するために,グループ相対ポリシー最適化を採用している。
キュレートされたベンチマークの実験では、Talk2Moveは正確で一貫性があり、セマンティックに忠実なオブジェクト変換を実現している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:56:27 GMT)
MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization [68.9] 話者対応のタイムスタンプ・トランセプションは,各話者の発話のタイミングを正確に決定することを目的としている。
既存のSATSシステムでは、エンド・ツー・エンドの定式化はまれであり、コンテキストウィンドウの制限、長距離スピーカーメモリの弱い、タイムスタンプの出力ができないといった制約がある。
本稿では,MOSS Transcribe Diarizeについて述べる。MOSS Transcribe Diarizeはマルチモーダルな大規模言語モデルで,エンドツーエンドのパラダイムで話者属性,時間スタンプの転写を行う。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:58:04 GMT)
OptiVote: Non-Coherent FSO Over-the-Air Majority Vote for Communication-Efficient Distributed Federated Learning in Space Data Centers [68.7] メガコンステレーションは、宇宙データセンター(SDC)の長期的なビジョンを推進している
AirCompはフリースペース(FSO)を学習するためのネットワーク内集約フレームワーク
AirVoteは符号勾配(SGD)と多数符号変調(PPM)を統合し、各衛星はPPMタイムスロットを活性化することで局所勾配を伝達する。
OptiVoteは位相依存性電場重ね合わせを位相非依存光強度結合に緩和する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:31:52 GMT)
All That Glisters Is Not Gold: A Benchmark for Reference-Free Counterfactual Financial Misinformation Detection [67.9] RFC Benchは、現実的なニュースの下で財務的な誤情報に関する大規模な言語モデルを評価するためのベンチマークである。
このベンチマークでは、2つの補完的なタスクが定義されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:39:03 GMT)
Character-R1: Enhancing Role-Aware Reasoning in Role-Playing Agents via RLVR [67.7] character-R1は効果的な役割認識推論のための検証可能な報酬信号を提供するために設計されたフレームワークである。
本フレームワークは,認知的フォーカス・リワード(Cognitive Focus Reward),参照ガイド・リワード(Reference-Guided Reward),文字指定リワード正規化( character-Conditioned Reward normalization)の3つのコア設計で構成されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:33:37 GMT)
Milestones over Outcome: Unlocking Geometric Reasoning with Sub-Goal Verifiable Reward [67.0] サブゴールレベルの評価と学習へのパラダイムシフトを導入する。
まず,厳密な形式検証データエンジンを用いたベンチマークであるGeoGoalを構築した。
本研究では,スケルトンレートに基づいて,スパース信号を高密度な報酬に置き換えるサブゴール検証リワード(SGVR)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:17:56 GMT)
CounterVid: Counterfactual Video Generation for Mitigating Action and Temporal Hallucinations in Video-Language Models [66.6] ビデオ言語モデル(VLM)は、強いマルチモーダル理解を実現するが、特に行動や時間秩序を推論する場合、幻覚を起こす傾向にある。
本稿では,シーンコンテキストを保ちながら,アクションや時間構造が異なる映像を合成する,対物映像生成のためのスケーラブルなフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:03:07 GMT)
Muse: Towards Reproducible Long-Form Song Generation with Fine-Grained Style Control [66.5] 我々は, きめ細かなスタイル条件付き長大な楽曲生成のための, 完全オープンソースシステムをリリースする。
データセットは116kの完全ライセンスの合成曲で構成され、自動生成の歌詞とスタイル記述がある。
我々は、個別の音声トークンで拡張されたQwenベースの言語モデルの単一ステージ教師付き微調整によりMuseを訓練する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:25:41 GMT)
Re-Rankers as Relevance Judges [65.4] 再ランカ・アズ・レバレンス・ジャッジ設定で再ランカを再現する。
TREC-DL 2019〜2023では,220Mから32Bの3家族から8人の再ランカを対象に実験を行い,再ランカに基づく審査員による評価バイアスを分析した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 00:02:59 GMT)
Mind the Generative Details: Direct Localized Detail Preference Optimization for Video Diffusion Models [65.2] LocalDPOは、ビデオ拡散モデルと人間の好みを一致させる新しいフレームワークを構築している。
そこで我々は,LocalDPOがビデオの忠実度,時間的コヒーレンス,人間の嗜好スコアを,他のポストトレーニングアプローチよりも一貫して改善することを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:51:26 GMT)
BaseCal: Unsupervised Confidence Calibration via Base Model Signals [65.1] ポストトレーニング後のLLM(PoLLM)は、一般的に深刻な過信で信頼を損なう。
対応するLLMはよく校正されたままである。
このことは、ベース LLM をリファレンスとして、PoLLM の信頼性を校正する動機となります。
簡単な解決策であるBaseCal-ReEvalは、PoLLMの応答を評価し、それらをベースLSMに供給し、平均確率を自信として得る。
そこで本研究では,PLLMの最終層が隠された状態をベースにマッピングするために,軽量プロジェクションをトレーニングするBaseCal-Projを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:57:18 GMT)
CoV: Chain-of-View Prompting for Spatial Reasoning [64.8] CoV(Chain-of-View)は、視覚言語モデルをアクティブな視点推論子に変換する。
我々はOpenEQA上でのCoVの評価を行い、Qwen3-VL-Flashで最大13.62%向上したLLM-Matchで平均+11.56%改善した。
CoVはテストタイムのスケーリングも行っており、最小アクション予算を増やすことで、Gemini-2.5-Flashで最大で+3.73%となる2.51%の平均的な改善がもたらされる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:59:42 GMT)
Same Claim, Different Judgment: Benchmarking Scenario-Induced Bias in Multilingual Financial Misinformation Detection [64.8] 大規模言語モデル (LLM) は金融分野に広く適用されている。
行動バイアスは、意思決定における不安定性と不確実性をもたらす可能性がある。
mfmdscenは様々な経済シナリオで mfmdの行動バイアスを評価するベンチマークです
論文参考訳(メタデータ) (Thu, 08 Jan 2026 22:00:32 GMT)
Surface-based Molecular Design with Multi-modal Flow Matching [64.0] SurfFlowは、ペプチドの配列、構造、表面の包括的な共設計を可能にする、新しい表面ベースの生成アルゴリズムである。
包括的なPepMergeベンチマークで評価すると、SurfFlowはすべてのメトリクスで一貫して全原子ベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:19:29 GMT)
SmartSearch: Process Reward-Guided Query Refinement for Search Agents [63.5] 大言語モデル(LLM)に基づく検索エージェントは、知識集約的な問題に対処するために有望であることが証明されている。
既存の研究は主に、検索エージェントの推論パラダイムの最適化に重点を置いているが、推論中の中間的な検索クエリの品質は見過ごされ続けている。
この問題を緩和する2つの主要なメカニズムの上に構築されたフレームワークであるSmartSearchを紹介します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:39:05 GMT)
Current Agents Fail to Leverage World Model as Tool for Foresight [61.8] エージェントは、行動する前に結果を予測するためにそれらを使用できます。
本稿では,現在のエージェントがそのような世界モデルを,認知力を高めるツールとして活用できるかどうかを実証的に検討する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:36:21 GMT)
Token-Level LLM Collaboration via FusionRoute [60.7] FusionRouteはトークンレベルのマルチLLMコラボレーションフレームワークである。
各デコーディングステップで最も適した専門家を選択し、選択した専門家の次のTokenディストリビューションを洗練または修正する補完ロジットをコントリビュートする。
シーケンスレベルのコラボレーションとトークンレベルのコラボレーション、モデルマージ、ダイレクト微調整の両方に優れています。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:53:16 GMT)
Dynamics-inspired Structure Hallucination for Protein-protein Interaction Modeling [60.6] タンパク質とタンパク質の相互作用 (PPI) は生物学の中心的な課題である。
深層学習は、このような変異の影響を予測することは約束されているが、2つの主要な制約によって妨げられている。
本稿では,Refine-PPIという新しいフレームワークについて述べる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:29:04 GMT)
Adaptive Retrieval for Reasoning-Intensive Retrieval [60.3] Bridgeドキュメントは、推論プロセスに寄与するが、初期クエリに直接関連しないドキュメントである。
既存の推論ベースのリランカパイプラインは、これらのドキュメントをランキングで表示しようとするが、バウンドリコールに悩まされる。
適応検索のための高密度フィードバック信号として、推論計画を再取得することで、このギャップを埋めるフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:46:50 GMT)
SciIF: Benchmarking Scientific Instruction Following Towards Rigorous Scientific Intelligence [60.2] 科学的妥当性を確立する制約に厳格に固執しながら、問題を解決する能力。
具体的には,大学レベルの問題と制約の固定されたカタログをペアにすることで,この能力を評価するマルチディシプリンのベンチマークであるSciIFを紹介する。
SciIFは、解の正当性と多拘束性の両方を測定することにより、構成的推論失敗のきめ細かい診断を可能にする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:45:58 GMT)
WESR: Scaling and Evaluating Word-level Event-Speech Recognition [59.2] 音声は言語情報だけでなく、笑ったり泣いたりするような豊富な非言語的な音声イベントも伝達する。
我々は,21の発声イベントの分類を改良し,個別(スタンドアローン)と連続(音声と混合)に分類した。
改良された分類法に基づくWESR-Benchは,新しい位置認識プロトコルを備えた専門家アノテート評価セット(900以上の発話)である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:23:21 GMT)
Mechanisms of Prompt-Induced Hallucination in Vision-Language Models [59.0] 制御されたオブジェクトカウント設定において、プロンプトが画像中のオブジェクト数をオーバーステートする障害モードについて検討する。
刺激誘発幻覚 (PIH) を, 追加訓練を伴わずに40%以上減少させる小さなアテンションヘッドのセットを同定した。
本研究は, 刺激による幻覚を誘発する内的メカニズムについての知見を提示し, モデル特異的な行動の実施方法の違いを明らかにした。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:23:03 GMT)
BackdoorAgent: A Unified Framework for Backdoor Attacks on LLM-based Agents [58.8] 大規模言語モデル(LLM)エージェントは、計画、メモリ、ツールの使用を組み合わせた多段階ワークフローを通じてタスクを実行する。
エージェントワークフローの特定のステージに注入されたバックドアトリガーは、複数の中間状態を通して持続し、下流出力に悪影響を及ぼす可能性がある。
LLMエージェントにおけるバックドア脅威を統一したエージェント中心のビューを提供するモジュールおよびステージアウェアフレームワークである textbfBackdoorAgent を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:49:39 GMT)
Atlas 2 - Foundation models for clinical deployment [58.2] 我々はAtlas 2とAtlas 2-BとAtlas 2-Sを提示する。
我々のモデルは、これまでで最大の病理基盤モデルデータセットでトレーニングされ、スライド画像全体の550万の病理組織学で構成された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:37:00 GMT)
Thinking-Based Non-Thinking: Solving the Reward Hacking Problem in Training Hybrid Reasoning Models via Reinforcement Learning [57.6] Thinking-Based Non-Thinkingは、さまざまなクエリに対する思考を使用しない応答に対して、異なる最大トークン使用量を設定する。
5つの数学ベンチマークの実験により、TNTはトークンの使用量を約50%削減することを示した。
TNTの応答における報酬ハッキングの確率は、思考を使用しないものとして分類されているが、依然として10%以下である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:38:41 GMT)
Beyond Monolithic Architectures: A Multi-Agent Search and Knowledge Optimization Framework for Agentic Search [56.8] エージェント検索は、大規模言語モデル(LLM)が推論とツールの使用をインターリーブできるようにすることによって、複雑な情報を探すための有望なパラダイムとして登場した。
本稿では,bfM-ASKを提案する。bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:13:27 GMT)
Commitment Checklist: Auditing Author Commitments in Peer Review [55.7] 本稿では,大規模言語モデル(LLM)を用いた著者のコミットメントの大規模監査を行い,カメラ対応バージョンとの比較を行う。
約束された変更の大多数が実装されているが、かなりのシェア(約25%)は提供されていない。
我々は、著者やオーガナイザに未承認の約束を通知する、著者コミットチェックリストのアイデアを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:37:09 GMT)
Memory Matters More: Event-Centric Memory as a Logic Map for Agent Searching and Reasoning [55.3] 大規模言語モデル(LLM)は、環境を推論し、計画し、相互作用するインテリジェントエージェントとして、ますます多くデプロイされている。
長期のシナリオに効果的にスケールするには、そのようなエージェントの重要な機能は、過去の経験を保持し、整理し、取り出すことができるメモリメカニズムである。
イベント理論にインスパイアされたイベント中心のメモリフレームワークであるCompassMemを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:44:07 GMT)
Exploring Recommender System Evaluation: A Multi-Modal User Agent Framework for A/B Testing [54.5] A/Bテストのためのマルチモーダルユーザエージェント(A/Bエージェント)を提案する。
具体的には、A/Bテストのためのレコメンデーションサンドボックス環境を構築し、マルチモーダルおよびマルチページインタラクションを実現する。
モデル,データ,機能という3つの観点から,従来のA/Bテストに代わるエージェントの可能性を検証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:33:43 GMT)
QwenStyle: Content-Preserving Style Transfer with Qwen-Image-Edit [54.1] 本稿では,Qwen-Image-Editでトレーニングされた最初のコンテンツ保存スタイル転送モデルを提案する。
QwenStyle V1は、スタイルの類似性、コンテントの一貫性、美的品質の3つのコアメトリクスで、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:22:51 GMT)
RiskAtlas: Exposing Domain-Specific Risks in LLMs through Knowledge-Graph-Guided Harmful Prompt Generation [53.5] 大規模言語モデル(LLM)は、金融や医療といった専門分野にますます適用されている。
本稿では、知識グラフ誘導による有害なプロンプト生成を行い、二重パス難読化書き換えを適用するエンドツーエンドフレームワークを提案する。
このフレームワークは、強いドメイン関連性と暗黙性を組み合わせた高品質なデータセットを生成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:05:28 GMT)
PROMISE: Process Reward Models Unlock Test-Time Scaling Laws in Generative Recommendations [52.7] 生成レコメンデーションは有望なパラダイムとして現れ、階層的なセマンティックIDよりもシーケンス・ツー・シーケンス生成タスクとしてレコメンデーションを改革している。
既存の手法は、セマンティックドリフト(Semantic Drift)と呼ばれる重要な問題に悩まされ、初期、高レベルのトークンのエラーは、生成軌道を無関係な意味部分空間に不可逆的に分散させる。
本稿では,高密度なステップバイステップ検証を生成モデルに統合する新しいフレームワークPromiseを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:38:46 GMT)
Enhancing Multimodal Retrieval via Complementary Information Extraction and Alignment [52.0] 文書中のテキストと画像の両方を統一された潜在空間に変換する,新しいマルチモーダル検索手法であるCIEAを提案する。
2つの相補的コントラスト損失を用いてCIEAを最適化し、セマンティックな整合性を確保し、画像に含まれる相補的情報を効果的にキャプチャする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:02:49 GMT)
Learning Latent Action World Models In The Wild [50.5] In-the-wild video における潜在行動世界モデル学習の問題点について検討する。
連続的な、しかし制約のある、潜在的なアクションは、ワイルドなビデオからアクションの複雑さを捉えることができる。
ビデオ間の共通の具体化がないため、我々は主に宇宙空間で局所化される潜伏行動を学ぶことができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:55:39 GMT)
Large Language Models Are Bad Dice Players: LLMs Struggle to Generate Random Numbers from Statistical Distributions [50.1] 大規模言語モデル(LLM)における母国語の確率的サンプリングの大規模,統計的に活用された最初の監査について述べる。
バッチ生成は, ほぼ完全に崩壊する一方, 中央値のパスレートが13%であり, 統計的妥当性はわずかであることがわかった。
現在のLCMには機能的な内部サンプルが欠如しており、統計的保証を必要とするアプリケーションに外部ツールを使う必要があると結論付けている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 22:33:12 GMT)
Aligning Text, Code, and Vision: A Multi-Objective Reinforcement Learning Framework for Text-to-Visualization [50.1] テキスト2Vis生成のための最初の強化学習フレームワークであるRL-Text2Visを提案する。
本手法では,テキストの精度,コードの有効性,可視化品質を共同で最適化する新しい多目的報酬を用いている。
その結果,GRPOは可視化生成における構造的マルチモーダル推論の効果的な戦略として確立された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:29:07 GMT)
A Unified Spoken Language Model with Injected Emotional-Attribution Thinking for Human-like Interaction [50.1] 本稿では,感情的インテリジェンスのための統一言語モデルを提案する。
IEATは、ユーザーの感情状態とその根本原因をモデルの内部推論プロセスに組み込んでおり、明示的な監督として扱われるのではなく、感情を意識した推論を内部化することができる。
HumDial(Human-like Spoken Dialogue Systems Challenge)Emotional Intelligenceベンチマークの実験は、提案手法が感情軌道モデリング、感情的推論、共感的応答生成にまたがるトップランクのパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:07:30 GMT)
FaST: Efficient and Effective Long-Horizon Forecasting for Large-Scale Spatial-Temporal Graphs via Mixture-of-Experts [49.9] 既存のモデルは、主に短期水平予測に焦点を当てており、悪名高い計算コストとメモリ消費に悩まされている。
本稿では,長期・大規模STG予測のためのMixture-of-Experts(MoEs)に基づく,効率的かつ効率的なフレームワークであるFaSTを提案する。
まず、計算負担を軽減するための適応型グラフエージェントアテンション機構を提案する。
第2に,従来のフィードフォワードネットワークを Gated Linear Units (GLUs) に置き換えた新しい並列MoEモジュールを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:00:58 GMT)
Differential syntactic and semantic encoding in LLMs [49.3] 我々は,Large Language Models (LLMs) の内部層表現において,統語的・意味的情報を符号化する方法を検討する。
構文と意味論の層間符号化プロファイルは異なっており,この2つの信号はある程度分離可能であることが判明した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:33:29 GMT)
Agentic Retoucher for Text-To-Image Generation [48.8] Agentic Retoucherは階層的な意思決定駆動のフレームワークで、ポストジェネレーションの修正を人間のような知覚・推論・アクションループとして再構成する。
この設計は、知覚的証拠、言語的推論、制御可能な修正を統一された自己修正的決定プロセスに統合する。
実験により、エージェント・リタッチは知覚品質、歪みの局在化、人間の嗜好調整において、最先端の手法を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:57:37 GMT)
ObjectForesight: Predicting Future 3D Object Trajectories from Human Videos [48.2] 本研究では,3次元オブジェクト中心のダイナミックスモデルを導入し,短い自我中心の映像シーケンスから剛体物体の将来の6-DoFのポーズと軌跡を予測する。
ピクセルまたは潜在空間で動作する従来の世界やダイナミクスモデルとは異なり、ObjectForesightはオブジェクトレベルで3Dで明示的に世界を表現する。
我々は、ObjectForesightが、未確認のオブジェクトやシーンへの精度、幾何整合性、一般化において、大幅に向上することを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:58:08 GMT)
ConMax: Confidence-Maximizing Compression for Efficient Chain-of-Thought Reasoning [46.5] 大規模推論モデルは、精度を向上することなく計算コストを増大させる冗長な推論経路を生成する。
本稿では,推論トレースを自動的に圧縮する新しい強化学習フレームワークであるConMaxを紹介する。
5つの推論データセットに対する実験は、ConMaxが優れた効率とパフォーマンスのトレードオフを達成することを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:22:58 GMT)
ArcAligner: Adaptive Recursive Aligner for Compressed Context Embeddings in RAG [46.1] ArcAlignerは、言語モデルレイヤに統合された軽量モジュールである。
適応的な''ゲーティング'システムを使用し、情報が複雑である場合にのみ追加の処理能力を追加する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:44:52 GMT)
Distilling the Thought, Watermarking the Answer: A Principle Semantic Guided Watermark for Large Reasoning Models [46.1] 本稿では推論集約型LLM用に設計された新しい透かしフレームワークであるReasonMarkを紹介する。
提案手法は, 生成を非破壊思考相と透かし解答相に分解する。
実験の結果、ReasonMark はテキストのパープレクシティを 0.35 に減らし、BLEU のスコアを0.164 に増やし、数学的精度を 0.67 ポイント向上させることで最先端の手法を上回った。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:32:22 GMT)
OptiSet: Unified Optimizing Set Selection and Ranking for Retrieval-Augmented Generation [46.0] 検索補助生成(RAG)は、大規模な外部コーパスから取得した証拠を組み込むことで、生成品質を向上させる。
セット選択とセットレベルのランキングを統一する,セット中心のフレームワークであるOptiSetを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:35:01 GMT)
How to Set the Batch Size for Large-Scale Pre-training? [46.0] 本稿では,Warmup-Stable-Decay(WSD)学習率スケジューラに適した改良E(S)関係を提案する。
理論的には, 目標損失を達成するのに必要な最小バッチサイズしきい値であるB_minと, 合計トークンを最小化してデータ効率を最大化する最適バッチサイズであるB_optの2つの基本的特性を明らかにしている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:43:31 GMT)
TourPlanner: A Competitive Consensus Framework with Constraint-Gated Reinforcement Learning for Travel Planning [44.7] TourPlannerは、マルチパス推論と制約付き強化学習を備えた包括的なフレームワークである。
本研究では,TourPlannerが最先端のパフォーマンスを実現し,既存の手法をはるかに上回っていることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:08:35 GMT)
Logics-STEM: Empowering LLM Reasoning via Failure-Driven Post-Training and Document Knowledge Enhancement [44.6] 本稿では、Logics-STEM-SFT-Datasetに基づいて、最先端の推論モデルであるLogics-STEMを提案する。
Logics-STEMは、STEM関連のベンチマークでは8Bスケールで次のベストモデルよりも平均4.68%向上している。
我々はLogics-STEMモデルとLogics-STEM-SFT-Datasetの両方を公開し、オープンソースコミュニティにおける将来の研究を支援する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:13:14 GMT)
Mind2Report: A Cognitive Deep Research Agent for Expert-Level Commercial Report Synthesis [43.8] Mind2Reportは、専門家レベルのレポートを合成するために商業アナリストをエミュレートする、認知的なディープリサーチエージェントである。
具体的には、まずきめ細かな意図を探索し、それからWebソースを検索し、ハエの蒸留情報を記録し、その後、レポートを反復的に合成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:27:52 GMT)
SOVABench: A Vehicle Surveillance Action Retrieval Benchmark for Multimodal Large Language Models [43.8] 我々は,車両関連行動を中心とした監視映像から構築した実世界検索ベンチマークであるSOVABenchを紹介する。
SOVABenchは、2つの評価プロトコル(ペア内とペア内)を定義し、相互行為の識別と時間方向の理解を評価する。
本稿では,MLLMによる画像とビデオの両方の記述から解釈可能な埋め込みを生成するための学習自由フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:58:59 GMT)
Identifying Good and Bad Neurons for Task-Level Controllable LLMs [43.2] 大規模言語モデルは、複数の質問応答ベンチマークで顕著な機能を示した。
大型ニューロンの基盤となる複雑なメカニズムは不透明であり、LLMの理解と操舵に重大な課題を生んでいる。
本稿では,LLMニューロン識別における機能的アンタゴニティの生物学的原理を取り入れた,タスクレベルのLLM理解フレームワークであるNeuronLLMを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:24:18 GMT)
SparseLaneSTP: Leveraging Spatio-Temporal Priors with Sparse Transformers for 3D Lane Detection [42.9] 3Dレーン検出は、自動運転において重要な課題として浮上している。
本稿では,SparseLaneSTPを提案する。SparseLaneSTPは,レーン構造の幾何学的性質と時間情報の両方をスパースレーントランスに統合する手法である。
新しいレーン固有の時間的注意機構、スパースアーキテクチャに適した連続レーン表現、および時間的正規化を導入している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:16:11 GMT)
Conformity and Social Impact on AI Agents [42.0] 本研究では,AIエージェントとして機能する大規模マルチモーダル言語モデルにおいて,社会圧力下での集団意見の一致傾向について検討した。
実験の結果,AIエージェントは社会影響理論と整合性バイアスを示し,グループサイズ,一様性,タスクの難易度,ソース特性に敏感であることがわかった。
これらの発見は、悪意のある操作、誤報キャンペーン、マルチエージェントシステムにおけるバイアス伝搬を可能にするAIエージェント決定における基本的なセキュリティ脆弱性を明らかにしている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:16:28 GMT)
When Imbalance Comes Twice: Active Learning under Simulated Class Imbalance and Label Shift in Binary Semantic Segmentation [42.0] Active Learningの目的は、ラベルのないデータセットから最も情報に富んだサンプルを選択することである。
これは、マシンビジョンや医用画像など、データの量が大きく、ラベル付けが高価である場合に有用である。
高度に不均衡なデータセットであっても、アクティブな学習戦略、特にエントロピーベースとコアセットの選択が興味深く効率的であることを示します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:14:06 GMT)
Inside Out: Evolving User-Centric Core Memory Trees for Long-Term Personalized Dialogue Systems [41.7] Inside Outは、グローバルにメンテナンスされているPersonaTreeを長期ユーザープロファイリングのキャリアとして利用するフレームワークである。
我々は、プロセスベースの報酬で強化学習を通じて軽量なMemListenerをトレーニングし、構造化された、実行可能で、解釈可能なADD、UDDATE、DELETE、NO_OP操作を生成する。
実験により、ペルソナTreeは、コンテキストノイズの抑制とペルソナの一貫性維持において、フルテキスト結合と様々なパーソナライズドメモリシステムより優れていることが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:59:11 GMT)
Orchestrating Intelligence: Confidence-Aware Routing for Efficient Multi-Agent Collaboration across Multi-Scale Models [41.5] OI-MASは、マルチスケールモデルのヘテロジニアスプールにまたがる適応モデル選択ポリシーを実装する、新しいマルチエージェントフレームワークである。
OI-MASはベースラインのマルチエージェントシステムより一貫して優れており、精度は最大12.88%向上し、コストは最大79.78%削減されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:56:09 GMT)
Agent-Dice: Disentangling Knowledge Updates via Geometric Consensus for Agent Continual Learning [41.5] 大言語モデル(LLM)ベースのエージェントは、破滅的な忘れをせずに新しいタスクを学習する。
Agent-Diceは指向性コンセンサス評価に基づくパラメータ融合フレームワークである。
GUIエージェントとツール使用エージェントドメインの実験は、Agent-Diceが優れた連続学習性能を示すことを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:36:44 GMT)
When Single-Agent with Skills Replace Multi-Agent Systems and When They Fail [40.7] マルチエージェントAIシステムは複雑な推論に有効であることが証明されている。
スキルのライブラリから選択した単一のエージェントで、同様のモジュラリティのメリットを達成できますか?
本研究では,スキル選択のスケーリング行動を調査し,印象的なパターンを観察する。
図書館のサイズだけでなく,類似のスキル間のセマンティック・コンフューザビリティが,この劣化に中心的な役割を果たしていることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:14:26 GMT)
Miner:Mining Intrinsic Mastery for Data-Efficient RL in Large Reasoning Models [40.6] 大規模推論モデルに対する現在の批判のないRL法は、正の同質なプロンプトのトレーニングにおいて深刻な非効率性に悩まされる。
UlineMine Ulineintrinsic Mastulineery (Miner) に対する超単純だが強力なソリューションを提案する。
マイナーは、政策の本質的な不確実性を自己監督的な報酬信号として再利用する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:52:37 GMT)
On the Hidden Objective Biases of Group-based Reinforcement Learning [40.5] グループベース強化学習法は,近年,大規模言語モデルのポストトレインに広く用いられている。
本稿では,GRPO スタイルの手法を統一的なサロゲート定式化の中で研究することによって理論的に解析する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:00:35 GMT)
TimeGNN-Augmented Hybrid-Action MARL for Fine-Grained Task Partitioning and Energy-Aware Offloading in MEC [39.3] 本稿では,複数のエッジサーバを対象とした協調計算フレームワークを提案する。
多次元サーバ状態情報の時系列をモデル化し、予測するために、時間グラフニューラルネットワーク(TimeGNN)が組み込まれている。
また、離散連続ハイブリッドアクション空間において、マルチエージェント決定論的ポリシー勾配アルゴリズム(DC-MADDPG)を導入する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:24:58 GMT)
Self-MedRAG: a Self-Reflective Hybrid Retrieval-Augmented Generation Framework for Reliable Medical Question Answering [39.1] Self-MedRAGは、臨床推論の反復的仮説検証プロセスを模倣するために設計された自己反射型ハイブリッドフレームワークである。
Sparse(BM25)とReciprocal Rank Fusion(Reciprocal Rank Fusion)による高密度(Contriever)レトリバーを組み合わせたハイブリッド検索戦略を統合している。
ジェネレータを使用して、支持する合理性で回答を生成し、軽量な自己回帰モジュールで評価する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:56:04 GMT)
Normalized Conditional Mutual Information Surrogate Loss for Deep Neural Classifiers [39.0] 我々は,デファクト・クロスエントロピー(CE)の代替として,新しい情報理論的サロゲート損失,正規化条件付き相互情報(NCMI)を提案する。
画像認識と全スライディングイメージング(WSI)サブタイピングベンチマークを通じて、NCMIでトレーニングされたモデルは、CEと同等の計算コストで、かなりのマージンのアート損失の状態を超越した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:36:47 GMT)
UniLiPs: Unified LiDAR Pseudo-Labeling with Geometry-Grounded Dynamic Scene Decomposition [38.9] 自動運転の応用において、ラベルなしのLiDARログは、本質的には、平らな視界に隠れている密集した3D幾何学の金鉱である。
テキストと2Dビジョン基礎モデルから直接3Dへと持ち上げ、融合するために、LiDARスイープ間の時間的幾何学的整合性を活用することで、このボトルネックに対処する。
提案手法が既存のセマンティックセグメンテーションやオブジェクト検出擬似ラベル法と良好に比較できることを実験的に検証した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:52:28 GMT)
RoboVIP: Multi-View Video Generation with Visual Identity Prompting Augments Robot Manipulation [38.7] 大規模なデータセットから視覚的なアイデンティティプールをキュレートするためのスケーラブルなパイプラインを構築しています。
付加的な操作データを用いて、下流での視覚-言語-アクションとビジュモータポリシーモデルを訓練すると、シミュレーションと実ロボット設定の両方で一貫したパフォーマンス向上が得られる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:59:22 GMT)
Re-Align: Structured Reasoning-guided Alignment for In-Context Image Generation and Editing [38.2] Re-Alignは構造化推論誘導アライメントを通じて理解と生成のギャップを埋める。
In-context Image Generation and editing (ICGE)により、ユーザーはインターリーブされた画像テキストプロンプトによって視覚概念を指定できる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:13:00 GMT)
Learning from Mistakes: Negative Reasoning Samples Enhance Out-of-Domain Generalization [37.6] チェーン・オブ・シンクレット(CoT)軌道上でのSFT(Supervised Fine-tuning)は、大規模言語モデルにおける推論を可能にする一般的なアプローチである。
通常、標準的なプラクティスは、正しい最終回答(陽性)を持つ軌跡を保ちながら、残り(陰性)を無視するのみである。
我々は、このパラダイムが相当な監督を放棄し、オーバーフィッティングを悪化させ、ドメイン外一般化(OOD)を制限すると論じている。
適応型サンプル認識方式であるGain-based LOss Weighting (GLOW)を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:49:10 GMT)
Character Detection using YOLO for Writer Identification in multiple Medieval books [37.5] 文書の執筆時期を推定し、中世の写本に寄与した個々の筆跡を特定することで、書跡や書体の発展をたどることができる。
筆者らはこれまで、各著者を特徴付ける特定の文字や略語を特定することに焦点を当てたアプローチを提案してきた。
テンプレートマッチング手法を用いて、各ページの「a」文字と畳み込みニューラルネットワーク(CNN)の出現を検知し、各インスタンスを正しいスクライブに属性付けした。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:11:24 GMT)
ResMAS: Resilience Optimization in LLM-based Multi-agent Systems [37.4] 大規模言語モデルに基づくマルチエージェントシステム(LLMベースMAS)
LLMベースのMASは一般的に異なるデバイスや環境に分散しており、エージェント障害などの摂動に弱い。
摂動下でのMASのレジリエンスについて検討し、通信トポロジと迅速な設計の両方がシステムのレジリエンスに大きく影響していることを見出した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:03:37 GMT)
ImagineNav++: Prompting Vision-Language Models as Embodied Navigator through Scene Imagination [36.5] VLM(Vision-Language Models)は、オンボードのRGB/RGB-Dストリームのみを使用してマップレスなビジュアルナビゲーションを実現し、空間的な知覚と計画の可能性を解き放つ。
我々はこれを、想像力によるナビゲーションフレームワークImagineNav++で実現している。
空間的整合性を維持するため,スパース・トゥ・デンス・フレームワークによる観測を階層的に統合する選択的葉形成記憶機構を開発した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:38:18 GMT)
Trade-R1: Bridging Verifiable Rewards to Stochastic Environments via Process-Level Reasoning Verification [35.4] モデルトレーニングフレームワークであるTrade-R1は、プロセスレベルの推論検証を通じて、検証可能な報酬を環境にブリッジする。
我々は、得られた証拠、推論連鎖、および決定の間のペアワイズアライメントを評価するために、三角形の整合性指標を構築する。
国別資産選択の実験は、我々のパラダイムが報酬ハッキングを減らすことを実証している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:48:58 GMT)
Modern Neuromorphic AI: From Intra-Token to Inter-Token Processing [35.4] 現代のAIアーキテクチャは、高度に定量化されたアクティベーション、状態空間のダイナミクス、スパースアテンションメカニズムを通じて、ニューロモルフィックの原則を具現化している。
本稿では、ニューロモルフィックモデル、状態空間モデル、トランスフォーマーアーキテクチャ間の接続について詳述する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:17:56 GMT)
Controllable Memory Usage: Balancing Anchoring and Innovation in Long-Term Human-Agent Interaction [35.2] エージェントのメモリ依存を明示的かつユーザ制御可能な次元としてモデル化できることを示す。
textbfSteerable textbfMemory Agent, textttSteeMを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:54:30 GMT)
Fast thermal state preparation beyond native interactions [35.2] 熱状態に対する量子シミュレーションを設計するための,ユニタリダイナミクスのみに基づくフレームワークを提案する。
総進化時間などの必要な実験資源は、温度と臨界から独立していることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:43:56 GMT)
LAMB: LLM-based Audio Captioning with Modality Gap Bridging via Cauchy-Schwarz Divergence [35.1] LAMBは、オーディオ埋め込みとテキスト埋め込み空間の間のモダリティギャップを橋渡しするオーディオキャプションフレームワークである。
クロスモーダルアリグナーは、相互情報を最大化しながら、コーシー=シュワルツの発散を最小限にする。
セマンティックにリッチなオーディオ埋め込みを抽出するTwo-Stream Adapterは、よりリッチな情報をCross-Modal Alignerに提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:05:35 GMT)
Illumination Angular Spectrum Encoding for Controlling the Functionality of Diffractive Networks [35.1] そこで本研究では,照明の角スペクトルに基づく回折ニューラルネットワークの新しい制御機構を提案する。
本稿では,複数の画像間翻訳タスクを実行するために,単一の回折ネットワークを訓練することにより,提案手法を数値的に説明する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:00:40 GMT)
ToolGate: Contract-Grounded and Verified Tool Execution for LLMs [35.0] 外部ツールを付加した大規模言語モデル(LLM)は、複雑な推論タスクにおいて顕著な機能を示した。
既存のフレームワークは、いつツールが呼び出されるか、結果がコミットされるべきかどうかを決定するために、自然言語の推論に大きく依存している。
textbfToolGateは、論理的安全性保証と検証可能な状態進化を提供するフォワード実行フレームワークである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:56:45 GMT)
LANGSAE EDITING: Improving Multilingual Information Retrieval via Post-hoc Language Identity Removal [34.7] 多言語埋め込みは、セマンティクスと共に言語アイデンティティをエンコードする。
本稿では,プール埋め込みを訓練したポストホックスパースオートエンコーダであるLangSAE EDIINGを提案する。
複数の言語にわたる実験では、ランキング品質と言語間カバレッジが一貫して改善されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:36:41 GMT)
UniCorn: Towards Self-Improving Unified Multimodal Models through Self-Generated Supervision [34.6] 導電失語(Conduction Aphasia)は、モデルがマルチモーダル入力を正確に解釈するが、その理解を忠実で制御可能な合成に変換するのに苦労する現象である。
外部データや教師の監督を必要としない,シンプルでエレガントな自己改善フレームワークUniCornを提案する。
マルチモーダルコヒーレンスの回復を検証するために,テキスト・トゥ・イメージ・トゥ・テクスチャ・コンシステンシー・ベンチマークであるUniCycleを導入する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:08:10 GMT)
Fast, high-fidelity Transmon readout with intrinsic Purcell protection via nonperturbative cross-Kerr coupling [34.1] 超伝導量子ビットの分散可読化は、量子ビットと読み出し共振器をハイブリダイズする逆容量結合に依存する。
ここでは、強い量子ビット-共振器間相互作用を実現する単純なアーキテクチャであるジャンクション・リードアウトを示す。
我々は,外部パーセルフィルタや近量子制限増幅器を使わずに,68 ns積分時間と98.4 %QND忠実度で99.4 %の割当忠実度を実現する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:25:30 GMT)
Vision-Language Introspection: Mitigating Overconfident Hallucinations in MLLMs via Interpretable Bi-Causal Steering [33.4] メタ認知的自己補正プロセスをシミュレートするトレーニングフリー推論フレームワークであるVision-Language Introspection (VLI)を導入する。
VLIは高度なモデルで最先端のパフォーマンスを実現し、MMHal-Benchではオブジェクト幻覚率を12.67%削減し、POPEでは精度を5.8%向上した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:49:13 GMT)
A General Neural Backbone for Mixed-Integer Linear Optimization via Dual Attention [33.3] 混合整数線形プログラミング(MILP)は最適化のための広く使われているモデリングフレームワークである。
ディープラーニングの最近の進歩は、MILPインスタンスを可変制約二部グラフとして表現することで、この問題に対処している。
我々は、純粋なグラフビューを超えて表現的表現を学習する、注意駆動型ニューラルネットワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:23:47 GMT)
Quantitative mapping from conventional MRI using self-supervised physics-guided deep learning: applications to a large-scale, clinically heterogeneous dataset [33.0] 本研究では,T1,T2,およびプロトン密度マップを推定する物理誘導深層学習フレームワークを提案する。
このフレームワークは、大規模な、臨床的に不均一なデータセットで訓練され、評価された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:08:58 GMT)
CuMA: Aligning LLMs with Sparse Cultural Values via Demographic-Aware Mixture of Adapters [32.8] textbftextscCuMA(textbfCultural textbfMixture of textbfAdapters)は、textbf条件のキャパシティ分離問題としてアライメントをフレーム化するフレームワークである。
textscCuMAは最先端のパフォーマンスを実現し、密度の高いベースラインとセマンティックのみのMoEを著しく上回っている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:30:43 GMT)
A Vision for Multisensory Intelligence: Sensing, Synergy, and Science [32.0] 本稿は,今後10年間の多感覚人工知能研究の展望を概説する。
この新しいテクノロジーは、人間とAIがどのように経験し、相互に相互作用するかを変えることができる。
センサーの研究は、AIがデジタルメディアを超えて、より豊かな方法で世界を捉える方法を広げるべきである。
我々は、モダリティと人間とAIの相乗効果を学ぶための新しい技術的課題を提示する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:46:20 GMT)
Know Thy Enemy: Securing LLMs Against Prompt Injection via Diverse Data Synthesis and Instruction-Level Chain-of-Thought Learning [31.8] 大規模言語モデル(LLM)統合アプリケーションはますます普及しているが、プロンプトインジェクション(PI)攻撃による重大なセキュリティ上の脆弱性に直面している。
InstruCoTは、多種多様な訓練データを合成し、微調整を指示レベルチェーンで行うPIディフェンスのモデル拡張手法である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:25:27 GMT)
RAAR: Retrieval Augmented Agentic Reasoning for Cross-Domain Misinformation Detection [31.8] RAARは、クロスドメイン誤情報検出のための検索強化エージェント推論フレームワークである。
RAARは、それぞれのサンプルのセマンティクス、感情、書き込みスタイルに沿ったソースドメインのエビデンスを取得する。
RAARは、特殊なマルチエージェントコラボレーションを通じて、検証可能な多段階推論パスを構築する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:43:16 GMT)
Revisiting Judge Decoding from First Principles via Training-Free Distributional Divergence [31.4] ジャッジ・デコーディングは、投機的デコーディングの厳密な検証を緩和することで推論を加速する。
本研究では、このパラダイムを第一原理から再考し、コストのかかる監督によって得られた臨界点のスコアが、本質的に、ドラフトターゲットの分散分散にエンコードされていることを明らかにした。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:34:54 GMT)
Evaluating the Pre-Consultation Ability of LLMs using Diagnostic Guidelines [31.3] LLMの前処理能力を評価するために設計されたベンチマークデータセットとフレームワークであるEPAGを紹介する。
成熟したタスク固有のデータセットで微調整された小さなオープンソースモデルは、前処理でフロンティアLSMより優れている。
以上の結果から,HPIの増加が診断性能の向上につながるとは限らないことが判明した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:47:05 GMT)
AppellateGen: A Benchmark for Appellate Legal Judgment Generation [30.9] 7,351対のケースペアからなる第2のインスタンス法定判断生成のためのベンチマークであるAppellateGenを紹介する。
このタスクは、最初の評決と明らかな更新について推論することで、法的に拘束力のある判断を起草するモデルを必要とする。
本稿では,SOPに基づく法的マルチエージェントシステム(SLMAS)を提案し,その生成過程を個別の課題識別,検索,起草の段階に分解する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:49:41 GMT)
GeM-VG: Towards Generalized Multi-image Visual Grounding with Multimodal Large Language Models [30.8] MLLM(Multimodal Large Language Models)は、単一画像のグラウンド化と一般的な多画像理解において、目覚ましい進歩を見せている。
一般化されたマルチイメージの視覚的グラウンド化が可能なMLLMであるGeM-VGを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:58:35 GMT)
SpeechMedAssist: Efficiently and Effectively Adapting Speech Language Models for Medical Consultation [30.5] 本稿では,患者と音声によるマルチターンインタラクションを実現するSpeechMedAssistを提案する。
本研究では,SpeechLMのアーキテクチャ特性を利用して,従来のワンステージトレーニングを2段階のパラダイムに分離する。
我々のモデルは、ほとんどの評価設定において、有効性とロバスト性の両方において全てのベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:14:58 GMT)
TokenSeg: Efficient 3D Medical Image Segmentation via Hierarchical Visual Token Compression [30.3] TokenSegは、効率的な3D医療ボリュームセグメンテーションのための境界対応スパーストークン表現フレームワークである。
TokenSegは、不均一な解剖学的構造に対して、常に最適な性能を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:32:48 GMT)
MisSpans: Fine-Grained False Span Identification in Cross-Domain Fake News [30.0] MisSpansは、スパンレベルの誤情報検出と分析のためのベンチマークである。
実話と偽ニュースが混在している。
微粒なローカライゼーション、真/偽以上のニュアンス化された特徴化、そして実行可能な説明を可能にする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:46:30 GMT)
AM$^3$Safety: Towards Data Efficient Alignment of Multi-modal Multi-turn Safety for MLLMs [30.0] 提案するInterSafe-Vは,11,270件の対話と500件の特別設計のVQAサンプルを含む,オープンソースのマルチモーダル対話データセットである。
我々は,グループ相対的政策最適化とコールドスタートの拒絶フェーズを組み合わせたフレームワークAM$3$Safetyを提案する。
Qwen2.5-VL-7BとLLaVA-NeXT-7Bの実験では、攻撃成功率が10%以上低下した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:57:05 GMT)
SurgeQ: A Hybrid Framework for Ultra-Fast Quantum Processor Design and Crosstalk-Aware Circuit Execution [29.9] SurgeQは、超伝導量子回路のためのハードウェアとソフトウェアの共同設計戦略である。
SurgeQは、クロストークを緩和しながら、結合強化されたより高速な2ビットゲートを採用している。
本稿では,SurgeQは一般に最新のベースラインよりも高い忠実度を達成でき,指数的忠実度崩壊と闘う上でも有効であることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:42:27 GMT)
Precision over Diversity: High-Precision Reward Generalizes to Robust Instruction Following [28.9] ハードリミテッドな制約でトレーニングされたモデルは、混合データセットでトレーニングされたモデルよりも一貫して優れています。
実験により、報酬の精度は、制約の多様性よりもむしろ、効果的なアライメントの原動力であることが判明した。
本稿では,報酬精度を優先する簡易かつ効果的なデータ中心精錬戦略を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:00:51 GMT)
Do LLMs Benefit from User and Item Embeddings in Recommendation Tasks? [28.5] 大型言語モデル (LLM) は有望なレコメンデーションシステムとして登場した。
協調フィルタリングから学習したユーザとアイテムの埋め込みを LLM トークン空間に投影する,シンプルで効果的なソリューションを提案する。
予備的な結果から、この設計は構造化されたユーザとイテムのインタラクションデータを効果的に活用し、テキストのみのLLMベースラインよりもレコメンデーション性能を向上させることが示されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:58:28 GMT)
Distributed Online Convex Optimization with Efficient Communication: Improved Algorithm and Lower bounds [27.9] 圧縮通信を用いた分散オンライン凸最適化について検討する。
本稿では,凸関数と強凸関数に対して,$tildeO(-1/2-1nsqrtT)$と$tildeO(-1-2nlnT)$の改善された後悔境界を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:05:36 GMT)
MLB: A Scenario-Driven Benchmark for Evaluating Large Language Models in Clinical Applications [27.7] 基礎知識とシナリオベース推論の両方に基づいて,LLM(Large Language Models)を評価するベンチマークである医療用LLMベンチマークMLBを紹介する。
MLBは、医療知識(MedKQA)、安全と倫理(MedSE)、医療記録理解(MedRU)、スマートサービス(SmartServ)、スマートヘルスケア(SmartCare)の5つのコア次元で構成されている。
その設計は、300人の医師が参加する厳格なキュレーションパイプラインを特徴としている。また、専門家アノテーションに基づいて訓練されたSFT(Supervised Fine-Tuning)を用いた特別審査モデルを中心に、スケーラブルな評価手法を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:41:42 GMT)
Crafting Adversarial Inputs for Large Vision-Language Models Using Black-Box Optimization [27.3] 同時摂動近似(ZO-SPSA)を用いたゼロ階最適化によるLVLM(Large Vision-Language Models)に対するブラックボックスジェイルブレイク攻撃を提案する。
InstructBLIP, LLaVA, MiniGPT-4の3つのLVLM上でZO-SPSAを評価し, InstructBLIPのジェイルブレイク成功率は83.0%であった。
これらの知見は、ブラックボックスジェイルブレイクの現実的な実現可能性を強調し、現在のLVLMの安全性メカニズムにおける重大な弱点を明らかにしている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:46:04 GMT)
MoE Adapter for Large Audio Language Models: Sparsity, Disentanglement, and Gradient-Conflict-Free [27.3] 音響情報の分離を目的とした疎混合(MoE)アーキテクチャであるtextittextbfMoE-Adapter を導入する。
実験により、MoE-Adapterは、音声意味的タスクとパラ言語的タスクの両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:17:18 GMT)
Semi-Supervised Diseased Detection from Speech Dialogues with Multi-Level Data Modeling [27.2] 本稿では,音声から医療状況を検出するための新しい枠組みを提案する。
エンドツーエンドアプローチは,多粒度特徴を動的に集約し,高品質な擬似ラベルを生成する。
この研究は、医学的音声分析における弱い極端の監督から学ぶための原則的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:10:16 GMT)
DocDancer: Towards Agentic Document-Grounded Information Seeking [27.1] Document Question Answering (DocQA) は、与えられた文書に根ざした質問に答えることに焦点を当てている。
既存のDocQAエージェントは効果的なツール利用がなく、主にクローズドソースモデルに依存している。
我々は、エンドツーエンドの訓練済みオープンソースDocエージェントDocDancerを紹介する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:54:32 GMT)
Thinking with Map: Reinforced Parallel Map-Augmented Agent for Geolocalization [27.0] モデルtextitThinking with Map with agent-in-the-map loop ability and formulate it as an agent-in-the-map loop。
エージェント強化学習(RL)と並列テスト時間スケーリング(TTS)を含む2段階最適化手法を開発した。
さらに,本手法を最新・最新画像で評価するために,実世界の画像で構成された総合的なジオローカライズ訓練および評価ベンチマークMAPBenchを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 23:47:30 GMT)
PsychEval: A Multi-Session and Multi-Therapy Benchmark for High-Realism AI Psychological Counselor [26.8] textttPsychEvalは、3つの重要な課題に対処するために設計された、マルチセッション、マルチセラピー、そして非常に現実的なベンチマークである。
メモリ連続性、適応推論、縦計画などの重要な機能を必要とする。
データセットには677以上のメタスキルと4577のアトミックスキルを含む、広範なプロフェッショナルスキルが注釈付けされている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:52:50 GMT)
DP-MGTD: Privacy-Preserving Machine-Generated Text Detection via Adaptive Differentially Private Entity Sanitization [26.3] 本稿では,Adaptive Differentially Private Entity Sanitizationアルゴリズムを組み込んだフレームワークを提案する。
提案手法は,検出精度がほぼ良好であり,非プライベートベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:33:15 GMT)
DR-LoRA: Dynamic Rank LoRA for Mixture-of-Experts Adaptation [26.2] Mixture-of-Experts (MoE) はLarge Language Models (LLM) のスケーリングのパラダイムとして注目されている。
DR-LoRAと呼ばれる動的ランクのLoRAフレームワークを提案し、タスク固有の要求に基づいて微調整中に専門家のLoRAランクを動的に増加させる。
複数のベンチマークの実験では、DR-LoRAは同じパラメータ予算の下で標準のLoRAと静的アロケーション戦略を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:58:51 GMT)
From Rays to Projections: Better Inputs for Feed-Forward View Synthesis [26.1] フィードフォワードビュー合成モデルは、最小3次元誘導バイアスを持つ単一のパスで新しいビューを予測する。
既存の作業はカメラをシャーカー線マップとしてエンコードし、予測を任意の世界座標ゲージに結び付け、小さなカメラ変換に敏感にする。
本稿では,プロジェクティブ・コンディショニングを提案する。プロジェクティブ・コンディショニングは,プロジェクティブ・コンディショニングのパラメータを,安定な2次元入力を提供するターゲットビュー・プロジェクティブ・キューに置き換える。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:03:44 GMT)
AgentOCR: Reimagining Agent History via Optical Self-Compression [25.9] 本稿では,視覚トークンの優れた情報密度を利用するフレームワークであるAgentOCRを紹介する。
履歴をハッシュ可能なセグメントに分解し、ビジュアルキャッシュを維持することで、AgentOCRは冗長な再レンダリングを取り除く。
以上の結果から,AgentOCRは95%以上のテキストベースのエージェント性能を保ちながら,トークン消費量を大幅に削減していることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:10:20 GMT)
EvolSQL: Structure-Aware Evolution for Scalable Text-to-SQL Data Synthesis [25.7] Evolは、クエリをよりリッチでセマンティックに多様な形式に進化させる構造対応のデータ合成フレームワークである。
7Bモデルは、データの1/18のみを使用して、はるかに大きなSynデータセットでトレーニングされたモデルよりも優れています。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:19:50 GMT)
MoE3D: A Mixture-of-Experts Module for 3D Reconstruction [25.6] MoE3Dは深度マップを予測し、動的重み付けによってそれらを融合する。
VGGTのようなトレーニング済みの3D再構成バックボーンと統合すると、再構成品質が大幅に向上する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:33:52 GMT)
Constitutional Classifiers++: Efficient Production-Grade Defenses against Universal Jailbreaks [25.5] 我々は,生産レベルのジェイルブレイクの堅牢性を実現するため,計算コストを劇的に削減し,拒否率を下げる改良された憲法を導入した。
我々の研究は、大規模言語モデルの保護のための憲法上の保護を確立する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:16:12 GMT)
QNeRF: Neural Radiance Fields on a Simulated Gate-Based Quantum Computer [25.5] ニューラルラジアンス場(NeRF)の新規合成技術
QNeRFは、2次元画像からの新規ビュー合成のために設計された最初のハイブリッド量子古典モデルである。
実験の結果,QNeRFはパラメータの半数以下を用いながら,古典的NeRFベースラインに適合あるいは優れることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:59:55 GMT)
FaceRefiner: High-Fidelity Facial Texture Refinement with Differentiable Rendering-based Style Transfer [25.2] FaceRefinerは、3Dサンプルテクスチャをスタイルとして扱い、テクスチャ生成法の出力をコンテンツとして扱う。
テクスチャの質と顔のアイデンティティの保存能力は,最先端技術と比較して向上する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:34:29 GMT)
Visual Merit or Linguistic Crutch? A Close Look at DeepSeek-OCR [25.0] DeepSeek-OCRは、入力された視覚トークンの10倍以上のテキストトークンをデコードすると主張している。
我々は,本モデル固有のOCR能力を言語先行から分離するために,文レベルおよび単語レベルの意味的腐敗を用いる。
従来のパイプラインOCR法は, 従来のパイプラインOCR法に比べて, 意味摂動に対するロバスト性が高いことがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:37:59 GMT)
SCALER:Synthetic Scalable Adaptive Learning Environment for Reasoning [24.8] 強化学習(Reinforcement Learning, RL)は、大規模言語モデルの推論能力を高めるための原則的な方法である。
実際には、RLの進捗は、タスクの難しさがモデル能力と整合しなくなると遅くなります。
本稿では,適応環境設計による効果的な学習信号を維持する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:42:04 GMT)
LLM Agents in Law: Taxonomy, Applications, and Challenges [24.7] 大規模言語モデル(LLM)は、法的領域において劇的な改善をもたらした。
スタンドアロンモデルの展開は、幻覚、時代遅れの情報、検証可能性に関する重大な制限に直面している。
近年,LSMエージェントはこれらの課題に対する解決策として注目されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:04:35 GMT)
InfiniteWeb: Scalable Web Environment Synthesis for GUI Agent Training [24.6] InfiniteWebはGUIエージェントのトレーニングのために,機能的Web環境を大規模に自動生成するシステムである。
統一仕様、タスク中心のテスト駆動開発、Webサイトシードとリファレンスデザインイメージの組み合わせによる課題に対処する。
実験によると、InfiniteWebはリアルなWebサイト構築において、商用のコーディングエージェントを上回っている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:37:47 GMT)
Can Large Language Models Resolve Semantic Discrepancy in Self-Destructive Subcultures? Evidence from Jirai Kei [24.3] 自己破壊行動は複雑な心理的状態と関連付けられており、診断が困難である。
これらの行動は、その独特の表現のために、サブカルチャーグループ内での識別がさらに困難になる可能性がある。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:02:41 GMT)
Measurement-Consistent Langevin Corrector: A Remedy for Latent Diffusion Inverse Solvers [24.2] 遅延拡散逆解法は不安定性に悩まされ、望ましくないアーティファクトと劣化した品質を示す。
我々は,理論上は接地されたプラグ・アンド・プレイ補正モジュールであるMCLC(Messistent Langevin Corrector)を導入する。
従来の手法と比較して、MCLCはこの仮定なしで動作し、より安定で信頼性の高い振る舞いをもたらす。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:15:35 GMT)
DVD: A Robust Method for Detecting Variant Contamination in Large Language Model Evaluation [24.1] textbfDVDは、温度サンプリングによって誘導される局所的な出力分布をモデル化する単一サンプル検出器である。
我々は,Omni-MATH と SuperGPQA の2つの領域にわたる変異汚染の最初のベンチマークを構築した。
textbfDVDは、パープレキシティベース、Min-$k$%++、編集距離(CDD)、埋め込み類似性ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:48:40 GMT)
A Navigational Approach for Comprehensive RAG via Traversal over Proposition Graphs [23.8] ToPGは知識ベースを命題、実体、通過の異種グラフとしてモデル化する。
TOPGは精度と品質ベースのメトリクスの両方で強力なパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:50:40 GMT)
Forge-and-Quench: Enhancing Image Generation for Higher Fidelity in Unified Multimodal Models [23.5] 本稿では, 画像の忠実度と詳細性を高めるために理解を活用するという, 新たな視点を紹介する。
我々は、この原則を実践する新しい統一フレームワークForge-and-Quenchを提案する。
実験により、Forge-and-Quenchは複数のモデルで画像の忠実度とディテールを大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:18:44 GMT)
IGenBench: Benchmarking the Reliability of Text-to-Infographic Generation [23.5] 本稿では,テキスト・ツー・インフォグラフィック・ジェネレーションの信頼性を評価するための最初のベンチマークであるIGENBENCHを提案する。
質問レベルの精度 (Q-ACC) とインフォグラフィックレベルの精度 (I-ACC) が得られる。
私たちの体系的な分析は、将来のモデル開発における重要な洞察を明らかにします。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:06:53 GMT)
Text as a Universal Interface for Transferable Personalization [23.4] 我々は、自然言語を嗜好表現のための普遍的、モデル的、タスクに依存しないインターフェースとして提唱する。
高品質な合成データの教師付き微調整と強化学習を組み合わせた2段階学習フレームワークを提案する。
テキストの選好要約を生成する普遍的選好推論モデルであるAlignXplore+を開発した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:09:17 GMT)
RelayLLM: Efficient Reasoning via Collaborative Decoding [23.4] RelayLLMはトークンレベルのコラボレーティブデコーディングによる効率的な推論のための新しいフレームワークである。
RelayLLM の平均精度は 49.52% であり,両モデル間の性能ギャップを効果的に埋めることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:56:16 GMT)
Generate, Transfer, Adapt: Learning Functional Dexterous Grasping from a Single Human Demonstration [23.3] 合成データから新規物体のデキスタスな機能的把握を頑健に学習するフレームワークであるCorDexを提案する。
私たちのアプローチの核となるのは、シミュレーションにおいて多様な高品質なトレーニングデータを生成する対応ベースのデータエンジンです。
生成したデータに基づいて視覚情報と幾何学情報を統合するマルチモーダル予測ネットワークを導入する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:59:30 GMT)
All Changes May Have Invariant Principles: Improving Ever-Shifting Harmful Meme Detection via Design Concept Reproduction [23.2] 本稿では,デザイン概念の再現に基づく,常に変化する有害なミーム検出手法であるRepMDを提案する。
RepMDは81.1%で最高精度を達成し、タイプシフトや時間進化のミームに一般化するとわずかに精度が低下する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:49:49 GMT)
Nightmare Dreamer: Dreaming About Unsafe States And Planning Ahead [23.2] 安全問題に対処するモデルベースのSafe RLアルゴリズムであるNightmare Dreamerを紹介する。
Nightmare Dreamerは、報酬を最大化しながら、ほぼゼロの安全違反を達成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:55:07 GMT)
Agri-R1: Empowering Generalizable Agricultural Reasoning in Vision-Language Models with Reinforcement Learning [22.3] 我々は,農業用大規模モデルであるtextbfAgri-R1を提案する。
我々のフレームワークは、視覚言語合成とLLMに基づくフィルタリングによる高品質な推論データを生成する。
疾患認識の精度は+23.2%、農業知識のQAは+33.3%、クロスドメインの一般化は+26.10ポイント向上した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:34:37 GMT)
AdaptEval: A Benchmark for Evaluating Large Language Models on Code Snippet Adaptation [22.3] AdaptEvalは、コードスニペット適応の大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
各タスクには、タスクレベルと適応レベルの両方の要件がアノテートされ、さまざまな適応シナリオにおけるLCMの評価をサポートする。
コードスニペット適応における6つの命令調整LDM, 特に3つの理由付けLDMを評価するための実験的検討を行った。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:13:20 GMT)
ReLA: Representation Learning and Aggregation for Job Scheduling with Reinforcement Learning [22.1] 構造化表現学習とアグリゲーションに基づく強化学習スケジューラであるReLAを提案する。
小規模、中規模、大規模なジョブインスタンスの実験では、ReLAはテスト済みのほとんどの設定で最高のペースパンを達成する。
その結果、ReLAの学習表現と集約がRLスケジューリングの強力な決定支援を提供することを確認した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:28:59 GMT)
Succeeding at Scale: Automated Multi-Retriever Fusion and Query-Side Adaptation for Multi-Tenant Search [22.1] DevRev Searchは、完全に自動パイプラインで構築されたテクニカルカスタマーサポートのためのパス検索ベンチマークである。
低ランク適応によるクエリエンコーダのみを微調整することで、実用的な textbfIndex-Preserving Adaptation 戦略を提案する。
DevRev SearchとSciFactの実験では、クエリエンコーダ内の特定のトランスフォーマー層をターゲットにすることで、最適な品質効率のトレードオフが得られることを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:44:40 GMT)
AlgBench: To What Extent Do Large Reasoning Models Understand Algorithms? [21.8] 本稿では,アルゴリズム中心のパラダイムの下でLarge Reasoning Models(LRMs)を評価する専門家によるベンチマークであるAlgBenchを提案する。
AlgBenchは、ACMアルゴリズムの専門家によって構築された27のアルゴリズムにまたがる3000以上の元の問題で構成されている。
先進的なLRM(Gemini-3-Pro、DeepSeek-v3.2- Speciale、GPT-o3)に関する実証的な評価は、かなりの性能を示している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:54:44 GMT)
SemPA: Improving Sentence Embeddings of Large Language Models through Semantic Preference Alignment [21.6] SemPAは、意味的嗜好のアライメントを通じてLLMの生成能力を保ちながら、文表現を増強する。
我々は,DPOとコントラスト学習の正式な関係を,Planet-Luceモデルフレームワークの下で確立する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:19:24 GMT)
Mechanism Design for Federated Learning with Non-Monotonic Network Effects [21.4] 既存のメカニズムは、クライアントの参加と多様なモデルパフォーマンス要求のネットワーク効果を見落としている。
本稿では,モデルトレーディング・アンド・シェアリング(MoTS)フレームワークを提案する。
また,アプリケーション・アウェア・アンド・ネットワーク・エフェクト(SWAN)による社会福祉機構を設計し,インセンティブ化のためのモデル顧客支払いを生かした。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:45:22 GMT)
On the Holistic Approach for Detecting Human Image Forgery [20.8] 本稿では,ヒト画像偽造検出のための総合的なフレームワークであるHuForDetを紹介する。
コンテキスト化された偽造検出ブランチは、MLLM(Multi-Modal Large Language Model)を利用して、フルボディのセマンティック一貫性を分析する。
我々のHuForDetは、最先端の偽造検出性能と、多様な画像偽造者に対して優れた堅牢性を実現している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:33:22 GMT)
SRU-Pix2Pix: A Fusion-Driven Generator Network for Medical Image Translation with Few-Shot Learning [20.7] 本稿では,Squeeze-and-Excitation Residual Networks(SEResNet)とU-Net++を統合したPix2Pixフレームワークを提案する。
提案手法は,500枚未満の撮影条件下で,一貫した構造的忠実度と画質の向上を実現する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:10:03 GMT)
Beyond Static Summarization: Proactive Memory Extraction for LLM Agents [20.1] 我々は、既存の要約に基づく手法は、繰り返し処理理論に基づく2つの大きな制限があると主張している。
本稿では,エージェントが対話履歴を積極的に探究するために自己問合せを利用する繰り返しフィードバックループを提案する。
我々のProMemは抽出したメモリの完全性とQA精度を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 00:37:29 GMT)
SimRPD: Optimizing Recruitment Proactive Dialogue Agents through Simulator-Based Data Evaluation and Selection [19.8] SimRPDは、プロアクティブな対話エージェントを訓練するための3段階のフレームワークである。
まず,大規模な会話データを合成する高忠実度ユーザシミュレータを開発する。
次に,Chain-of-Intentionに基づく多次元評価フレームワークを提案する。
最後に、選択したデータセットに基づいて、採用プロアクティブ対話エージェントを訓練する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:14:02 GMT)
Leveraging Prediction Entropy for Automatic Prompt Weighting in Zero-Shot Audio-Language Classification [19.7] 本稿では,予測信頼度を最大化するために,コントリビューションの頑健な組み合わせを見つけることを目的としたエントロピー誘導型プロンプト重み付け手法を提案する。
我々の手法は個々のサンプルやオーディオサンプルに応用でき、追加のラベルを必要とせず、無視できる計算オーバーヘッドを発生させる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:11:04 GMT)
AT$^2$PO: Agentic Turn-based Policy Optimization via Tree Search [19.4] LLMエージェントは、内部推論と外部ツールの相互作用をインターリーブすることによって、マルチターンタスクに対処する強力なシステムとして登場した。
マルチターンエージェントRLのための統合フレームワークであるAT$2$POを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:35:49 GMT)
Timeliness-Oriented Scheduling and Resource Allocation in Multi-Region Collaborative Perception [19.4] 協調認識(CP)は、自動運転やスマートシティといったアプリケーションにおいて重要な技術である。
環境の動的な性質のため、送信された情報のタイムラインは知覚性能にとって重要である。
本研究では,マルチリージョンCPシナリオにおける動的スケジューリング問題について検討し,TAMPスケジューリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:16:00 GMT)
Breaking Robustness Barriers in Cognitive Diagnosis: A One-Shot Neural Architecture Search Perspective [19.3] 認知診断のためのワンショットニューラルネットワーク探索法を提案する。
OSCDはトレーニングと検索という2つの異なる段階を通じて運用されている。
探索段階において、異種雑音シナリオ下での最適アーキテクチャ探索を定式化する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:17:40 GMT)
Beyond Physical Labels: Redefining Domains for Robust WiFi-based Gesture Recognition [18.9] データ自体から直接ドメインを再定義するために、WiFi潜伏ドメインマイニングを導入した新しいWiFiベースのジェスチャー認識システムであるGesFiを提案する。
最先端のベースラインと比較して、GesFiは、既存の敵メソッドよりも最大78%、50%のパフォーマンス改善を実現している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:04:27 GMT)
The Persona Paradox: Medical Personas as Behavioral Priors in Clinical Language Models [18.9] ペルソナは、安全性や専門性の保証よりも、コンテキスト依存のトレードオフを導入する行動の先駆者として機能する。
私たちの研究は、ペルソナが安全性や専門知識の保証よりも、文脈に依存したトレードオフを導入する行動の優先事項として機能することを示している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:01:11 GMT)
Towards Real-world Lens Active Alignment with Unlabeled Data via Domain Adaptation [18.7] 光シミュレーション上に構築されたデジタルツインパイプラインは、大規模ラベル付きデータを生成する上で大きな利点がある。
ドメイン適応は、実世界の堅牢なパフォーマンスを持つシミュレーション訓練されたモデルを効果的に提供します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:11:05 GMT)
MM-Sonate: Multimodal Controllable Audio-Video Generation with Zero-Shot Voice Cloning [18.6] MM-Sonateは、制御可能な音声とビデオのジョイント生成とゼロショット音声のクローン機能を統合するマルチモーダルフローマッチングフレームワークである。
ゼロショット音声のクローニングを可能にするため,言語コンテンツから話者識別を効果的に分離する分類器注入機構を導入する。
MM-Sonateがジョイントジェネレーションベンチマークで新しい最先端性能を確立していることを示す実証評価を行った。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:43:41 GMT)
EntroCoT: Enhancing Chain-of-Thought via Adaptive Entropy-Guided Segmentation [18.6] CoT(Chain-of-Thought)の促進により、大規模言語モデルの数学的推論能力が大幅に向上した。
既存の微調整データセットは、しばしば"答えは正しいが間違った理由"プローブに悩まされる。
本稿では,高品質なCoT監視トレースを自動的に識別し,精錬するための統合フレームワークであるEntroCoTを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:46:55 GMT)
Hybrid Federated Learning for Noise-Robust Training [18.6] フェデレーション・ラーニング(Federated Learning, FL)とフェデレーション・蒸留(FD)は、UEモデルを高度なプライバシーで訓練する分散学習パラダイムである。
本稿では,各ユーザ機器(UE)が勾配またはログを送信し,基地局(BS)がFLおよびFD更新の単位単位の重みを選択するハイブリッド・フェデレーション・ラーニング(HFL)フレームワークを提案する。
数値計算の結果,両DoFを利用した場合,HFLは低SNRでの試験精度に優れていた。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:34:51 GMT)
Multimode Fock-State Measurements using Dispersive Shifts in a Trapped Ion [18.5] トラップされたイオンは、長寿命のスピン量子ビットとともに、自然に複数の運動モードを担っている。
このようなボソニックレジスタを効果的に特徴づけるには、限られたスピン資源で多くの運動モードにアクセスする能力が必要である。
広帯域多重モードのJaynes-Cummings相互作用における分散シフトを用いた単スピンマルチモード測定プリミティブを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:42:33 GMT)
UniBiDex: A Unified Teleoperation Framework for Robotic Bimanual Dexterous Manipulation [18.4] We present UniBiDex a unified teleoperation framework for robotic bimanual dexterous operation。
UniBiDexは、異種入力デバイスを共有制御スタックに統合することにより、リアルタイムのコンタクトリッチなデュアルアーム遠隔操作を可能にする。
本研究は,5つの逐次操作サブタスクを含む長距離キッチンタイピングタスクにおいて,UniBiDexの有効性を検証し,よりスムーズな作業成功率を示すとともに,強いベースラインと比較して頑健性を向上させる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:00:24 GMT)
Compositional Steering of Large Language Models with Steering Tokens [18.1] マルチビヘイビアステアリングのためのテキストコンポジションステアリングトークンを提案する。
まず、自然言語命令として表現された個々の振る舞いを、自己蒸留によって専用のトークンに埋め込む。
ステアリングトークンは、競合するアプローチと比較して、より優れたマルチ行動制御をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:08:44 GMT)
Higher-Order Adversarial Patches for Real-Time Object Detectors [18.0] 高次の敵攻撃は、猫とマウスのゲームの結果であると考えることができる。
このイディオムは、敵の攻撃パターンの永続的な円形訓練と敵の訓練が最善であることを示す。
以上の結果から,高次対向パッチは直接訓練された対象検出器に影響を及ぼすだけでなく,より強力な一般化能力をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:48:50 GMT)
Green's-Function Spherical Neural Operators for Biological Heterogeneity [18.0] 設計可能なグリーン関数フレームワーク(DGF)を導入し,新しい球面演算子ソリューション戦略を提案する。
DGFに基づいて、3つの演算子解を融合したグリーン関数球型ニューラル演算子(GSNO)を提案する。
GSNOは、ニュアンス可変性と異方性を持つ実世界の異種系に適応することができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:10:45 GMT)
HarmonRank: Ranking-aligned Multi-objective Ensemble for Live-streaming E-commerce Recommendation [18.0] ライブストリーミングのeコマースは、購入とユーザーとストリームの双方のインタラクションのバランスをとるためのランキングメカニズムを必要とする。
本稿では,複数目的のアンサンブルフレームワークであるHarmonRankを提案する。
提案手法は,4億DAUのライブストリーミングEコマースレコメンデーションプラットフォームに完全デプロイされ,2%以上の購入率に寄与している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:20:47 GMT)
LinguaGame: A Linguistically Grounded Game-Theoretic Paradigm for Multi-Agent Dialogue Generation [17.6] 本稿では,多エージェント対話生成のための言語論的ゲーム理論パラダイムを提案する。
我々のフレームワークは、最小限のタスク固有結合を伴う言語情報推論に依存している。
我々は,模擬法廷手続と議論における枠組みを評価し,コミュニケーション効率の大幅な向上を示す人間専門家の評価を行った。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:30:43 GMT)
Spatial-Temporal Feedback Diffusion Guidance for Controlled Traffic Imputation [17.5] 空間的時間的交通データに欠落した値を付与することは、インテリジェント交通システムにとって不可欠である。
本研究では,インプット中の誘導尺度を適応的に制御する空間時間フィードバック拡散誘導法であるFENCEを提案する。
FENCEは、アテンションスコアに基づいてノードをグループ化することで、クラスタレベルでのガイダンススケールを計算する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:03:32 GMT)
HATIR: Heat-Aware Diffusion for Turbulent Infrared Video Super-Resolution [17.4] 既存のビデオ超解像法 (VSR) は、赤外線と可視像の固有のモード差を無視したり、乱流による歪みの回復に失敗したりする。
乱流赤外ビデオスーパーリゾリューションのための熱認識拡散法を導入し, 拡散サンプリング経路に熱認識変形先行を注入する。
FLIR-IVSRは、FLIR T1050scカメラから一対のLR-HRシーケンスを合成した、乱流赤外VSRの最初のデータセットである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:49:02 GMT)
Observations and Remedies for Large Language Model Bias in Self-Consuming Performative Loop [17.2] textbfSelf-textbfConsuming textbfPerformative textbfLoop。
本研究では, 動的反復学習過程における生成バイアスにおける合成データの役割について検討した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:08:15 GMT)
SPINAL -- Scaling-law and Preference Integration in Neural Alignment Layers [17.0] 本研究では,深度にまたがってアライメントが表現にどう影響するかを測定する診断手法であるSPINALを紹介する。
モデルファミリ全体で、DPOは最終デコーダブロックに集中する層ワイドキャリブレーション効果を生成する。
調整されたチェックポイントは、収縮の後期層の増加と輸送の円滑な減少を示し、厳密で安定した政策質量と一致している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:47:12 GMT)
PyramidalWan: On Making Pretrained Video Model Pyramidal for Efficient Inference [16.8] 本稿では,事前学習した拡散モデルを低コストな微調整によりピラミッド型に変換するパイプラインを提案する。
本研究では, ピラミッドモデルにおける段階蒸留の各種戦略について検討, 比較を行い, 推論効率をさらに高めることを目的とした。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:16:06 GMT)
Rethinking GNNs and Missing Features: Challenges, Evaluation and a Robust Solution [16.6] 欠落したノード機能を扱うことは、医療やセンサーネットワークといった現実世界のドメインにグラフニューラルネットワーク(GNN)をデプロイする上で重要な課題である。
既存の研究では、(a)高次元だがスパースなノード特徴を持つベンチマークデータセットと(b)ミス・コンプリート・アット・ランダム(MCAR)メカニズムの下で生成された不完全なデータなど、比較的良質なシナリオに対処している。
この制限を克服するために、我々は1つの合成データセットと3つの実世界のデータセットと、密で意味論的に意味のある特徴を持つ3つの実世界のデータセットを紹介します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:45:59 GMT)
HUR-MACL: High-Uncertainty Region-Guided Multi-Architecture Collaborative Learning for Head and Neck Multi-Organ Segmentation [16.4] 頭頸部における多臓器分割のための多臓器協調学習モデルを提案する。
提案手法は,2つの公開データセットと1つのプライベートデータセットに対してSOTA結果を得る。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:25:05 GMT)
Scalable neural pushbroom architectures for real-time denoising of hyperspectral images onboard satellites [16.3] 次世代の地球観測衛星は、ペイロードに直接インテリジェントなモデルを展開しようとしている。
この設定は、3つの競合する目標、すなわち、複雑さの低い高品質な推論、動的パワースケーラビリティ、耐障害性に対処する必要があることを示す。
本稿では、上記の3つの目的に対処するニューラルネットワーク設計について、いくつかの新しいコントリビューションを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:28:39 GMT)
PRISM: A Unified Framework for Post-Training LLMs Without Verifiable Rewards [16.2] 大規模言語モデルの訓練後の現在の技術は、費用のかかる人事監督や外部検証に頼っている。
PRISMは、プロセス・リワード・モデル(Process Reward Model, PRM)を用いて、モデルの内部信頼度とともに学習をガイドする統合トレーニングフレームワークである。
PRMと自己確実性を効果的に組み合わせることで,安定したトレーニングとテスト時間性能の両立が期待できることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:09:29 GMT)
Advanced Multimodal Learning for Seizure Detection and Prediction: Concept, Challenges, and Future Directions [16.1] 本調査は,てんかん発作検出・予測(AMLSDP)のための先進的マルチモーダル学習の概念を強調した。
調査では, てんかん性発作検出(ESD)と予測(ESP)技術の進化を, 時代によって明らかにした。
この研究は、てんかんモニタリングのためのウェアラブルおよびイメージングベースのソリューションに向けて、神経テクノロジーを進歩させるだろうと考えています。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:43:06 GMT)
Segmentation-Driven Monocular Shape from Polarization based on Physical Model [15.8] 本稿では,新しいセグメンテーション駆動単分子SfPフレームワークを提案する。
グローバルな形状回復を適応的に分断された凸部分領域上の局所的な再構成の集合に再構成する。
合成と実世界の両方のデータセットの実験は、提案されたアプローチを検証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:57:47 GMT)
When AI Settles Down: Late-Stage Stability as a Signature of AI-Generated Text Detection [15.7] 我々は120k以上のテキストサンプルを分析し、レイトステージのボラティリティの低下を明らかにする: AI生成されたテキストは、生成が進むにつれて、ログの確率変動を急速に安定化させる。
先進的分散と局所ボラティリティの2つの単純な特徴を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:11:00 GMT)
Fast Mining and Dynamic Time-to-Event Prediction over Multi-sensor Data Streams [15.6] 本研究は,マルチセンサデータストリームを解析することにより,今後のイベントのタイミングを継続的に予測することを目的とする。
現実世界のデータストリームのキーとなる特徴は、そのダイナミックな性質であり、基礎となるパターンは時間とともに進化する。
我々は、これらの変化に適応し、将来のイベント時間の正確なリアルタイム予測を提供するよう設計された動的予測フレームワークであるTimeCastを紹介する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:05:57 GMT)
Using Large Language Models to Detect Socially Shared Regulation of Collaborative Learning [15.6] 予測モデルを拡張し、埋め込み型アプローチを用いて、社会的に共有された学習行動の制御を自動的に検出する。
我々は,大規模言語モデル(LLM)を要約ツールとして活用し,システムログに整合した学生対話のタスク認識表現を生成する。
その結果, テキストのみの埋め込みは, 実行やグループダイナミクスに関連するSSRLの挙動の検出において, より強力な性能が得られることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 00:30:46 GMT)
Specific Emitter Identification via Active Learning [15.5] 本稿では,アクティブラーニング(AL)によって強化されたSEIアプローチを提案する。
第1段階では、ラベルのないデータからロバストな表現を抽出する動的辞書更新機構を自己教師付きコントラスト学習に適用する。
第2段階では、小さなラベル付きデータセットの教師付きトレーニングが行われ、コントラストとクロスエントロピーの損失を共同最適化して特徴分離性を向上させる。
第3段階では、ALモジュールは、不確実性と代表性基準に基づいて、未ラベルデータから最も価値のあるサンプルをアノテーションとして選択する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:16:04 GMT)
NC2C: Automated Convexification of Generic Non-Convex Optimization Problems [15.4] NC2Cは8%の実行を実現し、変換可能な凸問題において76%の成功を確実にする。
これにより、NC2C法は様々な問題データセットにおいてかなりの差で性能が向上する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:12:45 GMT)
AIVD: Adaptive Edge-Cloud Collaboration for Accurate and Efficient Industrial Visual Detection [15.4] 本稿では,高精度な局所化と高品質なセマンティック生成を実現するためのAIVDフレームワークを提案する。
エッジトリミングボックスノイズとシナリオ変動に対するクラウドMLLMのロバスト性を高めるため,我々は効率的な微調整戦略を設計する。
異種エッジデバイスと動的ネットワーク条件間の高いスループットと低レイテンシを維持するため,異種リソースを考慮した動的スケジューリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:56:07 GMT)
DeepHalo: A Neural Choice Model with Controllable Context Effects [15.1] 我々は,文脈効果の原理的解釈を実現しつつ,特徴を組み込んだニューラルモデリングフレームワークであるDeepHaloを提案する。
本モデルでは, 相互作用効果の順序による体系的同定が可能であり, 特徴のない設定に特化する場合に, 文脈依存選択関数の普遍的近似として機能する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:46:14 GMT)
WebCryptoAgent: Agentic Crypto Trading with Web Informatics [14.9] WebCryptoAgentは、Webインフォームド決定をモダリティ固有のエージェントに分解するエージェントトレーディングフレームワークである。
リアルタイムの2段階リスクモデルから戦略的時間的推論を分離する分離制御アーキテクチャを導入する。
現実世界の暗号通貨市場での実験では、WebCryptoAgentは取引の安定性を改善し、急激な活動を減らし、既存のベースラインと比較してテールリスク処理を強化している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:55:10 GMT)
T-Retriever: Tree-based Hierarchical Retrieval Augmented Generation for Textual Graphs [14.8] グラフベースのRAGアプローチは、局所グラフ構造に損傷を与える厳密な層特異的圧縮クォータを強制する。
グラフ検索をツリーベースとして再構成する新しいフレームワークであるT-Retrieverを紹介する。
T-Retrieverは最先端のRAG法を著しく上回り、複雑なクエリに対してより一貫性があり、文脈的に関連する応答を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:49:12 GMT)
Sci-Reasoning: A Dataset Decoding AI Innovation Patterns [14.7] Sci-Reasoningは、高品質なAI研究の背後にある知的合成をキャプチャする最初のデータセットである。
分析では15の異なる思考パターンを同定し,3つの戦略が52.7%を占めた。
このデータセットは、科学的進歩の定量的研究を可能にし、次世代AI研究エージェントを訓練するための構造化推論軌道を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:12:47 GMT)
GenProve: Learning to Generate Text with Fine-Grained Provenance [14.7] 本稿では, モデルが文レベル三重項を同時に生成しながら, フロートな解を生成するタスクである生成時ファイン・グラニュアル・プロヴァンス(Generation-time Fine-fine Provenance)を提案する。
GenProveは,回答忠実度と証明精度の複合報酬を最適化することにより,14個の強力なLDMよりも高い性能を示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:30:30 GMT)
Users Mispredict Their Own Preferences for AI Writing Assistance [14.6] AI記述アシスタントは、ユーザがドラフト支援を希望するタイミングを予測する必要があるが、好みを駆動する要因に関する実証的な理解は欠如している。
構成的努力が決定を支配しているのに対して、緊急性は予測力を示さない。
ユーザーは、最も弱い行動ドライバーであるにもかかわらず、緊急性を自己報告でランク付けする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 00:33:58 GMT)
Not All Steps are Informative: On the Linearity of LLMs' RLVR Training [14.6] 検証可能な報酬(RLVR)による強化学習は,大規模言語モデル(LLM)のポストトレーニングの中心的コンポーネントとなっている。
本研究では,将来のモデル状態が外挿による中間チェックポイントから予測可能かどうかを検討する。
Weight Extrapolationは標準RLトレーニングに匹敵する性能のモデルを生成すると同時に,計算量を大幅に削減することを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:06:18 GMT)
Estimating Causal Effects in Gaussian Linear SCMs with Finite Data [14.2] 観測データから因果効果を推定することは因果推論の根本的な課題である。
本稿では,ガウス線形構造因果モデル(GL-SCM)における因果効果の推定に焦点をあてる。
本稿では,有限観測試料から因果効果パラメータを同定し,因果効果を推定できるEMに基づく新しい推定法を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:37:10 GMT)
From Idea to Co-Creation: A Planner-Actor-Critic Framework for Agent Augmented 3D Modeling [13.8] 本稿では,アクター・クリティカル・アーキテクチャを,マルチエージェント・セルフリフレクションとヒューマン・イン・ザ・ループ・イン・ループ・イン・ループ(Human-in-the-loop)による創造的な3Dモデリングに拡張するフレームワークを提案する。
この設計では、Plannerはモデリングステップをコーディネートし、アクターはそれらを実行し、批判は反復的なフィードバックを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:18:12 GMT)
RL-AWB: Deep Reinforcement Learning for Auto White Balance Correction in Low-Light Night-time Scenes [13.6] 夜間ホワイトバランスのための統計的手法と深部強化学習を組み合わせた新しいフレームワークRL-AWBを提案する。
実験結果から,本手法は低照度・高照度画像に対して優れた一般化を実現することが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:59:55 GMT)
Learning Mixture Models via Efficient High-dimensional Sparse Fourier Transforms [13.5] 我々は、$d$次元で$k$球面分布の混合のパラメータを効率的に学習する、$rm poly(d,k)$ time and sampleアルゴリズムを提供する。
クラスタ分布が十分に重い尾を持つ特性関数を持つ場合,本手法は成功する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:47:58 GMT)
Orion-RAG: Path-Aligned Hybrid Retrieval for Graphless Data [13.3] Retrieval-Augmented Generation (RAG) は知識合成に有効であることが証明されているが、データは本質的に離散的で断片化されている現実的なシナリオにおいて重大な課題に直面している。
本稿では,断片化された文書を半構造化データに変換するOrion-RAGを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:32:01 GMT)
KnowMe-Bench: Benchmarking Person Understanding for Lifelong Digital Companions [13.2] 我々は、長文の自伝的物語から構築された公開リリース可能なベンチマークであるBenchNameを紹介する。
BenchNameは各物語をフラッシュバック対応のタイムアンコールストリームに再構成し、エビデンスにリンクされた質問でモデルを評価する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:11:33 GMT)
Fame Fades, Nature Remains: Disentangling the Character Identity of Role-Playing Agents [13.0] 本研究では,文字を2つの異なる層に分割する多次元的構成法を提案する。textbf(1) パラメトリック・アイデンティティは,LLMの事前学習から符号化された文字固有の知識を指し,textbf(2) 属性の属性や道徳的価値などの微粒な行動特性を捉える。
以上の結果から,RPAの忠実度の主要なボトルネックとして否定的な社会的特性が指摘され,今後の性格構築と評価を導いた。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:33:40 GMT)
GeoReason: Aligning Thinking And Answering In Remote Sensing Vision-Language Models Via Logical Consistency Reinforcement Learning [13.0] GeoReasonは、内部思考と最終的な決定を同期させるように設計されたフレームワークである。
まず、4000の推論軌道を含む論理駆動型データセットGeoReason-Benchを構築した。
次に,(1)推論の構文とドメインの専門知識をモデルに組み込むための知識初期化の促進,(2)推論の信頼性を向上するための一貫性を考慮した強化学習,という2段階の学習戦略を定式化する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:19:12 GMT)
How Does India Cook Biryani? [12.8] この研究は、ビリャーニ準備ビデオの最初の大規模、キュレートされたデータセットを提示する。
視覚言語モデル(VLM)を用いて、動画を細かな手続き単位に分割し、音声の書き起こしや標準レシピテキストと整合させる。
地域差の手続き的差異を自動的に識別し,説明するビデオ比較パイプラインを構築した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:23:10 GMT)
MOSAIC-GS: Monocular Scene Reconstruction via Advanced Initialization for Complex Dynamic Environments [12.8] MOSAIC-GSはモノクロビデオから高忠実度ダイナミックシーンを再構築するための、新しく、完全に明示的で、計算的に効率的なアプローチである。
我々は,深度,光学的流れ,動的物体セグメンテーション,点追跡など,複数の幾何学的手法を活用する。
我々は,MOSAIC-GSが既存の手法に比べて大幅に高速な最適化とレンダリングを実現することを実証した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:48:24 GMT)
LELA: an LLM-based Entity Linking Approach with Zero-Shot Domain Adaptation [12.5] 我々の手法であるLELAは,大規模言語モデル(LLM)の能力を生かしたモジュラー・粗大なアプローチである。
各種エンティティリンク設定に対する実験により,LELAは細調整アプローチと高い競争力を示し,非微調整手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:15:34 GMT)
Fast convergence of Majorana Propagation for weakly interacting fermions [12.4] トラッターステップとトランケーションを組み合わせた単純なアルゴリズムは、時間発展可能な観測値の低次近似を効率的に求める。
これはハミルトン進化のためのマヨラナ伝播に関する最初の証明可能な保証を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:53:53 GMT)
MAGA-Bench: Machine-Augment-Generated Text via Alignment Detection Benchmark [12.4] 機械生成テキスト(MGT)とHWT(Human-Written Text)の区別がますます困難になりつつある
微調整検出器の一般化能力はデータセットの品質に大きく依存する。
我々は textbfAlignment (MAGA) を用いた textbfMachine-textbfAugment-textbf 生成テキストを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:07:07 GMT)
High-Rate Free-Running Reference-Frame-Independent Measurement-Device-Independent Quantum Key Distribution with Classified Distillation [11.9] 本稿では,高速な参照フレーム変動下で高速な鍵生成を実現するRFI-MDI-QKDプロトコルを提案する。
我々のプロトコルは、従来のRFI-MDI-QKD方式の9倍以上のキーレートを達成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:54:24 GMT)
When the Server Steps In: Calibrated Updates for Fair Federated Learning [11.7] フェデレートラーニング(FL)は、変革的な分散ラーニングパラダイムとして登場した。
多様な人口集団の公平性を確保するという課題に直面している。
EquFLは,FLシステムのバイアスを考慮に入れたサーバサイドのデバイアス化手法である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:06:00 GMT)
BioPIE: A Biomedical Protocol Information Extraction Dataset for High-Reasoning-Complexity Experiment Question Answer [11.6] 高情報密度(HID)とMulti-Step Reasoning(MSR)は、生体医学実験QAに固有の課題を提起する。
既存のバイオメディカルデータセットは、一般的なまたは粗い知識に焦点を当てている。
BioPIEデータセットは、実験的なエンティティ、アクション、関係のプロシージャ中心のKGを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:44:37 GMT)
Machine learning-aided direct estimation of coherence and entanglement for unknown states [11.6] 本稿では,コヒーレンス測度と量子エンタングルメントの幾何測度を直接推定する機械学習手法を提案する。
提案手法は、計算、通信、および気象学アプリケーション間で量子リソースを特徴付ける実用的でスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:26:50 GMT)
Learnable Multipliers: Freeing the Scale of Language Model Matrix Layers [11.4] 学習可能な乗算器を導入し,行列層に重み減衰を適用するための最適尺度を学習する。
この手法は muP 乗算器の学習可能で表現性の高い一般化とみなすことができる。
十分に調整された muP ベースラインを上回り、チューニングの計算オーバーヘッドを減らし、前方通過対称性や学習した乗算器の幅スケーリングといった実用的な質問を表面化する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:41:49 GMT)
Classical solution of the FeMo-cofactor model to chemical accuracy and its implications [11.4] 1つ以上のFeMo-Coモデルにおいて、基底状態から化学的精度の計算方法を示す。
我々は,コファクタの現実的な表現における電子的景観を明らかにするために,より単純な計算手順を蒸留する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:49:32 GMT)
Rotation-Robust Regression with Convolutional Model Trees [11.1] 畳み込みモデル木(CMT)を用いた画像入力のための回転ロバスト学習に関する研究
分割方向に対する幾何学的帰納バイアスを3つ導入し、平面内回転下でのロバスト性への影響を定量化する。
我々は1-vs-restレグレッションとして実装されたMNIST桁認識における一貫した傾向を観察する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:53:33 GMT)
Multivector Reranking in the Era of Strong First-Stage Retrievers [11.1] 2つの公開データセット上で、最先端のマルチベクタ検索手法を再現する。
トークンレベルの集合フェーズを単一ベクトル文書検索器に置き換えることで,より小さく,より意味的に一貫性のある候補セットが生成されることを示す。
我々の2段階のアプローチは、最先端のマルチベクター検索システムに対して24ドル以上のスピードアップを実現し、同等または優れた検索品質を維持しています。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:22:18 GMT)
DeepWeightFlow: Re-Basined Flow Matching for Generating Neural Network Weights [11.0] 本稿では,多種多様な高精度ニューラルネットワーク重みを生成するために,直接重み空間で動作するフローマッチングモデルであるDeepWeightFlowを提案する。
DeepWeightFlowが生成するニューラルネットワークは、パフォーマンス向上のために微調整を必要とせず、大規模ネットワークにスケールすることができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:56:28 GMT)
GlimpRouter: Efficient Collaborative Inference by Glimpsing One Token of Thoughts [10.8] 協調推論は、軽量モデルと大規模モデルの間の作業を選択的に割り当てることで、有望なソリューションを提供する。
ステップワイドなコラボレーションに関する新しい視点を提案する。推論ステップの難しさは,最初のトークンから推測できる。
Glimpは軽量なモデルを使用して、各推論ステップの最初のトークンのみを生成し、初期トークンエントロピーがしきい値を超えた場合にのみ、ステップをより大きなモデルにルーティングする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:58:07 GMT)
A Semi-supervised Molecular Learning Framework for Activity Cliff Estimation [10.6] そこで本研究では,SemiMolと呼ばれる新しい半教師付き学習手法を提案する。
SemiMolは、後続のトレーニングに擬似信号として、多くの無注釈データに対する予測を使用する。
また,SemiMolはグラフベースのMLアーキテクチャを大幅に強化し,最先端の事前トレーニングやSSLベースラインを克服することを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:20:25 GMT)
Tool-MAD: A Multi-Agent Debate Framework for Fact Verification with Diverse Tool Augmentation and Adaptive Retrieval [10.6] マルチエージェント・ディベート(MAD)システムは,複数のLLMエージェントが対話を行えるようにすることで,解答精度を向上させることを目的としている。
既存のMADフレームワークは主に内部知識や静的文書に依存しており、幻覚に弱い。
エージェントを別個の外部ツールに割り当てることで,事実検証を強化する多エージェント討論フレームワークであるTool-MADを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:07:41 GMT)
Faithful Summarisation under Disagreement via Belief-Level Aggregation [10.3] 言語生成から信念レベルアグリゲーションを分離する不一致認識合成パイプラインを導入する。
以上の結果から,大規模モデルは世代ごとの集約処理において,信念レベルアグリゲーションに十分一致するが,アーキテクチャや能力の面では安定ではないことが示唆された。
対照的に、信念レベルのアグリゲーションと単純なプロンプトの利得が組み合わさって、モデル間の相反する性能を一貫して強く認識する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:40:47 GMT)
Multi-Scale Local Speculative Decoding for Image Generation [10.2] マルチスケールローカル投機復号(MuLo-SD)を導入する。
MuLo-SDは、多重解像度のドラフトと空間情報による検証を組み合わせることで、AR画像生成を高速化する。
我々は MuLo-SD が $mathbf1.7times$ までの大幅な高速化を実現することを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:39:35 GMT)
Observation of ΔJ=0 Rotational Excitation in Dense Hydrogens [10.1] 広い圧力-温度範囲における密度H2, D2, H2+D2のラマン測定により、J=0回転励起の存在が明らかになった。
気体/流体状態では、この励起はラマンシフトをゼロとするが、固体では結晶場が0から切り離す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:25:02 GMT)
Chiral Graviton Modes in Fermionic Fractional Chern Insulators [10.1] キラルグラビトンモードは、フラクタル量子ホール(FQH)液体の集合励起である。
ここではフェルミオン型FCIにおけるグラビトンモードの理論的および数値的研究について述べる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:18:45 GMT)
Distinguishing Coherent and Incoherent Errors in Multi-Round Time-Reversed Dynamics via Scramblons [9.9] 量子カオスシステムでは、不完全なハミルトン制御によるコヒーレントエラーと環境への結合によって引き起こされる非コヒーレントエラーが指数関数的に増幅される。
これらの2種類のエラーが、多体力学の創発的不可逆性に異なるシグネチャをインプリントする方法を示す。
この結果は、逆ダイナミクスにおけるコヒーレントおよび非コヒーレントエラーを特徴づけ、校正するための理論的基礎を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:46:30 GMT)
Surprisal and Metaphor Novelty: Moderate Correlations and Divergent Scaling Effects [9.9] 本研究では,言語モデルにおける予測可能性の確率的尺度である仮定がメタファの新規性データセットと相関するかどうかを考察する。
我々は、コーパスベースおよび合成メタファーノベルティデータセットに基づく16のLM変種から予備解析を行った。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:27:27 GMT)
Optimal Lower Bounds for Online Multicalibration [9.9] 期待される多重校正誤差に対して$(T2/3)$低い境界を3つの非結合二元群を用いて証明する。
次に、文脈に依存するが学習者の予測には依存しない群関数のより難しい場合の下位境界に目を向ける。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:59:32 GMT)
GRACE: Reinforcement Learning for Grounded Response and Abstention under Contextual Evidence [9.8] Retrieval-Augmented Generation (RAG)は、外部知識を統合してLarge Language Models (LLM)を強化する
RAGは、明確な根拠のない正しい答えを提供することと、検索された文脈が不十分な場合に製造された応答を生成するという2つの重大な欠陥に感受性がある。
本稿では,両方の欠陥を同時に軽減する強化学習フレームワークGRACEを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:47:33 GMT)
Computational Compliance for AI Regulation: Blueprint for a New Research Domain [9.6] 私たちは、従来の類似のコンプライアンス手法を引き続き頼りにすることで、AIシステムは必要なスピードと規模で規制に従えないと論じています。
その代わり、これらの規則の遵守は、AIシステムのライフサイクルを横断するアルゴリズムで現実的にのみ達成され、ダイナミックな条件に直面して自動的にAIRコンプライアンスに向けて制御される。
個々のアルゴリズムがこれらの設計目標を満たすかどうかを定量的に測定できるベンチマークデータセットを指定する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:22:45 GMT)
SKATER: Synthesized Kinematics for Advanced Traversing Efficiency on a Humanoid Robot via Roller Skate Swizzles [9.5] 本研究では,ローラースケート用の4輪の受動車輪を脚に備えた新しいヒューマノイドロボットを提案する。
また, ローラースケートの内在特性に基づいて, 報奨関数を設計したシュリップルゲイトに対して, 深部強化学習制御フレームワークを開発した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:54:22 GMT)
From National Curricula to Cultural Awareness: Constructing Open-Ended Culture-Specific Question Answering Dataset [9.3] 本稿では,文化意識管理の基盤として,国家社会学カリキュラムを活用したスケーラブルなアプローチを提案する。
韓国の社会学カリキュラムにCuCuを適用し,34.1万対のオープンエンドQAからなるKCaQAを構築した。
定量的および質的分析から,KCaQAは文化特有のトピックをカバーし,地域社会文化の文脈に根ざした応答を生み出すことが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:04:59 GMT)
Unified Framework for Qualifying Security Boundary of PUFs Against Machine Learning Attacks [9.3] 機械学習攻撃に対するPUFセキュリティを評価するためのフレームワークを提案する。
未知の課題に対する応答を予測する際の敵の優位性を数学的に特徴づける。
提案手法はPUFのレジリエンスを体系的に定量化し、微妙なセキュリティ上の違いを捉え、PUFの実用的展開に対して実用的な理論的根拠を持つセキュリティ保証を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:07:09 GMT)
MoEBlaze: Breaking the Memory Wall for Efficient MoE Training on Modern GPUs [9.1] メモリウォール」のボトルネックは、現代の大規模Mixture-of-Experts (MoE)アーキテクチャで顕著に増幅されている。
私たちは、メモリ効率のよいMoEトレーニングフレームワークであるMoEBlazeを紹介します。
既存のMoEフレームワークと比較して、MoEBlazeは4倍以上のスピードアップと50%以上のメモリ節約を実現できます。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:38:23 GMT)
Gradient-based Optimisation of Modulation Effects [9.0] 本稿では,異なるディジタル信号処理に基づいて,フランガー,コーラス,位相効果をモデル化する枠組みを提案する。
モデルは時間周波数領域でトレーニングされるが、推論時には時間領域で動作し、遅延はゼロである。
アナログ効果ユニットに対して訓練した場合、モデルから出力される音は、参照とは知覚的に区別できない場合もある。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:04:41 GMT)
Towards Public Administration Research Based on Interpretable Machine Learning [8.9] この論文は、解釈可能な機械学習の基本原理と社会科学研究におけるその応用について論じている。
本稿では、行政分野における解釈可能な機械学習の学際的価値について考察する。
従来の因果推論手法を補完するものとして、解釈可能な機械学習は、行政の領域における定量的研究において、新しい信頼性の時代を導く。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:48:10 GMT)
Reasoning Over Space: Enabling Geographic Reasoning for LLM-Based Generative Next POI Recommendation [8.8] Reasoning Over Space (ROS) は、地理を推論プロセスにおける重要な決定変数として利用するフレームワークである。
ROSは、粗い局所性とPOIセマンティクスを合成トークンに識別する階層的空間意味ID(SID)を導入している。
空間誘導強化学習(Reinforcement Learning, RL)により, 実世界の地理とモデルをさらに整合させる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:46:03 GMT)
Understanding Gaming the System by Analyzing Self-Regulated Learning in Think-Aloud Protocols [8.6] 本研究は,ゲームがほとんど答えられていない場合,学生が認知的に切り離されているか,あるいは,異なる自己統制型学習戦略に従事しているかを検討する。
ゲームは単に認知的努力の欠如を反映するものではなく、ゲーム中、学生はより長い発話を生み出すことが多い。
この理解により、今後の研究は、より良い学習を促進するために、不適応な自己規制をターゲットとするシステムを設計することによって、ゲームとその負の影響に対処することができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:45:56 GMT)
$PC^2$: Politically Controversial Content Generation via Jailbreaking Attacks on GPT-based Text-to-Image Models [8.4] 公共の人物の描写など政治的に有害な内容は、偽ニュースやプロパガンダのために武器化された場合、深刻な脅威となる。
我々は、T2Iモデルのための最初のブラックボックス政治ジェイルブレイクフレームワークである$PC2$を提案する。
これは、安全フィルタが言語的文脈に基づいて政治的感受性を評価するという、新たな脆弱性を利用する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:40:50 GMT)
Large language models can effectively convince people to believe conspiracies [8.4] 大規模言語モデル(LLM)は様々な文脈で説得可能であることが示されている。
これらのモデルが反証するのと同じくらい簡単に不信を助長できるかどうかを考察する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:56:05 GMT)
Vision-Language Agents for Interactive Forest Change Analysis [8.4] 複数のRSICIタスクにまたがる自然言語クエリをサポートする林分変化解析エージェントを提案する。
提案システムは,LLMベースのオーケストレーションを用いたマルチレベル変化解釈(MCI)に基づく。
実験の結果、提案されたシステムmIoUとBLEU-4はフォレスト・チャンジのデータセットで67.10%と40.17%、LEVIR-MCI-Treesでは88.13%と34.41%であった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:02:36 GMT)
Efficient Inference for Noisy LLM-as-a-Judge Evaluation [8.3] 大規模言語モデル(LLM)は、生成的AI出力の自動評価器としてますます使われている。
実際には、LLMの判断は根底にある真実の完全な予測であり、体系的な非ランダムな誤りを示すことができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 22:46:26 GMT)
AgentDevel: Reframing Self-Evolving LLM Agents as Release Engineering [8.2] AgentDevelは、現行のエージェントを反復的に実行するリリースエンジニアリングパイプラインである。
実行トレースから実装盲の症状レベルの品質信号を生成する。
主要な症状パターンを集約し、監査可能なエンジニアリング仕様を生成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:49:01 GMT)
An Empirical Investigation of Robustness in Large Language Models under Tabular Distortions [8.0] 大規模言語モデル(LLM)は、他の標準表現の表計算データが意味的および構造的歪みを受けると失敗する。
システムプロンプトを通じて明示的な事前情報を提供する場合のみ、モデルは推論戦略を部分的に調整し、いくつかの歪みを修正する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:10:32 GMT)
MineNPC-Task: Task Suite for Memory-Aware Minecraft Agents [7.9] 我々は,オープンワールドのemphMinecraftにおいて,メモリを意識した混合開始型LLMエージェントをテストするためのユーザ認証ベンチマークと評価ハーネスであるtextscMineNPC-Task を提示する。
タスクは、合成プロンプトに頼るのではなく、専門家と形式的で要約的なコプレイから引き出され、明示的な前提条件と依存性構造を持つパラメトリックテンプレートに正規化される。
コード実行、インベントリ/ツールハンドリング、参照、ナビゲーションにおいて繰り返し発生するブレークダウンパターンを観察し、混合初期化と軽量メモリによるリカバリをサポートします。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:39:52 GMT)
Improving Enzyme Prediction with Chemical Reaction Equations by Hypergraph-Enhanced Knowledge Graph Embeddings [7.8] 酵素と基質の相互作用を予測することは、長い間、生化学と代謝工学の基本的な問題であった。
既存の方法では、専門家が計算した酵素と基質のペアのデータベースを利用して、既知のペアの相互作用から学習することができる。
この十分なトレーニングデータの欠如は、従来の酵素予測モデルが目に見えない相互作用を一般化する能力を著しく妨げている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:17:18 GMT)
FlowLet: Conditional 3D Brain MRI Synthesis using Wavelet Flow Matching [7.4] 年齢条件付き3次元MRIを合成する条件生成フレームワークであるFlowLetを提案する。
実験により、FlowLetはサンプリングステップの少ない高忠実度ボリュームを生成することが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:36:29 GMT)
MPM-LLM4DSE: Reaching the Pareto Frontier in HLS with Multimodal Learning and LLM-Driven Exploration [7.3] 本稿では,マルチモーダル予測モデル(MPM)を組み込んだMPM-LLM4DSEフレームワークを提案する。
実験の結果,我々のマルチモーダル予測モデルは最先端のProgSGを最大10.25$times$で大幅に上回ることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:32:49 GMT)
Scalable Generation of Macroscopic Fock States Exceeding 10,000 Photons [7.3] 我々は,1万ドルを超えるフォック状態を生成するために,シングルボソニックモードでKerr-Engineered Multi-lensプロトコルを導入する。
我々の枠組みは巨大フォック状態の量子-古典遷移の探索を可能にする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:06:45 GMT)
Bridging Distance and Spectral Positional Encodings via Anchor-Based Diffusion Geometry Approximation [7.3] 広く使われている2つのファミリーは、ラプラシアンまたは拡散演算子に由来するスペクトル符号化と、最短パス情報から構築されたアンカーベース距離符号化である。
我々は, 乱れた拡散座標を変換されたアンカー距離とアンカースペクトル位置から再構成する明示的な3次写像を導出した。
共有GNPベースのDDI予測バックボーンを用いたDarmBank分子グラフでは、距離駆動Nystrmスキームが拡散幾何学を密接に回復する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:31:03 GMT)
Challenges and Research Directions for Large Language Model Inference Hardware [7.2] 最近のAIトレンドによってさらに悪化している主な課題は、計算よりもメモリと相互接続である。
ハイバンド幅はFlashのような帯域幅で10倍のメモリ容量を持ち、プロセッシング・ナアー・メモリと高メモリ帯域で3Dメモリ・ロジック・スタックリングを行う。
スピードアップ通信への低レイテンシ相互接続。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:52:11 GMT)
A Survey of Agentic AI and Cybersecurity: Challenges, Opportunities and Use-case Prototypes [7.0] Agentic AIは、単一ステップ生成モデルから、長期的タスクに対する推論、計画、行動、適応が可能なシステムへの重要な転換点である。
本調査は,サイバーセキュリティにおけるエージェントAIの影響について検討する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:46:06 GMT)
FeedEval: Pedagogically Aligned Evaluation of LLM-Generated Essay Feedback [6.9] 本稿では,LLM生成エッセイフィードバックを評価するためのフレームワークFeedEvalを提案する。
ASAP++ベンチマークの実験では、FeedEvalは人間の専門家による判断と密接に一致しており、FeedEvalでフィルタされた高品質なフィードバックでトレーニングされたモデルを評価するエッセイは、優れたスコアリング性能を実現している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:04:29 GMT)
A Multimodal Data Processing Pipeline for MIMIC-IV Dataset [6.5] MIMIC-IVは、大規模な電子健康記録(EHR)リソースで、臨床機械学習研究に広く利用されている。
構造化データ、臨床ノート、波形、画像データを含む複数のモダリティから構成される。
MIMIC-IVデータ抽出用のパイプラインがいくつか用意されているが、モダリティの小さなサブセットをターゲットにしているか、あるいは任意のダウンストリームアプリケーションを完全にサポートしていない。
本稿では,従来普及してきたユニモーダルパイプラインを大幅に拡張し,包括的でカスタマイズ可能なマルチモーダルパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:05:05 GMT)
Leveraging Membership Inference Attacks for Privacy Measurement in Federated Learning for Remote Sensing Images [6.5] フェデレートラーニング(FL)は、トレーニングデータをローカライズしながら協調的なモデルトレーニングを可能にし、リモートセンシングを含むさまざまな領域におけるプライバシ保護を可能にします。
近年の研究では、FLモデルは出力を通じて機密情報を漏洩し、厳格なプライバシー評価の必要性が示唆されている。
我々は、リモートセンシング画像分類に応用したFLの定量的プライバシー測定フレームワークとして、MIA(Message Inference attack)を利用する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:58:33 GMT)
When Models Manipulate Manifolds: The Geometry of a Counting Task [6.3] Claude 3.5 Haikuは、固定幅テキストのラインブレークという、そのようなタスクを達成している。
文字数はスパース特徴群によって離散化された低次元曲線多様体上で表現される。
視覚錯覚、つまり、カウント機構をハイジャックする文字列を発見する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:33:42 GMT)
Cells on Autopilot: Adaptive Cell (Re)Selection via Reinforcement Learning [6.1] 本稿では,モバイルネットワーク力学の時間パターンを学習することで,セル選択パラメータを適応的に調整する強化学習(RL)フレームワークCellPilotを提案する。
本研究は,軽量なRLエージェントであっても,異なるネットワークシナリオに対して効果的に一般化しながら,従来の再構成を最大167%向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:32:37 GMT)
GCR: Geometry-Consistent Routing for Task-Agnostic Continual Anomaly Detection [5.9] 幾何整合性ルーティングによる連続的異常検出を安定化するための軽量なミックス・オブ・サーキットフレームワークを提案する。
GCRは、蓄積した最も近いプロトタイプ距離をカテゴリ固有のプロトタイプバンクに最小化し、各テスト画像を共有パッチ埋め込み空間に直接ルーティングする。
MVTec ADとVisAの実験では、幾何一貫性のあるルーティングがルーティングの安定性を大幅に改善し、連続的な性能崩壊を緩和することを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:18:30 GMT)
Analyzing Message-Code Inconsistency in AI Coding Agent-Authored Pull Requests [5.9] AIコーディングエージェントによって生成されたプルリクエスト記述は、人間のレビュアーにコード変更を伝えるための主要なチャネルである。
PRメッセージコード不整合(PR-MCI)を用いた5エージェントにわたるエージェントPR23,247の解析を行った。
高MCIのPRは51.7%減少し、合併までに3.5倍の期間を要した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:31:02 GMT)
VotIE: Information Extraction from Meeting Minutes [5.8] 本稿では,物語の熟考記録における構造化された投票イベントの識別を目的とした新しい情報抽出タスクであるVotIEを紹介する。
我々は,最近導入されたCitiLinkコーパスに基づいて,ポルトガルの自治体時間を用いて,このタスクの最初のベンチマークを構築した。
標準的なドメイン内評価では、微調整エンコーダ(特にXLM-R-CRF)は93.2%のマクロF1に達し、生成的アプローチより優れている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:24:16 GMT)
4D-ARE: Bridging the Attribution Gap in LLM Agent Requirements Engineering [5.8] 属性駆動型エージェントを特定するための予備的方法論である4D-AREを提案する。
金融サービスにおける産業パイロットの展開を通じて,その方法論を実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:36:06 GMT)
Can AI-Generated Persuasion Be Detected? Persuaficial Benchmark and AI vs. Human Linguistic Differences [5.8] 大きな言語モデル(LLM)は説得力のあるテキストを生成し、プロパガンダ、操作、その他の有害な目的に対する誤用を懸念する。
LLMを用いて説得的コンテンツを生成するための制御可能な生成手法を分類し、6つの言語をカバーする高品質な多言語ベンチマークであるPersuaficialを導入する。
過度に説得力のあるLLM生成テキストは人書きテキストよりも検出しやすいが、微妙なLLM生成パースケーションは自動検出性能を一貫して低下させる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:22:25 GMT)
PILOT-Bench: A Benchmark for Legal Reasoning in the Patent Domain with IRAC-Aligned Classification Tasks [5.8] PILOT-BenchはPTABの判断をケースレベルでUSPTOの特許データと一致させる最初のPTAB中心のベンチマークである。
我々は、様々なクローズドソース(商用)とオープンソースLLMを評価し、複数の視点で分析を行う。
PILOT-Benchは、特許ドメインの法的推論を体系的に評価する基盤を確立している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:26:05 GMT)
Crystal Generation using the Fully Differentiable Pipeline and Latent Space Optimization [5.7] 本稿では,対称性条件付き変分オートエンコーダ (CVAE) と微分可能なSO(3)パワースペクトルを結合したフレームワークを提案する。
我々は,直接および潜在結晶表現に対してバッチワイズ最適化を行う,完全微分可能なパイプラインを実装した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:24:59 GMT)
Intent at a Glance: Gaze-Guided Robotic Manipulation via Foundation Models [5.7] Eye Eyeは、高速で、非侵襲的で、意図に富んだ入力モダリティを提供する。
我々は,エゴ中心の視線追跡と視覚言語モデルを利用して,ユーザの意図を推測し,ロボット操作タスクを自律的に実行するシステムであるGAMMAを提案する。
結果は、GAMAが堅牢で直感的で汎用的な制御を提供し、基礎モデルを組み合わせる可能性と、自然でスケーラブルなロボット自律性を見つめることを強調している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:33:03 GMT)
ALL-FEM: Agentic Large Language models Fine-tuned for Finite Element Methods [5.7] ALL-FEMは、エージェントAIとドメイン固有で微調整されたLLMを統合した、FEniCSコード生成のための自律シミュレーションシステムである。
我々は、キュレートされたエキスパートコードと検索拡張マルチLLMパイプラインを組み合わせることで、1000以上の検証済みFEniCSスクリプトのコーパスを構築する。
我々のエージェントフレームワークは、微調整LDMを用いた特殊エージェントを編成し、問題をPDEとして定式化し、コードを生成し、結果を視覚化する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:25:59 GMT)
Defense Against Indirect Prompt Injection via Tool Result Parsing [5.7] LLMエージェントは間接的なプロンプトインジェクションからエスカレートする脅威に直面している。
この脆弱性は、エージェントが物理的な環境をより直接的に制御するようになると、重大なリスクをもたらす。
そこで本稿では,LLMに対してツール解析による正確なデータを提供するとともに,注入された悪意のあるコードを効果的にフィルタリングする手法を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:21:56 GMT)
Lost in Execution: On the Multilingual Robustness of Tool Calling in Large Language Models [5.7] 大規模言語モデル(LLM)は、構造化関数呼び出しを通じて外部ツールを呼び出すエージェントとして、ますます多くデプロイされている。
診断ベンチマークであるMLCLを導入し,中国語,ヒンディー語,低リソース言語Igboを対象とした多言語ツールコールの体系的評価を行う。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:44:28 GMT)
Neural Algorithmic Reasoning for Approximate $k$-Coloring with Recursive Warm Starts [5.6] ノードカラー化におけるグラフニューラルネットワーク(GNN)の利用について検討する。
我々は,軽量なグリーディ局所探索アルゴリズムを導入し,暖かいスタートに使用するために$(k-1)-coloringを使用することで,それを改善することを示す。
数値実験により、局所探索アルゴリズムは小さな入力に対して優れているが、GNN$はスケールにおいて優れた性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:28:09 GMT)
Archetypal cases for questionnaires with nominal multiple choice questions [5.4] アーチティパル分析は、純粋な(極端)パターンの凸結合として観測の集合を解釈する探索ツールとして機能する。
本研究は初めて,古細菌分析を名目観察に応用することを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:32:23 GMT)
Multiagent Reinforcement Learning with Neighbor Action Estimation [5.2] 本稿では,エージェントの振る舞いを推論するための行動推定ニューラルネットワークを用いたマルチエージェント強化学習フレームワークを提案する。
工学的応用レベルでは、このフレームワークはデュアルアームロボット操作タスクで実装され、検証されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:26:57 GMT)
Internal Representations as Indicators of Hallucinations in Agent Tool Selection [5.2] 大規模言語モデル(LLM)は、ツール呼び出しとツールの使用において顕著な能力を示している。
LLMは、誤ったツールを選択し、不正なパラメータを提供し、"ツールバイパス"の振る舞いを示す幻覚に悩まされる。
LLMの内部表現を利用して,ツールコールの幻覚をリアルタイムに検出する,計算効率のよいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:38:45 GMT)
Manifold-based Sampling for In-Context Hallucination Detection in Large Language Models [5.2] 大型言語モデル (LLMs) は、しばしば幻覚と呼ばれる、事実的に誤った、またはサポートされていないコンテンツを生成する。
そこで本研究では,文書内デモを選択するための,多様体を用いた実演サンプリングフレームワークMB-ICLを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:17:18 GMT)
Sketch&Patch++: Efficient Structure-Aware 3D Gaussian Representation [5.2] 本稿では, ガウスを(i) 高周波数, 境界定義特徴を表すSketch Gaussian, (ii) 低周波数, 滑らかな領域をカバーするPatch Gaussianに分類するハイブリッド表現を提案する。
提案手法では,適応的品質駆動型精細化と合わせて,マルチクレータ密度に基づくクラスタリングを用いる。
この構造対応表現は、帯域制限されたネットワークとリソース制限されたデバイス間で、効率的なストレージ、適応ストリーミング、高忠実度3Dコンテンツのレンダリングを可能にする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:32:54 GMT)
See, Explain, and Intervene: A Few-Shot Multimodal Agent Framework for Hateful Meme Moderation [5.0] 我々は、有害なミームを3つの補完的な角度から調べる: それらを検出する方法、その内容を説明する方法、投稿前に介入する方法。
本稿では,タスク固有の生成的マルチモーダルエージェントと大規模マルチモーダルモデルの少数ショット適応性を活用して,異なる種類のミームに対応する新しいフレームワークを提案する。
これは、限られたデータ条件下での一般化可能なヘイトフルなミームのモデレーションに焦点を当てた最初の作業であり、実際の運用シナリオに展開する可能性も強い、と私たちは信じています。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:02:48 GMT)
Optimizing Digital Adjudication through Social Network Analysis: An Empirical Study of Credit Card Disputes in Beijing [5.0] 本研究は,北京における個人情報保護に関するクレジットカード紛争を,ソーシャル・ネットワーク・アナリティクスを用いて調査する。
その結果、SNAは「デジタルコート」システムを最適化するための堅牢な方法論的枠組みを提供し、中核的な法的規範を効果的に識別し、事例をタイプできることを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:21:39 GMT)
The LLM Mirage: Economic Interests and the Subversion of Weaponization Controls [5.0] 米国のAIセキュリティポリシは、フロンティア言語モデルのトレーニングに使用される計算に比例して、国家安全保障のリスクがスケールするという、$textitLLM Mirage$によってますます形作られています。
我々は、効果と国際人道法に基づくAI兵器の意図と能力の定義を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:59:47 GMT)
The Adverse Effects of Omitting Records in Differential Privacy: How Sampling and Suppression Degrade the Privacy--Utility Tradeoff (Long Version) [4.9] 我々は、レコードの選択や削除の一般的な方法として、抑圧を調査する。
テストされた抑制戦略は、プライバシとユーティリティのトレードオフの改善にも失敗しています。
驚くべきことに、均一なサンプリングは、まだ劣化する効果があるにもかかわらず、最高の抑制方法の1つとして現れます。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:03:57 GMT)
Multi-Group Quadratic Discriminant Analysis via Projection [4.9] 多群分類は多くの予測と意思決定の問題に現れる。
近年の研究では、線形判別分析を複数のグループに拡張しているが、より一般的な方法が必要である。
二次判別分析に基づく多群分類法であるMGQDA(Multi-Group Quadratic Discriminant Analysis)を開発した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 22:33:54 GMT)
PRISM: Protocol Refinement through Intelligent Simulation Modeling [4.8] 本稿では,実験プロトコルの設計,検証,実行を自動化するフレームワークであるPRISMを紹介する。
PRISMは言語モデルに基づくエージェントのセットを使用し、共同で実験的なステップを生成し、洗練する。
我々は、PRISMを言語ベースのプロトコル生成、シミュレーションベースの検証、自動ロボット実行をブリッジする実用的なエンドツーエンドワークフローとして実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:15:28 GMT)
A Bayesian Generative Modeling Approach for Arbitrary Conditional Inference [4.5] 本稿では,任意の条件推論のためのベイズ生成モデル (BGM) を提案する。
BGMは、モデルパラメータと潜伏変数が収束するまで更新される反復ベイズ更新アルゴリズムを通してXの生成モデルを学ぶ。
経験的に、BGMはよく校正された予測間隔で優れた予測性能を達成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:14:30 GMT)
OceanSplat: Object-aware Gaussian Splatting with Trinocular View Consistency for Underwater Scene Reconstruction [4.3] OceanSplatは、水中のシーンで3D幾何学を表現するための新しい3Dガウススプレイティングベースのアプローチである。
そこで,OceanSplatは,散乱媒体におけるシーン復元と復元の両方において,既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:38:39 GMT)
NorwAI's Large Language Models: Technical Report [4.3] NorwAIはノルウェー語や他のスカンジナビア語に特化されたモデルのファミリーを開発した。
これらのモデルは、スクラッチから事前訓練されるか、25B - 88.45Bトークンで継続的に事前訓練される。
このレポートは、モデルアーキテクチャ、トレーニングデータ、トークン化設計、微調整戦略、デプロイメント、評価に関する詳細なドキュメントを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:58:43 GMT)
Prior-Informed Zeroth-Order Optimization with Adaptive Direction Alignment for Memory-Efficient LLM Fine-Tuning [4.3] 本稿では,事前インフォームド摂動を組み込んだプラグアンドプレイ手法を提案する。
本手法は標準ZO法と比較して収束を著しく加速する。
勾配推定器が真の勾配方向とより強く一致することを証明する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:27:15 GMT)
Precomputing Multi-Agent Path Replanning using Temporal Flexibility: A Case Study on the Dutch Railway Network [4.2] カスケード遅延を回避しつつ、他のエージェントの時間的柔軟性を追跡・利用することで効率的に再計画する方法を示す。
私たちのアルゴリズムであるFlexSIPPは、遅延エージェントの可能なすべてのプランをプリ計算し、与えられたシナリオ内の任意の単一エージェント遅延に対して、他のエージェントの変更を返します。
オランダの高密度鉄道網における列車の運行計画に関する実例として,本手法を実証した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:30:36 GMT)
Scalable Floating-Point Satisfiability via Staged Optimization [4.2] この研究は浮動小数点満足度を解くための新しいアプローチであるStageSATを導入している。
StageSATは、浮動小数点公式を、精度の向上の3段階における一連の最適化問題として再設定する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:51:46 GMT)
From Policy to Logic for Efficient and Interpretable Coverage Assessment [4.2] 本稿では,政策解釈をより効率的かつ解釈可能なものにすることで,人間レビュアーを支援するためのアプローチを提案する。
本稿では,関係する政策言語を明らかにするために,包括的ルールベース推論と包括的ルール対応レトリバーを組み合わせた手法を提案する。
提案手法は,F1スコアの4.5%向上とともに,推論コストの44%削減を実現し,効率と有効性を実証した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:28:40 GMT)
Patch-based Representation and Learning for Efficient Deformation Modeling [4.1] 表面パッチ上にジェット関数を局所的に取り付けることで得られる表面のパッチベース表現であるPolyFitを提案する。
PolyFitを使えば、ジェット係数のコンパクトな集合を更新することで、表面を効率的に変形させることができる。
我々は、解像度や衣服の種類をまたいで一般化し、強力なベースラインよりも高速な推論を提供する、自己監督的、メッシュ的、衣服に依存しないモデルを訓練する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:43:57 GMT)
On the Limitations of Rank-One Model Editing in Answering Multi-hop Questions [3.9] ランクワンモデル編集による知識の編集が層深度に及ぼす影響について検討した。
マルチホップ推論を強化するシンプルかつ効果的な戦略である冗長編集を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:05:09 GMT)
STResNet & STYOLO : A New Family of Compact Classification and Object Detection Models for MCUs [3.9] 画像分類のためのSTResNetと、リソース制約のあるプラットフォーム上での精度、効率、メモリフットプリントに最適化されたオブジェクト検出のためのSTYOLO。
STResNetMilliは、300万のパラメータだけで、Top 1の精度が70.0%に達し、MobileNetV1とShuffleNetV2を同等の計算複雑性で上回っている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:39:50 GMT)
Deep Dive into the Abuse of DL APIs To Create Malicious AI Models and How to Detect Them [3.9] 事前トレーニングされたAIモデルは、Hugging FaceやHubといったモデルハブから取得されることが多い。
これにより、攻撃者が悪意のあるコードをモデルに注入できるセキュリティリスクがもたらされる。
ファイルの読み取り/書き込みやネットワークの送/受信といったAPIの隠れた機能を悪用する方法を示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:30:20 GMT)
Momentum-Space Entanglement Entropy as a Universal Signature of Dynamical Quantum Phase Transitions [3.8] クエンチに続く運動量モード間の量子相関を定量化するために,運動量空間の絡み合いエントロピーを導入する。
我々の研究は、動的量子相転移に関する統一的、絡み合いに基づく視点を確立する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:03:51 GMT)
FastSLM: Hierarchical Frame Q-Former for Effective Speech Modality Adaptation [3.8] FastSLMは、長文音声に対する効果的な理解と推論のために設計された軽量で効率的な音声言語モデル(SLM)である。
本稿では,多岐にわたる音声関連タスクの一般化を促進する新しい3段階学習戦略を提案する。
実験結果から,FastSLMは既存の最先端モデルと比較して競争性能が向上することが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:46:03 GMT)
Topological sensing of superfluid rotation using non-Hermitian optical dimers [3.8] 我々は,分散的および散逸的バックアクションによってパラメータが再正規化される非エルミート光学ダイマーについて検討した。
固有モード置換に基づくディジタル例外点に基づくセンシング手法を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:14:31 GMT)
Belief in Authority: Impact of Authority in Multi-Agent Evaluation Framework [3.7] 本稿では,ChatEvalを用いたフリーフォームマルチエージェント評価において,役割に基づく権限バイアスを初めて体系的に分析する。
フランス語とラヴェンの権力に基づく理論を応用し、権威的な役割を正当性、参照性、専門家のタイプに分類する。
GPT-4oとDeepSeek R1の実験により、エキスパートと参照パワーの役割はレジデントパワーの役割よりも強い影響力を持つことが明らかになった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:13:56 GMT)
Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems [3.7] 本稿では,統計的精度のみでなく,運用リスクを計測するグリッド固有評価フレームワークを提案する。
このフレームワークを用いて,カリフォルニア州のグリッド予測のためのマンバをベースとしたステートスペースモデルの体系的評価を行う。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:12:43 GMT)
RiskBridge: Turning CVEs into Business-Aligned Patch Priorities [3.6] RiskBridgeは、説明とコンプライアンスを意識したヴァルナー能力管理フレームワークである。
CVSS v4、EPSS、CISA KEVからのマルチソースインテリジェンスを統合し、動的でビジネス対応のパッチ優先順位を生成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:41:17 GMT)
Theoretical investigation of non-Förster exciton transfer mechanisms in perylene diimide donor, phenylene bridge, and terrylene diimide acceptor systems [3.6] ペリレンジイミドとテルリレンジイミドのオリゴフェニレンブリッジユニットで結合したダイアド内でのエキシトン移動の速度は、Frsterの共鳴エネルギー移動理論から大きく逸脱することが示されている。
橋梁の電子状態の寄与を推定し, エクシトン移動のメカニズムを詳細に検討した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:07:04 GMT)
GlyRAG: Context-Aware Retrieval-Augmented Framework for Blood Glucose Forecasting [3.5] GlyRAGは、CGMトレースから直接血糖値のセマンティック理解を導き出す、文脈対応、検索強化予測フレームワークである。
GlyRAGは最先端の手法を一貫して上回り、RMSEは最大で39%低下し、RMSEはベースラインよりもさらに1.7%減少する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:07:59 GMT)
FastWhisper: Adaptive Self-knowledge Distillation for Real-time Automatic Speech Recognition [3.5] 本稿では,教師モデルの依存度を低減し,自己学習能力を向上させる適応型自己知識蒸留法を提案する。
FastWhisperは、教師モデルWhisperよりも1.07%低い単語エラー率を実現し、相対的な推論時間は5倍速くなった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:05:30 GMT)
Detector-Augmented SAMURAI for Long-Duration Drone Tracking [3.5] 都市環境におけるロバストなドローン追跡に対する佐村井の可能性を, 初めて体系的に評価した。
以上の結果から,提案手法は複雑な都市環境におけるロバスト性を大幅に向上させることが示された。
検出器キューを組み込むことで、データセットやメトリクス間でのSAmuraiのゼロショットのパフォーマンスよりも一貫した利得が得られる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:27:05 GMT)
THaLLE-ThaiLLM: Domain-Specialized Small LLMs for Finance and Thai -- Technical Report [3.2] タイのLLMイニシアチブは、オープンLLMにおけるタイ語の能力を強化することを目的としている。
我々は,高性能多機能LDMを開発するための資源効率の代替手段として,モデルマージについて検討する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:01:07 GMT)
Advancing Language Models for Code-related Tasks [3.2] 言語モデル(LM)の最近の進歩は、様々なソフトウェア工学のタスクにおいて大きな進歩をもたらした。
しかし、既存のLMはデータ品質、モデルアーキテクチャ、推論能力の制限のために複雑なプログラミングシナリオに苦戦している。
本研究は3つの相補的な方向を通してこれらの課題を体系的に解決する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:48:01 GMT)
SimuAgent: An LLM-Based Simulink Modeling Assistant Enhanced with Reinforcement Learning [3.1] 我々は,Simulinkに適したモデリングおよびシミュレーションエージェントであるSimuAgentを紹介する。
SimuAgentはXMLを簡潔な辞書スタイルのPython表現に置き換え、トークン数を劇的に削減する。
2段階で訓練された軽量な計画実行アーキテクチャは、エージェントに低レベルのツールスキルと高レベルの設計推論の両方を装備する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:10:35 GMT)
Thunder-KoNUBench: A Corpus-Aligned Benchmark for Korean Negation Understanding [3.1] 我々は韓国の否定のコーパスに基づく分析を行い、LLMのパフォーマンスが否定の下で劣化することを示す。
次に,韓国の否定現象の実証的分布を反映した文レベルのベンチマークであるThunder-KoNUBenchを紹介する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:02:52 GMT)
Discrete Fourier Transform-based Point Cloud Compression for Efficient SLAM in Featureless Terrain [2.9] 離散フーリエ変換(DFT)を利用して点雲マップを圧縮する新しい手法を提案する。
提案手法はDEM(Digital Elevation Model)を周波数領域2D画像に変換し,その高周波成分を省略する。
この方法は、点雲を著しく劣化させることなく、データサイズを圧縮するのに有効である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:28:56 GMT)
EdgeLDR: Quaternion Low-Displacement Rank Neural Networks for Edge-Efficient Deep Learning [2.8] EdgeLDRは、四元数チャネルとブロック循環パラメータ構造を組み合わせた四元数ブロック循環型および畳み込み型層のためのフレームワークである。
本稿では、EdgeLDR層の参照実装と、FFTに基づく計算と、四元系循環生成物の自然な空間領域実現の比較を行う。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:04:07 GMT)
Compensation Effect Amplification Control (CEAC): A movement-based approach for coordinated position and velocity control of the elbow of upper-limb prostheses [2.8] 補償効果増幅制御(英: Compensation Effect Amplification Control、CEAC)は、運動に基づく制御パラダイムである。
CEACは、制御遅延を導入しながら、トランクと補綴の自然な結合を増幅する。
その結果,自然腕の動きに匹敵するタスク性能が得られた。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:18:10 GMT)
Driver-Intention Prediction with Deep Learning: Real-Time Brain-to-Vehicle Communication [2.8] 本研究では,脳波(EEG)信号を用いた運転者のハンドル操作意図の予測手法を提案する。
運転シミュレーターは、参加者が様々な運転シナリオで車両を制御することを想像する制御環境を作った。
畳み込みニューラルネットワーク(CNN)は、検出された脳波データを最小の事前処理で分類した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:29:08 GMT)
Data-Driven Terramechanics Approach Towards a Realistic Real-Time Simulator for Lunar Rovers [2.7] 月面の高忠実度シミュレータは、ローバー操作とミッション計画の広範なテストのためのデジタル環境を提供する。
現在のシミュレーターは視覚的リアリズムか物理的精度に重点を置いており、月面条件を包括的に再現する能力を制限する。
この研究は、月面上のローバーのリアルな表現のために、高い視覚的忠実度と現実的な地形相互作用を組み合わせることで、そのギャップに対処する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:23:31 GMT)
Neural-Symbolic Integration with Evolvable Policies [2.7] Neural-Symbolic (NeSy) Artificial Intelligenceは、ニューラルネットワークの学習能力とシンボルシステムの解釈可能な推論を組み合わせるための有望なアプローチとして登場した。
本稿では,非微分不可能なシンボルポリシーとニューラルネットワーク重みの同時学習を実現するフレームワークを提案する。
空のポリシーとランダムなニューラルウェイトから始まるNeSyシステムは、隠れた非微分可能なターゲットポリシーをうまく近似できることを実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:29:49 GMT)
Skeletonization-Based Adversarial Perturbations on Large Vision Language Model's Mathematical Text Recognition [2.7] 本研究は, 新たな敵攻撃手法を導入することにより, 基礎モデルの視覚的能力と限界について検討する。
本手法は,テキストを含む画像,特に数式画像を対象としている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:15:27 GMT)
VERSE: Visual Embedding Reduction and Space Exploration. Clustering-Guided Insights for Training Data Enhancement in Visually-Rich Document Understanding [2.7] VERSEはエラーが発生しやすいクラスタに関連する視覚的特徴を明らかにするのに役立つ。
DonutやIdefics2のようなオンプレミスモデルは、VERSEで最適化されると、GPT-4やPixtralのようなソリューションのパフォーマンスを上回る。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:15:15 GMT)
Multi-turn Jailbreaking Attack in Multi-Modal Large Language Models [2.7] 本稿では,MJAD-MLLMsを提案する。MLLMのマルチターンジェイルブレイク攻撃とマルチLLMベースの防御手法を総合的に解析するフレームワークである。
我々は,マルチターンプロンプト下でMLLMの脆弱性を悪用するために,新しいマルチターンジェイルブレイク攻撃を導入する。
第2に,MLLMにおける脱獄攻撃を効果的に軽減するために,FragGuardと呼ばれるフラグメント最適化およびマルチLLM防御機構を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:37:22 GMT)
When More Words Say Less: Decoupling Length and Specificity in Image Description Evaluation [2.7] 我々は、記述は簡潔で情報に密接であり、あるいは長くて空白であると主張する。
情報内容が変化しながら長さを制御できるデータセットを構築した。
長さの制御だけでは特異性の違いは説明できない。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:28:08 GMT)
Encoding complex-balanced thermalization in quantum circuits [2.7] 本稿では,量子回路プラットフォーム上でのマルコフ過程による複素平衡熱化を効果的に実装するためのプロトコルを提案する。
このプラットフォームの2つの応用として、時間的に相関した2色放射と、リウヴィリアの例外点が有限温度での量子同期を保護していることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:58:38 GMT)
Design and Development of Modular Limbs for Reconfigurable Robots on the Moon [2.6] 4-DOFロボットは、異なる環境やタスクへの適応を可能にするために、さまざまな構成と車輪モジュールを接続するように設計されている。
このようなモジュラーロボットは、リソースが制約された宇宙ミッションに柔軟性と汎用性を加える。
本稿では,ハードウェアの実装,モジュールの機械的設計,およびそれらを制御・コーディネートするためのソフトウェアアーキテクチャ全般について述べる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:15:31 GMT)
Coding the Visual World: From Image to Simulation Using Vision Language Models [2.6] 本研究では,視覚言語モデル(VLM)による画像内のシステム認識とシミュレートの能力について検討する。
VLMは現実世界のシステムの自然なイメージを与えられ、システムを記述し、それをシミュレートして生成するコードを書く。
このアプローチは、物理的システム(波、光、雲)から植生、都市、材料、地質形成まで、様々な複雑な創発システムでテストされている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:49:05 GMT)
Scaling Behavior Cloning Improves Causal Reasoning: An Open Model for Real-Time Video Game Playing [2.6] 私たちは、すべてのデータ(高品質な人間のゲームプレイ8300時間以上)、トレーニングと推論コード、オープンライセンス下で事前訓練されたチェックポイントをリリースします。
我々の最良のモデルは、人間のプレイと競合するレベルにおいて、様々な3Dビデオゲームをプレイできることを示します。
まず,ある種の因果推論において,トレーニングデータの量とネットワーク深度の両方を増大させることで,より因果ポリシーを学習できる,単純な玩具問題を示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:06:17 GMT)
Learning Dynamics in RL Post-Training for Language Models [2.5] 我々は、教師あり学習において研究されてきたが、RLでは未探索である視点から、RLポストトレーニングの学習ダイナミクスを分析した。
特徴表現の変動性に制限があることから,RL更新がモデル信頼性を体系的に向上させる可能性が示唆された。
これらの知見に感化されて、簡単な2段階学習戦略である分類器第一強化学習(CF-RL)を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:32:15 GMT)
Political Alignment in Large Language Models: A Multidimensional Audit of Psychometric Identity and Behavioral Bias [2.5] 本研究は,26の著名な大言語モデル(LLM)の社会技術監査について述べる。
アライメント信号は、ノイズではなく、一貫したアーキテクチャ特性であるように見える。
モデルは体系的な「中心シフト」を示し、しばしば中立の項目を左派として分類する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:26:15 GMT)
BanglaLorica: Design and Evaluation of a Robust Watermarking Algorithm for Large Language Models in Bangla Text Generation [2.5] 本研究は,最新のテキスト透かし手法の体系的評価を初めて行ったものである。
組込み時間とポストジェネレーション透かしを組み合わせた層状透かし方式を提案する。
本研究は,多言語透かしにおけるロバスト性品質のトレードオフを定量化し,実践的,トレーニング不要なソリューションとして層状透かしを確立した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:01:59 GMT)
A Gap Between Decision Trees and Neural Networks [2.4] ここでは、解釈可能性の概念として用いられる決定境界の幾何学的単純さが、浅いニューラルネットワークによる軸整列決定木の正確な近似と矛盾する場合について検討する。
分類するために、有限$mathrmRmathrmTV$で滑らかな障壁スコア$S_A$を構築し、その固定しきい値$=1$がボックスを正確に回復する。
長方形の合成結合の実験は、結果として生じる精度-複雑さのトレードオフを示している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:31:51 GMT)
Zero Wrench Control via Wrench Disturbance Observer for Learning-free Peg-in-hole Assembly [2.4] ダイナミックレンチ外乱オブザーバ(DW-DOB)は、接触リッチな操作において高感度なゼロレンチ制御を実現するように設計されている。
タスク空間慣性を観測者の名目モデルに埋め込むことで、DW-DOBは固有の動的反応を真の外部レンチからきれいに分離する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:29:21 GMT)
Autonomous Agents on Blockchains: Standards, Execution Models, and Trust Boundaries [2.3] エージェントAIシステムとパブリックブロックチェーンは、値転送、アクセス制御、検証可能な状態遷移のためのプログラム可能な基板へと進化してきた。
標準で相互運用性があり、セキュアなインターフェースを設計することで、エージェントはオンチェーンの状態を観察し、トランザクションの意図を定式化し、ユーザやプロトコル、組織を受け入れ難いセキュリティ、ガバナンス、経済リスクに晒すことなく実行を承認することができる。
この調査は、3000以上のレコードの最初のプールから317の関連する著作を識別し、体系的な文献レビューを通じてエージェント-ブロックチェーンの相互運用性の新興の展望を体系化する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:29:26 GMT)
Extreme-value forest fire prediction A study of the Loss Function in an Ordinality Scheme [2.2] 本報告では,フランスにおける運用上の意思決定と直接一致した山火事の重症度を予測するための,最初の規則分類フレームワークについて紹介する。
本研究では,損失関数設計が,希少かつ重要な高重度火災発生を予測するニューラルネットワークの能力に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:01:17 GMT)
From Understanding to Engagement: Personalized pharmacy Video Clips via Vision Language Models (VLMs) [2.1] ビジョン言語モデル(VLM)は、医薬品産業のデジタルトランスフォーメーションに革命をもたらす。
本稿では,音声言語モデル(ALM)と視覚言語モデル(VLM)を統合し,ハイライトクリップを生成するドメイン適応ビデオクリップ生成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:02:56 GMT)
Hán Dān Xué Bù (Mimicry) or Qīng Chū Yú Lán (Mastery)? A Cognitive Perspective on Reasoning Distillation in Large Language Models [2.1] 本研究は,SFT(Supervised Fine-Tuning)による追跡情報を模倣する学習モデルが,この認知構造を伝達できないことを示す。
分析の結果,SFTは,教師の動的資源配分政策を内部化せずに,言語的推論(動詞)の形式を儀礼的に再現する「カルゴカルト」効果を誘導することが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:27:03 GMT)
Scaling Vision Language Models for Pharmaceutical Long Form Video Reasoning on Industrial GenAI Platform [2.0] 視覚言語モデル (VLM) はマルチモーダル推論タスクにおいて高い性能を示した。
医薬コンテンツ理解のような産業環境では、実践者は厳格なGPU、レイテンシ、コスト制約の下でロングフォームビデオを処理する必要がある。
20万以上のPDF、25,326の動画、888の多言語音声ファイルを20言語以上で処理する産業用GenAIフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:42:17 GMT)
MQ-GNN: A Multi-Queue Pipelined Architecture for Scalable and Efficient GNN Training [2.0] MQ-GNNは、GNNトレーニングステージをインターリーブし、リソース利用を最適化することで、トレーニング効率を最大化するマルチキューパイプラインフレームワークである。
最大で大胆な$bm4.6のトレーニング時間、30%のGPU使用率向上を実現し、競争精度を維持している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:19:47 GMT)
Generalized Canonical Polyadic Tensor Decompositions with General Symmetry [2.0] 一般化CP(GCP)分解は、一般損失関数を許容することによってこのアプローチを一般化する。
我々は、一般的な対称性の形式を可能にする対称GCP(SymGCP)分解を開発する。
合成データと実データの両方について様々な実験を行い,提案したSymGCPアルゴリズムの有用性を実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:27:52 GMT)
A zone-based training approach for last-mile routing using Graph Neural Networks and Pointer Networks [2.0] 最終マイルルーティング問題に対するディープラーニングに基づくアプローチを提案する。
グラフニューラルネットワークエンコーダは、停止間の空間的関係をキャプチャするノード埋め込みを生成する。
ポインタネットワークデコーダは、埋め込みとルートのスタートノードを取り、次のストップをシーケンシャルに選択する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:18:32 GMT)
FedKDX: Federated Learning with Negative Knowledge Distillation for Enhanced Healthcare AI Systems [1.7] FedKDXは、Negative Knowledge Distillation (NKD)を通じて医療AIの限界に対処する学習フレームワークである。
このフレームワークは、従来の知識蒸留、コントラスト学習、NKDを統合し、通信コストを削減しながらプライバシを維持する統一アーキテクチャと統合する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:35:28 GMT)
On the Effect of Cheating in Chess [1.7] ゲーム中に限られた回数を不正にすることで得られる,パフォーマンス向上の可能性を評価する。
アルゴリズムは一般的に使用されるチェスエンジンで開発、テストされる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:18:45 GMT)
Quantum-enhanced long short-term memory with attention for spatial permeability prediction in oilfield reservoirs [1.7] 本研究では,変分量子回路(VQC)をリカレントセルに組み込んだQLSTMAモデルを提案する。
量子絡み合いと重ね合わせの原理を用いることで、QLSTMAは透過性のような複雑な地質パラメータを予測する能力を大幅に改善する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:01:22 GMT)
From Stories to Cities to Games: A Qualitative Evaluation of Behaviour Planning [1.7] 本稿では,行動計画と呼ばれる新しい多様な計画パラダイムを提案する。
3つのケーススタディを提示することにより,実環境における行動計画の有用性を実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:09:43 GMT)
ECLIPSE: An Evolutionary Computation Library for Instrumentation Prototyping in Scientific Engineering [1.7] ECLIPSEは、複雑なドメイン固有のシミュレーションツールと直接インターフェースするために構築された進化的フレームワークである。
ECLIPSEは、進化した3Dアンテナや極低軌道でのドラッグリダクションに最適化された宇宙船など、いくつかの活発な宇宙科学応用を実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:45:11 GMT)
Approximate equivariance via projection-based regularisation [1.6] 非同変モデルは、実行時のパフォーマンスと不完全な対称性のため、再び注目を集めている。
これは、対称性の尊重とデータ分布の適合の間に中間点を打つ、ほぼ同変モデルの開発を動機付けている。
本研究では,空間領域とスペクトル領域の両方において,非等分散ペナルティを正確に,効率的に計算するための数学的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:35:42 GMT)
Quantum Neural Network Training and Inference with Low Resolution Control Electronics [1.5] 量子コンピュータをスケールするには、低温制御エレクトロニクスと量子プロセッサを密に統合する必要がある。
有限DAC解像度制約下で量子ニューラルネットワーク(QNN)のトレーニングと推論について検討する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:37:56 GMT)
Dynamics in Search Engine Query Suggestions for European Politicians [1.5] 欧米の政治家に対してGoogle検索クエリーの提案を体系的に分析する。
質問提案は、政治家の出身国、政治家が超国家的役割を担っている時、および女性政治家にとって、時間とともに安定していないことが判明した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:27:04 GMT)
Holographic codes seen through ZX-calculus [1.5] 我々は、ZX-計算の観点から、ペンタゴンホログラフィック量子誤り訂正符号を再検討する。
基礎となるテンソルをZX-ダイアグラムとして表現することにより、コードの安定化構造をパウリ・ウェブを通して研究する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:00:45 GMT)
Composable simultaneous purification: when all communication scenarios reduce to spatial correlations [1.5] 非シグナリング状態集合体は常に同時に精製される。
我々は、この同時浄化にインスパイアされた結果を、全てのマルチパーティ通信方式に拡張する。
我々の主な貢献は、非シグナリング集合の任意の構成が標準空間量子ベル相関集合から逃れられないことを確立することである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:48:56 GMT)
Training a Custom CNN on Five Heterogeneous Image Datasets [1.5] 本研究では,農業・都市領域にまたがる5つのデータセットを対象としたCNNアーキテクチャの有効性について検討した。
これらのデータセットには、照明の差、解像度、環境の複雑さ、クラス不均衡など、さまざまな課題が導入されている。
我々は、ResNet-18やVGG-16など、確立したディープアーキテクチャとともに、軽量でタスク固有のカスタムCNNを評価し、スクラッチとトランスファーラーニングの両方を用いて訓練した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:44:17 GMT)
3D Conditional Image Synthesis of Left Atrial LGE MRI from Composite Semantic Masks [1.5] 我々は,高忠実度3次元LGEMRIボリュームを3次元条件生成器を用いて合成するパイプラインを開発した。
SPADE-LDMは最もリアルで構造的に正確な画像を生成する。
合成LGE画像で拡張すると、3次元U-NetモデルによるLA空洞分割のためのDiceスコアが改善された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:35:40 GMT)
Large-Scale Continual Scheduling and Execution for Dynamic Distributed Satellite Constellation Observation Allocation [1.3] 衛星への自律的な展開には、効率的な計算と通信が必要である。
動的マルチサテライトコンステレーション観測スケジューリング問題(DCOSP)を提案する。
D-NSS(Dynamic Incremental Neighborhood Search)アルゴリズムも提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 00:10:45 GMT)
Comparison of Maximum Likelihood Classification Before and After Applying Weierstrass Transform [1.3] Weierstrass Transformを適用し,Weierstrass Transformを適用する前に,ML(Maximum Likelihood Classification)の結果を比較する。
その結果,決定空間におけるクラスの平均値の分離が,Weierstrass Transform を用いて最大好奇数(ML)の分類精度を高める主要な要因であることが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:41:07 GMT)
Convergence Rates for Learning Pseudo-Differential Operators [1.2] 楕円型擬微分作用素上での学習を,多スケール空間を持つ無限次元回帰問題として定式化する。
学習した演算子は,数値誤差がその統計的精度と一致する,効率的で安定したガレルキン解法を導出することを示す。
この結果は,演算子学習,データ駆動型解法,ウェーブレット法を科学計算に組み込むことに寄与する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:21:08 GMT)
ProFuse: Efficient Cross-View Context Fusion for Open-Vocabulary 3D Gaussian Splatting [1.1] ProFuseは3Dガウススプラッティングを用いたオープンな3Dシーン理解のための効率的な文脈認識フレームワークである(3DGS)
パイプラインは、直接登録設定内でのクロスビュー一貫性とマスク内凝集を強化する。
ProFuseは1シーンあたり約5分でセマンティックアタッチメントを完了しながら、強力なオープン語彙の3DGS理解を実現する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:20:46 GMT)
DivAS: Interactive 3D Segmentation of NeRFs via Depth-Weighted Voxel Aggregation [1.1] 既存のNeural Radiance Fields(NeRF)のセグメンテーション方法は、しばしば最適化に基づいており、2D基礎モデルのゼロショット能力を犠牲にする、シーンごとの遅いトレーニングを必要としている。
DivASは最適化のない、完全にインタラクティブなフレームワークで、これらの制限に対処しています。
提案手法は,ユーザポイントプロンプトから生成される2次元SAMマスクをNeRFから派生した深度で改良し,幾何学的精度と前景分離を向上する高速GUIベースのワークフローを介して動作する。
私たちのコントリビューションの中核はカスタムカーネルで、これらの洗練されたマルチビューマスクを統合された3Dボクセルグリッドに集約します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:53:04 GMT)
Higher-Order Knowledge Representations for Agentic Scientific Reasoning [1.1] 本稿では,多義性関係を忠実にエンコードするハイパーグラフに基づく知識表現を構築する手法を提案する。
バイオコンポジット足場上の1,100の写本のコーパスに適用し、161,172個のノードと320,201個のハイパーエッジからなるグローバルなハイパーグラフを構築した。
さらに,ハイパーグラフツールを用いたエージェントシステム,特にノード間制約を用いて,意味論的に離れた概念をブリッジできることを実証した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:25:37 GMT)
Code-Mix Sentiment Analysis on Hinglish Tweets [1.1] インドにおけるブランド監視は、ヒングリッシュの台頭によってますます困難になっている。
従来の自然言語処理モデルは、このコード混在言語の構文的および意味論的複雑さを解釈するのに失敗することが多い。
本稿では,Hinglish つぶやきに特化して設計された,高性能な感情分類フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:39:26 GMT)
Imitation Learning for Combinatorial Optimisation under Uncertainty [1.1] 本稿では,不確実性の下でのIL最適化の専門家の系統分類について紹介する。
専門家は, 筋力, 決定性, フル情報, 2段階, 多段階の定式化, 最適性のレベル, タスク最適, 近似的エキスパートの識別, 学習者とのインタラクションモード, ワンショットの監督から反復的, インタラクティブなスキームまで, の3つの次元に沿って分類される。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:16:25 GMT)
HMVI: Unifying Heterogeneous Attributes with Natural Neighbors for Missing Value Inference [1.1] 現在の計算法は、不均一な特徴間の重要な相互依存性を見越して、数値的および分類的特性を独立に扱う。
統一されたフレームワーク内で、クロスタイプな機能依存を明示的にモデル化する新しい計算手法を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:18:36 GMT)
Integrating Distribution Matching into Semi-Supervised Contrastive Learning for Labeled and Unlabeled Data [1.0] 半教師付きコントラスト学習(SSL)は、少量のラベル付きデータと大量のラベル付きデータとが共存するシナリオにおいて非常に関係がある。
本研究の目的は,ラベル付きとラベルなしの機能埋め込みの分散マッチングを組み込むことにより,擬似ラベルベースのSSLを強化することである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:32:12 GMT)
Improving Semi-Supervised Contrastive Learning via Entropy-Weighted Confidence Integration of Anchor-Positive Pairs [1.0] 予測確率分布のエントロピーに基づいて,各試料の信頼度を推定する新しい損失関数を提案する。
実験結果から,提案手法は分類精度を向上し,低ラベル条件下でもより安定した学習性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:34:08 GMT)
Categorical Belief Propagation: Sheaf-Theoretic Inference via Descent and Holonomy [1.0] 因子グラフ上での信念伝播のための分類的基盤を開発する。
メッセージパッシングは、分極因子グラフ上のGrothendieckフィブレーション (int to catFG_) を用いて定式化される。
本稿では,因子神経のホロノミーによる降下障害検出アルゴリズムであるHATCCを紹介する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 00:03:11 GMT)
Personalized Model-Based Design of Human Centric AI enabled CPS for Long term usage [1.0] 人間の中心的なクリティカルシステムは、センサーが収集したデータから知識を抽出するために、人工知能がますます関与している。
例えば、医療監視と制御システム、ジェスチャーに基づく人間のコンピュータインタラクションシステム、自動運転車などがある。
このようなAIを有効化しているアプリケーションの長期的な運用は、その運用が不確実である可能性のあるケースにそれらを公開することができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:17:59 GMT)
Detection of Deployment Operational Deviations for Safety and Security of AI-Enabled Human-Centric Cyber Physical Systems [1.0] 人間中心のサイバー物理システムは、センサーが収集したデータから知識を抽出する人工知能にますます関与している。
例えば、医療監視や制御システム、自動運転車などがある。
本稿では,これらのシステムを未知条件下で動作させる動作偏差について論じる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:23:58 GMT)
TCAndon-Router: Adaptive Reasoning Router for Multi-Agent Collaboration [1.0] マルチエージェントシステム(MAS)は、高性能なインテリジェントアプリケーションを構築するための強力なパラダイムとなっている。
これらのシステム内では、特定のクエリを処理する専門家エージェントを決定するルータが、全体的なパフォーマンスにおいて重要な役割を果たす。
これらの課題に対処するため,マルチエージェント協調のための適応推論ルータTCAndon-TCARを提案する。
公開データセットと実際のエンタープライズデータの実験は、TARがルーティングの正確性を大幅に改善し、ルーティングの競合を低減し、あいまいなシナリオで堅牢であることを示している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:17:33 GMT)
Quantum Secure Biometric Authentication in Decentralised Systems [0.9] 中央集権されたアーチテクチュアは、機密データの集約によってプライバシーと懐疑的な問題を引き起こす。
本研究は, 量子セキュアな生体認証システムのための通信プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:42:18 GMT)
Web Retrieval-Aware Chunking (W-RAC) for Efficient and Cost-Effective Retrieval-Augmented Generation Systems [0.9] Web Retrieval-Aware Chunking (W-RAC)は、Webベースのドキュメントに特化して設計された、コスト効率の高いチャンキングフレームワークである。
W-RACは、解析されたWebコンテンツを構造化されたID対応ユニットとして表現することで、セマンティックチャンク計画からのテキスト抽出を分離する。
これによりトークンの使用が大幅に減少し、幻覚リスクを排除し、システムオブザーバビリティが向上する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:41:59 GMT)
Vibe Coding an LLM-powered Theorem Prover [0.9] イザベルム(Isabellm)は、イザベル/HOLのLLMによる定理証明である。
コンシューマグレードコンピュータで動作するように設計されている。
最先端のLLMでさえ、意図した補充と修復のメカニズムを確実に実装するのに苦労していることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:00:24 GMT)
A Generalized Adaptive Joint Learning Framework for High-Dimensional Time-Varying Models [0.9] 本稿では,機能的変数選択と構造的変化点検出を同時に行うための正規化フレームワークであるAdaptive Joint Learning (AJL)を紹介する。
この分析は、疾患進行の同期相転移を明らかにし、時間変化の予測マーカーの相同的なセットを同定する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:07:49 GMT)
The Kernel Manifold: A Geometric Approach to Gaussian Process Model Selection [0.9] カーネル・オブ・カーネルズ幾何に基づくベイズ最適化フレームワークを提案する。
多次元スケーリング(MDS)埋め込みは、離散カーネルライブラリを連続ユークリッド多様体にマッピングし、滑らかなBOを可能にする。
提案手法は, 合成ベンチマーク, 実世界の時系列データセット, 追加的な製造ケーススタディである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:52:53 GMT)
PACOX: A FPGA-based Pauli Composer Accelerator for Pauli String Computation [0.8] パウリ弦はハイブリッド量子古典アルゴリズムにおける計算プリミティブである。
PACOXは、パウリ弦のためのFPGAベースのアクセラレーターである。
実験によると、PACOXは最先端のCPUベースの手法と比較して最大100倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:04:57 GMT)
Unitary fault-tolerant encoding of Pauli states in surface codes [0.8] 表面符号におけるパウリ固有状態を作成するための一元的かつスケーラブルで、距離保存可能な符号化方式を提案する。
我々の研究は、表面コード状態の計測ベースとユニタリエンコーディングのギャップを埋める。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:00:25 GMT)
A Longitudinal Analysis of Gamification in Untappd: Ethical Reflections on a Social Drinking Application [0.8] 本稿では,バッジ,ストリーク,ソーシャルシェアリングを通じてビール消費をゲーミフィケーションするソーシャル飲料アプリケーションであるUntappdについて,縦断的倫理分析を行った。
従来の倫理理論とソフトウェアエンジニアリングの実践的フレームワークに基づいて、バッジの5つのカテゴリと、それらのユーザの自律性と幸福に対する影響を分析します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:22:47 GMT)
LLMs-Integrated Automatic Hate Speech Recognition Using Controllable Text Generation Models [0.8] 本稿では,大規模言語モデル(LLM)を用いたヘイトスピーチの自動音声認識モデルを提案する。
提案手法は,ALSモデルのエンコーダとLLMのデコーダを統合し,同時転写および検閲処理を可能にする。
実験の結果,ヘイト関連単語のマスキング精度は58.6%であった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:03:48 GMT)
Token Maturation: Autoregressive Language Generation via Continuous Token Dynamics [0.7] 本稿では,複数の更新ステップにまたがる連続ベクトルとしてトークンが表現される言語生成の連続的自己回帰的定式化を導入する。
この成熟過程だけでは、決定論的復号法(argmax)を用いてコヒーレントで多様なテキストを生成するのに十分であることを示す。
力学や履歴の平滑化のような追加の摂動は自然に組み込むことができるが、モデルが機能するためには必要ではない。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:44:34 GMT)
A Method for Constructing a Digital Transformation Driving Mechanism Based on Semantic Understanding of Large Models [0.7] デジタルトランスフォーメーションの過程では、非構造化データのセマンティック理解が不十分なような問題に直面している。
本研究では,大規模言語モデル(LLM)と知識グラフを組み合わせた手法を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:06:58 GMT)
Supporting Secured Integration of Microarchitectural Defenses [0.7] 本稿では,統合の初期段階において,MDAVの可能性を確認するための2段階の手法を提案する。
我々は,いくつかの最先端防衛システムの実装において,包括的チャネル攻撃が可能であることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:58:30 GMT)
GenAI-DrawIO-Creator: A Framework for Automated Diagram Generation [0.7] GenAI-DrawIO-Creatorは大規模言語モデル(LLM)を利用して図生成と操作を自動化する新しいフレームワークである。
本システムでは、Claude 3.7を統合して、構造化された視覚データを推論し、有効な図表表現を生成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:51:35 GMT)
Mathematical Knowledge Graph-Driven Framework for Equation-Based Predictive and Reliable Additive Manufacturing [0.6] 大規模言語モデル(LLM)を付加生産数理知識グラフ(AM-MKG)と密に統合する方程式中心のフレームワークを提案する。
公式オントロジー内で方程式、変数、仮定、およびそれらの意味関係を明示的に符号化することにより、非構造化文学は機械解釈可能な表現へと変換される。
信頼度を考慮した外挿評価を導入し、外挿距離、統計的安定性、知識グラフに基づく物理的一貫性を統一信頼度スコアに統合する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:38:03 GMT)
The Table of Media Bias Elements: A sentence-level taxonomy of media bias types and propaganda techniques [0.6] 個々の文でパーシャル性がどのように表現されるかというアウトレットの立場から焦点を移すことを目的としている。
我々は、メディアバイアスとプロパガンダの微粒で文レベルの分類を導き出すために、密読、学際理論、パイロットアノテーションを反復的に組み合わせている。
その結果、38の初等バイアス型からなる2階層のスキーマが、6つの機能ファミリーに配置され、「メディアバイアス要素のテーブル」として視覚化される。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:18:55 GMT)
CircuitLM: A Multi-Agent LLM-Aided Design Framework for Generating Circuit Schematics from Natural Language Prompts [0.5] 大型言語モデル(LLM)は、しばしば細かい詳細を幻覚し、電気的制約に違反し、機械で読めない出力を生成する。
ユーザプロンプトを構造化して視覚的に解釈可能なCircuitJSONスキーマに変換する,マルチエージェントLCM支援回路設計パイプラインであるCircuitLMを提案する。
この作業は、自然言語入力をデプロイ可能なハードウェア設計にブリッジし、非専門家による信頼性の高い回路プロトタイピングを可能にする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:18:43 GMT)
Publishing FAIR and Machine-actionable Reviews in Materials Science: The Case for Symbolic Knowledge in Neuro-symbolic Artificial Intelligence [0.5] 本稿では,原子層堆積・エッチング(ALD/E)のケーススタディとして,レビューテーブルをFAIRとして公開する。
我々は、キュレートされたシンボル層が、材料科学における信頼できるニューロシンボリックAIのバックボーンのままであるべきだと論じる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:56:17 GMT)
Interactive Distillation for Cooperative Multi-Agent Reinforcement Learning [0.5] HINT (Hierarchical Interactive Teacher-based Transfer) は、MARLのための新しいKDフレームワークである。
階層的RLを活用することで、HINTはスケーラブルでハイパフォーマンスな教師を提供する。
我々は、挑戦的協力領域におけるHINTの評価(例えば、資源配分のためのFireCommander、戦術戦闘のためのMARINE)。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 22:16:43 GMT)
Knowledge-to-Data: LLM-Driven Synthesis of Structured Network Traffic for Testbed-Free IDS Evaluation [0.5] 本稿では,Large Language Models (LLMs) が構造化された合成ネットワークトラフィックデータセットを生成するための制御された知識データエンジンとして機能するかどうかを検討する。
本稿では,プロトコル文書,アタックセマンティクス,および明示的な統計的ルールを組み合わせた手法を提案する。
その結果、明示的な制約の下では、LLM生成データセットは実際のネットワークトラフィックの統計的および構造的特性を正確に近似することができることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:31:33 GMT)
TRec: Egocentric Action Recognition using 2D Point Tracks [0.5] 本稿では,2Dポイントトラックを付加的な動きキューとして活用する,エゴセントリックな行動認識手法を提案する。
我々はCoTrackerを用いて、各ビデオを通してランダムに一組のポイントを追尾し、結果のトラジェクトリをTransformerベースの認識モデルへの入力として使用する。
実験結果から,2Dポイントトラックの統合は,運動情報のないトレーニングモデルと比較して連続的に性能を向上させることが確認された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:30:42 GMT)
Evaluating Human and Machine Confidence in Phishing Email Detection: A Comparative Study [0.5] 本研究では、人間の認識と機械学習モデルがどのように連携し、フィッシングメールと正当性を区別するかを検討する。
その結果,機械学習モデルでは精度が向上するが,信頼性は著しく異なることがわかった。
一方、人間の評価者はより多様な言語記号を使用し、より一貫した信頼を維持する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:30:41 GMT)
CEEMDAN-Based Multiscale CNN for Wind Turbine Gearbox Fault Detection [0.4] 本研究では,風車用ギアボックスの故障検出のためのハイブリッド手法を提案する。
CEEMDANとマルチスケール畳み込みニューラルネットワーク(MSCNN)を組み合わせている。
提案手法は実世界のデータセットに基づいて評価された98.95%のF1スコアを実現する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:55:15 GMT)
TSSR: Two-Stage Swap-Reward-Driven Reinforcement Learning for Character-Level SMILES Generation [0.4] TSSRは文字レベルSMILES生成のためのSwap-Reward駆動の強化学習フレームワークである。
これは、構文を修復するローカルトークンスワップに報酬を与え、無効からパース可能な文字列への遷移を促進する。
スパース端末の目的をより密度が高く、より解釈可能な報酬に変換し、多様性を低下させることなく、構文的および化学的品質の両方を改善する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:35:22 GMT)
Towards Spatio-Temporal Extrapolation of Phase-Field Simulations with Convolution-Only Neural Networks [0.4] 完全に畳み込み、条件付きパラメータ化されたU-Netサロゲートを導入し、空間と時間の両方でトレーニングデータを超えて外挿する。
私たちのフレームワークは最大36,000回のスピードアップも可能で、数週間のシミュレーションの実行時間を数秒に短縮します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:25:14 GMT)
Quantum Elastic Network Models and their Application to Graphene [0.4] 我々はQENM(Quantum Elastic Network Models)を導入し、Babbushらの量子アルゴリズムを利用する(PRX, 2023)。
本稿では, 平面材料の効率的なシミュレーションを実現する方法について述べる。
我々は,初期状態の準備,ハミルトニアンシミュレーション,この物質の測定の正確な複雑さを分析し,実世界の2つの応用を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:49:53 GMT)
DynaSTy: A Framework for SpatioTemporal Node Attribute Prediction in Dynamic Graphs [0.4] 動的グラフ上のノードレベルの属性の正確な予測は、ファイナンシャルトラストネットワークから生物学的ネットワークに至るまで、アプリケーションにとって非常に重要である。
本研究では,複数次元の隣接行列の時系列を取り込み,端から端までの動的エッジバイアスエッジ時間モデルを提案する。
我々の手法は根平均正方形誤差(RMSE)と平均絶対誤差(MAE)の強いベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:32:20 GMT)
EARL: Energy-Aware Optimization of Liquid State Machines for Pervasive AI [0.4] 広く普及するAIは、厳しいリソース制約の下で低レイテンシとエネルギー効率の計算を提供するデバイス上での学習システムに依存している。
液体状態機械は、広範およびニューロモルフィックシステムにおける低消費電力時間処理に有望なアプローチを提供する。
本研究は,ベイズ最適化と適応型強化学習に基づく選択ポリシーを統合したエネルギー対応強化学習フレームワークEARLを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:31:11 GMT)
What Students Ask, How a Generative AI Assistant Responds: Exploring Higher Education Students' Dialogues on Learning Analytics Feedback [0.4] 学習分析ダッシュボード(LAD)は、複雑なデータをフィードバックに変換することによって、学習の規制を支援することを目的としている。
学生、特に自己統制学習(SRL)能力の低い学生は、分析フィードバックへの関与と解釈に苦慮することが多い。
我々は10週間の学期で学生とGenAIアシスタントがLADに統合された真正の対話について検討した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:17:44 GMT)
Reverse-engineering NLI: A study of the meta-inferential properties of Natural Language Inference [0.3] 自然言語推論(NLI)は、自然言語理解のための言語モデルを評価する重要なタスクである。
我々は、NLIラベルセットの3つの可能な読み出しを定式化し、それらが持つメタ推論特性を包括的に分析する。
論理的関係の読み出しがデータセットによってエンコードされるという知見を導出する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:58:52 GMT)
Parallelizing Node-Level Explainability in Graph Neural Networks [0.3] グラフニューラルネットワーク(GNN)は、幅広いタスクにおいて顕著なパフォーマンスを示している。
ノード分類において、ノードレベルの説明可能性は非常に時間がかかり、グラフのサイズが大きくなる。
本稿では,グラフ分割によるGNNにおけるノードレベルの説明可能性の並列化手法を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:39:48 GMT)
Temporal Kirkwood-Dirac Quasiprobability Distribution and Unification of Temporal State Formalisms through Temporal Bloch Tomography [0.3] カークウッド・ディラック(KD)準確率分布を任意のマルチ時間量子プロセスに拡張する。
我々は、実成分とともに、左、右、二重の時間準確率を定義する。
これらの量はすべて、干渉測定スキームを通じて実験的にアクセス可能である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:03:02 GMT)
CrackSegFlow: Controllable Flow Matching Synthesis for Generalizable Crack Segmentation with a 50K Image-Mask Benchmark [0.3] マスク・イメージアライメントを施した2次元マスク上でクラック画像を生成する制御可能なフローマッチングフレームワークであるCrackSegFlowを提案する。
クラス条件付きフローマッチングモデルは、クラックカバレッジを制御したマスクを合成し、手動のアノテーションなしでバランスの取れたトポロジ-ディバースデータを可能にする。
CNN-Transformerのバックボーンを持つ5つのデータセットでは、合成されたペアはドメイン内のパフォーマンスを5.37 mIoUと5.13 F1に改善し、ターゲット誘導されたクロスドメイン合成は13.12 mIoUと14.82 F1に向上する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:35:39 GMT)
A Lightweight and Explainable Vision-Language Framework for Crop Disease Visual Question Answering [0.3] 本研究は,葉のイメージから作物や病気を識別する軽量な視覚言語フレームワークを提案する。
視覚表現学習とクロスモーダルアライメントを改善するために、2段階のトレーニング戦略が採用されている。
実験の結果,作物の同定と病原体同定の精度が高かった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:31:09 GMT)
Beyond the "Truth": Investigating Election Rumors on Truth Social During the 2024 Election [0.2] 大規模言語モデル(LLM)は、社会現象を大規模に分析する前例のない機会を提供する。
本稿では,ニッチなAlt-Techプラットフォーム上での選挙噂の大規模データセットをコンパイルし,心理測定におけるLLMの価値を示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:04:07 GMT)
Quantum Wiener architecture for quantum reservoir computing [0.2] この研究は量子貯水池計算、特に量子ワイナーアーキテクチャ(qWiener)に焦点を当てている。
我々は、qWiener系が古典的なWienerアーキテクチャのフェードメモリ特性と普遍性を保っているという最初の厳密な証明を提供する。
我々は、従来の古典的および量子的貯水池計算モデルよりも体系的な性能向上を実証し、標準計算ベンチマークのアーキテクチャを実証的に評価した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:46:22 GMT)
Exploring Student Expectations and Confidence in Learning Analytics [0.2] 学習分析(Learning Analytics, LA)は、近年、多くの教育システムにおいて広く普及しており、学生データを収集し、分析することで、学習とその発生環境を理解し、最適化することができる。
一方、データの収集はプライバシー法に関する需要の増加に対応する必要がある。
本稿では,学習分析質問紙(SELAQ)を用いて,学習分析のためのデータ処理に関する異なる学部の学生の期待と自信を分析する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:27:09 GMT)
Arabic Prompts with English Tools: A Benchmark [0.2] 本稿では,アラビア語における大規模言語モデル(LLM)のツールコールとエージェント機能を評価するための最初のベンチマークを紹介する。
ツールコールの精度は、ツール記述自体がアラビア語であれ英語であれ、平均で5~10%低下する。
これらの重要な課題に光を当てることで、このベンチマークは、アラビア語話者のためのより信頼性が高く言語的に公平なAIエージェントの開発を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:47:09 GMT)
Filtering for Copyright Enforcement in Europe after the Sabam cases [0.2] ベルギーの人権管理団体であるサバムは、インターネットアクセスプロバイダとソーシャルネットワークサイトが著作権を強制するフィルターシステムを設置することを望んだ。
欧州連合司法裁判所は、ソーシャルネットワークサイトとインターネットアクセスプロバイダは、サバムが要求したフィルターシステムをインストールする必要はないと判断した。
この記事は、プライバシと情報の自由にはほとんど報われていない、と論じている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:55:26 GMT)
Automatic Classifiers Underdetect Emotions Expressed by Men [0.2] 感情検出における性別バイアスを調査するために、100万以上の自己注釈付き投稿のユニークな大規模データセットを使用します。
男性によって書かれたテキストのエラー率は、女性によって書かれたテキストよりも一貫して高いことがわかりました。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:52:17 GMT)
Interacting electrons in silicon quantum interconnects [0.2] シリコン量子処理ユニット間のコヒーレントな相互接続は、スケーラブルな量子計算と長距離の絡み合いに不可欠である。
我々はSi/SiGeヘテロ構造のシリコン量子井戸に形成された一次元電子チャネルが強いクーロン相互作用を示すことを示す。
我々は、電荷輸送と電荷センシングによるウィグナー-フライデルクロスオーバーの実験的なシグネチャを、ゼロ磁場と高磁場の両方で提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:44:46 GMT)
Glitter: Visualizing Lexical Surprisal for Readability in Administrative Texts [0.2] 本研究では,テキストのエントロピーを計測して可読性を推定する方法について検討する。
本稿では,複数の言語モデルを用いてテキストの情報エントロピーを近似し,結果を視覚化する可視化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 22:27:24 GMT)
Forecasting the U.S. Treasury Yield Curve: A Distributionally Robust Machine Learning Approach [0.1] 配当の不確実性下における米国債利回り曲線の予測について検討する。
予測者は、平均予測誤差を最小化する代わりに、最悪のケース予測損失を最小限に抑える決定ルールを選択する。
本研究では,因子モデルと高次元非パラメトリック機械学習モデルを統合する分散ロバストなアンサンブル予測フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:26:43 GMT)
Formal Safety Guarantees for Autonomous Vehicles using Barrier Certificates [0.1] この研究は、コネクテッド・アンド・オートマチック・ビークルズのための公式に認証された安全フレームワークを開発する。
Barrier(BC)と解釈可能なトラフィック競合メトリクス、特に時間対時間安全メトリクスを統合している。
このアプローチは、解釈可能な安全保証と証明可能な安全保証の両方を提供し、安全な自動運転のための実用的でスケーラブルな戦略を実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:44:13 GMT)
An interpretable data-driven approach to optimizing clinical fall risk assessment [0.1] 我々は,Johns Hopkins Fall Risk Assessment Toolの転倒リスク予測を,データ駆動型モデリングアプローチによる臨床的に有意義な指標と整合させることを目標としている。
我々は,JHFRATスコアの重み付けに制約スコア最適化モデルを用い,その付加的構造と臨床閾値を保存した。
このモデルは現在のJHFRATよりも予測性能が大幅に向上した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:17:31 GMT)
CRANE: Causal Relevance Analysis of Language-Specific Neurons in Multilingual Large Language Models [0.0] 言語能力がニューロンレベルでどのように組織されるかは、いまだに理解されていない。
機能的必要度の観点から言語特異性を再定義する関連性に基づく分析フレームワークであるCRANEを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:21:13 GMT)
When to Act: Calibrated Confidence for Reliable Human Intention Prediction in Assistive Robotics [0.0] 日常生活活動におけるマルチモーダル次行動予測のための校正確率に基づく安全クリティカルトリガーフレームワークを提案する。
ポストホック校正は、予測された信頼性と経験的信頼性を一致させ、精度に影響を与えることなく、およそ1桁の誤校正を減少させる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:35:17 GMT)
When and why non-Hermitian eigenvalues miss eigenstates in topological physics [0.0] 非エルミート系は、エルミート物理学に欠如している基本的なスペクトル二分法を示す。
非エルミート的ハミルトニアンが固有値によって完全に検出されない固有状態をサポートする方法を示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:57:21 GMT)
Virtual temperatures as a key quantifier for passive states in quantum thermodynamic processes [0.0] 偏光理論のレンズによる受動量子状態に対する仮想温度の役割を解析する。
隣接するエネルギーレベルの仮想温度の平均温度は、等エネルギー変換と等エントロピー変換から生じる系の受動的状態を比較するために定義される。
我々は、これらの仮想温度を用いて量子オットーエンジンの中間受動状態を特徴づけ、作業媒体のmin-max仮想温度で表現できるオットー効率の上限を導出する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:04:35 GMT)
Variance-Reduced Diffusion Sampling via Target Score Identity [0.0] クリーンな(ターゲット)スコアが利用可能か,あるいは近似可能な設定において,スコア推定と拡散に基づくサンプリングの分散化について検討した。
我々は、標準の逆時間解法と互換性のあるプラグアンドプレイ非パラメトリックな自己正規化重要度サンプリング推定器を開発した。
PDE-Governed Inverse問題と合成ターゲット実験により, 固定シミュレーション予算に対する試料品質の改善が示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:50:23 GMT)
Unconditionally teleported quantum gates between remote solid-state qubit registers [0.0] 量子処理ノードをフォトニックリンクで接続する量子ネットワークは、分散およびモジュラー量子計算を可能にする。
この枠組みでは、遠隔量子ビット間の量子ゲートを量子テレポーテーションプロトコルを用いて実現することができる。
遠隔ダイヤモンドベースの量子ビットデバイス間の非条件制御NOT量子ゲートを実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:38:08 GMT)
Toward Maturity-Based Certification of Embodied AI: Quantifying Trustworthiness Through Measurement Mechanisms [0.0] 我々は、信頼度評価に固有の多目的トレードオフをナビゲートするには、構造化された評価フレームワーク、定量的評価機構、および方法が必要であると論じる。
本研究では,不確実性を計測機構として用い,非クルード航空機システム(UAS)検出ケーススタディを通じて実現可能性を示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:16:48 GMT)
The unsuitability of existing regulations to reach sustainable AI [0.0] 漸進的な進歩にもかかわらず、現在のアプローチは、AI関連のエネルギー使用、水消費、および物質需要を支える市場の失敗を正すのに不適当である、と我々は主張する。
この分析は、これらの規制のギャップを、学術研究、市民社会の擁護、標準設定、産業イニシアチブのより広いエコシステムの中に位置づけている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:02:51 GMT)
The Role of Quantum in Hybrid Quantum-Classical Neural Networks: A Realistic Assessment [0.0] 量子機械学習は、短期的な量子ハードウェアのための有望なアプリケーションドメインとして登場した。
我々は、ハイブリッド量子古典ニューラルネットワークアーキテクチャにおける量子処理の影響に光を当てることを目指している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:54:44 GMT)
The Ontological Neutrality Theorem: Why Neutral Ontological Substrates Must Be Pre-Causal and Pre-Normative [0.0] 現代のデータシステムは、永続的な法的、政治的、分析的な意見の相違を越えて、説明責任をサポートしなければならない。
中立性は、非コミットと非互換な拡張の下での安定性と理解されており、因果的あるいは規範的コミットメントを含むこととは相容れない。
中立な存在論的基質は、アイデンティティと永続性条件とともに、実体を表す、前因果関係と先因果関係でなければならない。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:36:13 GMT)
The Minary Primitive of Computational Autopoiesis [0.0] Minaryは、最初の公式に証明可能なオートポエティックプリミティブの候補として設計された計算フレームワークである。
与えられた意味的次元の活性化を条件とした正規化コンセンサスの平均と分散に関する正確な公式を導出する。
私たちは、Minaryは組織的にクローズドだが、MaturanaとVarelaの意味で運用的にオープンである、と論じています。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:12:04 GMT)
The Geometry of the Pivot: A Note on Lazy Pivoted Cholesky and Farthest Point Sampling [0.0] Pivoted Cholesky分解はこのタスクの標準ツールである。
再現ケルネルヒルベルト空間におけるアルゴリズムの幾何学的解釈を解明する。
我々は,理論と実践のギャップを埋めるために,簡潔な導出と最小限のPython実装を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:49:45 GMT)
Tape: A Cellular Automata Benchmark for Evaluating Rule-Shift Generalization in Reinforcement Learning [0.0] 本稿では,遅延ルールシフト下でのOOD障害の分離を目的とした強化学習ベンチマークであるTapeを提案する。
我々は、(i)標準化されたOODプロトコル、(ii)統計報告要件、(iii)エントロピー還元と条件付き相互情報を結ぶ情報理論のアイデンティティを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:05:42 GMT)
Stock Market Price Prediction using Neural Prophet with Deep Neural Network [0.0] The Neural Prophet with a Deep Neural Network (NP-DNN) is proposed to predict Stock market price。
提案されたNP-DNNモデルは、他のアプローチと比較して99.21%の精度を達成した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:24:22 GMT)
Stochastic Deep Learning: A Probabilistic Framework for Modeling Uncertainty in Structured Temporal Data [0.0] 構造化データと時間的データを含む機械学習アプリケーションにおける不確実性を改善するために、微分方程式(SDE)を深層生成モデルと統合する新しいフレームワークを提案する。
このアプローチはLatent Differential Inference (SLDI)と呼ばれ、変分オートエンコーダの潜時空間にIt SDEを埋め込む。
SDEのドリフトと拡散の項はニューラルネットワークによってパラメータ化され、データ駆動推論と古典的時系列モデルにより不規則なサンプリングと複雑な動的構造を扱うことができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:53:59 GMT)
Smart IoT-Based Wearable Device for Detection and Monitoring of Common Cow Diseases Using a Novel Machine Learning Technique [0.0] この研究は、牛の日常活動と健康状態を監視するために設計されたIoT対応サイバー物理システムフレームワークを提案する。
収集された生理的および行動学的データを用いて,牛の共通疾患の診断に新しい機械学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:29:11 GMT)
Simulation of noisy quantum circuits using frame representations [0.0] フレーム理論に基づく量子回路の古典的シミュレーションのための統一的な枠組みを導入する。
このフレームワーク内では、シミュレーションアルゴリズムの計算コストは、関連する準確率分布の1ノルムによって決定される。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:20:49 GMT)
Signatures of Spin Coherence in Chiral Coupled Quantum Dots [0.0] キラル誘起スピン選択性(CISS)は、磁気材料を持たないキラル分子系における電荷キャリアのスピン選択性を可能にする。
我々は, キラルリンカーで結合した多層量子ドット集合体におけるスピン依存性の発光ダイナミクスをその場で予測する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:33:46 GMT)
Semantically Orthogonal Framework for Citation Classification: Disentangling Intent and Content [0.0] SOFTは2次元のSemantically Orthogonal Frameworkであり、引用意図と引用内容のタイプを明確に分離する。
我々は、SOFTを用いてACL-ARCデータセットを再注釈し、ACT2からサンプリングされたクロスディシプリナテストセットをリリースする。
結果は、デジタルライブラリや学術的なコミュニケーション基盤の明確性、一貫性、一般化性を改善した、明確で再利用可能なアノテーション標準としてのSOFTの価値を確認した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:48:36 GMT)
Scalable Suppression of XY Crosstalk by Pulse-Level Control in Superconducting Quantum Processors [0.0] 超伝導量子プロセッサでは、高性能量子制御がますます重要になっている。
特に、近隣の量子ビット間の不要な相互作用は、運用性能を制限するクロストークエラーを引き起こす。
本稿では,XYクロストーク誤りを抑制するためのスケーラブルなパルスレベル制御フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:56:03 GMT)
SampoNLP: A Self-Referential Toolkit for Morphological Analysis of Subword Tokenizers [0.0] 形態素レキシコン生成のためのコーパスフリーツールキットであるSampoNLPを紹介する。
フィンランド,ハンガリー,エストニアのSampoNLPが生成する高純度レキシコンを用いて,BPEトークンの系統的評価を行う。
モーフィムカバレッジとオーバースプリッティングのトレードオフをナビゲートする統合されたメトリクス、IPS(Integrated Performance Score)を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:05:51 GMT)
Safe Continual Reinforcement Learning Methods for Nonstationary Environments. Towards a Survey of the State of the Art [0.0] この研究は、継続的な安全なオンライン強化学習(COSRL)手法に関する最先端の調査を提供する。
オンラインの安全強化学習アルゴリズム構築における理論的側面、課題、オープンな疑問について論じる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:42:56 GMT)
Robust Reasoning as a Symmetry-Protected Topological Phase [0.0] 大規模言語モデルは意味的ノイズによって引き起こされる「幻覚」論理的矛盾に悩まされる。
因果秩序が自然対称性の破れに弱い「計量相」で機能することが提案される。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:58:34 GMT)
Remarkable Dates and Place: One Hundred Years Ago [0.0] アーウィン・シュルディンガーは1925年クリスマスにスイスの古典的なアルプスで休暇を過ごし、波動方程式「SchrQMI」を発見した。
ちょうど1世紀前、スイスのアロサで波動量子力学が誕生した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:33:11 GMT)
Regularization from Superpositions of Time Evolutions [0.0] 短時間の近似と経路積分は高エネルギーあるいは大面積の寄与によって支配される。
我々は, 干渉によって生じる条件写像として, 密接に関連する滑らかなフィルタが, 連続的に制御され, ポストセレクトされた進化の重ね合わせとして現れることを示した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:54:22 GMT)
Rational Synthesizers or Heuristic Followers? Analyzing LLMs in RAG-based Question-Answering [0.0] GroupQAは15,058件の多種多様な証拠文書と組み合わせて、1,635件の論争を巻き起こしたデータセットである。
グループレベルのエビデンス・アグリゲーション・ダイナミクスを制御実験により特徴づける。
グループベースの回答に対する LLM の説明は不信であることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:54:21 GMT)
Quantenlogische Systeme und Tensorproduktraeume [0.0] ジョージ・マッキーによって提供される量子論理公理系の直感的な構成を示す。
古典力学および量子力学から構成された物理系が、いかに論理的に記述されるべきかを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:28:22 GMT)
Prediction of Fault Slip Tendency in CO${_2}$ Storage using Data-space Inversion [0.0] 本研究では, 圧力, 応力場, ひずみ場, 断層すべり傾向を予測するために, 可変オートエンコーダ (VAE) ベースのデータ空間インバージョン (DSI) フレームワークを実装した。
DSI-VAEフレームワークは, 圧力, ひずみ, 応力場および断層すべり傾向の正確な予測を行う。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 23:41:04 GMT)
Prediction of Cellular Malignancy Using Electrical Impedance Signatures and Supervised Machine Learning [0.0] この研究は33の学術論文を体系的にレビューし、定量的な生体電気パラメータのデータセットをコンパイルした。
ランダムフォレスト(RF)、サポートベクトルマシン(SVM)、K-Nearest Neighbor(KNN)の3つの教師付き機械学習アルゴリズムを実装し調整した。
その結果、ランサムフォレストは最大深度を4と100の推定器で設定した場合、90%の予測精度を達成した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:30:52 GMT)
Phase-Randomized Laser Pulse Generation at 10 GHz for Quantum Photonic Applications [0.0] 本稿では,レーザーとともに自然発光の外部源を用いることにより,その限界を克服する手法を提案する。
提案手法は, 干渉位相相関を効果的に除去し, 10GHzの繰り返し速度で位相ランダム化を復元することを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:45:16 GMT)
Path Integral Lindblad Dynamics in Presence of Time-Dependent Fields [0.0] 我々は、PILDの代替的でシンプルな定式化を与え、この制限を越えられるようにします。
非マルコフメモリカーネルを直接評価する必要はなく、したがってFloquetシステムにも適用することができる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 05:17:59 GMT)
Paradoxical noise preference in RNNs [0.0] 生物学的ニューラルネットワークをモデル化するために使用されるリカレントニューラルネットワーク(RNN)では、通常、トレーニング中にノイズを導入し、生物学的多様性をエミュレートし、学習を規則化する。
連続時間リカレントニューラルネットワーク(CTRNN)は、非ゼロノイズレベル、特に、トレーニング中に使用されるものと同じレベルにおいて、よく機能する。
このノイズ嗜好は、ニューラルアクティベーション関数内でノイズが注入されたときに生じ、アクティベーション関数の外でノイズが注入された訓練されたネットワークは、ゼロノイズで最もよく機能する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:11:51 GMT)
Optimizing Path Planning using Deep Reinforcement Learning for UGVs in Precision Agriculture [0.0] 本研究では, 高精度農業における無人地上車両(UGV)の経路計画を, 連続行動空間における深部強化学習(DRL)技術を用いて最適化することに焦点を当てた。
ROSとGazeboを用いた3次元環境下での実験は、動的農業シナリオのナビゲートにおける連続DRLアルゴリズムの有効性を実証した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:28:11 GMT)
Ontology Neural Networks for Topologically Conditioned Constraint Satisfaction [0.0] トポロジカルコンディショニングと勾配安定化機構を統合した拡張フレームワークを提案する。
このフレームワークは、シード非依存の収束と、20ノード問題までの優雅なスケーリング挙動を示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:01:52 GMT)
On the Transition to an Auction-based Intelligent Parking Assignment System [0.0] オークションベースの駐車割り当ては、駐車のためのクルーズを緩和し、市場主導で需要に反応する駐車価格を設定する。
我々は実験を参加者と非参加者の比率の異なるEclipse SUMOシミュレーションとして設定した。
その結果, オークションベースのシステムでは, 浸透率の増加とともに交通の流れが向上することがわかった。
しかし、このシステムには料金が伴い、参加者の駐車費も増大する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 23:37:09 GMT)
On the Definition and Detection of Cherry-Picking in Counterfactual Explanations [0.0] 正当性説明のためのチェリーピッキングを正式に定義する。
実際に検出するのは極めて限られていることを示す。
我々は、安全対策は、ポストホック検出に対する優先順位、標準化、手続き上の制約を優先すべきであると主張している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:29:24 GMT)
OVO Fintech Application Analysis using The System Usability Scale [0.0] 本研究は,システムユーザビリティ尺度(System Usability Scale, SUS)を用いて,OVOアプリケーションのユーザビリティを評価する。
評価の結果、OVOアプリケーションは高いユーザビリティを持ち、SUSスコアは87.05またはグレードAであり、優れた評価を示していることが示された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:15:23 GMT)
Noise tailoring for error mitigation and for diagnozing digital quantum computers [0.0] ノイズテーラーリング(NT) - 統計的サンプリングにより、2量子ゲートに関連するノイズの構造を変更するために設計された革新的な戦略。
プロトコルの動作の古典的エミュレーションを行い、NT+EMの結果はEM単独の結果の最大5倍の精度が得られることを示した。
本稿では,ハードウェア開発を通知するために,量子コンピュータ上でそのようなエラーソースを特徴付けるNT手法を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:09:00 GMT)
Multi-Disciplinary Dataset Discovery from Citation-Verified Literature Contexts [0.0] 本稿では,学術論文の引用文脈からデータセットを抽出する文献駆動フレームワークを提案する。
提案手法は,大規模引用コンテキスト抽出,スキーマ誘導型データセット認識,証明保存エンティティ解決を併用する。
コード、評価データセット、結果はGitHubで公開しています。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:46:06 GMT)
Model of Spatial Human-Agent Interaction with Consideration for Others [0.0] コミュニケーションロボットは、公共空間にいる人々との会話を開始する必要があることが多い。
これら2つの要件に対処するためには、エージェントは行動に基づいて他人のコミュニケーション欲求を見積もる必要がある。
本研究では,他者を考慮した空間相互作用モデルを構築する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:05:18 GMT)
Measuring and Fostering Peace through Machine Learning and Artificial Intelligence [0.0] 私たちは、機械学習と人工知能を使って、ニュースやソーシャルメディアから国の平和レベルを測定しました。
ニュースメディアでは、オンラインニュースソースのテキスト埋め込みから、ニューラルネットワークを使用して平和のレベルを測定しました。
私たちはChromeエクステンションであるMirrorMirrorを開発し、テストしました。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:57:01 GMT)
Machine learning assisted state prediction of misspecified linear dynamical system via modal reduction [0.0] 固定されたパラメータを持つパラメトリックモデルは、幾何学、物質的挙動、減衰、境界条件の単純化による重要な物理的効果を省略することが多い。
本研究は、高次元有限要素に基づく構造力学系におけるMFE推定と補正のための包括的枠組みを導入する。
計算的トラクタビリティを確保するため、FEシステムは縮小されたモーダルベースに投影され、メッシュ不変のニューラルネットワークは、モーダル状態を不一致推定にマッピングする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:14:27 GMT)
MLLM-VADStory: Domain Knowledge-Driven Multimodal LLMs for Video Ad Storyline Insights [0.0] 本稿では,大規模ビデオ広告のストーリーライン理解のための洞察を定量化・生成するための,ドメイン知識誘導型マルチモーダル言語モデル(MLLM)フレームワークを提案する。
MLLM-VADStoryは、広告を機能単位に分割し、新しい広告固有の機能的役割分類を用いて各ユニットの機能を分類し、その後、データ駆動のストーリーライン構造を回復するために、広告全体で機能的シーケンスを集約する。
このフレームワークを4つの産業のサブバーティカルで5000万のソーシャルメディアビデオ広告に適用すると、ストーリーベースのクリエイティブがビデオの保持を改善することが分かる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:00:35 GMT)
Low-loss Material for Infrared Protection of Cryogenic Quantum Applications [0.0] 低温量子アプリケーションの脆弱な量子状態は、高温のステージやその他の源によって引き起こされる赤外線からの保護を必要とする。
低ギガヘルツ周波数の光子を伝送しながら、光範囲まで効率よく放射を遮断できる材料システムを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:35:45 GMT)
Long-lived state of a helium-like magnesium donor in silicon [0.0] スピントリップ1s(2T2)基の寿命は約20msである長寿命状態が観察された。
温度依存性は、緩和が活性化エネルギー13 meVのオルバッハ機構によって制御されることを示している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:32:35 GMT)
Landau Zener Interaction Enhanced Quantum Sensing in Spin Defects of Hexagonal Boron Nitride [0.0] 六方晶窒化ホウ素(hBN)における負電荷ボロン空孔(V$_textB-$)
量子力学シミュレーションにより、効果的な2状態ランダウ・ツェナーモデルが、緩和を組み込んだ集団反転とパルス長の複雑な関係を捉えていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:15:35 GMT)
Inverting Non-Injective Functions with Twin Neural Network Regression [0.0] 非単射関数の所定の対象変数に対する入力パラメータを求めるフレームワークを提案する。
本手法は,玩具問題とロボットアーム制御を記述した非インジェクティブ関数を反転させることで実証する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 21:04:07 GMT)
Intraday spatiotemporal PV power prediction at national scale using satellite-based solar forecast models [0.0] 本稿では,太陽光発電(PV)電力予測のための新しいフレームワークを提案する。
衛星由来の表面太陽放射(SSI)に対して予測が最初に検証される
さらに、メソスケールのクラウドシステムが、数時間以下の時間帯に、全国的なPV生産をどのように形成するかを、初めて視覚化する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 09:15:14 GMT)
Internal Reasoning vs. External Control: A Thermodynamic Analysis of Sycophancy in Large Language Models [0.0] 大規模言語モデルは、正しさよりも一致性を優先する、梅毒性を示す。
RLHFは正しい回答と自己補正批判のアウトプットを報いる。
代わりに推論プロセスの評価について検討する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:36:19 GMT)
Integrated Framework for Selecting and Enhancing Ancient Marathi Inscription Images from Stone, Metal Plate, and Paper Documents [0.0] 本稿では,バイナライゼーションと補完前処理技術に基づく画像強調手法を提案する。
提案手法は,石碑や金属板,史料など,古代の書体の種類によって評価されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:30:59 GMT)
Increasing the secret key rates and point-to-multipoint extension for experimental coherent-one-way quantum key distribution protocol [0.0] 受信機のデータライン上の2つの検出器の時間ビン情報を組み合わせることで秘密鍵レートを増大させることができることを示す。
我々は、追加の受信モジュールを導入し、ポイントツーマルチポイントCOW QKDプロトコルを実装した。
3人のユーザーは、OPP暗号化に依存して、後処理の秘密鍵を共有している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 03:16:15 GMT)
How Human is AI? Examining the Impact of Emotional Prompts on Artificial and Human and Responsiveness [0.0] 本研究では、人間とAIの相互作用の感情的トーンが、ChatGPTと人間の行動をどのように形成するかを検討する。
参加者に対して,ChatGPTと共同作業しながら,公開応答の執筆と倫理ジレンマへの対処という2つの課題について,感情表現を依頼した。
その結果、参加者が中立的な態度を維持している相互作用と比較して、ChatGPTは参加者が賞賛すると、回答がより良くなることがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:50:00 GMT)
Homeostasis Under Technological Transition: How High-Friction Universities Adapt Through Early Filtering Rather Than Reconfiguration [0.0] 技術的遷移のエンロメント構成への変換は,かなり遅れて起こることを示す。
我々は、これらのパターンを、工学教育を規制する国内規制の制約の中に位置づける。
これらの結果から, 見かけの剛性は異常ではなく, 応答性よりも安定性に最適化されたシステムの予測可能な結果であることが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:16:53 GMT)
Hardy nonlocality for entangled pairs in a four-particle system [0.0] ハーディのパラドックス(英: Hardy's paradox)またはハーディ型非局所性(英: Hardy-type nonlocality)は、不等式を用いることなく、粒子の絡み合った状態の非局所性を調べる方法である。
ハーディの非局所性に関する以前の研究は、主に完全に絡み合ったシステムに焦点を合わせてきたが、他の絡み合いの構成はいまだ研究されていない。
循環交絡構造に適合する量子回路を実装し,シミュレーションにより,相関パターンと関心状態が同定される。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:14:12 GMT)
Graph energy as a measure of community detectability in networks [0.0] PPM と ER ネットワーク間のグラフエネルギーの差は、検出可能性閾値において異なる遷移を持つことを示す。
この結果から,標準グラフ行列は依然として検出不能かつ検出不能なコミュニティでパラメータ領域を分離することができることが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:10:01 GMT)
GPU-Accelerated INT8 Quantization for KV Cache Compression in Large Language Models [0.0] キー値(KV)キャッシュは、大きな言語モデルにおける推論中に重要なメモリボトルネックを示す。
我々は、KVキャッシュ圧縮のためのINT8量子化を実装し、最小の精度で4$times$メモリ削減を実現した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:35:56 GMT)
Fundamental Limitations on the Reliabilities of Power and Work in Quantum Batteries [0.0] 量子電池は、充電と放電の過程で高い電力を約束する。
その実用性と性能は信頼性に大きく依存し、ノイズ-信号比によって定量化される。
並列、集合、ハイブリッドの充電方式におけるトレードオフと制限、およびスケーリングの挙動を分析します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:00:02 GMT)
From compatibility of measurements to exploring Quantum Darwinism on NISQ [0.0] 特定のモデルにおける量子ダーウィンの破れと、それが非古典的な測定統計にどのように変換するかを考察する。
NISQハードウェアの真の量子特性をベンチマークするための効果的なツールを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:04:38 GMT)
From Unstructured Data to Demand Counterfactuals: Theory and Practice [0.0] 差別化された製品に対する需要の実証モデルは、置換パターンを捉えるために低次元の製品表現に依存している。
プロキシが置換を駆動する真の微分の次元を捉えなかった場合、標準推論はバイアスのある反事実をもたらす。
我々は、このバイアスを補正し、幅広い反ファクトのクラスに対して有効な推論を保証する実用的なツールキットを開発する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:55:16 GMT)
Floquet-driven tunneling control in monolayer MoS$_2$ [0.0] モリブデンジスルフィドMoS$のフェルミオンとレーザー場と静電位バリアとの相互作用について検討した。
その結果、伝達確率はスピンアップ電子とスピンダウン電子の両方に対して振動することがわかった。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:18:21 GMT)
Flexible Manufacturing Systems Intralogistics: Dynamic Optimization of AGVs and Tool Sharing Using Coloured-Timed Petri Nets and Actor-Critic RL with Actions Masking [0.0] 本稿では,自動誘導車両(AGV)とツール共有システムの同時統合により,新たな複雑さを取り入れた従来型のジョブショップスケジューリング問題を推し進める。
色付き時間ペトリネット(CTPN)とアクター批判モデルに基づく強化学習(MBRL)を組み合わせた新しいアプローチを提案する。
提案手法は,小規模の公開ベンチマークと,Tallardベンチマークにインスパイアされた大規模ベンチマークを用いて評価した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:37:02 GMT)
FibreCastML: An Open Web Platform for Predicting Electrospun Nanofibre Diameter Distributions [0.0] エレクトロスピニング(Electrospinning)は、組織工学、薬物デリバリー、創傷治療に応用するために、調整可能なマイクロスケールとナノスケールのアーキテクチャを持つ繊維足場を製造するためのスケーラブルな技術である。
機械学習(ML)は、電子スピン化プロセスの最適化をサポートするのに使われてきたが、既存のほとんどのアプローチは、足場性能を規定する全径分布を無視して、繊維径のみを予測する。
本研究はFibreCastMLについて述べる。これはオープンな分布対応MLフレームワークで、日常的に報告される電子スピンリングパラメータから完全なファイバー径スペクトルを予測し、プロセス構造関係に関する解釈可能な洞察を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 12:18:41 GMT)
Extending Delta Debugging Minimization for Spectrum-Based Fault Localization [0.0] DDMIN-LOCは、DDMINプロセス中に生成されたパスとフェールインプットを収集することで制限に対処する。
DDMIN-LOCはバグギープログラムの1つの入力しか必要としないが、文字列入力を受けるプログラムにのみ適用できる。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 07:57:04 GMT)
Exponential capacity scaling of classical GANs compared to hybrid latent style-based quantum GANs [0.0] QGAN(Quantum Generative Adversarial Network)は、量子生成モデリングの主要な候補である。
遅延型QGANは、古典的な変分オートエンコーダを頼りに、入力データを潜時空間に符号化し、画像生成や薬物設計に効率的であることが証明されている。
本研究は,SAT4画像生成に応用したQGANSによるこの利点の総合的研究である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:44:41 GMT)
Evaluative Fingerprints: Stable and Systematic Differences in LLM Evaluator Behavior [0.0] 審査員は一貫性があるが、互いに一致していない。
評価は3,240件を超え、中間合意はほぼゼロに近い。
審査員の平均得点は、審査員の実際の値に該当しない合成判定を生成する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 17:02:22 GMT)
Entanglement negativity for a free scalar chiral current [0.0] 2つの時空次元における自由スカラーキラル流の絡み合い負性について検討する。
還元密度行列の部分的変換モーメントと対数的負性率のモーメントの解析式を求める。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:52:50 GMT)
Ensemble of radiomics and ConvNeXt for breast cancer diagnosis [0.0] 放射線学と深層学習(DL)は、早期がん検出で放射線科医を補助する大きな可能性を示している。
本研究の目的は, マンモグラム検診における放射線, DL, アンサンブル法の性能評価である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:54:24 GMT)
Emission Dynamics of Rydberg Excitons in $\mathbf{\mathrm{Cu_2O}}$: Distinguishing Second Harmonic Generation from Secondary Emission [0.0] ライドバーグ励起子は共鳴2光子励起の下で2つの非常に異なる光学応答をもたらす。
それぞれが$n$、温度、励起力、結晶品質に依存しているかを示す。
この結果は、Rydberg Exitonsからの放射を解釈するための統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:53:30 GMT)
Effects of personality steering on cooperative behavior in Large Language Model agents [0.0] 大規模言語モデル(LLM)におけるパーソナリティステアリングが協調行動に及ぼす影響を,Prisoner's Dilemmaゲームを用いて検討した。
以上の結果から,すべてのモデル間の協力を促進する要因は一致性であり,他のパーソナリティ特性には影響が限られていることが明らかとなった。
これらの結果から,人格管理は決定論的制御機構よりも行動バイアスとして機能することが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 14:23:45 GMT)
Dynamic Inclusion and Bounded Multi-Factor Tilts for Robust Portfolio Construction [0.0] 本稿では,推定誤差,非定常性,現実的な取引制約の下で頑健なポートフォリオ構築フレームワークを提案する。
この手法は、動的資産の適性、決定論的再バランス、および等重量ベースラインに適用された有界多要素傾きを組み合わせたものである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 23:26:58 GMT)
Density Matrix RNN (DM-RNN): A Quantum Information Theoretic Framework for Modeling Musical Context and Polyphony [0.0] 古典的リカレントニューラルネットワーク(RNN)は、音楽の文脈を決定論的隠れ状態ベクトルに要約する。
本稿では、密度行列を用いた新しい理論アーキテクチャである密度行列RNN(DM-RNN)を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:44:04 GMT)
Defocus Aberration Theory Confirms Gaussian Model in Most Imaging Devices [0.0] 本稿では,従来の撮像装置において,デフォーカス演算子がガウスモデルに従属することを確実にするための設定について紹介する。
その結果、平均絶対誤差が最大$(M!A!E)$が1%以下であることを示し、モデルの正確性と信頼性を裏付ける。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:03:13 GMT)
Decision-Aware Trust Signal Alignment for SOC Alert Triage [0.0] 本稿では,SOC警告トリアージの信頼信号対応方式を提案する。
このフレームワークは、調整済みの信頼性、軽量不確実性、そしてコストに敏感な決定しきい値をコヒーレントな決定支持層に組み合わせている。
信頼度が不一致な表示によって偽陰性が大幅に増幅されるのに対し、コスト重み付き損失は決定整合信頼信号を持つモデル間での桁違いに減少することを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:41:54 GMT)
Decentralized Privacy-Preserving Federal Learning of Computer Vision Models on Edge Devices [0.0] 機械学習モデルの協調トレーニングには、機密データやプライベートデータを共有するリスクが伴う。
フェデレーション学習は、クライアントデータを共有することなく、単一のグローバルモデルを集合的にトレーニングする方法を提供する。
分類に用いる畳み込みニューラルネットワークの精度に及ぼす勾配圧縮と勾配雑音の負の効果を解析した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:10:33 GMT)
Cyber Threat Detection and Vulnerability Assessment System using Generative AI and Large Language Model [0.0] サイバー攻撃にはランサムウェア、マルウェア、フィッシング、DoS(DoS)関連の攻撃など様々な脅威が含まれる。
Gene Artificial Intelligence (AI)やSecurity Bidirectional Representations from Transformers (BERT)といった従来のモデルは、サイバー脅威を検出するために実装された。
既存のSecurity BERTモデルは、テキストデータの文脈的理解が限られており、サイバー攻撃の検出にはあまり影響しない。
提案したRoBERTaモデルは,精度(0.99),リコール(0.91),精度(0.89)で既存のBERTモデルよりも優れた結果を得た。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 19:19:54 GMT)
Cutting AI Research Costs: How Task-Aware Compression Makes Large Language Model Agents Affordable [0.0] 70ビリオンのパラメータモデルを用いた単一の研究セッションは、クラウド料金が約127ドルである。
我々はこの問題に正面から取り組むためにAgentCompressを開発した。
私たちのシステムは小さなニューラルネットワークを使って、各タスクがどれだけ難しいかを測定します。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:13:46 GMT)
CurricuLLM: Designing Personalized and Workforce-Aligned Cybersecurity Curricula Using Fine-Tuned LLMs [0.0] CurricuLLMは、サイバーセキュリティカリキュラムの自動設計と分析のためのフレームワークである。
提案手法は,(1)個別のカリキュラム設計の自動化,(2)産業要求に沿ったデータ駆動パイプライン,(3)カリキュラム開発における微調整 LLM の活用のための総合的な方法論,の3つの重要な貢献を提供する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:43:15 GMT)
Conversational AI for Rapid Scientific Prototyping: A Case Study on ESA's ELOPE Competition [0.0] 本稿では,ESAのELOPEコンペティションにおける高速プロトタイピングにChatGPTを用いたケーススタディを提案する。
遅れて加入したにもかかわらず、スコアは0.01282で2位に終わった。
ChatGPTは実行可能なコードだけでなく、アルゴリズムによる推論、データハンドリングルーチン、方法論的な提案にも貢献した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:17:50 GMT)
Construction of asymptotic quantum many-body scar states in the SU($N$) Hubbard model [0.0] 親ハミルトニアンがスピン1/2の場合ではなくSU($N$)強磁性ハイゼンベルクモデルとなることを示す。
我々の結果は、スピン-1/2を超えてAQMBSの親ハミルトニアン族を拡張し、SU($N$)対称系の解析的、低絡み合い励起を与える。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:21:05 GMT)
Concept Tokens: Learning Behavioral Embeddings Through Concept Definitions [0.0] 本研究では,LLMに新たな特別なトークンを追加する軽量な方法であるConcept Tokensを提案し,その埋め込みを目標概念の自然言語定義からのみ学習する。
概念トークンは,HotpotQA上でのクローズドブック質問応答,第二言語教育のための教育的フィードバック戦略の再放送,エッフェル塔と架空の「オーストラルタワー」との質的研究の3つの設定で評価する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 00:49:48 GMT)
Chain-of-Sanitized-Thoughts: Plugging PII Leakage in CoT of Large Reasoning Models [0.0] 中間推論は、最終回答が衛生化されても、個人識別可能な情報(PII)をリークすることが多い。
プライバシ優先推論では,機密情報を漏らさずにモデルによる推論を行う。
プライベートCoT推論は、最小限のユーティリティ損失で実現できることを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 16:19:43 GMT)
Cat states and violation of the Bell-CHSH inequality in relativistic Quantum Field Theory [0.0] 右リンドラーウェッジに局在した猫状態を用いて、相対論的スカラー自由量子場理論におけるベル-CHSH不等式の不等式の研究を行う。
2つのコヒーレントな状態の重ね合わせとして、猫の状態は干渉項の存在を許容し、ベル-CHSHの不等式に違反する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:41:06 GMT)
Cascading multi-agent anomaly detection in surveillance systems via vision-language models and embedding-based classification [0.0] この研究は、補完パラダイムをコヒーレントで解釈可能なアーキテクチャに統一するカスケーディングマルチエージェントフレームワークを導入している。
初期モジュールは再構成ゲートフィルタリングとオブジェクトレベルの評価を行い、高レベルの推論エージェントは、意味的に曖昧な事象を解釈するために選択的に呼び出される。
このフレームワークは、早期出力効率、適応型マルチエージェント推論、説明可能な異常属性を組み合わせることで、従来の検出パイプラインを超えて進歩し、スケーラブルなインテリジェントなビジュアル監視のための再現可能でエネルギー効率の良い基盤を確立する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:31:47 GMT)
Cardinality augmented loss functions [0.0] クラス不均衡は、ニューラルネットワークのトレーニングにおいて一般的で悪質な問題である。
現代数学文学における基数様不変量から導かれる基数拡張損失関数を導入する。
マイノリティクラス間での大幅なパフォーマンス改善と、全体的なパフォーマンス指標の改善を観察する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:43:55 GMT)
CAOS: Conformal Aggregation of One-Shot Predictors [0.0] ワンショット予測は、1つのラベル付き例のみを使用して、事前訓練された基礎モデルの新しいタスクへの迅速な適応を可能にする。
標準分割コンフォメーション法は、データ分割と単一の予測器への依存のため、ワンショット設定では非効率である。
本稿では,複数のワンショット予測器を適応的に集約するコンフォーマルフレームワークである1ショット予測器のコンフォーマルアグリゲーション(CAOS)を提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:44:21 GMT)
Bridging Temporal and Textual Modalities: A Multimodal Framework for Automated Cloud Failure Root Cause Analysis [0.0] 本稿では,事前学習した言語モデル埋め込み空間と時系列表現を調和させる診断フレームワークを提案する。
本フレームワークは,複合障害モードを含むシナリオにおいて,48.75%の精度で診断精度を向上する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:20:44 GMT)
Bound state solutions with a linear combination of Yuakawa plus four-parameter diatomic potentials using path integral approach: Thermodynamic properties [0.0] 二つの原子分子ポテンシャル, 湯川と4つのパラメータポテンシャルの線形結合による近似解析的境界状態について検討した。
遠心項を評価するための適切な近似の助けを借りて、境界状態のエネルギースペクトルと正規化波動関数を導出する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:39:30 GMT)
Beyond the imbalance: site-resolved dynamics probing resonances in many-body localization [0.0] 空間平均化は重要な顕微鏡的特徴をマスクできることを示す。
ランダムフィールド XXZ 鎖の強い乱れ状態に着目する。
これらの局所プローブの時間発展と無限時間限界を解析することにより、共鳴構造と稀な局所不安定性を明らかにする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:02:56 GMT)
Architecting Agentic Communities using Design Patterns [0.0] 大規模言語モデル(LLM)とエージェントAI技術は、洗練されたプロダクショングレードシステムを構築するための体系的なアーキテクチャガイダンスを必要とする。
本稿では,企業における分散システム標準や形式的手法,産業プラクティスから派生したデザインパターンを用いて,そのようなシステムを設計するためのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 20:30:07 GMT)
Application of Hybrid Chain Storage Framework in Energy Trading and Carbon Asset Management [0.0] 本稿は、解決のコミットメントとチェーン上の鍵となる制約をアンロックする、ハイブリッドなオンチェーンおよびオフチェーンの解決フレームワークを提案する。
パブリックな制約のあるワークロード下での実験では、フレームワークが監査の信頼性を維持しながら、オンチェーンの実行とストレージコストを大幅に削減することを示している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 02:27:34 GMT)
Anomaly to Resource: The Mpemba Effect in Quantum Thermometry [0.0] 非平衡量子温度測定は、平衡戦略と寒冷状態の両方を過渡的に上回ることを示す。
その結果、非平衡量子温度測定の一般的な設計原理として異常緩和が確立された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:51:47 GMT)
Analytical Solutions to Asymmetric Two-Photon Rabi Model [0.0] 一般化されたラビモデルは、2光子項と非対称項の両方を含むと考えられている。
適切な変換によって、ほぼ正確な解はベーテ・アンザッツ法(英語版)を用いて得られることが示されている。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 22:49:58 GMT)
Akasha 2: Hamiltonian State Space Duality and Visual-Language Joint Embedding Predictive Architectur [0.0] Akasha 2は、Handian State Space Duality (H-SSD)とVisual-Language Joint Embedding Predictive Architecture (VL-JEPA)を統合した最先端アーキテクチャである。
視覚合成にはハミルトンフローマッチング(HFM)と持続3次元ガウススプラッティング(3DGS)を導入する。
我々のアプローチは、物理学にインスパイアされた帰納バイアスを神経推論に組み込むことで、大きな改善をもたらすことを実証している。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 18:40:31 GMT)
AVX / NEON Intrinsic Functions: When Should They Be Used? [0.0] AVX/NEON固有の関数の容量と制限を検討するためにクロスコンフィグレーションベンチマークが提案されている。
主な目的は、OS、アーキテクチャ、および/または利用可能なコンパイラによって、開発者が固有の関数を使うときの選択を誘導することである。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 13:21:19 GMT)
APoW: Auditable Proof-of-Work Against Block Withholding Attacks [0.0] 本稿では,HashcashスタイルのナンスサーチにインスパイアされたAuditable Proof-Work (APoW)構築について紹介する。
ナンス空間の再スキャンにより、他の鉱山労働者の作業の監査を可能にする。
APoWをBitcoinにフルデプロイするには、コンセンサスルールの変更とASICのマイニングに小さな修正が必要である。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 04:27:42 GMT)
AI Safeguards, Generative AI and the Pandora Box: AI Safety Measures to Protect Businesses and Personal Reputation [0.0] 生成AIはコンテンツ生成のパワーを解放し、現実的なディープフェイクの箱を開けた。
ニューラルネットワークを用いた解像度とハイブリダイゼーション検出技術は、コンテンツのフラグ付けを可能にする。
優れた検出技術とフラグ付けはAIの安全性を可能にする。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 06:58:42 GMT)
AECV-Bench: Benchmarking Multimodal Models on Architectural and Engineering Drawings Understanding [0.0] AEC人工物上でのマルチモーダルおよびヴィジュアル言語モデルを評価するためのベンチマークであるAECVBenchを提案する。
その結果、現在のシステムはドキュメントアシスタントと同様に機能するが、ロバストな描画リテラシーが欠如していることが示唆された。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 10:54:32 GMT)
A scalable gallium-phosphide-on-diamond spin-photon interface [0.0] 我々は、スケーラブルで平面的なプラットフォームにおいて、量子欠陥とハイブリッド集積ナノフォトニクスとの初めての高協調結合を実現する。
単発読み出しによるスピン依存伝送スイッチングとSiVスピンの量子ジャンプを観察する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 08:55:08 GMT)
A Mathematical Theory of Payment Channel Networks [0.0] 本稿では、ポリトープ$W_G$の資産分配を中心とする決済チャネルネットワークの理論を紹介する。
マルチパーティチャネル(コインプール/チャネルファクトリ)がどのようにしてW_G$を拡大するかを示す。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 11:12:58 GMT)
A Data-Driven Predictive Framework for Inventory Optimization Using Context-Augmented Machine Learning Models [0.0] 本研究では,小売および自動販売機部門における需要予測を改善するため,機械学習(ML)アルゴリズムの利用について検討する。
平日、休日、販売偏差指標といった先進的な要因は、正確性を高めるために体系的に組み入れられた。
XGBoostは、外部変数を含め、平均絶対誤差(MAE)が22.7に達した。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 15:43:28 GMT)
A Closed-Loop Multi-Agent System Driven by LLMs for Meal-Level Personalized Nutrition Management [0.0] 本稿では,LLM駆動型マルチエージェントコントローラと画像ベースの食事ログを併用して,食事レベルのクローズドループをサポートする次世代モバイル栄養アシスタントを提案する。
このシステムは、視覚、対話、状態管理エージェントを調整し、写真から栄養分を推定し、毎日の摂取予算を更新する。
論文参考訳(メタデータ) (Thu, 08 Jan 2026 01:51:37 GMT)