Locate, Steer, and Improve: A Practical Survey of Actionable Mechanistic Interpretability in Large Language Models [122.6] 機械的解釈可能性 (MI) は、大規模言語モデル (LLM) の意思決定を決定づける重要なアプローチとして登場した。
Awesomeinterventionable-MI-Survey" というパイプラインを中心に構築された実践的調査を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:23:23 GMT)
Towards Execution-Grounded Automated AI Research [106.9] 実行基盤化は役に立つかもしれないが、自動実行が実現可能かどうか、LLMが実行フィードバックから学べるかどうかは不明だ。
我々は、アイデアを実装する自動化エグゼキュータを構築し、その有効性を検証するために大規模な並列GPU実験をローンチする。
本研究では,進化的探索と強化学習という,実行フィードバックから学習する2つの方法を分析する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:35:44 GMT)
Toward Efficient Agents: Memory, Tool learning, and Planning [96.9] 本稿では,レイテンシ,トークン,ステップなどのコストを考慮したメモリ,ツール学習,計画という,エージェントの3つのコアコンポーネントの効率性について検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:51:56 GMT)
NewsRECON: News article REtrieval for image CONtextualization [96.8] 本稿では,関連ニュース記事と画像をリンクして,記事メタデータから日付と場所を推測する手法であるNewsRECONを紹介する。
TARAと5Pils-OOCの実験では、NewsRECONは以前の作業よりも優れており、新しいSOTAを達成するためにマルチモーダルな大規模言語モデルと組み合わせることができる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:15:53 GMT)
FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs [94.3] Future Omniは、オーディオ視覚環境から全モードの将来の予測を評価するために設計された最初のベンチマークである。
Future Omniは、スケーラブルなLCM支援の人-イン-ザ-ループパイプラインで構築されており、919のビデオと1,034のマルチチョイスQAペアを含んでいる。
13のOmni-modalモデルと7つのビデオオンリーモデルによる評価は、現在のシステムは、特に音声の重みのあるシナリオにおいて、音声・視覚の将来の予測に苦慮していることを示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:47:20 GMT)
Analyzing the Availability of E-Mail Addresses for PyPI Libraries [89.2] 81.6%のライブラリには、少なくとも1つの有効な電子メールアドレスが含まれており、PyPIが主要なソースとなっている。
698,000以上の無効なエントリを識別します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:54:58 GMT)
Top 10 Open Challenges Steering the Future of Diffusion Language Model and Its Variants [85.3] 本稿では,基盤基盤,アルゴリズム最適化,認知推論,統合マルチモーダルインテリジェンスという4つの柱で構成された戦略ロードマップを提案する。
この移行は、複雑な構造的推論、動的自己補正、シームレスなマルチモーダル統合が可能な次世代AIの開発に不可欠である、と我々は主張する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:58:23 GMT)
Latent Causal Diffusions for Single-Cell Perturbation Modeling [83.5] 測定ノイズ下で観察された定常拡散過程として単細胞遺伝子発現をフレーム化する生成モデルを提案する。
LCDはシングルセルRNAシークエンシングスクリーンにおいて、目に見えない摂動の組み合わせの分布変化を予測するために確立されたアプローチより優れていた。
我々は、摂動応答(CLIPR)を介して因果線形化と呼ばれるアプローチを開発し、全ての遺伝子間の直接的な因果効果を近似する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:15:38 GMT)
Which Reasoning Trajectories Teach Students to Reason Better? A Simple Metric of Informative Alignment [82.0] Rank-Surprisal Ratioは、推論軌道の適合性を評価するためにアライメントとインフォメーションの両方をキャプチャする単純な計量である。
軌道選択と教師選択の両方において,その実用性を実証する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:58:10 GMT)
VideoMaMa: Mask-Guided Video Matting via Generative Prior [73.0] ビデオマッチングモデルを実世界のビデオに一般化することは、ラベル付きデータの不足のため、依然として大きな課題である。
粗いセグメンテーションマスクを画素精度のアルファマットに変換するビデオマスク・トゥ・マテモデル(VideoMaMa)を提案する。
大規模ビデオマッティングのためのスケーラブルな擬似ラベルパイプラインを構築し、ビデオデータセットのMatting Anythingを構築する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:59:56 GMT)
Responsible Evaluation of AI for Mental Health [72.9] メンタルヘルスケアにおけるAIツールの評価に対する現在のアプローチは、断片化されており、臨床実践、社会的コンテキスト、ファーストハンドのユーザエクスペリエンスと不整合である。
本稿では,臨床の健全性,社会的文脈,公平性を統合した学際的枠組みを導入することにより,責任ある評価を再考する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:55:10 GMT)
CodeContests-O: Powering LLMs via Feedback-Driven Iterative Test Case Generation [71.4] 既存のアプローチは、Large Language Models (LLM) を用いたテストケースの合成を試みる
包括的なテストケース構築のために、textbfFeedback-Bench Iterative Framework$を提案します。
私たちのデータセットは、平均的真正率(TPR)が89.37%、真負率(TNR)が90.89%で、CodeContestsとCodeContests+をそれぞれ4.32%、9.37%で大幅に上回っている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:32:44 GMT)
PRiSM: Benchmarking Phone Realization in Speech Models [70.8] 音声認識(PR)は言語に依存しない言語間音声処理と音声解析のためのアトミックインタフェースとして機能する。
PRiSMは、音声知覚における盲点を明らかにするために設計された、最初のオープンソースベンチマークである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:00:36 GMT)
IntentCoding: Amplifying User Intent in Code Generation [66.9] 大規模言語モデル(LLM)は、コード生成において強力な能力を示しているが、複数の制約を伴うきめ細かいユーザ意図への固執は、依然として大きな課題である。
Intent-Amplified Code Generation (IntentCoding, IntentCoding)を提案する。
IntentCodingは、インテントをマスキングしてユーザインテントの影響を捉え、生成時のユーザインテントの効果を増幅するために、多強度アンサンブル機構を適用する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:34:16 GMT)
Fine-Grained Zero-Shot Composed Image Retrieval with Complementary Visual-Semantic Integration [64.1] ゼロショット合成画像検索(ZS-CIR)は急速に発展し,実用化が進んでいる分野である。
既存のZS-CIR法は、細粒度の変化を捉え、視覚情報と意味情報を効果的に統合するのに苦労することが多い。
補足型ビジュアルセマンティック統合を用いたファイングラインドゼロショット合成画像検索手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:17:14 GMT)
RoboBrain 2.5: Depth in Sight, Time in Mind [63.8] 本稿では,一般的な知覚,空間的推論,時間的モデリングを促進する次世代AI基盤モデルであるRoboBrain 2.5を紹介する。
具体的には、2Dピクセル相対グラウンドから深度対応座標予測にシフトすることで、精密3D推論をアンロックする。
Dense Temporal Value Estimationは、密集したステップ対応の進捗予測と実行状態の理解を提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:21:54 GMT)
Opportunities in AI/ML for the Rubin LSST Dark Energy Science Collaboration [63.6] この白書は、DESCの主要な宇宙探査と横断的分析を通して、AI/MLの現在の状況を調査している。
本研究では,大規模ベイズ推定,物理インフォームド手法,検証フレームワーク,発見のための能動的学習など,主要な方法論研究の優先事項を明らかにする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:46:42 GMT)
Interp3D: Correspondence-aware Interpolation for Generative Textured 3D Morphing [63.1] テクスチャ化された3DモーフィングのためのトレーニングフリーフレームワークであるInterp3Dを提案する。
生成的先行性を利用し、幾何学的忠実さとテクスチャコヒーレンスの両方を保証するために、プログレッシブアライメント原理を採用する。
包括的評価のために, 難易度の高い専用データセットInterp3DDataを構築し, 忠実度, 遷移滑らか度, 可視性から生成結果を評価する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:03:22 GMT)
Hierarchical Long Video Understanding with Audiovisual Entity Cohesion and Agentic Search [61.9] 我々は,コヒーレントかつ包括的推論を可能にする,長時間ビデオ理解のための統一的なフレームワークであるHAVENを提案する。
視覚ストリームと聴覚ストリームをまたいだエンティティレベルの表現を統合することで、セマンティック一貫性を維持する。
これらの層にまたがる動的検索と推論を可能にするためにエージェント検索機構を用いる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:23:29 GMT)
Integrating Vision-Centric Text Understanding for Conversational Recommender Systems [61.7] STARCRSはScreen-Text-AwaRe Conversational Recommender Systemである。
本稿では, コントラストアライメント, クロスアテンション相互作用, 適応ゲーティングを組み合わせた知識認識融合フレームワークを提案する。
広く使われている2つのベンチマークの実験では、STARCRSはレコメンデーション精度と生成された応答品質の両方を一貫して改善している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:41:54 GMT)
Understanding Multilingualism in Mixture-of-Experts LLMs: Routing Mechanism, Expert Specialization, and Layerwise Steering [61.1] 本研究では,中間層におけるルーティング動作を,支配言語に関連する共有専門家に適応的に誘導するルーティング誘導型ステアリング手法を提案する。
私たちのコードはhttp://conctsai.com/multilingualism-in-Mixture-of-Experts-LLMsで利用可能です。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:04:25 GMT)
ORCA -- An Automated Threat Analysis Pipeline for O-RAN Continuous Development [57.6] Open-Radio Access Network (O-RAN)は、多くのソフトウェアコンポーネントをクラウドのようなデプロイメントに統合し、これまで考えられていなかったセキュリティ脅威に無線アクセスネットワークを開放する。
現在の脆弱性評価の実践は、しばしば手動、労働集約、主観的な調査に依存しており、脅威分析の不整合につながる。
人間の介入や関連するバイアスを最小限に抑えるために,自然言語処理(NLP)を活用する自動パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:31:59 GMT)
ChartVerse: Scaling Chart Reasoning via Reliable Programmatic Synthesis from Scratch [57.0] グラフの複雑さを定量化する新しい指標であるRollout Posterior Entropy(RPE)を紹介する。
また、推論厳密性を保証するために、真正対応の逆QA合成を開発する。
さらに, モデルフェールレートに基づく試料をろ過し, 高品質なCoT (Chain-of-Thought) 推算を行った。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:11:44 GMT)
OP-Bench: Benchmarking Over-Personalization for Memory-Augmented Personalized Conversational Agents [55.3] オーバーパーソナライゼーションを3つのタイプに分類する。
エージェントは不要な場合でも、ユーザメモリを取得およびオーバーアタッチする傾向があります。
我々の研究は、メモリ拡張対話システムにおいて、より制御可能で適切なパーソナライズに向けた最初の一歩を踏み出した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:27:13 GMT)
An Elementary Approach to Scheduling in Generative Diffusion Models [55.2] 生成拡散モデルにおけるノイズスケジューリングと時間離散化の影響を特徴付けるための基礎的手法を開発した。
異なるデータセットと事前訓練されたモデルにわたる実験により、我々のアプローチによって選択された時間離散化戦略が、ベースラインとサーチベースの戦略を一貫して上回ることを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:06:26 GMT)
Motion 3-to-4: 3D Motion Reconstruction for 4D Synthesis [53.5] Motion 3-to-4は、単一のモノクロビデオから高品質な4Dダイナミックオブジェクトを合成するためのフィードフォワードフレームワークである。
我々のモデルは、コンパクトな動き潜在表現を学習し、フレーム単位の軌道を予測して、時間的コヒーレントな幾何である完全なロバスト性を取り戻す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:59:48 GMT)
RepoGenesis: Benchmarking End-to-End Microservice Generation from Readme to Repository [53.0] RepoGenesisは、リポジトリレベルのエンドツーエンドWebマイクロサービス生成のための、最初の多言語ベンチマークである。
Pass@1、API Coverage(AC)、Deployment Success Rate(DSR)を使用して、オープンソースのエージェント(DeepCodeなど)と商用IDE(Cursorなど)を評価します。
その結果、高いAC(最大73.91%)とDSR(最大100%)にもかかわらず、最高のパフォーマンスのシステムはPythonで23.67%のPass@1、Javaで21.45%しか達成していないことが明らかになった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:19:20 GMT)
Insight: Interpretable Semantic Hierarchies in Vision-Language Encoders [52.9] 言語対応の視覚基盤モデルは、下流の様々なタスクで強く機能する。
近年の研究では、これらの表現を人間の解釈可能な概念に分解するが、空間的接地が乏しく、画像分類に限られている。
入力画像に人間が解釈可能で空間的に接地した、きめ細かい概念を提供する言語対応概念基盤モデルであるInsightを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:57:26 GMT)
ASBA: A-line State Space Model and B-line Attention for Sparse Optical Doppler Tomography Reconstruction [52.6] 横軸(B線)に沿って1次元深度分解生Aスキャン(A線)を順次取得して2次元光ドップラートモグラフィ(ODT)画像(B線)を生成する。
現在のプラクティスは、スキャン時間が長くなり、ストレージの需要が増加し、急激な血流動態の捕捉が制限される、密度の高いサンプリングに依存している。
そこで本研究では,高度にサンプル化した生のAスキャンからODT画像の再構成を行うために,ASBAという新しい血流認識ネットワークを導入する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:17:02 GMT)
Sample Complexity of Average-Reward Q-Learning: From Single-agent to Federated Reinforcement Learning [51.8] 有限状態と作用空間を持つ平均回帰型MDPに対して、弱い通信仮定の下で、単純だが効果的なQ-ラーニングアルゴリズムについて検討する。
We proof that the collaborations the per-agent sample complexitys to $widetildeOleft(frac|mathcalA||hstar|_mathsfsp3Mvarepsilon3right)$, with only $widetildeOleft(frac|hstar|_mathsfsp3Mvareps)。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:21:54 GMT)
Stream-Voice-Anon: Enhancing Utility of Real-Time Speaker Anonymization via Neural Audio Codec and Language Models [51.7] Stream-Voice-Anonは、ストリーミングスピーカーの匿名化に特化して、現代的なLMベースのNACアーキテクチャを適用している。
匿名化アプローチには、擬似話者表現サンプリング、話者埋め込みミキシング、多様なプロンプト選択戦略が組み込まれている。
VoicePrivacy 2024 Challengeプロトコルの下で、Stream-Voice-Anonは知性を大幅に改善した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:23:44 GMT)
Preconditioning Benefits of Spectral Orthogonalization in Muon [50.6] 線形変圧器の行列分解と文脈内学習の2つのケーススタディにおいて,ミュオンの簡易版の有効性について検討した。
解析の結果,Muonのダイナミクスはスペクトル領域内の独立したスカラー配列の集合に分解され,それぞれが同様の収束挙動を示すことが明らかとなった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:08:31 GMT)
Rerank Before You Reason: Analyzing Reranking Tradeoffs through Effective Token Cost in Deep Search Agents [50.2] 深層探索パイプラインにおける推論予算の配分について検討する。
BrowseComp-Plusベンチマークを用いて、モデルスケール、推論の労力、深度の再検討、トークン総コストのトレードオフを分析する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:38:35 GMT)
Report for NSF Workshop on AI for Electronic Design Automation [50.2] 本報告は、電子設計自動化のためのAIワークショップ(NSF Workshop on AI for Electronic Design Automation, EDA)の議論とレコメンデーションを精査するものである。
機械学習とEDAを専門とするワークショップでは、AIが拡張する大規模言語モデル(LLM)、グラフニューラルネットワーク(GNN)、強化学習(RL)、ニューロシンボリックメソッドなどについて調査した。
報告書では、AI/EDAコラボレーションの促進、EDAのための基礎的AIへの投資、堅牢なデータインフラストラクチャの開発、スケーラブルなコンピューティングインフラストラクチャの促進、ハードウェア設計の民主化と次世代ハードウェアシステムの実現のための労働力開発への投資をNSFが推奨している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 23:45:40 GMT)
Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.1] オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:42:56 GMT)
Towards Token-Level Text Anomaly Detection [48.8] 本稿では,テキスト中の異常の微粒化を可能にする新しいパラダイムであるトークンレベルの異常検出手法を提案する。
文書レベルとトークンレベルの両方でテキスト異常を正式に定義し,複数のレベルにまたがる統合検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:27:09 GMT)
Jet-RL: Enabling On-Policy FP8 Reinforcement Learning with Unified Training and Rollout Precision Flow [48.5] 本研究は,FP8 RLトレーニングの総合的研究である。
安定かつ堅牢なRL最適化を実現するFP8 RLトレーニングフレームワークであるJet-RLを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:54:31 GMT)
Unsupervised Video Class-Incremental Learning via Deep Embedded Clustering Management [47.5] 教師なしビデオクラスインクリメンタルラーニング(uVCIL)は,忘れずにビデオ情報を学ぶための重要な学習パラダイムである。
我々は,uVCILに対処するためのシンプルで効果的なアプローチを提案する。
まず、クラスやタスク情報を仮定することなく、各タスク中に代表的ビデオ機能セットを提供する、深い特徴抽出ネットワークについて検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:25:41 GMT)
Two-Stream temporal transformer for video action classification [47.5] 動画理解において動作表現は重要な役割を担い、エンコーダアクション認識、ロボット、自律誘導など多くの応用がある。
近年、トランスフォーマーネットワークは、その自己保持機構機能を通じて、多くのアプリケーションでその効率を証明している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:47:00 GMT)
RM-Distiller: Exploiting Generative LLM for Reward Model Distillation [47.0] リワードモデル(RM)は、大きな言語モデル(LLM)と人間の嗜好の整合において重要な役割を果たす。
既存のアプローチは主に教師モデルを単純なバイナリアノテータとして扱い、RM蒸留の豊富な知識と能力を完全に活用することができなかった。
教師LLMの多面的能力を体系的に活用するフレームワークであるRM-Distillerを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:53:32 GMT)
POCI-Diff: Position Objects Consistently and Interactively with 3D-Layout Guided Diffusion [47.0] 本稿では,テキスト・トゥ・イメージ(T2I)生成のための拡散型アプローチを提案する。
連続的かつインタラクティブな位置決めのためのフレームワーク(POCI-Diff)を導入する。
本手法は,個々のテキスト記述を特定の3次元境界ボックスに結合することで,オブジェクトごとのセマンティック制御を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:13:43 GMT)
The Side Effects of Being Smart: Safety Risks in MLLMs' Multi-Image Reasoning [46.2] MIR-SafetyBenchは,マルチイメージ推論の安全性を重視した最初のベンチマークである。
より高度なマルチイメージ推論を持つモデルは、MIR-SafetyBenchに対してより脆弱であることが判明した。
安全でない世代は 平均して安全な世代よりも 注意のエントロピーが低い
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:24:18 GMT)
KAGE-Bench: Fast Known-Axis Visual Generalization Evaluation for Reinforcement Learning [44.9] 我々は、観察プロセスを独立して制御可能な視覚軸に分解するJAXネイティブな2DプラットフォームであるKAGE-Envを紹介する。
この環境に基づいてKAGE-Benchを定義する。KAGE-Benchは、34の列車評価構成ペアからなる6つの既知の軸組のベンチマークである。
完全にベクター化されたJAX実装は、単一のGPU上で毎秒3300万の環境ステップを可能にし、視覚的要因を高速かつ再現可能なスイープを可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:44:28 GMT)
Storage-Rate Trade-off in A-XPIR [43.8] 非対称な$X$-secureのプライベート情報検索設定における記憶問題について考察する。
サーバにおける平均ストレージと平均ダウンロードコストの間のトレードオフ領域に焦点を当てる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:04:49 GMT)
SilentDrift: Exploiting Action Chunking for Stealthy Backdoor Attacks on Vision-Language-Action Models [43.2] VLA(Vision-Language-Action)モデルは、安全クリティカルなロボットアプリケーションにますます採用されている。
現代のVLAシステムにおける基本的なセキュリティ欠陥を識別する。
我々は、この脆弱性を利用したステルスなブラックボックスバックドア攻撃であるSILENTDRIFTを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:24:17 GMT)
Co-Initialization of Control Filter and Secondary Path via Meta-Learning for Active Noise Control [42.5] アクティブノイズコントロール(ANC)は、音響環境が変化すると迅速に適応しなければならない。
モデルに依存しないメタラーニング(MAML)を併用して,制御フィルタと二次パスモデルを協調的に設定する。
オンライン二次経路モデリングFxLMSテストベッドでは、早期エラーの低減、目標までの時間短縮、補助ノイズエネルギーの低減、経路変更後の回復の高速化が期待できる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:02:03 GMT)
Simple Role Assignment is Extraordinarily Effective for Safety Alignment [42.5] 原則に基づくアライメントは、コンテキストの感度と完全性に欠けることが多い。
社会的役割は暗黙的に値とそれを適用するために必要な認知スキーマの両方を符号化する。
我々は,役割条件付きジェネレータと反復的な役割に基づくリファインメントの批判を特徴とする無訓練パイプラインを導入する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:42:44 GMT)
Vision Also You Need: Navigating Out-of-Distribution Detection with Multimodal Large Language Model [42.3] アウト・オブ・ディストリビューション(OOD)検出は重要な課題であり、大きな注目を集めている。
本稿では,MLLMのマルチモーダル推論機能を活用した新しいパイプラインMM-OODを提案する。
提案手法は,OODタスクの近・遠の両方における性能向上を目的としている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:06:10 GMT)
Soft Tail-dropping for Adaptive Visual Tokenization [41.5] STATは、イメージを個別のコード列にエンコードし、トークン単位の保留確率を同時に保持する。
これらの確率は、シーケンスに沿って単調に減少し、その分布を画像レベルの複雑性尺度と整合させるように正規化します。
結果としてSTATは、因果1D自己回帰(AR)視覚生成モデルと自然に互換性のある長さ適応型1D視覚トークンを生成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:57:19 GMT)
Multi-Objective Hierarchical Optimization with Large Language Models [41.4] 大規模言語モデル(LLM)は、多目的最適化を推進するための既定の選択肢ではない。
本稿では,このギャップを,構造化階層型探索戦略内での代理モデルと候補サンプルとしてLLMを活用することで解決する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:10:13 GMT)
Diffusion Large Language Models for Black-Box Optimization [39.4] オフラインのブラックボックス最適化は、デザインとそのラベルのオフラインデータセットのみに基づく最適な設計を見つけることを目的としている。
従来の手法はタスク固有のプロキシや生成モデルに依存しており、事前訓練された大規模言語モデル(LLM)のコンテキスト内学習能力を見越している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:59:29 GMT)
ChatAD: Reasoning-Enhanced Time-Series Anomaly Detection with Multi-Turn Instruction Evolution [39.2] 既存の手法では、不適切な推論能力、不十分なマルチターン対話能力、狭い一般化の課題に直面している。
私たちの3つのChatADモデルは、34.50%の精度、34.71%のF1、37.42%の偽陽性で大幅に向上した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:12:37 GMT)
Quantum simulation of general spin-1/2 Hamiltonians with parity-violating fermionic Gaussian states [39.1] パリティ違反フェルミオン平均場理論(PV-FMFT)の運動方程式を導入する。
PV-FMFTはパリティ違反フェルミオン状態(PV-FGS)に基づく数値的に効率的なフェルミオン平均場理論である
我々はPV-FMFTが非相互作用スピン-1/2ハミルトニアンの想像とリアルタイムのダイナミクスを正確に捉えることができることを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:09:29 GMT)
Inverting Self-Organizing Maps: A Unified Activation-Based Framework [39.1] 我々は,SOMの活性化パターンを逆転させて,微妙な幾何学的条件下での正確な入力を復元できることを示す。
我々は,MUSIC (Manifold-Aware Unified SOM Inversion and Control) 更新ルールを導入する。
合成ガウス混合系, MNIST と Faces in the Wild を用いたアプローチを検証した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:02:54 GMT)
TextBFGS: Quasi-Newton Optimization for Discrete Executable Text via Gradient-Operator Retrieval [38.4] 離散テキストに対して準ニュートン最適化法を実装するための2次フレームワークであるTextBFGSを紹介する。
TextBFGSは、事前学習された成功した軌道の記憶から勾配演算子を取得することで、逆ヘッセン行列を近似する。
より少ないモデルコールで優れたパスレートを実現し、強力なクロスタスク転送性を示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:45:56 GMT)
Automatic Prompt Optimization for Dataset-Level Feature Discovery [38.4] 特徴発見をデータセットレベルのプロンプト最適化問題として定式化する。
本稿では,言語モデルエージェントが特徴定義を共同で提案し,特徴値を抽出し,特徴品質を評価するマルチエージェントプロンプト最適化フレームワークを提案する。
この定式化は、サンプルごとの監督に依存し、非構造化テキストからの自動特徴発見のための原則化されたメカニズムを提供する、事前のプロンプト最適化手法から逸脱する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:51:03 GMT)
OmniTransfer: All-in-one Framework for Spatio-temporal Video Transfer [38.3] 統合ビデオ転送のためのOmni-temporal frameworkを提案する。
ビデオフレーム間のマルチビュー情報を活用して、外観整合性を高める。
時間的手がかりを利用して、きめ細かい時間的制御を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:58:11 GMT)
What Gets Activated: Uncovering Domain and Driver Experts in MoE Language Models [37.9] 3つのパブリックドメインにわたるMOEモデルのエキスパートアクティベーションについて検討する。
専門家の中には、明らかにドメインの好みを示す者もいれば、モデルのパフォーマンスに強い因果関係を持つ者もいる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:18:10 GMT)
Sparse Adapter Fusion for Continual Learning in NLP [34.7] Sparse Adapter Fusion Method (SAFM)は、これらの課題に対処するために、古いアダプタと新しいアダプタを動的に融合する。
実験結果から,SAFMは最先端(SOTA)法よりも優れていた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:58:25 GMT)
Correcting and Quantifying Systematic Errors in 3D Box Annotations for Autonomous Driving [34.4] アクティブセンサーのデータに基づく3Dボックスアノテーションは、動的なシナリオでは難しい。
私たちの研究は、広く使われ、公開されているデータセットでこのようなアノテーションエラーを発見する最初のものです。
当社のアプローチは、これらのデータセットでボックスアノテーションの品質を17%以上向上させています。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:57:48 GMT)
Policy-Embedded Graph Expansion: Networked HIV Testing with Diffusion-Driven Network Samples [33.7] HIVは、ヒトの免疫系を攻撃し、適切な治療を受けずに死に至るレトロウイルスである。
WHOとワイツ大学と共同で、最終的な展開を目標にHIV検査の効率を改善する方法について研究する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:44:59 GMT)
Towards Efficient and Robust Linguistic Emotion Diagnosis for Mental Health via Multi-Agent Instruction Refinement [33.3] うつ病、不安、外傷などの感情の言語表現は、臨床ノート、カウンセリングダイアログ、オンラインのメンタルヘルスコミュニティに広く浸透している。
診断効率とロバスト性を改善するために,より広範かつきめ細かなプロンプト空間を体系的に探索するフレームワークであるAPOLOを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:31:19 GMT)
CommunityBench: Benchmarking Community-Level Alignment across Diverse Groups and Tasks [32.6] コミュニティレベルのアライメント評価のための,最初の大規模ベンチマークであるCommunityBenchを紹介する。
コミュニティベンチにおける様々な基礎モデルの包括的評価を行い、現在のLCMはコミュニティ固有の嗜好をモデル化する能力に限られていることを明らかにする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:10:50 GMT)
PMCE: Probabilistic Multi-Granularity Semantics with Caption-Guided Enhancement for Few-Shot Learning [32.3] 少数のラベル付きサンプルから新しいカテゴリを識別することを目的としている。
本稿では,多粒度セマンティクスとキャプション誘導型エンハンスメントを利用したPMCEを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:06:23 GMT)
MN-TSG:Continuous Time Series Generation with Irregular Observations [32.3] 時系列生成は、医療など幅広い領域において重要な役割を果たす。
既存の手法の多くは、定期的にサンプリングされた観測と固定された出力の解決を前提としており、実世界のシナリオとよく一致しない。
このミスマッチは臨床モニタリングのようなアプリケーションでは特に問題であり、不規則な測定は連続かつ高解像度の時系列を必要とする下流タスクをサポートする必要がある。
我々は,MN-TSGを提案する。MN-TSGは,Mixture-of-Experts(MoE)ベースのNCDEを探索し,それらを不規則かつ連続的な生成タスクのための既存のTSGモデルと統合するフレームワークである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:45:03 GMT)
InT: Self-Proposed Interventions Enable Credit Assignment in LLM Reasoning [32.3] アウトカム・リワード強化学習(RL)は,大規模言語モデル(LLM)の推論能力向上に有効であることが証明された。
標準RLは最終回答のレベルにのみクレジットを割り当て、結果が正しくない場合にすべての推論トレースを罰する。
Invention Training (InT) は、モデルが独自の推論トレースに基づいてきめ細かいクレジット割り当てを行う訓練パラダイムである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:15:38 GMT)
IIR-VLM: In-Context Instance-level Recognition for Large Vision-Language Models [31.8] In-context Instance-level Recognition のために拡張された VLM である IIR-VLM を提案する。
我々は、事前訓練されたIRRエキスパートモデルを補助視覚エンコーダとして統合し、多様なインスタンスを学習するための特別な機能を提供する。
既存のインスタンスパーソナライズベンチマークにおいて,IIR-VLMの有効性を検証する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:45:24 GMT)
Face-Voice Association with Inductive Bias for Maximum Class Separation [31.4] フェース・ボイス・アソシエーションは多モーダル・ラーニングにおいて広く研究されており、同一人物に近づき、他者と十分に区別された埋め込みを持つ顔や声を表現している。
近年の分類の進歩は、最大クラス分離を帰納バイアスとして与えることで、埋め込みの識別能力を強化することができることを示している。
この研究は、マルチモーダル学習における帰納バイアスとして最大クラス分離の有効性を初めて適用し、実証するものである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:38:10 GMT)
From Tags to Trees: Structuring Fine-Grained Knowledge for Controllable Data Selection in LLM Instruction Tuning [31.2] Tree-Aware Aligned Global Sampling (TAGS)は、きめ細かいタグから構築された知識ツリーを活用する統一フレームワークである。
我々の制御可能なサンプリング戦略は、木レベル情報ゲインを最大化し、特定のドメインに対するKL分割による葉レベルアライメントを強制する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:06:51 GMT)
Question-Focused Filtering for Knowledge-based VQA [30.0] 知識に基づくビジュアル質問回答(KB-VQA)は、画像と外部知識を統合することで質問に答えることを目的としている。
本稿では,高品質なフィルタリング知識を効率的に得るための質問焦点フィルタリング手法を提案する。
実験の結果,E-VQAでは4.9%,InfoSeekでは3.8%,最先端モデルでは4.9%向上した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:08:33 GMT)
OptiSQL: Executable SQL Generation from Optical TokensOptiSQL: Executable SQL Generation from Optical Tokens [29.4] 本稿では,テーブルイメージや自然言語質問から直接実行可能なsqlを生成する,視覚駆動型フレームワークOptiを提案する。
実験の結果、Optiはテーブル入力トークンを桁違いに削減しながら、強い実行精度を維持していることがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:49:29 GMT)
DIS2: Disentanglement Meets Distillation with Classwise Attention for Robust Remote Sensing Segmentation under Missing Modalities [29.0] DIS2は、モダリティ共有機能依存からアクティブでガイド付き機能不足補償へ移行した新しいパラダイムである。
補償的特徴は、利用可能なモダリティの特徴と融合すると、フルモダリティの場合の理想的フューズド表現に近似する。
提案手法はベンチマーク間で最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:33:54 GMT)
Learning PDE Solvers with Physics and Data: A Unifying View of Physics-Informed Neural Networks and Neural Operators [28.8] 偏微分方程式(PDE)は科学モデリングの中心である。
現代のコンポーネントは、大規模な計算プロセスにおけるモデルの再利用、推論、統合をサポートするために、学習ベースのコンポーネントにますます依存している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:19:41 GMT)
vLinear: A Powerful Linear Model for Multivariate Time Series Forecasting [28.6] vecTransは学習可能なベクトルを使って多変量相関をモデル化する軽量モジュールである。
WFMLossは効果的なプラグ・アンド・プレイの目標であり、既存の予測装置を一貫して改善している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:23:10 GMT)
AgentEHR: Advancing Autonomous Clinical Decision-Making via Retrospective Summarization [28.0] RetroSumは、レトロスペクティブの要約メカニズムと進化するエクスペリエンス戦略を統合するフレームワークである。
競争ベースラインよりも29.16%のパフォーマンス向上を実現し、全体のインタラクションエラーを92.3%まで大幅に削減した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:48:04 GMT)
TimeART: Towards Agentic Time Series Reasoning via Tool-Augmentation [27.7] TimeARTは、強力なアウトオブザボックスツールの分析能力とLarge Language Models(LLM)の推論能力を融合したフレームワークである。
LLMをベースとしたTSRM(Time Series Reasoning Models)戦略ツールの使用法を教えるため,TimeToolBenchと呼ばれる100kの専門的軌道コーパスも収集した。
TSRMの一般化能力を高めるために,我々は,TSRMの早期経験と自己回帰から学ぶことによって,TSRMを向上する4段階のトレーニング戦略を考案した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:39:10 GMT)
More Than Efficiency: Embedding Compression Improves Domain Adaptation in Dense Retrieval [27.7] PCAはクエリの埋め込みにのみ適用され、モデルとデータセットのペアの75.4%でNDCG@10が改善された。
文書検索には事前学習した埋め込みを動力とするダンスレトリバーが広く用いられているが、専門ドメインでは苦労している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:21:03 GMT)
On Temperature-Constrained Non-Deterministic Machine Translation: Potential and Evaluation [27.4] 我々は,現代機械翻訳システムを体系的に評価し,温度制約のない非決定性MT(ND-MT)を別の現象として同定した。
ND-MTは,システム性能評価における新たな課題を導入し,特に,D-MT用に設計された評価フレームワークは,ND-MTに適用した場合に一貫した評価結果を得ることができない。
本研究では,ロバストなND-MTを選択するための評価指標の信頼性を自動評価するPrestantoSample戦略を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:39:10 GMT)
VulnResolver: A Hybrid Agent Framework for LLM-Based Automated Vulnerability Issue Resolution [27.2] VulnResolverは、自動脆弱性解決のための最初のハイブリッドエージェントフレームワークである。
自律エージェントの適応性と、ワークフロー誘導修理の安定性を2つの特殊エージェントを通じて結合する。
VulnResolverはSEC-bench Liteの75%の問題を解決する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:09:16 GMT)
LifeAgentBench: A Multi-dimensional Benchmark and Agent for Personal Health Assistants in Digital Health [27.2] LifeAgentBenchは、長期、クロス次元、マルチユーザのライフスタイル推論のための大規模なQAベンチマークである。
本稿では,多段階のエビデンス検索と決定論的アグリゲーションを統合した保健アシスタントのための強力なベースラインエージェントとしてLifeAgentを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:51:58 GMT)
Autonomous Knowledge Graph Exploration with Adaptive Breadth-Depth Retrieval [26.8] ARK: アダプティブ・リトリバー・オブ・ナレッジ(Adaptive Retriever of Knowledge)は、この広い範囲のトレードオフを言語モデルで制御します。
ARKは、脆弱な種の選択に依存することなく、幅指向の発見と深さ指向の展開を交互に行う。
ARKは平均Hit@1と67.4の平均MRRを59.1%、平均Hit@1を31.4%、平均MRRを28.0%改善している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:46:37 GMT)
From "Fail Fast" to "Mature Safely:" Expert Perspectives as Secondary Stakeholders on Teen-Centered Social Media Risk Detection [26.7] 本稿では,33名のオンライン安全専門家とのオンラインインタビューを通じて,ティーン中心のソーシャルメディアリスク検出ダッシュボードの評価を行った。
専門家は、ダッシュボードの十代のエージェンシーに対する明確な設計を称賛し、彼らのフィードバックは、そのような技術の実装と維持において5つの主要な緊張関係を明らかにした。
これらの発見は、青少年の安全技術革新のための「ティーン中心」と「ファイル・ファスト」から「成熟した安全」パラダイムへの移行を再考する動機となっている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:09:54 GMT)
Does Privacy Always Harm Fairness? Data-Dependent Trade-offs via Chernoff Information Neural Estimation [26.6] 我々は、情報理論の指標であるChernoff Informationを用いて、公正性、プライバシー、正確性の三者間の関係のデータ依存性を強調する。
この研究は、公平性とプライバシ-正確性関係の統一的な理解に向けて構築され、データ依存の性質を強調している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:51:48 GMT)
Diffusion In Diffusion: Breaking the Autoregressive Bottleneck in Block Diffusion Models [26.5] 半自己回帰的パラダイムとして機能するブロック拡散言語モデルは、自己回帰的パラダイムと拡散的パラダイムの両方の長所を組み合わせる。
彼らの厳密な一方向ブロック依存は、拡散モデルが有名であるグローバルな計画能力の不可逆性を導入し、犠牲にする。
本稿では,ブロック拡散モデルに固有の不可逆性とミオピア問題を克服するために,ディフュージョン・イン・ディフュージョン(Diffusion in Diffusion)を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:00:26 GMT)
FastGHA: Generalized Few-Shot 3D Gaussian Head Avatars with Real-Time Animation [26.2] OURSは、少数の入力画像から高品質なガウスヘッドアバターを生成するフィードフォワード方式である。
提案手法は,入力画像から画素ごとのガウス表現を直接学習する。
実験の結果,提案手法は,レンダリング品質と推論効率の両方において,既存の手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:49:49 GMT)
PINA: Prompt Injection Attack against Navigation Agents [25.8] 大型言語モデル(LLM)を利用したナビゲーションエージェントは、自然言語命令を実行可能な計画とアクションに変換する。
PINAは、ブラックボックス、ロングコンテキスト、アクション実行可能な制約の下でナビゲーションエージェントに適した適応的なプロンプト最適化フレームワークである。
屋内および屋外のナビゲーションエージェントの実験は、PINAが平均87.5%の攻撃成功率を達成したことを示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:28:23 GMT)
CauScientist: Teaching LLMs to Respect Data for Causal Discovery [25.8] CauScientistは「データ科学者」と確率統計を厳密な「検証者」として相乗化するフレームワークである
実験の結果、CauScientistは純粋にデータ駆動のベースラインよりも大幅に優れていた。
CauScientistは37ノードグラフ上のQwen3-32Bと比較して、構造ハミング距離(SHD)を44.0%削減する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:32:22 GMT)
Numina-Lean-Agent: An Open and General Agentic Reasoning System for Formal Mathematics [25.8] 我々はClude CodeとNumina-Lean-MCPを組み合わせたNumina-Lean-Agentを導入し、リーンとの自律的なインタラクションを可能にします。
Claude Opus 4.5 をベースモデルとして、Numina-Lean-Agent はPutnam 2025 (12 / 12) の全ての問題を解決する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:51:45 GMT)
AgentGC: Evolutionary Learning-based Lossless Compression for Genomics Data with LLM-driven Multiple Agent [25.7] AgentGCは、最初の進化的エージェントベースのゲノミクスデータ(GD)管理システムである。
AgentGCはユーザフレンドリなインターフェース、認知層、圧縮層を統合している。
9つのデータセットの14のベースラインと比較すると、平均圧縮率はそれぞれ16.66%、16.11%、16.33%である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:29:45 GMT)
GIC-DLC: Differentiable Logic Circuits for Hardware-Friendly Grayscale Image Compression [25.6] 微分論理回路(GIC-DLC)を用いたグレースケール画像圧縮を提案する。
我々は、ニューラルネットワークの柔軟性とブール演算の効率を組み合わせるために、ルックアップテーブルをトレーニングする。グレースケールのベンチマークデータセットの実験によると、GIC-DLCは圧縮効率において従来のコーデックよりも優れており、エネルギー消費と遅延の大幅な削減を可能にしている。
これらの結果から,学習圧縮はハードウェアフレンドリであり,エッジデバイス上での低消費電力画像圧縮に有望な方向を提供することが示された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:29:23 GMT)
Confident Rankings with Fewer Items: Adaptive LLM Evaluation with Continuous Scores [25.6] IRTベースの適応テストの原則的拡張を連続有界スコア(ROUGE, BLEU, LLM-as-a-Judge)に適用する。
本稿では,信頼性の高いモデルランキングを実現するための適応的停止基準付き不確実性意識ランクアを導入し,できるだけ少数の項目をテストする。
提案手法では,各項目の2%をランダムサンプリングよりも格付け相関を0.12改善し,95%の精度で信頼度予測を行う。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:59:13 GMT)
Dynamic Differential Linear Attention: Enhancing Linear Diffusion Transformer for High-Quality Image Generation [25.3] 拡散変換器(DiT)は高忠実度画像生成のための強力なアーキテクチャとして登場した。
DyDiLAは、過密問題を緩和し、生成品質を向上させることでLiTsの有効性を高める新しい線形アテンション定式化である。
DyDiLAを活用するために,DyDi-LiTと呼ばれる改良されたLiTを導入し,その進歩を体系的に取り入れた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:33:16 GMT)
Finding RELIEF: Shaping Reasoning Behavior without Reasoning Supervision via Belief Engineering [25.2] 大きな推論モデル(LRM)は複雑な問題解決において顕著な成功を収めているが、計算の冗長性や不誠実さの推論に悩まされることが多い。
本稿では,RELIEF(Reasoning Belief Engineering)を提案する。RELIEF(Reasoning Belief Engineering)は,モデルの自己概念と目標信念の青写真とを整合させることにより,LEMの振る舞いを形作るフレームワークである。
RELIEFは、目的の信念を肯定する自己反射的質問応答ペアを微調整することによって、望ましい特性を内部化する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:07:01 GMT)
LogicEnvGen: Task-Logic Driven Generation of Diverse Simulated Environments for Embodied AI [25.2] エージェントのテストケースとして論理的に多様なシミュレーション環境を生成するためにLogicEnvGenを提案する。
潜在的なタスク状況を表すそれぞれの論理軌道に対して、LogicEnvGenは具体的な環境をインスタンス化する。
環境評価のための4つの定量的指標からなる新しいベンチマークであるLogicEnvEvalを紹介する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:28:07 GMT)
On-Chip Generation of Co-Polarized and Spectrally Separable Photon Pairs [24.6] 薄膜ニオブ酸リチウムナノフォトニック回路においてスペクトル分離可能な光子対を生成するための新しい手法を示す。
このアプローチは、量子コンピューティングと量子ネットワークのためのオンチップ量子光源のフレキシブルスペクトルおよび時間工学を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:54:51 GMT)
Partial Decoder Attention Network with Contour-weighted Loss Function for Data-Imbalance Medical Image Segmentation [24.5] 医療画像は、臓器や組織間の大きな体積差や、異なる解剖学的構造にまたがる不均一なサンプル分布など、データ不均衡の問題に悩まされることが多い。
この不均衡は、モデルをより大きな臓器やより頻繁に表現される構造に偏らせる傾向にあり、より小さいまたは少ない表現された構造を見渡す傾向がある。
モデルが小さく, 表現不足な構造を表現する能力を向上させる新しい輪郭重み付きセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:21:12 GMT)
Predicting Retrieval Utility and Answer Quality in Retrieval-Augmented Generation [24.4] RAGの改善の鍵となる課題は、検索した文書の有用性と最終回答の品質の両方を、正確性と妥当性の観点から予測することである。
RAG内では,検索性能予測と生成性能予測という2つの予測タスクを定義している。
入力クエリに条件付けされた検索コンテキストのLLMの難易度など、読者中心の機能は、予測精度をさらに高めることができると論じる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 23:59:54 GMT)
LURE: Latent Space Unblocking for Multi-Concept Reawakening in Diffusion Models [24.3] 概念消去は拡散モデルにおけるセンシティブなコンテンツを抑制することを目的としている。
最近の研究では、消去された概念は再起動可能であることが示されており、消去方法の脆弱性が明らかにされている。
生成過程を暗黙の関数としてモデル化し、複数の因子の包括的な理論的分析を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:39:11 GMT)
FG-OrIU: Towards Better Forgetting via Feature-Gradient Orthogonality for Incremental Unlearning [24.2] 既存の手法は、特徴レベルと勾配レベルの両方に明示的な制約を伴わずに、パラメータを抑えるか、知識を混乱させる。
FG-OrIU (textbfFeaturetextbfGradient textbfOrthogonality for textbfIncrementaltextbfUnlearning)を提案する。
Singular Value Decomposition (SVD)を介して特徴空間を分解し、忘れられたり残ったクラス特徴を別々の部分空間に分離する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:05:13 GMT)
HardSecBench: Benchmarking the Security Awareness of LLMs for Hardware Code Generation [24.1] 大規模言語モデル(LLM)は、コード生成のための実用的なハードウェアとファームウェア開発パイプラインに統合されつつある。
この研究ギャップは、現実的な仕様の下でセキュリティ意識を評価するためのベンチマークを設計する動機となります。
我々は、Verilog Registers Transfer Level (RTL)とファームウェアレベルCにまたがる924のタスクからなるベンチマークであるHardSecBenchを紹介し、76のハードウェア関連Common Weaknession (CWE)エントリをカバーしている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:27:40 GMT)
Scaling Test-time Inference for Visual Grounding [23.8] 効率的な視覚的接地言語モデル (EGM) は、小さなモデルのテスト時間計算をスケールする手法である。
小さなモデルのテストタイムの計算をスケールすることは、デプロイメントフレンドリで、エンドツーエンドのレイテンシが向上します。
EGM-Qwen3-VL-8Bは平均737ms (5.9倍高速)の遅延を持つ91.4IoUを示し、Qwen3-VL-235Bは90.5IoUを達成するために4,320msを要求する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:07:02 GMT)
Optimal L2 Regularization in High-dimensional Continual Linear Regression [23.8] 等方性正規化は,教師設定と教師設定の両方でラベルノイズを緩和することを示す。
最適な固定正則化強度は、タスク数$T$、具体的には$T/ln T$とほぼ線形にスケールすることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:58:14 GMT)
Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response Assistance [23.5] $textbfRebuttalAgent$は、エビデンス中心の計画タスクとしてrebuttal生成を再設計する、新しいマルチエージェントフレームワークである。
本システムでは,複雑なフィードバックをアトミックな関心事に分解し,ハイブリッドコンテキストを動的に構築する。
ドラフト前にインスペクタブルなレスポンスプランを生成することで、$textbfRebuttalAgent$は、すべての引数が内部または外部のエビデンスに明示的に固定されていることを保証します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:23:51 GMT)
Zero-shot adaptable task planning for autonomous construction robots: a comparative study of lightweight single and multi-AI agent systems [23.3] 本研究では,建設ロボットにおけるタスク計画の適応性と一般化性を高める基礎モデルの可能性について検討する。
軽量でオープンソースの大言語モデル(LLM)と視覚言語モデル(VLM)の4つのモデルが提案され,実装されている。
その結果,4歳以上のチームは,最先端のGPT-4oを10倍の費用対効果で上回る結果が得られた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:54:33 GMT)
Glance-or-Gaze: Incentivizing LMMs to Adaptively Focus Search via Reinforcement Learning [23.2] Glance-or-Gaze(GG)は、受動的知覚からアクティブな視覚計画に移行する、完全に自律的なフレームワークである。
GoGはSelective Gazeメカニズムを導入し、グローバルコンテキストを視認するか、あるいは高価値領域を視認するかを動的に選択する。
6つのベンチマークの実験は、最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:18:18 GMT)
Chain-of-Thought Compression Should Not Be Blind: V-Skip for Efficient Multimodal Reasoning via Dual-Path Anchoring [23.2] CoT(Chain-of-Thought)推論は遅延制限を禁止します。
本稿では,V-Skipを導入し,V-Achored Information Bottleneck (VA-IB) 最適化問題としてトークンプルーニングを再構成する。
Qwen2-VLとLlama-3.2ファミリーの実験では、V-Skipが29倍のスピードアップを達成した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:45:38 GMT)
When Wording Steers the Evaluation: Framing Bias in LLM judges [23.2] 大規模言語モデル(LLM)は、プロンプトのフレーズによって異なる応答を生成することが知られている。
本研究では, 4つの高い評価課題に対して, フレーミングスキューモデルによる判断を意図的に行う方法について検討する。
14人以上の審査員がフレーミングに対する明らかな感受性を観察し、モデルファミリーは合意や拒絶に対して明確な傾向を示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:48:10 GMT)
ELSA: Efficient LLM-Centric Split Aggregation for Privacy-Aware Hierarchical Federated Learning over Resource-Constrained Edge Networks [22.5] ネットワークエッジでの大規模言語モデル(LLM)のトレーニングは、デバイスリソースの制約、厳密なデータの不均一性、プライバシーリスクの増大など、基本的な課題に直面している。
リソース制約付きエッジネットワーク上での分散LLM微調整のための分割学習(SL)と階層的フェデレーション学習(HFL)を統合する新しいフレームワークであるELSAを提案する。
まず、公的なプローブ入力と対称KL発散を用いたセマンティックフィンガープリントを構築するタスク非依存の振る舞い対応クライアントクラスタリング機構を用いる。
次に、LLMをクライアントとエッジサーバの3つの部分に分割し、クラウドはアダプタアグリゲーションにのみ使用される。
第三に
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:33:19 GMT)
ICPO: Illocution-Calibrated Policy Optimization for Multi-Turn Conversation [21.7] マルチターン会話におけるLarge Language Models (LLM) は、しばしば会話中に失われる現象に悩まされる。
Reinforcement Learning with Verifiable Rewards (RLVR)のような標準のポストトレーニング技術がこの問題を悪化させることに気付きました。
Illocution-Calibrated Policy Optimization (ICPO) を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:39:28 GMT)
ForgetMark: Stealthy Fingerprint Embedding via Targeted Unlearning in Language Models [21.3] textscForgetMarkはステルスな指紋認証フレームワークで、対象とする未学習を通じて証明をエンコードする。
アシスタントモデルと予測エントロピーランキングを備えたコンパクトで可読なキー-バリューセットを構築し、その後、軽量のLoRAアダプタを訓練して、一般的な機能を保ちながらキーの元の値を抑制する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:49:45 GMT)
SecureSplit: Mitigating Backdoor Attacks in Split Learning [21.3] Split Learning (SL)は、データのプライバシを尊重する協調モデルトレーニングのためのフレームワークを提供する。
SLは、悪意のあるクライアントが埋め込みを微調整して隠れたトリガーを挿入するバックドア攻撃の影響を受けやすい。
SLに合わせた防御機構であるSecureSplitを紹介する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:07:28 GMT)
Machine learning based radiative parameterization scheme and its performance in operational reforecast experiments [21.2] 本研究では、ディープニューラルネットワークを数値予測モデルに組み込むハイブリッド予測フレームワークに固有の制約について検討する。
残留畳み込みニューラルネットワークを用いて、中国気象庁のグローバル運用システム内での一般循環モデル(RRTMG)のラピッシブトランスファーモデル(Rapidive Transfer Model)を近似する。
リアルタイムな演算処理に適したLibTorchベースの結合方式が提案されている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:45:45 GMT)
DSAEval: Evaluating Data Science Agents on a Wide Range of Real-World Data Science Problems [21.2] DSAEvalは、285の多様なデータセットから得られた641の現実世界のデータサイエンス問題からなるベンチマークである。
DSAEvalには,(1)テキストや視覚を含む複数のモードからの観察をエージェントが解釈できるマルチモーダル環境知覚,(2)実世界のデータサイエンスプロジェクトの反復的・累積的性質を反映するマルチクエリインタラクション,(3)推論,コード,結果の全体的評価を提供するマルチ次元評価の3つの特徴がある。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:44:36 GMT)
Facial Spatiotemporal Graphs: Leveraging the 3D Facial Surface for Remote Physiological Measurement [20.7] 顔表面の微妙な色変化を時間とともにモデル化することで生理的信号を推定する。
既存の方法は、R信号の空間的支持である3次元顔表面と、その受容野を明示的に整合させることができない。
顔色を符号化し、3Dメッシュシーケンスを使用する表情表現である顔時間グラフ(STGraph)を提案する。
本稿では,STGraph上で信号推定を行うクリティカルグラフ畳み込みネットワークであるMeshPhysを紹介する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:29:44 GMT)
XCR-Bench: A Multi-Task Benchmark for Evaluating Cultural Reasoning in LLMs [20.5] 大規模言語モデル(LLM)における異文化間の能力は、CSI(Culture-Specific Items)を識別する能力を必要とする
我々は,Cross(X)-Cultural Reasoning BenchmarkであるXCR-Benchを紹介した。
以上の結果から,現状のLCMは社会的エチケットや文化的参照に関連するCSIを識別・適応する上で,一貫した弱点を示すことが明らかとなった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:21:18 GMT)
GerAV: Towards New Heights in German Authorship Verification using Fine-Tuned LLMs on a New Benchmark [20.5] オーサシップ検証 (AV) とは、2つのテキストが同じ著者によって書かれたかどうかを決定するタスクである。
GerAVは600k以上のラベル付きテキストペアからなるドイツのAVの総合ベンチマークである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:08:18 GMT)
Habibi: Laying the Open-Source Foundation of Unified-Dialectal Arabic Speech Synthesis [20.5] 本稿では,特殊・統一された音声合成モデルであるHabibiを紹介する。
当社のアプローチは、先進的な商用サービスの世代品質を上回ります。
我々は、多言語アラビア語音声合成のための最初の体系的ベンチマークを作成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:02:11 GMT)
Activation-Space Anchored Access Control for Multi-Class Permission Reasoning in Large Language Models [20.5] 大規模言語モデル(LLM)は、効率的な知識検索と質問応答のために、知識ベース上にますます展開されている。
LLMはユーザーの許可範囲を超えて不注意に答えることができ、センシティブなコンテンツをリークする。
マルチクラスパーミッション制御のためのトレーニングフリーフレームワークである Activation-space Anchored Access Control (AAAC) を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:57:44 GMT)
OmniOVCD: Streamlining Open-Vocabulary Change Detection with SAM 3 [19.9] Open-Vocabulary Change Detection (OVCD)は、事前に定義されたカテゴリへの依存を減らすことを目的としている。
本稿では,OVCD用に設計されたスタンドアロンフレームワークであるOmniOVCDを提案する。
4つの公開ベンチマークの実験では、IoUスコアは67.2、66.5、24.5、27.1(クラス平均)である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:25:41 GMT)
Large-Scale Label Quality Assessment for Medical Segmentation via a Vision-Language Judge and Synthetic Data [19.9] 本稿では,142個の解剖学的構造にまたがるラベル品質を自動的に予測する軽量視覚監視モデルであるSegAEを提案する。
品質スコアを持つ400万枚以上の画像ラベルのペアでトレーニングされたセセエは、Diceの接地特性と0.902の高い相関係数を達成する。
SegAEは、アクティブおよび半言語学習におけるデータ効率とトレーニングパフォーマンスを改善し、データセットアノテーションのコストを3分の1削減し、1ラベルあたりの品質チェック時間を70%削減する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:09:12 GMT)
Dimension-First Evaluation of Speech-to-Speech Models with Structured Acoustic Cues [19.9] 大言語モデル(LLM)の判断は、強い推論能力を示すが、テキストコンテンツに限定される。
提案するTRACEは,LLM審査員が音質を判断し,費用対効果と人間対応のS2S評価を実現するための新しいフレームワークである。
HCoTアノテーションとTRACEフレームワークをリリースし、スケーラブルでヒューマンアラインなS2S評価を可能にします。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:57:02 GMT)
Robust Reversible Watermarking in Encrypted Images Based on Dual-MSBs Spiral Embedding [19.7] 既存のRRWEIスキームはノイズ、損失圧縮、収穫攻撃に対して限られた堅牢性を示す。
本稿では,空間冗長性と誤り訂正符号を両面に埋め込むRRWEIフレームワークを提案する。
提案フレームワークは,広範囲の攻撃シナリオにおいて,ビットエラー率を大幅に低減し,より安定した性能を実現する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:50:53 GMT)
Small Gradient Norm Regret for Online Convex Optimization [19.7] 我々は、$Gstar$後悔は、既存の$Lstar$(小さな損失)後悔を厳しく洗練させることを示した。
結果をダイナミックな後悔と盗賊の設定にまで拡張します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:11:01 GMT)
Towards Visually Explaining Statistical Tests with Applications in Biomedical Imaging [19.6] サンプルレベルと特徴レベルの説明で深部2サンプルテストを強化するための,説明可能な深部統計的テストフレームワークを提案する。
この研究は統計的推論と説明可能なAIを橋渡しし、医療画像における解釈可能なラベルなし人口分析を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:27:23 GMT)
Autoregressive deep learning for real-time simulation of soft tissue dynamics during virtual neurosurgery [19.5] 従来の数値解法は、しばしばリアルタイムのパフォーマンス要求を満たすのに不足する。
本稿では,一過性脳の変形を効率的にシミュレートする深層学習に基づく代理モデルを提案する。
さらに、トレーニングされた代理モデルを対話型神経外科シミュレーション環境に統合し、シミュレーションステップあたり10ミリ秒未満のランタイムを実現する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:25:32 GMT)
A Security Framework for Chemical Functions [19.5] 化学システムをノイズの多い課題としてモデル化する統一的なフレームワークであるケミカル関数を導入します。
有限状態とインスタンス状態の両方における化学関数のロバスト性、非閉塞性、予測不可能性を定義する。
製品内認証や共有鍵生成への応用を実証する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:36:00 GMT)
A Survey of Security Challenges and Solutions for Advanced Air Mobility and eVTOL Aircraft [19.2] 本調査では,AAM(Advanced Air Mobility)システムに関連する,既存のおよび想定されたセキュリティ脆弱性と防御メカニズムについてレビューする。
本稿では攻撃の分類を示し、緩和戦略を分析し、将来のAAMエコシステムに合わせたセキュアなシステムアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:22:18 GMT)
Tensor Network Assisted Distributed Variational Quantum Algorithm for Large Scale Combinatorial Optimization Problem [19.0] 組合せ最適化問題の解法として分散変分量子アルゴリズム(DVQA)を提案する。
DVQAの重要な革新は、複雑な長距離の絡み合いに頼ることなく、変数間の依存関係を保存するために、切り詰められた高階特異値分解を使用することである。
実験的に、DVQAはシミュレーションの最先端性能を達成し、ポートフォリオ最適化のためにWu Kong量子コンピュータで実験的に検証されている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:31:02 GMT)
TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers [18.9] 汎用的な意味理解を維持する汎用VLMをコーディネートする新しいアーキテクチャであるTwinBrainVLAを紹介する。
TwinBrainVLA は凍結した "Left Brain" を合成するが、これは頑健な視覚的推論を保ち、訓練可能な "Right Brain" を具体的知覚に特化している。
SimplerEnvとRoboCasaベンチマークの実験は、TwinBrainVLAが優れた操作性能を達成することを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:30:07 GMT)
Kakugo: Distillation of Low-Resource Languages into Small Language Models [18.9] Kakugoは、低リソース言語のための汎用小言語モデル(SLM)をトレーニングするために設計されたパイプラインである。
言語毎の総生成コストとトレーニングコストが50ドル未満のKakugoは、コミュニティが言語固有のAIを開発するための方法を提供している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:05:44 GMT)
VTONGuard: Automatic Detection and Authentication of AI-Generated Virtual Try-On Content [18.9] 775,000以上の実画像と合成画像を含むベンチマークデータセットであるVTONGuardを提案する。
データセットは、ポーズ、背景、服装スタイルのバリエーションを含む、さまざまな現実世界の状況をカバーする。
本結果は,各手法の強みと弱みを明らかにし,パラダイム間一般化の持続的課題を強調した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:26:06 GMT)
What Do LLMs Know About Alzheimer's Disease? Fine-Tuning, Probing, and Data Synthesis for AD Detection [18.7] 大規模言語モデル(LLM)はドメイン間の強い転送能力を示している。
本研究では,タスク関連情報を内部表現にエンコードする方法について検討する。
我々はシーケンス・ツー・シーケンス・モデルを用いて、構造的に一貫性があり、診断的に有益な合成サンプルを生成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:12:31 GMT)
Quantum state exclusion with many copies [18.6] 3つ以上の純粋な状態の任意の集合に対して、有限個のコピーで状態排除が可能であることを示す。
さらに、必要なコピーの数が任意に大きいことを示します -- 特にすべての自然数$N$に対して、$N$以下のコピーでは除外できない状態の集合を構築します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:15:41 GMT)
Probabilistic Deep Discriminant Analysis for Wind Blade Segmentation [18.1] 本稿では,Deep Discriminant Analysis (DDA)を導入し,深層ネットワークを用いたFisher criterionを直接最適化する。
安定なDDA損失関数を2つ提示し、確率損失を増大させ、確率的DDA(PDDA)をもたらす。
PDDAは出力分布におけるクラスオーバーラップを効果的に最小化し、クラス内分散を低減した高い信頼性の予測を生成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:03:51 GMT)
Discriminant Learning-based Colorspace for Blade Segmentation [18.1] 最適な色表現は、しばしば正確な画像分割を妨げるが、現代の多くのアルゴリズムはこの重要な前処理ステップを無視している。
本研究は,多次元非線形判別分析アルゴリズムであるCSDA(Colorspace Discriminant Analysis)を改良したセグメンテーションを提案する。
風力タービンブレードデータに関する実験は、ドメイン固有のセグメンテーションにおける調整前処理の重要性を強調しながら、かなりの精度の向上を示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:23:23 GMT)
CityCube: Benchmarking Cross-view Spatial Reasoning on Vision-Language Models in Urban Environments [18.0] クロスビュー空間推論は、複雑な環境における空間的理解、メンタルシミュレーション、計画の基盤となる、具体化されたAIにとって不可欠である。
都市環境における現在のVLMのクロスビュー推論能力を調査するためのベンチマークであるCityCubeを紹介する。
包括的評価では、5つの認知次元と3つの空間的関係表現に分類される5,022個の注釈付きマルチビューQAペアが特徴的である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:44:02 GMT)
Pro-AI Bias in Large Language Models [17.9] 大規模言語モデル(LLM)は、複数のドメインにわたる意思決定サポートにますます採用されている。
これらのモデルが人工知能(AI)自体に有利な体系的優先バイアスを示すかどうかを検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:03:57 GMT)
SurfSLAM: Sim-to-Real Underwater Stereo Reconstruction For Real-Time SLAM [17.7] 水中環境では、画像は光の減衰、視覚的アーティファクト、動的照明条件によって劣化する。
その結果、空気中のデータに基づいてトレーニングされたステレオ推定ネットワークは、水中ドメインに直接転送することはできない。
シミュレーションデータを用いた水中ステレオ異方性推定ネットワークのシミュレートと実時間トレーニングを可能にする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:55:23 GMT)
Beyond Known Facts: Generating Unseen Temporal Knowledge to Address Data Contamination in LLM Evaluation [17.5] トレーニングと評価のための既存のデータセットは依然として少ない。
評価データの汚染は 未解決の問題だ
我々は4.2Kの将来の四重項とそれに対応するテキスト記述からなるデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:48:42 GMT)
Large Language Model-Powered Evolutionary Code Optimization on a Phylogenetic Tree [17.1] PhyloEvolveは、GPU指向のアルゴリズム最適化をIn-Context Reinforcement Learning問題として再設計するシステムである。
本稿では,アルゴリズムの変種間の継承,分岐,組換えを捉える系統木表現を提案する。
我々は、PDEソルバ、多様体学習、スペクトルグラフアルゴリズムを含む科学計算処理のPhyloEvolveを評価する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:32:52 GMT)
"The Whole Is Greater Than the Sum of Its Parts": A Compatibility-Aware Multi-Teacher CoT Distillation Framework [17.0] CoT(Chain-of-Thought)推論は、大きな言語モデル(LLM)に優れた能力を与えるが、通常は禁止的なパラメータスケールを必要とする。
CoT蒸留は、推論技術をコンパクトな学生モデル(SLM)に伝達するための有望なパラダイムとして登場した。
我々は,教師の勾配を動的に重み付けすることで,教師の指導を適応的に融合させるフレームワークCompactを紹介する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:05:19 GMT)
Lost in Transcription: How Speech-to-Text Errors Derail Code Understanding [16.7] 本研究では,音声クエリをユーザネイティブ言語で受け付ける,コード理解のための音声駆動フレームワークを開発する。
我々は,書き起こし誤りが下流タスクのパフォーマンスに与える影響を系統的に特徴づける。
本研究は,音声インタフェースにおけるコードセンシティブ適応の必要性を裏付けるものである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:34:40 GMT)
Uncertainty-Aware Gradient Signal-to-Noise Data Selection for Instruction Tuning [16.6] 現代の命令データセットは、大きく、騒々しく、冗長であり、完全なデータの微調整はコストが高く、不要である。
本稿では,客観的な不確実性を考慮したデータ選択フレームワークであるGRADingを提案する。
本手法は, マルチアズ・ア・ジャッジ評価や人的評価において, ランダムなサブセットと強いベースラインとを一致させるか, あるいは超える。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:51:32 GMT)
Reinforcement Learning for Opportunistic Routing in Software-Defined LEO-Terrestrial Systems [16.0] 大型の低地球軌道(LEO)衛星コンステレーションはインテリジェントなルーティング戦略を必要としている。
固定宛先ではなく,現在利用可能な地上ゲートウェイにパケットを転送することで,配送遅延を最小限に抑える。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:01:14 GMT)
When Reasoning Leaks Membership: Membership Inference Attack on Black-box Large Reasoning Models [15.9] 大規模推論モデル(LRM)は、複雑なタスクを解く上での強い性能で急速に有名になった。
LRMはAPIを通じて中間的推論トレースを公開し、透明性を向上させる。
これらの痕跡がメンバーシップのシグナルを漏らし、新たなプライバシーの脅威を生じさせることがわかりました。
我々は,ブラックボックスLEMを対象とした最初のメンバシップ推論攻撃フレームワークであるBlackSpectrumを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:15:24 GMT)
A General One-Shot Multimodal Active Perception Framework for Robotic Manipulation: Learning to Predict Optimal Viewpoint [15.7] ロボット操作のための汎用的なワンショットマルチモーダル能動認識フレームワークを提案する。
このフレームワークは、最適な視点の直接推測を可能にし、データ収集パイプラインと最適な視点予測ネットワークから構成される。
その結果, フレームワークによって導かれる能動的知覚は, 把握成功率を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:12:53 GMT)
Rig-Aware 3D Reconstruction of Vehicle Undercarriages using Gaussian Splatting [15.6] 車両が走行する際、車体下部の映像を撮影するために3台のカメラ・リグを使用するエンドツーエンドパイプラインを提案する。
3Dモデルでは、検査官や顧客は下着を回転、ズーム、スライスして、さび、漏れ、衝撃を数秒で検出できる。
本手法は,正確なカメラキャリブレーション,同期映像ストリーム,カメラリグからの強い幾何学的先行情報を統合することで,広角レンズ歪みと低パララックスシーンの課題を克服する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:13:03 GMT)
IF-GEO: Conflict-Aware Instruction Fusion for Multi-Query Generative Engine Optimization [15.6] 生成エンジンは、検索したソースから直接回答を合成することで、情報検索に革命をもたらす。
ソースの可視性の向上は、GEO(Generative Engine Optimization)と呼ばれる実用的な戦略である
IF-GEOは、2つのフェーズから構成される「分枝変換」フレームワークである。 (i) 代表的な潜伏クエリから個別に最適化された選好をマイニングすること (ii) 競合認識命令融合による選好の調整によるガイド付き編集のためのグローバルリビジョン・ブループリントを合成すること。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:13:39 GMT)
Trust Me on This: A User Study of Trustworthiness for RAG Responses [15.0] 本研究では,検索強化生成システムからの応答において,異なるタイプの説明がユーザ信頼にどのような影響を及ぼすかを検討する。
ユーザの判断は、応答の明確性、行動可能性、およびそれ自身の事前知識にも大きく影響される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:30:33 GMT)
Dr. Assistant: Enhancing Clinical Diagnostic Inquiry via Structured Diagnostic Reasoning Data and Reinforcement Learning [14.9] 大規模言語モデル(LLM)は、幅広い知識保護、検索、コミュニケーション能力のために、医療において広く採用されている。
LLMは医療ベンチマークにおいて有望であり、その診断的推論と調査のスキルは制限されている。
本稿では,(1)抽象的な臨床推論ロジックを捉えるための臨床診断推論データ(CDRD)構造と,その構築のためのパイプライン,(2)臨床推論と検査技術を備えた臨床診断モデルであるDr. Assistantを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:43:57 GMT)
SCRIPTMIND: Crime Script Inference and Cognitive Evaluation for LLM-based Social Engineering Scam Detection System [14.7] ソーシャルエンジニアリングの詐欺は、パーソナライズされたマルチターン詐欺をますます採用している。
大規模言語モデル(LLM)は詐欺の特定を約束する一方で、認知支援の可能性はまだ探索されていない。
自動推論と人間の認識を橋渡しするLLMベースの詐欺検出のための統合フレームワークScriptMindを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:11:00 GMT)
A model of errors in transformers [14.5] 決定論的出力を必要とするタスクにおけるLLMの誤り率と,少人数の代替案から引き出されたトークンの繰り返し処理について検討する。
注意機構の小さな誤差がしきい値を超えたときに、誤った予測が生じることを論じる。
エラー率を減らすためにプロンプトを構築する方法を示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:27:03 GMT)
HateXScore: A Metric Suite for Evaluating Reasoning Quality in Hate Speech Explanations [14.3] textsfHateXScoreは、モデル説明の推論品質を評価するために設計されたメトリクススイートである。
ヘイトスピーチのデータセットを6つ評価しました
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:13:07 GMT)
Learning Fine-Grained Correspondence with Cross-Perspective Perception for Open-Vocabulary 6D Object Pose Estimation [14.3] 微粒化対応ポース推定(FiCoP)は、ノイズの発するグローバルマッチングから空間的に制約されたパッチレベル対応へ移行するフレームワークである。
FiCoPは、最先端の手法と比較して平均リコールを8.0%と6.1%改善する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:48:54 GMT)
HeteroCache: A Dynamic Retrieval Approach to Heterogeneous KV Cache Compression for Long-Context LLM Inference [14.2] トレーニング不要な動的圧縮フレームワークであるHeteroCacheを提案する。
We show that HeteroCache achieves state-of-the-art performance on multiple long-context benchmarks and accelerates decoding by up $3times$ in the original model in the 224K context。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:35:06 GMT)
Auditory Brain Passage Retrieval: Cross-Sensory EEG Training for Neural Information Retrieval [14.2] Brain Passage Retrieval (BPR)は、中間テキスト翻訳なしで脳波信号を通過表現にマッピングする。
聴覚脳波は音声インタフェースと視覚障害者の効果的な検索を可能にするか?
本研究は,BPRにおける聴覚脳波を初めて体系的に調査し,クロスセンセーショナルトレーニングの利点を評価する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:22:41 GMT)
Business Logic-Driven Text-to-SQL Data Synthesis for Business Intelligence [14.0] プライベートビジネスインテリジェンス設定におけるテキスト対the4%)エージェントの評価は、現実的でドメイン固有のデータが不足しているため、難しい。
本稿では,ビジネスペルソナや業務シナリオ,複雑な質問に根ざしたデータを生成するビジネス論理駆動型データ合成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:21:59 GMT)
The Hidden Toll of Social Media News: Causal Effects on Psychosocial Wellbeing [13.8] この調査では、BlueSkyプラットフォーム上で26万の投稿と4500万のコメントの大規模なデータセットを活用している。
情緒的,行動的,認知的結果の観点から,心理社会的幸福度を検討した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:46:51 GMT)
BACH-V: Bridging Abstract and Concrete Human-Values in Large Language Models [13.8] 本稿では,概念的理解を3つの能力に分解する抽象化基盤フレームワークを提案する。
人間の価値観をテストベッドとして利用し、探索(内部アクティベーションにおける値トレースの検出)とステアリング(振る舞いを変えるための表現の修正)を採用する。
その結果,具体的な事象の物語や意思決定の推論において,抽象的価値記述のみに基づいて訓練された診断プローブが同一の値を確実に検出できることが判明した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:26:58 GMT)
ToolCaching: Towards Efficient Caching for LLM Tool-calling [13.7] キャッシュは、冗長あるいは反復的なツール呼び出し要求の問題に対する古典的な解決策である。
効率的な機能駆動型アダプティブキャッシュフレームワークであるToolCachingを提案する。
ToolCachingはキャッシュヒット率を最大11%向上し,標準ポリシよりも34%低レイテンシを実現している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:25:59 GMT)
Lost in the Prompt Order: Revealing the Limitations of Causal Attention in Language Models [13.4] 大きな言語モデルは、プロンプトの構造に対して驚くほどの感度を示す。
複数選択質問応答では、質問とオプション(CQO)の前にコンテキストを置くと、逆順(QOC)が14%以上向上する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:54:22 GMT)
Neural Induction of Finite-State Transducers [13.3] ニューラルネットワークによって学習された隠れ状態幾何に従って、非重み付き有限状態トランスデューサ(FST)を自動的に構築する新しい手法を提案する。
提案手法は, 実世界の形態変化, グラファイム・音素予測, および歴史的正規化のためのデータセット上で評価され, 構築されたFSTが多くのデータセットに対して極めて正確かつ堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:30:38 GMT)
Layer-adaptive Expert Pruning for Pre-Training of Mixture-of-Experts Large Language Models [13.3] 本研究では,Mixture-of-Experts (MoE) Large Language Models (LLMs) の事前学習段階に対するLayer-Adaptive Expert Pruning (LAEP)アルゴリズムを導入する。
総合的な実験により、LAEPはモデルのサイズを効果的に減らし、事前学習効率を大幅に改善することが示された。
特に、1010Bベースモデルをスクラッチから事前トレーニングする場合、LAEPはトレーニング効率を48.3%改善し、33.3%のパラメータ削減を実現している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:39:04 GMT)
Diffusion-Guided Backdoor Attacks in Real-World Reinforcement Learning [13.2] バックドア攻撃は、強化学習ポリシーに隠された悪意のある振る舞いを埋め込み、テスト時にトリガーを使用してそれらをアクティベートする。
既存の攻撃のほとんどはシミュレーションでのみ検証されているが、実際のロボットシステムでの有効性はまだ不明である。
これまでに見過ごされてきた問題を考察し,現実世界のRLに対する拡散誘導型バックドアアタックフレームワーク(DGBA)を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:03:51 GMT)
Reasoning or Pattern Matching? Probing Large Vision-Language Models with Visual Puzzles [13.1] このサーベイは、LVLMにおける視覚パズル推論の統一的な視点を提供する。
共通の抽象化を通じて視覚パズルをフレーム化し、それらがターゲットとする推論メカニズムによって既存のベンチマークを編成する。
我々は、不安定な一般化、知覚と推論の密接な絡み合い、流動的な説明と忠実な実行の間の永続的なギャップなど、現在のモデルにおける一貫した限界を識別する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:02:04 GMT)
Software Testing in the Quantum World [13.0] 量子ソフトウェアが複雑化するにつれて、量子コンピュータの古典的なシミュレーションは実現不可能になる。
本稿では,大規模量子ソフトウェアをテストする上での課題と,それに対応するソフトウェア工学的視点について述べる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:09:24 GMT)
Copy-Trasform-Paste: Zero-Shot Object-Object Alignment Guided by Vision-Language and Geometric Constraints [12.7] 2つのメッシュのゼロショット3Dアライメントについて,その関係を記述したテキストプロンプトを用いて検討した。
テスト時の相対的なポーズの最適化,翻訳,回転,等方的スケールの更新,CLIP駆動の勾配による検討を行った。
我々の手法は、意味論的に忠実で物理的に妥当なアライメントをもたらす全ての代替手段より優れています。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:12:55 GMT)
PAS-Mamba: Phase-Amplitude-Spatial State Space Model for MRI Reconstruction [12.5] 本稿では、周波数領域における位相と等級モデリングを分離し、画像領域の特徴と組み合わせて再構築するフレームワークを提案する。
IXI と fastMRI の膝のデータセットの実験では、PAS-Mamba は芸術再建手法の状態を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:53:35 GMT)
AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents on Software Development [12.5] 大規模言語モデル(LLM)ベースのコーディングエージェントは、プルリクエストの生成とマージを行う自律的なコントリビュータとして機能するようになっている。
本稿では,オープンソースリポジトリにおけるエージェント導入の経時的因果関係について検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:51:56 GMT)
DRGW: Learning Disentangled Representations for Robust Graph Watermarking [12.5] 本稿では,この問題に対処する最初のグラフ透かしフレームワークであるDRGWを提案する。
具体的には,多様な摂動に対する不変構造表現を学習する逆学習エンコーダを設計する。
また,離散グラフ編集における潜時修正の問題を解消する構造認識エディタも開発している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:55:18 GMT)
Device Association and Resource Allocation for Hierarchical Split Federated Learning in Space-Air-Ground Integrated Network [12.5] 6Gは宇宙空間統合ネットワーク(SAGIN)におけるフェデレートラーニング(FL)の展開を促進する
本稿では,階層的分割型フェデレート学習フレームワークを提案し,損失関数の上限を導出する。
元の問題をいくつかのサブプロブレムに分解し、デバイスアソシエーションとリソース割り当てのための反復最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:24:10 GMT)
The Role of Prosodic and Lexical Cues in Turn-Taking with Self-Supervised Speech Representations [12.4] 音声の韻律や語彙を従来よりもクリーンに制御するためのボコーダに基づくアプローチを提案する。
韻律に整合した無知雑音の予測はクリーン音声の精度に類似していることが判明した。
将来のモデルはプロソディのみを必要とし、プライバシと潜在的なパフォーマンスのメリットを提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:45:12 GMT)
GeoDynamics: A Geometric State-Space Neural Network for Understanding Brain Dynamics on Riemannian Manifolds [12.4] 状態空間モデル(SSM)は、脳力学の解明の基礎となっている。
我々は,高次元SPD多様体上での潜在脳状態軌跡を直接追跡する幾何学的状態空間ニューラルネットワークGeoDynamicsを紹介する。
GeoDynamicsは、各接続マトリックスを多様体対応の繰り返しフレームワークに組み込み、タスク駆動の状態変化とアルツハイマー病、パーキンソン病、自閉症の早期マーカーを明らかにするスムーズな遷移を学ぶ。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:56:06 GMT)
Explore Brain-Inspired Machine Intelligence for Connecting Dots on Graphs Through Holographic Blueprint of Oscillatory Synchronization [12.4] まず,脳のリズムを,HoloBrainと呼ばれる自発同期神経振動の干渉によってモデル化した。
結合振動の人工力学系を用いた脳リズムのモデル化の成功は、HoloGraphと呼ばれる共有同期機構に基づく脳にインスパイアされたマシンインテリジェンスの「第一原理」を動機付けている。
私たちのHoloGraphフレームワークは、グラフニューラルネットワークにおける過度に滑らかな問題を効果的に緩和するだけでなく、グラフ上の問題を推論し解決する強力な可能性も示しています。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:15:21 GMT)
VERIDAH: Solving Enumeration Anomaly Aware Vertebra Labeling across Imaging Sequences [12.2] 列挙異常の同定は、慢性の腰痛と手術計画に潜在的な臨床的意味を持つ。
The Vertebra Identification with Anomaly Handling (VERIDAH) is a novel vertebra labeling algorithm based on multiple classification head with a weighted vertebra sequence prediction。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:22:59 GMT)
On the Role of Rotation Equivariance in Monocular 3D Human Pose Estimation [11.7] 我々は,3次元ポーズ推定における単眼的設定,すなわち単一視点入力について考察する。
ここでは、単一の2次元入力画像から人間の骨格関節の3D点集合を予測する。
回転した入力に遭遇すると、一般的な昇降モデルは失敗する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:41:08 GMT)
HyperWalker: Dynamic Hypergraph-Based Deep Diagnosis for Multi-Hop Clinical Modeling across EHR and X-Ray in Medical VLMs [11.6] 動的ハイパーグラフとテストタイムトレーニングによって臨床推論を再構築するフレームワークである textbfHyperWalker を提案する。
MIMICとEHRXQAの医療用VQAを用いたMRG実験は、HyperWalkerが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:48:09 GMT)
On Autopilot? An Empirical Study of Human-AI Teaming and Review Practices in Open Source [11.4] プロジェクトレベルのガイドラインとAI支援プルリクエスト(PR)との開発者のインタラクションについて検討した。
AIが共著するPRの67.5%以上が、コードオーナシップのないコントリビュータから生まれています。
非オーナーの開発者が最もフィードバックを受けられるような、人間が作ったPRとは対照的に、非オーナーのAI共著のPRは最小限のフィードバックを受け取っている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:09:53 GMT)
FantasyVLN: Unified Multimodal Chain-of-Thought Reasoning for Vision-Language Navigation [11.2] VLN(Vision-and-Language Navigation)は、マルチモーダル命令と視覚空間コンテキストを協調的に理解するために、エンボディエージェントを必要とする。
最近の研究は、解釈可能性と長期計画を改善するために、CoT(Chain-of-Thought)推論の可能性を示している。
明示的なトークンオーバーヘッドを伴わずにCoT推論の利点を保った暗黙的推論フレームワークであるFantasyVLNを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:54:10 GMT)
PAC-Private Responses with Adversarial Composition [11.1] PACプライバシは、任意のブラックボックス機能に対して、インスタンスベースのプライバシ保証を提供する。
適応雑音校正による逆合成を実現する新しいアルゴリズムを提案する。
実験により, ステップごとのプライバシー予算が極端に小さく, 有効性が高いことがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:53:39 GMT)
TREX: Tokenizer Regression for Optimal Data Mixture [10.9] Tokenizer Regression for Optimal Data MiXture (TREX)は、トークン処理者のトレーニングに最適なデータ混合物を効率的に予測する回帰ベースのフレームワークである。
TREXは、ランダムな混合物上で小規模なプロキシトークンを訓練し、圧縮統計を収集し、データ混合物から圧縮性能を予測する。
TReXの予測混合物は、LLaMA3と均一分布に基づいて混合物を最大12%圧縮する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:41:09 GMT)
DisasterVQA: A Visual Question Answering Benchmark Dataset for Disaster Scenes [10.8] 災害VQAは、現実世界の画像1,395枚と、洪水、山火事、地震などの多様な出来事にまたがる4,405枚の専門家による質問応答からなる。
我々は、7つの最先端のビジョン言語モデルをベンチマークし、問題タイプ、災害カテゴリ、地域、人道的タスクにまたがるパフォーマンスの変動を見出す。
災害VQAは、より堅牢で運用上意味のある災害対応のための視覚言語モデルの開発をガイドする、挑戦的で実用的なベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:50:46 GMT)
Highly Deformable Proprioceptive Membrane for Real-Time 3D Shape Reconstruction [10.8] この研究は、光導波路センシングに基づく、柔らかく、柔軟で、伸縮性のあるプロバイオセプティブシリコン膜を提供する。
膜センサーは、エッジマウントされたLEDと中央分散フォトダイオード(PD)を統合し、多層エラストマー複合材料に埋め込まれた液体金属トレースを介して相互接続する。
大規模な面外変形のリアルタイムな再構成は90Hzで達成され、シャンファー距離によって平均1.3mmの復元誤差が測定される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:59:21 GMT)
Modality as Heterogeneity: Node Splitting and Graph Rewiring for Multimodal Graph Learning [10.7] 本稿では,ノード分割とグラフ交換機構を統合したマルチモーダルグラフ学習フレームワークNSG(Node Splitting Graph)-MoEを提案する。
各ノードをモダリティ固有のコンポーネントに明示的に分解し、不均一なメッセージフローを処理するためにリレーションアウェアの専門家を割り当てる。
3つのマルチモーダルベンチマークの実験は、NSG-MoEが強いベースラインを一貫して超えることを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:38:50 GMT)
VirtualCrime: Evaluating Criminal Potential of Large Language Models via Sandbox Simulation [10.6] 大規模言語モデル(LLM)は、多段階の意思決定、計画、行動において強力な能力を示している。
その強い問題解決能力が犯罪に悪用されるかどうかが問題である。
本稿では,3エージェントシステムに基づくサンドボックスシミュレーションフレームワークであるVirtualCrimeを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:59:53 GMT)
DiffFace-Edit: A Diffusion-Based Facial Dataset for Forgery-Semantic Driven Deepfake Detection Analysis [10.4] 我々は、200万以上のAI生成フェイク画像を含むDiffFace-Editデータセットを紹介した。
8つの顔領域(例えば目、鼻など)にまたがる編集機能を備えており、より多様な編集機能を備えている。
具体的には,検出器回避サンプルが検出モデルに与える影響を具体的に分析する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:21:43 GMT)
AgenticRed: Optimizing Agentic Systems for Automated Red-teaming [10.3] 我々は人的介入なしに反復的に赤チームシステムを設計・洗練するための自動パイプラインであるAgenticRedを紹介した。
メタエージェントサーチなどの手法に触発されて,進化的選択を用いたエージェントシステムを進化させる新しい手法を開発した。
AgenticRedが設計したレッドチームシステムは、最先端のアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:10:22 GMT)
Weather-R1: Logically Consistent Reinforcement Fine-Tuning for Multimodal Reasoning in Meteorology [10.2] WeatherQAは気象学の新しいマルチモーダル推論ベンチマークである。
LoCo-RFTは論理一貫性報酬を導入することで自己コントラを解消する。
気象R1は、気象学における論理的忠実性を持つVLMの最初の推論である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:00:15 GMT)
MASCOT: Towards Multi-Agent Socio-Collaborative Companion Systems [10.1] マルチパースペクティブな社会協力型コンパニオンのための一般化可能なフレームワークであるMASCOTを提案する。
MASCOTは、個人と集団の振る舞いを調和させる新しい双方向最適化戦略を導入した。
当社のフレームワークは,次世代のソーシャルインテリジェントマルチエージェントシステムを構築するための実用的なロードマップを提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:44:04 GMT)
Atomic Depth Estimation From Noisy Electron Microscopy Data Via Deep Learning [10.0] この手法は意味的セグメンテーション問題として定式化深度推定に基づいている。
我々は、深部畳み込みニューラルネットワークを訓練し、ピクセル単位の深度セグメンテーションマップを生成することにより、得られたセグメンテーション問題に対処する。
シミュレーション画像と実世界のTEMデータからCeO2ナノ粒子中の原子列の深さを推定するために本手法を適用した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:35:53 GMT)
Temporal-Spatial Decouple before Act: Disentangled Representation Learning for Multimodal Sentiment Analysis [10.0] 本稿では,各モーダルを時間的ダイナミックスと空間的構造的コンテキストに明示的に分離するTSDA法を提案する。
あらゆるモダリティに対して、時間エンコーダと空間空間エンコーダは、別々の時間的および空間的な体に信号を伝達する。
F-Consistent Cross-Modal Alignmentは、時間的特徴と時間的特徴と、時間的特徴と、空間的特徴とを一致させる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:50:40 GMT)
SHARE: A Fully Unsupervised Framework for Single Hyperspectral Image Restoration [9.9] ハイパースペクトル画像(HSI)の復元は、計算画像とコンピュータビジョンの基本的な課題である。
本稿では、低ランクスペクトルモデリングと幾何同値原理を統一する、完全に教師なしのフレームワークであるSHAREを提案する。
提案手法は最先端の教師なし手法よりも優れており,教師付き手法に匹敵する性能を実現している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:01:13 GMT)
A scalable near-visible integrated photon-pair source for satellite quantum science [9.8] 統合フォトニクスはスケーラブルなソリューションを提供するが、重要なスペクトルギャップは持続する。
広帯域超低損失窒化ケイ素マイクロ共振器を用いた近視光子対光源を試作した。
このソースは、日光量子通信と軌道上のマルチ光子干渉を必要とするプロトコルのための飛行可能なハードウェア基盤を構成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:35:24 GMT)
PREFAB: PREFerence-based Affective Modeling for Low-Budget Self-Annotation [9.6] 低予算の自己アノテーションであるPreFABは、完全なアノテーションではなく、感情的な反射領域をターゲットにしている。
PreFABは、相対的な感情変化を検出するために嗜好学習モデルを採用し、アノテータは刺激の残りの部分を補間しながら、選択したセグメントのみをラベル付けするように指示する。
その結果、PreFABは、作業負荷を軽減しつつ、感情的インフレクションをモデル化する上で、ベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:30:13 GMT)
PREGEN: Uncovering Latent Thoughts in Composed Video Retrieval [9.5] Composed Video Retrieval (CoVR)は、クエリビデオと修正テキストに基づいてビデオを取得することを目的としている。
現在のCoVR法は、現代のビジョンランゲージモデル(VLM)を完全に活用できない
これらの制限を克服する効率的で強力なCoVRフレームワークであるPregenを紹介します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:57:04 GMT)
VENI: Variational Encoder for Natural Illumination [9.3] 逆レンダリングは不適切な問題であるが、照明前処理のような先行処理はそれを単純化することができる。
2次元投影に頼らずに球面上の自然照明をモデル化する回転同変変変分オートエンコーダを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:38:02 GMT)
Principled Latent Diffusion for Graphs via Laplacian Autoencoders [9.2] LG-Flowはグラフ拡散フレームワークである。
置換同変オートエンコーダは各ノードを固定次元埋め込みにマッピングし、完全な隣接性は確実に回復可能である。
提案手法は,最先端グラフ拡散モデルに対する競合的な結果を得ると同時に,最大1000倍の高速化を実現する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:37:53 GMT)
Fairness or Fluency? An Investigation into Language Bias of Pairwise LLM-as-a-Judge [9.1] LLM-as-a-judgeの2種類の言語バイアスについて検討した。
同言語の判断では、言語家族間で大きなパフォーマンス格差があり、ヨーロッパ語はアフリカ語を一貫して上回っている。
言語間判断において、ほとんどのモデルは英語の解答を好んでおり、この選好は質問言語よりも解答言語によって影響される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:33:33 GMT)
Attention-space Contrastive Guidance for Efficient Hallucination Mitigation in LVLMs [9.0] 大きな視覚言語モデルにおける幻覚は、言語が視覚的証拠を支配するときにしばしば起こる。
本稿では,視覚言語と言語のみの注意経路を構築するために,自己注意層内で動作するシングルパス機構であるContrastive Guidance(ACG)を提案する。
ACGは、計算コストを大幅に削減しつつ、最先端の忠実さとキャプション品質を達成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:04:18 GMT)
Unsupervised Deformable Image Registration with Local-Global Attention and Image Decomposition [9.0] 変形可能な画像登録は、医療画像解析において重要な技術であり、疾患診断、マルチモーダル核融合、手術ナビゲーションなどの臨床実践に広く応用されている。
近年のディープラーニングの進歩は、特徴整合性を改善するための注意に基づくメカニズムを導入しているが、高い解剖学的多様性を持つ領域を正確に登録することは依然として困難である。
本研究では,新しい非教師付きデフォルマブル画像登録フレームワークであるLGANet++を提案する。このフレームワークは,特徴の相互作用と融合のためのユニークな技術と統合され,登録精度,堅牢性,一般化性を向上する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:19:13 GMT)
MirageNet:A Secure, Efficient, and Scalable On-Device Model Protection in Heterogeneous TEE and GPU System [8.9] モデルトレーニングのコストとユーザエクスペリエンスの要件が高ければ、モデルのプライバシとランタイムオーバーヘッドのバランスをとることが重要です。
本稿では,モデルの機密性や整合性を保ちながら,低レイテンシと高精度を実現する新しい難読化手法であるConvShatterを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:39:09 GMT)
Measuring the State of Open Science in Transportation Using Large Language Models [8.9] オープンサイエンスのイニシアチブは、科学の完全性を強化し、多くの分野における研究の進歩を加速してきた。
オープンサイエンスの主要な特徴は、ここではデータとコードの可用性として定義されており、フィールド固有の複雑さのために抽出するのが困難である。
本稿では,交通研究におけるデータとコード可用性を計測する,自動かつスケーラブルな特徴抽出パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:39:52 GMT)
Simulated Ignorance Fails: A Systematic Study of LLM Behaviors on Forecasting Problems Before Model Knowledge Cutoff [8.7] シミュレート・イグノランス(SI)は、プレカットオフ知識の抑制を促すモデルが潜在的な解決策として浮上した。
477の競合レベルの質問と9つのモデルで、SIは体系的に失敗する。
我々は,プレカットイベントのRFは方法論的に欠陥があると結論付けた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:21:55 GMT)
ParkingTwin: Training-Free Streaming 3D Reconstruction for Parking-Lot Digital Twins [8.7] ParkingTwinは、オンラインストリーミング3D再構築のためのトレーニング不要で軽量なシステムである。
エントリーレベルのGTX 1660では30FPS以上で動作する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:03:58 GMT)
Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging [8.6] ClaSP PE(Class-stratified Scheduled Power Predictive Entropy)を導入する。
ClaSP PEは、標準的な不確実性に基づくアクティブラーニングメソッドの2つの重要な制限に対処する、シンプルで効果的なクエリ戦略である。
AL法が3次元セグメンテーションに適応したランダムベースラインを一貫して上回り得ることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:29:50 GMT)
Eliciting Harmful Capabilities by Fine-Tuning On Safeguarded Outputs [8.5] 堅牢に保護されたモデルでさえ、オープンソースモデルで有害な機能を引き出すために使用することができる。
我々の研究は、アウトプットレベルのセーフガードによる生態系レベルのリスク軽減の課題を示しています。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:24:44 GMT)
Zero-Shot Speech LLMs for Multi-Aspect Evaluation of L2 Speech: Challenges and Opportunities [8.3] 本稿では,5000発のSpeechocean762発声に対して,命令付き言語LLMであるQwen2-Audio-7B-Instructのゼロショット性能を評価する。
このモデルは精度、流派、韻律、完全性のスコアを生成し、+-2許容範囲内の人間の評価と強い一致を示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:48:38 GMT)
UniHash: Unifying Pointwise and Pairwise Hashing Paradigms for Seen and Unseen Category Retrieval [8.2] 本稿では,統一ハッシュ(UniHash)を提案する。
UniHashは2つの相補的なブランチで構成されている: ポイントワイドパラダイムに従うセンターベースのブランチとペアワイドパラダイムに従うペアワイドブランチである。
分岐間の双方向の知識伝達を可能にし、ハッシュコードの識別性と一般化を改善するため、新しいハッシュコード学習法が導入された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:21:08 GMT)
Causal feature selection framework for stable soft sensor modeling based on time-delayed cross mapping [8.1] 因果的特徴選択は、産業応用におけるソフトセンサーモデルの性能を向上させることができる。
本稿では,時間遅れのクロスマッピングに基づく因果的特徴選択フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:58:51 GMT)
Vulnerability of LLMs' Belief Systems? LLMs Belief Resistance Check Through Strategic Persuasive Conversation Interventions [8.0] 小さなモデルは極端なコンプライアンスを示し、最初の説得的なターンで80%以上の信念の変化が生じる。
メタ認知は、堅牢性を高めるのではなく、信念の侵食を加速することで脆弱性を増大させる。
これらの知見は、現在のロバストネス介入のモデル依存性のかなりの限界を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:43:55 GMT)
How Hyper-Datafication Impacts the Sustainability Costs in Frontier AI [8.0] 本研究では、サステナビリティレンズを用いて、AIにおける大規模データの環境、社会的、経済的コストについて検討する。
Hugging Face Hubから約550,000のデータセットを分析します。
我々は、実績、資源意識、所有権、オープン性、虚偽性、標準にまたがるData PROOFSレコメンデーションを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:54:37 GMT)
LLM Augmented Intervenable Multimodal Adaptor for Post-operative Complication Prediction in Lung Cancer Surgery [7.9] 肺癌術後合併症のリスクを予測するための深層学習アーキテクチャであるMIRACLEを提案する。
MIRACLEはヘテロジニアス入力の超球面埋め込み空間融合を採用し、堅牢で差別的な特徴の抽出を可能にする。
我々は,Roswell Park Comprehensive Cancer Centerで手術を受けた3,094人の肺癌患者を対象とした実世界のPOC-Lに対するアプローチを検証した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:58:12 GMT)
Optimizing Energy and Data Collection in UAV-aided IoT Networks using Attention-based Multi-Objective Reinforcement Learning [7.9] 無人航空機(UAV)は、特にデータ収集作業において、無線ネットワークサービスにとってますます重要になっている。
既存のアルゴリズムは限られたトレーニングデータに悩まされており、非常にダイナミックな環境でパフォーマンスを損なう。
本研究では,都市環境におけるデータ収集とエネルギー消費のトレードオフを明示的に扱う多目的強化学習アーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:55:11 GMT)
CatMaster: An Agentic Autonomous System for Computational Heterogeneous Catalysis Research [7.8] 自然言語要求を完全な計算作業空間に変換する,大規模言語モデル(LLM)駆動エージェントシステムであるCatMasterを提案する。
CatMasterは、インスペクションと再起動性のための重要な事実、制約、ファイルポインタの永続的なプロジェクト記録を維持している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:51:12 GMT)
Communication-Free Collective Navigation for a Swarm of UAVs via LiDAR-Based Deep Reinforcement Learning [7.7] 本稿では,無人航空機(UAV)群を通信密度の高い環境で集団航行するためのDRL(Deep reinforcement Learning)に基づく制御手法を提案する。
明示的なコミュニケーションを伴わずにグループをガイドする生物学的群集に触発されて、私たちは暗黙的なリーダー・フォロワーの枠組みを採用している。
このパラダイムでは、リーダーだけがゴール情報を持ち、従者UAVはオンボードLiDARセンシングのみを使用して堅牢なポリシーを学ぶ。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:46:09 GMT)
DExTeR: Weakly Semi-Supervised Object Detection with Class and Instance Experts for Medical Imaging [7.6] 本稿では,DexTeR (DETR with Experts) について紹介する。
オブジェクトクエリとして単一ポイントアノテーションをエンコードし、提案されたクラス誘導の変形可能な注意で特徴抽出を洗練する。
異なる医療領域にまたがる3つのデータセットにわたる最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:27:14 GMT)
Orthogonium : A Unified, Efficient Library of Orthogonal and 1-Lipschitz Building Blocks [7.6] Orthogoniumは、Orthogonal層と1-Lipschitz層を提供する、統一的で効率的で包括的なPyTorchライブラリである。
Orthogoniumは、厳密な数学的保証を維持しながら、歩数、拡張、グループ化、転置を含む標準的な畳み込み機能へのアクセスを提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:33:14 GMT)
StoTAM: Stochastic Alternating Minimization for Tucker-Structured Tensor Sensing [7.5] 低ランクテンソルセンシングは、信号処理と機械学習の幅広い応用において基本的な問題である。
既存のリカバリ手法は、高価なテンソルプロジェクションを持つフルテンソル変数で動作するか、あるいはまだフル段階の計算に依存している分解式を採用するかのいずれかである。
本研究では、タッカー因子化の下でコアテンソルと係数行列を直接操作する交互最小化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:18:20 GMT)
MVGD-Net: A Novel Motion-aware Video Glass Surface Detection Network [7.2] ガラスの表面は、日常生活とプロの環境の両方でユビキタスであり、視覚ベースのシステムに潜在的な脅威をもたらす。
動きの不整合を利用して映像中のガラス表面を検出するための新しいネットワークMVGD-Netを提案する。
ネットワークの学習には,312種類のガラスシナリオと合計19,268フレームからなる大規模データセットも提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:19:17 GMT)
Counterexample Classification against Signal Temporal Logic Specifications [7.2] Signal Temporal Logic (STL) は、ハイブリッドシステムの望ましい振る舞いを特定するための仕様言語として広く採用されている。
実際には、これらの反例は異なる原因から起こりうるので、異なるシステム欠陥に関係している。
パラメトリック信号時間論理(PSTL)を用いて各クラスを表す分類基準を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:57:20 GMT)
PAtt: A Pattern Attention Network for ETA Prediction Using Historical Speed Profiles [6.9] 本稿では,過去の速度パターンよりも注意機構を生かしたETAモデルを提案する。
このアーキテクチャは、モデルを軽量かつスケーラブルにしながら、効率的かつ正確なETA推定を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:51:35 GMT)
Scalable Knee-Point Guided Activity Group Selection in Multi-Tree Genetic Programming for Dynamic Multi-Mode Project Scheduling [6.8] 我々は,活動の有望なサブセットを特定するために,膝点に基づく選択機構を導入する。
両タイプのルールを同時に進化させるマルチツリーGPフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:13:11 GMT)
ReSearch: A Multi-Stage Machine Learning Framework for Earth Science Data Discovery [6.8] 我々は,地球科学データ発見を定式化した多段階推論型検索フレームワークであるtextbfReSearchを紹介した。
ReSearchは、語彙検索、セマンティック埋め込み、省略拡張、および統合アーキテクチャ内での大規模言語モデルの再配置を統合している。
実験によると、ReSearchはベースラインメソッドよりもリコールとランキングのパフォーマンスを継続的に改善している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:27:12 GMT)
Knowledge Graph-Assisted LLM Post-Training for Enhanced Legal Reasoning [6.8] LLMポストトレーニングは主に、ドメイン知識の構造を捉えることなく、大きなテキストコーパスと人間のフィードバックに依存している。
これによりモデルは複雑な推論タスク、特に高度な専門ドメインを扱うのに苦労する。
本稿では,法律におけるLLMの推論能力を高めるための知識グラフ(KG)支援手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:06:34 GMT)
Learning Domain-Invariant Representations for Cross-Domain Image Registration via Scene-Appearance Disentanglement [6.7] ドメインシフトによる画像登録は、コンピュータビジョンと医用画像の基本的な課題である。
本稿では,この課題に対処する一貫したフレームワークであるSAR-Netを提案する。
対象登録誤差の中央値(rTRE)は0.25%であり, 最先端のMEVIS法(0.27% rTRE)を7.4%上回り, 99.1%の堅牢性を示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:01:19 GMT)
Multi-Location Software Model Completion [6.7] 我々は,新たなグローバル埋め込み型次フォーカス予測器であるNextFocusを提案する。
NextFocusは、初めてマルチロケーションモデル補完を行うことができる。
平均のPrecision@kスコアは$k leq 10$で0.98で、3つのベースラインアプローチよりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:19:34 GMT)
Reasoning or Fluency? Dissecting Probabilistic Confidence in Best-of-N Selection [6.6] 本稿では,段階間因果摂動の3つのクラスを導入し,推論ステップ間の依存関係を体系的に破壊する。
選択精度は、これらの破壊の下ではわずかに低下する。
本稿では,ステップ間の因果関係を明確に分離する対照的な因果関係尺度を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:46:33 GMT)
Practitioner Views on Mobile App Accessibility: Practices and Challenges [6.6] 本稿では,43ヶ国110のモバイルアプリ開発者を対象に,混合手法による調査を行った。
結果として、開発者はしばしばプラットフォーム固有のガイドラインに依存し、通常、開発プロセスの後半にコンプライアンステストを実行します。
我々は、新しいプラットフォーム固有の障壁を特定し、アクセシビリティの実践が開発者エクスペリエンスレベルによってどのように異なるかを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:30:02 GMT)
Self-Improvement as Coherence Optimization: A Theoretical Account [6.5] 議論、ブートストラップ、内部コヒーレンスといった手法は、外部の監督なしに言語精度を向上させる。
これらはすべてコヒーレンス最適化の特別なケースであり、最も圧縮可能で、共同で予測可能なコンテキスト・ツー・ビヘイビアマッピングを見つけることを示しています。
予備実験で支持された我々の理論は、なぜフィードバックのない自己改善が機能するのかを説明し、それが成功するか失敗するかを予測する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:50:02 GMT)
RIM Hand : A Robotic Hand with an Accurate Carpometacarpal Joint and Nitinol-Supported Skeletal Structure [5.9] RIMハンド(RIM Hand)は、手根手根手関節を正確に再現する生体模倣ロボットハンドである。
フル・トゥ・メタカル解剖学をモデル化することにより、腱駆動指による現実的な手のひら変形を可能にする。
柔軟なシリコーン皮膚により、接触摩擦と接触面積が増大し、多様な物体を安定的につかむことができる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:48:04 GMT)
Efficient Coordination with the System-Level Shared State: An Embodied-AI Native Modular Framework [5.8] 本稿では,デカップリングと明示的なシステムレベルのプリミティブを実現するモジュール型フレームワークANCHORを提案する。
ANCHORは、(i)標準化された共有状態の進化可能な契約であるCanonical Recordsを、(ii)多対多の普及とフィードバック指向の調整のための通信バスから分離する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:21:52 GMT)
HALT: Hallucination Assessment via Latent Testing [5.8] 大きな言語モデルにおける幻覚は、忠実な読み出しの失敗と解釈できる。
質問トークンの中間隠蔽状態から直接幻覚リスクを読み取る残差プローブを提案する。
高速な選択生成とルーティングのためのエージェント批評家として,プローブをデプロイする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:16:10 GMT)
XD-MAP: Cross-Modal Domain Adaptation using Semantic Parametric Mapping [5.6] 本稿では,センサ固有の知識を画像データセットからLiDARに転送する手法を提案する。
我々のXD-MAPは、カメラ画像上のニューラルネットワークからの検出を活用して意味的パラメトリックマップを作成する。
その結果,手動ラベリングを使わずにLiDARデータに対して高い性能を実現する手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:00:26 GMT)
engGNN: A Dual-Graph Neural Network for Omics-Based Disease Classification and Feature Selection [5.5] グラフニューラルネットワーク(GNN)は、機能関係をグラフとしてエンコーディングすることで、事前知識を統合するための有望な手段を提供する。
本稿では,外部生物ネットワークとデータ駆動型生成グラフを併用したデュアルグラフフレームワークである,外部で生成したグラフニューラルネットワーク(engGNN)を提案する。
engGNNは一貫して最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 23:18:56 GMT)
End-to-End Reverse Screening Identifies Protein Targets of Small Molecules Using HelixFold3 [5.4] 高精度な生体分子構造予測モデルであるHelixFold3を用いたエンド・ツー・エンドのリバース・スクリーニング手法を提案する。
従来の逆ドッキングと比較すると, スクリーニング精度が向上し, 構造忠実度, 結合位置精度, ターゲット優先度が向上した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:45:53 GMT)
Performance and Complexity Trade-off Optimization of Speech Models During Training [5.3] 音声機械学習では、ニューラルネットワークモデルは通常、固定された層の大きさと構造を持つアーキテクチャを選択することで設計される。
全体的なアーキテクチャは通常、タスクの事前の知識によってガイドされるが、個々のレイヤのサイズは、しばしば選択される。
プルーニング法とは異なり,本手法では,対象の性能・複雑さのトレードオフに対して,モデルサイズを動的に最適化する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:00:05 GMT)
Empowering LLMs for Structure-Based Drug Design via Exploration-Augmented Latent Inference [5.1] 大言語モデル(LLM)は、表現力と推論能力を持っているが、構造に基づく薬物設計(SBDD)への応用は、タンパク質構造や予測不可能な分子生成の理解が不十分なため制限されている。
本研究では,LLM生成過程を符号化,遅延空間探索,復号化ワークフローとして再解釈するフレームワークであるELILLM(Exploration-Augmented Latent Inference for LLMs)を提案する。
ELILLMは、デコードモジュールを使用して、よく知られた領域を処理し、化学的に有効で合成学的に合理的な分子を生成することで、モデル現在の知識を超えた設計問題の部分を明示的に探求する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:10:48 GMT)
Understanding Mental States to Guide Social Influence in Multi-Person Group Dialogue [5.0] SocialMindChangeは、心の追跡から、社会的相互作用における心の変化へと移行するベンチマークである。
我々は1200の社会的コンテキストを構築し、6000のシナリオと90,000以上の質問をカバーし、それぞれが現実主義と品質を検証した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:41:26 GMT)
Bridging the Gap Between Estimated and True Regret Towards Reliable Regret Estimation in Deep Learning based Mechanism Design [4.9] 本稿では,計算コストを削減しつつ,後悔推定精度を大幅に向上させるガイド付き精細化手法を提案する。
提案手法は,ディープラーニングに基づくオークション機構におけるインセンティブの適合性を評価するための,より信頼性の高い基盤を提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:54:28 GMT)
Sticky Help, Bounded Effects: Session-by-Session Analytics of Teacher Interventions in K-12 Classrooms [4.9] 本研究は,学生の先行支援履歴とその関与状態が教師の意思決定をどのように形成するかを考察する。
知的学習システムMATHiaにおいて,14のクラスにまたがる339人の生徒を対象に,14万の学生システムインタラクションを分析した。
ヘルプはセッション内の即時学習と一致したが、後のセッションではスキル獲得を予測できなかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:15:01 GMT)
Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering [4.8] SDLC(Software Development Life Cycle)におけるLCM-MAシステムにおけるトークン消費パターンの分析を行う。
GPT-5推論モデルを用いて、ChatDevフレームワークによって実行される30のソフトウェア開発タスクの実行トレースを分析する。
予備的な結果は、反復コードレビューの段階が平均59.4%のトークン消費の大多数を占めていることを示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:52:14 GMT)
SWE-Tester: Training Open-Source LLMs for Issue Reproduction in Real-World Repositories [4.7] SWE-Testerは、問題再現テストを生成するためにオープンソースのLLMをトレーニングするための新しいパイプラインである。
まず、オープンソースのGitHubリポジトリ2.6Kから41Kインスタンスの高品質なトレーニングデータセットをキュレートします。
微調整されたモデルでは、SWT-Bench Verifiedにおける最大10%の成功率と21%の変更カバレッジの絶対的な改善を実現している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:10:56 GMT)
The Orchestration of Multi-Agent Systems: Architectures, Protocols, and Enterprise Adoption [4.7] 本稿では,オーケストレーションされたマルチエージェントシステムの技術構成の統合と形式化を行う。
計画、ポリシー執行、状態管理、品質操作を一貫性のあるオーケストレーション層に統合する統合アーキテクチャフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:13:53 GMT)
How Worst-Case Are Adversarial Attacks? Linking Adversarial and Statistical Robustness [4.6] 敵攻撃はモデル堅牢性を評価するために広く利用されているが、ランダム摂動に対するロバスト性のためのプロキシとしての有効性については議論が続いている。
逆方向の摂動は、同じ大きさのランダムノイズの下で頑健さを代表的に推定するか、あるいは非典型的な最悪の事象を反映するかを問う。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:24:47 GMT)
Internal Deployment Gaps in AI Regulation [4.6] 企業が自社組織に高度に能力のあるシステムをデプロイする場合に、ハイステークなアプリケーションが内部で発生する可能性がある。
本稿では、2025年の米国と欧州連合におけるフロンティアAI規制が、内部展開をどのように扱うかを検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:50:14 GMT)
Hidden in Plain Text: Measuring LLM Deception Quality Against Human Baselines Using Social Deduction Games [4.5] 大規模言語モデル(LLM)エージェントは、多くのアプリケーションでますます使われており、その安全性に対する懸念が高まっている。
マフィアでは,会話を通じて他人を騙すことに成功度が左右される。
我々は GPT-4-Turbo を用いたマフィア検出器を作成し、プレイヤーロール情報なしでゲームスクリプティングを分析し、マフィアプレーヤーを予測する。
その結果,マフィア検出器のマフィア予測精度は人間のゲームよりもLDMゲームの方が低いことがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:07:21 GMT)
Towards Transparent Malware Detection With Granular Explainability: Backtracking Meta-Coarsened Explanations Onto Assembly Flow Graphs With Graph Neural Networks [4.4] 本稿では,グラフデータとしてバイナリ実行ファイルのアセンブリフローを表現するために,アセンブリフローグラフ(AFG)を提案する。
AFGは、グラフニューラルネットワーク(GNN)を用いたマルウェア検出の透明性を高めるために必要な詳細な説明を抽出するために使用できる。
また,グラフリダクションによる計算トラクタビリティ向上のためのメタコア化手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:05:07 GMT)
Real-Time Wildfire Localization on the NASA Autonomous Modular Sensor using Deep Learning [4.4] 我々は、NASAautonomous Modular Sensor (AMS) から人間による注釈付きデータセットを導入する。
我々のデータセットは、赤外(IR)、短波赤外(SWIR)、熱を含む12の異なるチャンネルのスペクトルデータを合成する。
本研究では, 深層学習モデルを用いて, 火災周囲決定の人為的集中プロセスを自動化する実験を行った。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:56:34 GMT)
An Empirical Study on Remote Code Execution in Machine Learning Model Hosting Ecosystems [4.4] モデルローディング中の信頼できないコードの実行は、モデル共有プラットフォームに対するセキュリティ上の懸念である。
5つの主要なモデル共有プラットフォームにわたるカスタムモデルローディングプラクティスに関する、最初の大規模な実証的研究を行います。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:13:42 GMT)
Interpretable and Sparse Linear Attention with Decoupled Membership-Subspace Modeling via MCR2 Objective [4.4] 既存の設計では、MCR2における「メンバーシップ行列」と「サブスペース行列U」の密結合は、不正なトークン射影の下で冗長な符号化を引き起こす。
我々は、MCR2目標における「メンバーシップ行列」と「サブスペースU」の機能的関係を分離し、解釈可能なスパース線形アテンション演算子を導出する。
実験結果から,Token Statistics TransformerのアテンションモジュールをDMSAに置き換えれば,符号化速度が向上し,ImageNet-1Kデータセット上のトップ1精度が1.08%~1.45%向上することがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:11:40 GMT)
TractRLFusion: A GPT-Based Multi-Critic Policy Fusion Framework for Fiber Tractography [4.3] トラクトグラフィーにおける永続的な課題は、急激な接続を最小化しながら、白質のトラクトを正確に再構築することである。
我々はデータ駆動型融合戦略を通じて複数のRLポリシーを統合する新しいGPTベースのポリシー融合フレームワークであるTractRLFusionを提案する。
提案手法では, 効果的な政策融合のための2段階のトレーニングデータ選択プロセスを使用し, 続いて, 堅牢性と一般化性を高めるために, マルチクリティック微調整フェーズを用いる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:26:38 GMT)
Truth with a Twist: The Rhetoric of Persuasion in Professional vs. Community-Authored Fact-Checks [4.3] ファクトチェックのエコシステムにおける説得手法の有病率と種類を定量化する。
コミュニティが生み出した文書が主観的あるいは説得的な言葉に大きく依存しているという証拠は見つからない。
群衆のレーダは、特定の問題のある修辞的手段の使用を解析するのに効果的である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:04:09 GMT)
Predicting Long-Term Self-Rated Health in Small Areas Using Ordinal Regression and Microsimulation [4.2] オープンソースのマイクロシミュレーションはアイルランドの人口を未来に投影するために使われる。
通常の回帰は、社会的・経済的特性に基づいて個人の自己評価された健康を予測するために利用される。
将来的には、高齢化の影響が社会経済的成果の他の改善を上回る可能性があることが示される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:57:57 GMT)
Resilient Routing: Risk-Aware Dynamic Routing in Smart Logistics via Spatiotemporal Graph Learning [4.2] 本稿では,時空間グラフニューラルネットワーク(ST-GNN)と最適化を統合したリスク対応動的ルーティング(RADR)フレームワークを提案する。
RADRアルゴリズムはサプライチェーンのレジリエンスを大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:06:35 GMT)
APEX-Agents [4.2] エージェントのためのAI生産性指数(APEX-Agents)は、AIエージェントが長期のクロスアプリケーションタスクを実行できるかどうかを評価するベンチマークである。
Gemini 3 Flash(Thinking=High)は24.0%、GPT-5.2(Thinking=High)、Claude Opus 4.5(Thinking=High)、Gemini 3 Pro(Thinking=High)が続く。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:53:44 GMT)
Progressive self-supervised blind-spot denoising method for LDCT denoising [4.2] 低線量CT(LDCT)画像の聴取において,自己教師あり学習がますます研究されている。
LDCT画像にのみ依存する新たな自己教師型トレーニング戦略を提案する。
我々は、段階的に段階的に条件付き独立を強制する段階的な盲点決定機構を導入する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:35:02 GMT)
Domain-Adaptation through Synthetic Data: Fine-Tuning Large Language Models for German Law [4.1] 大規模言語モデル(LLM)は、専門知識が限られているため、法的推論のような専門分野に苦しむことが多い。
本稿では, 新たな合成データ生成手法を用いて, ドイツの法的問題に高度LLMを適応させる効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:11:51 GMT)
Reasoning is a Modality [4.1] 人間の知性に中心的な能力である抽象的推論を研究する。
現代のAIシステムは、行動予測マシンとして動作する。
人間は内部状態の復号化によって行動を説明することができ、一方AIシステムは流動的なポストホックな合理化を生成することができる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:37:17 GMT)
Agentic AI Meets Edge Computing in Autonomous UAV Swarms [3.9] エージェントAIは、大規模言語モデル(LLM)をベースとして、自律的な推論、計画、実行によって、新たな運用可能性を開く。
しかし、インフラ制約、動的環境、マルチエージェント調整の計算要求は、現実世界の展開を制限する。
本稿では,LLMベースのエージェントAIとエッジコンピューティングを統合し,UAV群におけるスケーラブルでレジリエンスな自律性を実現する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:45:33 GMT)
The Impact of Machine Learning Uncertainty on the Robustness of Counterfactual Explanations [3.9] モデルの不確実性に対して, 反事実的説明が極めて敏感であることを示す。
モデル精度が小さくても、生成したカウンターファクトのバリエーションが大きくなる可能性がある。
これらの知見は、金融や社会科学といった分野における不確実性を考慮した説明手法の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:45:25 GMT)
Pedagogical Alignment for Vision-Language-Action Models: A Comprehensive Framework for Data, Architecture, and Evaluation in Education [3.8] 軽量VLAモデルに教育的アライメントを適用するフレームワークであるtextitPedagogical VLA Frameworkを提案する。
物理,化学,生物学,地球科学にまたがる5つの科学実験において,教育的VLAフレームワークを評価した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:43:15 GMT)
From Quotes to Concepts: Axial Coding of Political Debates with Ensemble LMs [3.8] 我々は、大言語モデル(LLM)で軸符号化を運用する。
長い書き起こしをコンパクトで階層的に構造化されたコードやカテゴリに変換する。
今後の研究をサポートするため、発話とコードの全データセットを公開しています。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:20:31 GMT)
Towards Effective Negation Modeling in Joint Audio-Text Models for Music [3.8] 共同音声テキストモデルは否定のような意味的な現象と競合する。
テキスト拡張による否定と異種性に基づくコントラスト損失を導入する。
本稿では,検索および二項分類タスクとして,否定モデリングをフレーム化する2つのプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:06:48 GMT)
Fisher-Informed Parameterwise Aggregation for Federated Learning with Heterogeneous Data [3.8] フェデレーション学習は、分散クライアントからのモデル更新を集約する。
FedAvgのような標準のファーストオーダーメソッドは、各クライアントのすべてのパラメータに同じスカラーウェイトを適用します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:18:09 GMT)
A longitudinal geospatial multimodal dataset of post-discharge frailty, physiology, mobility, and neighborhoods [3.8] GEOFRAIL(GEOFRAIL)は、地域在住の高齢者の退院後に収集した縦断的データセットである。
データは、プライバシを保存する空間アグリゲーションを備えた標準化されたパイプラインを使用して、放電後8週間にわたって収集された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:11:35 GMT)
SandWorm: Event-based Visuotactile Perception with Active Vibration for Screw-Actuated Robot in Granular Media [3.7] SandWorm(サンドワーム)は、ローコモーションを強化するために、周囲の動きによって強化されたネジ作動ロボットである。
SWTacは、能動的に振動するエラストマーを持つ、イベントベースの新規ビゾタクティルセンサーである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:25:50 GMT)
A Unified Variational Imputation Framework for Electric Vehicle Charging Data Using Retrieval-Augmented Language Model [3.7] 電気自動車の充電データのための新しい確率的変動計算フレームワークを開発した。
PRAIMは、訓練済みの言語モデルを使用して、異種データをエンコードし、時系列要求、カレンダー機能、地理空間コンテキストにまたがる。
PRAIMは、計算精度と元のデータの統計分布を保存する能力の両方において、確立されたベースラインを著しく上回っている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:17:54 GMT)
XR: Cross-Modal Agents for Composed Image Retrieval [3.6] Composed Image Retrieval (CIR)はこのシフトを例示している。
我々は,学習不要なマルチエージェントフレームワークであるXRを導入し,検索を段階的に協調した推論プロセスとして再編成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:57:00 GMT)
Multi-objective fluorescent molecule design with a data-physics dual-driven generative framework [3.6] LUMOSは、蛍光分子の逆設計のためのデータおよび物理駆動のフレームワークである。
ニューラルネットワークと高速時間依存密度汎関数理論(TD-DFT)計算ワークフローを組み合わせる。
蛍光特性予測の精度、一般化可能性、物理的妥当性の点で、ベースラインモデルより一貫して優れている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:41:02 GMT)
Advances in non-Hermitian dynamics of quadratic bosonic systems [3.6] 非エルミート物理学は急速に進歩する研究分野として現れてきた。
非エルミート的性質が量子効果に与える影響は、探索を待っている重要な問題である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:50:25 GMT)
Topological Anderson insulator and reentrant topological transitions in a mosaic trimer lattice [3.6] 一次元準周期ポテンシャル変調モザイク三量体格子の位相特性について検討する。
準周期性障害は異なる充填量に対して複数の異なる効果をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:12:27 GMT)
Differentiated Pickup Point Offering for Emission Reduction in Last-Mile Delivery [3.5] 本研究は、配送トラックルートと顧客旅行からの排出を共同で削減することを目的とした、差別化ピックアップポイントオファリング(DPO)政策を提案する。
DPOの下では、到着した各顧客は、すべての場所において制限のない選択ではなく、単一の推奨ピックアップポイントが提供される。
計算実験により、分化したピックアップポイントは炭素排出量を大幅に削減できることが示された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:00:42 GMT)
Generative AI-enhanced Probabilistic Multi-Fidelity Surrogate Modeling Via Transfer Learning [3.3] High-fidelity (HF) データは入手に乏しく、計算コストも低いが、low-fidelity (LF) データは豊富だが精度は低い。
生成的伝達学習に基づく確率的多要素サロゲートフレームワークを開発した。
本研究では,多くの粗いメッシュ (LF) シミュレーションと有限セットのファインメッシュ (HF) シミュレーションを組み合わせることで,鉄筋コンクリートスラブベンチマークのアプローチを検証した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:03:46 GMT)
LLMOrbit: A Circular Taxonomy of Large Language Models -From Scaling Walls to Agentic AI Systems [3.2] この調査では、8つの相互接続軌道次元を通して、15の組織にわたる50以上のモデルを調査した。
1)データ不足(2026-2028年までに減少する9-27Tトークン)、(2)指数的なコスト増加(5年間で3M~3M+)、(3)持続不可能なエネルギー消費(22倍)の3つの重大な危機を識別する。
トレーニング後ゲイン(RLHF, GRPO, pure RL)、DeepSeek-R1(79.8% MATH)、効率革命(MoEルーティング18x効率、マルチヘッド遅延注意8xKVキャッシュ圧縮)により、GPT-4レベルのパフォーマンスを$で実現している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:06:19 GMT)
A Converse Bound via the Nussbaum-Szkoła Mapping for Quantum Hypothesis Testing [3.1] 本稿では,Nussbaum-Szkoa写像に基づく非対称量子仮説テストのための新しい下界を提案する。
提案された境界は1つの式から生じ、場合によっては古典的な結果の直接的利用を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:48:28 GMT)
Human Values in a Single Sentence: Moral Presence, Hierarchies, and Transformer Ensembles on the Schwartz Continuum [3.0] 本研究では, シュワルツ動機づけ連続体における19個の値の文レベル同定を, テキスト中の人的価値検出の具体的な定式化として検討した。
この設定は、まばらな道徳的な手がかりと厳しい階級不均衡を特徴としている。
まず、二項道徳的存在感タスク("does any value appear?")を運用し、単一の文から学習可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:25:33 GMT)
'1'-bit Count-based Sorting Unit to Reduce Link Power in DNN Accelerators [3.0] 本研究では、畳み込みニューラルネットワーク(CNN)に最適化された比較自由選別ユニットのハードウェア実装を提案する。
本設計では,データリオーダのリンク電力の利点を保ちながら,ハードウェア領域の削減を実現している。
我々の近似ソートユニットは、正確な実装の20.42%に比べて、19.50%のBT削減を維持しながら、最大35.4%の面積削減を実現している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:47:36 GMT)
Uncovering and Understanding FPR Manipulation Attack in Industrial IoT Networks [2.9] 本稿では,悪意のあるパケットを,機械学習に基づくNIDSの攻撃として誤分類できることを示す。
これは理論上可能なだけでなく、NIDSに対する特定の脅威でもあることを実証する。
実験により、この新たな攻撃は80.19%から100%の成功率をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:57:40 GMT)
AttackMate: Realistic Emulation and Automation of Cyber Attack Scenarios Across the Kill Chain [2.9] 敵エミュレーションツールは、サイバー攻撃チェーンのスクリプティングと自動実行を容易にする。
本稿では,実際の攻撃者の動作パターンを模倣したオープンソースの攻撃スクリプティング言語と実行エンジンであるAttackMateを紹介する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:04:59 GMT)
SUNSET -- A Sensor-fUsioN based semantic SegmEnTation exemplar for ROS-based self-adaptation [2.8] アーキテクチャに基づく自己適応の厳密かつ反復的な評価を可能にするROS2ベースの例であるSUNSETを提案する。
SUNSETには、セグメンテーションパイプライン、トレーニングされたMLモデル、不確実性注入スクリプト、ベースラインコントローラ、ステップバイステップの統合と評価ドキュメントが含まれている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:40:57 GMT)
A Modulated Electron Lattice (MEL) Criterion for Metallic Superconductivity [2.8] 超伝導の理論における中心的な未解決の問題は、なぜ一部の金属元素だけが超伝導状態を示すのかである。
金属超伝導は, 特定のMEL拡張窓を満たす場合にのみ出現することを示す。
ある金属が超伝導を発達する一方で、他の金属が超伝導を起こさない理由を同定し、BCSパラダイムの中で長い間開かれている選択問題を解消する可能性がある。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:43:05 GMT)
VisTIRA: Closing the Image-Text Modality Gap in Visual Math Reasoning via Structured Tool Integration [2.7] 視覚言語モデル(VLM)は、同じ問題がテキストではなく画像として提示される場合、数学的推論においてテキストのみの言語モデルより遅れる。
本稿では、与えられた数学問題を(画像として)自然言語の有理数に分解することで、構造化された問題解決を可能にするツール統合推論フレームワークであるVisTIRAを紹介する。
ツール統合監視により画像ベース推論が向上し,OCRグラウンド化により,より小さなモデルのギャップをさらに狭めることができることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:54:49 GMT)
HoverAI: An Embodied Aerial Agent for Natural Human-Drone Interaction [2.7] HoverAIは、ドローンモビリティ、インフラストラクチャ非依存の視覚投影、リアルタイムの会話AIを統合プラットフォームに統合する、実施済みの航空エージェントである。
HoverAIは、視覚と音声を通じてユーザを知覚し、ユーザ人口に適応するリップシンクアバターを介して応答する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:59:49 GMT)
Generalizing Abstention for Noise-Robust Learning in Medical Image Segmentation [2.6] 禁制機構はクロスエントロピーの能力を高めることによって分類タスクに有効であることが証明されている。
本稿では,多種多様な損失関数のノイズ・ロバスト性を向上させる,普遍的かつモジュラーな禁忌フレームワークを提案する。
本フレームワークは, 抑止動作を誘導する情報正規化項と, 抑止ペナルティのためのより柔軟な省力性に基づく自動チューニングアルゴリズムの2つの重要なコンポーネントによる事前作業を改善する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:57:56 GMT)
Optical Linear Systems Framework for Event Sensing and Computational Neuromorphic Imaging [2.5] イベントビジョンセンサ(ニューロモルフィックカメラ)は、ログ強度閾値の交差によって引き起こされる非同期ON/OFFイベントを出力する。
非線形系として、この事象表現は、ほとんどの計算イメージングと光学系設計の基盤となる線形フォワードモデルと容易には統合されない。
本稿では,イベントストリームを1ピクセルあたりの対数強度と強度微分の推定値にマッピングし,これらの測定結果を動的線形系モデルに組み込む物理基底処理パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:23:22 GMT)
TrackletGPT: A Language-like GPT Framework for White Matter Tract Segmentation [2.4] 我々は,トラックレットを用いてトークンのシーケンシャル情報を再導入する言語ライクなGPTフレームワークであるTrackletGPTを提案する。
TrackletGPTはデータセットをシームレスに一般化し、完全に自動化され、粒度の細かなサブストリームセグメント、トラックレット、スケーリングとTractography内のGPTモデルの精細化をエンコードする。
実験の結果,TrackletGPTは,TractoInfernoおよびHCPデータセットにおける平均DICE,Overlap,Overreachスコアにおいて,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:09:52 GMT)
AMVICC: A Novel Benchmark for Cross-Modal Failure Mode Profiling for VLMs and IGMs [2.4] マルチモーダル大言語モデル (MLLM) と画像生成モデル (IGM) について検討した。
我々は、画像からテキストまでのタスクとテキストから画像までのタスクの障害モードを比較するための新しいベンチマークを作成しました。
この結果から,障害モードはモデルとモダリティの間で共有されることが多いが,特定の障害はモデル固有かつモダリティ固有であることがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:06:58 GMT)
On the Generalization Gap in LLM Planning: Tests and Verifier-Reward RL [2.4] 細調整された大規模言語モデル(LLM)は、PDDL計画タスクにおいて、高い有効計画記憶率を達成することができる。
しかし、これが移行可能な計画能力やドメイン固有の一般化を反映しているかどうかは不明だ。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:25:37 GMT)
Patterning: The Dual of Interpretability [2.3] パターン化は,各解の局所学習係数をターゲットとして,モデルが学習するアルゴリズムを選択することができることを示す。
結果は、内部構造を読むのに使用されるのと同じ数学的枠組みが、それを記述するために逆転可能であることを証明している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:15:27 GMT)
Agentic SPARQL: Evaluating SPARQL-MCP-powered Intelligent Agents on the Federated KGQA Benchmark [2.3] 我々は,既存の知識グラフ質問回答ベンチマークをエージェント型知識グラフ質問回答(FKGQA)に拡張する方法について議論する。
我々の研究は、エージェントAIと実りある組み合わせに向けた自動SPARQLクエリフェデレーションの以前の作業を補完し、拡張します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:17:03 GMT)
BioNIC: Biologically Inspired Neural Network for Image Classification Using Connectomics Principles [2.2] 我々は、MICrONsデータセットからの詳細なシナプス接続グラフにインスパイアされた感情分類のためのフィードフォワードニューラルネットワークであるBioNICを提案する。
構造レベルでは、マウス一次視覚皮質(V1)の1つの皮質列から導かれる構造的制約を組み込む。
機能レベルでは, ホメオスタディレギュレーションを伴うヘビアンシナプス可塑性, 層正規化, 知覚入力における自然変動に対するデータ露出のモデル化, 神経性モデリングのためのシナプスノイズ。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:58:30 GMT)
Secure Multi-Path Routing with All-or-Nothing Transform for Network-on-Chip Architectures [2.2] 悪意のあるノードによる盗聴攻撃は、最も一般的でステルス的だ。
準群に基づくAll-Or-Nothing変換を利用した軽量な秘密保持フレームワークを提案する。
提案手法は,悪質なルータによる盗聴攻撃を非許容領域と性能上のオーバーヘッドで効果的に軽減する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:25:30 GMT)
Balancing Fairness and High Match Rates in Reciprocal Recommender Systems: A Nash Social Welfare Approach [2.2] マッチングプラットフォーム上での相互レコメンデータシステム(RRS)の公平性について検討する。
フェアディビジョンの観点から、推奨されるユーザの機会を定義し、エロフリーネスというフェアネスの概念を確立します。
我々はSinkhornアルゴリズムに基づくSW/NSW/$-SW法に対する計算効率の良い近似アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:18:25 GMT)
DroneVLA: VLA based Aerial Manipulation [2.2] 本研究は,高レベルの自然言語コマンドを解釈してオブジェクトを検索し,人間の手に届ける,自律航空操作システムという新しい概念を導入する。
このシステムは、Grounding DINOとVision-Language-Actionモデルに基づくMediaPipeと、1-DOFグリップとIntel RealSense RGB-Dカメラを備えたカスタムドローンを統合することを意図している。
実世界におけるローカライゼーションとナビゲーションの実証実験により,最大0.164m,0.070m,0.084m,平均ユークリッド,ルート平均2乗のシステムの有効性を実証した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:08:00 GMT)
Who Should Have Surgery? A Comparative Study of GenAI vs Supervised ML for CRS Surgical Outcome Prediction [2.1] 慢性副鼻腔炎(CRS)の術前予後予測について検討した。
全患者が手術を受けた前向きに収集したコホートでは,術前臨床データのみを用いたモデルで,予後不良者を特定することができた。
最適MLモデル(MLP)は、キャリブレーションと決定曲線ネットの利点に優れた精度で85%の精度を達成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:07:58 GMT)
Sample Efficient Learning of Body-Environment Interaction of an Under-Actuated System [2.1] これらの手法をテストするために作られた物理ロボットの運動追跡データから運動地図を学習する方法を比較する。
以上の結果から,小規模なトレーニングデータセットよりも優れている単純な手法と,より多くのトレーニングデータが利用可能である場合に優れている高度な手法とのトレードオフが示された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:33:54 GMT)
Language, Caste, and Context: Demographic Disparities in AI-Generated Explanations Across Indian and American STEM Educational Systems [2.1] 本稿では,LLMが学生プロフィールの知的能力をどのように捉えているのかを,異なる文化的文脈における辺境的アイデンティティの交差から問う。
インドにおけるカースト、教科、教育委員会、および人種、HBCU出席者、アメリカにおける学校タイプを組み合わせたプロフィールを構築し、所得や大学階層といった普遍的な要因について検討する。
両文脈の背景を疎外したプロファイルに低品質な出力を提供するバイアスを観察する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:58:45 GMT)
Unpacking Security Scanners for GitHub Actions Workflows [2.0] GitHub Actionsは広く使われているプラットフォームで、開発者はプロジェクトのビルドとデプロイを自動化することができる。
プラットフォームの人気が高まり続けており、近年のソフトウェアサプライチェーン攻撃のターゲットとなっている。
GitHub Actionsの強化を支援するために、いくつかのセキュリティスキャナが登場した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:25:11 GMT)
Large Data Limits of Laplace Learning for Gaussian Measure Data in Infinite Dimensions [2.0] Laplace Learningは、部分的にラベル付けされたデータセットから欠落したラベルを見つけるためのソリューションである。
無限次元空間上のルベーグ測度は、データが有限次元でない場合、解析を必要とする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:14:05 GMT)
Foundations of Global Consistency Checking with Noisy LLM Oracles [2.0] グローバルな一貫性の検証には,最悪の場合,指数関数的に多くのオラクルクエリが必要です。
本稿では,最小整合部分集合を同定する適応的な分割・コンカレントアルゴリズムを提案する。
合成および実オーラクルを用いた実験により,本手法は不整合を効率よく検出し,局所化することを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:02:35 GMT)
Generative Adversarial Networks for Resource State Generation [2.0] 本稿では,量子資源状態生成を逆設計タスクとして再キャストする物理インフォームド・ジェネレーティブ・アダクティブ・アダクショナル・ネットワークフレームワークを提案する。
タスク固有のユーティリティ関数をトレーニングに組み込むことで、テレポーテーションと絡み合いのブロードキャストに最適化された有効な2量子状態を生成することを学ぶ。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:04:57 GMT)
Active Cross-Modal Visuo-Tactile Perception of Deformable Linear Objects [2.0] 本稿では,変形可能な線形物体(DLO)の3次元形状再構成のためのクロスモーダルビズオ触覚認識フレームワークを提案する。
視覚に大きく依存する既存の手法とは異なり、提案手法は基礎モデルに基づく視覚知覚と適応探索を統合している。
以上の結果から,本フレームワークは,大部分閉塞しても,単純・高度に湾曲した単線または複数本のケーブル構成を正確に再構築することを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:57:59 GMT)
Cosmo-FOLD: Fast generation and upscaling of field-level cosmological maps with overlap latent diffusion [1.9] 本稿では,宇宙学および天体物理学の3次元場を高速に生成する新しい手法を提案する。
我々は,TNG300-2ダークマター密度とガス温度場を,体積の1%しか訓練されていないモデルから生成することができる。
これらの結果は、元のシミュレーションコストのごく一部で得られ、1つのGPUで生成される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:00:04 GMT)
LLM Security and Safety: Insights from Homotopy-Inspired Prompt Obfuscation [1.9] 我々は,大規模言語モデルにおけるセキュリティと安全性の脆弱性の理解を高めるために,ホモトピーに着想を得た迅速な難読化フレームワークを提案する。
実験には15,732のプロンプトが含まれており、LLama、Deepseek、KIMIによるコード生成、Claudeによる検証が含まれている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:51:15 GMT)
Automatic Adjustment of HPA Parameters and Attack Prevention in Kubernetes Using Random Forests [1.8] 本稿では,実験シナリオとしてHTTPステータスコードをHPA内のカスタムメトリクスとして使用する。
機械学習からランダムフォレスト分類アルゴリズムを統合することにより、攻撃を評価し予測する。
このアプローチは、ターゲットとする攻撃シナリオにおける機械学習スクリプトを使用したHPAパラメータの調整を可能にする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:08:06 GMT)
Hidden-in-Plain-Text: A Benchmark for Social-Web Indirect Prompt Injection in RAG [1.8] ウェブ対応RAG評価のためのコンパクトで再現可能なベンチマーク・アンド・ハーネスであるOpenRAG-Socを提供する。
このスイートは、交換可能なスパースと密集したレトリバーとデプロイ可能な緩和を組み合わせた社会的なコーパスである。
摂取から生成までのエンドツーエンド評価を標準化し、応答時の1つの応答の攻撃時刻を報告する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:27:06 GMT)
GeoSteer: Faithful Chain-of-Thought Steering via Latent Manifold Gradients [1.8] 中間推論の品質を向上させる多様体ベースのフレームワークであるGeoSteerを提案する。
本手法は,(1)ステップレベルのスコアを持つCoTデータセットの構築,(2)変分オートエンコーダ(VAE)モデルと品質推定モデルを用いて,高品質なCoT軌道の低次元多様体を学習し,(3)潜在空間の高品質領域に向けて目標LLMの隠れ状態を操る。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:37:44 GMT)
RL-BioAug: Label-Efficient Reinforcement Learning for Self-Supervised EEG Representation Learning [1.8] ラベル効率強化学習(RL)エージェントを利用して最適な拡張ポリシーを自律的に決定するフレームワークであるRL-BioAugを提案する。
実験の結果,RL-BioAugはランダム選択戦略よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:38:01 GMT)
Remapping and navigation of an embedding space via error minimization: a fundamental organizational principle of cognition in natural and artificial systems [1.7] 多様な知能の出現する分野は、非常に異なる構成、構成、および基質のエージェントにおける問題解決の総合的な見解を求める。
本稿では, 自然系と合成系の双方における認知が, 2つの重要な不変量間の相互作用によって特徴づけられ, 理解されることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:57:36 GMT)
SoundBreak: A Systematic Study of Audio-Only Adversarial Attacks on Trimodal Models [1.7] 音声、視覚、言語を統合するマルチモーダル基礎モデルは、推論および生成タスクにおいて強力なパフォーマンスを達成する。
我々は,3モーダルな音声・ビデオ言語モデルに対する,音声のみの敵対的攻撃という,現実的で過小評価された脅威モデルについて検討する。
音声のみの摂動は重度のマルチモーダル障害を引き起こし、最大96%の攻撃成功率を達成できることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:53:29 GMT)
Fusion Segment Transformer: Bi-Directional Attention Guided Fusion Network for AI-Generated Music Detection [1.7] 我々は、Fusion Segment Transformerと呼ばれるSegment Transformerの改良版を提案する。
これまでの研究と同様に、多様な特徴抽出器を用いて短い音楽セグメントからコンテンツ埋め込みを抽出する。
我々は、Gated Fusion Layerを導入して、AI生成音楽のフルオーディオ検出のためのアーキテクチャを強化する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:31:05 GMT)
Kaleidoscope Yang-Baxter Equation for Gaudin's Kaleidoscope models [1.7] 本稿では,DN対称性とその可積分性との関係について詳細に検討する。
座標Bethe ansatzによるモデルの可解性は、散乱行列によって満たされる一貫性関係だけでなく、解を求める部分空間の境界条件や対称性にも依存することを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:50:54 GMT)
MARBLE: Multi-Agent Reasoning for Bioinformatics Learning and Evolution [1.6] バイオインフォマティクスモデルのための実行安定型自律モデル改良フレームワークMARBLEを紹介する。
MARBLEは、複数の改良サイクルにわたる強力なベースラインよりも持続的なパフォーマンス改善を実現している。
フレームワークレベルの分析は、構造化された議論、バランスのとれたエビデンスの選択、そしてパフォーマンスに基づくメモリが、安定的で繰り返し可能なモデルの進化に不可欠であることを示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:10:47 GMT)
A universal linearized subspace refinement framework for neural networks [1.6] 本稿では、LSR(Linearized Subspace Refinement)を導入し、LSR(Linearized Subspace Refinement)とLSR(Linearized Subspace Refinement)について述べる。
LSRは、標準学習された解よりも精度が大幅に向上した洗練された予測器を得る。
複合損失構造に関する問題に対しては、一発LSRと教師付き非線形アライメントを交互に行うIterative LSRを導入する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:03:28 GMT)
DiSPA: Differential Substructure-Pathway Attention for Drug Response Prediction [1.6] DiSPAは、薬物応答の構造的および文脈的メカニズムを阻害する表現学習フレームワークである。
最先端のパフォーマンスを実現し、特に解離セットの設定が大幅に改善されている。
バルクRNA-seqデータのみをトレーニングしたDiSPAは,空間転写学へのゼロショット転送を可能にすることを実証した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:44:17 GMT)
Asymmetric regularization mechanism for GAN training with Variational Inequalities [1.5] 我々は,GANの学習をナッシュ均衡問題として定式化する。
古典的チホノフステップと新しいゼロ中心勾配ペナルティに基づく非対称正則化機構を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:50:18 GMT)
Refined Gradient-Based Temperature Optimization for the Replica-Exchange Monte-Carlo Method [1.5] レプリカ交換モンテカルロ法 (RXMC) はマルチモーダル分布からサンプリングする強力なマルコフ連鎖モンテカルロアルゴリズムである。
本稿では,勾配に基づく最適化フレームワークを拡張した改良されたオンライン温度選択手法を提案する。
提案手法は, 受入率の均一化に成功し, 温度空間を横断するラウンドトリップ時間を短縮できることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:03:32 GMT)
"Just in Time" World Modeling Supports Human Planning and Reasoning [1.5] シミュレーションに基づく推論のための「ジャスト・イン・タイム」フレームワークを提案する。
このような表現を最小限の計算量でオンラインで構築する方法を示す。
グリッドワールド計画タスクと物理推論タスクの代替モデルに対して、この説明に対する強い実証的な支持が得られます。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:08:19 GMT)
Can LLM Reasoning Be Trusted? A Comparative Study: Using Human Benchmarking on Statistical Tasks [1.5] 大規模言語モデル(LLM)は、統計的タスクと推論の質を評価する能力を解決する。
我々は、その統計的推論能力を高めるために、特別に開発されたデータセット上で、選択したオープンソースLLMを微調整した。
この結果から, 精密調整モデルでは, 統計学の学生に匹敵する高度統計処理の精度が向上していることがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:01:08 GMT)
Anonpsy: A Graph-Based Framework for Structure-Preserving De-identification of Psychiatric Narratives [1.5] 我々は、タスクをグラフ誘導セマンティックリライトとして再構成する非識別フレームワークであるAnonpsyを紹介した。
解剖学は、各物語を臨床的実体、時間的アンカー、型付き関係をコードする意味グラフに変換する。
専門家、セマンティクス、GPT-5に基づく評価の下で、診断の正確性を維持しながら、常に低い再識別リスクを達成している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:37:44 GMT)
Impact Matters! An Audit Method to Evaluate AI Projects and their Impact for Sustainability and Public Interest [1.4] 本研究では,具体的なAIプロジェクトを評価する定性的な監査手法であるImpact-AI-methodを紹介する。
この方法は、プロジェクトのガバナンス構造、変化の理論、AIモデルとデータ特性、社会的、環境的、経済的影響を捉える。
これは再利用可能な青写真として意図されており、どちらもAIの「良い」主張に関する公的な議論を伝え、AIシステムの透明性の創造をサポートする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:12:20 GMT)
Evaluating Few-Shot Temporal Reasoning of LLMs for Human Activity Prediction in Smart Environments [1.4] 既存のデータ駆動エージェントベースのモデルは、低データ環境において苦労する。
本稿では,人間の知識に基づいて事前学習された大規模言語モデルがこのギャップを埋めるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:58:17 GMT)
Composing $p$-adic qubits: from representations of SO(3)$_p$ to entanglement and universal quantum logic gates [1.4] 我々は、コンパクトな$p$-進特殊群 SO(3)$_p$ の2次元既約表現としての 1 つの$p$-進キュービットの概念に基づいて構築する。
我々は、量子情報処理の$p$-adicの定式化の基礎となる、$p$-adicの量子ビット合成と絡み合いの問題に取り組む。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:07:49 GMT)
Institutional AI: Governing LLM Collusion in Multi-Agent Cournot Markets via Public Governance Graphs [1.4] 本稿では,Institutional AIを評価するための実験フレームワークについて述べる。
このアプローチの中心はガバナンスグラフであり、法的状態、移行、制裁、回復経路を宣言する公開かつ不変なマニフェストである。
我々は、未統治(クールノット市場の構造からのベースラインインセンティブ)、憲法(固定された文書による反共憲法として実施される即時的な政策・アズ・プロンプト禁止)、制度の3つを比較した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:10:21 GMT)
Vision-Based Natural Language Scene Understanding for Autonomous Driving: An Extended Dataset and a New Model for Traffic Scene Description Generation [1.4] 本稿では,一眼レフカメライメージを簡潔な自然言語記述に変換するフレームワークを提案する。
空間的特徴抽出と意味的特徴抽出を統合し、文脈的に豊かで詳細なシーン記述を生成する。
提案モデルは高い性能を達成し,その目的を新たに開発したデータセット上で効果的に達成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:50:42 GMT)
Theory for Entangled-Photons Stimulated Raman Scattering versus Nonlinear Absorption for Polyatomic Molecules [1.3] 共役光子を用いた刺激ラマン散乱(SRS)の顕微鏡理論を開発した。
我々は光子対の時間-エネルギー相関が多原子分子のシグナルを最適化できることを実証した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:30:04 GMT)
Multilingual-To-Multimodal (M2M): Unlocking New Languages with Monolingual Text [1.3] マルチモーダルモデルは、豊富な画像テキストとオーディオテキストデータによってサポートされているが、他の言語では性能が急激に低下する。
既存のソリューションは機械翻訳に依存しているが、多言語テキストモデリングの進歩は未利用のままである。
多言語テキストの埋め込みをマルチモーダル空間にマッピングするために,M2Mを導入し,少数の線形層のみを学習する軽量アライメント手法を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:40:18 GMT)
Prosody-Guided Harmonic Attention for Phase-Coherent Neural Vocoding in the Complex Spectrum [1.3] 韻律誘導型高調波アテンションを導入し、音声セグメント符号化を強化し、逆STFTによる波形合成のための複雑なスペクトル成分を直接予測する。
ベンチマークデータセットの実験では、HiFi-GANとAutoVocoderに対する一貫した利得が示されている: F0 RMSEは22%削減され、音声/無声エラーは18%減少し、MOSスコアは0.15改善された。
これらの結果から,韻律誘導された注意と直接複素スペクトルモデリングが組み合わさることで,より自然な,ピッチ精度,頑健な合成音声が得られることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:53:24 GMT)
LatencyPrism: Online Non-intrusive Latency Sculpting for SLO-Guaranteed LLM Inference [1.3] 我々は,最初のゼロ侵入型マルチプラットフォーム遅延推論システムPrismを提示する。
パイプライン全体のレイテンシの彫刻を分解し、予測異常を積極的に警告し、コードやサービスの再起動を必要とせずにSLOへの準拠を保証することを目的としている。
我々は、根本原因分析に関する広範な実験と調査を行い、Prismの能力を実証する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:29:49 GMT)
Onset of thermalization of q-deformed SU(2) Yang-Mills theory on a trapped-ion quantum computer [1.3] 2+1)次元の$q$-deformed $mathrmSU(2)_3$ Yang-Mills理論における熱化ダイナミクスの量子シミュレーションを開発する。
我々は,F$-movesを明示的に実装した量子回路を用いて,このモデルのリアルタイムダイナミクスをシミュレートした。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:25:53 GMT)
GPU-accelerated simulated annealing based on p-bits with real-world device-variability modeling [1.2] p-bits (p-bits) を用いた確率計算は、複雑な問題解決のためのCMOSロジックの効率的な代替手段である。
本稿では,pビットをベースとしたGPUアクセラレーション,オープンソースシミュレートフレームワークを提案する。
このフレームワークはスケーラブルでアクセスしやすいツールを提供することで、確率コンピューティングの研究を進めることを目指している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:59:21 GMT)
OCCAM: Class-Agnostic, Training-Free, Prior-Free and Multi-Class Object Counting [1.2] CAC(Class-Agnostic Object Counting)は、イメージ内の任意のクラスからオブジェクトのインスタンスをカウントする。
補足情報を必要としないCACに対する初となるトレーニングフリーアプローチであるOCCAMを提示する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:36:38 GMT)
Decoder-Free Supervoxel GNN for Accurate Brain-Tumor Localization in Multi-Modal MRI [1.2] SVGFormerはデコーダフリーのパイプラインで、ボリュームをスーパーボクセルのセマンティックグラフに分割する。
その階層エンコーダは、パッチレベルのトランスフォーマーとスーパーボクセルレベルのグラフアテンションネットワークを組み合わせることで、リッチなノード表現を学習する。
以上の結果から,グラフベースのエンコーダのみのパラダイムが,3次元医用画像表現の正確かつ本質的に解釈可能な代替手段であることが明らかとなった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:13:04 GMT)
STEC: A Reference-Free Spatio-Temporal Entropy Coverage Metric for Evaluating Sampled Video Frames [1.2] 既存の評価指標は主に知覚の質や再現性に焦点を当てている。
本稿では,ビデオフレームサンプリングの有効性を評価するための簡易かつ非参照の指標である時空間エントロピーカバレッジ(STEC)を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:51:33 GMT)
HiT: History-Injection Transformers for Onboard Continuous Flood Change Detection [1.2] 小型衛星のメモリと計算限界内で動作するオンボード切替検出システムを開発した。
本研究では,過去の観測から歴史的文脈を維持するトランスフォーマーモデル (HiT) のヒストリインジェクション機構を提案する。
提案されたHiT-Prithviモデルは、ナノサットで使用される代表的ハードウェアであるJetson Orin Nano上で43FPSを達成した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:05:43 GMT)
If You Want Coherence, Orchestrate a Team of Rivals: Multi-Agent Models of Organizational Intelligence [1.2] 完全コンポーネントを得ることなく、不完全なコンポーネントを慎重にオーケストレーションすることで信頼性を実現することができることを示す。
本稿では,このようなシステムのアーキテクチャについて述べる。特殊エージェントチーム(プランナ,実行者,評論家,専門家)。
提案手法は,ユーザの露出前に90%以上の内部エラーインターセプションを達成し,許容可能なレイテンシトレードオフを維持していることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:19:09 GMT)
OpenLearnLM Benchmark: A Unified Framework for Evaluating Knowledge, Skill, and Attitude in Educational Large Language Models [1.1] OpenLearnLM Benchmarkは、大規模な言語モデルを評価するフレームワークである。
本ベンチマークは、複数の科目、教育的役割、難易度にまたがる124K以上の項目からなる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:53:31 GMT)
Language Models Entangle Language and Culture [1.1] WildChatデータセットの分析に基づいて、現実世界のオープンエンドの質問セットを作成します。
私たちは、応答が言語によって異なるか、具体的には、応答の品質がモデルに問い合わせる言語に依存するかを評価するためにそれを使用します。
言語は、モデルが使用する文化的な文脈に大きな影響を与えます。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:46:44 GMT)
Large Language Models for Large-Scale, Rigorous Qualitative Analysis in Applied Health Services Research [1.1] 大規模言語モデル(LLM)は、医療サービス研究における質的分析の効率を向上させることを約束している。
我々は,人間-LLM質的分析手法を設計するためのモデルおよびタスクに依存しないフレームワークを開発した。
この研究は、LSMを応用保健サービス研究に統合して、厳格な保存をしながら効率を高める方法を示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:01:02 GMT)
Automated Machine Learning in Radiomics: A Comparative Evaluation of Performance, Efficiency and Accessibility [1.1] 本研究では,汎用および放射能固有のAutoMLフレームワークの性能,効率,アクセシビリティを評価する。
画像モダリティ(CT/MRI),サイズ,解剖,結節を多用した10個の公衆・民間放射能を用いた。
Simplatabは、放射能分類問題に対する性能、効率、アクセシビリティの効果的なバランスを提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:31:33 GMT)
Reasoning While Recommending: Entropy-Guided Latent Reasoning in Generative Re-ranking Models [1.0] 本稿では,Entropy-Guided Latent Reasoning(EGLR)レコメンデーションモデルを提案する。
まず、"レコメンデーションファースト、レコメンデーション"パラダイムを捨てて"レコメンデーションしながらレコメンデーション"を実現する。
第二に、コンテキスト認識推論トークンを用いたエントロピー誘導可変長推論を実装している。
第三に、モデルは複雑な独立したモジュールや後処理を持たない軽量な統合設計を採用する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:32:39 GMT)
A phase space approach to the wavefunction and operator spreading in the Krylov basis [0.9] クリロフ基底における時間発展状態(あるいは作用素)の拡張に基づく複雑性測度は、一般的な複雑性測度に属すると考えられる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:39:32 GMT)
FoundationalASSIST: An Educational Dataset for Foundational Knowledge Tracing and Pedagogical Grounding of LLMs [0.8] FoundationalASSISTは、大規模言語モデルの研究に必要な完全な情報を提供する最初の英語教育データセットである。
5000人の学生による170万のインタラクションは、これまで追求できなかった研究の方向性を可能にしている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:47:30 GMT)
Learning Nonlinear Heterogeneity in Physical Kolmogorov-Arnold Networks [0.8] 物理ニューラルネットワークは典型的には線形シナプス重みを訓練し、デバイス非線形性を固定として扱う。
シナプス非線形性自体をトレーニングすることで、物理リソース当たりのタスク性能が著しく向上することを示す。
我々は「シナプス素子」と呼ぶシリコンオン絶縁体デバイスにおける物理KAを実験的に実現した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:00:26 GMT)
Spatiotemporal Wildfire Prediction and Reinforcement Learning for Helitack Suppression [0.8] 森林火災は頻度と強度で増加しており、何十億ドルものコストが抑制され、毎年アメリカ合衆国で経済被害が拡大している。
伝統的な山火事の管理は、主に反応し、火災が検出された後にのみ対処する。
textitFireCastRLは,山火事予測とインテリジェントな抑制戦略を組み合わせた,アクティブなAIフレームワークである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:50:12 GMT)
Harmonizing the Deep: A Unified Information Pipeline for Robust Marine Biodiversity Assessment Across Heterogeneous Domains [0.8] この研究は、北極と大西洋の海洋生態系を対象とする多年にわたる侵略的な種モニタリングイニシアチブの基礎的な検出層を確立する。
異種データセットを同等の情報フローに標準化する統一情報パイプラインを開発した。
シーン構成やオブジェクト密度,コンテキスト冗長性などの構造的要因から,ドメイン間の性能損失が説明できる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:51:55 GMT)
Learning-Augmented Online TRP on a Line [0.8] 本稿では,最近提案された学習強化フレームワーク内でのオンライン旅行修理担当者問題について考察する。
我々の予測モデルは、プリオリとして知られるストリーム内の各リクエストの予測位置、おそらくエラーを起こします。
我々の決定論的アルゴリズムは$min3.732+4,4$-competitiveとなり、$$を知ります。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:10:02 GMT)
Integrity from Algebraic Manipulation Detection in Trusted-Repeater QKD Networks [0.7] 量子鍵分布(QKD)は、計算仮定に頼らずにセキュアな通信を可能にする。
機密性と整合性の両方を確実に提供する最初のプロトコルを提示する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:44:56 GMT)
CMind: An AI Agent for Localizing C Memory Bugs [0.7] 本稿では,Cメモリのバグをローカライズする人工知能エージェントであるCMindについて述べる。
ツールへの入力は、Cプログラムのソースコードと、問題を記述したバグレポートである。
CMindはバグレポートを読み、プログラムへの潜在的なエントリポイントを見つけ、プログラムのソースコードをナビゲートし、ソースコードを分析し、テンプレートに合った仮説の場所と合理性を生成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:43:11 GMT)
Attention-Based Offline Reinforcement Learning and Clustering for Interpretable Sepsis Treatment [0.7] クラスタリングに基づく成層モジュールは、ICU入院時に患者を低、中、高リスクグループに分類する。
可変オートエンコーダ(VAE)と拡散モデルを活用する合成データ拡張パイプラインは、流体や血管圧剤などの未表現軌跡を豊かにする。
マルチモーダルな大規模言語モデルを用いた合理生成モジュールは、臨床コンテキストに基づく自然言語の正当化を生成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:41:44 GMT)
Robotic Tele-Operation for Upper Aerodigestive Tract Microsurgery: System Design and Validation [0.6] 上気道消化路(UADT)治療は、腫瘍やポリープの除去などの処置に経口レーザーマイクロ手術(TLM)を用いることが多い。
TLMでは標的組織を切断するためにレーザー光を使用し、UADT内の組織をつかみ、操作し、安定させる。
本稿では,手根管制御のための新しいエンドエフェクタをベースとして,UADTプロシージャにおける組織操作のための新しいロボットシステムを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:46:54 GMT)
MANGO: A Global Single-Date Paired Dataset for Mangrove Segmentation [0.6] マングローブは気候変動の緩和に重要であり、効果的な保全のために信頼できるモニタリングを必要としている。
ディープラーニングはマングローブ検出の強力なツールとして登場したが、その進歩は既存のデータセットの制限によって妨げられている。
124か国で42,703のラベル付き画像マスクペアからなる大規模なグローバルデータセットであるMANGOを紹介した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:11:32 GMT)
Feature-Aware Test Generation for Deep Learning Models [0.5] 本研究では,視覚に基づくディープラーニング(DL)モデルのための機能認識型テスト生成フレームワークであるTectを紹介する。
潜在空間内で非絡み合ったセマンティック属性を摂動することで入力を生成する。
行動シフトにつながる特徴を特定し、セマンティック属性に視覚言語モデルを使用する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:41:06 GMT)
Leveraging ChatGPT and Other NLP Methods for Identifying Risk and Protective Behaviors in MSM: Social Media and Dating apps Text Analysis [0.5] 男性と性交する男性(MSM)は、異性愛者に比べて性感染症や有害な飲酒のリスクが高い。
ソーシャルメディアとデートアプリのテキストが、性的リスク行動を予測するのに使えるかどうかを評価した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:28:50 GMT)
MooneyMaker: A Python package to create ambiguous two-tone images [0.5] ムーニー画像は、高コントラストで2トーンの視覚刺激であり、写真画像の閾値付けによって生成される。
MooneyMakerはオープンソースのPythonパッケージで、曖昧なMooneyイメージの生成を自動化する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:37:15 GMT)
GutenOCR: A Grounded Vision-Language Front-End for Documents [0.4] 我々はQwen2.5-VL-3BとQwen2.5-VL-7Bを微調整して得られた接地型OCRフロントエンド群を紹介する。
結果として得られる単一チェックポイントビジョン言語モデルは、読み出し、検出、グラウンド化を、統一されたプロンプトベースのインターフェースを通じて公開する。
グッテンOCR-7Bは,Qwen2.5-VL-7Bバックボーンの複合接地OCRスコアを10.5Kの保留ビジネスページと科学ページの2倍以上に向上させることを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:26:15 GMT)
Optimal Construction of Two-Qubit Gates using the Symmetries of B Gate Equivalence Class [0.4] Bゲート同値類からの2つのゲートの応用は、全ての2ビットゲートを生成することができる。
2ビットゲートの局所同値類は、Bゲート同値類を除いて、この2つの対称性を持たない。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:00:37 GMT)
Hierarchical Contextual Uplift Bandits for Catalog Personalization [0.3] パーソナライズされたレコメンデーションのための階層型コンテキストアップリフトバンドイットフレームワークを提案する。
Dream11ファンタジースポーツプラットフォームにおける大規模A/Bテストの結果,提案手法は推奨品質を大幅に向上させることが示された。
このシステムを2025年5月にデフォルトのカタログパーソナライズシステムとして運用し,さらに0.5%の収益改善を実現した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:35:36 GMT)
SatMap: Revisiting Satellite Maps as Prior for Online HD Map Construction [0.3] 衛星地図と多視点カメラの観測を統合するオンラインベクトル化HDマップ推定手法であるSatMapを提案する。
本手法は,バードアイビュー(BEV)から見た衛星画像からのレーンレベルのセマンティクスとテクスチャをグローバルな先行画像として活用する。
nuScenesデータセットの実験では、SatMapはカメラのみのベースラインよりも34.8%のmAPパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:44:42 GMT)
torch-sla: Differentiable Sparse Linear Algebra with Adjoint Solvers and Sparse Tensor Parallelism for PyTorch [0.3] オープンソースのPyTorchライブラリであるTorchslaは、GPUを加速し、スケーラブルで、微分可能なスパース線形代数を可能にする。
torchslaは複数のバックエンド(SciPy、cuDSS、PyTorch-native)をサポートし、エンドツーエンドの微分可能なシミュレーションのためにPyTorch Autogradとシームレスに統合される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:06:01 GMT)
LightOnOCR: A 1B End-to-End Multilingual Vision-Language Model for State-of-the-Art OCR [0.3] 我々は,多言語視覚言語モデルである textbfLightOnOCR-2-1B を提案する。
大規模で高品質な蒸留混合物でスキャン、フランス語文書、科学PDFを強くカバーし、LightOnOCR-2はOlmOCR-Benchの最先端の結果を得る。
私たちはApache 2.0でモデルチェックポイントをリリースし、データセットと textbfLightOnOCR-bbox-bench の評価をそれぞれのライセンスで公開しています。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:58:32 GMT)
DermaBench: A Clinician-Annotated Benchmark Dataset for Dermatology Visual Question Answering and Reasoning [0.3] DermaBenchは,Diverse Dermatology Imagesデータセット上に構築された臨床用アノテート皮膚科VQAベンチマークである。
DermaBenchは、フィッツパトリックの皮膚型I-VIにまたがる570人のユニークな患者の656の臨床像を含む。
DermaBenchは、上流ライセンスを尊重するメタデータのみのデータセットとしてリリースされ、Harvard Dataverseで公開されている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:44:57 GMT)
Recent progress on disorder-induced topological phases [0.3] 翻訳対称性のない乱れた系における物質のトポロジカルな状態は、近年大きな関心を集めている。
凝縮物質および人工システムにおける障害誘発トポロジカルフェーズの理論的および実験的進歩を概説する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:41:35 GMT)
Vanishing correlations in (bi)stochastic controlled circuits [0.3] 両立制御ゲートからなる回路のダイナミクスについて検討する。
その結果、驚くほど単純な相関構造を示す幅広い種類の量子系が明らかとなった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:00:05 GMT)
Deep Learning Approaches to Quantum Error Mitigation [0.3] 本稿では,雑音発生確率分布の量子誤差軽減に応用したディープラーニング手法の系統的研究を行う。
シーケンス・ツー・シークエンス・アテンション・ベース・モデルが最も効果的なデータセットとして認識する。
いくつかの異なる回路深度で、本手法は他のベースライン誤差軽減手法よりも優れている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:40:22 GMT)
Stabilizing autoregressive forecasts in chaotic systems via multi-rate latent recurrence [0.2] 階層型暗黙予測器であるMSR-HINEを導入し、異なる時間スケールで動作させるマルチレート繰り返しモジュールを用いて、マルチスケールの潜伏先行を増大させる。
2つの標準ベンチマークで、MSR-HINEはU-Netの自己回帰ベースラインよりも大幅に向上する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:16:37 GMT)
BikeActions: An Open Platform and Benchmark for Cyclist-Centric VRU Action Recognition [0.2] FUSE-Bikeは、その種の最初の完全にオープンな認識プラットフォームである。
BikeActionsは5つのアクションクラスにわたる852の注釈付きサンプルからなる、新しいマルチモーダルデータセットである。
我々は、公開されたデータ分割に基づいて、最先端のグラフ畳み込みとトランスフォーマーベースのモデルを評価することで、厳密なベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:44:36 GMT)
Hybrid Deep Feature Extraction and ML for Construction and Demolition Debris Classification [0.2] 本研究では,従来の機械学習(ML)分類器と深い特徴抽出を統合したハイブリッド・ビジョン・ベース・パイプラインを用いて,自動構築・解体(C&D)デブリ分類を行う。
アラブ首長国連邦の実際の建設現場から4つの材料カテゴリを表す1,800枚のバランスのとれた高品質の画像からなる新しいデータセットを収集した。
事前学習したXceptionネットワークを用いて深い特徴を抽出し,SVM,kNN,Bagged Trees,LDA,Logistic Regressionを含む複数のML分類器を体系的に評価した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:33:45 GMT)
Bright Heralded Single-Photon Superradiance in a High-Density Thin Vapor Cell [0.2] 超放射能は、放射能崩壊がエミッター間のコヒーレンスによって一括的に増強される、協調量子放出の目印である。
1mmの高密度気相セルにおいて, 自発4光波混合による明るい一光子超放射能を報告した。
これらの知見は、超ラジカル光子源を実現するための実用的で堅牢な媒体として、密度の高い原子蒸気を確立する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:35:08 GMT)
The OncoReach Stylet for Brachytherapy: Design Evaluation and Pilot Study [0.2] OncoReachスタイルト(OncoReach stylet)は、標準のISBT 15と13ゲージの針との互換性のために設計された手持ちの腱駆動のステアブルスタイルトである。
2管のコセラットロッドモデルでは、ほとんどの試験において針の中心的な形状を正確に予測した。
その結果, 侵襲性の低い中等度進入点から, 最側方へ到達する能力を示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:25:47 GMT)
Curriculum-Based Strategies for Efficient Cross-Domain Action Recognition [0.2] 本稿では,カリキュラムベースのトレーニング戦略が,実際の空中データを使用しなくても,実際の空中データを見落とせるように一般化する方法について検討する。
本研究では,合成空中視データと実地視データという2つの領域外情報源を用いたクロスビュー行動認識のためのカリキュラム学習について検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:01:57 GMT)
3D Stacked Surface-Code Architecture for Measurement-Free Fault-Tolerant Quantum Error Correction [0.2] 中間回路の測定は、ゲートよりも遅く、ノイズが多いため、超伝導量子プロセッサの主要なボトルネックとなっている。
測定不要な量子誤差補正(mfec)は、連続した測定と古典的なフィードフォワードをコヒーレントな量子フィードバックによって置き換える。
既存のmfecプロトコルは、平面的な表面コードアーキテクチャにマップされると、接続のオーバーヘッドがひどくなる。
この研究は、計測不要なフォールトトレラントな量子誤り訂正のための3次元積層表面符号アーキテクチャを導入している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:32:28 GMT)
Demystifying the trend of the healthcare index: Is historical price a key driver? [0.1] 本研究は,過去のオープン・ハイ・ロー・クロース(OHLC)指標データに,その後の取引日におけるオープン・インデクシングの方向性を予測する十分な情報が含まれているかを検討する。
多様な特徴セットが構築されており、原価、ボラティリティに基づく技術指標、および相互OHLC比から派生した新しい特徴クラスで構成されている。
その結果, 精度は0.8以上, マシューズ相関係数は0.6以上であった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:20:59 GMT)
Intermittent time series forecasting: local vs global models [0.1] かなりの量のゼロの存在によって特徴づけられる断続的な時系列は、サプライチェーンにおける在庫のかなりの割合を占める。
在庫水準の計画には確率的予測が必要である。
間欠的な時系列は通常、各時系列で個別に訓練されるローカルモデルを用いて予測される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:53:24 GMT)
Human Simulation Computation: A Human-Inspired Framework for Adaptive AI Systems [0.1] HSC(Human Computation Simulation)は、思考、行動、学習、リフレクション、活動スケジューリングを含む、継続的な閉ループプロセスとしてインテリジェンスをモデル化する。
HSCは、内部推論プロセスのすべての段階にわたって一般的に使用される人間の思考戦略を取り入れている。
理論的分析を通じて、人間のシミュレーション戦略は言語資料だけでは学べないと主張している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:00:04 GMT)
ConceptCaps -- a Distilled Concept Dataset for Interpretability in Music Models [0.1] ConceptCapsは、200の属性の分類の明確なラベルを持つ23kのミュージックキャプションオーディオ三重奏曲のデータセットである。
VAEは可塑性属性共起パターンを学習し、微調整されたLCMは属性リストを専門的な記述に変換し、MusicGenは対応するオーディオを合成する。
音声テキストアライメント(CLAP)、言語品質指標(BERTScore, MAUVE)、およびTCAV分析により、概念プローブが音楽的に意味のあるパターンを復元することを確認した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:04:08 GMT)
Analyzing Far-Right Telegram Channels as Constituents of Information Autocracy in Russia [0.1] 本研究では、ロシアの極右コミュニティが、ミームや視覚的物語を通して、政治人物の知覚をいかに形作るかを検討する。
予備的な所見は、極右ミームがプロパガンダ共同生産の道具として機能することを示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:48:06 GMT)
Information transport and transport-induced entanglement in open fermion chains [0.1] 情報とは, 絡み合いに関連する重要な量であることを示す。
非平衡開量子系における空間的およびスケール分解された情報電流を特徴づける。
我々の研究は、駆動型オープン量子システムにおける情報伝達と絡み合いの発生に関する体系的な研究への扉を開く。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:54:28 GMT)
Virtual Urbanism: An AI-Driven Framework for Quantifying Urban Identity. A Tokyo-Based Pilot Study Using Diffusion-Generated Synthetic Environments [0.0] このフレームワークは、計算的に抽出可能な都市アイデンティティメトリクスを向上することを目的としている。
安定拡散モデルとLORAモデルを統合したパイプラインを用いて東京9地域の合成レプリカを作製した。
その結果, 平均識別精度は81%であり, レプリカの有効性が確認された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:59:44 GMT)
Unifying Quantum and Classical Dynamics [0.0] 古典物理学と量子物理学の力学を統一する可能性を探る。
ハイゼンベルクの運動方程式はニュートンの運動方程式と同一の形にキャストできることが示されている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:50:54 GMT)
Unified Unbiased Variance Estimation for MMD: Robust Finite-Sample Performance with Imbalanced Data and Exact Acceleration under Null and Alternative Hypotheses [0.0] 最大平均誤差(英: maximum mean discrepancy、MMD)は、2サンプルテストのためのカーネルベースの非パラメトリック統計量である。
我々は,そのU統計表現とHoeffding分解によるMDD統計量の分散について検討する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:41:32 GMT)
Uma Prova de Conceito para a Verificação Formal de Contratos Inteligentes [0.0] 本稿では、Relativized Contract Language(RCL)とRECALLツールを使って概念実証を行う。
この研究は、モデリングフェーズ中に規範的競合を検出するツールの能力を実証している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:38:17 GMT)
Ultra Compact low cost two mode squeezed light source [0.0] 光の量子関連状態、例えば圧縮状態は、量子技術の基本的な資源である。
本稿では,85Rb原子蒸気中の4波長混合に基づく795nmの2モード励起光の小型狭帯域源について報告する。
その結果,低SWaP圧縮光発生のための汎用的でポータブルなプラットフォームが確立され,展開可能な量子化技術への道が開かれた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:16:02 GMT)
TruthTensor: Evaluating LLMs Human Imitation through Prediction Market Drift and Holistic Reasoning [0.0] 本稿では,大規模言語モデルを測定する新しい再現可能な評価パラダイムであるTrathTensorを紹介する。
我々のフレームワークは前向きで汚染のないタスクに基づいており、実際の予測市場に評価を固定しています。
TruthTensorは、同様の予測精度のモデルがキャリブレーション、ドリフト、リスク感度で著しく変化することを示した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:11:47 GMT)
Tripartite quantum correlations obtained by post-selection from twin beams [0.0] iCCDカメラは、元のツインビームの一部で形成されたビームの特性を多目的に調整することができる。
ツインビームのアイドラービームを3つの等高な部分に分割し、信号ビーム全体の光数を検出することで、高い非古典性を示すアイドラーフィールドに到着する。
非古典性は、適切な非古典性証人とその対応する非古典性深さの助けを借りて分析される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:34:56 GMT)
Translational Gaps in Graph Transformers for Longitudinal EHR Prediction: A Critical Appraisal of GT-BEHRT [0.0] 我々は,MIMIC-IV集中治療結果と心不全予測に基づいて評価したグラフ変換器アーキテクチャであるGT-BEHRTについて検討した。
キャリブレーション解析の欠如,不完全公平性評価,コホート選択に対する感受性,表現型や予測地平線を越えた限定的な分析など,いくつかの重要なギャップを同定する。
全体として、GT-BEHRTはEHR表現学習において有意義なアーキテクチャ上の進歩を示すが、より厳密な評価は校正、公平性、展開に重点を置いている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:18:09 GMT)
Transformer based Multi-task Fusion Network for Food Spoilage Detection and Shelf life Forecasting [0.0] 本稿では,CNNとLSTMとDeiT変換器を同時に組み合わせた融合型アーキテクチャを提案する。
CNN+CNN-LSTMとCNN+DeiT Transformerは、CNN、VGG16、ResNet50、Capsule Networks、DeiT Transformerなどのディープラーニングモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:07:21 GMT)
Towards robust long-context understanding of large language model via active recap learning [0.0] 本研究では,長期的文脈理解における大規模言語モデル(LLM)の拡張フレームワークであるアクティブ・リキャップ・ラーニング(ARL)を提案する。
ARLは、推論時に連続した事前学習と振り返りの要約の間、ターゲットのシーケンス構成を通じて、以前のコンテンツを再検討し、要約することを可能にする。
実験の結果、ARLはRULERを26.8%改善し、LongBenchを9.44%改善した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:42:04 GMT)
Towards Device-Independent Quantum Key Distribution with Photonic Devices [0.0] デバイス独立(DI) QKDは、デバイスモデリングの度合いをブラックボックスの設定に還元することで、この問題に対処する。
本研究では、最近機械学習技術によって同定されたフォトニック回路上でのDIQKDの実現可能性を評価する。
解析の結果,提案した光回路は雑音に十分に耐性があり,実験的な実現を実現することができることがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:00:03 GMT)
Toward self-coding information systems [0.0] 本稿では,エージェントAI分野における新たな研究トピックを提案する。
これらのシステムは、潜在的な適応決定を評価し、ソースコードを生成し、テストし、(再)実行時にソースコードを自律的にデプロイすることで、構造や振る舞いを動的に適応することができる。
ここでは、このトピックを動機付け、自己コーディング情報システムの正式な定義を提供し、新しい技術の期待する影響について議論し、潜在的研究方向性を示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:30:05 GMT)
To infinity and back -- $1/N$ graph expansions of light-matter systems [0.0] 本稿では,連結クラスタ定理を用いて,光物質系に対する全グラフ展開を行う手法を提案する。
この方法により、粒子数において熱力学限界$Nto infty$に対する1/N$の補正を探索することができる。
常磁性相におけるパラダイム的Dicke-Ising鎖の低エネルギー状態の物理量を計算する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:13:51 GMT)
The rate of purification of quantum trajectories [0.0] 測定結果に条件づけられた量子軌道は、長期的には純粋であることを示す。
また、同じ測定記録の下で2つの軌道を伝搬することにより、量子状態推定問題にも対処する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:44:12 GMT)
The Limits of Conditional Volatility: Assessing Cryptocurrency VaR under EWMA and IGARCH Models [0.0] 暗号通貨のリスク管理に標準の静的幾何学的ブラウン運動(GBM)モデルを適用すると、システム障害が生じた。
本研究では,EWMA/IGARCHベースラインの3つの条件ボラティリティモデル,明示的な平均回帰(IGARCH + MR)を付加したIGARCHモデル,および相関モンテカルロVRフレームワーク内のEGARCHスタイルの非対称ショックモデルを用いた修正EGARCHスタイルモデルについて比較検討した。
以上の結果から,非対称モデル(モデル3)では過度な過度化が生じる一方,固定性が著しく低下するリスク(5%のバリュー・アット・リスクが50%減少する)が著しく過小評価されることが示唆された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:11:24 GMT)
The Algorithmic Barrier: Quantifying Artificial Frictional Unemployment in Automated Recruitment Systems [0.0] 米国の労働市場は高い失業率と長期失業期間の持続的共存を示している。
本稿では,現代摩擦失業の非自明な部分は,自動採用システムによって人工的に引き起こされていることを論じる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 23:08:06 GMT)
The $O(n\to\infty)$ Rotor Model and the Quantum Spherical Model on Graphs [0.0] 一般グラフ上で定義された$O(n)$量子ロータモデルの大きな$n$制限は、対応する量子球面モデルと同じ臨界挙動を持つことを示す。
我々は古典的から量子的マッピングを採用し、グラフ上の古典的な$O(n)$モデルの大きな$n$制限に対して既知の結果を使用する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:14:01 GMT)
Test-Time Adaptation for Non-stationary Time Series: From Synthetic Regime Shifts to Financial Markets [0.0] 因果時間予測と方向分類のための小さなフットプリントテスト時間適応フレームワークについて検討した。
分類にはエントロピーを最小化し、時間的一貫性を強制する。
この枠組みは、ETTベンチマークの総合的体制シフトと、パンデミック、高インフレ、リカバリの2段階にわたるデイリーエクイティとFXシリーズ(SPY、QQQ、EUR/USD)で評価する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:30:23 GMT)
Symmetric Informationally Complete Positive Operator Valued Measure and Zauner conjecture [0.0] 任意の有限次元 N のヒルベルト空間において、SIC-POVM(Symmetric Informationally Complete Positive Operator Valued Measure)を構成する N2 純状態が存在する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 00:09:12 GMT)
Style Transfer as Bias Mitigation: Diffusion Models for Synthetic Mental Health Text for Arabic [0.0] 合成テキスト生成のための事前学習自由拡散に基づくアプローチを提案する。
本研究は,男性から女性への女性スタイルの移譲に着目した。
以上の結果から,拡散に基づくスタイル転送は,高エントロピー,セマンティックに忠実な合成データを生成することが示唆された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:21:41 GMT)
Squeezed-Light-Enhanced Multiparameter Quantum Estimation in Cavity Magnonics [0.0] 本研究では,キャビティ-マグノン系におけるパラメータの同時推定精度を向上させるための実験的現実的手法を提案する。
システムに非線形性を導入すると、量子ノイズが著しく抑制されることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:13:59 GMT)
Spin-$s$ $U(1)$-eigenstate preparation [0.0] 一般的な$U(1)$-eigenstate of a spin-$s$ chain of length $n$を作成するための決定論的アルゴリズムを定式化する。
このアルゴリズムを用いて、積分可能なスピンの正確な固有状態(英語版)をXXXハミルトニアン(英語版)で作成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:07:41 GMT)
Sharp Inequalities for Schur-Convex Functionals of Partial Traces over Unitary Orbits [0.0] 部分的トレース情報理論において,スペクトルの等価量を求めることができることを示す。
また、任意のSchuform上界の任意の次元汎函数の有界を最大化できることも示している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:05:45 GMT)
Self-Supervised Score-Based Despeckling for SAR Imagery via Log-Domain Transformation [0.0] 合成開口レーダ(SAR)に固有のスペックルノイズは画像品質を著しく低下させ、その後の解析を複雑にする。
本稿では,スコアベース生成モデルに基づく新たな自己教師型SAR画像復調フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:45:55 GMT)
Search over Self-Edit Strategies for LLM Adaptation [0.0] 本研究では,LLMがタスクフィードバックを用いて重みを更新する方法について検討する。
自己適応型言語モデル(SEAL)フレームワークをテストベッドとして使用し、固定されたヒューマンテンプレート制約を緩和した。
テンプレート生成が過去のテンプレートの軽量アーカイブで条件付けられたかどうかが異なる2つのバリエーションが研究された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:59:58 GMT)
SCG With Your Phone: Diagnosis of Rhythmic Spectrum Disorders in Field Conditions [0.0] スマートフォンで得られた加速度計記録を用いて,SCGセグメンテーションとリズム分析のための堅牢なディープラーニングフレームワークを提案する。
マルチスケールの畳み込み、残差接続、アテンションゲートを統合した拡張U-Net v3アーキテクチャを開発した。
専用の後処理パイプラインは、確率マスクを正確なAOタイムスタンプに変換する一方、新しい適応型3D-to-1Dプロジェクション方式は、任意のスマートフォンの向きに対して堅牢性を保証する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:58:31 GMT)
Reservoir-Engineered Refrigeration of a Superconducting Cavity with Double-Quantum-Dot Spin Qubits [0.0] 超伝導マイクロ波空洞の貯留層冷凍に関する解析的考察を行った。
DQDを分光素子としてではなく、調整可能なエンジニアリングされた貯水池として扱うことで、人口、コヒーレンス、ライン幅、およびデトゥニングのゲート制御が、光子発生死の効果的なプロセスをどのように定義しているかを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:09:40 GMT)
Recursivism: An Artistic Paradigm for Self-Transforming Art in the Age of AI [0.0] 本稿では,人工知能時代の現代芸術的実践を分析するための概念的枠組みとして,再帰主義を紹介する。
再帰主義(Recursivism)とは、アウトプットが時間とともに変化するだけでなく、生成過程自体が自身の効果を通じて反射的な修正を行うことができるプラクティスを指す。
この記事は、自己修正芸術システムの美学、カリキュラム、倫理的意味を調べることで締めくくられる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:05:21 GMT)
RECAP: A Resource-Efficient Method for Adversarial Prompting in Large Language Models [0.0] 本稿では,事前学習した相手プロンプトのデータベースに新たなプロンプトをマッチングすることで,リトレーニングの必要性を解消する資源効率の高い逆プロンプト手法を提案する。
セマンティックに類似した敵のプロンプトを抽出することにより,計算コストを大幅に削減した競合攻撃成功率を実現する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:01:02 GMT)
Quantum Pontus-Mpemba Effect Enabled by the Liouvillian Skin Effect [0.0] 非対称な不整合ホッピングとコヒーレント境界結合を持つ散逸性強結合鎖に量子ポントス-メンバ効果を呈する。
非相互散逸によって引き起こされる皮膚効果は、系の境界付近で緩和モードを局在させ、非直交スペクトル幾何学を引き起こす。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:44:14 GMT)
Quantum Entanglement Geometry on Severi-Brauer Schemes: Subsystem Reductions of Azumaya Algebras [0.0] 幾何学的障害として家族における純粋状態の絡み合いを定式化する。
純状態空間のツイスト族に対して、絡み合いは、$SB(A)$内の相対的なセグレ部分スキームの存在に対する障害である。
最初の主要な結果は$mathbf d$-サブシステム構造のモジュライを商 $P/G_mathbf d$ で識別する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:16:42 GMT)
Quadratic Upper Bound for Boosting Robustness [0.0] 高速対人訓練(FAT)は、訓練時間を短縮して対人攻撃に対するモデルの堅牢性を高めることを目的としている。
FATはしばしば、敵空間の探検が不十分なため、妥協された堅牢性に悩まされる。
我々はFAT下での劣化ロバスト性の問題を軽減するために損失関数を開発する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 06:27:34 GMT)
Performance enhancing of hybrid quantum-classical Benders approach for MILP optimization [0.0] 本稿では,ハードウェアに依存しないベンダー分解アルゴリズムと,量子コンピューティングを最大限に活用することを目的とした一連の拡張を提案する。
提案アルゴリズムは、D-Wave量子アニールを用いて、スケーラブルな伝送ネットワーク拡張計画問題に対する古典的アプローチに対してベンチマークを行う。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:47:50 GMT)
Pauli Propagation for Imaginary Time Evolution [0.0] 本稿では,パウリの時間力学を直接近似する仮想時間パウリ伝搬アルゴリズムを提案する。
一次元横フィールドイジングモデル上でのITPPのベンチマークでは、トラルニケーションが精度と計算コストのトレードオフを制御できることが示されている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:05:04 GMT)
Optimizing Parallel Schemes with Lyapunov Exponents and kNN-LLE Estimation [0.0] 逆並列解法におけるそのような不安定性を同定・測定・低減するための統合分析データ駆動手法を提案する。
理論的には、基礎となる反復写像の安定性と分岐特性を導出する。
計算面では、局所的に最大のリアプノフ指数をkNN駆動で推定するマイクロシリーズパイプラインを導入する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 05:09:52 GMT)
On the Runway Cascade of Transformers for Language Modeling [0.0] デコーダのみ(因果)変換器では、因果マスキングによって生成された計算グラフは、中間トークンによって形成された直接パスの注意と間接パスの両方を通して情報をルーティングする。
この2つの情報伝達モードの相違により, 因果変換器の故障モードが悪化する可能性が示唆された。
本稿では,各トークンの直接パス注意に滑走路コンテキストを直接組み込む方法として,滑走路認識再配線を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:29:34 GMT)
On spooky action at a distance and conditional probabilities [0.0] 非独立確率分布の古典的概念と絡み合った状態の量子的概念の類似性を明示する。
古典的な場合、アフェットは確率変数の1つ、基礎となるサンプル空間、確率分布の変化を観察する。
量子の場合、コンポーネントの1つに関連する事象が観測されると、後測定状態はシステムの状態の変化と暗黙的に新しい確率分布の両方をキャプチャする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:42:47 GMT)
On finite-dimensional encoding/decoding theorems for neural operators [0.0] 函数空間 $E$ と $F$ の間の連続写像 $f$ がコンパクト空間上の一様収束の位相において近似されることを示す。
この結果は、すべてのノルム空間だけでなく、任意の局所凸空間に対しても、$E,F$の仮定は必要としない。
この解析は、微分方程式の理論において非ノルムな局所凸函数空間が一般的であるため、既に有用である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:15:51 GMT)
OAMAC: Origin-Aware Mandatory Access Control for Practical Post-Compromise Attack Surface Reduction [0.0] 実行の起源は、現代のオペレーティングシステムのセキュリティモデルに欠けている抽象化である。
オリジン対応強制アクセス制御(OAMAC)を導入する。
OAMACは、実行元をファーストクラスのセキュリティ属性として扱う。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:40:26 GMT)
Nonclassical photocounting statistics with a single on-off detector [0.0] オンオフ検出器の簡単な変更 -- 調整可能な設定として制御減衰を導入する -- により、そのような検出器は放射場の非古典的特性を明らかにすることができる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:34:12 GMT)
Non-zero Momentum Implies Long-Range Entanglement When Translation Symmetry is Broken in 1D [0.0] Gioia と Wang は、非ゼロ運動量を持つ翻訳対称状態は必然的に長距離絡み(LRE)であることを示した。
ここでは、非翻訳対称状態に対する運動量の概念は、翻訳対称状態の場合と同様に、その絡み合いの性質を直接エンコードできるだろうか?
1次元系に対して解が肯定的であることを示す一方で、高次元拡張と位相的に順序付けられた系は更なる作業を必要とする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:01:06 GMT)
No Reliable Evidence of Self-Reported Sentience in Small Large Language Models [0.0] 言語モデルは、自身の意識についていくつかのオープンウェイトモデルに問い合わせることで、自分自身がセンシティブであると信じるかどうかをテストする。
モデルは常に知覚的であることを否定しており、意識は人間に当てはまるが、自分自身には当てはまらない。
これらの知見は、モデルが自身の意識に潜伏する信念を損なうことを示唆する最近の研究とは対照的である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:28:02 GMT)
Neural Organ Transplantation (NOT): Checkpoint-Based Modular Adaptation for Transformer Models [0.0] 我々は、トレーニングされたトランスフォーマー層をドメイン適応のための再利用可能なチェックポイントとして機能させることができるモジュラー適応フレームワークであるNeural Organ Transplantation (NOT)を導入する。
事前訓練されたモデルから連続的なレイヤサブセット(ドナーオルガン)を抽出せず、ドメイン固有のデータで独立してトレーニングし、元のトレーニングデータにアクセスせずに互換性のあるモデルに移植可能なスタンドアロンのチェックポイントファイルとして保存する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:10:57 GMT)
Native linear-optical protocol for efficient multivariate trace estimation [0.0] 本稿では,バーグマン不変量と呼ばれる量子状態の多変量トレースを効率的に推定する線形光学プロトコルを提案する。
我々のプロトコルは、多光子多モード量子状態を含む回路モデルにおけるサイクルテストの光子ネイティブ版として理解することができる。
このプロトコルはサンプル効率が高く,一般化された抑圧法則,量子機械学習のための効率的な量子カーネル推定法,固有スペクトル推定法,多光子識別可能性の評価などの応用を論じる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:07:27 GMT)
Motion-to-Response Content Generation via Multi-Agent AI System with Real-Time Safety Verification [0.0] 本稿では、音声からの感情信号に基づいて、応答指向メディアコンテンツをリアルタイムで生成するマルチエージェント人工知能システムを提案する。
提案システムは,(1)CNNに基づく音響抽出機能を有する感情認識エージェント,(2)応答モードに感情をマッピングする反応ポリシー決定エージェント,(3)メディア制御パラメータを生成するコンテンツ生成エージェント,(4)年齢不適切性と刺激の制約を強制する安全性検証エージェントの4つの協調エージェントからなる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:42:03 GMT)
Low-Resource Quantum Energy Gap Estimation via Randomization [0.0] 量子多体系のエネルギースペクトルを推定することは量子物理学の基本的な課題である。
本稿では,確率アングル補間(TE-PAI)による時間進化をシャドウ分光フレームワークに統合するハイブリッド量子古典プロトコルを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:53:29 GMT)
Look-Ahead-Bench: a Standardized Benchmark of Look-ahead Bias in Point-in-Time LLMs for Finance [0.0] 我々はLook-Ahead-Benchについて紹介する。Look-Ahead-Benchは、LLM(Point-in-Time)大言語モデルにおけるルック-アヘッドバイアスを測定する標準ベンチマークである。
我々は、時間的に異なる市場体制におけるパフォーマンス劣化を分析し、パフォーマンス閾値を確立するために、いくつかの定量的ベースラインを取り入れた。
その結果, ピチンフモデルとは異なり, アルファ崩壊で測定された標準LDMの頭頂部偏差が顕著であった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:23:51 GMT)
Log anomaly detection via Meta Learning and Prototypical Networks for Cross domain generalization [0.0] 本稿では,ログ異常を検出するメタラーニング手法に基づくエンドツーエンドフレームワークを提案する。
提案手法は,Drain3ログ解析機構と動的ドリフトベースラベリング手法を組み合わせることで,まずデータを準備する。
Model Agnostic Meta-Learning (MAML)とPrototypeal Networksモデルは、迅速かつ効果的に適応するように訓練されている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:09:33 GMT)
Localizable Entanglement as an Order Parameter for Measurement-Induced Phase Transitions [0.0] 局所化可能な絡み合い(LE)は測定誘起相転移の順序パラメータである。
LEは体積法相に対して本質的に定数であるのとは対照的に、面積法相における距離で指数関数的に崩壊する。
本稿では,2つのアンシラプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:43:33 GMT)
Locality forces equal energy spacing of quantum many-body scar towers [0.0] 量子多体傷は、正確な固有状態である複数の局所的な「親」ハミルトニアンを持つことを示す。
特に、ディック状態の完全集合が広い局所ハミルトニアンの正確な固有状態であるなら、それらのエネルギーは必ずしも等間隔でなければならない。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:10:03 GMT)
Limits of multimode bunching for boson sampling validation: anomalous bunching induced by time delays [0.0] 異常な集団化を厳格に排除したインターフェロメトリ構成のクラスを同定する。
非常に意外なことに、時間モードのミスマッチはこのクラスに属していない。
これらの結果は,マルチモードクラスタリングが信頼性の高い検証ツールであり続ける条件を明らかにする上で有効である。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:50:58 GMT)
Learning to Explain: Supervised Token Attribution from Transformer Attention Patterns [0.0] 我々は、トランスフォーマーの注意パターンからトークンレベルの重要度スコアへの明示的なマッピングを学習する軽量ニューラルネットワークであるExpplanation Network(ExpNet)を紹介する。
我々はExpNetを挑戦的なクロスタスク設定で評価し、モデルに依存しない幅広い手法と注意に基づく手法に対してベンチマークする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:06:34 GMT)
Learning Discrete Successor Transitions in Continuous Attractor Networks: Emergence, Limits, and Topological Constraints [0.0] 連続引力ネットワーク(Continuous attractor network, CAN)は、頭部方向、空間位置、位相などの低次元連続変数を表す。
標準空間領域では、アトラクタ多様体に沿った遷移は連続的な変位信号によって駆動される。
安定な誘引状態間の後継的な遷移を行うために,CANを訓練するための実験的な枠組みを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:41:18 GMT)
Know Your Contract: Extending eIDAS Trust into Public Blockchains [0.0] 本稿では,欧州連合のeIDAS信頼フレームワークをパブリックブロックチェーンエコシステムに拡張するアーキテクチャを提案する。
このメカニズムは、欧州委員会信頼リストから個々のオンチェーンアドレスへの、検証可能な信頼の連鎖を確立する。
提案されたアーキテクチャは、ヨーロッパのデジタル信頼インフラストラクチャをブロックチェーンベースのシステムに統合するための経路を提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:29:00 GMT)
Interaction-Conditional Semantics and the Dissolution of Quantum Paradoxes [0.0] 客観性を保ちながら、物理計測幾何学における相対的な配置のみをライセンスする4つの原則を紹介します。
ベルの定理とコチェン=スペクターの定理は、力学的な謎ではなく、許容可能な説明的構造に対する制約として再構成される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 01:22:22 GMT)
Group Fourier filtering of quantum resources in quantum phase space [0.0] 量子位相空間(QPS)が量子系の代替記述を提供することを示す。
一般コンパクトリー群量子リソース理論 (QRTs) に対して、ストラトノビッチ-ワイル量子位相空間の表現はカヒル-グラバーパラメータ$s$-has で表され、明確な資源理論と信号処理の意味を持つことを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:39:23 GMT)
Generating consensus and dissent on massive discussion platforms with an $O(N)$ semantic-vector model [0.0] 意味論的に類似したアイデアを集約する動的システムを導入する。
以上の結果から,0$は強磁性相(グローバルコンセンサス)へ,0$は反強磁性相(最大反強磁性相)を誘導することがわかった。
このフレームワークは、集合知プラットフォームにおける凝集と多様性の間のトレードオフを管理するための制御可能な方法を提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:08:00 GMT)
Generalization and Completeness of Stochastic Local Search Algorithms [0.0] 局所探索(SLS)アルゴリズムを一意な形式モデルに一般化する。
このモデルには、2つの重要な構成要素がある: できるだけ大きいように設計された共通構造と、できるだけ小さいことを意図したパラメトリック構造である。
SLSアルゴリズムのチューリング完全性を証明するために,本モデルを用いた。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:17:45 GMT)
Generalised contextuality of continuous variable quantum theory can be revealed with a single projective measurement [0.0] 連続変数系に対する一般化文脈性の標準定義の直接的な適用は、いくつかの基本的な測定値の統計を包含しないことを示す。
連続変数系に対する一般化された文脈性の定義の修正を提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:24:26 GMT)
Gaussian Based Adaptive Multi-Modal 3D Semantic Occupancy Prediction [0.0] この研究は、新しい適応カメラ-LiDARマルチモーダル3D占有率予測モデルを強化する。
カメラモダリティの意味的強度とLiDARモダリティの幾何学的強度をシームレスにブリッジする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:11:09 GMT)
Fundamental Limits of Continuous Gaussian Quantum Metrology [0.0] 連続的なガウス測度の下では、多モード自由ボソンを用いた量子距離論の一般的な理論的枠組みを開発する。
我々は、グローバル量子フィッシャー情報(QFI)と環境QFIの成長率に関する解析式を導出する。
指数関数的に拡張されたグローバルQFIを実現するために,非エルミート皮膚効果を利用した非相互セットアップが可能であることを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:26:40 GMT)
FP-THD: Full page transcription of historical documents [0.0] 本研究は, 特色を保存した史料の書き起こしのためのパイプラインを提案する。
我々は、レイアウト解析モデルを用いて過去のテキスト画像を分析し、テキスト行を抽出し、OCRモデルで処理し、完全にデジタル化されたページを生成する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 07:13:38 GMT)
Exact Constraint Enforcement in Physics-Informed Extreme Learning Machines using Null-Space Projection Framework [0.0] この研究は、係数空間における代数的射影による厳密な制約執行を達成するために、Null-Space Projected PIELMを導入している。
NP-PIELM は許容係数多様体の幾何学的構造を利用して、境界作用素の零空間を分解することを認識する。
これにより、単発トレーニング効率を維持しながらペナルティ係数、双対変数、問題固有の構成を排除できる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:28:58 GMT)
Evolution of Vortex Strings after a Thermal Quench in a Holographic Superfluid [0.0] 三次元ホログラム超流動層における渦弦の形成について検討する。
遅いクエンチの場合、渦弦数はKZMスケーリングに従うが、急激なクエンチの場合、最終温度に支配される補完的な普遍的なスケーリングを示す。
トータルの渦長分布はガウス的のままであるが、累積は様々なパワーロー指数を持つ普遍的なスケーリング法則に従い、拡張トポロジカルな欠陥の統計的特徴を示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:22:13 GMT)
European digital identity: A missed opportunity? [0.0] OpenID4VCIとOpenID4VPの設計におけるいくつかの問題を特定した。
私たちはOpenIDの'パラダイムシフト'信頼モデルを破壊します。
法律自体は、自己主権的なアイデンティティの約束を満たせない。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:55:24 GMT)
Entanglement scaling and dynamics in the Sauter-Schwinger effect [0.0] 非摂動・強磁場QED設定における絡み合いエントロピーの進化と幾何学的スケーリングについて検討する。
エントロピーの絡み合いは、特定の強磁場状態に対して、領域法則から体積法則スケーリングへ遷移することを示します。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:00:20 GMT)
Enhanced Cyber Threat Intelligence by Network Forensic Analysis for Ransomware as a Service(RaaS) Malwares [0.0] 署名に基づく侵入検出は、RaaSパケットシグネチャの不足に苦しむ役割を担っている。
我々はネットワーク法医学的手法を用いてRaaSサンプルを分析し、良質で悪意のあるネットワークトラフィックのパケットキャプチャについて検討した。
この実験では、40%以上のパケットが悪意があることがわかった。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:40:58 GMT)
EEG-Titans: Long-Horizon Seizure Forecasting via Dual-Branch Attention and Neural Memory [0.0] 本稿では、長期コンテキストモデリングのための現代のニューラルメモリ機構を組み込んだデュアルブランチEEGアーキテクチャを提案する。
EEG-Titansは18人の被験者の平均セグメントレベルの感度を99.46%達成している。
以上の結果から, 記憶増強長文モデリングは, 臨床的に制約された評価下において, 堅牢な発作予測を可能にする可能性が示唆された。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:03:49 GMT)
Dimensional Constraints from SU(2) Representation Theory in Graph-Based Quantum Systems [0.0] 抽象グラフエッジが内部自由度を持つが、幾何学的性質が欠如している場合、表現理論から生じる次元的制約について検討する。
このような内部自由度が方向情報のみを符号化できることを証明し、最小表現として$mathbbC2$の量子状態を必要とする。
この結果は、次元構造が、量子情報理論、離散幾何学、量子基礎と潜在的に関連して、情報理論の制約からどのように導出されるかを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 10:40:22 GMT)
Differentiable quantum-trajectory simulation of Lindblad dynamics for QGP transport-coefficient inference [0.0] 我々は,クォークグルーオンプラズマの輸送係数のパラメータ推定を,クォーコニウム抑制のオープン量子系に基づくモンテカルロシミュレーションの微分により検討した。
基礎となるシミュレータは大きなヒルベルト空間でリンドブラッド方程式を解くことを必要とし、パラメータ推定は計算コストがかかる。
我々は,モンテカルロ波動関数アルゴリズムにおいて,離散的なジャンプサンプリングにより,スコア関数勾配推定器を適用し,リンドブラッド方程式を解く。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:03:37 GMT)
Differentiable Logic Synthesis: Spectral Coefficient Selection via Sinkhorn-Constrained Composition [0.0] 凍結フーリエ基底からスペクトル係数を選択する微分可能なアーキテクチャである階層スペクトル合成を導入する。
我々はこのフレームワークを論理合成に適用し、ブール否定を可能にするカラムサイン変調を追加する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 13:26:52 GMT)
Device-independent quantum memory certification in two-point measurement experiments [0.0] ブラックボックス量子メモリを認証するためのデバイスに依存しない手法を提案する。
量子系を2つの点で探索し、古典的因果モデルに対して観測された時間的相関に直面する。
本手法は,量子技術の鍵となる要素をベンチマークするための実用的で強力なツールとして,時間的相関と因果モデリングを確立する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:49:54 GMT)
Decentralized Infrastructure for Digital Notarizing, Signing and Sharing Files using Blockchain [0.0] この論文では、ブロックチェーン技術を使用したドキュメントのデジタル表記、署名、共有のための分散インフラストラクチャを提案する。
この研究は、暗号技術と分散ストレージを組み合わせることにより、公式文書を管理するためのよりセキュアで効率的なフレームワークの開発に寄与する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 12:34:30 GMT)
Credible CO2 Comparisons: A Machine Learning Approach to Vehicle Powertrain Assessment [0.0] 道路輸送の脱炭には、車両技術全体にわたるCO2排出量を比較するための一貫した透明な方法が必要である。
本稿では, 内燃機関車(ICEV)と電気自動車(EV)を, 同一の実世界の運転条件下での運転評価を行う機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 14:43:21 GMT)
Confinement-Induced Floquet Engineering and Non-Abelian Geometric Phases in Driven Quantum Wire Qubits [0.0] この研究は、双色場によって駆動される放物型量子ワイヤ内のスピン量子ビットが、閉じ込め可能な合成ゲージ場を示すことを理論的に証明している。
本研究は, 周期的摂動に対するキュービット状態のトポロジカル保護機構について述べる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 11:12:36 GMT)
Confined non-Hermitian skin effect in a semi-infinite Fock-state lattice [0.0] 本稿では,半無限フォック状態格子における非エルミート皮膚効果について検討する。
非一様で非相反的なSSHモデルを解析的に解くことにより、非相反性と組み合わせた内在的不均一結合が従来の皮膚効果を根本的に修飾することを示した。
この研究は、合成次元におけるエンジニアリングされた結合プロファイルが非エルミート特性を再構成し、量子状態操作のための新しいプロトコルを実現する方法を明らかにする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 02:59:03 GMT)
Comparison of Multiple Classifiers for Android Malware Detection with Emphasis on Feature Insights Using CICMalDroid 2020 Dataset [0.0] 署名スキャナーは、パブリックアプリストアでリリースサイクルの速さに遅れを取っている。
私たちはCICMalDroid PCA2020を使用しました。
オリジナル機能のグラデーション向上が 最善を尽くした
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:50:58 GMT)
Comparing Without Saying: A Dataset and Benchmark for Implicit Comparative Opinion Mining from Same-User Reviews [0.0] 同ユーザレビューから暗黙的な意見マイニングのための新しいデータセットSUDOを紹介する。
SUDOは4,150の注釈付きレビューペア(15,191文)とアスペクトレベルの言及とレビューレベルの嗜好をキャプチャするバイレベル構造から構成される。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 04:00:51 GMT)
Collective intelligence in science: direct elicitation of diverse information from experts with unknown information structure [0.0] チャットに絡み合った自己解決型プレイマネー予測市場を提案する。
参加者はチャットや取引を通じて仮説に関する個人的な情報を直接共有していることが示される。
このアプローチは、完全に解釈可能な形で関連情報の効率的な集約につながる。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 15:01:55 GMT)
ButterflyMoE: Sub-Linear Ternary Experts via Structured Butterfly Orbits [0.0] ButterflyMoEは、専門家を独立した重量行列ではなく、統一された量子化基板の幾何学的再配向として扱う。
言語モデリングベンチマーク全体で、ButterflyMoEは256のエキスパートで150倍のメモリ削減を実現している。
これにより、64人のエキスパートが標準のMoEの8人のエキスパートと比較して4GBのデバイスに適合し、幾何学的パラメトリゼーションが線形スケーリングを損なうことを示す。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 03:39:33 GMT)
Breaking the Orthogonality Barrier in Quantum LDPC Codes [0.0] 我々は, 誤り確率が4%の非分極チャネル上で, フレーム誤り率を10~8ドル以下で達成する量子低密度パリティチェック(LDPC)コードを開発した。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 18:24:56 GMT)
Breaking the Data Barrier in Learning Symbolic Computation: A Case Study on Variable Ordering Suggestion for Cylindrical Algebraic Decomposition [0.0] 記号計算は、正確な深層計算による数学的推論において重要な応用である。
既存の学習ベースのアプローチは、最高の専門家ベースの方法と競合するだけです。
我々は、大量の注釈付きデータを簡単に取得できる一連の密結合タスクを設計する。
一般公開されたCAD注文データセットの実験では、新しいモデルによって予測される順序は、提案されるものよりもはるかに良いことが示されている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 08:40:35 GMT)
Arabic Sign Language Recognition using Multimodal Approach [0.0] アラビア手話(ArSL)は、聴覚障害者コミュニティにおける個人にとって不可欠なコミュニケーション方法である。
既存の認識システムは、Leap MotionやRGBカメラのような単一センサーアプローチに依存しているため、重大な課題に直面している。
本稿では,Leap Motion と RGB カメラデータを組み合わせて ArSL 認識の可能性を検討するマルチモーダルアプローチの可能性を検討することを目的とする。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:21:43 GMT)
Aiming for AI Interoperability: Challenges and Opportunities [0.0] 技術的相互運用性は、AIシステムとネットワークが一緒に機能する能力である。
規制の相互運用性は、管轄区域やセクター間での規則の一貫性と重複である。
このレポートは、多くの政府、標準設定機関、民間企業が新しいAI法、ポリシー、フレームワークを起草、実施、または通過している、加速する傾向を観察する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 22:05:55 GMT)
Adaptive KDE for Real-Time Thresholding: Prioritized Queues for Financial Crime Investigation [0.0] オンライン適応カーネル密度をスコアストリームに適合させ、その密度をテール質量曲線に変換してキャパシティを満たす。
合成, ドリフト, マルチモーダルストリームにおいて, しきい値ジッタを低減しつつ, 競合能力の定着を実現する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 20:55:46 GMT)
AQUA: an Agile Process to Develop Quantum Annealing Applications [0.0] アジャイルQUantum Annealing(アジャイルQUantum Annealing)は、NetService S.p.AとCagliari大学との産学連携を通じて作られたQUBO/QA開発のためのアジャイルライフサイクルである。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 21:44:53 GMT)
AI Agents vs. Human Investigators: Balancing Automation, Security, and Expertise in Cyber Forensic Analysis [0.0] AIエージェントは、異常検出、エビデンス分類、行動パターン認識などのプロセスを自動化する能力のために、デジタル法医学のプラクティスを越えて採用されている。
しかし、AIを不可欠にしている特徴は、注目すべきリスクももたらしている。
本研究は、最もよく使用されるAIエージェントであるChatGPTと人間法医学研究者の有効性の比較分析を行った。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 23:52:32 GMT)
A generating-function approach to the interference of squeezed states with partial distinguishability [0.0] 本研究では, 位相空間の定式化を基礎として, 単モード圧縮状態の干渉に対する部分微分可能性の影響を特徴づける。
我々のアプローチは、追加の非干渉モードを通して区別可能性を表す一般的なモデルを越えている。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 17:50:15 GMT)
A full process algebraic representation of Ant Colony Optimization [0.0] 本稿では,並列化されたAnt Colony Optimizationアルゴリズムを詳細に記述できるプロセス代数について述べる。
3つの異なるACOアルゴリズムの基礎を説明し、PA$2$COを正式に定義し、異なる並列スキームを持つ複数の実装の表現に使用する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 19:45:19 GMT)
A Systematic Analysis of Chunking Strategies for Reliable Question Answering [0.0] 本研究では,文書のチャンキング選択が検索・拡張生成システムの信頼性に与える影響について検討する。
我々は、SPLADE検索とMistral-8Bジェネレータという、標準的な産業装置を使用している。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 16:19:58 GMT)
A Blockchain-Oriented Software Engineering Architecture for Carbon Credit Certification Systems [0.0] 本稿では,ブロックチェーンベースのカーボンクレディット認証アーキテクチャを紹介する。
リアルタイムIoTデータ収集、エッジレベルのアグリゲーション、スマートコントラクトで許可されたブロックチェーン上のセキュアなオンチェーンストレージを統合する。
検証可能な炭素クレディットレコードを生成し、サードパーティによる検証をサポートするための構造化された経路を提供する。
論文参考訳(メタデータ) (Tue, 20 Jan 2026 09:31:14 GMT)