EnvScaler: Scaling Tool-Interactive Environments for LLM Agent via Programmatic Synthesis [101.7] 大規模言語モデル(LLM)は、様々な現実世界環境においてエージェントとして機能するよう訓練されることが期待されている。
このプロセスはリッチで多様なツール・インタラクション・サンドボックスに依存している。
スケーラブルなツールインタラクション環境のための自動化フレームワークであるEnvScalerを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:32:06 GMT)
The ICASSP 2026 HumDial Challenge: Benchmarking Human-like Spoken Dialogue Systems in the LLM Era [95.4] 我々はICASSP 2026で最初のヒューマンライクな音声対話システムチャレンジ(HumDial)を開催する。
本稿では,データセット,トラック構成,最終結果について概説する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:32:30 GMT)
e5-omni: Explicit Cross-modal Alignment for Omni-modal Embeddings [91.3] 市販の視覚言語モデルをロバストなオムニモーダル埋め込みモデルに適応させる軽量な明示的アライメントレシピであるe5-omniを提案する。
e5-omniは、類似度尺度を整合させるためにモード対応温度校正と、混乱する負の点に焦点を合わせた制御可能な負のカリキュラムと、クロスモーダル幾何に適合するバッチホワイトニングを組み合わせる。
MMEB-V2とAudioCapsの実験では、強いバイモーダルおよびオムニモーダルベースラインよりも一貫した利得を示した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:24:32 GMT)
On the Fallacy of Global Token Perplexity in Spoken Language Model Evaluation [88.8] 大規模生音声で事前訓練された生成音声言語モデルは、適切な内容で音声プロンプトを継続することができる。
本稿では,グローバルトークンの難易度に代えて,多種多様な可能性・生成的評価手法を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:01:56 GMT)
Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency [78.9] 完全な自己整合性で答えられた事実でさえ、軽微な文脈干渉の下で急速に崩壊することを示します。
本研究では,概念的近傍における応答コヒーレンスを評価する信念の構造尺度であるNighbor-Consistency Belief(NCB)を提案する。
また、文脈不変の信念構造を最適化し、長い知識の脆さを約30%低減する構造意識訓練(SAT)を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:23:21 GMT)
MoGen: A Unified Collaborative Framework for Controllable Multi-Object Image Generation [76.9] MoGenは、ユーザフレンドリーなマルチオブジェクト画像生成方法である。
まず、言語記述中のフレーズ単位を対応する画像領域に正確に固定する地域意味アンカー(RSA)モジュールを設計する。
適応型マルチモーダルガイダンス(AMG)モジュールを導入し,マルチソース制御信号の様々な組み合わせを適応的に解析・統合する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:57:48 GMT)
K-EXAONE Technical Report [76.2] K-EXAONEはLG AI Researchが開発した大規模多言語言語モデルである。
256Kのコンテキストウィンドウをサポートし、韓国語、英語、スペイン語、ドイツ語、日本語、ベトナム語をカバーしている。
我々はK-EXAONEを、推論、エージェント、一般、韓国語、多言語能力にまたがる総合的なベンチマークスイートで評価した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:37:13 GMT)
The Molecular Structure of Thought: Mapping the Topology of Long Chain-of-Thought Reasoning [76.1] 有効かつ学習可能なLong CoTトラジェクトリは、統一された視点で安定な分子様構造を特徴とすることを示す。
有効セマンティック異性体を導入し, 高速エントロピー収束を促進する結合のみが安定なLong CoT学習を支援することを示す。
本稿では,効率の良いLong CoT構造の合成を導出する分布移動グラフ法であるMole-Synを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:39:01 GMT)
Can We Predict Before Executing Machine Learning Agents? [74.4] データ中心のソリューション優先のタスクを形式化し、18,438対比較の包括的コーパスを構築する。
検証データ解析レポートを作成した場合, LLM は重要な予測能力を示すことを示す。
このフレームワークをForEAGENT(Predict-then-Verifyループを利用するエージェント)でインスタンス化し、実行ベースラインを+6%超えながらコンバージェンスを6倍高速化する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:44:17 GMT)
Projecting Out the Malice: A Global Subspace Approach to LLM Detoxification [73.8] 大規模言語モデル(LLM)は例外的な性能を示すが、有害なコンテンツを生成する固有のリスクを生じさせる。
従来の手法では、パラメータの根底にある有害領域を排除できず、敵の攻撃に弱いモデルを残している。
我々は,このグローバルな部分空間をFFNパラメータから識別・排除することで毒性を緩和する軽量な方法であるGLOSSを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:34:53 GMT)
Adversarial Yet Cooperative: Multi-Perspective Reasoning in Retrieved-Augmented Language Models [72.4] 本稿ではAdrialversa Reasoning RAG(ARR)というReasoner-Verifierフレームワークを提案する。
ReasonerとVerifierは、回収された証拠を推論し、プロセス認識の利点によってガイドされながら、互いの論理を批判する。
複数のベンチマーク実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:12:04 GMT)
SceneAlign: Aligning Multimodal Reasoning to Scene Graphs in Complex Visual Scenes [69.0] マルチモーダルな大きな言語モデルは、複雑な視覚シーンにおいて忠実な推論に苦しむことが多い。
既存の嗜好ベースのアプローチでは、モデルが視覚的グラウンドをバイパスするために言語事前を活用できるため、この課題に対処できない。
我々は,シーングラフを構造化視覚情報として活用し,制御可能な構造介入を行うフレームワークであるSceneAlignを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:40:39 GMT)
All That Glisters Is Not Gold: A Benchmark for Reference-Free Counterfactual Financial Misinformation Detection [67.9] RFC Benchは、現実的なニュースの下で財務的な誤情報に関する大規模な言語モデルを評価するためのベンチマークである。
このベンチマークでは、2つの補完的なタスクが定義されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:56:48 GMT)
Circular Reasoning: Understanding Self-Reinforcing Loops in Large Reasoning Models [66.1] Circular Reasoningは、生成されたコンテンツが自身の再発の論理的前提として機能する自己強化トラップである。
機械学的には、円の推論は異なる境界を示す状態崩壊として特徴付けられる。
自己強化型V字型アテンション機構によって駆動される不自由なサイクルとして継続するループ開始を誘導する推論が阻害されることを明らかにする。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:23:55 GMT)
Weights to Code: Extracting Interpretable Algorithms from the Discrete Transformer [65.4] 本稿では,連続表現と離散記号論理のギャップを埋めるアーキテクチャである離散変換器を提案する。
実証的には、Discrete TransformerはRNNベースのベースラインに匹敵するパフォーマンスを達成するだけでなく、連続的な変数ドメインへの解釈可能性を大幅に拡張する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:49:41 GMT)
One Language-Free Foundation Model Is Enough for Universal Vision Anomaly Detection [65.1] Universal Visual Anomaly Detection (AD) は、オープンかつダイナミックなシナリオに向けて、異常画像とセグメント異常領域を識別することを目的としている。
現在の手法は、複雑なプロンプトエンジニアリング、精巧な適応モジュール、そして挑戦的な訓練戦略に苦しむことが多い。
本稿では,Universal Vision Anomaly Detection(UniADet)のための,恥ずかしいほどシンプルで汎用的で効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:05:18 GMT)
CoV: Chain-of-View Prompting for Spatial Reasoning [64.8] CoV(Chain-of-View)は、視覚言語モデルをアクティブな視点推論子に変換する。
我々はOpenEQA上でのCoVの評価を行い、Qwen3-VL-Flashで最大13.62%向上したLLM-Matchで平均+11.56%改善した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:20:05 GMT)
GIFT: Games as Informal Training for Generalizable LLMs [64.5] 大規模言語モデル(LLM)は「実践的な知恵」と一般化可能な知性に苦しむ。
このギャップは、目標指向の指示よりもインタラクティブなフィードバックに長けている非公式な学習の欠如から生じる。
LLMの非公式学習におけるゲーム処理環境として,本質的な報酬信号と抽象化された複雑性を活用することを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:42:44 GMT)
PaCoRe: Learning to Scale Test-Time Compute with Parallel Coordinated Reasoning [62.6] PaCoReは、現代の言語モデルの中心的な制限を克服するために設計されたトレーニングと推論のフレームワークである。
PaCoReは、複数のラウンドでメッセージパッシングアーキテクチャを介して調整された巨大な並列探索を通じてTTCを駆動することで、従来のシーケンシャルパラダイムから逸脱する。
大規模で結果に基づく強化学習を備えたエンドツーエンドで訓練されたモデルでは、PaCoReに必要な合成能力を習得し、コンテキスト制限を超えることなく、数百万の効果的なTTCにスケールする。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:24:43 GMT)
CLewR: Curriculum Learning with Restarts for Machine Translation Preference Learning [61.4] 大言語モデル(LLM)は、ゼロショット多言語機械翻訳(MT)において競合性能を示した。
いくつかのフォローアップ作業は、好みの最適化を通じてMTのパフォーマンスをさらに改善するが、主に探索されていない重要な側面、すなわちトレーニング中にデータサンプルが与えられる順序を残している。
MT性能を向上させるために,カリキュラム学習を様々な最先端の選好最適化アルゴリズムに統合することで,この問題に対処する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:34:31 GMT)
Stephanie2: Thinking, Waiting, and Making Decisions Like Humans in Step-by-Step AI Social Chat [60.5] Stephanie2は、次世代のステップワイド意思決定対話エージェントである。
Stephanie2は、アクティブな待機とメッセージペースの適応によって、各ステップで送信と待機を明示的に決定する。
実験によると、Stephanie2は自然さやエンゲージメントなどの指標で明らかにStephanie1を上回っている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:27:17 GMT)
Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards [60.1] 強化学習(Reinforcement Learning, RL)は, LLMに基づくディープサーチエージェントの強化に重要な手法である。
既存のアプローチは主にバイナリ結果の報酬に依存しており、エージェントの推論プロセスの包括性と事実性を捉えていない。
ディープサーチエージェントのための微粒化報酬フレームワークである textbfCitation-aware RL Rewards (CaRR) を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:57:53 GMT)
Overcoming Joint Intractability with Lossless Hierarchical Speculative Decoding [58.9] 我々は無益な無益な提案をする。
承認されたトークンの数を大幅に増加させる検証方法。
HSDは様々なモデルファミリやベンチマークの受け入れ率に一貫した改善をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:10:29 GMT)
Towards Generalized Multi-Image Editing for Unified Multimodal Models [56.6] 統一マルチモーダルモデル(UMM)は、マルチモーダル理解と生成を統合する。
UMMは、複数の入力画像にまたがる詳細を参照する場合、視覚的一貫性の維持と視覚的手がかりの曖昧さに制限される。
画像の同一性を明確に識別し、可変入力数に一般化するUMMのためのスケーラブルなマルチイメージ編集フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:42:49 GMT)
Perception Test 2025: Challenge Summary and a Unified VQA Extension [56.2] 第3の知覚テストは、IEEE/CVF International Conference on Computer Vision (ICCV) 2025と共に、フルデイワークショップとして組織された。
第一の目的は、最先端のビデオモデルをベンチマークし、マルチモーダル知覚の進捗を測定することである。
主要なパーセプションテストの課題の結果を要約し、既存のタスクとベンチマークへの新たな追加の両方を詳述する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:02:21 GMT)
SSR: Safeguarding Staking Rewards by Defining and Detecting Logical Defects in DeFi Staking [55.6] DeFi(Decentralized Finance)の買収は、DeFiエコシステムにおける最も顕著なアプリケーションの1つだ。
DeFiの盗難の論理的欠陥により、攻撃者は不当な報酬を請求できる。
我々は,DeFi取引契約における論理的欠陥を検出するための静的解析ツールであるSSR(Safeguarding Stake Reward)を開発した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:01:41 GMT)
VideoWeave: A Data-Centric Approach for Efficient Video Understanding [54.6] 我々は、合成長文学習サンプルを構築して、データ効率を改善するためのシンプルで効果的な方法であるVideoWeaveを提案する。
VideoWeaveは、利用可能なビデオテキストペアを再編成して、固定計算内で時間的多様性を拡大する。
我々の結果は、アーキテクチャを変更するのではなく、トレーニングデータを再編成することで、ビデオ言語モデルをトレーニングするためのシンプルでスケーラブルなパスを提供できることを強調している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:55:26 GMT)
A Large Scale Empirical Analysis on the Adherence Gap between Standards and Tools in SBOM [54.4] ソフトウェア・ビル・オブ・マテリアル(Software Bill of Materials, SBOM)は、ソフトウェア情報を整理する機械読み取り可能なアーティファクトである。
標準に従って、組織はSBOMの生成と利用のためのツールを開発した。
本稿では,我々の自動評価フレームワークであるSAPを用いて,接着ギャップの大規模2段階解析を行った。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:26:05 GMT)
Readability-Robust Code Summarization via Meta Curriculum Learning [53.4] 現実の世界では、コードが貧弱な構造や難読化され、モデルのパフォーマンスが著しく低下することが多い。
本稿では,可読性の低いコードに対するコード要約の堅牢性を向上する,新しい微調整手法であるRoFTCodeSumを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:38:24 GMT)
PiXTime: A Model for Federated Time Series Forecasting with Heterogeneous Data Structures Across Nodes [52.8] 時系列は非常に価値が高く、ノード間で共有することは滅多にない。
サンプリング基準の相違により、ノード間の時間粒度や変数セットが多様になる。
フェデレーション学習用に設計された新しい時系列予測モデルであるPiXTimeを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:11:45 GMT)
A Causal Information-Flow Framework for Unbiased Learning-to-Rank [52.5] Web検索とレコメンデーションシステムでは、ユーザクリックがランキングモデルのトレーニングに広く使用されている。
本稿では,Unbiased Learning-to-Rankを拡張する因果学習に基づく新たなランキングフレームワークを提案する。
本手法は測定されたバイアスリークを一貫して低減し,ランキング性能を向上させる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:19:35 GMT)
Disordered Dynamics in High Dimensions: Connections to Random Matrices and Machine Learning [52.3] ランダム行列によって駆動される高次元力学系について概説する。
機械学習理論における学習と一般化の単純なモデルへの応用に焦点を当てる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:50:11 GMT)
SGDrive: Scene-to-Goal Hierarchical World Cognition for Autonomous Driving [52.0] 本稿では,運転特化知識階層に関するVLMの表現学習を構築する新しいフレームワークであるSGDriveを提案する。
トレーニング済みのVLMバックボーン上に構築されたSGDriveは、人間の運転認知を反映するシーンエージェントゴール階層に、駆動理解を分解する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:55:42 GMT)
How well can off-the-shelf LLMs elucidate molecular structures from mass spectra using chain-of-thought reasoning? [51.3] 大規模言語モデル (LLM) は推論集約的な科学的タスクを約束するが、化学的解釈の能力はまだ不明である。
我々は、分子構造を予測するために、LLMが質量スペクトルデータに対してどのように理由を持つかを評価する、Chain-of-Thought(CoT)プロンプトフレームワークとベンチマークを導入する。
SMILESの妥当性, 式整合性, 構造的類似性の指標による評価の結果, LLMは合成学的に有効で, 部分的に可視な構造を生成できるが, 分子予測の正確性やリンク推論を達成できないことがわかった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:08:42 GMT)
Efficient Differentiable Causal Discovery via Reliable Super-Structure Learning [51.2] 本稿では,新たな因果発見パイプラインであるALVGLを提案する。
ALVGLはスパース分解とローランク分解を用いてデータの精度行列を学習する。
ALVGLは最先端の精度を達成するだけでなく、最適化効率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:18:59 GMT)
DIFF-MF: A Difference-Driven Channel-Spatial State Space Model for Multi-Modal Image Fusion [51.1] マルチモーダル画像融合は、複数のソース画像から補完的な情報を統合して、リッチなコンテンツで高品質な融合画像を生成することを目的としている。
マルチモーダル画像融合のための差動駆動型チャネル空間空間モデルDIFF-MFを提案する。
本手法は,視覚的品質と定量的評価の両方において,既存の手法よりも優れている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:26:54 GMT)
WildSci: Advancing Scientific Reasoning from In-the-Wild Literature [50.2] 我々は、ピアレビューされた文献から自動的に合成されるドメイン固有の科学質問の新しいデータセットWildSciを紹介する。
複雑な科学的推論タスクを複数選択形式でフレーミングすることにより、明確に定義された報酬信号によるスケーラブルなトレーニングを可能にする。
一連の科学的ベンチマークの実験は、我々のデータセットとアプローチの有効性を実証している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:35:23 GMT)
The Facade of Truth: Uncovering and Mitigating LLM Susceptibility to Deceptive Evidence [49.9] MisBeliefは、協調的な多ラウンドの相互作用によって誤解を招く証拠を生成するフレームワークである。
MisBeliefを用いて、3つの難易度で4,800のインスタンスを生成し、7つの代表的なLCMを評価する。
結果は、モデルは直接的な誤報に対して堅牢であるが、この洗練された証拠に非常に敏感であることを示している。
本稿では,疑似意図を証拠裏で推測することにより早期警告信号を提供するガバナンス機構である,認知的意図遮蔽(DIS)を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:28:00 GMT)
Differential syntactic and semantic encoding in LLMs [49.3] 我々は,Large Language Models (LLMs) の内部層表現において,統語的・意味的情報を符号化する方法を検討する。
構文と意味論の層間符号化プロファイルは異なっており,この2つの信号はある程度分離可能であることが判明した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:02:00 GMT)
The Evaluation Gap in Medicine, AI and LLMs: Navigating Elusive Ground Truth & Uncertainty via a Probabilistic Paradigm [49.3] 基礎的真理解における高い確実性は、専門家でさえ高いスコアを得るのに、ほぼ常に必要であるということを理論的に説明するために確率論的パラダイムを導入する。
そこで我々は,有能な人間やシステムが与えられた真理応答の変動を推定するために,期待精度と期待F1の概念を導出する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:19:37 GMT)
Matrix Factorization Framework for Community Detection under the Degree-Corrected Block Model [49.0] 我々は,DCBM推論を制約付き非負行列分解問題として再定義できることを示した。
我々のアプローチは、任意の特定のネットワーク構造に適応し、DCBMで表現可能な任意の構造を持つグラフに適用する。
合成および実ベンチマークネットワークの実験により,本手法はDCBMの推測に匹敵するコミュニティを検出する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:16:29 GMT)
DynaDebate: Breaking Homogeneity in Multi-Agent Debate with Dynamic Path Generation [47.6] DynaDebate (Dynamic Multi-Agent Debate) を導入し,3つのキーメカニズムによるマルチエージェント討論の有効性を高める。
大規模な実験により、DynaDebateは既存の最先端のMADメソッドを超越して、様々なベンチマークで優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:01:33 GMT)
How to Set the Batch Size for Large-Scale Pre-training? [46.6] 本稿では,Warmup-Stable-Decay(WSD)学習率スケジューラに適した改良E(S)関係を提案する。
理論的には, 目標損失を達成するのに必要な最小バッチサイズしきい値であるB_minと, 合計トークンを最小化してデータ効率を最大化する最適バッチサイズであるB_optの2つの基本的特性を明らかにしている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:25:57 GMT)
AdaFuse: Adaptive Ensemble Decoding with Test-Time Scaling for LLMs [46.5] 推論時のアンサンブルは、大規模な言語モデル機能を再訓練せずに組み合わせる実用的な方法を提供する。
生成時に意味的に適切な融合単位を動的に選択する適応型アンサンブルデコーディングフレームワークであるAdaFuseを提案する。
AdaFuseは一貫して強力なアンサンブルベースラインを上回り、6.88%の平均的な相対的な改善を達成している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:58:22 GMT)
ReasonAny: Incorporating Reasoning Capability to Any Model via Simple and Effective Model Merging [46.1] 本稿では,コントラシブ・グラディエント同定による推論領域の性能崩壊を解消する新たな統合フレームワークを提案する。
安全、バイオメディシン、ファイナンス領域での実験では、ReasonAnyは効果的に"Reasoning + X"機能を合成している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:19:00 GMT)
SAPL: Semantic-Agnostic Prompt Learning in CLIP for Weakly Supervised Image Manipulation Localization [45.2] 悪意のある画像操作は公衆の安全を脅かし、効率的な位置決め方法を必要とする。
既存の弱教師付き手法は画像レベルのバイナリラベルに依存し、グローバルな分類に重点を置いている。
本稿では,CLIPにおける意味非依存型プロンプト学習(SAPL)を提案し,非意味的,境界中心的なキューを意図的に符号化するテキストプロンプトを学習する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:25:55 GMT)
MaxCode: A Max-Reward Reinforcement Learning Framework for Automated Code Optimization [44.3] 大きな言語モデル(LLM)は、一般的なコーディングタスクにおいて強力な能力を示すが、コードの最適化には2つの重要な課題に直面する。
本研究では,LLMがよりよい解を見つけるための推論時間探索アルゴリズムについて検討する。
MaxCodeと呼ばれる我々の手法は、マックス・リワード強化学習フレームワークの下で既存の検索方法を統一する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:21:28 GMT)
VIGIL: Defending LLM Agents Against Tool Stream Injection via Verify-Before-Commit [44.2] オープン環境で動作するLLMエージェントは、間接的なプロンプトインジェクションによるエスカレーションリスクに直面している。
制約的分離から検証前コミットプロトコルへパラダイムをシフトするフレームワークである textbfVIGIL を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:19:49 GMT)
Pantagruel: Unified Self-Supervised Encoders for French Text and Speech [44.2] 我々は、フランス語のテキストと音声のための自己教師型エンコーダモデルの新しいファミリーであるPantagruelモデルをリリースする。
テキストトークンや音声単位などのモダリティに適したターゲットを予測する代わりに、Pantagruelは特徴空間におけるコンテキスト化されたターゲット表現を学習する。
Wikipedia、OSCAR、CroissantLLM、MultilingualLibriSpeech、LeBenchmark、INA-100kなど、大規模なフランスのコーパスで事前訓練されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:28:25 GMT)
SOVABench: A Vehicle Surveillance Action Retrieval Benchmark for Multimodal Large Language Models [43.8] 我々は,車両関連行動を中心とした監視映像から構築した実世界検索ベンチマークであるSOVABenchを紹介する。
SOVABenchは、2つの評価プロトコル(ペア内とペア内)を定義し、相互行為の識別と時間方向の理解を評価する。
本稿では,MLLMによる画像とビデオの両方の記述から解釈可能な埋め込みを生成するための学習自由フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:27:37 GMT)
VIB-Probe: Detecting and Mitigating Hallucinations in Vision-Language Models via Variational Information Bottleneck [43.7] 本稿では,新しい幻覚検出・緩和フレームワークVIB-Probeを提案する。
本手法は,意味論をフィルタリングしながら,階層や頭部の識別パターンを抽出する。
私たちのコードは公開されます。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:58:22 GMT)
Left, Right, or Center? Evaluating LLM Framing in News Classification and Generation [43.4] 大規模言語モデル(LLM)に基づく要約とテキスト生成は、テキストの生成と書き直しにますます利用されている。
LLMの分類に基づくバイアス信号が、生成された要約におけるフレーミング行動と一致しているかを調べることで、政治的フレーミングを研究する。
記事レベルの評価と生成テキストの両方において,広汎なイデオロギー中心崩壊がみられ,中心フレーミングに対する体系的な傾向が示唆された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:10:11 GMT)
Learning Geometric Invariance for Gait Recognition [43.3] 異なる歩行条件の変動は、幾何変換の組合せとして概ね見なすことができる。
我々は$mathcalRRS$-Gaitという,$mathcalR$eflect-$mathcalR$otate-$mathcalS$cale不変学習フレームワークを設計する。
4つの一般的な歩行データセットの実験は、様々な歩行条件において優れた性能を示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:47:01 GMT)
Generalizable and Adaptive Continual Learning Framework for AI-generated Image Detection [42.7] 悪意のある誤用とAI生成画像の普及は、オンライン情報の信頼性に重大な脅威をもたらす。
現在の検出方法は、しばしば目に見えない生成モデルに一般化するのに苦労する。
本稿では,進化的生成モデルへの継続的適応を目的とした3段階連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:01:22 GMT)
ToolGym: an Open-world Tool-using Environment for Scalable Agent Testing and Data Curation [42.5] 一般的な204のアプリにまたがって,571フォーマットの統一ツール上に構築された,オープンワールドのツール使用環境を紹介します。
これには、ロングホライゾンを合成するタスク生成エンジン、ワイルド制約付きマルチツール、ストレス-テストの堅牢性に割り込みと失敗を注入するステートコントローラが含まれる。
最先端のLLMの総合評価では、ツール計画と実行能力の相違、既存のLLMの弱点に続く制約、DeepSeek-v3.2の強靭さが明らかにされている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 21:59:31 GMT)
EverMemOS: A Self-Organizing Memory Operating System for Structured Long-Horizon Reasoning [42.3] 大きな言語モデル(LLM)は、長期の対話エージェントとしてますますデプロイされているが、その限られたコンテキストウィンドウは、拡張された相互作用よりもコヒーレントな振舞いを維持するのが困難である。
本稿では,EverMemOSについて紹介する。EverMemOSは,計算メモリにエミュレートされたライフサイクルを実装した自己組織型メモリオペレーティングシステムである。
EverMemOSは、メモリ拡張推論タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:23:07 GMT)
Efficient Temporal-aware Matryoshka Adaptation for Temporal Information Retrieval [40.4] TMRL(Talal-Aware Matryoshka Representation Learning)は,TMRL(Taloral-Aware Matryoshka Representation Learning)の略で,TMRL(Taloral-Aware Matryoshka Representation Learning)の略である。
TMRLは多様なテキスト埋め込みモデルに効率よく適応し、競合する時間的検索と時間的RAG性能を実現する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:01:01 GMT)
Assembling Solar Panels by Dual Robot Arms Towards Full Autonomous Lunar Base Construction [38.6] 今後何十年もの間、月面基地の建設に注力し、ロボットシステムが重要なインフラを安全かつ効率的に確立する重要な役割を担っている。
国際宇宙ステーション(ISS)の建設と同様に、モジュールを介して必要なコンポーネントを出荷し、それらを組み立てることは現実的なシナリオである。
本稿では、デュアルアームロボットシステムのための自律シーケンスにおける視覚、制御、ハードウェアシステムの統合に焦点を当てる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:47:13 GMT)
Ground What You See: Hallucination-Resistant MLLMs via Caption Feedback, Diversity-Aware Sampling, and Conflict Regularization [38.5] マルチモーダル大言語モデル(MLLM)における幻覚の根本原因を系統的に解析する。
1)不正確な初期記述が後続の推論を誤った前提に固定する連鎖的視覚推論の過度な信頼、(2)政策最適化中の探索の多様性が不十分で、過度に自信があるが誤ったアウトプットを発生させる要因、(3)トレーニングサンプル間の破壊的な衝突、NTKの類似性が誤関連や不安定なパラメータ更新を引き起こす要因である。
実験の結果,提案手法は幻覚率を著しく低減し,MLLMの推論精度を効果的に向上することが示された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:59:18 GMT)
From Laboratory to Real-World Applications: Benchmarking Agentic Code Reasoning at the Repository Level [38.2] 本稿では,帰納的アサーション検証を中心とした診断ベンチマークであるRepoReasonを紹介する。
本研究では, 環境を意味として利用し, 地盤構造を再現する実行駆動型突然変異フレームワークを実装した。
我々の発見は、次世代のエージェントソフトウェアエンジニアリングを最適化するための、詳細なホワイトボックスの洞察を提供する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:30:25 GMT)
Learning from Mistakes: Negative Reasoning Samples Enhance Out-of-Domain Generalization [37.6] チェーン・オブ・シンクレット(CoT)軌道上でのSFT(Supervised Fine-tuning)は、大規模言語モデルにおける推論を可能にする一般的なアプローチである。
通常、標準的なプラクティスは、正しい最終回答(陽性)を持つ軌跡を保ちながら、残り(陰性)を無視するのみである。
我々は、このパラダイムが相当な監督を放棄し、オーバーフィッティングを悪化させ、ドメイン外一般化(OOD)を制限すると論じている。
適応型サンプル認識方式であるGain-based LOss Weighting (GLOW)を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:57:10 GMT)
Autoregressive Ranking: Bridging the Gap Between Dual and Cross Encoders [37.2] マルチトークンドクIDを用いたポイントワイズ生成ランキングはデュアルエンコーダよりも優れていることを示す。
SToICaLは、アイテムとトークンのレベルの両方において、ランク対応の監視を組み込むことができるシンプルなトークンの校正損失である。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:16:28 GMT)
Analysing Differences in Persuasive Language in LLM-Generated Text: Uncovering Stereotypical Gender Patterns [35.5] 我々は,受取者の性別,送信者意図,あるいは出力言語によって,説得的言語生成がどのような影響を受けるかを評価する。
以上の結果から,全モデルにまたがる説得言語に有意な性別差が認められた。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:07:38 GMT)
LLMs as Science Journalists: Supporting Early-stage Researchers in Communicating Their Science to the Public [34.3] 本研究では,科学ジャーナリストの役割を模擬する大規模言語モデルを訓練するための枠組みを提案する。
我々は、シミュレーションと人間研究者の双方との会話を指導するLLMジャーナリストの有用性を評価した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:51:20 GMT)
Bidirectional Channel-selective Semantic Interaction for Semi-Supervised Medical Segmentation [34.1] 半教師型医用画像分割のための双方向チャネル選択セマンティックインタラクション(BCSI)フレームワークを提案する。
まず,SSP(Semantic-Spatial Perturbation)機構を提案する。
次に,ラベル付きデータとラベルなしデータとの相互作用におけるノイズを低減するために,チャネル選択型ルータ(CR)コンポーネントを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:32:57 GMT)
AGDC: Autoregressive Generation of Variable-Length Sequences with Joint Discrete and Continuous Spaces [33.9] トランスフォーマーベースの自己回帰モデルはデータ生成に優れるが、識別トークンへの依存によって本質的に制約される。
本稿では,従来の離散化に基づくハイブリッド離散連続列生成手法のスケーラビリティ限界を解析する。
可変長列の離散値と連続値とを連立でモデル化する新しい統合フレームワーク AGDC を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:57:12 GMT)
ThinkRL-Edit: Thinking in Reinforcement Learning for Reasoning-Centric Image Editing [33.9] 画像編集の質を向上させるために,強化学習(RL)について検討した。
RL は,(1) ノイズ除去に限定した推論探索,(2) バイアスド報酬融合,(3) 不安定な VLM ベースの命令報酬の3つの主要な課題に直面している。
画像合成から視覚的推論を分離する推論中心のRLフレームワークであるThinkRL-Editを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:07:26 GMT)
Knowledge-Driven Multi-Turn Jailbreaking on Large Language Models [33.3] 大規模言語モデル(LLM)は、マルチターンジェイルブレイク攻撃による重大な脅威に直面している。
動的で自己改善的なアプローチを採用したマルチターンジェイルブレイクフレームワークであるMastermindを紹介します。
我々は, GPT-5 や Claude 3.7 Sonnet を含む最先端モデルに対する総合的な実験を行った。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:27:08 GMT)
Closing the Modality Reasoning Gap for Speech Large Language Models [33.2] TARSは、テキスト条件と音声条件の軌跡を整列する強化学習フレームワークである。
提案手法は,7Bスケール音声LLMにおいて,モダリティ推論ギャップを著しく狭め,最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:51:56 GMT)
Tracing Moral Foundations in Large Language Models [33.2] 本研究では,道徳的基盤の符号化,組織化,および2つの命令調整型大規模言語モデル内での表現について検討する。
どちらのモデルも、人間の判断に沿う構造化された層依存的な方法で道徳的基礎を表現し、区別することを発見した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:09:28 GMT)
Good Allocations from Bad Estimates [32.9] 条件平均処理効果推定は、異種集団に対する治療を対象とするデファクトゴールド標準である。
治療効果の自然分布について,O(M/)$サンプルだけで同じ治療効果が得られることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:35:50 GMT)
A Vision for Multisensory Intelligence: Sensing, Synergy, and Science [32.0] 本稿は,今後10年間の多感覚人工知能研究の展望を概説する。
この新しいテクノロジーは、人間とAIがどのように経験し、相互に相互作用するかを変えることができる。
センサーの研究は、AIがデジタルメディアを超えて、より豊かな方法で世界を捉える方法を広げるべきである。
我々は、モダリティと人間とAIの相乗効果を学ぶための新しい技術的課題を提示する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:12:07 GMT)
An Empirical Study on Knowledge Transfer under Domain and Label Shifts in 3D LiDAR Point Clouds [31.5] 3次元点雲の知覚における連続的および移動的学習の研究は、2次元の視覚と比較してまだ未調査である。
RObust Autonomous driving under dataset shifts (ROAD) benchmark, a comprehensive evaluation suite for LiDAR based object classification。
本研究は, 現実的な変化下での既存アプローチの限界を明らかにし, 堅牢な3次元知覚における今後の研究の基盤を固めるものである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:00:05 GMT)
Orchestrating Tokens and Sequences: Dynamic Hybrid Policy Optimization for RLVR [31.4] Reinforcement Learning with Verifiable Rewards (RLVR)は,大規模言語モデルを推論タスクで最適化するための,有望なフレームワークを提供する。
既存のRLVRアルゴリズムは様々な粒度に重点を置いており、それぞれに相補的な強度と制限がある。
本稿では, GRPO と GSPO を単一のクリッピングサロゲート対象にブリッジする動的ハイブリッドポリシー最適化 (DHPO) を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:57:40 GMT)
Rotate Your Character: Revisiting Video Diffusion Models for High-Quality 3D Character Generation [31.4] RCM(Rotate your Character Model)は、高品質なノベルビュー合成(NVS)と3Dキャラクタ生成に適した画像間拡散フレームワークである。
RCMは、新しいビュー合成と3D生成品質の両方において最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:07:54 GMT)
What's Left Unsaid? Detecting and Correcting Misleading Omissions in Multimodal News Previews [31.4] 事実が正しいとしても、ソーシャルメディアのニュースプレビューは解釈のドリフトを引き起こす。
この秘密の害は明示的な誤報よりも検出が難しいが、未発見のままである。
我々は、プレビューベースとコンテキストベースの理解を分離し、シミュレートするマルチステージパイプラインを開発した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:29:19 GMT)
Demystifying Multi-Agent Debate: The Role of Confidence and Diversity [31.2] マルチエージェントディベート(MAD)は、テスト時間スケーリングによる大規模言語モデル(LLM)のパフォーマンス向上に広く利用されている。
最近の研究では、バニラMADは計算コストが高いにもかかわらず単純な多数決を下回っていることが示されている。
我々は,バニラMADから欠落する2つの主要なメカニズムを同定する: (i) 初期視点の多様性と (ii) 明示的で校正された信頼コミュニケーション。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:38:30 GMT)
VideoAR: Autoregressive Video Generation via Next-Frame & Scale Prediction [31.2] VideoARは、ビデオ生成のための最初の大規模なVisual Autoregressiveフレームワークであり、マルチスケールの次世代の予測と自動回帰モデリングを組み合わせたものである。
VideoARは、フレーム内VARと因果次フレーム予測を統合することで、空間的および時間的依存関係をアンハングルする。
実証的な結果として、VideoARは、自動回帰モデル間の解像度を改善し、UCF-101上のFVDを99.5から88.6に改善し、10倍以上の推論ステップを減らし、拡散ベースのVBenchスコア81.74に到達した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:34:59 GMT)
EvidFuse: Writing-Time Evidence Learning for Consistent Text-Chart Data Reporting [31.2] データ駆動型レポートのためのテキストチャートインターリーブ生成のためのトレーニング不要なマルチエージェントフレームワークである textbfEvidFuse を提案する。
EvidFuseは2つの協力的なコンポーネントを通じて、長い形式のドラフトから可視化分析を分離する。
LLM-as-a-judgeと人によるチャート品質評価、チャートテキストアライメント、レポートレベルの有用性の両方において、トップランクを獲得している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:41:54 GMT)
SAS-VPReID: A Scale-Adaptive Framework with Shape Priors for Video-based Person Re-Identification at Extreme Far Distances [31.0] ビデオベースのPerson Re-IDentification(VPReID)は、重複しないカメラで撮影したビデオから同じ人物を回収することを目的としている。
極端に離れたところでは、VPReIDは高分解能劣化、劇的な視点の変化、不可避な外観ノイズのために非常に困難である。
本稿では,SAS-VPReIDと命名されたVPReIDのための形状優先型スケール適応フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:22:58 GMT)
Breaking Model Lock-in: Cost-Efficient Zero-Shot LLM Routing via a Universal Latent Space [30.7] 現在のルーティングフレームワークは、徹底的でコストのかかるリトレーニングを必要とし、スケーラビリティと適応性を妨げる。
我々は、このロックインを壊すLSMルーティングの新しいパラダイムであるZeroを紹介します。
提案手法は,モデルのプロファイリングからクエリの特徴を根本的に分離する,クエリの難しさのモデルに依存しない表現である。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:03:40 GMT)
TOSC: Task-Oriented Shape Completion for Open-World Dexterous Grasp Generation from Partial Point Clouds [30.0] Task-Oriented Shape Completionは、全形状ではなく、潜在的な接触領域を完成させることに焦点を当てた新しいタスクである。
3次元識別型オートエンコーダを提案し,各生成した候補の妥当性を評価し,最も妥当な候補を最適化する。
FlowGraspという条件付きフローマッチングモデルを開発し、最適化された形状からタスク指向のデクサラスな把握を生成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:03:02 GMT)
FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments [29.2] FinVaultは、金融エージェントのための最初の実行基盤セキュリティベンチマークである。
現実的な金融エージェント設定では,既存の防衛機構が依然として有効ではないことを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:25:45 GMT)
Reinforcement Learning of Large Language Models for Interpretable Credit Card Fraud Detection [29.1] 本稿では,強化学習(Reinforcement Learning, RL)を用いて,不正検出タスクのための軽量言語モデルの訓練後処理を行う手法を提案する。
我々は,グループシーケンスポリシー最適化(GSPO)アルゴリズムとルールベースの報酬システムを組み合わせて,実生活におけるトランザクションデータセットに基づいて,さまざまなサイズの言語モデルを微調整する。
実験により,本手法の有効性を実証し,学習後の言語モデルを用いて,保持試験データに対するF1スコアの大幅な改善を実現した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:56:27 GMT)
HEART: A Unified Benchmark for Assessing Humans and LLMs in Emotional Support Dialogue [29.1] HEARTは、人間とLDMを同一のマルチターン感情支援会話で直接比較する最初のフレームワークである。
いくつかのフロンティアモデルは、共感と一貫性の知覚において、平均的な人間の反応に近づいたり、超えたりします。
HEARTは、サポート的対話を、一般的な推論や言語流布とは分離可能な、独立した能力軸として再編成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:48:08 GMT)
FACTUM: Mechanistic Detection of Citation Hallucination in Long-Form RAG [29.1] 扇動幻覚(Citation hallucination)とは、モデルがその主張を裏付けることができない情報源を自信を持って引用する詐欺的失敗である。
既存の作業は、しばしば幻覚がモデルのパラメトリック知識に対する単純な過度な信頼に起因している。
FACTUMは,モデルの注意とFFN経路の異なる寄与を測る4つのメカニスティックスコアのフレームワークである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:41:08 GMT)
An Empirical Study on Preference Tuning Generalization and Diversity Under Domain Shift [28.4] 優先順位調整は、事前訓練された言語モデルと品質、有用性、安全性の人間の判断を一致させる。
以前の研究では、好み調整はパフォーマンスを低下させ、トレーニング領域外での評価において有用性を低下させることが示された。
擬似ラベルに基づく適応戦略はドメインシフト劣化を著しく低減できることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:56:55 GMT)
Semi-Supervised Facial Expression Recognition based on Dynamic Threshold and Negative Learning [28.4] DTA(Dynamic Threshold Adjustment)とSNL(Selective Negative Learning)に基づく半教師付き表情認識アルゴリズムを提案する。
我々はRAF-DBとAffectNetデータセットで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:13:53 GMT)
HAG: Hierarchical Demographic Tree-based Agent Generation for Topic-Adaptive Simulation [28.2] 堅牢なフレームワークは、マイクロレベルの個人合理性を確保しつつ、マクロレベルの関節分布をキャプチャするべきである。
既存のアプローチは、データから見えないトピックに適応できない静的なデータベースの検索方法と、マクロレベルの分布認識を欠くLLMベースの生成方法の2つのカテゴリに分類される。
人口発生を2段階決定プロセスとして定式化する階層型エージェント生成フレームワークであるHAGを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:26:08 GMT)
TAGRPO: Boosting GRPO on Image-to-Video Generation with Direct Trajectory Alignment [28.2] コントラスト学習にインスパイアされたI2Vモデルの堅牢なフレームワークであるTAGRPOを提案する。
我々のアプローチは、同一の初期ノイズから生成されたロールアウトビデオが、最適化のための優れたガイダンスを提供するという観察に基づいている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:15:27 GMT)
Distributed Online Convex Optimization with Efficient Communication: Improved Algorithm and Lower bounds [27.9] 圧縮通信を用いた分散オンライン凸最適化について検討する。
本稿では,凸関数と強凸関数に対して,$tildeO(-1/2-1nsqrtT)$と$tildeO(-1-2nlnT)$の改善された後悔境界を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:05:42 GMT)
Transformer Is Inherently a Causal Learner [27.8] 自己回帰的に訓練されたトランスフォーマーは,時間遅れの因果構造を自然に符号化することを示す。
この関係を理論的に標準的な識別可能性条件下で証明する。
このアプローチは最先端の発見アルゴリズムの性能を大幅に上回る。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:10:04 GMT)
Crisis-Bench: Benchmarking Strategic Ambiguity and Reputation Management in Large Language Models [27.4] Crisis-Benchは、大規模言語モデル(LLM)を評価する多エージェント部分観測可能なマルコフ決定プロセス(POMDP)である。
静的グラウンドの真理に依存する従来のベンチマークとは異なり、Adjudicator-Market Loopを導入します。
倫理的懸念に屈服するモデルもある一方で、マキアベリアの正統な戦略的拘束力を示すモデルもある。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:41:49 GMT)
PRISMA: Reinforcement Learning Guided Two-Stage Policy Optimization in Multi-Agent Architecture for Open-Domain Multi-Hop Question Answering [27.0] 大規模コーパスに対する現実世界のオープンドメイン問題への回答は、レトリーバル・拡張ジェネレーション(RAG)システムにおいて重要な課題である。
近年の研究では、検索強化推論プロセスのエンドツーエンド最適化に強化学習(RL)を採用している。
PRISMAはPlan-Retrieve-Inspect-Memoizeアーキテクチャを特徴とする分離誘導型フレームワークである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:38:38 GMT)
Jailbreaking Large Language Models through Iterative Tool-Disguised Attacks via Reinforcement Learning [26.6] iMIST (underlineinteractive underlineMulti-step underlineProgreunderlinessive underlineTool-disguised Jailbreak Attack) は、現在の防御機構の脆弱性を利用する新しい適応型ジェイルブレイク手法である。
広く使われているモデルの実験では、iMISTは低い拒絶率を維持しながら高い攻撃効果を発揮することが示された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:41:39 GMT)
StackPlanner: A Centralized Hierarchical Multi-Agent System with Task-Experience Memory Management [25.5] 中央のエージェントは、メモリ管理の欠如により不安定な長期のコラボレーションに悩まされることが多い。
メモリ制御を明示する階層型マルチエージェントフレームワークStackPlannerを提案する。
複数のディープサーチおよびエージェントシステムベンチマークの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:09:48 GMT)
Toward an Integrated Cross-Urban Accident Prevention System: A Multi-Task Spatial-Temporal Learning Framework for Urban Safety Management [24.6] 複数の都市にまたがるマルチタスク学習問題として,事故リスク予測を定式化する統合システムを提案する。
提案手法を,ニューヨークとシカゴの現実世界のデータセットを用いて75の実験により検証した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:29:07 GMT)
Stable-RAG: Mitigating Retrieval-Permutation-Induced Hallucinations in Retrieval-Augmented Generation [24.6] Retrieval-Augmented Generationは、大規模言語モデルにおける事実幻覚を減らすための重要なパラダイムとなっている。
本稿では,置換誘導幻覚を緩和するために,置換感度推定を利用するStable-RAGを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:55:53 GMT)
Multilingual Amnesia: On the Transferability of Unlearning in Multilingual LLMs [24.6] 我々は,データアンラーニングと概念アンラーニングという2つの設定の下で,Aya-Expanse 8Bモデルを用いて多言語アンラーニングを研究する。
実際の知識とステレオタイプに関するベンチマークを、翻訳によって10言語に拡張する。
実験の結果,高出力言語では非学習がより安定であり,非対称な伝達効果がタイポロジー関連言語間で観測されることがわかった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:59:42 GMT)
Uncovering Failures in Cyber-Physical System State Transitions: A Fuzzing-Based Approach Applied to sUAS [24.4] SaFUZZは、状態遷移、自動フェイルセーフ、ヒューマンオペレータのインタラクションに関連するコア動作を検証する、状態認識ファジィパイプラインである。
ファジィグ仕様を作成し、行動偏差を検知し、関連する障害木を動的に生成し、状態、モード、環境要因を可視化する。
我々は,SaFUZZを現実世界のsUASシステムに対して検証し,これまでシステム開発チームが検出していなかったいくつかの障害点を特定することができた。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:37:35 GMT)
Classroom AI: Large Language Models as Grade-Specific Teachers [23.9] 大型言語モデル (LLMs) は、異なる教育レベルの学生に対して、グレードに適した応答を提供することができない。
本研究では,LLMを微調整し,年齢に合った教育コンテンツを6段階にわたって生成する枠組みを提案する。
本枠組みは, 事実の正しさを犠牲にすることなく, 生徒の理解能力に合致する説明をうまく適応させる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:58:40 GMT)
Afri-MCQA: Multimodal Cultural Question Answering for African Languages [23.2] Afri-MCQAは、12カ国の15のアフリカ言語にわたる7.5万のQ&Aペアをカバーする、初の多言語文化質問回答ベンチマークである。
このベンチマークは、テキストと音声のモダリティに並列な英語とアフリカ語のQ&Aペアを提供しており、完全にネイティブスピーカーによって作成されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:40:09 GMT)
Boosting Latent Diffusion Models via Disentangled Representation Alignment [23.1] 世代フレンドリーなVAEを追求するために、近年の研究では、VAEのアライメントアライメントターゲットとしてVision Foundation Modelsを活用することを検討している。
本稿では,意味的非絡み付きVAE(Send-VAE)を提案する。
提案手法では,VAEラテントを変換する非線形マッパーネットワークを用いて,属性レベルの不絡合と高レベルのセマンティクスのギャップを埋めるために,VFMと整列する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:54:30 GMT)
Immunological Density Shapes Recovery Trajectories in Long COVID [23.0] SARS-CoV-2感染の急性後遺症(Long COVID)は数ヶ月にわたり持続するが、臨床再発の要因は未定義のままである。
関連予防接種歴のある13,511名を対象に, 経時的PASCの97,564例について検討した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:54:59 GMT)
EET: Experience-Driven Early Termination for Cost-Efficient Software Engineering Agents [23.0] EETは、ソフトウェアエンジニアリングエージェントのエクスペリエンス駆動の早期終了アプローチである。
タスクパフォーマンスを維持しながら、SEエージェントのコストを削減する。
EETは総コストを19%-55%削減し、解決率の低下は無視できる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 13:01:49 GMT)
Negative Sampling Techniques in Information Retrieval: A Survey [22.8] このサーベイサーベイでは、35のセミナー論文を合成し、高密度赤外線における負のサンプリング技術の概要を概説する。
私たちのユニークな貢献は、最新のNLPアプリケーションと、最近のLarge Language Model(LLM)駆動のメソッドを含めることです。
ランダム・静的・動的マイニング・合成データセットを含む手法を分類する分類法を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:32:24 GMT)
Over-Searching in Search-Augmented Large Language Models [22.8] 検索強化された大言語モデル(LLM)は、外部検索を統合することで知識集約的なタスクに優れる。
過剰探索は、無関係な文脈を取り入れることで、計算の非効率性と幻覚をもたらす。
以上の結果から, (i) 解答可能な問合せに対する解答精度は向上するが, 解答不可能な問合せに対する棄却を損なうこと, (ii) 過剰探索が複雑な推論モデルや深層研究システムにおいてより顕著であること, (iii) 否定的証拠の存在が棄却を改善していることが示唆された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:24:46 GMT)
DeMa: Dual-Path Delay-Aware Mamba for Efficient Multivariate Time Series Analysis [22.8] トランスフォーマーベースのモデルは、計算複雑性と高いメモリオーバーヘッドに悩まされる。
マンバは高い表現力を持つ有望な線形時間代替品として登場した。
DeMaはデュアルパス遅延対応のMambaバックボーンである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:54:56 GMT)
SceneFoundry: Generating Interactive Infinite 3D Worlds [22.6] SceneFoundryは、機能的な家具を備えたアパートスケールの3Dワールドを生成する言語誘導拡散フレームワークである。
本フレームワークは,多様なシーンタイプや環境にまたがって,構造的に妥当でセマンティック・コヒーレントで,機能的にインタラクティブな環境を生成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:33:10 GMT)
UniFinEval: Towards Unified Evaluation of Financial Multimodal Models across Text, Images and Videos [22.5] 我々は、情報密度の高い金融環境のための最初の統合マルチモーダルベンチマークUniFinEvalを提案する。
UniFinEvalは、現実世界の金融システムに根ざした5つの中核的な金融シナリオを体系的に構築する。
Gemini-3-pro-previewは、全体的なパフォーマンスは最高だが、財務の専門家と比べて大きな差がある。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:15:32 GMT)
AlgBench: To What Extent Do Large Reasoning Models Understand Algorithms? [21.8] 本稿では,アルゴリズム中心のパラダイムの下でLarge Reasoning Models(LRMs)を評価する専門家によるベンチマークであるAlgBenchを提案する。
AlgBenchは、ACMアルゴリズムの専門家によって構築された27のアルゴリズムにまたがる3000以上の元の問題で構成されている。
先進的なLRM(Gemini-3-Pro、DeepSeek-v3.2- Speciale、GPT-o3)に関する実証的な評価は、かなりの性能を示している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:04:56 GMT)
360DVO: Deep Visual Odometry for Monocular 360-Degree Camera [21.8] 深層学習に基づく全方位視覚計測フレームワークである360DVOを提案する。
提案手法では,360度画像から歪み耐性特徴を適応的に学習する歪み対応球面特徴抽出器を提案する。
現実的な設定での評価を容易にするため、我々は新しい実世界のOVOベンチマークにも貢献する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:36:31 GMT)
A Framework for Personalized Persuasiveness Prediction via Context-Aware User Profiling [21.5] メッセージの説得性を推定することは、様々なアプリケーションにおいて重要である。
説得力予測モデルの利点に説得者の過去の活動を活用するための確立された枠組みは存在しない。
2つのトレーニング可能なコンポーネントを持つコンテキスト認識型ユーザプロファイリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:22:31 GMT)
Open-Vocabulary 3D Instruction Ambiguity Detection [21.1] 安全クリティカルな領域では、言語的曖昧さは深刻な結果をもたらす可能性がある。
ほとんどの具体的AI研究は、指示が明確で、確認よりも実行に重点を置いていると仮定して、これを見落としている。
Open-Vocabulary 3D Instruction Ambiguity Detectionを最初に定義しました。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:17:11 GMT)
Annotating Dimensions of Social Perception in Text: The First Sentence-Level Dataset of Warmth and Competence [21.0] 本稿では,ウォームス・コンピテンス・センテンス(W&C-Sent)について紹介する。
データセットには1,600以上の英語の文-ターゲットペアが含まれており、信頼と社会的可能性(温かさの成分)と能力の3つの側面に沿って注釈付けされている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 21:19:46 GMT)
Walk the PLANC: Physics-Guided RL for Agile Humanoid Locomotion on Constrained Footholds [20.4] 二足歩行ロボットは、制約された足場に移動する際にバランス、タイミング、接触決定を調整する必要がある。
本稿では,低次ステッピングプランナが動的に一貫した運動目標を供給できるロコモーションフレームワークを提案する。
この構造化されたステップ計画とデータ駆動型適応の組み合わせは、ヒューマノイドロボット上で正確で、アジャイルで、ハードウェアで検証されたステップストーンの移動を生み出す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:56:42 GMT)
Revisiting Human-vs-LLM judgments using the TREC Podcast Track [20.3] 我々は,大規模言語モデル (LLM) と人間専門家のユーザ合意に関する分析を行う。
この結果は2002年のSormunenのこれまでの知見を補強し、単一のアセスメントを頼りにすることでユーザ合意の低さにつながった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:45:18 GMT)
IIB-LPO: Latent Policy Optimization via Iterative Information Bottleneck [20.1] イテレーティブ・インフォメーション・ボトルネック(IIB-LPO)は、トークンの統計的摂動から推論軌道のトポロジカル分岐へと探索を移す新しいアプローチである。
IIB-LPOは最先端のパフォーマンスを達成し、従来の手法を最大5.3%の精度と7.4%の多様性で上回っている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:46:40 GMT)
Statistical Foundations of DIME: Risk Estimation for Practical Index Selection [20.1] 最近提案されたDIMEは、埋め込みのインフォメーションコンポーネントを特定するためのクエリ依存スコアを提供する。
我々の研究は統計的に定位された基準を提供し、推論時に各クエリに対して最適な次元の集合を直接識別する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:11:05 GMT)
Double: Breaking the Acceleration Limit via Double Retrieval Speculative Parallelism [19.8] textscDouble (Double Retrieval Speculative Parallelism)を紹介する。
提案手法は,理論的な高速化限界を断ち切るために反復的検索投機を実行する。
実験では、LLaMA3.3-70Bで$textbf5.3times$、Qwen3-32Bで$textbf2.8times$の最先端のスピードアップが示されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:35:21 GMT)
LatentVLA: Efficient Vision-Language Models for Autonomous Driving via Latent Action Prediction [19.6] 大規模データセットでトレーニングされたエンドツーエンドの自律運転モデルは、一般的なシナリオではうまく機能するが、稀で長い尾の状況では苦労する。
近年のVision-Language-Action(VLA)モデルは、事前訓練されたビジョンモデルから幅広い知識を活用して、この制限に対処している。
言語アノテーションを使わずにVLAモデルをトレーニングするために,自己教師付き潜在動作予測を用いた新しいフレームワークであるLatentVLAを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:06:44 GMT)
AutoMonitor-Bench: Evaluating the Reliability of LLM-Based Misbehavior Monitor [19.4] AutoMonitor-Benchは、さまざまなタスクや障害モードにわたる誤動作モニタの信頼性を体系的に評価する最初のベンチマークである。
本研究では,2つの相補的指標(ミスレート(MR)とFalse Alarm Rate(FAR))を用いてモニタの評価を行った。
本研究では、153,581個のサンプルとQwen3-4B-インストラクションからなる大規模トレーニングコーパスを構築し、既知の比較的簡単に構築可能な誤動作データセットによるトレーニングが、目に見えない、より暗黙的な誤動作に対する監視性能を向上させるかどうかを調査する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:09:45 GMT)
ViTNT-FIQA: Training-Free Face Image Quality Assessment with Vision Transformers [19.1] ViTNT-FIQAは、中間的なVision Transformerブロック間のパッチ埋め込み進化の安定性を測定する、トレーニング不要のアプローチである。
本稿では,L2正規化パッチ埋め込み間のユークリッド距離を逐次変圧器ブロックから計算し,それらを画像レベルの品質スコアに集約する。
ViTNT-FIQAは,任意のトレーニング済みのViTベースの顔認識モデルに対して,計算効率と即時適用性を保ちながら,最先端手法との競合性能を実現する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:46:25 GMT)
Auditing Fairness under Model Updates: Fundamental Complexity and Property-Preserving Updates [18.2] 任意の更新の下でグループフェアネス監査について検討する。
本稿では,実証的財産最適化(EPO)に基づくPAC監査のための汎用フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:28:11 GMT)
From Off-Policy to On-Policy: Enhancing GUI Agents via Bi-level Expert-to-Policy Assimilation [18.2] 視覚言語モデルはコンピュータ使用エージェントとしてますます多くデプロイされている。
エンドツーエンドのスクリーンショット・ツー・アクションポリシーはデプロイが容易だが、OSWorld-Verifiedのようなベンチマークでは遅れている。
BEPA(Bi-Level Expert-to-Policy Assimilation)を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 13:26:38 GMT)
Distilling Lightweight Domain Experts from Large ML Models by Identifying Relevant Subspaces [17.6] 「SubDistill」は、各層における教師モデルの関連成分のみを蒸留する数値特性を改良した新しい蒸留アルゴリズムである。
ベンチマーク評価は, 蒸留した学生モデルが元の教師モデルの判断構造とより密に一致していることを示す説明可能なAI分析によって補完される。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:28:55 GMT)
ACDZero: MCTS Agent for Mastering Automated Cyber Defense [17.5] 我々はモンテカルロ木探索(MCTS)に基づく計画中心の防衛政策を提案する。
我々は,ネットワークからの観測を属性グラフとして埋め込むために,グラフニューラルネットワーク(GNN)を新たに利用している。
本研究では,多様なネットワーク構造と敵行動を含むCC4シナリオにおけるエージェントの評価を行った。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:28:29 GMT)
LEAPS: An LLM-Empowered Adaptive Plugin for Taobao AI Search [17.1] 我々は,従来の検索システムを"Broaden-and-Empower"パラダイムでシームレスにアップグレードするLEAPS(LLM-Empowered Adaptive for Taobao AI Search)を提案する。
新たな3段階のトレーニング戦略 – 逆データ拡張,後知識による微調整,多様性を考慮した強化学習 – を採用して,適応的および補完的なクエリの組み合わせを生成する。
2025年8月以降、Taobao AI Searchに完全にデプロイされている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:41:27 GMT)
AIConfigurator: Lightning-Fast Configuration Optimization for Multi-Framework LLM Serving [16.7] AIConfiguratorは、Large Language Model(LLM)推論のための統一されたパフォーマンスモデリングシステムである。
GPUベースのプロファイリングを必要とせずに、迅速なフレームワークベースの構成検索を可能にする。
これは、高密度モデルのパフォーマンスを最大40%向上させる優れたサービス構成を特定する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:03:57 GMT)
HogVul: Black-box Adversarial Code Generation Framework Against LM-based Vulnerability Detectors [16.6] HogVulは、語彙と構文の摂動を統合したブラックボックスの逆コード生成フレームワークである。
4つのベンチマークデータセットの実験では、HogVulが平均攻撃成功率26.05%の改善を達成した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:14:29 GMT)
ACR: Adaptive Context Refactoring via Context Refactoring Operators for Multi-Turn Dialogue [16.3] 大規模言語モデル(LLM)はマルチターン対話において顕著な性能を示した。
既存のアプローチは主にコンテキストウィンドウの拡張、外部メモリの導入、コンテキスト圧縮の適用に焦点を当てている。
textbfAdaptive textbfContext textbfRefactoring textbf(ACR) Frameworkを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:17:28 GMT)
Continual Pretraining on Encrypted Synthetic Data for Privacy-Preserving LLMs [16.2] 個人識別可能な情報を保護するために、暗号化されたトレーニングデータを合成するエンティティベースのフレームワーク(PII)を提案する。
提案手法は,データ合成をガイドする重み付きエンティティグラフを構築し,PIIエンティティに決定論的暗号化を適用する。
限られたスケールのデータセットに対する我々の結果は、事前訓練されたモデルがベースモデルより優れており、PIIセキュリティが保証されていることを示している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:44:07 GMT)
LIDL: LLM Integration Defect Localization via Knowledge Graph-Enhanced Multi-Agent Analysis [16.2] 大規模言語モデル統合ソフトウェアにおける欠陥ローカライゼーションのためのマルチエージェントフレームワークLIDLを提案する。
LIDLを105のGitHubリポジトリと16のエージェントベースシステムから収集した146の現実世界の欠陥インスタンスで評価した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:47:59 GMT)
Advanced Multimodal Learning for Seizure Detection and Prediction: Concept, Challenges, and Future Directions [16.2] 本調査は,てんかん発作検出・予測(AMLSDP)のための先進的マルチモーダル学習の概念を強調した。
調査では, てんかん性発作検出(ESD)と予測(ESP)技術の進化を, 時代によって明らかにした。
この研究は、てんかんモニタリングのためのウェアラブルおよびイメージングベースのソリューションに向けて、神経テクノロジーを進歩させるだろうと考えています。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:52:11 GMT)
Multimodal In-context Learning for ASR of Low-resource Languages [16.1] 大規模言語モデル(LLM)を用いたインコンテキスト学習(ICL)はこの問題に対処する。
本稿では,マルチモーダル ICL (MICL) を用いて,LLM が未知言語を学習できるかどうかを検討する。
言語間移動学習は、訓練なしでターゲット言語でのMICL効率を向上させる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:52:23 GMT)
GaussianSwap: Animatable Video Face Swapping with 3D Gaussian Splatting [15.5] 対象映像から3次元ガウススプラッティングに基づく顔アバターを構築するための映像顔交換フレームワークを提案する。
結果として得られるスワップされた顔は、アニメーションやインタラクティブな操作の能力のない、構造化されていないピクセルのセットとして存在するだけである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:39:29 GMT)
Goal Force: Teaching Video Models To Accomplish Physics-Conditioned Goals [15.3] Goal Forceを使えば、明示的な力ベクトルと中間ダイナミクスを使って目標を定義することができる。
我々は、合成因果プリミティブのキュレートされたデータセットに基づいて、ビデオ生成モデルを訓練する。
以上の結果から,映像生成を基礎的な物理相互作用で基礎づけることで,暗黙的な神経物理シミュレータとしてモデルが現れる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:23:36 GMT)
$\texttt{AMEND++}$: Benchmarking Eligibility Criteria Amendments in Clinical Trials [15.3] 臨床試験の修正は、しばしば遅延、コストの増大、管理上の負担をもたらす。
我々は,初期試験プロトコルの適格基準が今後修正されるかどうかを予測することを目的とした,新しいNLPタスクであるテキスト適格基準修正予測を導入する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:32:04 GMT)
SketchVL: Policy Optimization via Fine-Grained Credit Assignment for Chart Understanding and More [15.1] 我々はFinePOを最適化した新しいMLLMであるSketchVLを紹介した。
トレーニング中、FinePOアルゴリズムは細粒度プロセスリワードモデル(FinePRM)を利用して、各描画動作を軌道内でスコアし、各ステップのクレジットを正確に割り当てる。
実験の結果、SketchVLはFinPRMとステップレベルの動作を一致させることを学び、ベースモデルよりも平均7.23%の性能向上を達成した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:13:01 GMT)
Formal Methods in Robot Policy Learning and Verification: A Survey on Current Techniques and Future Directions [15.0] ロボット工学の分野では、ディープラーニングの採用によって、複雑さが増大する傾向が生まれている。
ディープニューラルネットワークは、従来の形式解析に課題を提起しており、柔軟性があり、脆弱で解釈が難しいモデルにつながっている。
本稿では,最近のロボット学習研究における形式的手法の活用方法について概説する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:49:58 GMT)
Amory: Building Coherent Narrative-Driven Agent Memory through Agentic Reasoning [14.4] Amoryは、オフライン時に構造化されたメモリ表現を積極的に構築するワーキングメモリフレームワークである。
アモリーは会話の断片を叙事詩の物語に整理し、記憶を運動量と統合し、周辺事実を意味記憶に意味づける。
Amoryは従来の最先端よりも大幅に改善され、パフォーマンスは完全なコンテキスト推論に匹敵し、レスポンスタイムを50%削減した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:51:11 GMT)
Tracing Stereotypes in Pre-trained Transformers: From Biased Neurons to Fairer Models [14.3] バイアスド・ナレッジは小ニューロンのサブセットに局在しており、その抑制は性能損失を最小限に抑えてバイアスを大幅に減少させることを示す。
これは、トランスフォーマーのバイアスがニューロンレベルで追跡され緩和されることを示し、ソフトウェア工学における公平性に対する解釈可能なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:33:51 GMT)
Causality-Aware Temporal Projection for Video Understanding in Video-LLMs [14.3] V-COREは、ビデオ理解のための時間的制約を明示的に導入する、パラメータ効率のよいフレームワークである。
4ビットQLoRAと凍結LDMバックボーンにより、V-COREは単一のコンシューマGPU上で効率的にトレーニングできる。
実験の結果、V-COREは挑戦的なNExT-QAベンチマークで強い性能を示し、61.2%の精度に達した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:41:24 GMT)
Package-Aware Approach for Repository-Level Code Completion in Pharo [14.0] グローバル変数を等しく扱う新しい補完エンジンを提案する。
提案手法では,要求するクラスのパッケージから,変数名を構造化された方法で検索する。
予備的な結果は、平均相互ランク(MRR)が改善し、パッケージの完了がより正確で関連する提案をもたらすことを確認していることを示している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:19:55 GMT)
Language as Prior, Vision as Calibration: Metric Scale Recovery for Monocular Depth Estimation [13.8] 相対深度基礎モデルは良好に伝達されるが、同定不可能なグローバルスケールとドメインシフト感度の上昇により、単分子メートル法深度は未定のままである。
凍結したバックボーンキャリブレーション設定の下では,画像固有のアフィン変換を逆の深さで行い,相対深度バックボーンとCLIPテキストエンコーダを固定しつつ,軽量なキャリブレーションヘッドのみを訓練する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:54:20 GMT)
OPT-Engine: Benchmarking the Limits of LLMs in Optimization Modeling via Complexity Scaling [13.6] 大規模言語モデル(LLM)は、最適化モデリングの驚くべき進歩を示している。
自動定式化と問題解決におけるそれらの能力の境界は、まだよく理解されていない。
OPT-ENGINEは、制御可能でスケーラブルな難易度を持つ最適化モデルにおいて、LCMを評価するために設計されたベンチマークフレームワークである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:22:33 GMT)
Enabling Stroke-Level Structural Analysis of Hieroglyphic Scripts without Language-Specific Priors [13.6] ヒエログリフ・ストローク・アナライザー(HieroSA)は、ヒエログリフと古代ヒエログリフの文字イメージを明示的で解釈可能な線分表現に変換するフレームワークである。
HieroSAは文字内構造や意味を効果的に捉え、言語固有の先行詞の必要性を回避している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:30:12 GMT)
A Rising Tide Lifts All Boats: MTQE Rewards for Idioms Improve General Translation Quality [13.5] 非合成式(例:イディオム、証明、メタファー)は、ニューラルマシン翻訳システムに重大な課題をもたらす。
本稿では,機械翻訳品質推定(MTQE)モデルを用いたGRPO方式の微調整について検討する。
中国語とヒンディー語のデータセットを用いて、慣用的翻訳能力は14ポイント向上し、一般の非慣用的翻訳能力は8ポイント向上し、言語間翻訳能力(ある言語で訓練され、他の言語で評価される)は6ポイント向上した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:55:09 GMT)
Learn to Evolve: Self-supervised Neural JKO Operator for Wasserstein Gradient Flow [13.4] Jordan-Kinderlehrer-Otto (JKO) スキームは、ワッサーシュタイン勾配流を計算するための安定な変分フレームワークを提供する。
本稿では,JKOトラジェクトリの数値解を必要とすることなく,JKO解演算子を学習するための自己教師型アプローチを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:12:21 GMT)
HAPS: Hierarchical LLM Routing with Joint Architecture and Parameter Search [13.2] 大規模言語モデル(LLM)ルーティングは、多様なタスクに対して異なるLLMの特殊強度を活用することを目的としている。
本稿では,モデルアーキテクチャとパラメータを協調的に検索する階層型LLMルーティングフレームワークHAPSを紹介する。
2つのよく使われるベンチマークの実験では、HAPSは強いルーティングベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:22:25 GMT)
Generation-Based and Emotion-Reflected Memory Update: Creating the KEEM Dataset for Better Long-Term Conversation [12.9] 本稿では,長期会話システムにおけるメモリ更新向上を目的とした,新しい世代ベースデータセットを提案する。
情緒的データと本質的なデータの両方でシステムのメモリをシームレスに更新することにより、我々のアプローチは深い共感を促進し、オープンドメインの会話において意味のある応答能力を高める。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:59:36 GMT)
Can Large Language Models Differentiate Harmful from Argumentative Essays? Steps Toward Ethical Essay Scoring [12.9] 本研究は,AESシステムとLLM(Large Language Models)における重要なギャップに対処する。
AES技術の進歩にもかかわらず、現在のモデルはエッセイの中で倫理的にも道徳的にも問題のある要素を見落としていることが多い。
この研究は、彼らがスコア付けしているコンテンツの倫理的意味に敏感な、より堅牢なAESシステムの開発の必要性を強調している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:54:40 GMT)
Adapting Vision Transformers to Ultra-High Resolution Semantic Segmentation with Relay Tokens [12.8] 超高解像度画像をセグメント化するための現在のアプローチは、ウィンドウをスライドするか、ダウンサンプルし、詳細をなくしている。
視覚変換器に明示的なマルチスケール推論を導入し,局所的な詳細とグローバルな認識を同時に保存する,シンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:41:08 GMT)
Towards Valid Student Simulation with Large Language Models [12.7] 学生シミュレーションを明示的疫状態仕様(ESS)によって規定される制約付き生成問題として再編成する。
さらに、行動目標とデプロイメントコンテキストに応じてシミュレーションされた学生システムをシミュレートする、ゴールバイ環境フレームワークも導入されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:09:52 GMT)
Do Sparse Autoencoders Identify Reasoning Features in Language Models? [12.7] 大規模言語モデル(LLM)において,スパースオートエンコーダ(SAE)が真の推論特徴を識別するかどうかを検討する。
少数の機能関連トークンを非推論テキストに注入すると、59%から94%の機能が強いアクティベーションを引き出すのに十分である。
単純なトークントリガによって説明されない残りの特徴に対して、LCM誘導のファルシフィケーションは、その特徴を活性化する非推論入力と、そうでない推論入力を一貫して生成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:54:36 GMT)
Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment for Dexterous Force-Based Grasping and Manipulation [12.5] 複数の指を持つ人間のような器用な手は、人間レベルの操作機能を提供する。
しかし、実際のハードウェアに直接デプロイ可能なトレーニングコントロールポリシは、コンタクトリッチな物理のため、依然として難しいままです。
本稿では,高密度触覚フィードバックと関節トルクセンシングを併用して身体的相互作用を調節する実践的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 13:09:26 GMT)
Safety Not Found (404): Hidden Risks of LLM-Based Robotics Decision Making [12.4] 安全クリティカルな環境でのAIシステムによる1つの間違いは、命がかかる可能性がある。
大きな言語モデル(LLM)がロボットの意思決定に不可欠なものになると、リスクの物理的次元が大きくなる。
本稿では,軽微な誤りであっても破滅的なシナリオにおいて,LCMの性能を体系的に評価する緊急的必要性について論じる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:04:15 GMT)
TAPM-Net: Trajectory-Aware Perturbation Modeling for Infrared Small Target Detection [12.3] 赤外線小目標検出(ISTD)は、信号のコントラストの弱さ、空間範囲の制限、背景の乱れなど、長年にわたる課題である。
現在のモデルでは、小さなターゲットが機能空間における方向的、階層的摂動をいかに引き起こすかを追跡するメカニズムが欠如している。
本稿では,対象特徴障害の空間的拡散挙動を明示的にモデル化するTrajectory-Aware Mamba Propagation Network (TAPM-Net)を提案する。
NUAA-SIRSTとIRSTD-1Kの実験は、TAPM-NetがISTDの最先端性能を達成することを示した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:27:18 GMT)
CARD: Cluster-level Adaptation with Reward-guided Decoding for Personalized Text Generation [12.3] CARDは、進歩的な洗練を通じて効果的なパーソナライズを実現する階層的な枠組みである。
本稿では,ユーザによるテキストとクラスタレベルの世代を対比する暗黙の選好学習機構を提案する。
推論時に、CARDは、軽量なユーザ嗜好ベクトルとローランクロジット補正を通じて、デコーディング専用のパーソナライズを注入する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:16:39 GMT)
Continual Learning of Achieving Forgetting-free and Positive Knowledge Transfer [12.2] 理想的な連続学習エージェントは、破滅的な忘れ(CF)を克服できるだけでなく、前向きと後向きの知識伝達(KT)を促進する必要がある。
本稿ではまず,各逐次学習課題がFKTとBKTの両方が正であることの制約の下で,その最適性能を達成するための最適化問題としてCLをモデル化する。
次に, 誤りのない, 肯定的なKTを実現するETCL法を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:27:14 GMT)
What Matters When Building Universal Multilingual Named Entity Recognition Models? [12.1] Otterは100以上の言語をサポートする汎用多言語NERモデルである。
Otterは強力な多言語NERベースラインよりも一貫した改善を実現し、GLiNER-xベースを5.3ppのF1で上回っている。
モデルチェックポイント、トレーニング、評価コードをリリースし、今後の研究を円滑に進めます。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:02:37 GMT)
FeatureSLAM: Feature-enriched 3D gaussian splatting SLAM in real time [11.9] 3Dガウススプラッティング(3DGS)を用いた効率的なカメラ追跡と特徴強調マッピングを統合したリアルタイム追跡SLAMシステムを提案する。
我々の主な貢献は、視覚的基礎モデルと整合した新しいビュー合成に、密集した特徴のセマンティック化とセマンティック化を統合することである。
直近の固定セットSLAMベースラインに比べて9%低いポーズ誤差と8%高いマッピング精度を得た。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:40:16 GMT)
MemBuilder: Reinforcing LLMs for Long-Term Memory Construction via Attributed Dense Rewards [11.8] 我々は,多次元メモリ構築のオーケストレーションをモデルに委ねる強化学習フレームワークであるMemBuilderを紹介した。
MemBuilderは,(1)スパーストラジェクトリ・レベル・リワード,(2)多次元メモリ属性の2つの課題に対処する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:44:37 GMT)
AWaRe-SAC: Proactive Slice Admission Control under Weather-Induced Capacity Uncertainty [11.6] 降雨変動を考慮したmWave x-haul ネットワークのためのアクティブスライス入射制御フレームワークを開発した。
提案フレームワークは,将来的なネットワーク条件の深層学習予測と,Q-ラーニングに基づくスライス入力制御機構を統合する。
本ソリューションは,動的リンク条件下での長期平均収益を2~3倍に向上させる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:53:09 GMT)
Table-BiEval: A Self-Supervised, Dual-Track Framework for Decoupling Structure and Content in LLM Evaluation [11.5] Table-BiEvalは、人間の自由で自己管理的な評価フレームワークに基づく、新しいアプローチである。
コンテンツセマンティック精度と正規化ツリー編集距離を計算し、構造をコンテンツから切り離す。
結果は大きな変動を示し、中規模のモデルが驚くほど大きなモデルよりも構造効率が優れていることを浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:38:27 GMT)
Squeezing-Enhanced Two-Phase Estimation with N-Particle W-type States [11.2] 光パラメトリック増幅(OPA)による3モード干渉計における2つの光位相の同時推定について検討する。
均一に適用されたOPAは、未増幅干渉計以上の達成可能な精度を著しく向上することを示す。
損失は達成可能な精度を低下させるが、OPA支援スキームは適度な損失に対して明確な優位性を保ち、消散に対する堅牢性を示している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:30:39 GMT)
ART: Adaptive Reasoning Trees for Explainable Claim Verification [11.0] ART(Adaptive Reasoning Trees)は、クレーム検証のための階層的手法である。
議論の強さは、子供のペアトーナメントを通じてボトムアップを決定する。
ARTの構造的推論は,強いベースラインよりも優れていた。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:01:55 GMT)
DeePM: Regime-Robust Deep Learning for Systematic Macro Portfolio Management [11.0] DeePMは構造化されたディープラーニングマクロポートフォリオマネージャで、堅牢でリスク調整されたユーティリティを最大化するためにエンドツーエンドでトレーニングされた。
これは、Directed Delayメカニズムを通じて非同期フィルタリングの"タグ付き"問題を解決する。
マクロ経済グラフプリエント(Macroconomic Graph Prior)を介して低信号対雑音比と戦う。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:47:32 GMT)
OVT-MLCS: An Online Visual Tool for MLCS Mining from Long or Big Sequences [10.9] 本稿では,大規模シーケンスをマイニングするためのキーポイントベースのtextitMLCSアルゴリズムを提案する。
OVT-MLCSと呼ばれる新しいオンラインビジュアルテキストMLCSマイニングツールも提示する。
OVT-MLCSは、長いシーケンスや大きなシーケンスからグラフやテキストの形式で、テキストMLCSの効果的なオンラインマイニング、保存、ダウンロードを可能にする。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:14:29 GMT)
GenCtrl -- A Formal Controllability Toolkit for Generative Models [10.8] 対話環境における制御可能なモデルの集合を推定する新しいアルゴリズムを提案する。
モデル制御性は驚くほど脆弱であり,実験環境に強く依存していることが示される。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:50:02 GMT)
Router-Suggest: Dynamic Routing for Multimodal Auto-Completion in Visually-Grounded Dialogs [10.7] リアルタイムマルチモーダルオートコンプリートは、デジタルアシスタント、チャットボット、デザインツール、医療相談に不可欠である。
このタスクは、部分的に入力されたテキストと視覚的手がかりを用いて、ライブチャットにおける今後の文字を予測する。
我々は,視覚言語モデル(VLM)を強いテキストベースラインに対して評価し,精度と効率のトレードオフを強調した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:29:50 GMT)
Adaptive Conditional Contrast-Agnostic Deformable Image Registration with Uncertainty Estimation [10.7] ランダムな畳み込みに基づくコントラスト拡張方式に基づく適応型条件付きコントラスト非依存型画像登録フレームワーク(AC-CAR)を提案する。
AC-CARは、訓練中に観察することなく任意の画像コントラストに一般化することができる。
我々は,分散ネットワークを統合することで,コントラストに依存しない登録の不確実性を実現する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:00:49 GMT)
DexterCap: An Affordable and Automated System for Capturing Dexterous Hand-Object Manipulation [10.6] 本稿では,手動操作のための低コスト光キャプチャシステムであるDexterCapについて紹介する。
DexterCapは、密集した文字コード化されたマーカーパッチを使用して、厳しい自己閉塞下で堅牢なトラッキングを実現する。
我々はデータセットとコードを公開し、デクスタラスハンドオブジェクトインタラクションに関する将来の研究を支援する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:16:31 GMT)
GS-DMSR: Dynamic Sensitive Multi-scale Manifold Enhancement for Accelerated High-Quality 3D Gaussian Splatting [10.4] 実験により, 合成データセット上で96FPSのフレームレートを達成できた。
本研究は, 複合変形シーンのモデリング効率を高めるため, マルチスケール多様体拡張モジュールを統合する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:12:23 GMT)
Circuit Mechanisms for Spatial Relation Generation in Diffusion Transformers [10.1] Diffusion Transformer (DiTs) はテキストから画像への変換が大幅に進歩しているが、モデルはまだテキストプロンプトで指定されたオブジェクト間の正確な空間関係を生成するのに苦戦している。
テキストエンコーダの異なるサイズのDiTをスクラッチからトレーニングし、テキストプロンプトに属性と空間関係が指定された2つのオブジェクトを含む画像を生成する。
全てのモデルがこのタスクをほぼ完璧に学習できるが、基礎となるメカニズムはテキストエンコーダの選択によって大きく異なる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:17:46 GMT)
Can AI mediation improve democratic deliberation? [10.1] 我々は、人工知能が幅広い参加、意味ある熟考、政治的平等の「トリレンマ」をナビゲートするのに役立つかどうかを尋ねる。
多様な視点を持つ人々が共通基盤を見つけるのを支援するために設計された,大規模言語モデル(LLM)ベースのシステムについて検討する。
究極的には、AIによる熟考の約束を完全に実現するためには、経験的、技術的、理論的に幅広い進歩が必要である。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:22:26 GMT)
FlexProofs: A Vector Commitment with Flexible Linear Time for Computing All Proofs [9.8] バッチオープニングを伴うマルチエクスポネントのための新しいベクトルコミットメントスキームであるFlexProofsを紹介する。
我々は、$N=216$と$b=log2N$の場合、FlexProofsはHydraProofsよりも6倍高速であることを示す。
我々の実験によると、$N=216$と$b=log2N$の場合、FlexProofsはHydraProofsより6倍速い。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:11:12 GMT)
Synthetic FMCW Radar Range Azimuth Maps Augmentation with Generative Diffusion Model [9.8] 本稿では,現実的な周波数変調連続波レーダレンジアジマスマップを合成するための条件付き生成フレームワークを提案する。
提案手法は,歩行者,車,サイクリストを含む複数の対象カテゴリーのレーダデータを生成するために,生成拡散モデルを利用する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:59:46 GMT)
Learning specifications for reactive synthesis with safety constraints [9.8] 我々は、潜在タスクを確率的形式言語としてモデル化し、適切な反応合成フレームワークを導入する。
既存のエビデンス駆動のステートアルゴリズムをマージし、学習プロセス全体を通して安全性要件を取り入れます。
本手法は,ロボットと環境の相互作用を動的変化を考慮した2人プレイヤゲームとしてモデル化する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:17:45 GMT)
Cumulative Path-Level Semantic Reasoning for Inductive Knowledge Graph Completion [9.6] 本稿では,帰納的知識グラフ補完(CPSR)フレームワークのための累積パスレベルセマンティック推論を提案する。
CPSRは、KGの構造情報と意味情報の両方を同時にキャプチャして、誘導的KGCタスクを強化する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:34:05 GMT)
SAFE: Secure and Accurate Federated Learning for Privacy-Preserving Brain-Computer Interfaces [9.4] 本稿では,モデルトレーニング中にデータをローカルに保つことにより,ユーザのプライバシを保護するためのフェデレート学習ベースのアプローチであるSAFEを提案する。
SAFEは、プライバシ保護を確保しながら、デコード精度と敵の堅牢性の両方において、14の最先端アプローチを一貫して上回りました。
我々の知る限り、SAFEは、ターゲットの被検体の校正データを用いることなく、高い復号精度、強い敵対的堅牢性、信頼性の高いプライバシ保護を同時に達成する最初のアルゴリズムである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 13:29:41 GMT)
Detecting Autism Spectrum Disorder with Deep Eye Movement Features [9.2] 自閉症スペクトラム障害(Autism Spectrum disorder、ASD)は、社会的コミュニケーションの障害と行動パターンを特徴とする神経発達障害である。
眼球運動データは、ASD検出のための非侵襲的診断ツールを提供する。
微妙で複雑な眼球運動パターンを効果的に捉えるために、離散的短期連続モデリングフレームワーク(DSTS)が設計されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:35:24 GMT)
CHDP: Cooperative Hybrid Diffusion Policies for Reinforcement Learning in Parameterized Action Space [9.2] ハイブリッド行動空間問題を解決するために,textbfCooperative Hybrid Diffusion Policies (CHDP) フレームワークを提案する。
CHDPは、それぞれ離散的および連続的な拡散ポリシーを利用する2つの協調エージェントを採用している。
挑戦的なハイブリッドアクションベンチマークでは、CHDPは最先端の手法を最大19.3%の成功率で上回っている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:50:47 GMT)
A three-dimensional multimode lumped-element resonator for collective spin manipulation and dispersive readout [9.2] 本報告では, スピンアンサンブルの均一な集団操作と分散再生を可能にする3次元積層素子型マイクロ波共振器について報告する。
コンパクトな設計、チューナブルカップリング、高磁場均一性により、この共振器はハイブリッドスピン光子系と多モード固体量子技術のための汎用デバイスとなる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:23:19 GMT)
Monkey Jump : MoE-Style PEFT for Efficient Multi-Task Learning [8.9] Monkey Jumpは、パラメータ効率の良い微調整にMix-of-expertsスタイルの特殊化をもたらす方法である。
アーキテクチャに依存しず、任意のアダプタベースのパラメータ効率の微調整手法に適用できる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:42:08 GMT)
Large language models can effectively convince people to believe conspiracies [8.4] 大規模言語モデル(LLM)は様々な文脈で説得可能であることが示されている。
これらのモデルが反証するのと同じくらい簡単に不信を助長できるかどうかを考察する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:36:53 GMT)
Random is Faster than Systematic in Multi-Objective Local Search [8.1] 多目的局所探索アルゴリズムでは、これまでに見いだされた全ての非支配的なソリューションのアーカイブを維持するのが一般的である。
この過程における中心的な問題は、選択された解の近傍を探索する方法である。
ランダムサンプリング法は,多目的問題の範囲にわたる系統探索法よりも一貫して高速であることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 21:27:30 GMT)
MineNPC-Task: Task Suite for Memory-Aware Minecraft Agents [7.9] 我々は,MineNPC-Taskを紹介した。これは,オープンワールドMinecraftにおけるメモリ認識,混合開始LDMエージェントのテストのための,ユーザ認可ベンチマークと評価ハーネスである。
合成プロンプトに頼るのではなく、タスクはプロのプレイヤーと形式的で要約的なコプレイによって引き起こされ、その後パラメトリックテンプレートに正規化される。
ハーネスはプラン、アクション、メモリイベントをキャプチャし、プランプレビュー、対象の明確化、メモリ読み込みと書き込み、プレコンディションチェック、修復の試みを含む。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:14:24 GMT)
SourceNet: Interpretable Sim-to-Real Inference on Variable-Geometry Sensor Arrays for Earthquake Source Inversion [7.9] SourceNetはTransformerベースのフレームワークで、任意のジオメトリをモデル化するためのフレキシブルなセットとしてセンサアレイを扱う。
10万の合成イベントを事前トレーニングし、2,000の現実世界イベントを微調整することで、SourceNetは保持された実データに対する最先端の精度を達成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 21:42:28 GMT)
Explainable AI: Learning from the Learners [7.9] 我々は、説明可能な人工知能(XAI)が学習者の学習を可能にすることを主張する。
基礎モデルと説明可能性の組合せが因果メカニズムの抽出にどのように役立つかを示す。
我々は,科学技術における人間とAIの連携のための統一的な枠組みとして,XAIを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:43:21 GMT)
Open World Knowledge Aided Single-Cell Foundation Model with Robust Cross-Modal Cell-Language Pre-training [7.8] オープンワールド言語知識支援ロバスト単一セル基盤モデル(OKR-CELL)を提案する。
クロスモーダルなCell-Language事前トレーニングフレームワークをベースに構築されている。
OKR-CELLは、6つの評価タスクにわたる最先端の結果を得る。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:10:14 GMT)
Do LLMs Need Inherent Reasoning Before Reinforcement Learning? A Study in Korean Self-Correction [7.8] 強化学習が韓国の推論能力を英語に匹敵する程度に向上させるかどうかを検討する。
韓国固有の推論能力に欠けるモデルに適用した場合,RLだけでは限定的な改善が得られた。
モデルの内部推論過程と韓国入力との整合性を示す。特に,韓国固有のニューロンを初期層に調整することで,RLの有効性を解き放つことが重要である。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:17:31 GMT)
MMViR: A Multi-Modal and Multi-Granularity Representation for Long-range Video Understanding [7.7] 数分から数時間の長いビデオは、現在のマルチモーダルな大規模言語モデルにとって大きな課題となる。
長大なビデオ理解のためのマルチモーダルな多粒構造表現MMViRを提案する。
MMViRは、時間のビデオ理解において19.67%の改善を実現し、処理遅延を45.4%に削減した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:59:05 GMT)
Empirical Characterization of Logging Smells in Machine Learning Code [7.5] 本研究の目的は,機械学習システムにおけるログの臭いを経験的に識別し,特徴付けることである。
我々は、GitHubにホストされているオープンソースのMLリポジトリを大規模にマイニングして、繰り返し発生するログの臭いをカタログ化することを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:48:42 GMT)
MMUEChange: A Generalized LLM Agent Framework for Intelligent Multi-Modal Urban Environment Change Analysis [7.4] MMUEChangeは異種都市データを柔軟に統合するマルチモーダルエージェントフレームワークである。
ケーススタディには、ニューヨークの小さなコミュニティ中心の公園へのシフトや、香港の地区に集中した水質汚染の広がりが含まれる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:34:35 GMT)
Autonomous Discovery of the Ising Model's Critical Parameters with Reinforcement Learning [7.3] 本研究は,エージェントが物理的環境と自律的に対話することを可能にする,物理に着想を得た適応型強化学習フレームワークを提案する。
本アルゴリズムは, 位相遷移を連想させる探索挙動を示し, 初期条件によらず効率的に目標パラメータに収束する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:55:02 GMT)
FairSCOSCA: Fairness At Arterial Signals -- Just Around The Corner [7.2] 交差点、特に動脈網における交通信号制御は、都市における交通渋滞の増大を緩和する鍵となるレバーである。
SCOOTSとSCATSの広範な展開にもかかわらず、フェアネスは設計ロジックからほとんど欠落している。
本研究は、これらのシステムに対する公正性を高める拡張であるFairSCOSCAを提案し、2つの新しい実用的設計適応を特徴としている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:41:02 GMT)
C-EQ-ALINEA: Distributed, Coordinated, and Equitable Ramp Metering Strategy for Sustainable Freeway Operations [7.2] C-EQ-ALINEA(C-EQ-ALINEA)は、古典的なALINEAフィードバックコントローラの拡張である。
SUMOを用いたアムステルダムのA10環道路の24時間マイクロシミュレーションで評価した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 21:01:10 GMT)
Controlling Rydberg atom-polariton interactions: from exceptional points to fast readout [7.1] ライドバーグ原子は、原子雲で伝播する光子と結合すると、単一光子レベルでの光非線形性を促進する。
我々は、原子アンサンブル中のRydberg偏光子と隣り合う1つのRydberg原子との相互作用を実験的に探索した。
非線形フォトニックネットワークにおける応用の実証実験について述べる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:55:38 GMT)
Can We Trust LLM Detectors? [7.0] トレーニング不要で教師なしのAIテキスト検出器は、分散シフト、見えないジェネレータ、シンプルなスタイリスティックな摂動の下で不安定である。
識別スタイルの埋め込みを学習する教師付きコントラスト学習フレームワークを提案する。
実験では、教師付き検出器はドメイン内を励起するが、ドメイン外を著しく劣化させ、訓練なしの手法はプロキシの選択に非常に敏感であることが示されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:53:06 GMT)
Rethinking Basis Path Testing: Mixed Integer Programming Approach for Test Path Set Generation [7.0] 本稿では,手続き探索タスクから宣言的最適化問題への基底経路生成を再構成する。
構造的単純性においてグローバルに最適な完全基底パスセットを生成するために設計された混合プログラミング(MIP)フレームワークを導入する。
我々のフレームワークには,理論上最適なパスセットを保証するホロスティックMIPモデルと,大規模かつ複雑なトポロジに対するスケーラブルなインクリメンタルMIP戦略の2つの補完戦略が含まれている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:36:29 GMT)
CHisAgent: A Multi-Agent Framework for Event Taxonomy Construction in Ancient Chinese Cultural Systems [6.8] 古代中国における歴史的分類学構築のためのマルチエージェントフレームワークである textbfCHisAgent を提案する。
ボトムアップのtextitInducerは生の歴史的コーパスから初期階層を派生し、トップダウンのtextitExpanderはLLMの世界知識を使って中間概念を欠いている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:28:45 GMT)
CyberGFM: Graph Foundation Models for Lateral Movement Detection in Enterprise Networks [6.8] ランダムウォークにおけるトークンの欠落をコンピュータネットワークで予測するために,グラフ基礎モデルをトレーニングする方法を示す。
グラフ基盤モデルはリンク予測のために微調整され、ネットワーク異常検出器として使用される。
この新しいアプローチにより、ランダムウォークベースの手法の効率性と、深層学習手法の豊かな意味表現を組み合わせることができる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:08:47 GMT)
On the Robustness of Age for Learning-Based Wireless Scheduling in Unknown Environments [6.7] 仮想キュー長の代わりにライン年齢を用いた学習に基づくスケジューリングポリシーを提案する。
本ポリシーは,ネットワーク条件下での最先端性能に適合することを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:15:17 GMT)
One Script Instead of Hundreds? On Pretraining Romanized Encoder Language Models [6.6] 複数言語モデル(mLM)における言語間移動(XLT)改善のための効果的な戦略として,ロマン化が出現した。
i) スクリプト固有情報の欠落, (ii) 語彙重複の増大による負の言語間干渉の2つの潜在的な劣化源について検討した。
異なる忠実度プロファイルを持つ2つのロマナイザを用いて、セグメントスクリプトを持つ言語に対して、無視可能な性能損失を観測する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 13:00:46 GMT)
Distilling Feedback into Memory-as-a-Tool [6.6] 本稿では,過渡的批判を検索可能なガイドラインに変換することによって,推論時間推論のコストを償却するフレームワークを提案する。
本稿では,この手法を,ルーリック学習のための新しいデータセットであるFeedback Bench上で評価する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:26:52 GMT)
GlueNN: gluing patchwise analytic solutions with neural networks [6.3] 一般的な戦略は、領域を複数の領域に分割し、各領域での方程式を単純化することである。
このパッチ法は、近似形式が境界付近で崩壊する可能性があるため、正しい解を再現できない。
本稿では,解析解の統合定数をスケール依存関数に昇格させる学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:07:43 GMT)
Multifaceted Scenario-Aware Hypergraph Learning for Next POI Recommendation [6.2] Next Point-of-Interest (POI)レコメンデーションは、履歴チェックインの軌跡からユーザの好みを推測する上で重要な役割を果たす。
既存のシーケンシャルおよびグラフベースの手法は、異なる文脈シナリオにおける重要なモビリティの変動をしばしば無視する。
我々は,次のPOIレコメンデーションにシナリオ分割パラダイムを採用するフレームワークであるMultifaceted Scenario-Aware Hypergraph Learning法(MSAHG)を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:29:55 GMT)
An Empirical Study of Policy-as-Code Adoption in Open-Source Software Projects [6.1] ポリシー・アズ・コード(PaC)は、ガバナンス、コンプライアンス、セキュリティ要件を直接ソフトウェアシステムに組み込むための基本的なアプローチとなっている。
組織がPaCツールをますます採用する一方で、ソフトウェアエンジニアリングコミュニティには、これらのツールが実際の開発プラクティスでどのように使用されているか、実証的な理解が欠けている。
本稿では,オープンソースソフトウェアにおけるPaC利用に関する大規模な研究を初めて実施することを目的とする。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:12:40 GMT)
Drivora: A Unified and Extensible Infrastructure for Search-based Autonomous Driving Testing [6.1] Drivoraは、広く使われているCARLAシミュレータ上に構築された自律運転システム(ADS)のための検索ベースのテストインフラストラクチャである。
Drivoraは、低レベルのアクション可能なパラメータを使用してシナリオを指定する、統一されたシナリオ定義であるOpenScenarioを導入した。
Drivoraはテストエンジン、シナリオ実行、ADS統合を分離する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:08:07 GMT)
Why LoRA Fails to Forget: Regularized Low-Rank Adaptation Against Backdoors in Language Models [6.0] Low-Rank Adaptation (LoRA) は大規模言語モデルのパラメータ効率の良い微調整に広く用いられている。
LoRAの脆弱性は基本的にスペクトルであることを示す。
正規化低ランク適応(RoRA)は、スペクトル強度を増大させることにより、忘れを改善する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:54:47 GMT)
Continuous-time noise mitigation in analogue quantum simulation [5.9] アナログ量子シミュレーションにおけるノイズ軽減のための新しい枠組みを確立する。
これは完全に類似しており、正確なノイズキャンセリングを実現する最初のプロトコルである。
この研究は、ノイズの存在下で高忠実度アナログ量子シミュレーションを達成するための新しい方向を開く。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:13:03 GMT)
Beyond BeautifulSoup: Benchmarking LLM-Powered Web Scraping for Everyday Users [5.8] 大規模言語モデル(LLM)はウェブスクレイピングを民主化しており、低スキルのユーザは単純な自然言語プロンプトを通じて洗練された操作を実行できる。
これまでのLCMベースのベンチマークでは,手作業による手作業がなくても,初心者のユーザはアクセス不能なWebサイトをスクラップできることがわかった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:34:28 GMT)
ROAP: A Reading-Order and Attention-Prior Pipeline for Optimizing Layout Transformers in Key Information Extraction [5.6] 本稿では,レイアウト変換器のアテンション分布を最適化する軽量かつアーキテクチャに依存しないパイプラインであるROAPを提案する。
FUNSDおよびCORDベンチマークの実験により、ROAPはバックボーンの性能を一貫して改善することを示した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:02:37 GMT)
mHC-lite: You Don't Need 20 Sinkhorn-Knopp Iterations [5.5] 制約のない残留行列は訓練安定性を損なうことがある。
DeepSeek's Manifold-Constrained Hyper-Connections (mHC) は、これらの行列を反復シンクホーン-クノップ(SK)正規化を通じてバーホフポリトープに投影する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:19:14 GMT)
Context-Aware Decoding for Faithful Vision-Language Generation [5.3] 視覚入力と矛盾する応答を生成する幻覚は、大きな視覚言語モデル(LVLM)の重要な限界である。
本研究では,幻覚を駆動するレイヤワイズ生成ダイナミクスを探索し,学習自由化戦略を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:50:57 GMT)
Higher-Order Domain Generalization in Magnetic Resonance-Based Assessment of Alzheimer's Disease [5.2] 多様な分布変化を模倣する高次特徴モーメント(歪と曲率)をブレンドするフレームワークであるExtended MixStyle(EM)を紹介する。
EMはクロスドメイン性能を向上し、最先端ベンチマークよりも平均2.4ポイントのマクロF1を改善した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:01:49 GMT)
TowerMind: A Tower Defence Game Learning Environment and Benchmark for LLM as Agents [5.2] 本稿では,RTSゲームにおけるタワー防衛サブジャンルを基盤とした,新しい環境であるタワーミンドを紹介する。
我々は、広く使われている大規模言語モデルを評価するために、5つのベンチマークレベルを設計する。
その結果、LLMと人間の専門家の能力と幻覚の両面において、明らかなパフォーマンスギャップが明らかとなった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:18:08 GMT)
Generalized Poincaré inequality for quantum Markov semigroups [5.1] トラシアル・フォン・ノイマン環上のトレース対称量子マルコフ半群に対する非可換$(p,p)$-ポアンカレ不等式を証明する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:41:12 GMT)
LDTC: Lifelong deep temporal clustering for multivariate time series [4.9] 本稿では,新しい時間クラスタリングアルゴリズムを提案する。
次元の削減と時間的クラスタリングを、エンドツーエンドの深い教師なし学習フレームワークに統合する。
実験の結果,LDTCは時間的クラスタリング問題を効果的かつ効率的に扱うための有望な方法であることがわかった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:05:31 GMT)
Decoding Workload and Agreement From EEG During Spoken Dialogue With Conversational AI [4.9] 本稿では,精神労働負荷と暗黙的合意のための確立された脳波分類器を,音声による人間-AI対話に転送できるかどうかを検討する。
Spelling Beeタスクと文補完タスクの2つの会話パラダイムと、単語レベルの会話イベントの書き起こし、注釈付け、調整のためのエンドツーエンドパイプラインを導入する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:59:25 GMT)
Hard Constraint Projection in a Physics Informed Neural Network [4.8] 本研究では、2次元非圧縮性ナビエストークス方程式の解を予測する物理情報ニューラルネットワーク(PINN)にハード制約を埋め込む。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:30:58 GMT)
Hi-ZFO: Hierarchical Zeroth- and First-Order LLM Fine-Tuning via Importance-Guided Tensor Selection [4.8] FO勾配をZO推定と相乗化するためにtextbfHi-ZFO (textbfHierarchical textbfZeroth- and textbfFirst-textbfOrder optimization) を提案する。
また,Hi-ZFOはトレーニング時間を大幅に短縮しつつ,優れた性能を実現していることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:20:54 GMT)
Understanding LLM-Driven Test Oracle Generation [4.8] 既存のテクニックは、テスト対象のクラスの実装された振る舞いを述語する回帰オラクルを主に生成します。
Foundation Models(FM)、特にLarge Language Models(LLM)の台頭に伴い、意図した振る舞いを反映したテストオラクルを生成する新たな機会がある。
本稿では,ソフトウェア障害を露呈するテストオラクル生成におけるLCMの有効性に関する実証的研究を行う。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:51:35 GMT)
An Intelligent AI glasses System with Multi-Agent Architecture for Real-Time Voice Processing and Task Execution [4.7] このシステムでは、エージェント01が自動音声認識(ASR)を処理し、エージェント02が局所言語モデル(LLM)、モデルコンテキストプロトコル(MCP)ツール、検索拡張生成(RAG)を介してAI処理を管理するデュアルエージェントアーキテクチャを採用している。
このシステムは、音声およびビデオデータ送信、アイトラッキングデータ収集、RabbitMQメッセージングによるリモートタスク実行のためのリアルタイムRTSPストリーミングをサポートする。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:13:32 GMT)
PII-VisBench: Evaluating Personally Identifiable Information Safety in Vision Language Models Along a Continuum of Visibility [4.6] PII-VisBenchは、オンラインプレゼンスの継続を通してVLMの安全性を評価するために設計された4000個のプローブを含む新しいベンチマークである。
このベンチマークは、200人の被験者を、オンラインで利用可能な情報の範囲と性質に基づいて、ハイ、ミディアム、ロー、ゼロの4つの可視性カテゴリに分類している。
モデル全体では、被験者の視認性が低下するにつれて、拒絶が増加し、PII開示が減少する(9.10%高から5.34%低)という一貫したパターンが観察される。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:40:56 GMT)
WaveRNet: Wavelet-Guided Frequency Learning for Multi-Source Domain-Generalized Retinal Vessel Segmentation [4.2] 領域一般化網膜血管分節は眼科における自動診断に重要である。
本稿では,ウェーブレット誘導周波数学習フレームワークであるWaveRNetを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:58:29 GMT)
FlashMem: Distilling Intrinsic Latent Memory via Computation Reuse [4.2] FlashMemは、計算再利用を通じて、過渡的推論状態から直接固有のメモリを蒸留するフレームワークである。
実験によると、FlashMemは5倍の推論遅延を減らしながら、重いベースラインのパフォーマンスと一致している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:27:43 GMT)
FLRQ: Faster LLM Quantization with Flexible Low-Rank Matrix Sketching [4.0] Rank1-Sketch-based Flexible Rank Selection (R1-FLR) と Best Low-rank Approximation under Clipping (BLC) を導入する。
R1-FLRは高速な低ランク近似のためにガウス射影を持つR1-Sketchを適用し、各層に対して外向きのランク抽出を可能にする。
BLCは、スケーリングとクリッピング戦略の下での低ランク量子化誤差の最小化を目的としている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:06:45 GMT)
Evaluating the Use of LLMs for Automated DOM-Level Resolution of Web Performance Issues [3.9] 本研究は文書オブジェクトモデル(DOM)の変更に焦点を当てる。
大規模言語モデル(LLM)の最近の進歩は、この複雑なタスクを自動化するための有望な道を提供する。
本研究は、Webパフォーマンス自動解決のための9つの最先端LCMの有効性を評価する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:21:49 GMT)
Smart Privacy Policy Assistant: An LLM-Powered System for Transparent and Actionable Privacy Notices [3.9] ほとんどのユーザーは、個人情報の収集、共有、収益化の方法を規定しているにもかかわらず、閲覧や理解なしにオンラインプライバシポリシーに同意する。
本稿では,LLMを利用したスマートプライバシポリシアシスタントを提案する。プライバシポリシを自動的に取り込み,キー句を抽出,分類し,人間の解釈可能なリスクレベルを割り当て,明確で簡潔な説明を生成する。
本稿では, ポリシーの取り込み, 条項分類, リスクスコアリング, 説明生成を含むエンドツーエンドパイプラインについて述べるとともに, 条項レベルの正確性, ポリシーレベルのリスク合意, ユーザ理解に基づく評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:42:59 GMT)
Semantic NLP Pipelines for Interoperable Patient Digital Twins from Unstructured EHRs [3.9] 本稿では,自由文 EHR 音符をデジタル双対表現に変換する意味的 NLP 駆動パイプラインを提案する。
このパイプラインは、名前付きエンティティ認識(NER)を利用して臨床概念を抽出し、概念正規化によってエンティティをSNOMED-CTまたはICD-10にマッピングし、条件、薬品、観察の間の構造化された関連をキャプチャする関係抽出を行う。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:20:11 GMT)
Adversarial Network Imagination: Causal LLMs and Digital Twins for Proactive Telecom Mitigation [3.9] 本稿では,敵ネットワーク障害の生成,シミュレーション,評価を行うための逆ネットワークイマジネーションを提案する。
このフレームワークはCausal Large Language Model、Knowledge Graph、Digital Twinを統合している。
ネットワーク操作をリアクティブなトラブルシューティングから予測レジリエンス分析に移行する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:15:05 GMT)
BlazeAIoT: A Modular Multi-Layer Platform for Real-Time Distributed Robotics Across Edge, Fog, and Cloud Infrastructures [3.9] BlazeAIoTは、異種インフラストラクチャをまたいだ分散ロボティクスを統合するために設計された、モジュール化された多層プラットフォームである。
動的データ転送、スマートサービス、統合監視、レジリエンス、セキュリティ、プログラミング言語の柔軟性を保証する。
その結果は、不完全なトポロジをまたいでサービスを動的に割り当て、システムの健全性を維持し、レイテンシを最小限にするBlazeAIoTの機能を強調している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:47:40 GMT)
When Smaller Wins: Dual-Stage Distillation and Pareto-Guided Compression of Liquid Neural Networks for Edge Battery Prognostics [3.7] 本稿では, 液状ニューラルネットワークを二段蒸留したDLNetについて述べる。
これは、高容量モデルを、バッテリーの健康予測のためにコンパクトでエッジにデプロイ可能なモデルに変える。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:20:21 GMT)
Memory Poisoning Attack and Defense on Memory Based LLM-Agents [3.7] 永続メモリを備えた大規模言語モデルエージェントは、メモリ中毒攻撃に対して脆弱である。
近年の研究では、MINJA (Memory Injection Attack) が95%以上のインジェクション成功率を達成した。
本研究は,記憶障害攻撃と防御の系統的評価を通じてギャップに対処する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:26:10 GMT)
Scaleable LED-pumped Room-temperature Maser using a Multi-blade Optical Injector [3.3] そこで本研究では,より効果的で,よりスケール可能なポンピングが可能な光インジェクタ「マルチブレード光インジェクタ」について検討する。
レイトレーシングは、導波路の異なる設計がPc:PTP結晶にどのように光を注入するかを評価するために用いられる。
マルチブレードインジェクション vis-a-vis 代替戦略の性能と拡張性について分析した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:42:12 GMT)
The Grammar of Transformers: A Systematic Review of Interpretability Research on Syntactic Knowledge in Language Models [3.3] 本稿では,トランスフォーマーに基づく言語モデルの構文的能力を評価する337の論文を体系的にレビューする。
以上の結果から, TLMは形式指向現象をよく捉えるが, 構文意味インタフェースにおける現象に対して, より可変かつ弱い性能を示すことが示唆された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:34:19 GMT)
Sequential Bayesian Optimal Experimental Design in Infinite Dimensions via Policy Gradient Reinforcement Learning [3.3] 高忠実性アプローチでは、ネストしたベイズ反転と設計ループの中で、繰り返し前方および随伴したPDEが解かれる。
我々は、SBOEDを有限水平マルコフ決定プロセスとして定式化し、ポリシー段階の強化学習を通じて、償却設計ポリシーを学習する。
汚染源追跡のための逐次マルチセンサ配置に関する数値実験は、高忠実度有限要素法よりも約100倍のスピードアップを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:44:49 GMT)
From Preoperative CT to Postmastoidectomy Mesh Construction: Mastoidectomy Shape Prediction for Cochlear Implant Surgery [3.2] 本研究では,術前CTスキャンから直接マストイド切除領域を予測するための,自己監督型・弱教師型学習フレームワークを提案する。
本手法は, 複合および無境界マストイドの形状を予測する際に, 平均Diceスコア0.72を達成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:26:26 GMT)
Integrating Temporal Context into Streaming Data for Human Activity Recognition in Smart Home [3.1] 受動的センサーからのヒューマンアクティビティ認識(HAR)は、主に従来の機械学習に依存している。
私たちは、朝、午後、夜のアクティビティをクラスタリングすることで、この問題に取り組みます。
日・日・週の時刻を周期的時間的特徴として組み込むことにより特徴ベクトルを拡張することを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:47:06 GMT)
Multi-task Modeling for Engineering Applications with Sparse Data [3.1] 本稿では,マルチソース多要素データに特徴付けられるエンジニアリングシステムに適したマルチタスクガウス処理(MTGP)フレームワークを提案する。
タスク間関係の定量化と活用により,提案したMTGPフレームワークは,計算および実験コストの大きい領域における予測モデリングのための堅牢でスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:28:19 GMT)
GeoSurDepth: Spatial Geometry-Consistent Self-Supervised Depth Estimation for Surround-View Cameras [3.1] GeoSurDepthは、サラウンドビューの深さ推定のための主要なキューとして、幾何整合性を利用するフレームワークである。
筆者らのフレームワークは,頑健な自己教師付き多視点深度推定のための幾何学的コヒーレンスと一貫性を活用することの重要性を強調した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:13:28 GMT)
iReasoner: Trajectory-Aware Intrinsic Reasoning Supervision for Self-Evolving Large Multimodal Models [3.0] 大規模マルチモーダルモデル(LMM)は、ラベルのないデータから自己再生とフィードバックによって自己改善することができる。
iReasonerは,LMMの暗黙的推論を改善するための自己進化型フレームワークである。
Qwen2.5-VL-7Bを皮切りに、iReasonerは教師なしのポストトレーニングの下で様々なマルチモーダル推論ベンチマークで最大$2.1$ポイントを得る。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:53:42 GMT)
Narrowband four-photon states from spontaneous four-wave mixing [3.0] 直列連続波ポンピングによる相関4光子状態を生成する。
我々は、飽和に近い秒間2.5(4)x106の時間相関4光子生成率を推定する。
生成した光子は原子遷移とほぼ共鳴し、MHzの順に帯域幅を持ち、原子を含む量子ネットワークアプリケーションと容易に互換性がある。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:16:56 GMT)
Performance of a Deep Learning-Based Segmentation Model for Pancreatic Tumors on Public Endoscopic Ultrasound Datasets [2.9] 膵癌は最も攻撃的ながんの1つであり、生存率も低い。
本研究では, 膵腫瘍に対するVision Transformerを用いたディープラーニングセグメンテーションモデルについて検討した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:48:50 GMT)
Data-Dependent Goal Modeling for ML-Enabled Law Enforcement Systems [2.9] 本稿では,GOREフレームワークKAOSを用いて,オンライン児童性的虐待の容疑者を識別するML対応システムの設計を行った経験を報告する。
データ要件は、目標のリンク、運用、満足度に影響を与える一方で、リファインメントの選択と候補エージェントを制限します。
データ駆動型システム開発とGOREを統合するための参照モデルを提供し、特にデータ導入と品質管理の明示的なサポートの必要性について、KAOS内のギャップを識別する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:22:02 GMT)
Gamma2Patterns: Deep Cognitive Attention Region Identification and Gamma-Alpha Pattern Analysis [2.9] 深い認知的注意は、ガンマ振動の高揚と協調した視覚行動によって特徴づけられる。
この研究は、Gamma2Patternsという、相補的なGammaとAlphaバンドのEEG活動を活用することによって、深い認知的注意を特徴付けるフレームワークを紹介している。
我々は,高焦点(ガンマ支配)と低焦点(アルファ支配)の神経活動の相違について分析した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:07:19 GMT)
Universal Dilation of Linear Itô SDEs: Quantum Trajectories and Lindblad Simulation of Second Moments [2.8] 本稿では,加法的あるいは乗法的な雑音を持つ量子コンピュータ上で線形イット微分方程式(SDE)をシミュレートするための普遍的枠組みを提案する。
一元的拡張法に基づいて、一般線型 SDE [ dX_t = A(t) X_t,dt + sum_j=1J B_j(t)X_t,dW_tj ] と、拡張ヒルベルト空間上のシュルディンガー方程式(SSE)の間の厳密な対応を確立する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:42:25 GMT)
Advancing credit mobility through stakeholder-informed AI design and adoption [2.7] 本研究は, ニューヨーク州立大学システムと連携して, 機関間の調律を提案するために, 人工知能を適用した。
カタログ記述における表面的マッチングと制度的バイアスに対処する教師付きアライメント手法を開発した。
本手法の調音予測と61%の平均的採用率から, 有効な信用移動機会の12倍の増加が予測された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:39:12 GMT)
Multi-Image Super Resolution Framework for Detection and Analysis of Plant Roots [2.7] 植物根の重なり合う複数のビューを撮像する新しい地下イメージングシステムを提案する。
我々は、深層学習に基づくMulti-Image Super Resolution (MISR) フレームワークを使用して、ルートの可視性と詳細性を高める。
我々の手法は最先端の超解像度ベースラインより優れており、BRISQUEの2.3%の削減を実現している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:30:48 GMT)
Mobile Robot Localization Using a Novel Whisker-Like Sensor [2.4] 本稿では,単一のウィスカセンサを用いて,既知の平面環境下での接触点とロボット位置を推定するための枠組みを提案する。
その結果,7mm以下の誤差で正確な接触推定と位置推定が得られた。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:11:15 GMT)
Automated QoR improvement in OpenROAD with coding agents [2.4] 我々は,OpenAIモデル上に構築された自律的リポジトリベースコーディングシステムであるAuDoPEDAと,OpenROADを読むCodexクラスエージェントを紹介する。
コントリビューションには、(i)EDAコード変更のためのクローズドループLLMフレームワーク、(ii)OpenROAD上のタスクスイートと評価プロトコルによるPPA指向の改善、(iii)人間の監督を最小限に抑えたエンドツーエンドのデモが含まれています。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:30:02 GMT)
Achieving the Heisenberg limit using fault-tolerant quantum error correction [2.4] ハイゼンベルク極限(英: Heisenberg limit, HL)は、量子力学によって許される極限である。
ハイゼンベルク極限は一般にノイズの存在下では到達できない。
量子エラー補正(QEC)は様々なシナリオでHLを回復することができる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:08:39 GMT)
A New Family of Poisson Non-negative Matrix Factorization Methods Using the Shifted Log Link [2.4] シフトログリンク機能を備えたPoisson NMFを提案する。
ポアソンNMFにおけるリンク関数の選択が、どのようにして結果に瞬時に影響を及ぼすかを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:16:54 GMT)
The Echo Chamber Multi-Turn LLM Jailbreak [2.4] 本研究では,段階的エスカレーション法を用いた新しいマルチターン攻撃であるEcho Chamberを紹介する。
我々は、この攻撃を詳細に記述し、他のマルチターン攻撃と比較し、その性能を複数の最先端モデルに対して示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:46:32 GMT)
Interpreting Transformers Through Attention Head Intervention [2.4] メカニスティック解釈は、ハイテイクドメインにおける説明責任と制御を可能にする。
本稿では,変圧器の因果解法として注目頭介入が出現した経緯を追究する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:24:36 GMT)
Automated Generation of Accurate Privacy Captions From Android Source Code Using Large Language Models [2.3] プライバシーキャプションとは、個人情報の使い方、使い方、理由を簡潔に記述した短い文章である。
不正確なキャプションはユーザーを誤解させ、デベロッパーに規制上の罰金を課す可能性がある。
既存のプライバシ通知や単にプライバシキャプションを生成するアプローチとしては、アンケート、テンプレート、静的分析、マシンラーニングなどがある。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:41:28 GMT)
Federated Learning and Class Imbalances [2.2] フェデレートラーニング(FL)は、データのプライバシを保持しながら、分散デバイス間で協調的なモデルトレーニングを可能にする。
実世界のFLデプロイメントは、ラベルノイズや非IID分布など、データ不均衡のような重要な課題に直面している。
RHFL+は、異種クライアントモデルを用いた設定におけるこれらの課題に対処するために、最先端の手法である。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:06:37 GMT)
Agentic LLMs as Powerful Deanonymizers: Re-identification of Participants in the Anthropic Interviewer Dataset [2.2] Anthropicは2025年12月4日に、質的なインタビューを大規模に実行するAIツールであるAnthropic Interviewerをリリースした。
ウェブ検索とエージェント機能を備えた LLM が,24 件中6 件のインタビューを特定の科学的研究にリンク可能であることを示す。
私の貢献は、現代のLSMベースのエージェントがそのような再識別を容易かつ低努力で行うことを示すことです。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:32:33 GMT)
Poisson Hyperplane Processes with Rectified Linear Units [2.2] 我々はポアソン超平面プロセス(PHP)と2層ReLUニューラルネットワークの接続を確立する。
ガウス前のPHPは2層ReLUニューラルネットワークの代替確率表現であることを示す。
数値実験により,提案手法は古典的な2層ReLUニューラルネットワークよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:12:50 GMT)
Learning Reconstructive Embeddings in Reproducing Kernel Hilbert Spaces via the Representer Theorem [2.1] 本研究は, 再現カーネルヒルベルト空間(RKHS)における再構成型多様体学習のための新しいアルゴリズムを提案する。
分離可能な演算子値カーネルは、単一のスカラー類似関数の単純さを維持しながら、定式化をベクトル値データに拡張する。
その後のカーネルアライメントタスクは、データをグラム行列が高次元再構成カーネルにマッチすることを目的とした低次元潜在空間に投影する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:35:19 GMT)
EviSnap: Faithful Evidence-Cited Explanations for Cold-Start Cross-Domain Recommendation [2.0] EviSnapは軽量なCDRフレームワークであり、その予測はエビデンスに励まされ忠実な合理性による構築によって説明される。
EviSnapは、LLMオフラインを使用してノイズの多いレビューをコンパクトなファセットカードに蒸留し、各ファセットと動詞のサポート文をペアリングする。
次に、ファセット埋め込みをクラスタ化して共有ドメインに依存しないコンセプトバンクを誘導し、ユーザ陽性、ユーザ陰性、アイテムプレゼンスの概念アクティベーションを計算する。
単一のコンセプト・ツー・コンセプトマップは、ユーザをドメイン間で転送し、線形スコアリングヘッドは、概念ごとの付加的なコントリビューションを生成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:21:43 GMT)
Buffered AUC maximization for scoring systems via mixed-integer optimization [1.8] スコアリングシステムは、少数の説明変数からなる線形分類器であり、それぞれが小さな整数係数を割り当てている。
これまでのいくつかの研究では、混合整数最適化(MIO)技術を用いてバイナリ分類のためのスコアリングシステムを開発した。
この研究は、高度に解釈可能な分類モデルを開発するためのMIO技術の進歩に寄与する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:52:13 GMT)
Modular Autonomy with Conversational Interaction: An LLM-driven Framework for Decision Making in Autonomous Driving [1.7] 大規模言語モデル(LLM)は、自律運転システム(ADS)のための自然言語インタフェースを作成する新しい機会を提供する
本稿では,モジュール型ADSソフトウェアにおいて,人間の言語の複雑さを構造化されたアクション空間にマッピングするという課題に対処する。
本稿では,LLMベースのインタラクション層と,広く使用されているオープンソースソフトウェアであるAutowareを統合するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:23:01 GMT)
Foundational Analysis of Safety Engineering Requirements (SAFER) [1.7] 安全工学の基礎解析のための枠組み(SAFER)について紹介する。
SAFERは、複雑な安全クリティカルシステムに対する安全要件の生成と分析を改善するために、ジェネレーティブAIによってサポートされているモデル駆動の方法論である。
我々は、生成AIを形式的なモデルで拡張し、体系的にクエリして、有意義な初期段階の安全要件を提供する必要があることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:13:35 GMT)
Continual-learning for Modelling Low-Resource Languages from Large Language Models [1.5] 低リソース言語用に構築された小型言語モデル(SLM)は破滅的な忘れ込みの課題を招いている。
本研究では,POS(Part-of-speech)ベースのコードスイッチングを用いた継続的学習戦略を提案する。
視覚的質問応答や言語モデリングタスクなどの視覚言語タスクの実験は、提案したアーキテクチャの成功を示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:51:12 GMT)
Evaluating Large Language Models for Abstract Evaluation Tasks: An Empirical Study [1.4] 大規模言語モデル(LLM)は、要求を処理し、テキストを生成することができるが、学術的コンテンツを評価する可能性にはさらなる調査が必要である。
本研究では,ChatGPT-5,Gemini-3-Pro,Claude-Sonnet-4.5の相互比較およびヒトレビュアーに対する抽象概念の整合性と信頼性について検討した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:21:17 GMT)
Creation and precise spectroscopy of $^{86}$Sr$_2$ halo molecules [1.4] 1光子光解離による効率的な分子生成は、電子励起電位と基底状態電位の標的振動状態の間の十分な波動関数の重なりに依存している。
我々はハロー状態と近隣の弱い境界状態における8,6$Sr$$分子の生成について報告する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 21:28:33 GMT)
From Global to Local: Cluster-Aware Learning for Wi-Fi Fingerprinting Indoor Localisation [1.3] 本稿では,局所化に先立って指紋データセットを構成するクラスタリング手法を提案する。
指紋は、空間的特徴または無線的特徴を用いてグループ化され、建物やフロアレベルでクラスタリングが適用できる。
本手法の有効性を3つの公開データセットと複数の機械学習モデルを用いて評価する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:12:40 GMT)
Manifold limit for the training of shallow graph convolutional neural networks [1.3] 本研究では,浅部グラフ畳み込みニューラルネットワーク(GCNN)のサンプル点雲近傍グラフにおけるトレーニングの整合性について検討した。
我々は、正規化された経験的リスク最小化関数の$$-convergenceと、それらの大域的最小化関数の対応する収束を証明した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:59:20 GMT)
AIBoMGen: Generating an AI Bill of Materials for Secure, Transparent, and Compliant Model Training [1.3] AI Bill of Materials(AIBOM)は、トレーニングされたAIモデルとその環境の標準化された検証可能な記録として紹介されている。
私たちの概念実証プラットフォームであるAIBoMGenは、トレーニング中にデータセット、モデルメタデータ、環境の詳細をキャプチャすることで、署名されたAIBOMの生成を自動化する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:46:42 GMT)
Don't Break the Cache: An Evaluation of Prompt Caching for Long-Horizon Agentic Tasks [1.2] 本稿では,3大言語モデル(LLM)プロバイダ間でのプロンプトキャッシュの総合評価について述べる。
以上の結果から,プロンプトキャッシングによりAPIコストが45~80%削減され,プロバイダ間で13~31%短縮された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:41:57 GMT)
From Issues to Insights: RAG-based Explanation Generation from Software Engineering Artifacts [1.2] 我々は,問題追跡データから説明文を生成するために,最初にRAG(Retrieval-Augmented Generation)アプローチを適用した。
提案する概念実証システムはオープンソースツールと言語モデルを用いて実装され,構造化された課題データを利用した説明生成の可能性を示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:05:50 GMT)
Data Augmented Pipeline for Legal Information Extraction and Reasoning [1.2] 本稿では,Large Language Models (LLMs) を法域内の情報抽出タスクにおけるデータ拡張に活用するパイプラインを提案する。
提案手法は単純かつ効果的であり,情報抽出システムの堅牢性を高めつつ,データアノテーションに必要な手作業を大幅に削減する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:02:54 GMT)
Cybersecurity AI: A Game-Theoretic AI for Guiding Attack and Defense [1.1] Generative Cut-the-Rope (G-CTR) はエージェントのコンテキストから攻撃グラフを抽出するゲーム理論誘導層である。
5つの実世界のエクササイズでは、G-CTRは専門家グラフ構造の70~90%と一致し、60~245倍高速で、手作業による分析より140倍以上安い。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:06:10 GMT)
The resource theory of causal influence and knowledge of causal influence [1.1] 我々は因果関係を理解するための資源理論の枠組みを開発する。
最も単純な非自明な設定(因果的に順序付けられた2つの変数)に焦点を当てます。
すべての資源の集合上の部分的な順序を捉えるという意味で完備な三重音を同定する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:43:10 GMT)
RingSQL: Generating Synthetic Data with Schema-Independent Templates for Text-to-SQL Reasoning Models [1.0] Ringは、スキーマに依存しないクエリテンプレートとLLMベースの自然言語質問のパラフレーズを組み合わせたハイブリッドデータ生成フレームワークである。
我々は、Ringによってトレーニングされたモデルが、他の合成データでトレーニングされたモデルと比較して、6つのテキスト間ベンチマークの平均精度+2.3%に達することを発見した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:46:53 GMT)
The Bathtub of European AI Governance: Identifying Technical Sandboxes as the Micro-Foundation of Regulatory Learning [0.9] 本稿では, マイクロ, メソ, マクロレベルに分解されたAI法によって定義された規制学習空間の理論モデルを確立する。
AIテクニカルサンドボックス(AITS)は、マイクロレベルのエビデンス生成に必要なエンジンであり、モデルのすべてのレベルにわたってスケーラブルな学習を促進するために必要なデータを提供する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:21:09 GMT)
Quantifying and Inducing Shape Bias in CNNs via Max-Pool Dilation [0.9] 畳み込みニューラルネットワーク(CNN)は強いテクスチャバイアスを示し、グローバルな形状情報よりも局所的なパターンを好むことが知られている。
構造類似度指数(SSIM)の計算によりデータセットの形状・テクスチャバランスを定量化するデータ駆動計量を提案する。
本稿では,畳み込み重みを凍結したまま最大プール演算のディレーションを変更することにより,形状バイアスを促進する計算効率のよい適応法を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:36:29 GMT)
STELP: Secure Transpilation and Execution of LLM-Generated Programs [0.9] LLM(Large Language Models)は、コード生成などのソフトウェア開発関連のタスクを解決する。
LLMの生成したコードは不安定あるいは誤動作し、システム障害を広範囲に発生させる脆弱性を含む可能性がある。
本稿では,LLM生成プログラム(STELP)のセキュアトランスパイラと実行器を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:49:41 GMT)
Evaluating Robustness of Large Language Models in Enterprise Applications: Benchmarks for Perturbation Consistency Across Formats and Languages [0.9] 小さな急激な変化でさえ、出力にかなりの違いをもたらす可能性がある。
複数の摂動型にまたがるロバスト性を評価するベンチマークスイートを提案する。
マイナーな摂動は、主要な企業メトリクスの最大40パーセントのパフォーマンスを低下させることに気付きました。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:26:31 GMT)
What Functions Does XGBoost Learn? [0.9] 無限次元関数クラス $mathcalFd, s_inftytextST$ を導入する。
XGBoost の目的の全ては、$mathcalFd, s_infty-textST$ のペナルティ$Vd, s_infty-textXGB(cdot)$ よりも同等のペナル化回帰問題であることを示す。
我々の結果は関数空間の最初の厳密な特徴を与える。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:22:08 GMT)
Autonomous Probe Microscopy with Robust Bag-of-Features Multi-Objective Bayesian Optimization: Pareto-Front Mapping of Nanoscale Structure-Property Trade-Offs [0.8] 組合せ材料ライブラリーは、候補成分の大きなファミリーを生成するための効率的な方法である。
自動原子間力顕微鏡と磁気力顕微鏡を統合した自律走査型プローブ顕微鏡フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 04:55:36 GMT)
Self-Admitted Technical Debt in LLM Software: An Empirical Comparison with ML and Non-ML Software [0.8] 自己承認技術的負債(Self-admitted Technical debt、SATD)とは、最適化されたコードや不完全な機能を明確に認識する開発者によるコメントである。
大規模言語モデル時代におけるSATDの実証的研究を行った。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:25:48 GMT)
The Qutrit Bloch Sphere [0.8] 立方体が3次元のブロッホ球で可視化できるかどうかを理解することは非常に重要である。
本研究では,この操作を行う数学的モデルについて述べる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:34:57 GMT)
Joint Optimization of Neural Autoregressors via Scoring rules [0.8] Tabular Prior-Data Fitted Network (TabPFN) は様々なベンチマークで最先端の性能を示した。
次元当たり$N$ binsの非パラメトリックな離散化では、明示的なジョイントグリッドの複雑さは指数関数的にスケールする。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:05:07 GMT)
Secure Change-Point Detection for Time Series under Homomorphic Encryption [0.8] 本稿では,暗号化時系列上での初回変更点検出手法を提案する。
本手法では、CKKS準同型暗号方式を用いて、データを復号することなく統計特性の変化を検出する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:40:45 GMT)
LayerGS: Decomposition and Inpainting of Layered 3D Human Avatars via 2D Gaussian Splatting [0.7] 任意に配置された人間をアニマタブルな多層型3次元アバターに分解する新しい枠組みを提案する。
提案手法は,従来の最先端技術よりも優れたレンダリング品質と層分解,再構成を実現する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:30:12 GMT)
Hierarchical GNN-Based Multi-Agent Learning for Dynamic Queue-Jump Lane and Emergency Vehicle Corridor Formation [0.7] 緊急回廊形成のための連結車両の協調のための,新しい階層型グラフニューラルネットワーク(GNN)に基づくマルチエージェント強化学習フレームワークを提案する。
このシステムは、ベースラインと比較して緊急車両の走行時間を28.3%削減し、シミュレーションでは非コーディネートトラフィックと比較して44.6%削減する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:02:43 GMT)
LLM-Augmented Knowledge Base Construction For Root Cause Analysis [0.6] 本研究では,支援チケットからルート原因分析(RCA)知識ベースを構築するための3つの大規模言語モデル(LLM)手法を評価する。
語彙と意味の類似度を総合的に比較する。
実産業データセットを用いた実験により, 生成した知識ベースがRCAタスクの高速化に優れた出発点となることが示された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:41:30 GMT)
Hardware-Aware Reformulation of Convolutions for Efficient Execution on Specialized AI Hardware: A Case Study on NVIDIA Tensor Cores [0.6] 例えばNVIDIA Coresは、効率的な実行のために入力チャネルを8と512の倍数にする必要がある。
従来のアプローチでは、ゼロパディングを使ってアライメントの問題に対処するが、これは非効率である。
書き直し規則を用いたCNN計算のハードウェア対応化について述べる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:28:14 GMT)
Kidney Cancer Detection Using 3D-Based Latent Diffusion Models [0.6] 本研究は, 弱教師付き異常検出のための3次元潜伏拡散の可能性と可能性を示す。
以上の結果から, 複雑な腹部解剖のアノテーション効率, 生成的モデリングへの重要な一歩が示唆された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:30:00 GMT)
Influence of Parallelism in Vector-Multiplication Units on Correlation Power Analysis [0.5] 本研究では,ハードウェアアクセラレータにおける並列処理がサイドチャネル攻撃に与える影響について検討する。
焦点は、同じ完全に接続された層の一部であるニューロンに向けられ、並列に実行され、同時に同じ入力値を処理する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:01:47 GMT)
Mixture-of-Experts as Soft Clustering: A Dual Jacobian-PCA Spectral Geometry Perspective [0.5] Mixture-of-Experts (MoE)アーキテクチャは、一般的に効率性と条件計算によって動機付けられている。
幾何レンズを用いてMoEを解析し、表現空間のソフトパーティショニングの形でルーティングを解釈し、重なり合う局所チャートに変換する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:07:14 GMT)
TRec: Learning Hand-Object Interactions through 2D Point Track Motion [0.5] 本稿では,2Dポイントトラックを付加的な動作キューとして活用する手動物体の動作認識のための新しい手法を提案する。
我々はCoTrackerを用いて、各ビデオを通してランダムに一組のポイントを追尾し、結果のトラジェクトリをTransformerベースの認識モデルへの入力として使用する。
実験結果から,2Dポイントトラックの統合は,運動情報のないトレーニングモデルと比較して連続的に性能を向上させることが確認された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:48:15 GMT)
A Fast and Effective Method for Euclidean Anticlustering: The Assignment-Based-Anticlustering Algorithm [0.4] 代入ベースのアンチクラスタリングアルゴリズムは、非常に大きなインスタンスにスケールする。
ABAは、ソリューションの品質と実行時間の両方において、よく知られたMETIS法よりも優れている。
ABAアルゴリズムのコードはGitHubで公開されている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:14:19 GMT)
Prompt-Free SAM-Based Multi-Task Framework for Breast Ultrasound Lesion Segmentation and Classification [0.4] 本研究では,病変分類と診断分類を共同で行うマルチタスク深層学習フレームワークを提案する。
提案手法では,高次元SAM特徴を軽量な畳み込みヘッドまたはUNetにインスパイアされたデコーダでデコードし,ピクセルワイドセグメンテーションを実現する。
PreCISE 2025乳房超音波データセットの実験では、クラスごとに80%のトレーニングと20%のテストに分割し、提案手法がDice similarity Coefficient (DSC)の0.887の精度と92.3%の精度を達成することを示した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:02:41 GMT)
Two-step Authentication: Multi-biometric System Using Voice and Facial Recognition [0.4] 本稿では,一般的なデバイスで利用可能なカメラとマイクのみを用いて,顔認証と話者認証を統合した費用対効果の2段階認証システムを提案する。
顔認識のために、プルーニングされたVGG-16ベースの分類器は、MCCNNによってローカライズされた5人の被験者の924の画像の強化データセットに基づいて訓練される。
音声認識では、LibriSpeechで訓練されたCNN話者検証モデルが98.9%の精度で、テストクリーンでは3.456%のEERを達成した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:11:50 GMT)
Affect and Effect: Limitations of regularisation-based continual learning in EEG-based emotion classification [0.4] 脳波に基づく感情分類における未知の被験者への一般化は、高い物体間および物体内変動のため、依然として課題である。
正規化に基づく連続学習アプローチは、EEGに基づくCL研究のベースラインとして一般的に用いられる。
本研究は,脳波に基づく感情分類において,正規化に基づくCL法が限られた性能を示すことを理論的,実証的に見出した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:09:54 GMT)
Community-Based Model Sharing and Generalisation: Anomaly Detection in IoT Temperature Sensor Networks [0.4] 関心のコミュニティ(CoIs)は、異種IoTセンサネットワークを組織化する上で有望なパラダイムを提供する。
本研究では,センサをコミュニティにグループ化することで,CoIパラダイムに基づく異常検出フレームワークを提案する。
その結果, コミュニティ間での変動が観察される一方で, 評価された構成に対して, コミュニティ内での堅牢な性能が示された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:05:57 GMT)
Reverse-engineering NLI: A study of the meta-inferential properties of Natural Language Inference [0.3] 自然言語推論(NLI)は、自然言語理解のための言語モデルを評価する重要なタスクである。
我々は、NLIラベルセットの3つの可能な読み出しを定式化し、それらが持つメタ推論特性を包括的に分析する。
論理的関係の読み出しがデータセットによってエンコードされるという知見を導出する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:37:13 GMT)
A Framework for Estimating Restricted Mean Survival Time Difference using Pseudo-observations [0.3] 対象学習 (TL) フレームワークは, 平均生存時間 (RMST) の差を, 時間と結果の異なる臨床試験で推定するために開発された。
このフレームワークは実データアプリケーションを使ってデモされている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:22:07 GMT)
Generating Diverse TSP Tours via a Combination of Graph Pointer Network and Dispersion [0.3] ディバース・トラベリング・セールスマン問題(Diverse Traveling Salesman Problem, D-TSP)は、異なるツアーのセットを求める双基準最適化問題である。
D-TSPを2つの効率的なステップに分解する新しいハイブリッドフレームワークを提案する。
当社のアプローチは,大規模インスタンス(783都市)の360倍以上高速です。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:40:19 GMT)
AI-Powered Algorithms for the Prevention and Detection of Computer Malware Infections [0.2] 本研究では,人工知能(AI)に基づくコンテキスト認識型ハイブリッドマルウェア検出フレームワークを提案する。
この新しいアプローチは、97.3%の精度で優れたパフォーマンスを提供し、同じ分野で確立されたいくつかの機械学習(ML)やディープラーニング(DL)と比較して、1.5%の偽陽性率と最小限の検出遅延しか得られない。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:14:34 GMT)
A Review on Machine Learning Approaches for the Prediction of Glucose Levels and Hypogylcemia [0.2] 機械学習(ML)モデルは、低血糖を予測し、最適な予防方法を提供することで、糖尿病管理を改善することができる。
本総説では,1型糖尿病(T1D)患者の連続血糖モニタリング(CGM)デバイスデータに基づいて訓練した最先端モデルについて検討する。
短期(15分から120分)と長期(3時間から24時間以上)の予測地平線(PH)を比較した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 23:06:36 GMT)
Mining Quantum Software Patterns in Open-Source Projects [0.2] 本稿では,80のオープンソースプロジェクトのJupyter Notebook 985について,実際に量子パターンがどのように適用されているのかを実証研究する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:50:50 GMT)
Detecting Stochasticity in Discrete Signals via Nonparametric Excursion Theorem [0.2] 本研究では,1つの離散時系列のみを用いて,拡散過程と決定論的信号とを区別する枠組みを開発する。
我々のアプローチは、連続半行列に対する古典的な探索と交差定理に基づいている。
本稿では,正準系,周期的・カオス的な地図,付加的な白色雑音を伴うシステムについて紹介する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:47:57 GMT)
The pros and cons of using deep reinforcement learning or genetic algorithms to design control schemes for quantum state transfer on qubit chains [0.1] 外部制御を用いた量子ビットチェーンにおける量子状態の伝達を制御するための2つの方法を提案する。
第1のアプローチは、よく知られた遺伝的アルゴリズムを使用して外部制御のシーケンスを生成し、第2のアプローチは強化学習の変種を使用する。
遺伝的アルゴリズムは、強化学習と同程度の短い伝送時間で優れた伝送忠実性を達成し、後者の手法により達成された忠実性を上回る。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:43:33 GMT)
Latent splitting as a causal probe [0.1] ベルのフレームワークを因果ネットワークに一般化することで、新たな基礎的な洞察と応用がもたらされた。
本稿では,量子ネットワークへの介入の一般化である潜時分割手法を紹介する。
従来の介入が失敗しても観察データと介入データを組み合わせることで,非古典性の検出を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:25:06 GMT)
Slow mixing and emergent one-form symmetries in three-dimensional $\mathbb{Z}_2$ gauge theory [0.0] 標準例として3次元格子ゲージ理論(LGT)の緩和力学について検討する。
我々の証明は、LGTを有限温度古典メモリとして確立している。
さらに、エントロピー効果が創発的な一形式対称性をもたらすことを証明する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:48:39 GMT)
Cross-National Evidence of Disproportionate Media Visibility for the Radical Right in the 2024 European Elections [0.0] 我々はオーストリア、ドイツ、アイルランド、ポーランド、ポルトガルの主要な国営メディアからのニュースを分析した。
記事のURLやタイトルから、政党、政治指導者、グループを特定しました。
クロスカントリー比較では、メインストリームと急進右派が他の政治グループよりも頻繁に言及されたことを示している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:00:59 GMT)
What do the metrics mean? A critical analysis of the use of Automated Evaluation Metrics in Interpreting [0.0] 現在、納品された解釈の質を迅速かつ効率的に測定する方法に対する高い需要がある。
本稿では,最近提案されたこれらの品質測定手法について検討し,実際の解釈の実践の質を評価するための妥当性について論じる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:39:28 GMT)
Visualising Information Flow in Word Embeddings with Diffusion Tensor Imaging [0.0] 言語モデル(LLM)が自然言語をどのように表現するかを理解することは、自然言語処理研究における中心的な課題である。
本稿では,拡散テンソル画像(DTI)を単語埋め込みに適用することにより,自然言語表現における情報フローの分析と可視化を行う新しいツールを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:58:17 GMT)
Variational Autoencoders for P-wave Detection on Strong Motion Earthquake Spectrograms [0.0] 本研究では,P波到着検出を自己教師付き異常検出タスクとして再編成する。
アーキテクチャの変動は、再構成の忠実さと異常な差別の間のトレードオフを規制していることを示す。
注意に基づく変分オートコーダは、0から40km近距離で0.91の曲率のエリアアンダー・ザ・カーブを達成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:28:02 GMT)
Universal Predictors for Mixing Time more than Liouvillian Gap [0.0] 我々はリンドブラッドマスター方程式によって支配される開量子系の混合時間を分析する。
これらの普遍的な混合時間予測器を利用することで、それぞれ高速混合と高速混合の一般的な条件を確立する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:02:49 GMT)
Triadic Concept Analysis for Logic Interpretation of Simple Artificial Networks [0.0] 人工知能ニューラルネットワーク(Artificial Neural Network, ANN)は、複雑な分類問題の解法である。
我々の考えは、入力オブジェクトの最小値に基づいて訓練された単純なANNモデルからシンボル表現を導出することである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:36:22 GMT)
Toward Safe and Responsible AI Agents: A Three-Pillar Model for Transparency, Accountability, and Trustworthiness [0.0] 本稿では,安全で信頼性の高いAIエージェントを開発し,運用するための概念的かつ運用的なフレームワークを提案する。
このフレームワークは、透明性、説明責任、信頼性を基礎とした三柱モデルに基づいている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:27:43 GMT)
The Limits of Lognormal: Assessing Cryptocurrency Volatility and VaR using Geometric Brownian Motion [0.0] この研究は、暗号通貨の微調整モデルリスク分析のための一連の研究の一部である。
従来の業界標準の幾何学的ブラウン運動(GBM)モデルを適用し,基礎的なベンチマークを確立する。
計算されたバリュー・アット・リスクは、1年間の地平線上の5%の信頼レベルにあります。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:14:16 GMT)
The Causal Effect of First-Time Academic Failure on University Dropout: Evidence from a Regression Discontinuity Design [0.0] 本研究は,初年度の学業失敗がその後の大学活動に与える影響を推定する。
従来の仮定とは対照的に, 実験結果から, 限界初回故障はその後の降雨確率の低下と関連していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:08:15 GMT)
Text Detoxification in isiXhosa and Yorùbá: A Cross-Lingual Machine Learning Approach for Low-Resource African Languages [0.0] Toxic Languageは、安全なオンライン参加のための大きな障壁の1つだが、アフリカ言語では堅牢な緩和ツールが不足している。
本研究は,2つの低資源アフリカ言語isiXhosaとYorbの自動テキストデトックス化(中和に有害な)について検討した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:28:58 GMT)
SyntaxMind at BLP-2025 Task 1: Leveraging Attention Fusion of CNN and GRU for Hate Speech Detection [0.0] 本稿では,BLP-2025 Task 1: Hate Speech Detectionで使用したシステムについて述べる。
提案手法は,GRUとCNNをベースとした複数の並列処理ブランチとBanglaBERT埋め込みを統合し,次に注意層と高密度層を用いて最終分類を行う。
提案システムでは,Subtask 1Aでは0.7345マイクロF1スコア(第2位),Subtask 1Bでは0.7317マイクロF1スコア(第5位)と高い競争性を示した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:54:54 GMT)
Sub-Planck structure quantification in non-Gaussian probability densities [0.0] 位相空間変数の非ガウス確率密度におけるサブプランク構造は、ボゾン量子系において広範である。
サブプランク構造を同定し、定量化し、比較するための、普遍的かつ実験的にフレンドリな方法を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:17:04 GMT)
Stuck in the Turing Matrix: Inauthenticity, Deception and the Social Life of AI [0.0] 生成AIの時代において、チューリングテストは人間が占める位置を記述する。
このエッセイは、社会生活の幅広い領域におけるAIに関するRedditの投稿データを利用する。
チューリングテストは、AGIや他のベンチマークの成果についてあまり教えてくれないかもしれないが、マトリックスにおける人間の生活の限界について、非常に多くのことを教えてくれる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:00:15 GMT)
Simplify-This: A Comparative Analysis of Prompt-Based and Fine-Tuned LLMs [0.0] 大規模言語モデル(LLM)は強力なテキスト生成を可能にし、一般的には微調整と迅速なエンジニアリングのトレードオフがある。
本稿では,エンコーダ-デコーダ LLM を用いたテキスト単純化のパラダイムを比較検討する Simplify-This を紹介する。
微調整されたモデルは、常により強い構造的単純化をもたらすが、プロンプトはしばしば高い意味的類似度スコアを得るが、入力をコピーする傾向がある。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 13:46:52 GMT)
Research Integrity and Academic Authority in the Age of Artificial Intelligence: From Discovery to Curation? [0.0] 人工知能は研究の組織と実践を変えつつある。
本稿は、これらの発展が研究の完全性に挑戦し、学術的権威の伝統的な基盤を損なうことを主張する。
技術フロンティアの企業研究所と競合するのではなく、大学は、容易に自動化または商業化できない役割を強化することで、正当性を維持することができる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:47:01 GMT)
Real-Time Image Processing Algorithms for Embedded Systems [0.0] 本研究では,組込みプロセッサに実装した画像処理アルゴリズム,特にエッジ検出,コーナー検出,ブロブ検出について検討する。
画像処理文献に記録されているレイテンシ、精度、消費電力に対処するため、最適化されたアルゴリズムアーキテクチャと量子化技術が採用されている。
この研究の進歩は、自動車、監視、ロボット分野におけるスケーラブルで安価な組込みイメージングシステムの実現を促進する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:58:26 GMT)
Quantum algorithm for dephasing of coupled systems: decoupling and IQP duality [0.0] 我々は、余分なアンシラを伴わないユニタリ量子チャネルをサンプリングすることにより、一様リンドブレディアン力学をシミュレートする量子アルゴリズムを提案する。
このアルゴリズムは一般のリンドブラディアンにも適用可能であることを示す。
入浴に結合した電子-フォノン系における非調和効果から自然に生じるフェミオンに結合したボゾンの模型をデファスで研究することで,我々のアプローチを実証する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 20:24:49 GMT)
Quantenlogische Systeme und Tensorproduktraeume [0.0] ジョージ・マッキーによって提供される量子論理公理系の直感的な構成を示す。
古典力学および量子力学から構成された物理系が、いかに論理的に記述されるべきかを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:49:11 GMT)
Putting green software principles into practice [0.0] パブリッククラウド上で稼働するライブ製品のためのグリーンソフトウェアへの旅について説明する。
特に、サーバーレスシステムのコスト効果を利用して効率を向上する実践的なソリューションについて論じる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:58:29 GMT)
Prophet as a Repro ducible Forecasting Framework: A Methodological Guide for Business and Financial Analytics [0.0] 本稿では,Metaが開発したオープンソースの予測フレームワークであるProphetについて検討する。
本研究は,新しいアルゴリズムを提案するのではなく,Prophetの付加構造,オープンソース実装,標準化されたワークフローが透過的で再現可能な予測プラクティスにどのように貢献するかを評価する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:43:28 GMT)
Performance Analysis of DCT, Hadamard, and PCA in Block-Based Image Compression [0.0] ブロックベースの画像圧縮は、信号エネルギーを少数の係数に集中させるために変換符号化に依存する。
古典コーデックは離散コサイン変換(DCT)のような固定変換を用いるが、主成分分析(PCA)のようなデータ駆動法はデコリレーションに理論的に最適である。
本稿では,DCT,Adamard,PCAを複数ブロックサイズおよび圧縮速度で比較した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:39:21 GMT)
Peek2: A Regex-free implementation of pretokenizers for Byte-level BPE [0.0] Peek2は、GPT-3、LLaMa-3、Qwen-2.5で使用されるcl100kのようなプリトケナイザーの代替品である。
ByteレベルのBPEエンコーディングプロセス全体にわたって、全体的なスループットが改善される。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:05:09 GMT)
Pattern formation in driven condensates [0.0] 均質媒質から自発的なパターン形成は、古典力学系における流体力学的不安定性のよく理解された例の1つである。
原子ガスのBECは超流動性のような多体量子現象を研究するのに理想的なプラットフォームである。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:49:56 GMT)
Optimally driving multi-photon transitions in the perturbative single-mode regime [0.0] 入射光場によって誘導される物質中の$m$-光子遷移の速度は、場の$m$2次コヒーレンス関数に依存する。
ここでは、制限された最大光子数で、弱い固定強度、狭帯域入射光場の最適状態を決定する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:32:06 GMT)
On the robustness of Quantum Phase Estimation to compute ground properties of many-electron systems [0.0] 本稿では,電子システムに適用された量子位相推定(QPE)アルゴリズムについて,その自由パラメータを解析して解析する。
これらのパラメータの深い理解は、予測計算化学や物質科学に適用されるQPEのさらなる自動化への道を開くために不可欠である。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 13:27:07 GMT)
Navigating the Sociotechnical Imaginaries of Brazilian Tech Workers [0.0] この章は、デジタル労働研究でしばしば見過ごされるブラジルの技術労働者の社会技術的想像力について考察する。
グローバル・サウスから見ることは、データの普遍性と、局所的な位置する値、制約、未来への挑戦に役立つ、と論じている。
この調査結果は、アルゴリズムバイアスに関する学術と産業の議論、ユーザーの損害と監視に関する企業説明責任の限界、そしてデジタル主権の意味の争点について、繰り返し緊張関係を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:30:04 GMT)
Multi-modal MRI-Based Alzheimer's Disease Diagnosis with Transformer-based Image Synthesis and Transfer Learning [0.0] アルツハイマー病(英語: Alzheimer's disease, AD)は、進行性神経変性疾患であり、臨床症状の発症より何年も前から病理学的変化が始まっている。
T1w MRIから直接FAおよびMDマップを予測する3DトランスUNet画像合成フレームワークを提案する。
私のモデルは高忠実度マップを生成し、構造類似度指数(SSIM)が0.93を超え、ピアーソン相関が強い(>0.94)。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:26:38 GMT)
Multi-Agent Framework for Controllable and Protected Generative Content Creation: Addressing Copyright and Provenance in AI-Generated Media [0.0] 現在の生成モデルは「ブラックボックス」として機能し、ユーザコントロールが制限され、知的財産権やトレースコンテンツの起源を保護するための内蔵機構が欠如している。
本稿では,これらの課題に対処する新しいマルチエージェントフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:29:20 GMT)
Motion Compensation for Real Time Ultrasound Scanning in Robotically Assisted Prostate Biopsy Procedures [0.0] 前立腺の平均スキャン時間は30秒で,前立腺の平均3D再構成は3秒であった。
前立腺ファントムの弾性および軟質材料特性により,最大ロボット追尾誤差は3mmであった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:30:55 GMT)
Looking for Work in Quantum Thermodynamics [0.0] 量子ワークの普遍的な測定スキームは、2つの直観的で古典的に回復力のあるデシダーを満たすものはない。
古典的な特徴をすべて保存できる単一の量子ワークは存在しないようだ。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 21:02:13 GMT)
LookAroundNet: Extending Temporal Context with Transformers for Clinically Viable EEG Seizure Detection [0.0] LookAroundNetは、脳波データのより広い時間的ウィンドウを使用して発作活動をモデル化するトランスフォーマーベースの発作検出装置である。
様々な臨床環境にまたがる複数の脳波データセットについて,提案手法の評価を行った。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:52:24 GMT)
LOTUS: Layer-ordered Temporally Unified Schedules For Quantum Approximate Optimization Algorithms [0.0] LOTUSは、高次元カオス探索から低次元力学系へQAOAを再構成するフレームワークである。
提案手法は計算コストを大幅に削減し,パウエル法やSLSQP法よりも90%以上削減できる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:53:26 GMT)
Intelligent Singularity Avoidance in UR10 Robotic Arm Path Planning Using Hybrid Fuzzy Logic and Reinforcement Learning [0.0] 提案システムは、特異点が制御の喪失と潜在的な機器損傷を引き起こすロボット操作において重要な課題に対処する。
我々のハイブリッドアプローチは,操作性測定,条件数解析,ファジィ論理決定を用いたリアルタイム特異点検出と適応経路計画のための安定的な強化学習フレームワークを組み合わせる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:10:23 GMT)
Improving quantum interference visibility between independent sources by enhancing the purity of correlated photon pairs [0.0] The two approach to enhance the purity of photon pairs generated from a type-0 PPLN waveguide。
どちらの手法も、香港・ウー・マンデル干渉の可視性は約80%向上した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:41:52 GMT)
Hybrid Secure Routing in Mobile Ad-hoc Networks (MANETSs) [0.0] 本稿では、ルーティング操作のセキュリティと堅牢性を高めるHybrid Secure Routing Protocol(HSRP)を紹介する。
HSRPは、プロアクティブなルーティング戦略とリアクティブなルーティング戦略の両方の長所を組み合わせることで、進化するネットワーク条件に動的に適応することができる。
軍事行動や災害対応などの重要な領域での利用により、この研究は、MANETにおける安全なルーティングのためのスケーラブルで実用的なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:04:28 GMT)
Hippocampal Atrophy Patterns Across the Alzheimer's Disease Spectrum: A Voxel-Based Morphometry Analysis [0.0] アルツハイマー病(AD)と軽度認知障害(MCI)は進行性灰白質障害と関連している。
本研究では, CAT12/SPM12vooxel-based morphometryを, 249人のADNI被験者のMRIのベースラインT1強調画像に応用した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 02:57:38 GMT)
Harnessing Environmental Memory with Reinforcement Learning in Open Quantum Systems [0.0] オープン量子系における非マルコフ記憶効果は、コヒーレンスを保ち、制御性を高めるための貴重な資源を提供する。
本稿では,2段階駆動システムにおける情報バックフローを自律的に増幅する強化学習フレームワークを提案する。
その結果、長期のモデルなし学習が分散バックフロー戦略をいかに自然に発見するかが示される。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:46:57 GMT)
Generation of squeezed optical states via stored classical pulses in a Bose gas [0.0] 古典的なプローブパルスをBose-Einstein Condensate (BEC)に格納することで、圧縮光を生成する手法を解析する。
$$タイプの光メモリインタフェースは、選択した時間プローブモードを単一の位相マッチングされた集合スピン波にマッピングする。
貯蔵中の衝突相互作用は1軸回転動力学を実装し、原子アンサンブル内でスピンスクイーズを生成する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:26:45 GMT)
Gender Bias in LLMs: Preliminary Evidence from Shared Parenting Scenario in Czech Family Law [0.0] 本研究では,先行するLarge Language Models (LLM) が,現実的な家族法シナリオに対する性別バイアスを示すか否かを検討する。
チェコの家族法に基づく専門的な離婚シナリオを提示し、最先端のLPMであるGPT-5 nano、Claude Haiku 4.5、Gemini 2.5 Flash、Llama 3.3の4つを評価した。
予備的な結果は、モデル間の差異を強調し、いくつかのシステムによって生成された結果における性別に依存したパターンを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 15:55:03 GMT)
Future-as-Label: Scalable Supervision from Real-World Outcomes [0.0] 我々は、時間的に解決された実世界の予測に、検証可能な報酬で強化学習を拡張した。
我々は、因果的にマスキングされた情報の下で確率予測を行うために言語モデルを訓練する。
スーパービジョンは、解決後の結果のみから導かれる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:15:12 GMT)
Fusion Matters: Length-Aware Analysis of Positional-Encoding Fusion in Transformers [0.0] 核融合機構自体が性能に影響を及ぼすか,特に時系列設定において検討する。
実験により、融合選択は短いテキストに無視できる影響を持つが、長い文書に一貫した利益をもたらすことが示された。
この結果から, 位置エンコード融合は長周期変換器の非自明な選択であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:25:31 GMT)
From Superradiance to Superabsorption: An Exact Treatment of Non-Markovian Cooperative Radiation [0.0] 損失共振器空洞に結合した2レベル原子のアンサンブルにおける協調放射現象の出現について検討した。
本結果より, 標準超放射能バーストを示すマルコフ相, 自発超吸収を特徴とする非マルコフ相, パルス集合放出を特徴とする臨界状態の3つが明らかとなった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:16:11 GMT)
FlyPose: Towards Robust Human Pose Estimation From Aerial Views [0.0] 航空画像のための軽量なトップダウン人間のポーズ推定パイプラインであるFlyPoseを訓練し、デプロイする。
我々は,Manipal-UAV,VisDrone,HIT-UAV,および我々のカスタムデータセットを用いて,人物検出における平均6.8mAPの改善を実現した。
FlyPoseは、Jetson Orin AGX Developer Kitでの事前処理を含む、20ミリ秒の推論遅延で動作する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:01:36 GMT)
EyeTheia: A Lightweight and Accessible Eye-Tracking Toolbox [0.0] EyeTheiaは、Webカメラによる視線推定のための軽量でオープンなディープラーニングパイプラインである。
標準のラップトップウェブカメラのみを使用してリアルタイムの視線追跡を可能にする。
MediaPipeベースのランドマーク抽出と、iTrackerにインスパイアされた畳み込みニューラルネットワークと、オプションのユーザ固有の微調整を組み合わせたものだ。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 19:49:01 GMT)
EvoQRE: Modeling Bounded Rationality in Safety-Critical Traffic Simulation via Evolutionary Quantal Response Equilibrium [0.0] EvoQREは、安全クリティカルなトラフィックインタラクションをモデル化するための原則化されたフレームワークである。
事前学習された生成世界モデルとエントロピー規則化された複製子ダイナミクスを統合する。
最先端の現実主義、安全基準の改善、多様な安全クリティカルシナリオの制御可能な生成を実現している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 09:21:36 GMT)
Emergence of the 2nd Law in an Exactly Solvable Model of a Quantum Wire [0.0] 量子ワイヤにおけるジュール加熱によるエントロピー生成は自動的には発生しないことを示す。
本研究では, 熱電プローブの連成による多数の局所測定の限界において, 期待エントロピー生成が実現されていることを示す。
局所測定によって導入された非弾性過程によるデコヒーレンスは, ジュール加熱によるエントロピー生成現象に不可欠である。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 03:56:54 GMT)
Dynamical entanglement percolation with spatially correlated disorder [0.0] それぞれのエッジが独立な2量子相互作用に対応する量子ビットネットワークのダイナミクスについて検討する。
単体進化と空間的相関性障害の相互作用が,非標準パーコレーションエノロジーに繋がることを示す。
相図が数値シミュレーションと平均場理論によって決定される2色相関結合パーコレーションモデルにより、この現象の背後にある物理が完全に解明される。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:38:25 GMT)
Domain-Specific Self-Supervised Pre-training for Agricultural Disease Classification: A Hierarchical Vision Transformer Study [0.0] ドメイン固有の自己指導型事前学習が階層型視覚変換器を用いた農業病の分類に及ぼす影響について検討した。
鍵となる発見は、わずか3,000のラベルのない農業用画像でSimCLRの事前トレーニングが、+4.57%の精度向上をもたらすことである。
Swin-Base の収率 +4.08% に対して同じ事前トレーニングを ViT-Base +4.20% に適用する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 12:35:52 GMT)
Deepfake detectors are DUMB: A benchmark to assess adversarial training robustness under transferability constraints [0.0] DUMB -- データセットのsoUrces、モデルアーキテクチャと Balance - と DUMBer メソッドを拡張して、ディープフェイク検出を行います。
我々は、転送可能性制約およびデータセット構成の下での敵攻撃に対するロバストネス検出器の評価を行った。
実験により, 対人訓練戦略は, 流通事例の堅牢性を高めるが, 採用戦略によっては, クロスデータセット構成下での分解も可能であることが示された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 18:06:19 GMT)
DNATokenizer: A GPU-First Byte-to-Identifier Tokenizer for High-Throughput DNA Language Models [0.0] DNATokはGPUファーストのトークン化システムで、汎用文字列処理をバイトルックアップテーブル(LUT)ベースの識別子ストリーミングと、重複したホスト・ツー・デバイス(H2D)/計算パイプラインに置き換える。
DNATokは最適化されたHugging Faceベースラインよりも84-95倍高いエンコーディングスループットを実現し、最大1.9倍高いH2Dスループットを実現している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:08:17 GMT)
Counterdiabatic ADAPT-VQE for molecular simulation [0.0] 本稿では,ADAPT-VQEフレームワークと逆断熱駆動を統合したハイブリッド手法を提案する。
本研究は,フェミオン励起演算子を用いた反断熱アルゴリズムやADAPT-VQEを用いた場合と比較して,回路深さの向上と回路深さの低減効果を示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:46:12 GMT)
Chaos, thermalization and breakdown of quantum-classical correspondence in a collective many-body system [0.0] 完全連結Bose-Hubbardモデルにおける熱化と量子古典対応について検討する。
この結果から, 集合多体力学において, 古典的極限への予期せぬ収束が遅く, 頑健な有限サイズ効果を示すことが明らかとなった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:33:38 GMT)
Cedalion Tutorial: A Python-based framework for comprehensive analysis of multimodal fNIRS & DOT from the lab to the everyday world [0.0] Cedalionは、fNIRSとDOTデータのモデルベースおよびデータ駆動分析を統合するために設計されたPythonベースのフレームワークである。
SNIRFとBIDS標準をサポートし、クラウドで実行可能なJupyterノートブックをサポートし、コンテナ化された分析パイプラインを提供する。
信号品質評価、運動補正、GLMモデリング、再構成のための検証済みアルゴリズムを実装し、シミュレーション、データ拡張、マルチモーダル生理学解析のモジュールによって補完される。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:37:48 GMT)
Can large language models interpret unstructured chat data on dynamic group decision-making processes? Evidence on joint destination choice [0.0] 本研究では,グループチャットから意思決定プロセスの解釈において,人間のアノテーションを自動補完する大規模言語モデルの可能性を評価する。
我々は知識獲得プロセスにインスパイアされたプロンプトフレームワークを設計し、重要な意思決定要因を逐次抽出した。
結果は、LLMが明確な決定要因を確実に捉える一方で、人間のアノテータが容易に識別できる暗黙の要因を特定するのに苦労していることを示している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 07:08:49 GMT)
CTHA: Constrained Temporal Hierarchical Architecture for Stable Multi-Agent LLM Systems [0.0] マルチスケールエージェントアーキテクチャは、異なる認知層を持つ時間階層を導入することで、ユビキタスなシングルループパラダイムを拡張した。
本稿では,協調的意思決定を確実にするための原則的調停機構を取り入れつつ,協調安定性を回復するための制約付き時間階層アーキテクチャ(CTHA)を提案する。
CTHAは大規模なタスク実行に有効であり、障害カスケードを47%削減し、サンプル効率を2.3倍改善した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 08:03:14 GMT)
Bug Severity Prediction in Software Projects Using Supervised Machine Learning Models [0.0] 本研究では、教師付き機械学習アルゴリズムに基づいて、バグ重大度レベルの予測を行う異なる分類器の比較を行う。
精度,精度,リコール,F1スコア,AUC-ROC,混乱行列で評価した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:06:43 GMT)
Bridging the Linear-Quadratic Gap: A Quantum-Classical Hybrid Approach to Robust Supply Chain Design [0.0] 量子インスパイアされた最適化法は、いわゆるリニア・クアドラティックギャップ現象を解くことができることを示す。
量子インスパイアされた最適化法は、いわゆるリニア・クアドラティックギャップ現象を解くことができることを示した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 10:41:27 GMT)
Breaking the Exponential: Decoherence-Driven Power-Law Spontaneous Emission in Waveguide Quantum Electrodynamics [0.0] デファスティングがないと、エミッターは従来型の指数関数的崩壊を示し、その後に長時間のパワーローテールを呈する。
厳密に言えば、デファス化が導入されたとき、強靭なパワーローの崩壊は、既に短時間で発生している。
その結果、導波路QEDプラットフォームにおける非指数的自然放出のための新規なデコヒーレンス誘導機構が明らかにされた。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:04:22 GMT)
Blockchain Verifiable Proof of Quantum Supremacy as a Trigger for Quantum-Secure Signatures [0.0] 分散台帳技術は、暗号化技術による透明性、セキュリティ、不変性を保証する。
しかし、量子コンピューティングの進歩は古典的な暗号方式のセキュリティを脅かしている。
このマイルストーンは、既存のセキュリティ標準を脆弱にし、ブロックチェーン資産を不正と盗難に晒すことになる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 05:20:02 GMT)
Block Encoding Linear Combinations of Pauli Strings Using the Stabilizer Formalism [0.0] パウリ弦の線形結合を符号化する量子回路を構築するための新しい手法を提案する。
本手法の回路複雑性をLCU(Linear Combination of Unitary)手法と比較するために,具体的な例を4つ提示し,数値シミュレーションを用いた。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 11:41:46 GMT)
Bipartitioning of Graph States for Distributed Measurement-Based Quantum Computing [0.0] 測定ベースの量子コンピューティング(MBQC)は本質的に分散量子コンピューティング(DQC)に適している
異なる量子処理ユニット(QPU)に作用する非局所ゲートはボトルネックである。
提案手法は,分散MBQCにおけるキュービット割り当てをグリッドグラフ上でテストすることで決定する上で極めて有効であることを示す。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 22:08:49 GMT)
Bias Detection and Rotation-Robustness Mitigation in Vision-Language Models and Generative Image Models [0.0] VLM(Vision-Language Models)と生成画像モデル(Generative Image Models)は、マルチモーダルタスクにおいて顕著なパフォーマンスを実現している。
本研究では、最先端のビジョン言語および生成モデルにおけるバイアス伝搬とロバスト性について検討する。
本稿では,データ拡張,表現アライメント,モデルレベルの正規化を併用した回転ロバスト緩和戦略を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:36:11 GMT)
Below-threshold error reduction in single photons through photon distillation [0.0] 光子蒸留は内在的にボソニックでコヒーレントな誤差緩和技術であり、量子干渉を利用して単一の光子を純化された内部状態に射出する。
蒸留ゲートによるノイズを考慮した場合においても, 理論的予測と一致した非条件誤差の低減を観察する。
我々は、大規模な量子コンピュータで光子蒸留が使われることを期待している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:04:56 GMT)
Auxiliary-predicted Compress Memory Model(ApCM Model): A Neural Memory Storage Model Based on Invertible Compression and Learnable Prediction [0.0] 大規模言語モデル(LLM)は一般的に、効率的な実行時メモリ機構を欠いている。
本稿では,ApCMモデル(Auxiliary Prediction Compression Memory Model)を提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 06:23:42 GMT)
Agentic AI Microservice Framework for Deepfake and Document Fraud Detection in KYC Pipelines [0.0] 合成メディア、プレゼンテーション攻撃、文書偽造は、Know Your Customer (KYC)に重大な脆弱性を生み出している。
本稿では,視覚モデル,ライブネスアセスメント,ディープフェイク検出,OCRベースの文書鑑定,マルチモーダルIDリンク,ポリシ駆動型リスクエンジンを統合したエージェントAIマイクロサービスフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:01:40 GMT)
Accelerating Monte-Carlo Tree Search with Optimized Posterior Policies [0.0] RMCTSは、単一のルート状態の探索において、MCTS-UCBの40倍以上高速である。
RMCTSトレーニングネットワークは,トレーニング時間の約3分の1で,MCTSトレーニングネットワークの品質と一致していることがわかった。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:07:13 GMT)
A survey of facial recognition techniques [0.0] 本稿では,隠れマルコフモデル,主成分分析(PCA),弾性クラスタスロットマッチング,サポートベクトルマシン(SVM),ガボルウェーブ,人工ニューラルネットワーク(ANN),固有顔,独立成分分析(ICA)など,最も洗練された顔検出手法について述べる。
また,JAFEE,FEI,Yale,LFW,AT&T(当時はORL),AR(Martinez,Benavente)などの顔データベースの画像も分析した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 16:24:44 GMT)
A brief note on learning problem with global perspectives [0.0] 本稿では,動的最適化プリンシパルエージェント設定による学習の問題点について考察する。
本稿では,この抽象的プリンシパル・エージェント学習フレームワークの背後にある学習過程を特徴付けるために必要となる,一貫性のある数学的議論について述べる。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 00:20:36 GMT)
A Framework for Low-Latency, LLM-driven Multimodal Interaction on the Pepper Robot [0.0] 我々はPepperロボットのためのオープンソースのAndroidフレームワークを提案する。
エンドツーエンド音声合成(S2S)モデルを統合し,低レイテンシインタラクションを実現する。
我々は,大規模言語モデルをエージェントプランナに高める機能拡張を実装した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:33:38 GMT)
A Dual Pipeline Machine Learning Framework for Automated Multi Class Sleep Disorder Screening Using Hybrid Resampling and Ensemble Learning [0.0] 本論文では、睡眠状態と生活スタイルのデータセットを用いた多クラス睡眠障害スクリーニングのためのデュアルパイプライン機械学習フレームワークを提案する。
実験では、Extra TreesとK Nearest Neighborsが98.67%の精度を達成した。
提案したデュアルパイプライン設計は,非侵襲的睡眠障害リスク階層化のための高精度かつ効率的な自動スクリーニングをサポートすることが示唆された。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 14:43:32 GMT)
A Critical Examination of Active Learning Workflows in Materials Science [0.0] アクティブラーニング(AL)は材料科学において重要な役割を担い、原子論シミュレーションのための機械学習の原子間ポテンシャルの構築や、自動運転研究所の運営などの応用を可能にしている。
広く使われているにもかかわらず、ALの信頼性と有効性は、体系的に調査されることが稀な暗黙の設計仮定に依存している。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 17:01:56 GMT)
A Critical Analysis of the Medibank Health Data Breach and Differential Privacy Solutions [0.0] 2022年のメディバンクの医療保険データ漏洩により、970万人の機密医療記録が流出した。
本稿では,Laplace と Gaussian のメカニズムを適応的な予算配分と統合した,エントロピー対応の微分プライバシーフレームワークを提案する。
その結果、分析ユーティリティ損失を24%以下に抑えながら、再識別確率を90.3%削減した。
論文参考訳(メタデータ) (Fri, 09 Jan 2026 01:46:36 GMT)