Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation [192.5] 高リソースデータによる学習は人工知能(AI)において大きな成功を収めた
しかし、データアノテーションやモデルトレーニングに関連するコストは依然として大きい。
本調査では,低リソースデータからの学習に伴う一般化誤差とラベル複雑性を分析するために,アクティブサンプリング理論を用いた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:15:42 GMT)
MRMR: A Realistic and Expert-Level Multidisciplinary Benchmark for Reasoning-Intensive Multimodal Retrieval [87.2] MRMRは,集中的推論を必要とする,最初のエキスパートレベルのマルチディシプリナマルチモーダル検索ベンチマークである。
さまざまな専門分野にわたる検索システムに挑戦し、ドメイン間のきめ細かいモデル比較を可能にする。
クエリは推論集約的であり、画像は顕微鏡スライドの診断などの深い解釈を必要とする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:14:56 GMT)
SVTime: Small Time Series Forecasting Models Informed by "Physics" of Large Vision Model Forecasters [86.4] 動的Webコンテンツを分析するには時系列AIが不可欠だ。
エネルギー集約的なトレーニング、推論、ハードウェアの要求を考えると、大きなモデルを1フィットのソリューションとして使うと、二酸化炭素のフットプリントと持続可能性に対する深刻な懸念が浮かび上がっています。
本稿では、長期時系列予測(LTSF)のための大型ビジョンモデル(LVM)予測器にインスパイアされた新しい小型モデルSVTimeを紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:42:23 GMT)
Search-Based Credit Assignment for Offline Preference-Based Reinforcement Learning [83.6] 本稿では,2つのフィードバックソースを統一する検索ベースPreference Weightingスキームを提案する。
選好ラベル付き軌道における各遷移について、SPWは専門家のデモンストレーションから最もよく似た状態-作用対を探索する。
これらの重みは標準の嗜好学習をガイドするために使われ、より正確なクレジット割り当てを可能にします。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:54:40 GMT)
Autonomous Agents for Scientific Discovery: Orchestrating Scientists, Language, Code, and Physics [82.6] 大規模言語モデル(LLM)は、人間の科学者、自然言語、コンピュータ言語とコード、物理学との相互作用を編成する柔軟性と汎用性を備えたフレームワークを提供する。
本稿では, LLMを基盤とした科学エージェントの展望と展望と, 科学発見のライフサイクルを変革する上でのその役割について述べる。
オープンな研究課題を特定し、より堅牢で汎用的で適応的な科学エージェントを構築するための有望な方向性を概説する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:26:26 GMT)
Mind-Paced Speaking: A Dual-Brain Approach to Real-Time Reasoning in Spoken Language Models [82.0] 我々は、高忠実でリアルタイムな推論を可能にする脳に触発されたフレームワークであるMind-Paced Talk(MPS)を紹介する。
MPSは「フォーミュレーション・ブレイン(Formulation Brain)」をハイレベルな推論に使用し、流れのある音声生成のために別個の「アーティキュレーション・ブレイン(Articulation Brain)」を誘導する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:50:59 GMT)
Diagonal Artifacts in Samsung Images: PRNU Challenges and Solutions [81.6] サムスンのスマートフォンが撮影した画像に写っている斜めのアーティファクト。
まず、一部のGalaxy Sシリーズが指紋の衝突を引き起こす共通のパターンを共有していることを示します。
Proモードを生のキャプチャでサポートするデバイスでは,信頼性の高いPRNU検証が引き続き実現可能であることを実証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:14:29 GMT)
Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols [80.7] プロトコルとモニタモデルを知っている信頼できないモデルによるアダプティブアタックについて検討する。
我々は、攻撃者がモデル出力に公知またはゼロショットプロンプトインジェクションを埋め込む単純な適応攻撃ベクトルをインスタンス化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:12:44 GMT)
Stable Video Infinity: Infinite-Length Video Generation with Error Recycling [76.9] 本研究では、高時間一貫性、可視的シーン遷移、制御可能なストリーミングストーリーラインを有する無限長ビデオを生成することができる安定ビデオインフィニティ(SVI)を提案する。
SVIにはError-Recycling Fine-Tuningが組み込まれており、これはDiffusion Transformerの自己生成エラーをスーパーバイザのプロンプトにリサイクルする、新しいタイプの効率的なトレーニングである。
我々は、一貫性、創造性、条件設定を含む3つのベンチマークでSVIを評価し、その汎用性と最先端の役割を徹底的に検証した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:45:46 GMT)
RetouchLLM: Training-free Code-based Image Retouching with Vision Language Models [76.8] トレーニング不要なホワイトボックス画像リタッチシステムであるRetouchLLMを提案する。
高解像度の画像に直接、解釈可能でコードベースのリタッチを実行する。
我々のフレームワークは、人間がマルチステップのリタッチを行う方法と同じような方法で、徐々に画像を強化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:25:44 GMT)
AnyEdit: Edit Any Knowledge Encoded in Language Models [76.3] 大規模言語モデル(LLM)のための新しい自動回帰編集パラダイムであるAnyEditを提案する。
長い形式の知識を逐次チャンクに分解し、各チャンク内のキートークンを反復的に編集し、一貫性と正確な出力を保証する。
UnKEBench、AKEW、そして我々の長文の多様な知識のための新しいEditEverythingデータセットを含むベンチマークでは、強いベースラインを21.5%上回っている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:17:50 GMT)
Building a Foundational Guardrail for General Agentic Systems via Synthetic Data [76.2] LLMエージェントは、計画段階で介入するマルチステップタスクを計画できる。
既存のガードレールは主にポスト・エグゼクティブ(英語版)を運用しており、スケーリングが困難であり、計画レベルで制御可能な監督を行う余地がほとんどない。
我々は、良性軌道を合成し、カテゴリーラベル付きリスクを困難に注入し、自動報酬モデルを介して出力をフィルタリングする制御可能なエンジンであるAuraGenを紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:42:32 GMT)
VITA-VLA: Efficiently Teaching Vision-Language Models to Act via Action Expert Distillation [76.1] VLA(Vision-Language Action)モデルは、事前訓練された視覚言語モデル(VLM)の強い知覚能力を活用することにより、ロボット操作を著しく向上させる。
本稿では,VLMに事前訓練された小規模な行動モデルから知識を伝達することで,動作実行能力を持たせる,簡易かつ効果的な蒸留ベースフレームワークを提案する。
5つの操作課題にわたる実世界の実験において,本手法は教師モデルより一貫して優れ,82.0%の成功率(17%改善)を達成した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:59:56 GMT)
Accelerated Evolving Set Processes for Local PageRank Computation [75.5] この研究は、パーソナライズされたPageRank計算を高速化するために、ネストした進化したセットプロセスに基づく新しいフレームワークを提案する。
このような局所化手法の時間複雑性は、PPRベクトルの$epsilon$-approximationを得るために$mintildemathcalO(R2/epsilon2), tildemathcalO(m)$によって上界となることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:02:52 GMT)
Learning Robust Diffusion Models from Imprecise Supervision [75.5] DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:42:20 GMT)
The Attacker Moves Second: Stronger Adaptive Attacks Bypass Defenses Against Llm Jailbreaks and Prompt Injections [74.6] 現在のジェイルブレイクとプロンプトインジェクションに対する防御は、通常、有害な攻撃文字列の静的セットに対して評価される。
我々は,この評価プロセスに欠陥があることを論じる。代わりに,攻撃戦略を明示的に修正したアダプティブアタッカーに対する防御を,防衛設計に対抗して評価すべきである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:51:04 GMT)
G$^2$RPO: Granular GRPO for Precise Reward in Flow Models [74.2] 本稿では,サンプリング方向の高精度かつ包括的な報酬評価を実現する新しいグラニュラー-GRPO(G$2$RPO)フレームワークを提案する。
複数の拡散スケールで計算された利点を集約するマルチグラニュラリティ・アドバンテージ・インテグレーション・モジュールを導入する。
G$2$RPOは既存のフローベースGRPOベースラインを著しく上回る。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:40:51 GMT)
Incentivizing Time-Aware Fairness in Data Sharing [73.8] 協調的なデータ共有と機械学習では、複数のパーティがデータリソースを集約して、よりよいパフォーマンスで機械学習モデルをトレーニングする。
既存のフレームワークでは、すべての関係者が同時にコラボレーションに参加すると仮定しています。
我々は、新しいタイムアウェアインセンティブを含む、公正でタイムアウェアなデータ共有フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:29:32 GMT)
MaP: A Unified Framework for Reliable Evaluation of Pre-training Dynamics [72.0] 大規模言語モデルの不安定性評価プロセスは、真の学習力学を曖昧にする。
textbfMaPは、アンダーラインMergingアンダーラインとアンダーラインPass@kメトリックを統合するフレームワークです。
実験により、MaPはよりスムーズな性能曲線を示し、ラン間分散を低減し、より一貫性のあるランキングを保証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:40:27 GMT)
UltraSeP: Sequence-aware Pre-training for Echocardiography Probe Movement Guidance [70.9] 本稿では,高品質な標準平面画像取得のためのプローブポーズ調整によるロボットシステムや初心者の誘導に応用可能な,新しいプローブ移動誘導アルゴリズムを提案する。
本研究では, マスクアウト画像の特徴とプローブ動作をスキャンシーケンスで予測することにより, パーソナライズされた3次元心構造の特徴を学習する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:29:46 GMT)
Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [70.0] 機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。
PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。
次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:32:30 GMT)
Towards Sequence Modeling Alignment between Tokenizer and Autoregressive Model [69.8] AliTokはトークンシーケンスの依存性構造を変更する新しいアラインド・トークンライザである。
AliTokは177Mパラメータしか持たない標準的なデコーダのみの自己回帰モデルで、ImageNet-256ベンチマークで1.44のgFIDと319.5のISを達成している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:20:43 GMT)
LLM Unlearning on Noisy Forget Sets: A Study of Incomplete, Rewritten, and Watermarked Data [69.5] 大規模言語モデル(LLM)は、顕著な生成能力を示すが、機密データを記憶することで倫理的およびセキュリティ上の懸念を引き起こす。
この研究は、ノイズのある忘れセットと呼ばれる、摂動的または低忠実な忘れデータの下での未学習に関する最初の研究を提示する。
コアセマンティック信号が保存されている場合、未学習は摂動に対して驚くほど堅牢である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:10:49 GMT)
Unified Multimodal Model as Auto-Encoder [69.4] 本稿では,テキストに画像を圧縮するエンコーダ(I2T)と,そのテキストから画像を再構成するデコーダ(T2I)の理解に関するパラダイムを紹介する。
我々の経験的結果は、理解は生成を大幅に促進し(GenEvalで検証されている)、生成は、特にきめ細かい視覚知覚を強化することを示唆している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:54:16 GMT)
Solving Inverse Problems with FLAIR [68.9] 本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:14:03 GMT)
Don't Throw Away Your Pretrained Model [68.6] 私たちは、モデルコラボレーションを通じて両方の世界を最大限に活用することを目指しています。
そこで我々は,事前訓練されたモデルバージョンが,応答シーケンスで「話し方」を交互に行うスイッチ生成を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:12:20 GMT)
Medchain: Bridging the Gap Between LLM Agents and Clinical Practice with Interactive Sequence [68.1] 臨床ワークフローの5つの重要な段階をカバーする12,163の臨床症例のデータセットであるMedChainを提示する。
フィードバック機構とMCase-RAGモジュールを統合したAIシステムであるMedChain-Agentも提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:35:02 GMT)
Multi-Scale Finetuning for Encoder-based Time Series Foundation Models [68.0] 時系列基礎モデル (TSFM) は, 時系列予測において印象的なゼロショット性能を示す。
直感的な微調整はパフォーマンスの向上をもたらすが、TSFMの能力を完全に活用するには不十分である、と我々は主張する。
マルチスケール・ファインタニング(MSFT)は,マルチスケール・モデリングをファインタニング・プロセスに明示的に統合する,シンプルながら汎用的なフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:32:07 GMT)
BLINK-Twice: You see, but do you observe? A Reasoning Benchmark on Visual Perception [67.9] 我々は視覚中心の推論ベンチマークであるBLINK-Twiceを紹介した。
外部の知識に頼るのではなく、私たちのタスクは視覚的コンテンツのみから推論するモデルを必要とします。
事前の知覚ベンチマークと比較すると、浅い知覚を超越し、きめ細かい観察と分析的推論を必要とする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:14:13 GMT)
Spotlight on Token Perception for Multimodal Reinforcement Learning [66.0] RLVR(Reinforcement Learning with Verifiable Rewards)は、LVLM(Large Vision-Language Models)の推論能力を向上した。
本稿では,トークン認識の新しい視点を通して,マルチモーダルRLVRの先駆的な探索を行う。
本稿では、トークン認識を明示的に活用して学習信号を洗練する新しいポリシー勾配アルゴリズムである視覚知覚政策最適化(VPPO)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:25:33 GMT)
How Memory Management Impacts LLM Agents: An Empirical Study of Experience-Following Behavior [65.7] メモリは、大きな言語モデル(LLM)ベースのエージェントにおいて重要なコンポーネントである。
本稿では,メモリ管理の選択がLLMエージェントの行動,特に長期的パフォーマンスに与える影響について検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:27:30 GMT)
Multimodal Prompt Optimization: Why Not Leverage Multiple Modalities for MLLMs [65.5] そこで本研究では,非テクスチャプロンプトのペアによって定義されるマルチモーダル空間にプロンプトの事前定義を拡張した,マルチモーダルプロンプト最適化の新たな問題を提案する。
MLLMの潜在的な可能性を実現するための重要なステップとして,マルチモーダルプロンプト最適化を確立する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:41:25 GMT)
VisRAG 2.0: Evidence-Guided Multi-Image Reasoning in Visual Retrieval-Augmented Generation [64.8] 視覚検索強化世代(VRAG)は視覚言語モデル(VLM)を外的視覚知識で拡張し、基礎推論を行い幻覚を減らす。
しかし、現在のVRAGシステムは、複数の画像に対して確実な認識と証拠の統合に失敗し、根拠の弱さと誤った結論に繋がることが多い。
EVisRAGは,エビデンス誘導型マルチイメージで推論を学習し,この問題に対処するエンド・ツー・エンドのフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:34:23 GMT)
System Prompt Optimization with Meta-Learning [64.7] 本稿では,多様なユーザプロンプトに対して堅牢なシステムプロンプトを設計することを目的とした,バイレベルシステムプロンプト最適化の新たな課題を紹介する。
本稿では,複数のデータセットにまたがるさまざまなユーザプロンプトに対して最適化することで,システムプロンプトをメタラーニングするメタラーニングフレームワークを提案する。
5つの異なるドメインにまたがる14の未知のデータセットに対して実験を行い、このアプローチが多様なユーザプロンプトに効果的に一般化するシステムプロンプトを生成することを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:56:06 GMT)
Fundamentals of Building Autonomous LLM Agents [64.4] 本稿では,大規模言語モデル(LLM)を用いたエージェントのアーキテクチャと実装手法について概説する。
この研究は、複雑なタスクを自動化し、人間の能力でパフォーマンスのギャップを埋めることのできる「アジェンティック」なLLMを開発するためのパターンを探求することを目的としている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:32:39 GMT)
Rate optimal learning of equilibria from data [63.1] マルチエージェント・イミテーション・ラーニング(MAIL)における理論的ギャップは,非対話的MAILの限界を特徴づけ,ほぼ最適なサンプル複雑性を持つ最初の対話的アルゴリズムを提示することによって解決する。
インタラクティブな設定では、報酬のない強化学習と対話型MAILを組み合わせたフレームワークを導入し、それをMAIL-WARMというアルゴリズムでインスタンス化する。
我々は,我々の理論を裏付ける数値的な結果を提供し,グリッドワールドのような環境において,行動クローンが学習に失敗する状況を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:28:35 GMT)
RAISE: Reinforced Adaptive Instruction Selection For Large Language Models [63.1] タスクオブジェクト駆動型命令選択フレームワークRAISE(Reinforced Adaptive Instruction Selection)を提案する。
RAISEは命令の微調整プロセス全体を最適化に取り入れ、各命令がモデルの性能改善に期待する影響に基づいて各ステップで命令を選択する。
実験と結果解析は,他の命令選択法と比較して,本手法の優位性を証明している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:08:30 GMT)
Dyna-Mind: Learning to Simulate from Experience for Better AI Agents [62.2] 私たちは、現在のAIエージェントは、行動する前に、別の未来を精神的にシミュレートする能力である「悪意ある試行錯誤」を必要としていると論じます。
我々は、(V)LMエージェントに対して、そのようなシミュレーションを推論に組み込むように明示的に教える2段階のトレーニングフレームワークであるDyna-Mindを紹介した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:30:18 GMT)
Understanding the Effects of Domain Finetuning on LLMs [60.9] 大規模医療言語モデルにおけるドメイン固有微調整に関する最初の体系的研究について述べる。
解析の結果,微調整は表現部分空間の小さな部分集合のみを修飾することがわかった。
サブ空間におけるこれらの変化を解釈するために、微調整によって引き起こされる方向パラメータシフトを明示的にキャプチャするチューニングベクトルを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:14:06 GMT)
Unleashing Perception-Time Scaling to Multimodal Reasoning Models [60.6] 推論時間スケーリングの最近の進歩は、LVLM(Large Vision-Language Models)の推論能力を大幅に向上させた。
この成功に触発されて、同様の戦略がマルチモーダル推論に適用されたが、視覚的知覚への影響は未だ不明である。
本稿では,トークンに富む知覚を促進する新しいパラダイムである知覚時間スケーリング(PTS)を提案し,複雑な知覚問題を中間的抽出可能なサブプロブレムに分解する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:17:52 GMT)
Orthogonal Representation Learning for Estimating Causal Quantities [59.2] 我々は,表現学習とNeyman-orthogonal Learningersを結びつける統一フレームワークを提案する。
低次元多様体仮説の下では、OR-学習者は標準ナイマン-直交学習者の推定誤差を厳密に改善できることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:15:56 GMT)
Barbarians at the Gate: How AI is Upending Systems Research [59.0] システム研究は、新しいパフォーマンス指向アルゴリズムの設計と評価に長年注力してきたが、AI駆動のソリューション発見には特に適している、と私たちは主張する。
このアプローチをAI駆動システム研究(ADRS)と呼び、ソリューションを反復的に生成し、評価し、洗練する。
我々の研究結果は、AI時代のシステム研究の実践に急激な適応の必要性と破壊的な可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:53:53 GMT)
Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark [58.6] 既存の赤外線画像強調法は、個々の劣化に対処することに焦点を当てている。
一般的にRGBセンサーに適用されるオールインワンエンハンスメント法は、有効性が制限されることが多い。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:55:54 GMT)
Enabling Self-Improving Agents to Learn at Test Time With Human-In-The-Loop Guidance [58.2] 大規模言語モデル(LLM)エージェントは、しばしばルールや必要なドメイン知識が頻繁に変化する環境で苦労する。
テスト時に更新されたドメイン知識を継続的に学習するための適応反射型対話エージェント(ARIA)を提案する。
ARIAはTikTok Pay内にデプロイされ、月間アクティブユーザ数は1億5000万を超えている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:52:01 GMT)
Task-Aware Resolution Optimization for Visual Large Language Models [57.9] ほとんどの視覚的大言語モデル(VLLM)は、下流タスクの固定解像度を前提としており、サブパーパフォーマンスをもたらす。
本稿では,これらの2つの要因を組み合わせ,与えられた視覚言語課題の最適解を求める実験式を提案する。
第二に、厳密な実験に基づいて、事前学習したVLLMの視覚入力分解能を同定された最適分解能に拡張する新しいパラメータ効率の微調整手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:53:30 GMT)
Dyna-Think: Synergizing Reasoning, Acting, and World Model Simulation in AI Agents [57.4] 本稿では,AIエージェントの性能向上のための推論と行動を伴う内的世界モデルとプランニングを統合した思考フレームワークDyna-Thinkを提案する。
DITは、R1の思考プロセスを再構築し、提案された(計画された)行動に関連する世界モデルシミュレーションの実行に集中し、この再構成データを用いてポリシーを訓練する。
DDTは2段階のトレーニングプロセスを使用して、まず状態予測や批判生成といった目的を通じてエージェントの世界モデリング能力を改善し、次にポリシートレーニングを通じてエージェントのアクションを改善する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:01:33 GMT)
What Makes LLMs Effective Sequential Recommenders? A Study on Preference Intensity and Temporal Context [56.6] RecPOは、シーケンシャルなレコメンデーションのための優先順位最適化フレームワークである。
これは、推定された嗜好階層と時間信号に基づいて適応的な報酬マージンを利用する。
タイムリーな満足感、コヒーレントな嗜好の維持、変化する状況下での識別の行使など、人間の意思決定の重要な特徴を反映している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:44:15 GMT)
CAPE: A CLIP-Aware Pointing Ensemble of Complementary Heatmap Cues for Embodied Reference Understanding [56.3] 身体的参照理解(Embodied Reference Understanding)は、シーンの人物が指し示すジェスチャーと言語の両方を通して参照しているオブジェクトを予測する。
本稿では,2重モデルフレームワークを提案し,一方のモデルが頭指先方向から学習し,他方のモデルが手指先方向から学習する。
我々は、ベンチマークYouRefItデータセットの広範な実験と分析を通じてアプローチを検証し、0.25IoU閾値で約4mAPの改善を実現した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:18:55 GMT)
A Multimodal Depth-Aware Method For Embodied Reference Understanding [56.3] Embodied Reference Understandingでは、言語命令とポインティングキューの両方に基づいて、視覚的なシーンで対象のオブジェクトを識別する必要がある。
本稿では,データ拡張,深度マップのモダリティ,深度認識決定モジュールを共同で活用する新しいERUフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:05:00 GMT)
FREE: The Foundational Semantic Recognition for Modeling Environmental Ecosystems [56.1] 我々は、様々な特徴と利用可能な情報を使ってユニバーサルモデルを訓練するフレームワーク、FREEを導入する。
その中核となる考え方は、利用可能な環境データをテキスト空間にマッピングし、環境科学における従来の予測モデリングタスクを意味認識問題に変換することである。
河川水温予測と収穫量予測という2つの社会学的に重要な実世界の応用に対する評価は、FREEが複数のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:38:06 GMT)
On the Reliability of Large Language Models for Causal Discovery [55.9] 本研究では,因果発見におけるLarge Language Models(LLMs)の有効性について検討した。
我々は,新たに利用可能なオープンソースLLM,OLMo,BLOOMを用いて,事前学習コーパスへのアクセスを行う。
i) 正確な因果関係予測のための暗記の影響, (ii) 事前学習データにおける誤った因果関係の影響, (iii) LLMの因果関係に対する理解に影響を与える文脈的ニュアンスについて検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:06:02 GMT)
SynthID-Image: Image watermarking at internet scale [55.6] 本稿では,AI生成画像の透かしを行うディープラーニングシステムであるSynthID-Imageを紹介する。
本稿では,このようなシステムをインターネット規模で展開する上での技術的デシラタ,脅威モデル,実践的課題について述べる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:03:31 GMT)
IRIS: An Iterative and Integrated Framework for Verifiable Causal Discovery in the Absence of Tabular Data [55.4] IRIS(Iterative Retrieval and Integrated System for Real-Time Causal Discovery)は,これらの制約に対処する新しいフレームワークである。
我々のアプローチは、既存のデータセットを必要とせずに、初期変数のセットのみからリアルタイム因果発見を可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:50:26 GMT)
Robustness in Both Domains: CLIP Needs a Robust Text Encoder [55.3] LEAFはテキストドメインの効率の良い逆方向の微調整手法であり、大きなCLIPモデルにスケールできる。
我々のモデルは、ロバスト画像エンコーダによる視力性能を維持しながら、テキスト領域におけるゼロショット対角精度を著しく向上させる。
我々は,ロバストテキストエンコーダが直接最適化による埋め込みから入力テキストの再構築を容易にすることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:24:53 GMT)
RE-Searcher: Robust Agentic Search with Goal-oriented Planning and Self-reflection [55.1] 環境の複雑さが脆弱な探索行動をいかに引き起こすかを定量的に分析する。
本稿では,検索エージェントRE-Searcherのインスタンス化をシンプルかつ効果的に行う手法を提案する。
この目標指向計画と自己回帰の組み合わせにより、RE-Searcherは複雑な検索環境における急激な手がかりに抵抗することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:18:13 GMT)
A Comprehensive Survey on Benchmarks and Solutions in Software Engineering of LLM-Empowered Agentic System [54.9] 本調査は, LLMを利用したソフトウェア工学の総合的解析を初めて行ったものである。
我々は150以上の最近の論文を分析し、2つの主要な次元にまたがる包括的分類に分類する。
我々の分析は、この分野が単純なプロンプトエンジニアリングから複雑なエージェントシステムへとどのように進化してきたかを明らかにする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:56:50 GMT)
Beyond Surface Reasoning: Unveiling the True Long Chain-of-Thought Capacity of Diffusion Large Language Models [54.8] 同時トークン更新を可能にする並列デコード。厳格な推論にしばしば必要とされる因果順序と競合する。
単純な推論タスクと複雑な推論タスクの両方において、DLLMは直接決定可能な出力に対してのみ真の並列性を示すことを示す。
そこで本研究では,PSCによる非効率性と非効率性を低減するために,いくつかの実用的な緩和,並列指向プロンプト,拡散早期停止,並列スケーリングを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:58:14 GMT)
Multimodal Language Models See Better When They Look Shallower [54.5] マルチモーダル大言語モデル(MLLM)は、通常、事前訓練された視覚変換器(ViT)の最終層から視覚的特徴を抽出する。
MLLMの視覚層選択に関する最初の総合的研究を行い,VT層間の表現類似性を解析した。
我々は、深い層がOCRのようなセマンティックリッチなタスクに優れているのに対して、浅い層と中層の層は、きめ細かい視覚的なタスクでそれらを著しく上回っていることに気付きました。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:32:25 GMT)
InstructPLM-mu: 1-Hour Fine-Tuning of ESM2 Beats ESM3 in Protein Mutation Predictions [54.2] InstructPLM-muと呼ばれる微調整フレームワークを提案する。
構造入力を持つ細調整ESM2はESM3に匹敵する性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:14:50 GMT)
AutoGD: Automatic Learning Rate Selection for Gradient Descent [54.2] 本稿では,ある反復における学習率の増大や減少を自動的に決定する勾配降下法であるAutoGDを紹介する。
我々は、滑らか性定数の知識を必要とせず、幅広い種類の函数に対して、GDの最適速度(定数まで)を回復できることを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:47:22 GMT)
Instance-Aware Robust Consistency Regularization for Semi-Supervised Nuclei Instance Segmentation [53.9] 本稿では、インスタンスレベルの正確な核分割のためのインスタンス対応ロバスト整合性正規化ネットワーク(IRCR-Net)を提案する。
病理画像に核形態学的な先行知識を取り入れ,これらの先行知識を用いてラベルのないデータから生成された擬似ラベルの品質を評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:32:32 GMT)
How can we assess human-agent interactions? Case studies in software agent design [53.0] 我々は,人間とエージェントの相互作用の厳密な評価に向けて,二つの大きな一歩を踏み出した。
エージェント設計のより効率的な人間中心評価のためのフレームワークであるPULSEを提案する。
私たちは、オープンソースのソフトウェアエージェントOpenHandsを中心に構築された大規模なWebプラットフォームにフレームワークをデプロイします。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:04:28 GMT)
Taxonomy of User Needs and Actions [51.9] 会話AIの普及は、ユーザの計測目標と、それらを達成するための位置、適応、および社会的プラクティスをキャプチャするフレームワークの必要性を強調している。
このギャップに対処するために,1193人の人間とAIの会話の反復的質的分析によって構築された経験的基盤の枠組みであるTUNA(Taxonomy of User Needs and Actions)を紹介した。
TUNAは、ユーザアクションを情報検索、合成、手続き的ガイダンス、コンテンツ作成、ソーシャルインタラクション、メタ会話に関連する行動を含む3段階の階層に編成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:13:43 GMT)
Randomized HyperSteiner: A Stochastic Delaunay Triangulation Heuristic for the Hyperbolic Steiner Minimal Tree [51.5] 双曲空間におけるSteiner Minimal Trees (SMT) 構築の問題を解決するためにRandomized HyperSteiner (RHS) を導入する。
RHSは拡張プロセスにランダム性を導入し、デラウネー三角勾配を通じて候補木を精製する。
ほぼ有界な構成では、RHSはHSよりも全長を32%削減できる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:31:55 GMT)
Don't Just Chase "Highlighted Tokens" in MLLMs: Revisiting Visual Holistic Context Retention [51.0] MLLM(Multimodal Large Language Models)は、巨大な視覚トークンに依存するため、計算オーバーヘッドがかなり大きい。
近年の研究では、この問題を緩和するためにトークンプルーニングが検討されている。
本稿では,効率的な推論のためのビジュアルトークン・プルーニング・フレームワークであるHoloVを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:22:17 GMT)
AutoPR: Let's Automate Your Academic Promotion! [50.9] 本稿では,研究論文を正確な,エンゲージメント,タイムリーな公開コンテンツに変換する新しいタスクであるAutoPRを紹介する。
PRAgentは、AutoPRを3段階で自動化するマルチエージェントフレームワークである。コンテンツ抽出、協調合成、標準の最適化、トーン、最大リーチのためのタグ付けのプラットフォーム固有の適応である。
結果は,AutoPRをトラクタブルで測定可能な研究課題と位置づけ,スケーラブルで影響力のある学術的コミュニケーションのためのロードマップを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:08:36 GMT)
P2P: A Poison-to-Poison Remedy for Reliable Backdoor Defense in LLMs [49.9] 微調整の間、大規模言語モデル(LLM)は、データポゾンによるバックドア攻撃に対してますます脆弱である。
汎用的で効果的なバックドアディフェンスアルゴリズムであるPoison-to-Poison (P2P)を提案する。
P2Pはタスク性能を維持しながら悪質なバックドアを中和できることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:31:10 GMT)
Tuning without Peeking: Provable Privacy and Generalization Bounds for LLM Post-Training [49.8] BBoxERはトレーニングデータの暗黙的な圧縮を通じて情報ボトルネックを誘導する。
我々は、データ中毒攻撃、および抽出攻撃に対する非空き一般化境界と、差分プライバシーに対する強力な理論的保証を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:08:31 GMT)
HINT: Helping Ineffective Rollouts Navigate Towards Effectiveness [49.7] 強化学習(RL)は、大規模言語モデル(LLM)の長いチェーン・オブ・シント(CoT)推論能力を高めるための重要な要因となっている。
しかし、GRPOのような一般的な手法は、タスクの難しさがモデルの能力を超えると失敗し、スパーシリティと非効率なトレーニングに報いる。
我々は、適応的なヒントフレームワークであるHINT: Helping In Effective Rollouts Navigate Towards Effectiveを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:42:03 GMT)
DiffMark: Diffusion-based Robust Watermark Against Deepfakes [49.1] ディープフェイクは、悪意のある顔操作を通じて、重大なセキュリティとプライバシーの脅威を引き起こす。
既存の透かし法はディープフェイク操作に対して十分な堅牢性を欠いていることが多い。
本稿では拡散モデルに基づく新しいロバストな透かしフレームワークDiffMarkを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:52:28 GMT)
3D Reconstruction from Transient Measurements with Time-Resolved Transformer [48.7] 我々は,光子効率画像における3次元再構成性能を高めるため,TRT(Time-Resolved Transformer)アーキテクチャを提案する。
本稿では,NLOS 画像用 TRT-LOS と NLOS 用 TRT-NLOS の2つのタスク固有のエボディメントを開発する。
さらに,様々なノイズレベルを持つ大規模かつ高分解能な合成LOSデータセットをコントリビュートし,実世界のNLOS画像計測を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:44:08 GMT)
A Comprehensive Evaluation of Multilingual Chain-of-Thought Reasoning: Performance, Consistency, and Faithfulness Across Languages [48.7] マルチリンガル・チェーン・オブ・ソート(CoT)推論の最初の包括的研究について述べる。
LRMがターゲット言語ですぐに考えることができる場合、言語コンプライアンス、解答精度、解答一貫性を計測する。
思考の痕跡の質と有効性は、素早い言語によって大きく異なることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:06:50 GMT)
Identifying & Interactively Refining Ambiguous User Goals for Data Visualization Code Generation [48.6] 本研究では,この課題に現れるあいまいさの分類法を開発し,それらを定量化するための指標を提案する。
我々の研究は、マルチターン対話が曖昧さを減らし、ユーザ目標の整合性を高めてコード精度を向上させる方法についても検討している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:44:40 GMT)
TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation [48.6] 視覚的自己回帰(VAR)モデルのための、最初の一般的なテスト時間スケーリングフレームワークを提示する。
クラスタリングに基づく多様性探索と再サンプリングに基づく潜在的選択を提案する。
強力なVARモデルであるInfinityの実験は、注目すべき8.7%のGenEvalスコアの改善を示している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:44:48 GMT)
On the Implicit Adversariality of Catastrophic Forgetting in Deep Continual Learning [48.5] 我々は,新タスクトレーニングが暗黙的に旧タスク知識に対する敵対的な攻撃であることを示す。
新しいタスク勾配は、古いタスクロスランドスケープの鋭い方向と自動的に正確に一致します。
提案するバックGPは,10.8%の遅延を低減し,平均12.7%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:24:45 GMT)
Learning to Reason Across Parallel Samples for LLM Reasoning [48.4] 大規模言語モデル(LLM)において、テスト時間計算のスケーリングは大幅なパフォーマンス向上をもたらす
本稿では,このような複数のサンプル集合を利用する新しい手法を提案する。
5つの推論データセットの実験は、SSAの有効性と効率を実証している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:30:44 GMT)
Multimodal Policy Internalization for Conversational Agents [48.1] マルチモーダルポリシー内部化(MPI)は、推論集約型マルチモーダルポリシーをモデルパラメータに内部化する新しいタスクである。
合成と実世界の意思決定とツール使用タスクにまたがる2つのデータセットを構築します。
TriMPIは、エンドツーエンドの精度、一般化、ロバスト性において顕著な向上を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:28:30 GMT)
SegTrans: Transferable Adversarial Examples for Segmentation Models [47.9] 既存の敵攻撃手法は、異なるセグメンテーションモデル間での転送性が低いことを示す。
入力サンプルを複数のローカル領域に分割する新しい転送攻撃フレームワークであるSegTransを提案する。
SegTransは、摂動を最適化するためにグローバルなセマンティック情報を使用するのではなく、元の入力からのローカルなセマンティック情報のみを保持する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:11:29 GMT)
How a Bilingual LM Becomes Bilingual: Tracing Internal Representations with Sparse Autoencoders [47.5] バイリンガル言語モデルの内部表現を解析するためにスパースオートエンコーダを用いる。
我々の分析では、まず言語モデルを個別に学習し、その後徐々にバイリンガルアライメントを形成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:14:26 GMT)
FinTagging: Benchmarking LLMs for Extracting and Structuring Financial Information [47.4] FinTaggingは構造認識とフルスコープのための最初の包括的なベンチマークである。
タグ付け
数値識別用FinNIは、数値エンティティとそのタイプを抽出する。
財務報告
概念リンクのためのFinCLは、抽出された各実体を米国の完全な分類学における対応する概念にマッピングする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:16:17 GMT)
Verbalized Sampling: How to Mitigate Mode Collapse and Unlock LLM Diversity [47.3] 我々は、基本的で普及したデータレベルドライバを識別する: 嗜好データにおける典型的バイアス。
我々は、このバイアスを理論的に定式化し、嗜好データセット上で実証し、モード崩壊において中心的な役割を果たすことを示す。
モード崩壊を回避するためのトレーニングフリープロンプト戦略であるVerbalized Samplingを導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:38:52 GMT)
Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training [47.3] 大規模言語モデル(LLM)に推論タスクに適用された強化学習は、不安定な勾配推定によってボトルネックとなることが多い。
LLMのオンラインRLポストトレーニングのための適応型サンプリングフレームワークであるReinforce-Adaを提案する。
従来の2段階配置法とは異なり、Reinforce-Adaはオンライン連続除去プロセスにおける推定とサンプリングをインターリーブする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:57:28 GMT)
InteractScience: Programmatic and Visually-Grounded Evaluation of Interactive Scientific Demonstration Code Generation [47.2] 大規模言語モデル(LLM)は、自然言語命令から完全なアプリケーションを生成する能力がますます高まっている。
科学的デモンストレーションを生成するには、正確な科学的知識と対話的なフロントエンドコードを実装する能力を組み合わせるモデルが必要である。
InactScienceは、5つの科学領域にまたがって慎重に設計された質問のかなりのセットからなるベンチマークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:55:46 GMT)
LaTeXTrans: Structured LaTeX Translation with Multi-Agent Coordination [46.5] 本稿では,構造化文書の翻訳を目的とした協調型マルチエージェントシステムMTTransを紹介する。
Transは、6つの特殊エージェントを通じてフォーマットの保存、構造的忠実性、一貫性を保証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:09:35 GMT)
Do LLMs Really Need 10+ Thoughts for "Find the Time 1000 Days Later"? Towards Structural Understanding of LLM Overthinking [46.4] ロングチェーン・オブ・シント(CoT)モデルは、単純なクエリであっても、必要以上に広範囲な推論を行うことが多い。
本研究では, LLMの思考過程の体系的, きめ細かな解析を行い, そのギャップ, TRACEを橋渡しする。
筆者らは,長さに基づくメトリクスを超えて,過剰思考のユーティリティベース定義を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:36:08 GMT)
Invariance Makes LLM Unlearning Resilient Even to Unanticipated Downstream Fine-Tuning [46.2] 機械学習は、大規模言語モデル(LLM)におけるプライバシーと安全性の懸念に対する有望な解決策を提供する
不変リスク最小化(IRM)に触発されて、非学習に初めて不変を導入する。
我々は、頑健性を高める正規化ベースのフレームワークである不変LLMアンラーニング(ILU)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:16:40 GMT)
Motion Tracks: A Unified Representation for Human-Robot Transfer in Few-Shot Imitation Learning [46.0] 本稿では,画像上の2次元短距離軌跡として行動を表現することを提案する。
これらの動作、つまりモーショントラックは、人間の手やロボットのエンドエフェクターの動作の予測方向を捉えます。
画像観察を受信し,動作トラックを動作として出力する,MT-pi(Motion Track Policy)と呼ばれるILポリシをインスタンス化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:31:44 GMT)
SpatialSplat: Efficient Semantic 3D from Sparse Unposed Images [45.8] 冗長性を意識したガウス語を生成するフィードフォワードフレームワークである textbfSpatialSplat を紹介する。
本研究では,シーン表現パラメータの60%削減を図り,最先端手法よりも優れた性能を実現した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:40:55 GMT)
Spatiotemporal Forecasting as Planning: A Model-Based Reinforcement Learning Approach with Generative World Models [45.5] 本研究では,モデルベース強化学習における新たなパラダイムであるSFP予測・アズ・プランニング(SFP)を提案する。
SFPは、多様な高時間将来の状態をシミュレートし、「想像に基づく」環境シミュレーションを可能にする新しい世界モデルを構築している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:54:02 GMT)
Evaluating Robustness of Large Language Models Against Multilingual Typographical Errors [45.4] 大規模言語モデル(LLM)は、ユーザ入力を持つマルチリンガルな実世界のアプリケーションにますます多くデプロイされている。
ほとんどのベンチマークはクリーンな入力を前提としており、LLMの堅牢性は、ほとんど探索されていないタイプミスに委ねられている。
MulTypoは,言語固有のキーボードレイアウトとタイピング行動に基づいて,ヒューマンライクなエラーをシミュレートする多言語型タイポ生成アルゴリズムである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:49:12 GMT)
Neural Codecs as Biosignal Tokenizers [45.1] ニューラルコーデックにインスパイアされた代替表現学習フレームワークであるBioCodecを導入し、離散トークンの形で低レベル信号特性をキャプチャする。
提案手法は、最先端のモデルと競合するバイオシグナルトークン化のための汎用的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:47:20 GMT)
SPG: Sandwiched Policy Gradient for Masked Diffusion Language Models [45.0] サンドウィッチ政策グラディエント(SPG)
実験の結果,SPGはELBOやワンステップ推定に基づいてベースラインを著しく上回ることがわかった。
具体的には、GSM8Kの3.6%、MATH500の2.6%、カウントダウンの18.4%、スドクの27.0%で、dLLMの最先端RL法よりも精度が向上する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:52:25 GMT)
A Unified Biomedical Named Entity Recognition Framework with Large Language Models [44.9] 大規模言語モデル(LLM)に基づくバイオメディカル名前付きエンティティ認識(BioNER)フレームワークを提案する。
まず、テキスト生成タスクとしてBioNERを再構成し、フラットなエンティティとネストされたエンティティの両方を共同で扱うシンボリックタグ戦略を設計する。
複数の中国語と英語のデータセットでバイリンガル共同微調整を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:33:54 GMT)
NG-Router: Graph-Supervised Multi-Agent Collaboration for Nutrition Question Answering [44.5] 食事は人間の健康において中心的な役割を担い、栄養質問回答(QA)はパーソナライズされた食事指導への有望な道を提供する。
既存の手法は、単一エージェントシステムの限られた推論能力と、効果的なマルチエージェントアーキテクチャを設計する複雑さの2つの根本的な課題に直面している。
本稿では,栄養QAを教師付き知識グラフ誘導多エージェント協調問題として定式化する新しいフレームワークであるNutritional-Graph Router(NG-)を紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:38:33 GMT)
SOS: Synthetic Object Segments Improve Detection, Segmentation, and Grounding [44.3] 本稿では,オブジェクト中心の合成戦略に基づくシンプルでスケーラブルなデータ合成パイプラインであるSOSを提案する。
高品質な合成オブジェクトセグメントを、構造化されたレイアウト先行と生成的リライトを使用して、新しい画像に貼り付ける。
SOSから10万の合成画像でトレーニングされたモデルは、より大きなリアルタイムデータセットでトレーニングされたモデルよりも優れています。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:04:30 GMT)
Cross-Representation Benchmarking in Time-Series Electronic Health Records for Clinical Outcome Prediction [44.2] このベンチマークは、2つの異なる臨床環境におけるデータキュレーションと評価を標準化する。
実験によると、イベントストリームモデルは、常に最強のパフォーマンスを提供する。
特徴選択戦略は臨床環境に適応する必要がある。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:03:47 GMT)
Towards the Training of Deeper Predictive Coding Neural Networks [44.1] 予測符号化ネットワーク(英: Predictive coding network)は、反復エネルギー最小化プロセスを通じて推論を行うニューラルネットワークである。
浅いアーキテクチャでは有効だが、5層から7層に留まらず、パフォーマンスが著しく低下する。
この劣化は,重み付け更新時の層間エラーの指数的不均衡と,より深い層内の更新を導くのに有効でない前の層からの予測が原因であることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:45:17 GMT)
Strong coupling between a single-photon and a two-photon Fock state [44.0] 超強結合回路QED系における単一光子と2光子フォック状態の強い結合を実験的に観察した。
結果は、量子非線形光学の新しい体制への重要な一歩である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:28:16 GMT)
ARM2: Adaptive Reasoning Model with Vision Understanding and Executable Code [43.9] 大規模推論モデル(LRM)は、しばしば過剰な思考の問題に悩まされ、単純なタスクに対する不必要に長い推論を引き起こす。
ARM2は、複数のフォーマットにわたる推論性能と効率を適応的にバランスさせる統一モデルである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:26:48 GMT)
RAGDiffusion: Faithful Cloth Generation via External Knowledge Assimilation [43.9] 本稿では、構造決定性を高め、幻覚を軽減するために、RAGDiffusionと呼ばれる新しいRAG(Retrieval-Augmented Generation)フレームワークを提案する。
RaGDiffusionは、構造的にもテクスチャ的にも忠実な衣服の資産を合成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:03:06 GMT)
RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models [43.8] イメージキャプションをパーソナライズするための強化学習に基づくポストトレーニングフレームワークを提案する。
本手法は,MLLMの視覚認識能力とパーソナライズ機能の両方を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:34:06 GMT)
Deploying Tiny LVLM Judges for Real-World Evaluation of Chart Models: Lessons Learned and Best Practices [43.6] 7Bパラメータしか持たないLVLM(Large Vision-Language Models)は、チャート理解タスクにおける自動判断として有望であることを示している。
i) 評価基準を1つのクエリにまとめるマルチ基準プロンプトと(ii) ドメイン適応トランスファーラーニングの2つのアプローチを提案し、チャートデータセットの合成判断に2B-パラメータLVLMを微調整してChartJudgeを作成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:31:25 GMT)
SpaceVista: All-Scale Visual Spatial Reasoning from mm to km [43.5] 本稿は,2つの課題に対処することで,多様なシナリオをまたいだ空間的推論を促進することを目的とする。
屋内の3Dスキャンと、データセットのキュレーションのための労働集約的な手作業アノテーションに大きく依存する。
本稿では,構造化空間推論システム,スケール・アウェア・モデリング,プログレッシブ・トレーニング・パラダイムを統合した総合的なソリューションを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:59:46 GMT)
Prompting Test-Time Scaling Is A Strong LLM Reasoning Data Augmentation [43.3] 大型言語モデル (LLMs) は、チェーン・オブ・シンクタンク(英語版)を備えた場合、印象的な推論能力を示す。
本研究では,P-TTS(Prompting Test-Time Scaling)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:57:04 GMT)
PanoLAM: Large Avatar Model for Gaussian Full-Head Synthesis from One-shot Unposed Image [43.2] 本稿では,ガウス全頭部合成のためのフィードフォワード・フレームワークを提案する。
従来のGANインバージョンとテスト時間最適化に依存した作業とは異なり、我々のフレームワークは、1つの未提示画像が1つの前方パスで与えられると、ガウスのフルヘッドモデルを再構築することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:20:05 GMT)
Constructive Distortion: Improving MLLMs with Attention-Guided Image Warping [43.1] AttWarpは、少ない情報領域を圧縮しながら、クエリ関連コンテンツにより多くの解像度を割り当てる軽量な方法である。
テスト時にはMLLMのクロスモーダルアテンションを用いて入力画像のリチ線形ワープを行う。
この注意誘導ワープは、元の画像情報を全て保存するが、一様に再分割する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:57:06 GMT)
Autoencoding-Free Context Compression for LLMs via Contextual Semantic Anchors [43.0] 現在の文脈圧縮法は、文脈に依存しない圧縮トークンを訓練し、文脈意味論を圧縮する自動符号化タスクに依存している。
本稿では,自動符号化タスクベース圧縮から,この圧縮機能を備えたアーキテクチャへ移行する新しい手法であるSemantic-Anchor Compression (SAC)を提案する。
SACは、様々な圧縮比で既存の文脈圧縮手法より一貫して優れている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:42:14 GMT)
Regret Bounds for Adversarial Contextual Bandits with General Function Approximation and Delayed Feedback [43.0] 我々は,コンテキスト型マルチアーム・バンディット(CMAB)問題に対する後悔のアルゴリズムをK$アクションに対して提示する。
我々は、$ O (sqrtKT log |Pi| + sqrtD log |Pi|) $ の最適再帰境界を確立し、$D$ は遅延の和である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:28:23 GMT)
A Unified Framework for Lifted Training and Inversion Approaches [43.0] この章では、さまざまな持ち上げトレーニング戦略をカプセル化した統合フレームワークを紹介します。
本稿では,ブロックコーディネート降下戦略を用いて,これらの手法の実装について論じる。
標準撮像タスクの数値計算結果から,昇降ブレグマン法の有効性と安定性が検証された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:00:34 GMT)
Wavelet Scattering Transform and Fourier Representation for Offline Detection of Malicious Clients in Federated Learning [42.6] フェデレートラーニング(FL)は、データプライバシを保持しながら、分散クライアント間で機械学習モデルのトレーニングを可能にする。
異常なクライアントや破損したクライアントの存在は、モデルパフォーマンスを著しく低下させる可能性がある。
我々は、トレーニング前に悪意のあるクライアントにラベル付けする検出アルゴリズムWAFFLEを提案する。
蒸留された公開データセットに基づいてトレーニングされた軽量検出器は、最小限の通信と計算オーバーヘッドでラベル付けを実行する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:50:17 GMT)
Reasoning Model Unlearning: Forgetting Traces, Not Just Answers, While Preserving Reasoning Skills [42.2] 大きな推論モデル(LRM)は、テスト時間計算を通じて強力なチェーン・オブ・シント(CoT)生成を可能にした。
従来の未学習アルゴリズムは、もともと非推論モデル用に設計されていたが、LRMには不適当であることを示す。
本稿では,意味のある推論トレースを効果的に抑制する新しい手法であるReasoning-aware Representation Misdirection for Unlearning(R2MU$)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:19:51 GMT)
Federated Fine-Tuning of Sparsely-Activated Large Language Models on Resource-Constrained Devices [41.8] 大規模言語モデル (LLM) のファインチューニングは, 膨大な計算量と参加者の資源制約のため, 困難である。
制約コンピューティングリソースの参加者間でMoEベースのLLMの微調整を可能にするシステムであるFLUXを提案する。
FLUXは既存の手法よりも優れており、時間と精度で最大4.75倍のスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:56:27 GMT)
ConjNorm: Tractable Density Estimation for Out-of-Distribution Detection [41.8] ポストホックアウト・オブ・ディストリビューション(OOD)検出は、信頼性の高い機械学習において大きな注目を集めている。
本稿では,密度に基づくスコア設計の統一的な視点を提供するために,Bregmanの発散に基づく理論的枠組みを提案する。
我々は,提案するtextscConjNormが,様々なOOD検出設定において,新たな最先端技術を確立したことを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:24:10 GMT)
Task-Level Insights from Eigenvalues across Sequence Models [41.8] 固有値がメモリと長距離依存性モデリングの本質的側面に影響を与えることを示す。
次に,シーケンスモデルのアーキテクチャ変更が固有値スペクトルとタスク性能の両方に与える影響について検討する。
この対応は、列モデルの能力を解釈し、理解し、最終的に改善するための原則的計量としての固有値解析の位置をさらに強化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:35:21 GMT)
Leading the Follower: Learning Persuasive Agents in Social Deduction Games [41.8] 大規模言語モデル(LLM)エージェントは、社会的推論ゲームにおいて顕著な進歩を見せている。
エージェントに説得力のある影響に対する発話を最適化するよう訓練する強化学習フレームワークを提案する。
この研究は、戦略的社会的影響力を持つAIエージェントを開発するための重要なステップである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:33:30 GMT)
Augmenting generative models with biomedical knowledge graphs improves targeted drug discovery [41.6] K-DREAM(Knowledge-Driven Embedding-Augmented Model)は、知識グラフを活用する新しいフレームワークである。
大規模知識グラフからの構造化情報を埋め込むことで、K-DREAMは高い生物学的関連性と治療適性を有する候補に分子生成を誘導する。
薬物設計タスクにおいて、K-DREAMは結合親和性を改善し、現在の最先端の生成モデルを上回る効果を予測できる薬物候補を生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:18:20 GMT)
Design-Based Bandits Under Network Interference: Trade-Off Between Regret and Statistical Inference [41.5] ネットワーク干渉(MABNI)を持つマルチアームバンディットでは、あるノードによって取られたアクションは他のノードの報酬に影響を与え、複雑な相互依存を生み出す。
我々は,最小化と推論精度のトレードオフをバランスさせるため,任意の正の信頼度シーケンスと対応するアルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:23:11 GMT)
An Improved Model-Free Decision-Estimation Coefficient with Applications in Adversarial MDPs [41.2] 構造観察による意思決定(DMSO)について検討する。
我々はDig-DECを紹介した。Dig-DECはモデルのないDECで、楽観性を排除し、情報ゲインによって純粋に探索を駆動する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:25:12 GMT)
Dense2MoE: Restructuring Diffusion Transformer to MoE for Efficient Text-to-Image Generation [41.2] 本研究では,高密度拡散変換器(DiT)をMixture of Experts(MoE)に変換する。
具体的には、DiT BlocksのFeed-Forward Networks(FFN)をMoE層に置き換え、FFNの活性化パラメータ数を62.5%削減する。
全体として、Dense2MoEは効率的なテキスト・画像生成のための新しいパラダイムを確立している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:42:27 GMT)
Automated Refinement of Essay Scoring Rubrics for Language Models via Reflect-and-Revise [41.2] 本研究では,Large Language Models (LLMs) で使用されているれんがを精製することにより,AES(Automated Scoring)を向上する可能性について検討する。
GPT-4.1、Gemini-2.5-Pro、Qwen-3-Next-80B-A3B-Instructによるデータセットの実験では、最大0.19と0.47の改善が得られた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:05:38 GMT)
Cluster-Aware Prompt Ensemble Learning for Few-Shot Vision-Language Model Adaptation [40.6] CLIPのような視覚言語モデル(VLM)は、多数の画像テキストペアを事前学習することで、様々なタスク間でゼロショット転送を実現する。
有効であるにもかかわらず、コンテキストプロンプトのテキスト的特徴を平均化する従来のプロンプトアンサンブルは、しばしば準最適結果をもたらす。
本稿では,コンテキストプロンプトのクラスタ特性を保存するクラスタ・アウェア・プロンプト・アンサンブル・ラーニング・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:58:43 GMT)
Haystack Engineering: Context Engineering for Heterogeneous and Agentic Long-Context Evaluation [40.4] LLM(Long-context Large Language Model)は、"needle-in-a-haystack"ベンチマークでよく機能する。
しかし、このようなテストは、バイアス付き検索とエージェントによる注意散逸から、いかにノイズの多いコンテキストが生じるかを見落としている。
私たちは、英語のWikipediaハイパーリンクネットワーク上に構築された新しいNIAHベンチマークであるHaystackCraftを通じて、これをインスタンス化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:33:52 GMT)
MomentSeg: Moment-Centric Sampling for Enhanced Video Pixel Understanding [40.4] Referring Video Object (RefVOS)は、自然言語記述でガイドされたビデオにターゲットオブジェクトをセグメント化しようとする。
本稿では,時空間接地(TSG)とRefVOSを協調的に最適化し,キーモーメント接地機能を自然に組み込んだ統合フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:18:21 GMT)
Beyond I'm Sorry, I Can't: Dissecting Large Language Model Refusal [40.3] 有害なプロンプトの拒絶は、命令調整型大規模言語モデル(LLM)における重要な安全行動である
残留ストリームアクティベーションを訓練したスパースオートエンコーダ(SAE)を用いて、Gemma-2-2B-ITとLLaMA-3.1-8B-ITの2つの公開命令チューニングモデルについて検討した。
有害なプロンプトが与えられた場合、私たちはSAE潜伏空間を探索し、アブレーションがモデルを拒絶からコンプライアンスに反転させ、因果的影響を示し、ジェイルブレイクを発生させる特徴セットを探索する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:46:26 GMT)
FinAuditing: A Financial Taxonomy-Structured Multi-Document Benchmark for Evaluating LLMs [40.2] FinAuditingは、財務監査タスクを評価するための最初の分類基準であり、構造を意識したマルチドキュメントのベンチマークである。
本物のアメリカ製である。
FinAuditingは3つの補完的なサブタスク、セマンティック一貫性のためのFinSM、リレーショナル一貫性のためのFinRE、数値一貫性のためのFinMRを定義している。
13の最先端のLCMに関する大規模なゼロショット実験は、現在のモデルが意味論、関係論、数学的次元で矛盾なく機能することを明らかにする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:41:55 GMT)
Large Language Models for Imbalanced Classification: Diversity makes the difference [40.0] 本稿では,多様性を高めるために,新しい大規模言語モデル (LLM) を用いたオーバーサンプリング手法を提案する。
まず,少数なラベルと特徴の両方に合成サンプル生成を条件付けるサンプリング戦略を導入する。
第2に、微調整事前学習LLMのための新しい置換戦略を開発する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:45:29 GMT)
LLaMAX2: Your Translation-Enhanced Model also Performs Well in Reasoning [39.8] 一般的な大規模言語モデルは推論において優れているが、翻訳のために強化されたモデルは推論タスクに苦労する。
提案手法は命令モデルから始まり,並列データのみに層選択型チューニングを適用する。
我々はQwen3-XPlusモデルを導入し、ハイソース言語とローソース言語の両方で翻訳性能が大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:33:28 GMT)
Decoupling Safety into Orthogonal Subspace: Cost-Efficient and Performance-Preserving Alignment for Large Language Models [39.7] 安全データのみをトレーニングしても,LORAに基づくRefusal-trainingにより安全性アライメントの維持が可能であることを示す。
我々は,LoRAがモデル固有の変換空間に対して,安全性を低ランク部分空間に効果的に分離する,理論的および実験的証拠の両方を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:01:44 GMT)
TARO: Timestep-Adaptive Representation Alignment with Onset-Aware Conditioning for Synchronized Video-to-Audio Synthesis [39.6] 本稿では,高忠実かつ時間的コヒーレントな音声合成のための新しいフレームワークTARO(Timestep-Adaptive Representation Alignment with Onset-Aware Conditioning)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:31:52 GMT)
MagicDock: Toward Docking-oriented De Novo Ligand Design via Gradient Inversion [39.6] MagicDockはプログレッシブパイプラインと差別化可能なサーフェスモデリングを基盤とした、前方に見えるフレームワークである。
まず、受容体の一般的なドッキング知識をバックボーンモデルに組み込む。
その後、ドッキング知識をバインド予測により逆勾配流としてインスタンス化し、デノボ生成を反復的に導く。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:45:50 GMT)
Mitigating Overthinking through Reasoning Shaping [39.5] Group Relative Segment Penalization (GRSP) は、推論を正規化するためのステップレベル手法である。
GRSPは精度を著しく損なうことなく優れたトークン効率を実現する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:49:03 GMT)
Graph Neural Network Surrogates to leverage Mechanistic Expert Knowledge towards Reliable and Immediate Pandemic Response [39.1] 我々は,空間的および階層的に解決された機械的メタポピュレーションシミュレータのグラフニューラルネットワーク(GNN)サロゲートを開発する。
提案手法は, 力学モデルと比較して最大28,670倍の速さで評価を行う。
結果は、GNNが複雑なメタポピュレーションモデルをパンデミック反応の即時かつ信頼性の高いツールに変換する方法を示している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:00:25 GMT)
Getting Your Indices in a Row: Full-Text Search for LLM Training Data for Real World [39.1] 本稿では,Apertus LLMトレーニングデータに対するフルテキストインデックスパイプラインを提案する。
Apertus LLMファミリーのトレーニングに使用された15.2Tのうち8.6Tトークンをインデックス化することができました。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:26:11 GMT)
LaV-CoT: Language-Aware Visual CoT with Multi-Aspect Reward Optimization for Real-World Multilingual VQA [39.1] 思考の連鎖(CoT)推論は、解釈可能性と複雑な推論を高めることが証明されている。
LaV-CoTは、マルチアスペクト・リワード最適化を備えた最初の言語対応Visual CoTフレームワークである。
LaV-CoTはオープンソースベースラインよりも9.5%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:28:38 GMT)
MASA: LLM-Driven Multi-Agent Systems for Autoformalization [38.8] 本稿では,大規模言語モデルによって駆動される自動形式化のためのマルチエージェントシステムを構築するための新しいフレームワークであるMASAを提案する。
本稿では,実世界の数学的定義と形式数学データセット実験におけるMASAの有効性を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:15:34 GMT)
Any-to-Bokeh: Arbitrary-Subject Video Refocusing with Video Diffusion Model [38.6] 時間的コヒーレントな深度対応ビデオボケレンダリングを生成するための一段階拡散フレームワークを提案する。
合成および実世界のベンチマークの実験では、時間的コヒーレンス、空間的精度、制御性が向上し、以前のベースラインよりも優れていた。
この研究は、ビデオボケ生成のための初めての専用拡散フレームワークであり、時間的コヒーレントで制御可能なフィールド効果のための新しいベースラインを確立する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:15:41 GMT)
An Exploration of Non-Euclidean Gradient Descent: Muon and its Many Variants [38.6] MuonMax は学習速度の選択に敏感であるのに対して,私たちが MuonMax と呼ぶ新しい変種は,はるかに堅牢である。
我々は、勾配非ユークリッド法とモデルベース運動量(モモとして知られる)を組み合わせる方法を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:57:49 GMT)
Visual Representation Alignment for Multimodal Large Language Models [38.3] マルチモーダルな大規模言語モデル (MLLM) は、視覚的指導のチューニングで訓練され、様々なタスクにまたがって高い性能を達成している。
しかし、それらはオブジェクトのカウントや空間的推論のような視覚中心のタスクに限られている。
本稿では、MLLMの内部視覚表現と事前学習された視覚基盤モデルとを整合させる、シンプルで効果的な正規化戦略である視覚表現アライメント(VIRAL)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:52:07 GMT)
Exploring Neural Granger Causality with xLSTMs: Unveiling Temporal Dependencies in Complex Data [38.1] 時系列における因果関係は、特に非線形依存の存在において決定することが困難である。
本稿では,変数間の長距離関係を捉えるために,Granger causal xLSTM(GC-xLSTM)を提案する。
本研究は,GC-xLSTMの総合的な有効性を示す6つの多種多様なデータセットについて実験的に評価した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:38:11 GMT)
AdaReasoner: Adaptive Reasoning Enables More Flexible Thinking in Large Language Models [38.1] AdaReasoner は LLM に依存しないプラグインで,任意の LLM が適応推論設定を自動化するように設計されている。
AdaReasonerは強化学習(RL)フレームワークを使用して訓練され、因子化されたアクション空間とターゲット探索戦略を組み合わせた。
標準ベースラインを一貫して上回り、分布外ロバスト性を保ち、調整されたプロンプトを通じて知識集約的なタスクに利益をもたらす。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:27:37 GMT)
ReTraceQA: Evaluating Reasoning Traces of Small Language Models in Commonsense Question Answering [38.0] 本稿では,コモンセンス推論タスクのプロセスレベル評価を導入する新しいベンチマークであるReTraceQAを紹介する。
専門家が注釈を付けたデータセットでは、ほとんどのケース(14-24%)において、SLMは、欠点のある推論プロセスにもかかわらず、正しい最終回答を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:03:33 GMT)
Diagnosing and Mitigating System Bias in Self-Rewarding RL [37.8] 検証可能な報酬(RLVR)による強化学習は、大規模言語モデル(LLM)の推論能力を拡大するが、継続するデータスケーリングのためにラベル付きサンプルの制限によりボトルネックが残る。
モデルは高信頼のロールアウトを過大評価する傾向があり、バイアスがあり不安定な報酬推定につながる。
本稿では,多種多様なモデルを集約し,報酬とロールアウトの選択に適応する強化学習(RLER)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:38:17 GMT)
Science Hierarchography: Hierarchical Organization of Science Literature [37.8] 我々は、科学文献を高品質な階層構造に整理する目的であるSCIENCE HIERARCHOGRAPHYを動機付けている。
我々は、効率的な埋め込みベースのクラスタリングとLLMベースのプロンプトを組み合わせたハイブリッドアプローチを開発した。
その結果,本手法は解釈可能性を改善し,科学的文献を探索するための代替経路を提供することがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:46:24 GMT)
Large Language Models Do NOT Really Know What They Don't Know [37.6] 最近の研究は、大言語モデル(LLM)が、その内部表現に事実性信号をエンコードしていることを示唆している。
LLMは、ショートカットやスプリアスアソシエーションに頼ることで、事実エラーを発生させることもできる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:09:04 GMT)
Learning to Disentangle Latent Reasoning Rules with Language VAEs: A Systematic Study [37.5] 本研究は,推論規則を言語モデル内に明示的に組み込んで記憶する方法について検討する。
本稿では,Transformer ベースの言語 VAE における推論規則を学習するための完全なパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:52:31 GMT)
Graph state extraction from two-dimensional cluster states [37.2] グラフ状態操作ツールを導入し、局所的な次数を増やし、サブグラフをマージする。
本稿では,複数のエッジを回避してオーバヘッドを最小化する方法を示し,計測に基づく量子計算とトランスポートを併用した局所的な操作戦略と比較する。
これらのスキームは、絡み合いベースの量子ネットワーク、センサーネットワーク、分散量子コンピューティング全般に直接的な応用がある。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:07:13 GMT)
FFT-based Selection and Optimization of Statistics for Robust Recognition of Severely Corrupted Images [37.1] 本稿では, 分類モデルのロバスト性向上のための新しい手法を提案する。
提案手法は,入力画像の劣化型を検出するために高周波特徴を用いて,層単位での特徴正規化統計を抽出する。
FROSTは、異なるモデルやデータセットに対する最先端の結果を提供し、ImageNet-Cの競合製品よりも37.1%も向上している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:03:20 GMT)
Why Low-Precision Transformer Training Fails: An Analysis on Flash Attention [37.0] 本稿では,低精度環境でのフラッシュアテンションによるトレーニングが破滅的損失の爆発を引き起こす長期未解決の故障事例について,最初の力学的説明を提供する。
我々の詳細な分析では、故障はランダムなアーティファクトではなく、注意機構内の類似の低ランク表現の出現と、低精度算術に固有の偏り付き丸め誤差の複合効果の2つの現象によって引き起こされることが明らかとなった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:14:31 GMT)
Improving Anomaly Detection in Industrial Time Series: The Role of Segmentation and Heterogeneous Ensemble [36.9] 異種アンサンブルと組み合わさったセグメンテーション技術の統合は,産業生産における異常検出をいかに向上させるかを示す。
我々はAUC-ROC計量を0.8599(PCAとLSTMのアンサンブルで達成)から0.9760(ランダムフォレストとXGBoostで達成)に改善する。
今後の研究では,変化点研究から得られた重み付き特徴とセグメント化と異種アンサンブルの併用による利点を評価し,早期異常検出におけるモデル性能をさらに最適化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:24:47 GMT)
Rethinking Reasoning in Document Ranking: Why Chain-of-Thought Falls Short [36.9] 文書の再ランク付けは情報検索(IR)における重要な要素である
本研究は, ポイントワイド設定とリストワイド設定の両方にまたがって, 推論に関する最初の体系的な研究である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:59:17 GMT)
MLLMEraser: Achieving Test-Time Unlearning in Multimodal Large Language Models through Activation Steering [36.8] MLLMEraserは、テスト時間アンラーニングのための入力対応、トレーニング不要のフレームワークである。
逆摂動型知識-リコール画像-テキストペアを対比してマルチモーダル消去方向を構築する。
LLaVA-1.5とQwen-2.5-VLの実験では、MLLMEraserは最先端MLLMの未学習ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:47:30 GMT)
Symmetry in Neural Network Parameter Spaces [36.6] 冗長性のかなりの部分はパラメータ空間の対称性によって説明される。
これらの対称性は損失ランドスケープと制約学習のダイナミクスを形成し、最適化、一般化、モデルの複雑さを理解するための新しいレンズを提供する。
既存の文献を要約し、対称性と学習理論の関連を明らかにするとともに、この新興分野におけるギャップと機会を特定する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:33:49 GMT)
Obstacle Avoidance using Dynamic Movement Primitives and Reinforcement Learning [36.1] 本研究は, 1つの人工的な実験からスムーズで, ほぼ最適な衝突のない3次元カルト軌道を高速に生成する手法を提案する。
デモは動的運動プリミティブ(DMP)として符号化され、ポリシーベースの強化学習を用いて反復的に再構成される。
この手法はシミュレーションと実ロボット実験で検証され、計算と実行時間の点でRTT-Connectベースラインを上回っている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:51:42 GMT)
DeHate: A Stable Diffusion-based Multimodal Approach to Mitigate Hate Speech in Images [36.1] 本稿では,デジタルコンテンツにおけるヘイトを識別するためのマルチモーダルデータセットを提案する。
我々は,Digital Attention Analysis Module (DAAM)と組み合わせた透かし,安定性向上,安定拡散技術を適用した。
この組み合わせは、画像内の憎しみのある要素をピンポイントし、それによって詳細な憎しみの注意マップを生成するのに役立ちます。
マルチモーダルデハティフィケーションタスク用に設計された視覚言語モデルであるDeHaterを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:11:19 GMT)
When LLM Agents Meet Graph Optimization: An Automated Data Quality Improvement Approach [36.0] テキスト分散グラフ(TAG)上のグラフニューラルネットワーク(GNN)は、入力品質に非常に敏感である。
既存のアプローチは主にモデルアーキテクチャの改善に焦点を当て、TAGデータ自体の体系的な最適化を無視している。
本稿では,グラフ品質制御をデータ中心の第一級問題として扱う統合マルチエージェントフレームワークであるLAGAを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:59:19 GMT)
Reasoning through Exploration: A Reinforcement Learning Framework for Robust Function Calling [36.0] グループ相対政策最適化(GRPO)に基づく新しいRLフレームワークである textbfEGPO を提案する。
EGPOの中核はエントロピー強化の利点関数であり、モデルのChain-of-Thought(CoT)のエントロピーをポリシー勾配に統合する。
挑戦的なBFCL(Berkeley Function Calling Leaderboard)では、EGPOでトレーニングされた4Bパラメータモデルが、同等サイズのモデルの間で新たな最先端を設定している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:20:24 GMT)
Auto-scaling Continuous Memory for GUI Agent [35.8] 従来のGUIエージェントは過去のトラジェクトリをテキストトークンに圧縮する。
本稿では,各GUI軌跡を連続埋め込みの固定長列に符号化する連続メモリを提案する。
メモリサイズと検索深度が増加するにつれて、長いプロンプトで劣化するテキストメモリとは異なり、パフォーマンスは単調に向上する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:16:45 GMT)
CHUG: Crowdsourced User-Generated HDR Video Quality Dataset [35.7] 高ダイナミックレンジ(UGC)ビデオは、優れた明るさ、コントラスト、色深度で視覚体験を高める。
YouTubeやTikTokなどのプラットフォームにおけるユーザ生成コンテンツ(UGC)の急増は、さまざまなキャプチャ条件、編集アーティファクト、圧縮歪みによるHDRビデオ品質評価(VQA)に対するユニークな課題を導入している。
既存のHDR-VQAデータセットは、主にプロが生成したコンテンツ(PGC)に焦点を当てており、現実の劣化を理解するためのギャップを残している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:35:39 GMT)
SeCon-RAG: A Two-Stage Semantic Filtering and Conflict-Free Framework for Trustworthy RAG [35.4] Retrieval-augmented Generation (RAG) システムは、外部知識を持つ大規模言語モデルを強化する。
既存の防御は、しばしば攻撃的なフィルタリングを適用し、不要な貴重な情報が失われる。
信頼性の高いRAGのための2段階のセマンティックフィルタリングとコンフリクトフリーフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:44:29 GMT)
Near-Optimal Second-Order Guarantees for Model-Based Adversarial Imitation Learning [35.4] エージェントがオフラインの専門家によるデモンストレーションから学び、報酬と対話するオンライン対人模倣学習(AIL)について研究する。
モデルベースAILアルゴリズム(MBAIL)を提案する。
MB-AILは,オンラインインタラクション(対数的要因まで)において,限られた専門家によるデモンストレーションにより,最小限のサンプル複雑性が得られることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:51:14 GMT)
VisionTS++: Cross-Modal Time Series Foundation Model with Continual Pre-trained Vision Backbones [35.3] VisonTS++は、大規模時系列上でのビジョンモデルの継続的な事前トレーニングに基づくTSFMである。
提案手法は,視覚モデルに基づくフィルタリング,色付き多変量変換,マルチクアンタイル予測という3つの重要なイノベーションを導入している。
実験により、VisionTS++は分布内および分布外予測の両方で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:02:07 GMT)
Target speaker anonymization in multi-speaker recordings [35.2] 本研究は,多話者対話音声における話者匿名化の重大な課題に対処する。
このシナリオは、顧客のプライバシが顧客の声のみを匿名化する必要があるコールセンタのようなコンテキストに非常に関係している。
本研究の目的は,会話音声における話者匿名化を効果的に行うことによって,これらのギャップを埋めることである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:59:45 GMT)
PrivATE: Differentially Private Confidence Intervals for Average Treatment Effects [34.9] 平均処理効果(ATE)に対する信頼区間計算のための機械学習フレームワークPrivATEを提案する。
具体的には、観測データからATEの適切なプライバシ保護CIを導出することに焦点を当てる。
私たちのフレームワークはモデルであり、二重に堅牢で、有効なCIを保証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:49:39 GMT)
MMAudioSep: Taming Video-to-Audio Generative Model Towards Video/Text-Queried Sound Separation [34.8] MMAudioSepは,ビデオ/テキスト検索音声分離のための生成モデルである。
事前訓練された音声生成モデルを用いて学習した映像・テキストと音声の関係について知識を利用することで、より効率的にモデルを訓練することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:13:06 GMT)
Agentic Property-Based Testing: Finding Bugs Across the Python Ecosystem [34.7] プロパティベースのテスト(PBT)は、ランダム化テストフレームワークとして実装される軽量な形式的手法である。
本研究では,Pythonモジュールを解析し,コードやドキュメントから関数固有およびクロスファンクショナルプロパティを推論し,PBTを合成・実行するLLMベースのエージェントを実演する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:43:54 GMT)
Personalize Before Retrieve: LLM-based Personalized Query Expansion for User-Centric Retrieval [34.3] Personalize Before Retrieve (PBR) は、ユーザ固有の信号を検索前にクエリ拡張に組み込むフレームワークである。
PBRは一貫して強力なベースラインを上回り、PersonaBenchはリトリーバー全体で最大10%の利益を得ている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:24:09 GMT)
InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models [34.2] 本稿では、連続的な事前学習と教師付き微調整をシームレスに統合するエンドツーエンドのFP8トレーニングレシピを提案する。
我々は,FP8をBF16の実用的で堅牢な代替品として確立し,大規模モデルトレーニングをさらに民主化するためのコードをリリースする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:13:13 GMT)
GTAlign: Game-Theoretic Alignment of LLM Assistants for Mutual Welfare [34.1] 推論と学習の両方にゲーム理論による意思決定を統合するアライメントフレームワークを提案する。
GTAlignは,ベースラインに比べて推論効率,回答品質,相互福祉を著しく改善することを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:05:14 GMT)
LLP: LLM-based Product Pricing in E-commerce [34.1] 本稿では,Large Language Models (LLMs) ベースの生成フレームワークについて紹介する。
LLMは、動的市場の変化に合わせて、まず同様の製品を回収する。
次に、自由形式のテキストで重要な価格情報に対するLLMの微妙な理解を活用して、正確な価格提案を生成する。
当社は中国最大の中古eコマースプラットフォームであるXianyufootnoteXianyuにLPPを配備することに成功しました。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:00:57 GMT)
Tiny-R1V: Lightweight Multimodal Unified Reasoning Model via Model Merging [34.0] Tiny-R1Vは2段階最適化により高速な推論と高精度を実現する軽量3Bモデルである。
最初の段階では、Tiny-R1Vは、新しい強化学習法であるLength-Informed Relative Policy Optimization (LIPO)を導入した。
第2段階では、トレーニング不要なモデルマージ手法である適応モデルマージ(AMM)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:14:57 GMT)
CLARITY: Clinical Assistant for Routing, Inference, and Triage [34.0] CLARITYは、患者からスペシャリストへのルーティング、臨床相談、患者状態の重症度評価を容易にするために設計された、AI駆動のプラットフォームである。
そのハイブリッドアーキテクチャは、構造化対話フローのための有限状態機械(FSM)と、LLM(Large Language Model)を用いた協調エージェントを組み合わせて、症状を分析し、適切な専門家への参照を優先順位付けする。
モジュール化されたフレームワーク上に構築されたCLARITYは、安全で効率的で堅牢なパフォーマンスを保証すると同時に、医療における既存およびITソリューションの要求を満たすために、柔軟で容易にスケーラブルである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:58:15 GMT)
PAC Reasoning: Controlling the Performance Loss for Efficient Reasoning [33.7] 大規模推論モデル(LRM)は複雑な問題解決タスクにおいて顕著な進歩を遂げた。
LRMは通常、展開中に高い計算コストに悩まされる。
本稿では,ユーザが指定した性能損失耐性の下での性能損失を制御するPAC推論を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:33:47 GMT)
Physically Valid Biomolecular Interaction Modeling with Gauss-Seidel Projection [33.4] 我々は、拡散モデルから最も近い物理的に有効な共役に仮原子座標をマッピングする微分可能な射影モジュールを開発する。
この射影はガウス・シーデルスキームを用いて達成され、これは制約の局所性と空間性を利用して、スケールにおける安定かつ高速な収束を保証する。
6つのベンチマークで、我々の2ステップモデルでは、最先端の200ステップ拡散ベースラインと同じ構造精度を達成し、物理的妥当性を保証しながら、壁面時計の約10倍の速度を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:52:15 GMT)
Entropy Regularizing Activation: Boosting Continuous Control, Large Language Models, and Image Classification with Activation as Entropy Constraints [32.9] モデル出力に特別に設計されたアクティベーションを適用することで、与えられた閾値以上のサンプリングエントロピーを制約する新しいパラダイムであるERAを提案する。
我々の研究は、出力の活性化をエントロピー制御の強力なツールとして評価し、よりシンプルで堅牢なアルゴリズムを設計するための新たな方向性を開拓する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:41:32 GMT)
Exploring Multi-Temperature Strategies for Token- and Rollout-Level Control in RLVR [32.8] 本稿では,異なるトークンに対して異なる温度設定を適用することで,サンプリング中の探索を明示的に促進する補完的アプローチを提案する。
具体的には, 知識トークンの温度を低く保ち, 事実の正しさを保ちながら, 探索を活発に進めるために, 推論トークンの高温を用いる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:11:42 GMT)
Tag-Enriched Multi-Attention with Large Language Models for Cross-Domain Sequential Recommendation [32.7] クロスドメインシークエンシャルレコメンデーション(CDSR)は、現代の消費者電子製品や電子商取引プラットフォームにおいて重要な役割を担っている。
我々はtextitLarge Language Models (LLMs) を統合した textbfTEMA-LLM を提案する。
4つの大規模なeコマースデータセットに関する大規模な実験は、TEMA-LLMが最先端のベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:12:09 GMT)
HoliTom: Holistic Token Merging for Fast Video Large Language Models [32.6] ビデオ言語モデル(ビデオLLM)は、ビデオ理解において優れるが、冗長なビデオトークンによる計算不効率に直面する。
HoliTomは、新しいトレーニング不要な全体的トークンフレームワークである。
また,内部LLMトークンの類似性に基づくマージ手法を導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:28:40 GMT)
Cross-attention Secretly Performs Orthogonal Alignment in Recommendation Models [32.5] クロスドメインシーケンシャルレコメンデーションは、異なるドメインから収集された異種ユーザ行動シーケンスを整列することを目的としている。
ほとんどの研究者は、クロスアテンションを残差アライメントと解釈し、冗長な情報を取り除き、非冗長な情報を保存することによって出力を生成する。
本稿では,クエリ入力に存在しない新しい情報を相互に関連付ける現象であるorthogonal Alignmentを紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:45:39 GMT)
Towards Natural Machine Unlearning [32.4] マシン・アンラーニング(MU)は、特定のトレーニングデータ、すなわちデータを忘れることから学んだ情報を、事前訓練されたモデルから排除することを目的としている。
現在、既存のMUメソッドの主流は、誤ったラベルで忘れたデータを修正し、その後、モデルを微調整することである。
我々は,テキストナチュラル・マシン・アンラーニングを導入し,ラベルを変更する際に,残りのデータから正確な情報を忘れるサンプルに注入する。
これらの調整されたサンプルをラベルと組み合わせることで、モデルではインジェクションされた正しい情報を使用し、忘れるべき情報を自然に抑制する傾向にある。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:28:32 GMT)
SMF: Template-free and Rig-free Animation Transfer using Kinetic Codes [32.3] アニメーション再ターゲッティングはキャラクタメッシュにスパース動作記述を適用し、意味論的に妥当で時間的に整合したフルボディシーケンスを生成する。
本稿では,スパース動作表現のみを訓練した自己教師型運動場(SMF)を提案する。
我々のアーキテクチャは、エンドツーエンドで共同で訓練された専用空間勾配予測器と時間勾配予測器から構成される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:19:38 GMT)
Advancing Intoxication Detection: A Smartwatch-Based Approach [32.2] この研究は、中毒警告に対するジャストインタイム介入に対するモバイルスマートウォッチアプリケーションアプローチを導入している。
3週間の期間に,TAC,加速度計,ジャイロスコープ,心拍データを収集するデータセットを作成した。
これは、加速度計、ジャイロスコープ、心拍計のデータを長期にわたって収集し、中毒レベルを分類する最初の研究である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:21:15 GMT)
MorphGen: Controllable and Morphologically Plausible Generative Cell-Imaging [32.0] MorphGenは、蛍光顕微鏡のための最先端拡散ベースの生成モデルである。
蛍光チャネルの完全なセットを共同で生成し、構造体ごとに保存する。
MorphGenは、以前の最先端のMorphoDiffよりも35%低いFIDスコアを獲得している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:11:46 GMT)
A Representer Theorem for Hawkes Processes via Penalized Least Squares Minimization [31.9] 代表者定理(英: representer theorem)は、カーネルヒルベルト空間を再現する潜在関数を推定することを目的とした、カーネル法の基礎となる定理である。
変換されたカーネルの族は、同時積分方程式の系によって定義される。
注目すべきは、双対係数はすべて解析的にユニタリに固定され、双対係数を得るためにコストのかかる最適化問題を解く必要がなくなることである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:00:56 GMT)
DualResearch: Entropy-Gated Dual-Graph Retrieval for Answer Reconstruction [31.4] DualResearchはツール集約推論の構造にマッチする検索および融合フレームワークである。
オープンソースのInternAgentのログファイルを使用して、安定して、効果的に回答を再構築する。
HLEとGPQAの科学的推論ベンチマークでは、DualResearchは競争性能を達成している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:10:17 GMT)
Layout-Aware Parsing Meets Efficient LLMs: A Unified, Scalable Framework for Resume Information Extraction and Evaluation [31.4] 自動抽出・評価のためのレイアウト認識・効率最適化フレームワークを提案する。
私たちのシステムはAlibabaのインテリジェントなHRプラットフォームに完全にデプロイされています。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:01:35 GMT)
zkFuzz: Foundation and Framework for Effective Fuzzing of Zero-Knowledge Circuits [31.3] ZK回路はプライバシー保護計算を可能にし、多くの暗号プロトコルの中心となっている。
既存のツールは、中間計算やプログラム中止など、いくつかの重要な動作を見落としている。
我々の理論的貢献は、ZK回路バグの基本的な言語に依存しない定式化であるTrace-Constraint Consistency Test (TCCT)である。
当社のシステムコントリビューションは、TCCT違反を検出するための新しいプログラム突然変異ベースのファジリングフレームワークであるzkFuzzである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:15:49 GMT)
DITING: A Multi-Agent Evaluation Framework for Benchmarking Web Novel Translation [31.2] DIINGは、Webノベル翻訳のための最初の総合的な評価フレームワークである。
AgentEvalは専門家による検討をシミュレートし、語彙オーバーラップを超えて翻訳品質を評価する。
誤りラベルとスカラー品質スコアを付加した300文対のメタ評価データセットであるMetricAlignを開発した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:10:10 GMT)
Geo-Aware Models for Stream Temperature Prediction across Different Spatial Regions and Scales [30.8] GeoSTAR-Sは、異なる流域と空間スケールにまたがる水温を予測するためのフレームワークである。
GeoSTAR-Sの大きな革新は、ジオアウェア埋め込みの導入である。
河川水温予測におけるGeoSTAR-Sの有効性について検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:04:35 GMT)
ICL-Router: In-Context Learned Model Representations for LLM Routing [30.8] 本稿では,モデル機能を表現するために,コンテキスト内ベクトルを用いた新しいルーティング手法を提案する。
本手法は,分散処理とアウト・オブ・ディストリビューション処理の両方において,最先端のルーティング性能を実現する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:47:37 GMT)
Can a MISL Fly? Analysis and Ingredients for Mutual Information Skill Learning [30.6] 自己教師型学習は、今日の強化学習におけるいくつかの重要な課題を取り上げる可能性を秘めている。
最近の研究(METRA)は、相互情報から離れ、代わりに特定のワッサーシュタイン距離を最適化することが、優れたパフォーマンスのために重要であると効果的に主張している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:49:14 GMT)
Velocity and Density-Aware RRI Analysis and Optimization for AoI Minimization in IoV SPS [30.4] 本稿では,Large Language Models (LLM) とDeep Deterministic Policy Gradient (DDPG) に基づく最適化手法を提案する。
まず,車両速度,車両密度,資源保全間隔(RRI)に影響されるAoI計算モデルを構築し,次いで2経路最適化方式の設計を行った。
実験の結果, DDPG法は, モデルトレーニングを必要とせず, 少数の例を蓄積した後にAoIを有意に低減できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:50:23 GMT)
FS-RWKV: Leveraging Frequency Spatial-Aware RWKV for 3T-to-7T MRI Translation [30.3] アクセス可能な3T取得から得られる7T品質の画像は、このアクセシビリティーチャレンジに有効な解決策を提供する。
3T-to-7T MRI翻訳のためのRWKVベースのフレームワークであるFS-RWKVを提案する。
UNCとBNUデータセットの実験では、FS-RWKVは既存のCNN-、Transformer-、GAN-、RWKVベースのベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:58:39 GMT)
Detecting Data Contamination from Reinforcement Learning Post-training for Large Language Models [30.3] データ汚染は大規模言語モデル(LLM)の信頼性評価に重大な脅威をもたらす
この問題は、ベンチマークサンプルが必然的にトレーニングセットに現れ、報告されたパフォーマンスの有効性を損なうことになる。
本稿では,RLポストトレーニングのための特殊汚染検出手法として,自己批判を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:58:50 GMT)
Towards Safer and Understandable Driver Intention Prediction [30.1] 運転者の安全のために,運転予測における解釈可能性の課題を紹介する。
解釈可能なDIPの研究を促進するために,新たなマルチモーダル・エゴ中心のビデオデータセットであるDAAD-Xをキュレートする。
次に,コヒーレントな説明を本質的に生成するフレームワークとして,ビデオコンセプト・ボトルネック・モデル(VCBM)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:41:25 GMT)
AirScape: An Aerial Generative World Model with Motion Controllability [29.7] AirScapeは、6自由度飛行エージェント用に設計された世界初の世界モデルである。
現在の視覚的入力と動きの意図に基づいて将来の観測を予測する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:40:25 GMT)
Training Long-Context, Multi-Turn Software Engineering Agents with Reinforcement Learning [29.6] マルチターン対話型タスクにおけるエージェントの訓練に強化学習をどのように利用できるかを示す。
本手法は,オープンウェイトモデルを用いた多ターン対話タスクのための有能エージェントの訓練のための実践的アプローチを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:53:37 GMT)
CFVBench: A Comprehensive Video Benchmark for Fine-grained Multimodal Retrieval-Augmented Generation [29.6] MRAG(Multimodal Retrieval-Augmented Generation)により、MLLM(Large Language Models)は、外部のマルチモーダルエビデンスによる応答を生成することができる。
既存のベンチマークは、モダリティのカバレッジとフォーマットの多様性に制限されている。
CFVBenchは599の公開ビデオから構築された大規模で手動で検証されたベンチマークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:05:37 GMT)
TimeScope: Towards Task-Oriented Temporal Grounding In Long Videos [29.5] ToTGは、タスクの自然な記述に基づいて必要な情報を含む時間間隔をローカライズすることを目的としている。
TimeScopeは進歩的推論に基づく新しいフレームワークである。
大規模な実験により、TimeScopeは既存の時間的接地法と一般的なMLLMよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:07:03 GMT)
Provable Watermarking for Data Poisoning Attacks [29.4] データ中毒は、伝統的に機械学習システムに対するセキュリティ上の脅威とみなされてきた。
データ中毒に対する2つの実証的および実用的な透かし手法を導入する。
いくつかの攻撃、モデル、データセットの実験を通じて、理論的な結果を検証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:45:33 GMT)
Attention to Non-Adopters [29.4] 2025年6月時点で、アメリカ人の66%がChatGPTを使用していなかった。
我々は,多目的かつ有能なLLMを開発するためには,非アドプタ視点を取り入れることが不可欠である,と論じている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:00:40 GMT)
Cross-Receiver Generalization for RF Fingerprint Identification via Feature Disentanglement and Adversarial Training [29.4] 高周波指紋認証(RFFI)は無線ネットワークセキュリティにとって重要な技術である。
ディープニューラルネットワークは、識別的特徴を抽出する際、顕著な能力を示してきたが、現実の展開は、受信者によって引き起こされる変動によって妨げられている。
本稿では,クロスレシーバ変動に頑健なRFFIフレームワークを提案する。
当社のアプローチは、最先端のベースラインを一貫して上回り、多様な受信設定で平均精度を最大10%向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:01:05 GMT)
DICE: Structured Reasoning in LLMs through SLM-Guided Chain-of-Thought Correction [29.2] 大規模言語モデル(LLM)は、しばしば詳細な命令の遵守よりも推論を優先する。
これに対応するための教師付きデータセットの微調整 LLM は、高い計算コストと限られたパラメータアクセスのために実用的ではない。
我々は,小型言語モデル(SLM)をガイドする軽量フレームワークであるDICEを提案し,LLMの出力をチェーン・オブ・シンク(CoT)補正により改善する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:45:35 GMT)
Base Models Know How to Reason, Thinking Models Learn When [29.1] 一貫性のあるパフォーマンス向上にもかかわらず、思考モデルがどのようにして全く新しい推論能力を学ぶのかは不明だ。
本稿では,ベースモデルにおける推論機構を適切なタイミングで活性化し,思考モデルレベルの推論連鎖を導出するハイブリッドモデルを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:48:16 GMT)
Exploring Single Domain Generalization of LiDAR-based Semantic Segmentation under Imperfect Labels [29.0] 雑音ラベル(DGLSS-NL)に基づくLiDARのための新しいタスク領域一般化について紹介する。
既存の雑音ラベル学習アプローチは,LiDARデータに適合しないことがわかった。
特徴レベルの一貫性を強制し、予測の信頼度を考慮したフィルタリングに基づくクロスエントロピー損失を適用した、強い分岐と弱い分岐を持つデュアルビューフレームワークであるDuNeを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:11:34 GMT)
Student-AI Interaction in an LLM-Empowered Learning Environment: A Cluster Analysis of Engagement Profiles [28.8] 本研究では,多エージェント LLM を用いた学習環境における多様な学習者のプロファイルについて検討した。
学生は様々な行動、認知、感情的なエンゲージメントの傾向を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:33:36 GMT)
Elicit and Enhance: Advancing Multimodal Reasoning in Medical Scenarios [28.6] textitMedE$2$は、医療領域に対するマルチモーダル推論を誘発し、拡張する2段階のポストトレーニングパイプラインである。
Stage-Iでは、2000のテキストのみのデータサンプルを使用して、正確に整理された推論のデモを含む微調整を行う。
ステージIIでは,1500の厳格な治療を行ったマルチモーダル・メディカル・ケースを用いて,モデルの推論能力をさらに強化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:57:52 GMT)
RobustMerge: Parameter-Efficient Model Merging for MLLMs with Direction Robustness [28.4] RobustMergeは、方向ロバスト性を維持するために相補的なパラメータ適応を備えたトレーニング不要なパラメータ効率のマージ手法である。
多様なマルチモーダルタスクからなるベンチマークを構築し,本手法の卓越した性能と一般化性を証明する実験を行った。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:19:20 GMT)
AniME: Adaptive Multi-Agent Planning for Long Animation Generation [28.4] 本稿では,アニメ自動制作のためのディレクター指向マルチエージェントシステムであるAniMEについて述べる。
AniMEは、一貫した文字と同期されたオーディオビジュアル要素を持つシネマティックアニメーションを生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:45:17 GMT)
Boosting Multi-modal Keyphrase Prediction with Dynamic Chain-of-Thought in Vision-Language Models [28.4] マルチモーダルキーフレーズ予測(MMKP)は、テキストのみの手法を超えて進歩することを目的としている。
従来のマルチモーダルアプローチは、困難な不在と目に見えないシナリオを扱う上で、重大な制限があることが証明されている。
MMKPタスクに視覚言語モデル(VLM)を活用することを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:13:07 GMT)
Covariances for Free: Exploiting Mean Distributions for Training-free Federated Learning [28.2] 事前学習モデルを使用することで、データの不均一性が低減され、フェデレーション学習アルゴリズムが高速化される。
最近の研究は、サーバ上のローカルクライアントデータ分散を集約するために、一階と二階の統計を用いたトレーニング不要の手法について検討している。
本稿では,クライアントがサーバに通信するクラス平均の1次統計量のみを使用するクラス共分散行列の非バイアス推定器に基づくトレーニング不要な手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:12:56 GMT)
WUGNECTIVES: Novel Entity Inferences of Language Models from Discourse Connectives [28.2] 談話接続が世界について言語モデルに情報を伝達できるかどうかを考察する。
本稿では,8,880個の刺激のデータセットであるWUGNECTIVESについて述べる。
LMをチューニングして推論動作を示すと、ほとんどの接続性において注目すべき改善が得られます。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:07:45 GMT)
MambaH-Fit: Rethinking Hyper-surface Fitting-based Point Cloud Normal Estimation via State Space Modelling [28.0] 我々は,超表面適合型点雲正規推定に適した状態空間モデリングフレームワークであるMambaH-Fitを提案する。
既存の正規推定法は、しばしば微粒な幾何学構造をモデル化するのに不足する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:35:11 GMT)
Group-Adaptive Adversarial Learning for Robust Fake News Detection Against Malicious Comments [28.0] 偽ニュース検知器の堅牢性を向上させるために,グループ適応型対人訓練戦略を提案する。
本手法は,広い範囲の反対コメント摂動に対する頑健性を高めつつ,強い検出精度を維持している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:39:57 GMT)
RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation [27.8] Repository Planning Graph (RPG)は、統一グラフ内の機能、ファイル構造、データフロー、関数をエンコードする。
ZeroRepoは、提案レベルの計画、実装レベルの構築、テストバリデーションを備えたグラフ誘導コード生成という、グラフ駆動のフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:35:51 GMT)
Gold Panning: Turning Positional Bias into Signal for Multi-Document LLM Reasoning [27.8] 我々は、位置バイアスを診断信号として活用するフレームワークであるGold Panning Banditsを紹介する。
言語モデルのクエリをランダムな置換ベースラインよりも最大65%少なくする関連文書を同定する。
この研究は、LLMバイアスが、効率的な推論時間最適化のために、負債から資産に変換できることを実証している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:28:36 GMT)
VAGPO: Vision-augmented Asymmetric Group Preference Optimization for Graph Routing Problems [27.7] グラフルーティング問題は、グラフ間の最適な経路を見つけることが不可欠であるWeb関連ネットワークにおいて重要な役割を果たす。
最近のデータ駆動最適化手法は大きな進歩を遂げているが、訓練効率と大規模インスタンスへの一般化の限界に直面していることが多い。
本稿では,空間構造と時間的依存関係の両方をキャプチャする,視覚拡張型非対称グループ優先最適化(VAGPO)手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:04:02 GMT)
CQ-DINO: Mitigating Gradient Dilution via Category Queries for Vast Vocabulary Object Detection [27.3] カテゴリクエリに基づくオブジェクト検出フレームワークであるCQ-DINOを提案する。
CQ-DINOは、オブジェクトクエリと学習可能なカテゴリクエリの間の対照的なタスクとして分類を再構成する。
実験により、CQ-DINOは挑戦的なV3Detベンチマークにおいて優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:06:58 GMT)
Mask Tokens as Prophet: Fine-Grained Cache Eviction for Efficient dLLM Inference [27.2] 拡散大言語モデル(dLLMs)は、支配的な自己回帰モデル(ARMs)に代わる有望な選択肢を提供する
既存のキャッシュ消去戦略はARM向けに設計されており、dLLMのユニークな特性を無視しているため、不満足なパフォーマンスにつながる。
トレーニング不要なキャッシュ消去フレームワークであるMaskKVを紹介した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:01:16 GMT)
On Epistemic Uncertainty of Visual Tokens for Object Hallucinations in Large Vision-Language Models [27.2] 我々は、視覚エンコーダ(VE)内の不確実な視覚トークンが、物体の幻覚に寄与する重要な要因であると主張している。
本稿では,VEのみを修飾することにより,物体の幻覚を緩和するための簡易かつ効果的な戦略を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:12:52 GMT)
Improbable Bigrams Expose Vulnerabilities of Incomplete Tokens in Byte-Level Tokenizers [27.1] 非完全トークン、すなわち、バイトレベルバイトペア符号化(BPE)トークン化(英語版)による不完全トークン、すなわち、不完全トークンについて検討する。
実験の結果, 難治性の大群は幻覚行動に顕著に影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:55:08 GMT)
The Geometry of Reasoning: Flowing Logics in Representation Space [27.0] 大規模言語モデル(LLM)が表現空間を通してどのように考えるかを研究する。
フローとしてのLCMの推論をモデル化する新しい幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:44:00 GMT)
Mono4DEditor: Text-Driven 4D Scene Editing from Monocular Video via Point-Level Localization of Language-Embedded Gaussians [26.9] フレキシブルで正確なテキスト駆動4Dシーン編集のためのフレームワークであるMono4DEditorを紹介する。
提案手法は,3次元ガウス関数を量子化したCLIP特徴量で拡張し,言語埋め込み動的表現を生成する。
Mono4DEditorは、さまざまなシーンやオブジェクトタイプにわたる高品質でテキスト駆動の編集を可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:49:49 GMT)
Déréverbération non-supervisée de la parole par modèle hybride [26.8] 本手法では,残響時間(RT60)などの限られた音響情報を用いて,残響システムの訓練を行う。
実験結果から,本手法は最先端技術よりも,様々な客観的指標にまたがる一貫した性能を実現することが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:51:17 GMT)
RadioFlow: Efficient Radio Map Construction Framework with Flow Matching [26.8] 次世代無線システムには、無線マップ(RM)生成が不可欠である。
フローマッチングに基づく生成フレームワークである textbfRadioFlow を提案する。
RadioFlowは8$times$未満のパラメータと4$times$で最先端の拡散ベースのベースラインと比較して高速な推論を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:11:51 GMT)
ControlAudio: Tackling Text-Guided, Timing-Indicated and Intelligible Audio Generation via Progressive Diffusion Modeling [26.3] 我々は,制御可能なTTA生成をマルチタスク学習問題として再キャストし,プログレッシブ拡散モデリング手法であるControlAudioを導入する。
本手法は, ステップバイステップ戦略により, テキスト, タイミング, 音素の特徴を含む, よりきめ細かな情報に適合する。
実験により,コントロールアウディオは時間的精度と発話明瞭度の観点から最先端のパフォーマンスを達成し,客観評価と主観評価の両方において既存の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:19:41 GMT)
Hybrid-grained Feature Aggregation with Coarse-to-fine Language Guidance for Self-supervised Monocular Depth Estimation [26.1] 現在の自己教師型単眼深度推定手法は, 意味空間知識の抽出が不十分なため, 性能限界に遭遇する。
基礎モデル(例えばCLIPやDINO)を体系的に統合し、視覚的先行情報を抽出し、MDEに十分な文脈情報を取得する新しいフレームワークであるHybrid-depthを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:20:19 GMT)
Diagnosing Shoulder Disorders Using Multimodal Large Language Models and Consumer-Grade Cameras [26.0] 医療資源が乏しい地域では、早期かつ正確な診断が大きな課題となっている。
本研究は、診断の基盤として、コンシューマグレードのデバイスが捉えたビデオを導入し、ユーザにとってのコストを削減した。
肩障害の早期診断におけるMLLM(Multimodal Large Language Models)の革新的応用に着目する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:17:23 GMT)
BaNEL: Exploration Posteriors for Generative Modeling Using Only Negative Rewards [26.0] BaNELは、失敗した試みのみを使用してモデルを訓練した後、報酬評価(NRE)の数を最小限にするアルゴリズムである。
複数のスパース・リワードタスクにおいて1つのサンプルを観察することなく,BaNELはモデル性能を向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:55:03 GMT)
TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training [25.7] 拡散モデルは通常、サンプルの非効率性と高いトレーニングコストに悩まされる。
TREADは計算コストを削減し、同時にモデル性能を向上することを示す。
ガイド付きで2.09、ガイドなしで3.93の競合FIDを達成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:22:55 GMT)
SkipClick: Combining Quick Responses and Low-Level Features for Interactive Segmentation in Winter Sports Contexts [25.7] 冬季スポーツにおける対話型セグメンテーションのための新しいアーキテクチャを提案する。
我々のシステムはHQSeg-44kデータセットに適用した場合、NoC@90が6.00、NoC@95が9.89の最先端結果を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:31:21 GMT)
Multi-model Online Conformal Prediction with Graph-Structured Feedback [25.5] 本稿では,新しい多モデルオンライン共形予測アルゴリズムを提案する。
バイパーティイトグラフからフィードバックを収集することで、各ステップで有効なモデルのサブセットを特定する。
そして、このサブセットからモデルを選択して予測セットを構築し、計算複雑性を減らし、予測セットを小さくする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:04:05 GMT)
Approximation theory for 1-Lipschitz ResNets [25.2] 負勾配流の明示的なステップに基づく1-Lipschitz残差ネットワーク(ResNets)に着目した。
本稿では,1-Lipschitz ResNets に対する最初の普遍近似保証を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:27:12 GMT)
Expert-Aided Causal Discovery of Ancestral Graphs [25.0] 因果発見アルゴリズムは、データが不足している場合に顕著に脆弱である。
ほとんどのCD手法に不確実性がないため、ユーザーは結果の診断と精査を妨げている。
これらの問題に対処するために、Ancestral GFlowNets (AGFNs)を導入します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:53:40 GMT)
Hierarchical Semantic RL: Tackling the Problem of Dynamic Action Space for RL-based Recommendations [25.0] 階層型セマンティックRL(HSRL)を導入し、固定されたセマンティックアクション空間(SAS)に対するRLに基づくレコメンデーションを再構成する。
HSRLは、ポリシー学習のためのセマンティックID(SID)としてアイテムをエンコードし、実行中に固定された可逆的なルックアップを通じてSIDを元のアイテムにマップする。
HSRLは18.421%のCVRリフトを1.251%のコストで提供し、RLベースの推奨のためのスケーラブルなパラダイムとしてHSRLをサポートする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:09:10 GMT)
Nav-EE: Navigation-Guided Early Exiting for Efficient Vision-Language Models in Autonomous Driving [24.7] Nav-EEは、タスク固有のエグジット層をオフラインでプリコンプリートし、それらをオンラインに動的に適用する、ナビゲーション誘導早期退避フレームワークである。
実験によると、Nav-EEは完全な推論に匹敵する精度を達成し、レイテンシを最大63.9%削減している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:31:16 GMT)
Cell Instance Segmentation: The Devil Is in the Boundaries [24.6] セルインスタンスセグメンテーションのための最新技術(SOTA)メソッドは、ディープラーニング(DL)セグメンテーションアプローチに基づいている。
本稿では,セル境界特性とラベルを利用して前景画素をセルインスタンスに分割する,Cebと呼ばれる新しいピクセルクラスタリング手法を提案する。
Cebは、セグメンテーション確率マップ上で既存のピクセルクラスタリング手法より優れている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:24:20 GMT)
KORMo: Korean Open Reasoning Model for Everyone [24.6] 本研究は, 英語以外の言語, 特に韓国語を対象に, 主に合成データに基づいて訓練された, 完全にオープンなバイリンガル大言語モデル(LLM)を構築するための, 初めての大規模研究である。
本研究は, 言語的包括的・多種多様な指導スタイルを念頭に置いた合成データが, 大規模事前学習における不安定性や劣化を生じさせないことを示した。
実験の結果,(1) 合成データはモデル崩壊を伴わずに長期訓練を確実に維持でき,(2) バイリンガル指導は韓国語でほぼネイティブな推論と談話のコヒーレンスを可能にすることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:31:25 GMT)
E-ICL: Enhancing Fine-Grained Emotion Recognition through the Lens of Prototype Theory [24.5] 本稿では,プロトタイプ理論の観点からICLの性能低下の原因を明らかにする。
感情認識のための感情文脈学習法(E-ICL)を提案する。
EDOS, Empathetic-Dialogues, EmpatheticIntent, GoEmotionsの詳細な感情データセット実験により, E-ICLが優れた感情予測性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:07:51 GMT)
Quantifying Fairness in LLMs Beyond Tokens: A Semantic and Statistical Perspective [24.5] 大規模言語モデル(LLM)は、しばしば固有のバイアスを伴う応答を生成し、現実のアプリケーションにおける信頼性を損なう。
LLMにおけるグループレベルの公平性を評価するための新しい統計フレームワークであるFiSCo(Fine-fine Semantic Comparison)を提案する。
モデル出力を意味的に異なるクレームに分解し、グループ間およびグループ間の類似性を比較するために統計的仮説テストを適用する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:14:10 GMT)
TBStar-Edit: From Image Editing Pattern Shifting to Consistency Enhancement [24.5] 本稿では,eコマースドメインに適した画像編集モデルTBStar-Editを紹介する。
TBStar-Editは、製品の外観とレイアウトの整合性を保ちながら、正確かつ高忠実な画像編集を実現する。
自己提案型eコマースベンチマークにおいて,TBStar-Editの広範な評価を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:02:57 GMT)
MolSpectLLM: A Molecular Foundation Model Bridging Spectroscopy, Molecule Elucidation, and 3D Structure Generation [24.1] MolSpectLLMはQwen2.5-7Bで事前訓練された分子基盤モデルであり、分子3D構造と実験的分光を統一する。
MolSpectLLMは、NMR、IR、MSベンチマークで平均0.53の精度でスペクトル関連タスクの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:13:53 GMT)
Trust Region Reward Optimization and Proximal Inverse Reward Optimization Algorithm [24.1] 逆強化学習(IRL)は、専門家によるデモンストレーションを説明するための報酬関数を学習する。
現代のIRL法は報酬と政策最適化を交互に行う逆数式(minimax)を用いることが多い。
最近の非敵対的IRLアプローチは、エネルギーベースの定式化を通じて報酬と政策を共同学習することで安定性を向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:47:30 GMT)
Efficient Autoregressive Inference for Transformer Probabilistic Models [24.1] 両パラダイムの利点を保った因果自己回帰バッファを導入する。
統合されたトレーニング戦略により、セットベースと自動回帰モードのシームレスな統合が可能になる。
提案手法は,強いベースラインの予測精度と最大20倍の高速な関節サンプリングを実現する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:32:58 GMT)
On Task Vectors and Gradients [24.0] タスクベクトルとタスク損失の勾配との接続を確立することにより、タスク演算の厳密な理論的基礎を提供する。
標準勾配勾配下では,1つの微調整のエポックから生成されたタスクベクトルは,学習速度によってスケールされた損失の負の勾配と正確に等価であることを示す。
7つの視覚ベンチマークによる経験的分析は、我々の理論を裏付け、最初のエポック勾配がノルムと方向の両方において微調整軌道を支配していることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:56:44 GMT)
StreamingVLM: Real-Time Understanding for Infinite Video Streams [23.9] StreamingVLMは、無限視覚入力のリアルタイムで安定した理解のために設計されたモデルである。
私たちのアプローチは、トレーニングとストリーミング推論を整合させる統合フレームワークです。
Inf-Streams-Evalでは、StreamingVLMはGPT-4O miniに対して66.18%の勝利率を獲得し、1つのNVIDIA H100上で最大8FPSで安定したリアルタイムパフォーマンスを維持する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:59:58 GMT)
HandEval: Taking the First Step Towards Hand Quality Evaluation in Generated Images [23.9] 我々は,手固有の品質評価モデルであるHandEvalを開発した。
HandEvalは、既存のSOTAメソッドよりも人間の判断と整合している。
HandEvalを画像生成とAIGC検出パイプラインに統合する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:39:10 GMT)
Inflated Excellence or True Performance? Rethinking Medical Diagnostic Benchmarks with Dynamic Evaluation [23.9] 臨床診断のための動的ベンチマークであるDyReMeを提案する。
静的な試験スタイルの質問とは異なり、DyReMeは、鑑別診断や一般的な誤診因子のような、新しくて相談のようなケースを発生させる。
実験により, この動的アプローチはより困難で現実的な評価をもたらし, 最先端のLCMと実際の臨床実践との間に有意な相違があることが判明した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:19:04 GMT)
ReFIne: A Framework for Trustworthy Large Reasoning Models with Reliability, Faithfulness, and Interpretability [23.7] 使用可能な推論システムは、解釈可能性、忠実性、信頼性の3つの特性を特徴とする、信頼できるものでなければならない、と我々は主張する。
本稿では,GRPOと教師付き微調整を統合した新しいトレーニングフレームワークReFIneを提案する。
実験の結果,ReFIneモデルはより明確でより構造化された推論トレースを生成することがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:08:44 GMT)
Towards Better & Faster Autoregressive Image Generation: From the Perspective of Entropy [23.6] 本研究は,現在の自己回帰画像生成モデルにおけるサンプリング問題を再検討する。
画像トークンは、テキストトークンとは異なり、低い情報密度と一様でない空間分布を示す。
本稿では,高速な合成速度で自己回帰生成品質を向上させるエントロピーインフォームデコード戦略を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:26:11 GMT)
Preference Discerning with LLM-Enhanced Generative Retrieval [23.6] 逐次レコメンデーションでは、モデルがユーザのインタラクション履歴に基づいたアイテムを推奨する。
本稿では,ユーザの嗜好を生成的レコメンデーションモデルに明示的に規定する,選好識別という新たなパラダイムを提案する。
以上の結果から,Menderはトレーニング中に観察されなかったとしても,ヒトの嗜好によって指導される推奨に効果的に適応することが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:19:09 GMT)
HiBBO: HiPPO-based Space Consistency for High-dimensional Bayesian Optimisation [23.5] HiBBO は、HiPPO を用いた VAE の潜在空間構築に空間整合性を導入する新しい BO フレームワークである。
高次元のベンチマークタスクの実験は、HiBBOが既存のVAEBO法よりも収束速度と解の質で優れていることを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:22:10 GMT)
PEAR: Phase Entropy Aware Reward for Efficient Reasoning [23.4] 本稿では,位相依存型エントロピーを報酬設計に組み込んだ報酬機構であるPEARを紹介する。
4つのベンチマーク実験により、PEARはモデルスケール間の競争精度を維持しながら、応答長を一貫して減少させることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:08:11 GMT)
Rethinking Provenance Completeness with a Learning-Based Linux Scheduler [23.3] セキュリティの脅威や影響の根本原因分析に対するシステムの動作のトレーサビリティを維持する上で、証明は重要な役割を果たす。
近年の研究では、既存の前兆収集システムが真の基準モニターのセキュリティ保証に失敗しているかどうかを疑問視している。
証明のために特別に設計されたLinuxのスケジューラであるAegisを紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:24:58 GMT)
Verifying Chain-of-Thought Reasoning via Its Computational Graph [23.3] CoT(Chain-of-Thought)検証手法は、出力(ブラックボックス)またはアクティベーション(グレイボックス)に基づいて正当性を予測する。
回路ベース推論検証(CRV)というホワイトボックス方式を導入する。
モデルの潜在推論回路の実行トレースと見なされる正しいCoTステップの帰属グラフは、間違ったステップのものと異なる構造指紋を持つことを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:06:04 GMT)
Continual Adapter Tuning with Semantic Shift Compensation for Class-Incremental Learning [23.2] クラスインクリメンタルラーニング(CIL)は、モデルが破滅的な忘れを克服しつつ、新しいクラスを継続的に学習できるようにすることを目的としている。
本稿では,連続学習の文脈において,異なるパラメータ効率チューニング(PET)手法を再検討する。
適応チューニングは,各学習セッションにおいてパラメータ拡張がなくても,プロンプトベースの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:02:09 GMT)
ROC-n-reroll: How verifier imperfection affects test-time scaling [23.2] テストタイムスケーリングは、推論中に追加の計算を活用することで、言語モデルのパフォーマンスを向上させることを目的としている。
BoNとRSは、テストタイムのスケーリングを可能にする検証器を使用するテクニックである。
これらの手法のインスタンスレベルの精度は, 検証器のROC曲線の幾何学的に特徴付けられる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:34:34 GMT)
The 1st Solution for CARE Liver Task Challenge 2025: Contrast-Aware Semi-Supervised Segmentation with Domain Generalization and Test-Time Adaptation [23.2] CoSSeg-TTA は nnU-Netv2 上に構築された GED4 (Gd-EOB-DTPA 拡張肝胆道相MRI) のコンパクトセグメンテーションフレームワークである。
ドメイン適応モジュールは、ランダム化されたヒストグラムスタイルの外観伝達関数とトレーニング可能なコントラスト対応ネットワークを組み込んで、ドメインの多様性を強化し、センター間の変動を緩和する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:33:24 GMT)
When Retrieval Succeeds and Fails: Rethinking Retrieval-Augmented Generation for LLMs [23.1] 大きな言語モデル(LLM)は、言語理解と生成における強力な能力を通じて、幅広いアプリケーションを可能にしました。
この制限を克服するために、LLMと外部検索機構を統合することにより、検索拡張生成(RAG)を開発した。
本稿では,RAGの概要を概観し,その全体的目標とコアコンポーネントについて概観する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:00:31 GMT)
AD-EE: Early Exiting for Fast and Reliable Vision-Language Models in Autonomous Driving [23.1] VLM(Vision-Language Models)のリアルタイム適用は、高いレイテンシと計算オーバーヘッドによって妨げられる。
本稿では,自律運転の領域特性を取り入れた早期排他フレームワークAD-EEを提案する。
提案手法は遅延を著しく低減し,最大で57.58%まで向上し,オブジェクト検出精度を最大で44%向上した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:21:32 GMT)
HeSRN: Representation Learning On Heterogeneous Graphs via Slot-Aware Retentive Network [22.6] HeSRNは、効率的かつ表現力のあるヘテロジニアスグラフ表現学習のための、新しいヘテロジニアススロット対応Retentive Networkである。
HeSRNは、ノード分類タスクにおける最先端の異種グラフニューラルネットワークとグラフトランスフォーマーベースラインを一貫して上回る。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:18:06 GMT)
Minkowski-MambaNet: A Point Cloud Framework with Selective State Space Models for Forest Biomass Quantification [22.4] Minkowski-MambaNetは、生のLiDARから直接ボリュームとAGBを推定する新しいディープラーニングフレームワークである。
最先端の手法を著しく上回り、より正確で堅牢な見積もりを提供する。
この研究は、大規模森林バイオマス分析のための強力なツールを提供し、LiDARベースの森林在庫を推し進める。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:24:00 GMT)
Beyond Single-Granularity Prompts: A Multi-Scale Chain-of-Thought Prompt Learning for Graph [22.2] プレトレイン・プロンプト」パラダイムは、NLPドメインからグラフドメインに拡張されている。
現在のグラフプロンプトチューニング手法は、学習可能なプロンプトベクトルを用いて入力や出力の機能を修正している。
本稿では,MSGCOT(Multi-Scale Graph Chain-of-Thought)プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:48:34 GMT)
Towards Understanding Ambiguity Resolution in Multimodal Inference of Meaning [22.1] 我々は、異なる画像テキストペアを用いて、人間の被験者と研究を行う。
参加者がマスキングや不慣れな単語の意味を推測しやすくするデータの特徴を分析する。
参加者のパフォーマンスと強い相関関係を持つ直感的な特徴しか見つからない。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:29:44 GMT)
Variability Aware Recursive Neural Network (VARNN): A Residual-Memory Model for Capturing Temporal Deviation in Sequence Regression Modeling [22.0] 本稿では,教師付き時系列回帰のための新しい残差認識アーキテクチャである変数認識再帰ニューラルネットワーク(VARNN)を紹介する。
VARNNは、変化とドリフトの信号として、短いコンテキストステップ上の残差から更新される学習されたエラーメモリ状態でフィードフォワード予測を増強する。
以上の結果から,VARNNモデルはドリフトおよびボラティリティ環境下での堅牢な予測を提供し,時系列学習のフレームワークとしての可能性を強調した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:50:50 GMT)
GUI-Shift: Enhancing VLM-Based GUI Agents through Self-supervised Reinforcement Learning [22.0] GUIエージェントのための効果的なビジョンランゲージモデル(VLM)のトレーニングは通常、大規模な注釈付きデータセットに依存する。
本稿では,2つのGUI状態間の遷移を引き起こす初期動作を予測することで,VLMがGUIダイナミクスを学習する自己教師型逆動的タスクであるKステップGUIトランジションを紹介する。
本稿では,ルールベースの最適化とデータフィルタリングを組み合わせることで,VLM性能を向上させるための強化学習フレームワークであるGUI-Shiftを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:28:53 GMT)
Characterizing the Multiclass Learnability of Forgiving 0-1 Loss Functions [21.9] この一般化されたナタラジャン次元が有限である場合に限り、仮説クラスが我々の設定で学習可能であることを示す。
また,設定値フィードバックによる学習の関連も示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:45:42 GMT)
High-Power Training Data Identification with Provable Statistical Guarantees [21.8] 本稿では,厳密な偽発見率(FDR)制御でトレーニングデータの集合を識別する厳密な手法であるProvable Training Data Identification (PTDI)を紹介する。
この手順により、証明可能で厳格なFDR制御と大幅なパワー向上によるトレーニングデータの発見が可能になる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:28:36 GMT)
Epistemic Errors of Imperfect Multitask Learners When Distributions Shift [21.7] ベイズニューラルネットワークのような不確かさを意識した機械学習者は、点予測の代わりに不確かさの定量化を出力する。
我々は、再現可能な(緊急な)不確実性から生じるエラーを識別し、排除する方法を特徴付けるための、原則化されたフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:04:11 GMT)
Robust LLM Training Infrastructure at ByteDance [21.5] ByteRobustは、大規模言語モデルの堅牢で安定したトレーニングに適した、大規模なGPUインフラストラクチャ管理システムである。
LLMトレーニングプロセスの独自性を活用し、定期的に障害を検出して回復するための最優先事項を提供します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:31:38 GMT)
Evaluation of Deformable Image Registration under Alignment-Regularity Trade-off [21.5] 変形可能な画像登録(DIR)は、高いアライメント精度を達成することと変形規則性を維持することの間の本質的にトレードオフがあるため、難しい。
そこで本稿では,DIR手法を全体評価するために,トレードオフを連続的に捕捉する評価手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:15:54 GMT)
Why Do Transformers Fail to Forecast Time Series In-Context? [21.4] 時系列予測(TSF)は、機械学習において難しい問題であり、ほとんど未解決である。
実証的な証拠は、パワフルなトランスフォーマーでさえ、より単純なモデルに勝てないことを一貫して示している。
In-Context Learning(ICL)理論のレンズを用いて,トランスフォーマーのTSF制限に関する理論的解析を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:34:19 GMT)
Benchmarking and Mitigate Sycophancy in Medical Vision-Language Models [21.4] 視覚言語モデルは、しばしば、証拠に基づく推論よりも、社会的手がかりや認識された権威を記述したユーザーとの整合性に優先順位を付ける、幻想的行動を示す。
本研究は, 新規な臨床評価基準を用いて, 医用視覚質問応答における臨床症状について検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:35:53 GMT)
ACD-CLIP: Decoupling Representation and Dynamic Fusion for Zero-Shot Anomaly Detection [21.3] ゼロショット異常検出(ZSAD)によるVLMの事前訓練
パラメータ効率のよい畳み込み型低ランク適応 (Conv-LoRA) アダプタを提案する。
また、テキストプロンプトを適応的に変調するために視覚的コンテキストを活用する動的フュージョンゲートウェイ(DFG)を導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:58:55 GMT)
Diffusion Generative Recommendation with Continuous Tokens [21.2] ContRecは、連続トークンをLLMベースのRecSysにシームレスに統合するフレームワークである。
本研究は,次世代レコメンデーションシステムにおける連続トークン化と生成モデリングの可能性を強調した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:27:13 GMT)
Logit Arithmetic Elicits Long Reasoning Capabilities Without Training [21.1] 我々は、ThinkLogitが、ガイドとして、かなり小さな推論モデルを用いて、長い推論のためにターゲットとなる大きな非推論モデルを調整することができることを示す。
実験の結果、ThinkLogitとThinkLogit-DPOはそれぞれ平均精度を24.5%、29.1%改善した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:07:14 GMT)
Instance-Level Generation for Representation Learning [21.0] インスタンスレベルの認識(ILR)は、幅広いカテゴリではなく個々のオブジェクトを特定することに焦点を当てている。
本稿では,複数のドメインから多様なオブジェクトインスタンスを合成的に生成する新しいアプローチを提案する。
本手法は,実画像に頼らずにILR固有の課題に最初に対処する手法である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:14:33 GMT)
Clear Roads, Clear Vision: Advancements in Multi-Weather Restoration for Smart Transportation [21.0] 逆の気象条件は、画像やビデオの品質を著しく低下させる。
これらの劣化は、自動運転、交通監視、監視といった重要な応用に影響を及ぼす。
本研究は、気象による視覚障害を軽減するために開発された画像と映像の復元技術について概説する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:15:59 GMT)
CLARity: Reasoning Consistency Alone Can Teach Reinforced Experts [20.6] 少ないデータ領域における訓練専門家のLSMは困難であり、しばしばMCQ(Multi-choice Question)に依存している。
大規模プロセスリワードモデル(PRM)のような既存の推論を監督するソリューションは、違法に高価である。
小型汎用LLMのみを用いて推論品質を向上させる費用対効果の高いRLフレームワークであるCLARityを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:21:09 GMT)
LTGS: Long-Term Gaussian Scene Chronology From Sparse View Updates [20.6] スパースビュー更新からの長期ガウスシーン時間について提案する。
我々は急激な動きと微妙な環境変動にもかかわらず、シーンの長期の時系列を強くモデル化する。
私たちのフレームワークは、単純な変換を通じて、複数の時間ステップで一般化できます。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:36:49 GMT)
Zero-shot image privacy classification with Vision-Language Models [20.5] プライバシベンチマークにより,トップ3のオープンソースVision-Language Models (VLM)を評価した。
以上の結果から,VLMはパラメータ数や推論が遅いという点では資源集約性が高いにもかかわらず,プライバシ予測の精度において,より小型のモデルに遅れがあることが示唆された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:50:16 GMT)
Precoder Design in Multi-User FDD Systems with VQ-VAE and GNN [20.4] 我々は、ガウス混合モデル(GMM)とグラフニューラルネットワーク(GNN)の組み合わせに基づいて、サイト固有のプリコーダを設計した以前の作業に基づいて構築した。
本稿では,ベクトル量子化変分オートエンコーダ(VQ-VAE)を用いて,GMMの重要な欠点の1つ,すなわちフィードバックビットに指数関数的にスケールするGMM成分の数を回避した。
さらに、VQ-VAEのディープラーニングアーキテクチャにより、パイロット最適化とともに、VQ-VAEと共にGNNを共同で訓練することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:55:18 GMT)
From Entity Reliability to Clean Feedback: An Entity-Aware Denoising Framework Beyond Interaction-Level Signals [20.3] 暗黙のフィードバックはレコメンデーションシステムの中心であるが、本質的にノイズがあり、しばしばモデルのトレーニングやユーザエクスペリエンスの劣化を損なう。
textbfEARD(textbfEntity-textbfAware textbfReliability-textbfDriven Denoising)は,インタラクションレベルの信号からエンティティレベルの信頼性に移行する軽量フレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:14:05 GMT)
Human-inspired Episodic Memory for Infinite Context LLMs [20.3] 大きな言語モデル(LLM)は目覚ましい能力を示しているが、それでも広範なコンテキストの処理に苦戦している。
EM-LLMは,ヒトのエピソード記憶と事象認識の重要な側面をLCMに組み込む新しい手法である。
EM-LLMは、ベイジアン・サプライズとグラフ理論境界修正の組み合わせを用いて、トークンの列をコヒーレントなエピソード事象に整理する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:27:14 GMT)
Design Principles for Sequence Models via Coefficient Dynamics [20.1] インパルス入力によって駆動される自律線形力学系の出力として線形結合係数をキャストすることにより、この出力演算を明示する統一的なフレームワークを開発する。
この視点は、線形RNNと線形注意を結びつけることに焦点を当てたアプローチとは大きく異なり、多様なアーキテクチャにまたがる共通の数学的テーマを明らかにしている。
これにより、表現性と効率的な実装のトレードオフ、入力選択性に関する幾何学的制約、数値的に安定したトレーニングと情報保持のための安定性条件を識別できる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:42:31 GMT)
The Role of Video Generation in Enhancing Data-Limited Action Understanding [19.4] 本稿では,テキスト・ビデオ拡散変換器を用いて,モデル学習のための注釈付きデータを生成する手法を提案する。
このパラダイムは、人間の介入なしに無限スケールで現実的な注釈付きデータを生成することを可能にする。
提案手法の有効性を5つのタスクにわたる4つのデータセットに示すとともに,ゼロショット動作認識のための最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:22:35 GMT)
DDO: Dual-Decision Optimization for LLM-Based Medical Consultation via Multi-Agent Collaboration [19.2] 大規模言語モデル(LLM)は強力な一般化と推論能力を示す。
textbfDDOは、textbfDual-textbfDecision textbfOptimizationを実行する新しいフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:03:53 GMT)
Active Model Selection for Large Language Models [19.0] LLM SELECTORはLarge Language Models (LLM) のアクティブモデル選択のための最初のフレームワークである。
特に、任意のタスクに対して、LLM SELECTORは、タスクの最良のモデルについて最も有益なアノテートのための小さなクエリセットを適応的に選択する。
LLM SELECTORは、タスクに最適な最寄りのLCMを選択すると、アノテーションコストを最大59.62%削減する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:20:47 GMT)
MultiMAE for Brain MRIs: Robustness to Missing Inputs Using Multi-Modal Masked Autoencoder [18.8] 医療画像データでは、入力シーケンスの欠落が一般的であり、完全な入力データに依存するディープラーニングモデルの課題となっている。
脳MRIを用いた3次元医療画像におけるマルチモーダル・マルチタスク学習のためのマスク付きオートエンコーダ(MAE)パラダイムを開発した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:30:24 GMT)
SQS: Bayesian DNN Compression through Sparse Quantized Sub-distributions [18.7] ベイズ変分学習(SQS)による同時プルーニングと低ビット量子化のための統合フレームワークを提案する。
理論的には、スパースで量子化されたディープニューラルネットワークに対する我々の提案した変分アプローチの一貫性のある結果を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:54:29 GMT)
Goal-oriented Backdoor Attack against Vision-Language-Action Models via Physical Objects [18.7] 視覚言語アクション(VLA)モデルのためのゴール指向バックドアアタック(GoBA)を提案する。
GoBAは、物理的トリガーの存在下で、事前に定義された、目標指向のアクションを実行する。
実験の結果、GOBAは被害者のVLAが97%の入力でバックドアゴールを達成できることを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:09:36 GMT)
ReaLM: Residual Quantization Bridging Knowledge Graph Embeddings and Large Language Models [18.7] 大言語モデル(LLM)は知識グラフ補完(KGC)の強力なパラダイムとして登場した。
我々は、KG埋め込みとLLMトークン化のギャップを埋める、新しく効果的なフレームワークであるReaLMを提案する。
本稿では,ReaLMが最先端性能を実現し,構造化知識と大規模言語モデルとの整合性を確認した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:36:13 GMT)
StatEval: A Comprehensive Benchmark for Large Language Models in Statistics [18.6] StatEvalは統計学に特化した最初の総合ベンチマークであり、難易度をまたいだ幅と深さの両方にまたがる。
学部と大学院のカリキュラムに関する13,817の基本的な問題と、主要な雑誌から抽出された2374の研究レベルの証明タスクで構成されている。
本稿では,算術的タスクと証明的タスクの両方に適したロバストな評価フレームワークを提案し,推論能力のきめ細かい評価を可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:28:43 GMT)
FrameEOL: Semantic Frame Induction using Causal Language Models [18.5] 因果的言語モデル(CLM)に基づく意味的フレーム帰納法を提案する。
In-context Learning(ICL)とDeep Metric Learning(DML)を活用し、フレーム誘導に適した埋め込みを得る。
提案手法が既存のフレーム帰納法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:52:07 GMT)
Efficient Resource-Constrained Training of Vision Transformers via Subspace Optimization [18.5] Weight-Activation Subspace Iteration (WASI)は、バックプロパゲーションのメモリボトルネックを軽減する方法である。
Raspberry Pi 5では、WASIはバニラトレーニングよりも高速なトレーニングと推論を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:03:49 GMT)
Synthetic Series-Symbol Data Generation for Time Series Foundation Models [18.5] 時系列解析の基礎モデル (TSA) が注目されている。
データ不足のトレーニングや不均衡といった課題は、開発を妨げ続けている。
我々は,高品質な時系列データの無制限作成を可能にする,時系列シンボルデータ生成機構を設計する。
時系列表現の強化を目的とした事前学習基盤モデルであるSymTimeを開発した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:19:24 GMT)
Can Large Language Models Master Complex Card Games? [18.4] 大規模言語モデル(LLM)は、様々なタスクにまたがって顕著な機能を示した。
高品質なデータを教師付き微調整することで,LLMが強力なゲームAIの性能にアプローチ可能であることを示す。
LLMは複雑なゲームをマスターする際の一般的な能力の低下を経験するが、この低下をある程度の一般的な命令データを統合することで軽減することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:49:14 GMT)
GyroSwin: 5D Surrogates for Gyrokinetic Plasma Turbulence Simulations [18.3] プラズマ乱流は非線形ジャイロキネティック方程式によって制御される。
縮小次モデルは、しばしばエネルギーの乱流輸送を近似するために実際に使用される。
GyroSwinは、5次元非線形ジャイロキネティックシミュレーションをモデル化できる最初のスケーラブルな5Dニューラルサロゲートである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:45:38 GMT)
Flattery in Motion: Benchmarking and Analyzing Sycophancy in Video-LLMs [18.1] ビデオ大言語モデル(ビデオ-LLM)は、マルチモーダル推論を必要とする現実のアプリケーションにますます統合されている。
これらのモデルが視覚的エビデンスと矛盾する場合でも、ユーザ入力と整合する傾向は、そのような文脈において彼らの信頼性を損なう。
我々は,最新のビデオLLMにおけるサイコファンティックな振る舞いを評価するための最初のベンチマークであるVISE(Video-LLM Sycophancy Benchmarking and Evaluation)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:15:28 GMT)
Fire-EnSF: Wildfire Spread Data Assimilation using Ensemble Score Filter [18.0] 野火管理には正確なリアルタイムの延焼予測が必要である。
データ同化は、数値モデルから生成された観測(リモートセンシングデータなど)と火災予測を統合することで重要な役割を果たす。
本稿では,最近提案された拡散モデルに基づくフィルタアルゴリズム - Ensemble Score Filter (EnSF) の適用について検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:16:13 GMT)
CCDP: Composition of Conditional Diffusion Policies with Guided Sampling [18.0] 本稿では,以前に失敗した動作を避けるため,サンプリング分布を改良する改良されたサンプリング戦略を提案する。
本手法は,探索行動の追加を必要とせずに,回復動作を推定できることを実証する。
提案手法では, サンプリングスペースを動的に調整し, 先行サンプルが不足した場合の効率を向上させる低レベルコントローラを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:15:36 GMT)
SIMBA UQ: Similarity-Based Aggregation for Uncertainty Quantification in Large Language Models [17.8] 不確実性定量化(UQ)は不確実性の尺度を提供する。
Black-box UQメソッドは内部モデル情報へのアクセスを必要としない。
本稿では,高レベルな非言語的類似性に基づくアグリゲーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:22:53 GMT)
EvoC2Rust: A Skeleton-guided Framework for Project-Level C-to-Rust Translation [17.6] EvoC2Rustは、完全なCプロジェクトを同等のRustに変換する自動化フレームワークである。
プロジェクトレベルの翻訳には骨格誘導翻訳戦略を採用している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:23:59 GMT)
Cell2Text: Multimodal LLM for Generating Single-Cell Descriptions from RNA-Seq Data [17.4] 我々は、cRNA-seqプロファイルを構造化された自然言語記述に変換するフレームワークであるCell2Textを紹介する。
遺伝子レベルの埋め込みと事前訓練された大きな言語モデルを統合することで、Cell2Textは、細胞のアイデンティティ、組織の起源、疾患関連、経路活性をキャプチャするコヒーレントな要約を生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:41:57 GMT)
Large Language Model Prompt Datasets: An In-depth Analysis and Insights [17.4] プロンプトは、大きな言語モデル(LLM)の特定のタスクを定義する自然言語命令である。
この作業では、初めて、さまざまなチャネルからソースされたプロンプトデータセットの広範なリストをコンパイルしました。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:15:55 GMT)
Transferable Parasitic Estimation via Graph Contrastive Learning and Label Rebalancing in AMS Circuits [17.4] 本稿では,新しいグラフコントラスト学習フレームワークCircuitGCLを提案する。
表現散乱とラベルリバランシングを統合し、異種回路グラフ間の転送性を高める。
CircuitGCLは全ての最先端(SOTA)メソッドより優れており、R2$は33.64% sim 44.20%$、F1スコアは92タイム sim 2.1times$である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:47:40 GMT)
Fewer Weights, More Problems: A Practical Attack on LLM Pruning [17.3] 最新のLCMプルーニング手法を悪質に悪用できることを示す。
提案手法は,各パラメータがプルーニングされる確率を推定するプロキシメトリックを,敵が計算できるという考えに基づいている。
5つのモデルに対する広範囲な評価を通じて,攻撃の重大さを実証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:42:47 GMT)
The Personalization Trap: How User Memory Alters Emotional Reasoning in LLMs [17.3] ユーザの記憶が大規模言語モデルにおける感情的インテリジェンスに与える影響について検討する。
異なるユーザプロファイルと組み合わせた同一のシナリオが、系統的に異なる感情的解釈を生み出すことが判明した。
パーソナライゼーション用に設計されたシステムは、社会的不平等を必然的に強化する可能性がある。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:39:37 GMT)
Scaling Law in LLM Simulated Personality: More Detailed and Realistic Persona Profile Is All You Need [17.3] 本研究では,大規模言語モデル(LLM)を用いて社会実験をシミュレートし,仮想ペルソナロールプレイングにおける人間の個性をエミュレートする能力を探求する。
本研究は、安定性と識別可能性の個人レベルの分析を含むエンドツーエンド評価フレームワークを開発する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:52:07 GMT)
Revisiting associative recall in modern recurrent models [17.2] 本稿では,現代の反復モデルの性能において,学習率の選択が重要な役割を担っていることを示す。
次に1層変圧器を検査し、その性能が劣っているにもかかわらず、トレーニングダイナミクスが驚くほど誘導ヘッドの形成に類似していることを明らかにする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:13:46 GMT)
Hierarchical Scheduling for Multi-Vector Image Retrieval [17.0] HiMIRは画像検索のための効率的なスケジューリングフレームワークである。
本稿では,画像オブジェクトのアライメントを高めるために,複数の中間粒度を用いた新しい階層的パラダイムを提案する。
実験により,HMIRは精度を向上するだけでなく,既存のMVRシステムに比べて最大3.5倍の計算量を削減できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:36:18 GMT)
Rebalancing with Calibrated Sub-classes (RCS): An Enhanced Approach for Robust Imbalanced Classification [17.0] 本稿では,キャリブレートサブクラス(RCS: Calibrated Sub-classes)を用いた分散校正手法を提案する。
エンコーダ・デコーダネットワークは、不均衡なデータの構造を保ち、絡み合いを防止するために訓練される。
本手法は,周辺地域のデータポイントの分布を利用してパラメータを校正する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:06:13 GMT)
RadVLM: A Multitask Conversational Vision-Language Model for Radiology [16.9] 本稿では,CXR解釈のためのコンパクトなマルチタスク対話基盤モデルRadVLMを提案する。
以上の結果から,RadVLMは対話能力と視覚的グラウンドニングにおいて最先端の性能を達成することが示唆された。
これらの知見は、臨床的に関連するAIアシスタントとしてのRadVLMの可能性を強調している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:06:52 GMT)
HyPINO: Multi-Physics Neural Operators via HyperPINNs and the Method of Manufactured Solutions [16.9] パラメトリックPDEの幅広いクラスにまたがるゼロショット一般化のために設計された多物理ニューラル演算子であるHyPINOについて述べる。
このモデルは、PDEパラメトリゼーションをターゲットとする物理情報ニューラルネットワーク(PINN)にマッピングし、線形楕円型、双曲型、放物型方程式を2次元で扱うことができる。
HyPINOは、PINNによる7つのベンチマーク問題、U-Net、文学、物理インフォームドニューラル演算子(PINO)よりも優れたゼロショット精度を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:06:49 GMT)
MedCAL-Bench: A Comprehensive Benchmark on Cold-Start Active Learning with Foundation Models for Medical Image Analysis [16.8] CSAL (Cold-Start Active Learning) は、事前の知識を必要とせずに、アノテーションのための情報的サンプルを選択することを目的としている。
既存のCSALメソッドの多くは、特徴抽出のためにターゲットデータセットの自己監視学習(SSL)に依存している。
MedCAL-Benchは,医療画像解析のためのFMベースのCSALベンチマークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:42:52 GMT)
Sequence Variables: A Constraint Programming Computational Domain for Routing and Sequencing [16.7] 本稿では,制約プログラミング(CP)におけるシーケンス変数の形式化について述べる。
古典的な後継モデルとは異なり、この計算領域は挿入ベースのLarge Neighborhood Searchを含む任意の訪問とサポート挿入を扱う。
実装は、既存のトレースベースのCPソルバにシーケンス変数を統合するために必要な基礎データ構造で記述される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:29:40 GMT)
Collaborative Unlabeled Data Optimization [16.7] 本稿では,ラベルなしデータの有用性を最大化するための新しいデータ中心パラダイムを開拓する。
ラベルのないデータを配布し、公開可能なタスクに依存しないモデルを活用することで、CoOptはスケーラブルで再利用可能な、持続可能なトレーニングパイプラインを促進します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:30:40 GMT)
Reimagining Agent-based Modeling with Large Language Model Agents via Shachi [16.6] 大規模言語モデル(LLM)によるマルチエージェントシステムにおける創発的行動の研究は重要な研究課題である。
エージェントのポリシーをコア認知コンポーネントに分解する形式的方法論とモジュラーフレームワークであるShachiを紹介する。
提案手法を総合的な10タスクベンチマークで検証し,新しい科学的探究を通じてその能力を実証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:11:03 GMT)
Enhancing Feature Fusion of U-like Networks with Dynamic Skip Connections [16.3] Uライクネットワークは、スキップ接続による医用画像セグメンテーションの基本的なフレームワークとなっている。
従来のスキップ接続には、機能間制約と機能内制約の2つの重要な制限がある。
本稿では,動的スキップ接続(DSC)ブロックを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:58:12 GMT)
Teaching Data Science Students to Sketch Privacy Designs through Heuristics (Extended Technical Report) [16.3] 本稿では,初級データサイエンスの学生が高品質なプライバシスケッチを作成するための障壁を低くする方法について検討する。
データサイエンスの学生24名を対象にしたユーザスタディでは,研究開始時に参加者に3つを提示するだけで,プライバシに関する設計決定のカバレッジを向上できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:26:05 GMT)
GBA-UBF : A Large-Scale and Fine-Grained Building Function Classification Dataset in the Greater Bay Area [16.3] 広東-香港-マカオ大都市圏の急速な都市化は、高解像度でビルレベルの機能的データに対する緊急の需要を生み出している。
5つの機能カテゴリのうちの1つを約400万の建物に割り当てる、大規模できめ細かいデータセットを提示する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:09:16 GMT)
An LLM-as-Judge Metric for Bridging the Gap with Human Evaluation in SE Tasks [15.8] SE-JuryはLLM-as-Ensemble-Judgeの最初の評価基準である。
さまざまなソフトウェアエンジニアリング(SE)ベンチマークでSE-Juryを評価します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:54:06 GMT)
Understanding and Improving Information Preservation in Prompt Compression for LLMs [15.8] 情報集約的なタスクでは、プロンプト長は急速に増加し、計算要求の増大、性能劣化、無関係または冗長な情報からのバイアスが引き起こされる。
本稿では,プロンプト圧縮手法の詳細な解析を可能にする総合評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:52:17 GMT)
RO-Bench: Large-scale robustness evaluation of MLLMs with text-driven counterfactual videos [15.7] 本稿では,ORD(Dynamic Out-of-distribution)対応ビデオテストセット上でMLLMを評価するための最初のベンチマークであるRo-Benchを紹介する。
近年のビデオMLLMを8種類評価し,ロベンチに反現実的映像コンテンツに曝露した場合に,現行のモデルが顕著な性能劣化を示すことを示した。
我々は, 反ファクトデータを用いた微調整MLLMがロベンチの性能を21.73%向上し, MVBenchデータセットの20タスクに対して12.78%改善したことを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:26:48 GMT)
HIPPD: Brain-Inspired Hierarchical Information Processing for Personality Detection [15.6] テキストからのパーソナリティ検出は、言語パターンに基づいて個人の性格特性を推測することを目的としている。
本稿では,ヒト脳の階層的情報処理をエミュレートする人格検出フレームワークであるHIPPDを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:20:35 GMT)
How much can we learn from quantum random circuit sampling? [15.6] ランダム回路サンプリング(RCS)に基づく新しいベンチマーク手法を提案する。
我々は,量子回路の古典的に難解なシミュレーションを伴わずに,この課題を実現する技術を開発した。
この結果から,現在の量子コンピュータと将来の量子コンピュータの実用的なベンチマークプロトコルが確立された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:35:16 GMT)
SUMMA: A Multimodal Large Language Model for Advertisement Summarization [15.5] 本研究では,ビデオ広告を商品価値の高いコンテンツを強調する要約に加工するモデルであるSUMMAを提案する。
SUMMAは2段階の訓練戦略-マルチモーダル指導型微調整と強化学習によって開発される。
オンライン実験は、統計的に広告収入が1.5%増加したことを示している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:22:47 GMT)
Unsupervised lexicon learning from speech is limited by representations rather than clustering [15.4] ゼロソースの単語セグメンテーションとクラスタリングシステムは、テキストラベルにアクセスすることなく、単語のような単位に音声をトークン化することを目的としている。
単語セグメントの表現によって性能が制限されるのか、あるいはそれらを単語のようなタイプに分類するクラスタリング手法によって性能が制限されるのかを問う。
我々は、英語とマンダリンデータに基づく様々なクラスタリング手法(K平均、階層、グラフベース)と、様々な自己教師付き音声特徴を組み合わせる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:12:11 GMT)
Defense against Unauthorized Distillation in Image Restoration via Feature Space Perturbation [15.4] 適応特異値摂動(Adaptive Singular Value Perturbation、ASVP)は、画像復元モデルに適したランタイムディフェンスである。
これはトップク特異値を増幅し、構造化された高周波摂動を注入し、蒸留に必要なアライメントを乱す。
実験の結果、ASVPは生徒のPSNRを最大4dB減らし、SSIMを60-75%減らし、教師のパフォーマンスには何の影響も与えないことがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:14:02 GMT)
ARROW: An Adaptive Rollout and Routing Method for Global Weather Forecasting [15.3] 我々は,グローバル気象予測のための適応ロールアウト型マルチスケールルーティング手法であるARROWを提案する。
モデル内では、Shared-Private Mixture-of-Expertsは、時間スケールにわたる大気力学の共有パターンと特定の特性の両方をキャプチャする。
第2に、現在の気象状況に応じて最適な時間間隔を選択する強化学習に基づく適応的なロールアウトスケジューラを開発する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:00:59 GMT)
CALM: A Causal Analysis Language Model for Tabular Data in Complex Systems with Local Scores, Conditional Independence Tests, and Relation Attributes [15.3] 観測データからの因果発見は生物学のような科学分野に不可欠である。
制約ベースのアプローチやスコアベースのアプローチを含む既存の手法は、重大な制限に直面している。
本稿では,表データに特化して設計された新しい因果解析言語CALMを紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:19:20 GMT)
Artificial Impressions: Evaluating Large Language Model Behavior Through the Lens of Trait Impressions [15.2] 言語に基づく人間の印象やステレオタイプに類似したプロンプトに人工印象を導入・研究する。
インプレッションは、その隠された表現からより直線的にデオード可能であることが分かりました。
また,プロンプトの人工印象は,モデル応答におけるヘッジの質や使用を予測できることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:57:09 GMT)
TC-LoRA: Temporally Modulated Conditional LoRA for Adaptive Diffusion Control [15.0] 現在の制御可能な拡散モデルは、中間的なアクティベーションを変更して新しいモダリティに基づくガイダンスを注入する固定アーキテクチャに依存している。
モデルの重みを直接条件付けすることで動的文脈認識制御を可能にする新しいパラダイムであるTC-LoRAを導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:13:02 GMT)
SeeingSounds: Learning Audio-to-Visual Alignment via Text [15.0] 本稿では,音声,言語,視覚の相互作用を利用した画像生成のためのフレームワークであるSeeingSoundsを紹介する。
音声は凍結言語エンコーダを介して意味言語空間に投影され、視覚言語モデルを用いて文脈的に視覚領域に基底される。
このアプローチは認知神経科学にインスパイアされ、人間の知覚で観察される自然な相互関連を反映している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:42:50 GMT)
Future G Network's New Reality: Opportunities and Security Challenges [15.0] ISAC(Integrated Sensing and Communication)は、ワイヤレス接続をユビキタスセンサーに変換する重要な技術である。
ISACは、トランスフォーメーションな新しい機能をアンロックし、自律システム、強化された人間のセンシング、そして次世代の没入型アプリケーションを動かす。
主要なセキュリティ上の懸念は、従来のデータ保護の重点から、システムの物理的現実そのものに対する認識の完全性を保護するという、新たな優先順位へとシフトしている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:07:17 GMT)
VaseVQA-3D: Benchmarking 3D VLMs on Ancient Greek Pottery [15.0] VaseVQA-3Dデータセットは古代ギリシアの陶器分析のための最初の3次元視覚質問応答データセットとして機能する。
我々はさらにVaseVLMモデルを開発し、ドメイン適応学習によるVaseアーチファクト解析におけるモデル性能を向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:14:35 GMT)
CausalVLBench: Benchmarking Visual Causal Reasoning in Large Vision-Language Models [14.9] 大規模視覚言語モデル(LVLM)は、認識や視覚的質問応答といったタスクにおいて顕著な性能を示している。
LVLMからのマルチモーダルインコンテキスト学習のための総合因果推論ベンチマークを導入する。
3つの因果表現学習データセットの因果推論タスクにおいて、最先端のオープンソースLVLMの能力を評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:38:10 GMT)
ProxRouter: Proximity-Weighted LLM Query Routing for Improved Robustness to Outliers [14.8] 大規模言語モデル(LLM)クエリルータは、現代のAIプラットフォームにとって極めて重要である。
非パラメトリックルータにおけるバイアスと分散のバランスをとるために指数関数的に傾いたアグリゲーション機構を応用したProxを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:28:14 GMT)
Untangling Component Imbalance in Hybrid Linear Attention Conversion Methods [14.8] 学習後線形化法は, 事前学習した変換器を線形モデルに効率的に変換する。
既存のハイブリッドメソッドは、必然的に線形成分をバイパスする。
バランスの取れたコンポーネントの使用を確保するための3つのソリューションを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:42:09 GMT)
Integrated Analysis for Electronic Health Records with Structured and Sporadic Missingness [14.8] 本稿では電子健康記録(EHR)に適した新しい計算法を提案する。
これらのギャップに対処することにより、本手法は、分析の統合、データ有用性の向上、および人口健康の理解を促進するための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:29:04 GMT)
FM-IRL: Flow-Matching for Reward Modeling and Policy Regularization in Reinforcement Learning [14.8] Flow Matching (FM) は、複雑な分布をモデル化する際、顕著な能力を示している。
FMベースの政策は、本質的に環境相互作用と探索の欠如によって制限されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:08:10 GMT)
OSCAR: Orthogonal Stochastic Control for Alignment-Respecting Diversity in Flow Matching [14.7] フローベースのテキスト・ツー・イメージモデルは決定論的軌跡に従っており、ユーザーは様々なモードを見つけるために繰り返しサンプルを採取せざるを得ない。
本稿では,フロー自体を多様性に配慮した,トレーニング不要な推論時間制御機構を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:07:19 GMT)
WARC-Bench: Web Archive Based Benchmark for GUI Subtask Executions [14.5] 複雑な現実世界のWebサイトをナビゲートするためにWebエージェントを訓練するには、$itsubtasks$をマスターする必要がある。
WARC-Benchは、サブタスク上でマルチモーダルAIエージェントを評価するように設計された438のタスクを特徴とする、新しいWebナビゲーションベンチマークである。
我々は、WARC-Benchが64.8%という最も高い成功率を持つコンピュータ使用モデルの先導に挑戦していることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:20:51 GMT)
Beyond Demonstrations: Dynamic Vector Construction from Latent Representations [14.3] In-Context derived Vector (ICV)メソッドは、大きな言語モデル(LLM)からタスク関連表現を抽出し、推論中に再注入する。
DyVecは、推論時タスク適応のための軽量でデータ効率のソリューションを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:03:33 GMT)
Scaling Laws and Symmetry, Evidence from Neural Force Fields [14.1] アーキテクチャに依存した指数によるデータ、パラメータ、計算について、明確なパワールールのスケーリング動作を示します。
特に、タスク対称性を利用する同変アーキテクチャは、非同変モデルよりもスケールが優れていることを観察する。
我々の分析は、計算最適トレーニングでは、データサイズとモデルサイズはアーキテクチャに関わらず、瞬時にスケールする必要があることを示唆している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:22:00 GMT)
Scalable Multi-Agent Path Finding using Collision-Aware Dynamic Alert Mask and a Hybrid Execution Strategy [14.1] マルチエージェントパスフィンディングは、ロボット工学や自律システムにおいて重要な問題である。
本稿では,分散経路計画と軽量集中コーディネータを組み合わせたハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:25:40 GMT)
Score-Based Density Estimation from Pairwise Comparisons [14.0] 本研究では, 知識の活用と人間のフィードバックからの学習を動機とした, 対比較による密度推定について検討した。
本研究では,未観測目標密度と係留勝者密度を関連付け,スコアマッチングを用いて勝者のスコアを学習する。
信念と勝者密度のスコアベクトルはコリニアであり、位置依存的テンパリング場によってリンクされていることを証明する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:49:24 GMT)
How Good Are LLMs at Processing Tool Outputs? [13.9] 大きな言語モデル(LLM)は、複雑な応答を返すツールを呼び出すために使われる。
ツール応答処理タスクとLLMのJSON処理能力について検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:59:22 GMT)
iBERT: Interpretable Style Embeddings via Sense Decomposition [13.8] iBERT (interpretable-BERT) は、本質的に解釈可能な埋め込みを生成するエンコーダである。
各入力トークンは、k個の文脈に依存しない感覚ベクトル上のスパースで非負の混合として表現される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:37:36 GMT)
Exploropleth: exploratory analysis of data binning methods in choropleth maps [13.8] 我々は、新しいオープンソースのWebベースの地理空間可視化ツールExploplethを紹介した。
ユーザーは、確立したデータバイナリメソッドのカタログと対話し、カスタムマップを比較し、カスタマイズし、エクスポートすることができる。
このツールは、複数のビンニング方法を一視点で提供し、管理単位の再分類をオンザフライでサポートすることにより、技術の状態を向上する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:19:12 GMT)
Geometry-Aware Scene Configurations for Novel View Synthesis [13.8] 不完全な観測から室内環境の没入的な体験を効果的に生み出すためのシーン適応型手法を提案する。
推定された幾何学的足場に関する観測統計を記録し, 基地の最適配置を導出する。
大規模屋内シーンにおけるレンダリング品質とメモリ要件に関する総合的な分析と議論について述べる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:36:11 GMT)
Contour Errors: An Ego-Centric Metric for Reliable 3D Multi-Object Tracking [13.8] 機能的な視点からシナリオを追跡することに関心のあるマッチを特定するためのegoまたはオブジェクト中心のメトリクスであるContour Errors(CE)を紹介します。
3Dカートラッキングでは, コンターエラーにより, 近距離域で80%, 遠距離域で60%のファンクション障害(FPs/FNs)が減少した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:37:08 GMT)
Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges [13.5] 大型言語モデル(LLM)は、自然言語を使って情報を統合し、指示に従い、推論と計画の形式を実行することができる。
マルチモーダルなデータストリームと複数のシステムにまたがるオーケストレーションによって、ラジオロジーはコンテキストに適応し、繰り返しながら複雑なタスクを自動化するエージェントの恩恵を受けるのに一意に適している。
本稿では, LLMエージェントシステムの設計を概観し, 主要なアプリケーションを強調し, 計画とツール使用の評価方法について議論し, エラーカスケード, ツール使用効率, 健康IT統合といった課題の概要を述べる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:56:27 GMT)
Titans Revisited: A Lightweight Reimplementation and Critical Analysis of a Test-Time Memory Model [13.3] Googleが開発したニューラルネットワークモデルであるTitansの軽量な再実装を提案する。
以上の結果から,タイタンはチャンキングによって常に確立されたベースラインを上回っているわけではないことが判明した。
そのNeural Memoryコンポーネントは、注目のみのモデルと比較して、一貫してパフォーマンスを改善している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:03:24 GMT)
ATLAS: Adaptive Trading with LLM AgentS Through Dynamic Prompt Optimization and Multi-Agent Coordination [13.3] 大規模な言語モデルは、財政的な意思決定を約束する一方で、自律的なトレーディングエージェントとしてそれらを展開することは、根本的な課題を提起する。
我々は、市場、ニュース、企業の基本から構造化情報を統合する統合マルチエージェントフレームワークATLASを紹介し、ロバストな取引決定を支援する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:01:51 GMT)
CFDLLMBench: A Benchmark Suite for Evaluating Large Language Models in Computational Fluid Dynamics [13.2] LLM(Large Language Models)は、一般的なNLPタスクに対して強力な性能を示すが、複雑な物理系の数値実験の自動化におけるその有用性は未解明のままである。
CFDLLMBenchは,大学院レベルのCFD知識,CFDの数値的および物理的推論,CFDの文脈依存的な実装という,3つの主要な能力にまたがるLCM性能を総合的に評価するためのベンチマークスイートである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:05:13 GMT)
DiTSinger: Scaling Singing Voice Synthesis with Diffusion Transformer and Implicit Alignment [13.1] 人間の歌声のコンパクトなシードセットは、固定されたメロディと多様な歌詞を組み合わせて構築され、メロディ固有のモデルは500時間以上の中国語の歌唱データを合成するように訓練されている。
そこで我々は, 深度, 幅, 解像度を体系的に拡張した拡散変換器 DiTSinger を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:39:45 GMT)
Solving Linear-Gaussian Bayesian Inverse Problems with Decoupled Diffusion Sequential Monte Carlo [13.1] 線形ガウス逆問題に対する連続モンテカルロ法を設計する。
DDSMC(Decoupled Sequential Monte Carlo)のタンパク質および画像データに対する効果を実証した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:38:06 GMT)
PHyCLIP: $\ell_1$-Product of Hyperbolic Factors Unifies Hierarchy and Compositionality in Vision-Language Representation Learning [13.1] 視覚言語モデルにおける階層構造と構成性をキャプチャするPHyCLIPを提案する。
PHyCLIPは、既存の単一空間アプローチよりも優れており、埋め込み空間においてより解釈可能な構造を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:02:22 GMT)
Augmenting Compliance-Guaranteed Customer Service Chatbots: Context-Aware Knowledge Expansion with Large Language Models [12.9] 検索ベースのチャットボットは、人間の検証されたQ&A知識を利用して、正確で検証可能な応答を提供する。
多様な顧客からの問い合わせを効果的に処理するために、セマンティックな意味を保持する「類似の質問」で知識ベースを増強することはコスト効率のよい戦略である。
本研究は,文脈認識型アプローチにより,包括的意味探索とソース・問合せ・問合せ関係の整合性を高めることを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:59:17 GMT)
CRPS-LAM: Regional ensemble weather forecasting from matching marginals [12.9] CRPS-LAMは,CRPSに基づいて学習した確率的LAM予測モデルである。
モデルに1つの遅延ノイズベクトルをサンプリングして注入することにより、CRPS-LAMは1つの前方通過でアンサンブル部材を生成する。
CRPS-LAMが拡散モデルの低誤差と一致するMEPS領域データセット上でモデルを評価した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:48:31 GMT)
Entropy Meets Importance: A Unified Head Importance-Entropy Score for Stable and Efficient Transformer Pruning [12.8] 本稿では,頭部重大スコアと注意エントロピーを統合したHIES(Head Importance-Entropy Score)を紹介する。
実験的に、HIESベースのプルーニングは、モデル品質を最大15.2%改善し、HISのみの手法よりも安定性を2.04倍改善する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:08:20 GMT)
Online Video Depth Anything: Temporally-Consistent Depth Prediction with Low Memory Consumption [12.8] Video Depth Anything (VDA)は、長いビデオシーケンスで強いパフォーマンスを示している。
大規模言語モデル(LLM)を用いたオンラインVDA(oVDA)
我々のoVDA法は、競合するオンラインビデオ深度推定法を、精度とVRAM使用率の両方で上回っている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:24:53 GMT)
Visual Anomaly Detection for Reliable Robotic Implantation of Flexible Microelectrode Array [12.8] 本稿では,ロボットFME植込みシステムの顕微鏡カメラを用いた画像に基づく異常検出フレームワークを開発した。
統合されたフレームワークを4つのチェックポイントで利用し、マイクロニードル、FMEプローブ、フック結果、インプラント点をチェックする。
タスク仕様を考慮し、感度-耐性トレードオフ問題に対処するプログレッシブパッチ特徴サンプリング手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:16:53 GMT)
Lesion-Aware Post-Training of Latent Diffusion Models for Synthesizing Diffusion MRI from CT Perfusion [12.8] ラテント拡散モデル(LDMs)は圧縮されたラテント空間における効率的な学習を活用する。
この効率性にはトレードオフがあり、重要なピクセルレベルの詳細を妥協させる可能性がある。
本稿では, 画像から画像への変換において, 病変対応の医用画素空間の目的を取り入れた, LDMの新たなトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:51:27 GMT)
Adaptive LoRA Experts Allocation and Selection for Federated Fine-Tuning [12.7] Federated Learning(FL)は、プライバシ保護ソリューションを提供するが、計算制約による課題に直面している。
Low-Rank Adaptation (LoRA) はパラメータ効率の良い微調整手法として登場した。
我々は、ドメイン固有のLoRAエキスパートを割り当て、訓練するための表現類似性に基づいてクライアントを適応的にクラスタ化する新しいフレームワークであるFedLEASEを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:05:39 GMT)
Closing the Data-Efficiency Gap Between Autoregressive and Masked Diffusion LLMs [12.7] マスケード拡散大言語モデル (dLLM) はarLLMパラダイムの強力な代替品として登場している。
我々は arLLMs と dLLMs を微調整し, 知識の一般化と逆の呪いを探索するために, 前後スタイルの質問回答 (QA) を用いて評価する。
本稿では,事前学習されたarLLMへの知識注入のためのマスク付微調整パラダイムを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:43:50 GMT)
Event-RGB Fusion for Spacecraft Pose Estimation Under Harsh Lighting [12.7] 宇宙船のポーズ推定は、ランデブー、ドッキング、軌道上でのサービスなど、自律的な宇宙での運用に不可欠である。
視覚に基づくポーズ推定法は、通常RGBイメージングセンサーを使用するが、厳しい照明条件に悩まされている。
本研究は,RGBとイベントセンサを組み合わせたセンサ融合手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:57:04 GMT)
NL2GenSym: Natural Language to Generative Symbolic Rules for SOAR Cognitive Architecture via Large Language Models [12.7] NL2GenSymは、自然言語から生成的シンボリックルールを生成するために、大規模言語モデルとSOARを統合する新しいフレームワークである。
我々のフレームワークは、自然言語からルールを生成するのに86%以上の成功率を達成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:08:35 GMT)
Covert Entanglement Generation over Bosonic Channels [12.7] 本研究では,正方根法則(SRL)をボソニックチャネル上で隠蔽的に生成可能であることを示す。
さらに, シングルレールおよびデュアルレールフォトニックキュービットを用いた被覆エンタングルメント生成の性能解析を行った。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:04:31 GMT)
GTR-Bench: Evaluating Geo-Temporal Reasoning in Vision-Language Models [12.6] GTR-Bench(Geo-Temporal Reasoning benchmark)は、大規模カメラネットワークにおける移動対象の地理的時間的推論のための新しい課題である。
GTR-Bench上で10以上の人気のあるVisual-Language Model (VLM)の評価は、最高のプロプライエタリモデルであるGemini-2.5-Proでさえ、時空間推論において人間のパフォーマンス(78.61%)よりもかなり遅れていることを示している。
GTR-Benchは貴重な洞察を提供し、空間的時間的知性の研究と応用の新たな機会を開く。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:28:26 GMT)
Deep Learning for Sports Video Event Detection: Tasks, Datasets, Methods, and Challenges [12.5] ビデオイベント検出は現代のスポーツ分析の基盤となり、自動パフォーマンス評価、コンテンツ生成、戦術的意思決定の動力となっている。
近年のディープラーニングの進歩は、代表的なタイムスタンプを識別するアクションスポッティング(AS)や、イベントの正確なフレームをピンポイントする精密イベントスポッティング(PES)といった、関連するタスクの進展を促している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:32:25 GMT)
A Human Behavioral Baseline for Collective Governance in Software Projects [12.5] 我々は,オープンソースコミュニティがバージョン管理のガバナンス文書を通じて,参加とコントロールをどのように記述しているかを検討する。
ペア化されたスナップショットを備えた710のプロジェクトコーパスを使用して、テキストをアクター、ルール、アクション、オブジェクトにパースし、それらをグループ化し、均等性、多様性の豊かさ、ドリフトのためのJensen Shannon分散によって変化を測定します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:04:46 GMT)
OrcaLoca: An LLM Agent Framework for Software Issue Localization [12.5] OrcaLocaはソフトウェアイシューのローカライゼーションの精度を向上させるエージェントフレームワークである。
LLM誘導アクションの優先度に基づくスケジューリング、関連性スコア付きアクション分解、距離対応コンテキストプルーニングを統合している。
また、パッチ生成統合を通じて、オープンソースのフレームワークの最終的な解決率を6.33ポイント改善する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:02:43 GMT)
The Potential of Second-Order Optimization for LLMs: A Study with Full Gauss-Newton [12.5] Gauss-Newton (GN) プレコンディショニングはプレコンディショニングに非常に効果的であり、高次損失項は収束速度に重要でない可能性がある。
層間情報を無視した正確なGNプリコンディショナーは,全GN法の性能とほぼ一致している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:35:10 GMT)
K-ASTRO: Structure-Aware Adaptation of LLMs for Code Vulnerability Detection [12.5] K-ASTROは、大規模言語モデルからのセマンティック埋め込みと抽象構文木(AST)の構造的特徴を組み合わせた軽量なトランスフォーマーモデルで、コード脆弱性検出の効率と精度を向上させる。
提案手法では,突然変異検査にインスパイアされたASTベースの拡張手法,拡張AST機能を組み込んだ構造認識型アテンション機構,コードセマンティクスと構文を統一する共同適応パイプラインを導入している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:41:55 GMT)
On the Interpolation Effect of Score Smoothing in Diffusion Models [12.3] このような創造性は経験的スコア関数の滑らか化による影響から生じるという仮説を考察する。
理論的には、正規化された2層ReLUニューラルネットワークが、経験的スコア関数の約1つのスムーズなバージョンを学習する傾向を示す。
本稿では,ニューラルネットワークを用いた学習スコア関数が,実際にスコアスムーシング効果を誘導することを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:14:52 GMT)
Psyzkaller: Learning from Historical and On-the-Fly Execution Data for Smarter Seed Generation in OS kernel Fuzzing [12.3] 事実上標準のSyzkallerを含む最先端のカーネルファズーは、暗黙のSyscall Dependency Relations(SDR)を尊重する有効なsyscallシーケンスを生成するのに苦労している。
我々は,N-gramモデルを用いてDongtingデータセットからSDRをマイニングする手法を提案する。
実験の結果、Psyzkallerは48時間のファジングでSyzkallerのコードカバレッジを4.6%-7.0%改善し、110.4%-187.2%のクラッシュを引き起こした。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:01:38 GMT)
A microscopic approach to nonlinear theory of spin-charge separation [12.2] 本研究では,ハバードモデルの強結合展開を用いた相関関数の顕微鏡理論を開発する。
エネルギー帯全体における非線形スピンチャージモードの一般的な安定性を示し、すべての非線形特徴を系統的に検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:24:28 GMT)
Networked Information Aggregation via Machine Learning [12.2] 有向非巡回グラフ(DAG)に学習エージェントを埋め込む分散学習問題について検討する。
DAGでは,情報集約が十分に長い経路で発生することが判明した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:15:05 GMT)
Progressive Uncertainty-Guided Evidential U-KAN for Trustworthy Medical Image Segmentation [12.0] 本研究では,硬質領域の特徴表現学習に焦点を合わせるために,プログレッシブ・エビデンス・ガイドド・アテンション(PEUA)機構を提案する。
従来のアプローチとは異なり、PEUAは注意重みを軽視するために低ランク学習を使用しながら、不確実性マップを使用して注意を徐々に洗練する。
そこで我々は,意味保存エビデンス学習(SAEL)戦略を導入し,セマンティック・スムース・エビデンス・ジェネレータとフィデリティ・エンハンス・正規化項を統合して,重要なセマンティクスを維持する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:58:01 GMT)
Bi-level Meta-Policy Control for Dynamic Uncertainty Calibration in Evidential Deep Learning [12.0] 最適不確実性モデリングのためのKL分散係数とディリクレ事前強度を調整する動的メタ学習フレームワークであるMeta-Policy Controller (MPC)を提案する。
MPCはモデル予測の信頼性とキャリブレーションを大幅に向上させ、信頼性に基づくサンプル拒絶後の不確実性校正、予測精度、性能保持を改善する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:39:26 GMT)
Neural Beam Field for Spatial Beam RSRP Prediction [11.9] 高密度無線ネットワークにおけるビーム管理には、正確なビームレベル基準信号受信電力(RSRP)の予測が不可欠である。
本稿では,空間ビームRSRP予測の効率的かつ解釈可能なハイブリッドニューラルネットワーク物理フレームワークであるNeural Beam Field (NBF)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:23:25 GMT)
TIT: A Tree-Structured Instruction Tuning Approach for LLM-Based Code Translation [11.9] LLMに基づくコード翻訳のためのツリー構造化命令チューニングパラダイムであるTITを提案する。
構文的混乱を軽減するため、構文的情報表現モジュールは言語に依存しない構文的特徴を統合する。
高品質の粒度並列データを生成するために、細粒度並列データセット拡張モジュールは、ノードとコードセグメントを整列する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:53:46 GMT)
On the Fairness of Privacy Protection: Measuring and Mitigating the Disparity of Group Privacy Risks for Differentially Private Machine Learning [11.8] データレコードの最悪のプライバシーリスクを効率的に評価できる新しい会員推論ゲームを導入する。
提案アルゴリズムは,グループプライバシリスクの格差を効果的に低減し,DPMLにおけるプライバシ保護の公平性を高める。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:09:08 GMT)
Training Models to Detect Successive Robot Errors from Human Reactions [11.8] この研究は、人間の反応からロボットの失敗の段階を認識するために機械学習を使用する。
会話エラーを繰り返したロボットと対話する26人の被験者を対象にした研究では、映像データから行動特徴を抽出し、モデルを訓練した。
最良のモデルは、エラーを検出するための93.5%の精度と、連続する障害を分類するための84.1%を達成した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:25:44 GMT)
MCMC: Bridging Rendering, Optimization and Generative AI [11.8] マルコフ・チェイン・モンテカルロ法(MCMC)は複雑な高次元分布からのサンプルの描画に特に有効である。
本コースは, 学生, 研究者, 実践者に対して, 生成的物理的レンダリングの共通の目標に向けて, 必要な理論的・実践的なツールを提供することを目的としている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:22:16 GMT)
Theoretical Modeling of LLM Self-Improvement Training Dynamics Through Solver-Verifier Gap [11.7] 理論的には、ソルバ検証ギャップの概念を用いて自己改善の訓練力学をモデル化する。
分析を拡張して、外部データがフレームワーク内のこれらのダイナミクスにどのように影響するかを調べます。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:29:47 GMT)
A Knowledge-Informed Deep Learning Paradigm for Generalizable and Stability-Optimized Car-Following Models [11.7] 自動車追従モデル (CFMs) は交通流解析と自律運転の基礎である。
本稿では,事前学習型大規模言語モデル(LLM)の一般化能力を軽量かつ安定性に配慮したニューラルアーキテクチャに蒸留する知識情報深層学習(KIDL)パラダイムを提案する。
KIDLを実世界のNGSIMおよびHighDデータセット上で評価し、その性能を代表的物理ベース、データ駆動、ハイブリッドCFMと比較した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:43:11 GMT)
Diffusion-based RGB-D Semantic Segmentation with Deformable Attention Transformer [11.6] 本稿では,RGB-Dセマンティックセグメンテーション問題に対処する拡散型フレームワークを提案する。
本研究では,デフォルマブルアテンション変換器をエンコーダとして利用し,奥行き画像から特徴を抽出することにより,デフォルマブルアテンション変換器の特性を効果的に把握できることを実証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:27:31 GMT)
CHUCKLE -- When Humans Teach AI To Learn Emotions The Easy Way [11.6] 感情認識のための認知駆動型CLフレームワークであるCHUCKLE(クラウドソーシング人間理解カリキュラム・知識リード感情認識)を提案する。
LSTMの相対平均精度は6.56%向上し,変圧器は1.61%向上した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:38:06 GMT)
Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions [11.6] 本稿では,複数のアクション提案を生成し,最も高いQ値を選択するアクタアーキテクチャであるSAVOを紹介する。
我々は,制限された移動,器用な操作,大規模な離散行動空間レコメンダシステムなどのタスクを評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:17:12 GMT)
Observation Matrix Design for Densifying MIMO Channel Estimation via 2D Ice Filling [11.5] この目的を達成するために,2次元アイスフィリング (2DIF) アルゴリズムを提案する。
2段2DIF(TS-2DIF)アルゴリズムは、位相シフト器によって実現されたアナログ結合回路を扱うために開発された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:54:36 GMT)
From Data to Rewards: a Bilevel Optimization Perspective on Maximum Likelihood Estimation [11.4] 生成モデルは現代の機械学習のバックボーンを形成し、テキスト、ビジョン、マルチモーダルアプリケーションにおける最先端システムを支える。
これらのアプローチは明示的な報酬信号に依存しており、実際には利用できないことが多く、高品質なデータセットのみがアクセス可能である場合に生成モデルをどのように整合させるかという問題を解き放つ。
そこでは、報酬関数を外部問題の最適化変数として扱い、政策勾配の目的が内部レベルを定義する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:45:35 GMT)
ROBOPSY PL[AI]: Using Role-Play to Investigate how LLMs Present Collective Memory [11.4] 本稿では,Large Language Models (LLMs) が集団記憶をどのようにキュレートし,現在に至るかを研究する,芸術的研究プロジェクトの最初の成果を示す。
訪問者は5つの異なるLCM(ChatGPT with GPT 4o and GPT 4o mini, Mistral Large, DeepSeek-Chat, and a local run Llama 3.1 model)と対話することができ、ナレーターとして機能するよう指示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:25:06 GMT)
LightMamba: Efficient Mamba Acceleration on FPGA with Quantization and Hardware Co-design [11.4] Mambaのようなステートスペースモデル(SSM)が最近注目を集めている。
LightMambaは、効率的なMamba推論のために量子化アルゴリズムとFPGAアクセラレーターアーキテクチャを共同設計する。
我々は、Xilinx Versal VCK190FPGA上にLightMambaを実装し、GPUベースラインよりも4.65倍から6.06倍高いエネルギー効率を達成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:26:17 GMT)
PC-UNet: An Enforcing Poisson Statistics U-Net for Positron Emission Tomography Denoising [11.4] ポジトロン・エミッション・トモグラフィ(PET)は医学において重要であるが、その臨床利用は高い信号-雑音比の線量によって制限されている。
画像の忠実度を改善するため,新しいPoisson Variance and Mean Consistency Loss (PVMC-Loss) を用いたPoisson Consistent U-Net (PC-UNet) モデルを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:26:26 GMT)
Rethinking Medical Anomaly Detection in Brain MRI: An Image Quality Assessment Perspective [11.3] 脳MRIにおける異常検出タスクには、再構成に基づく手法が広く採用されている。
本稿では,構造類似度指標尺度(SSIM)の構造レベルの感度と,画素レベルのl1の精度を適切に統合する新しい尺度である融合品質を提案する。
我々のIQAアプローチは,最先端のベースラインと統合した場合の医療異常検出性能を著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:10:10 GMT)
WyckoffDiff -- A Generative Diffusion Model for Crystal Symmetry [11.0] 本稿では,結晶の対称性に基づく記述を生成する生成モデルWyckoff Diffusionを提案する。
構成による対称性の尊重に加えて、我々のモデルの離散的性質は高速な生成を可能にする。
概念実証研究として、WyckoffDiff を用いて熱力学的安定性の凸殻の下にある新しい物質を探索する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:34:40 GMT)
Safety Game: Balancing Safe and Informative Conversations with Blackbox Agentic AI using LP Solvers [11.0] 既存のアライメントアプローチは費用がかかり、柔軟性がないため、新たな要件が発生すると再トレーニングが必要になる。
推論時アライメントに対する最近の取り組みは、これらの制限の一部を緩和するが、モデル内部へのアクセスを前提としている。
モデルに依存しない安全アライメントのためのブラックボックスフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:32:43 GMT)
Hierarchical Indexing with Knowledge Enrichment for Multilingual Video Corpus Retrieval [10.9] 我々は,NLPCC-2025 M4IVQAチャレンジにおいて,Multilingual Video Corpus Retrieval (mVCR)タスクに取り組む。
ビデオ字幕は意味的に一貫性のあるチャンクに分割され、簡潔な知識グラフ(KG)の事実に富む。
クエリ時に、粗い木々探索プルーネは関係のない枝であり、上位のチャンクだけが軽量な大言語モデル(LLM)によって再描画される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:06:01 GMT)
SOP-Maze: Evaluating Large Language Models on Complicated Business Standard Operating Procedures [10.9] 大規模言語モデル(LLM)はドメイン固有のエージェントとして広くデプロイされている。
実世界のビジネスデータから構築したベンチマークであるSOP-Mazeを提案する。
大規模な実験により、最先端のほぼ全てのモデルがSOP-Mazeと競合していることが判明した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:47:53 GMT)
Understanding Robust Machine Learning for Nonparametric Regression with Heavy-Tailed Noise [10.8] 我々は、Tikhonov-regularized risk minimizationのクローズアップ例として、Huberレグレッションを使用している。
i)弱モーメント仮定下での標準濃度ツールの分解と,(ii)非有界仮説空間によってもたらされる解析的困難に対処する。
我々の研究は、原則化されたルールを提供し、ハマーを超えて他の堅牢な損失に拡張し、頑健な学習を分析するための基本的なレンズとして、過剰なリスクではなく予測エラーを強調します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:57:18 GMT)
Uncolorable Examples: Preventing Unauthorized AI Colorization via Perception-Aware Chroma-Restrictive Perturbation [10.8] 非着色可能な例では、知覚不能な摂動をグレースケールのイメージに埋め込んで、無許可の着色を無効にする。
ImageNetとDanbooruデータセットの実験により、PAChromaは視覚的外観を維持しながら色付け品質を効果的に低下させることが示された。
この研究は、不正なAIのカラー化から視覚的コンテンツを保護し、生成メディアにおける著作権を意識した防御の道を開くための第一歩となる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:46:17 GMT)
One Stone with Two Birds: A Null-Text-Null Frequency-Aware Diffusion Models for Text-Guided Image Inpainting [10.8] テキスト誘導画像のインペイントは、テキストプロンプトに従ってマスクされた領域を再構築することを目的としている。
我々は、テキスト誘導画像のインペイントのための、textbfNTN-Diffと呼ばれるNull-text-null周波数対応拡散モデルを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:44:56 GMT)
TabImpute: Accurate and Fast Zero-Shot Missing-Data Imputation with a Pre-Trained Transformer [10.7] TabImputeはトレーニング済みのトランスフォーマーで、正確で高速なゼロショット計算を提供する。
MissBenchは、32ドルのOpenMLデータセットと13ドルの欠落パターンを備えた計算方法の評価のためのベンチマークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:55:12 GMT)
PlatformX: An End-to-End Transferable Platform for Energy-Efficient Neural Architecture Search [10.7] エッジデバイスに適した効率的なディープニューラルネットワーク(DNN)を設計するための強力なツールとして、ハードウェア・アウェア・ニューラル・アーキテクチャ(HW-NAS)が登場した。
制約を克服するために,完全に自動化され,転送可能なHW-NASフレームワークであるPlatformXを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:22:14 GMT)
CapGeo: A Caption-Assisted Approach to Geometric Reasoning [10.7] CapGeoは、視覚とテキストのモダリティを橋渡しするキャプション支援推論フレームワークである。
モデルがキャプションを装備している場合、実験は大幅に改善される。
また,4,641個のフィギュアキャプションペアのデータセットであるCapGeo-Benchを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:47:54 GMT)
Sequential Monte Carlo for Policy Optimization in Continuous POMDPs [10.7] 連続的な部分観測可能なマルコフ決定プロセスのための新しいポリシー最適化フレームワークを導入する。
本手法は,非マルコフ的ファインマン-カックモデルにおいて,政策学習を確率論的推論とみなす。
提案手法の有効性を,標準連続ポデムPベンチマークで実証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:59:49 GMT)
DSPO: Stable and Efficient Policy Optimization for Agentic Search and Reasoning [10.7] textbfDynamic-filter textbfSequence-level textbfPolicy textbfOptimization (DSPO)を導入する。
DSPOは、シーケンスレベルの最適化と動的サンプルフィルタリングによる堅牢なエージェントトレーニングのために設計された改良されたRLアルゴリズムである。
我々は、RLを通して純粋にモデルをトレーニングし、マルチターン探索と推論をインターリーブし、教師付きデモデータの必要性を回避した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:53:25 GMT)
EFRame: Deeper Reasoning via Exploration-Filter-Replay Reinforcement Learning Framework [10.6] グループ相対政策最適化(GRPO)は効率を向上するが、探索や訓練の不安定さに悩まされる。
GRPOを3次元に拡張するExploration-Filter-ReplayフレームワークであるEFRameを紹介する。
この統合されたフレームワークは、探索、効率、安定性のバランスをとる、原則化されたトレーニングサイクルを確立します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:11:19 GMT)
Three Birds with One Stone: Improving Performance, Convergence, and System Throughput with Nest [10.6] 変分量子アルゴリズム(VQA)は、短期量子コンピュータで量子ユーティリティを実証する可能性を秘めている。
これらのアルゴリズムは、最高の性能を達成するために、最も忠実な量子ビットとコンピュータ上で実行されることが多い。
最近の研究により、VQAは最初は低忠実度量子ビットで動作し、その後は高忠実度量子ビットで動作し、良好な性能が得られることが示されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:30:58 GMT)
On the optimization dynamics of RLVR: Gradient gap and step size thresholds [10.4] Reinforcement Learning with Verifiable Rewards (RLVR) は経験的成功を収めた。
本稿では,RLVRの学習過程を全応答レベル(軌道)とトークンレベルの両方で解析することにより,RLVRの理論的基盤を構築する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:46:51 GMT)
CoBia: Constructed Conversations Can Trigger Otherwise Concealed Societal Biases in LLMs [10.3] CoBiaは、大規模言語モデルが規範的または倫理的行動から逸脱する条件の範囲を洗練できる軽量な敵攻撃スイートである。
CoBiaは、モデルが社会的グループに関する偏見のある主張を発話する、構築された会話を生成する。
次に,モデルが生成したバイアスクレームから回復可能かどうかを評価し,バイアス付きフォローアップ質問を拒否する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:09:01 GMT)
SHERLOCK: Towards Dynamic Knowledge Adaptation in LLM-enhanced E-commerce Risk Management [10.3] 電子商取引業界の成長は、シャドーエコノミーアクターとリスクマネジメントチームとの対立のダイナミクスを強めている。
ケース分析の膨大な量は、リスク管理アナリストにかなりの負荷を課します。
本稿では,大規模言語モデル(LLM)の推論機能を活用し,リスク調査におけるアナリストの支援を行うSHERLOCKフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:57:58 GMT)
Bures-Wasserstein Flow Matching for Graph Generation [10.2] グラフ生成モデルにおける確率経路構築の理論的基盤となる枠組みを提案する。
次に, MRF物体間の最適輸送変位を利用してスムーズな確率経路を設計する。
BWFlowは、導出された最適確率パスを利用するグラフ生成のためのフローマッチングフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:13:41 GMT)
ProbRes: Probabilistic Jump Diffusion for Open-World Egocentric Activity Recognition [10.2] ProbResはジャンプ拡散に基づく確率的残留探索フレームワークである。
その結果,構造化された検索戦略の重要性が強調され,スケーラブルで効率的なオープンワールド活動認識への道が開かれた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:23:46 GMT)
GRADE: Personalized Multi-Task Fusion via Group-relative Reinforcement Learning with Adaptive Dirichlet Exploration [10.2] Adaptive Dirichlet Explorationを用いたグループ相対強化学習は、パーソナライズされたマルチタスク融合のための、新しくて堅牢なフレームワークである。
GRADEは、大規模なA/Bテストにおいて確立されたベースラインを著しく上回っている。
GRADEはKuaishouのマーケットプレース検索のシナリオに完全にデプロイされており、数億人のユーザーにサービスを提供している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:11:36 GMT)
ConDABench: Interactive Evaluation of Language Models for Data Analysis [10.2] 本稿では,会話データ分析(ConDA)ベンチマークを作成し,外部ツールを評価するフレームワークであるConDABenchを紹介する。
ベンチは、(a)パブリックデータセットから得られた洞察を記述した記事から現実的なベンチマークを生成するマルチエージェントワークフロー、(b)このワークフローを使用して生成された1,420のConDA問題、(c)最初に、生成されたConDA問題に基づいて会話データ分析ツールを体系的に評価できる評価ハーネスで構成されています。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:54:51 GMT)
Gradient-based Sample Selection for Faster Bayesian Optimization [10.1] 本稿では,勾配に基づくサンプル選択ベイズ最適化(GSSBO)を提案し,BOの計算効率を向上させる。
提案手法は,ベースライン法に匹敵する最適化性能を維持しつつ,BOにおけるGPフィッティングの計算コストを大幅に削減する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:32:32 GMT)
Nonlinear Heisenberg Limit via Uncertainty Principle in Quantum Metrology [10.1] パラメータ空間における位置-運動量不確実性関係を利用して,ハイゼンベルクのスケーリングを再検討する。
量子光学系において、この非線形スケーリングの強化は、固定されたプローブエネルギーで達成できることを実験的に実証した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:49:24 GMT)
On the Representations of Entities in Auto-regressive Large Language Models [10.1] 本稿では,Large Language Models (LLM) がエンティティをエンコードし,操作する方法を研究するための新しいフレームワークとして,エンティティ参照再構成を導入する。
本稿では、内部表現からエンティティの言及が生成できるかどうか、複数トークンのエンティティがどのようにエンコードされているか、そしてそれらの表現が関係知識を捉えているかどうかを考察する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:23:44 GMT)
Simplified Quantum Weight Reduction with Optimal Bounds [10.0] 低ウェイト符号は物理ハードウェアに量子エラー補正を実装するのに不可欠である。
軽量化はまた、量子PCP予想に関係があるかもしれない批判的理論ツールとしても機能する。
我々は、幾何学的洞察と円錐法を組み合わせた量子量削減の新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:58:31 GMT)
Extended validations on photon number resolving detector based Gaussian boson sampling with low noises [10.0] GBSでは,パターン認識の検証と相関法を比較対象として拡張する。
シミュレーションにより, パターン認識プロトコルは, ノイズが十分に低い場合でも, GBSの雑音評価に頑健であることが示唆された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:30:35 GMT)
Learning Bug Context for PyTorch-to-JAX Translation with LLMs [9.9] 我々は、PyTorchをJAX翻訳に強化するプロンプト拡張フレームワークであるT2Jを紹介します。
我々のパイプラインは2つのPyTorchソースを組み立て、GPT-4o-miniを使って初期のJAXドラフトを生成します。
T2J CodeTrans Score、T2J FixCost Score、T2J Comparison Score。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:22:36 GMT)
MAT-Agent: Adaptive Multi-Agent Training Optimization [9.9] マルチラベル画像分類は、複雑で進化する視覚風景をナビゲートするために適応的なトレーニング戦略を要求する。
MAT-Agentは、協調的リアルタイム最適化プロセスとしてトレーニングを再定義する新しいマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:41:50 GMT)
Privacy-Preserving Parameter-Efficient Fine-Tuning for Large Language Model Services [9.9] 本稿では,大規模言語モデルサービスに対するプライバシ保護を提供するフレームワークを提案する。
RAPTはローカルプライバシアプローチを採用しており、ユーザはテキストからテキストへのローカルな差分プライバシーメカニズムを使用して、データをローカルに民営化することができる。
RAPTは、敵に対するプライバシー保証を提供しながら、タスク間での競合的なパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:32:18 GMT)
Mem4Nav: Boosting Vision-and-Language Navigation in Urban Environments with a Hierarchical Spatial-Cognition Long-Short Memory System [9.7] 大規模都市環境における視覚・言語ナビゲーション (VLN) は、複雑な場面で言語指導を行うための具体的エージェントを必要とする。
階層型空間認識長短メモリシステムである textbfMem4Nav を導入し,任意のVLNバックボーンを拡張できる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:08:39 GMT)
A Scalable, Privacy-Preserving Decentralized Identity and Verifiable Data Sharing Framework based on Zero-Knowledge Proofs [9.7] 本稿では,DIDとVCを効率的にZero-Knowledge Proofスキームに統合する,新しい包括的フレームワークを提案する。
まず、zk-STARKをベースとした強力なプライバシ保護プロトコルのセットを構築する。
第二に、暗号化アキュムレータをベースとした、スケーラブルでプライバシ保護の資格取り消し機構を設計する。
第3に、実用的なソーシャルキー回復スキームを統合し、システムのユーザビリティとセキュリティを大幅に強化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:06:05 GMT)
RegexPSPACE: A Benchmark for Evaluating LLM Reasoning on PSPACE-complete Regex Problems [9.6] 大規模言語モデル(LLM)は、自然言語処理(NLP)、数学的推論、プログラミングにおいて強い性能を示す。
等価決定(RegexEQ)と最小化(RegexMin)という2つのPSPACE完全正規表現(regex)問題に基礎を置く新しいベンチマークを導入する。
様々なスケールの6LLMと5LRMに対して広範囲に評価を行い、冗長性や繰り返しといった共通の障害パターンを明らかにした。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:13:47 GMT)
Post-training quantization of vision encoders needs prefixing registers [9.6] 視覚エンコーダの出力を緩和するトレーニングフリーアルゴリズムを提案する。
提案されたRegCacheは、ターゲットのビジョンエンコーダに、アウトレイラを起こしながら意味的に意味のないプレフィックストークンを導入している。
本手法は,テキスト教師と自己教師付き視覚エンコーダの両面において,量子化モデルの精度を常に向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:33:23 GMT)
Modeling Layered Consciousness with Multi-Agent Large Language Models [9.6] 大規模言語モデル(LLM)における人工意識のモデル化のための枠組みを提案する。
我々は,エージェントインタラクションを通じて,自覚,意識,無意識をシミュレートする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:08:34 GMT)
Humanoid Artificial Consciousness Designed with Large Language Model Based on Psychoanalysis and Personality Theory [9.6] 精神分析の原理に基づく3つの人工意識を発達させる。
また,Mers-Briggs Type Indicator (MBTI) 型を表す個性が異なる16文字を設計する。
定量的および定性的な分析は、十分にシミュレートされた意識の可能性が高かった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:23:50 GMT)
MATT-CTR: Unleashing a Model-Agnostic Test-Time Paradigm for CTR Prediction with Confidence-Guided Inference Paths [9.5] 我々は,訓練されたCTRモデルの予測可能性を解き放つために,モデル非依存テスト時間パラダイム(MATT)を提案する。
特徴組合せの信頼性を定量化するために,階層的確率的ハッシュ法を導入する。
我々は,複数の経路から繰り返しサンプリングを行い,予測スコアを集約し,頑健な予測を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:22:55 GMT)
LLM-as-a-qualitative-judge: automating error analysis in natural language generation [9.5] 自然言語生成のための大規模言語モデル(LLM)に基づく評価手法を提案する。
主出力は、NLGシステム出力における共通問題型の構造化されたレポートである。
以上の結果から, LLM-as-a-qualitative-judge が出力するインスタンス固有の問題は, 2/3 例でヒトの注釈と一致した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:00:41 GMT)
Enabling Population-Level Parallelism in Tree-Based Genetic Programming for GPU Acceleration [9.4] 木に基づく遺伝的プログラミング(TGP)は、記号回帰、分類、ロボット制御などのタスクに広く用いられている進化的計算アルゴリズムである。
EvoGPは、TGPのGPUアクセラレーションに適した高性能なフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:54:22 GMT)
ClustRecNet: A Novel End-to-End Deep Learning Framework for Clustering Algorithm Recommendation [9.4] ClustRecNetは、特定のデータセットに最適なクラスタリングアルゴリズムを決定するための、新しいディープラーニング(DL)ベースのレコメンデーションフレームワークである。
多様な構造を持つ34,000の合成データセットからなる包括的データリポジトリを構築した。
提案するネットワークアーキテクチャは,局所構造パターンとグローバル構造パターンの両方を捉えるために,畳み込み,残差,注意機構を統合している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:12:30 GMT)
ALISE: Annotation-Free LiDAR Instance Segmentation for Autonomous Driving [9.4] アノテーションなしでLiDARインスタンスセグメンテーションを実行する新しいフレームワークであるALISEを紹介する。
我々のアプローチは、テキストと画像でガイドされたビジョンファウンデーションモデル(VFM)を用いて、初期の擬似ラベルを生成することから始まります。
そして、これらのラベルを、オフラインとオンラインの両方の最適化のために2Dと3Dのセマンティクスを組み合わせた専用の手動時間投票モジュールで洗練します。
この包括的な設計により、パフォーマンスが大幅に向上し、教師なしの3Dインスタンスセグメンテーションのための新しい最先端技術が確立される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:25:38 GMT)
Token-Level Policy Optimization: Linking Group-Level Rewards to Token-Level Aggregation via Markov Likelihood [9.3] TEPOはトークンレベルのアグリゲーションを通じてグループレベルの報酬とトークンをリンクする,Markov Likelihood(シーケンス可能性)を組み込んだ新しいトークンレベルのフレームワークである。
実験によると、TEPOは主要なメトリクスで既存のベースラインを一貫して上回っている。
数学的推論タスクに新たな技術状態を設定するだけでなく、トレーニングの安定性を著しく向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:25:28 GMT)
Value-State Gated Attention for Mitigating Extreme-Token Phenomena in Transformers [9.3] トランスフォーマーアーキテクチャに基づく大規模モデルは、注意シンクやバリューステートドレインのような極端に急激な現象に影響を受けやすい。
本稿では,'no-op'アテンションを効率的に行うための,シンプルで専用かつ安定したアーキテクチャ機構であるバリュー・ステート・ゲーテッド・アテンション(VGA)を提案する。
実験により,VGAは注目シンクの形成を著しく軽減し,値-状態ノルムを安定化させ,性能の向上,堅牢な量子化フィディリティ,モデル解釈可能性の向上を実現した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:40:53 GMT)
ChoirRec: Semantic User Grouping via LLMs for Conversion Rate Prediction of Low-Activity Users [9.3] ChoirRecは、Large Language Models(LLM)のセマンティック機能を活用してセマンティックユーザグループを構築する新しいフレームワークである。
ChoirRecはGAUCを1.16%改善し、オンラインA/Bテストでは7.24%のオーダボリュームが増加した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:48:09 GMT)
Bridging Research and Practice in Simulation-based Testing of Industrial Robot Navigation Systems [9.3] Surrealistは、UAV向けのシミュレーションベースのテスト生成フレームワークである。
本手法は,探索に基づくアルゴリズムを用いて,障害回避シナリオを自動的に生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:50:32 GMT)
A Linguistics-Aware LLM Watermarking via Syntactic Predictability [9.2] STELAは,言語固有の言語的自由度と透かし強度を一致させる新しい枠組みである。
我々の検出器は、いかなるモデルロジットもアクセスせずに動作し、公に検証可能な検出を容易にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:26:15 GMT)
Communication-Efficient Distributed Training for Collaborative Flat Optima Recovery in Deep Learning [9.2] 本研究では,ディープニューラルネットワーク(DNN)の並列分散データについて検討し,通信効率とモデル性能のトレードオフを改善する。
Inverse Mean ValleyはDNNの一般化と強い相関関係を示す。
DPPFは他の通信効率の高い手法よりも優れており、局所的な手法や勾配平均よりも優れた一般化性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:35:34 GMT)
Wormhole-Induced correlation: A Link Between Two Universes [9.2] 本研究は, 量子力学と時空幾何学の深い関係を動機として, ワームホール測地が量子情報抽出に与える影響について検討する。
量子真空場から2つのUnruh-DeWitt(UDW)検出器によって抽出された相関特異的相互情報(MI)と絡み合いを,Null-like Throwを特徴とするBTZワームホールの存在下で検討した。
以上の結果から, ワームホールはMI抽出を増強し, 検出器がワームホールに接続された特定の画像対称点にある場合に最大MIを達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:55:45 GMT)
mmJoints: Expanding Joint Representations Beyond (x,y,z) in mmWave-Based 3D Pose Estimation [9.2] mmJointsは、トレーニング済みのブラックボックスmmWaveベースの3Dポーズ推定器の出力を、追加のジョイントディスクリプタで増強するフレームワークである。
我々はmmJointsが4.2%以下のエラー率で記述子を推定していることを示す。
mmJointsはまた、関節位置の精度を最大12.5%向上し、最先端の手法よりも最大16%向上する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:24:56 GMT)
Designing and Evaluating an AI-driven Immersive Multidisciplinary Simulation (AIMS) for Interprofessional Education [9.1] AIMSは、大きな言語モデル(Gemini-2.5-Flash)、Unityベースの仮想環境エンジン、文字生成パイプラインを統合する仮想シミュレーションである。
AIMSは、薬局、医学、看護、ソーシャルワークの学生の間で、共同臨床推論と健康増進能力を高めるために設計された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:09:18 GMT)
SwarmGPT: Combining Large Language Models with Safe Motion Planning for Drone Swarm Choreography [9.1] 我々は,ドローンの性能設計を合理化するための言語ベースの振付師であるSwarmGPTを紹介する。
我々は,最大200機のドローンによるシミュレーションと,20機のドローンによるコレオグラフィーによる実世界実験を通じて,我々のアプローチを検証する。
この研究は、ファンデーションモデルを安全クリティカルなSwarmロボティクスアプリケーションに統合するための青写真を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:52:36 GMT)
Chain-of-Influence: Tracing Interdependencies Across Time and Features in Clinical Predictive Modelings [9.1] カオス・オブ・インフルエンス(Chain-of-Influence, CoI)は、機能相互作用の明示的な時間展開グラフを構築する、解釈可能なディープラーニングフレームワークである。
MIMIC-IVデータセットと民間慢性腎臓病コホートを用いて, 死亡率と疾患進行に関するCoIの評価を行った。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:20:51 GMT)
Users as Annotators: LLM Preference Learning from Comparison Mode [9.0] 我々は、比較モードからユーザアノテーションをペアワイズに選好するデータを収集する代替手法を検討する。
ユーザの潜在品質係数を推定する予測最大化アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:57:34 GMT)
An Imitative Reinforcement Learning Framework for Pursuit-Lock-Launch Missions [9.0] 無人戦闘空母(UCAV) 空中戦において、WVRの戦闘は決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家のデータを効果的に活用する,新しい擬似強化学習フレームワークを提案する。
我々のフレームワークは、複雑な空中戦闘タスクにおける臨界知識を迅速に習得し、100%の成功率を達成し、優れた堅牢性を示すことができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:21:49 GMT)
DeepOHeat-v1: Efficient Operator Learning for Fast and Trustworthy Thermal Simulation and Optimization in 3D-IC Design [9.0] 本稿では,熱解析のための物理インフォームド演算子学習フレームワークDeepOHeat-v1を提案する。
本稿では,座標軸に沿って基底関数を分解し,62倍のトレーニング高速化と31倍のGPUメモリ削減を実現する分離可能なトレーニング手法を提案する。
実験結果から,DeepOHeat-v1は高忠実度有限差分解器を用いた最適化に匹敵する精度が得られた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:43:04 GMT)
Detecting and Filtering Unsafe Training Data via Data Attribution with Denoised Representation [9.0] 大規模言語モデル(LLM)は、少数の安全でないトレーニングデータに対して非常に敏感である。
本稿では,新しい表現型データ属性手法であるDenoized Representation (DRA)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:54:29 GMT)
Improving Multimodal Brain Encoding Model with Dynamic Subject-awareness Routing [8.9] AFIRE(Agnostic Framework for Multimodal fMRI Response)は、様々なエンコーダからの時間整合後トークンを標準化する。
MINDはトークン依存のTop-Kスパースルーティングと、専門家の使用をパーソナライズする前の課題を組み合わせたものだ。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:31:12 GMT)
From Contextual Data to Newsvendor Decisions: On the Actual Performance of Data-Driven Algorithms [8.9] 本研究では,過去データの価値・品質・量が,文脈的ニューズベンダーの問題を分析することによって,パフォーマンスに与える影響について検討する。
データ駆動型アルゴリズムの性能は、文脈に依存した最悪の最悪の後悔という概念を用いて分析する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:56:08 GMT)
Constraint-Guided Unit Test Generation for Machine Learning Libraries [8.9] PyTorchやtensorといった機械学習(ML)ライブラリは、幅広い現代的なアプリケーションに必須である。
テストを通じてMLライブラリの正しさを保証することが重要です。
本稿では,これらの制約を活用するためにPynguinテストジェネレータを改善するアプローチであるPynguinMLを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:02:15 GMT)
Large Language Model Agent for Modular Task Execution in Drug Discovery [8.9] 本稿では,大規模言語モデル(LLM)をベースとしたモジュール型フレームワークを提案する。
LLM推論とドメイン固有のツールを組み合わせることで、バイオメディカルデータ検索、ドメイン固有の質問応答、分子生成、特性予測、特性認識分子精製、および3Dタンパク質リガンド構造生成を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:15:35 GMT)
COMPACT: Common-token Optimized Model Pruning Across Channels and Tokens [8.8] プルーニングは有望な手法であるが、既存のプルーニング手法は限られている。
本研究では, (i) 埋め込み/LMヘッド層を縮小するために希少な語彙を併用し, (ii) 共通トケン重み付き活性化を用いたFFN中間チャネルをプルーするCompactを提案する。
Qwen、LLaMA、Gemmaファミリ(0.5B-70B)にわたる実験では、パラメータ、GPUメモリ、レイテンシを大幅に削減した最先端のダウンストリームのパフォーマンスが示されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:50:18 GMT)
Stronger Re-identification Attacks through Reasoning and Aggregation [8.8] 本稿では,より強力な再識別攻撃を構築するための2つの補完戦略を提案する。
まず、PIIが再識別される_order_が複数の順序にまたがる予測を集約することで、より良い結果が得られることを示す。
また, 推論モデルにより, 特に, 相手が広い背景知識にアクセスできると仮定した場合に, 再同定性能が向上することが判明した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:27:42 GMT)
A Framework for Distributed Resource Allocation in Quantum Networks [8.8] 分散リソース割り当てフレームワークをQuantum Internetに導入し、既存のアプリケーションに完全に分散化された調整を頼りにしている。
我々はQNUM(Quantum Network Utility Maximization)の数学的枠組みの下で量子ネットワーク制御アルゴリズムを開発する。
次に、QPrimal-Dualという分散型でスケーラブルなアルゴリズムを導入し、ローカル状態情報を利用するネットワークコントローラを設置してQNUMを解決する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:27:32 GMT)
Demystifying and Navigating AI Ethics in Power Electronics [8.8] この記事では、電力エレクトロニクスにおけるAI倫理の4つの柱を特定する。
著者は、倫理的議論を率いるためにパワーエレクトロニクス技術者を提唱する。
IEEEパワーエレクトロニクス協会(IEEE Power Electronics Society)は、倫理基準の制定を先導するよう呼びかけている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:51:02 GMT)
RefGrader: Automated Grading of Mathematical Competition Proofs using Agentic Workflows [8.7] State-of-the-art (SOTA) LLMは、証明ベースのOlympiad問題から、IMO 2025問題のほとんどを解決するまで、進歩してきた。
本稿では,90 Gemini 2.5 Pro生成ソリューションのコーパスを用いて,詳細なエラーアノテーションを用いた1-4スケールで評価を行った。
分析の結果、モデルが不正確な解を確実にフラグ付けできるが、部分クレジットの割り当て方法にキャリブレーションのギャップがあることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:47:40 GMT)
Serial-Parallel Dual-Path Architecture for Speaking Style Recognition [8.7] 本稿では,音声スタイル認識のための新しいシリアル並列デュアルパスアーキテクチャを提案する。
提案手法はパラメータサイズを88.4%削減し,テストセット上の8種類のSSR精度を30.3%向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:15:25 GMT)
Multi Camera Connected Vision System with Multi View Analytics: A Comprehensive Survey [8.7] この調査は、MVMCトラッキング、Re-ID、AU、複合メソッドを統合するMVMCの包括的なレビューを初めて提供する。
我々は,CVSの重要成分をよりよく理解し,MVMC追跡,Re-ID,AU,複合手法の4つの重要な部分に分けられる独自の分類法を提案する。
この論文は、複雑な実世界のアプリケーションにおけるCVSの堅牢性、効率、適応性を高めるための重要な研究の方向性を概説することで締めくくっている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:45:01 GMT)
CrisiText: A dataset of warning messages for LLM training in emergency communication [8.5] 今回紹介するCrisiTextは,13種類の危機シナリオを対象とした警告メッセージ生成のための,最初の大規模データセットだ。
データセットには、このようなイベントの前後で民間人を支援することを目的とした40万以上の警告メッセージが含まれている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:32:11 GMT)
Improving Image Captioning Descriptiveness by Ranking and LLM-based Fusion [8.5] State-of-The-Art (SoTA)イメージキャプションモデルは、しばしばMicroSoft Common Objects in Contextデータセットでトレーニングされる。
本稿では,異なるSoTAキャプションモデルから生成されたキャプションを組み合わせて,よりリッチで情報性の高いキャプションを生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:42:26 GMT)
Doc2Query++: Topic-Coverage based Document Expansion and its Application to Dense Retrieval via Dual-Index Fusion [8.5] クエリ生成によるドキュメント拡張(DE)は、スパース検索において語彙ミスマッチに取り組むが、制限に直面している。
ドキュメントの潜在トピックをまず推測することでクエリ生成を構造化するDEフレームワークであるDoc2Query++を紹介します。
本稿では,テキストとクエリ信号を分離し,高密度設定における性能を向上させるDual-Index Fusion戦略を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:07:48 GMT)
Secret-Key Agreement Through Hidden Markov Modeling of Wavelet Scattering Embeddings [8.5] 無線チャネルの相互性に基づくシークレットキーの生成と合意は、IoTネットワークを保護するための有望な道を提供する。
本稿では,ウェーブレット散乱ネットワークを用いた秘密鍵生成手法を提案する。
提案手法は従来のベンチマークに比べて5倍のキー生成率向上を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:32:24 GMT)
Direct Quantized Training of Language Models with Stochastic Rounding [8.4] 様々な大きさのLLaMA構造化モデルの実験結果から,3次値に制約された場合でも,低精度の重み付きトレーニングが実現可能であることが示唆された。
我々のモデルは、FP32から低メモリ環境に移行する際の性能劣化を最小限に抑えながら、精度のスケーリングとメモリ削減に頑健なままです。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:08:17 GMT)
Gaussian Scenes: Pose-Free Sparse-View Scene Reconstruction using Depth-Enhanced Diffusion Priors [8.4] 本研究では2次元画像の粗い集合から360度シーンのポーズなし(カメラパラメータなしで)再構成のための生成的アプローチを提案する。
画像から画像への生成モデルを提案し、3Dシーンの新たな画像レンダリングと深度マップにおいて、欠落した詳細を描き、アーティファクトを除去する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:59:06 GMT)
Evolving Machine Learning: A Survey [8.4] この調査は、データドリフト、コンセプトドリフト、破滅的な忘れ、歪んだ学習、ネットワーク適応の5つの主要な課題に焦点を当てている。
我々は100以上の研究を体系的にレビューし、教師なし、教師なし、および半教師なしのアプローチにまたがって最先端の手法を分類した。
我々の研究は、研究者や実践者が実世界の展開のために堅牢で倫理的でスケーラブルなシステムを開発するのをガイドすることを目的としている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:55:11 GMT)
Fast CZ Gate via Energy-Level Engineering in Superconducting Qubits with a Tunable Coupler [8.4] エネルギーレベル工学による高速制御Z(CZ)ゲートの実装手法を提案する。
数値シミュレーションにより17 nsの非断熱CZゲートが99.99%以上の忠実度で達成された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:11:32 GMT)
Network Dynamics-Based Framework for Understanding Deep Neural Networks [8.4] 本稿では,動的システム理論のレンズを通して学習力学を解析するための理論的枠組みを提案する。
ニューラルネットワークの線形性と非線形性の概念をニューロンレベルで2つの基本変換単位を導入することにより再定義する。
異なる変換モードは、重みベクトルの組織、異なる情報抽出のモード、質的に異なる学習フェーズの出現において、異なる集団的挙動をもたらす。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:49:11 GMT)
If you can distinguish, you can express: Galois theory, Stone--Weierstrass, machine learning, and linguistics [8.3] 我々は「識別力」という関連する概念を結合する基本定理を提供する。
我々は、これらの定理が現れる機械学習とデータサイエンスの文脈について論じ、より一般的には、パワーの区別と表現力の関係のテーマが現れる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:26:57 GMT)
MemLoss: Enhancing Adversarial Training with Recycling Adversarial Examples [8.3] 本稿では,機械学習モデルの対戦訓練を改善するために,MemLossと呼ばれる新しい手法を提案する。
MemLossは'Memory Adversarial Examples'と呼ばれる以前に生成された敵の例を利用して、クリーンなデータのパフォーマンスを損なうことなく、モデルの堅牢性と精度を向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:59:44 GMT)
Mirror Flow Matching with Heavy-Tailed Priors for Generative Modeling on Convex Domains [8.2] 本研究では,フローマッチングとミラーマップを用いた凸領域の生成モデルについて検討する。
本稿では,双対尾部挙動を制御する鏡面図に基づくミラーフローマッチングを提案する。
速度場の空間的リプシッツ性や時間的正則性を含む理論的保証を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:19:23 GMT)
A Frequency-Domain Analysis of the Multi-Armed Bandit Problem: A New Perspective on the Exploration-Exploitation Trade-off [8.2] マルチアームバンディット(MAB)問題は、シーケンシャルな意思決定において最も基本的なモデルの一つである。
本稿では,信号処理問題として帯域幅過程を再構成する新しい周波数領域解析フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:45:14 GMT)
AbBiBench: A Benchmark for Antibody Binding Affinity Maturation and Design [8.2] AbBiBenchは、抗体結合親和性成熟と設計のためのベンチマークフレームワークである。
タンパク質モデルが完全なAb-Ag複合体をどれだけうまくスコアするかを測定することによって、抗体設計の結合電位を評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:13:44 GMT)
A Digital Twin for Diesel Engines: Operator-infused Physics-Informed Neural Networks with Transfer Learning for Engine Health Monitoring [8.2] 物理インフォームドニューラルネットワーク(PINN)とディープオペレータネットワーク(DeepONet)を組み合わせた新しいハイブリッドフレームワークを提案する。
本手法は,ニューラルネットワークのデータ駆動学習と組み合わせて,物理に基づくシステム知識を活用し,モデル適用性を向上させる。
本フレームワークは, 物理モデルとディープラーニングの柔軟性を組み合わせ, ディーゼルエンジン診断における一般化, 精度, 展開効率を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:54:09 GMT)
ViClaim: A Multilingual Multilabel Dataset for Automatic Claim Detection in Videos [8.2] ViClaimは、3つの言語(英語、ドイツ語、スペイン語)と6つのトピックにわたる1,798の注釈付きビデオテキストのデータセットである。
転写文の各文には、クレーム関連カテゴリ: fact-check-worthy, fact-non-check-worthy, opinionの3つがラベル付けされている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:45:02 GMT)
Bounds in the Projective Unitary Group with Respect to Global Phase Invariant Metric [8.1] 射影ユニタリ群 PUn における大域位相不変計量を考える。
PUn のギルバート・バルシャモフ境界とハミング境界を導出する。
また、PUn上に均一に分布するソースを定量化するための歪み率関数のバウンダリを確立する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:16:22 GMT)
A Davydov Ansatz approach to accurate system-bath dynamics in the presence of multiple baths with distinct temperatures [8.1] 複数のDavydov Ansatz (mDA) を用いた時間依存変分法を用いてベンチマークシミュレーションを行う。
パラメータ空間の広い領域について検討し,mDA法の収束挙動を詳細に解析した。
熱場力学と組み合わせたmDA法では, パラメータ空間のほぼすべての領域において, 数値的, 収束的な結果が得られることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:04:03 GMT)
Understanding Ice Crystal Habit Diversity with Self-Supervised Learning [8.1] 氷を含む雲は気候に強く影響するが、氷結晶の習性(すなわち形状)の多様性のためにモデル化は困難である。
我々は、自己教師付き学習(SSL)を用いて、氷結晶画像から結晶の潜在表現を学習する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:18:13 GMT)
Convergence of optimizers implies eigenvalues filtering at equilibrium [7.9] 我々は、異なる勾配が、そのハイパーパラメータによって決定される固有値フィルタとして効果的に機能すると主張している。
これらの知見に触発されて、拡張固有値フィルタリングを示す2つの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:09:14 GMT)
Breakdown of Non-Bloch Bulk-Boundary Correspondence and Emergent Topology in Floquet Non-Hermitian Systems [7.9] 非エルミート系のギャップにおける位相的エッジ状態は、位相的保護のため堅牢である。
エッジ状態は、部分格子対称性を保持する無限小摂動によって抑制される可能性があることを示す。
この結果は、新しい非エルミート位相の探索に期待できる新しい道を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:36:17 GMT)
Generative Data Augmentation in Graph Contrastive Learning for Recommendation [7.9] 高品質な拡張ビューを生成し、堅牢な自己教師型信号を提供するための新しいフレームワークであるGDA4Recを提案する。
我々は、深層生成モデルを利用したノイズ生成モジュールを用いて、データ拡張のための元のデータの分布を近似する。
GDA4Recはさらにアイテム補完行列を抽出し、アイテム間の潜在相関を特徴付け、追加の自己教師付き信号を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:29:21 GMT)
Deep Learning to Identify the Spatio-Temporal Cascading Effects of Train Delays in a High-Density Network [7.9] 本稿では,マルチステップ列車遅延予測のための新しいXGeoAIフレームワークを開発し,評価する。
この研究の核心は、2段階の自動回帰グラフ注意ネットワーク(GAT)モデルであり、オランダの鉄道ネットワークの40%以上をカバーする実世界のデータセットでトレーニングされている。
実運用における実稼働性をテストするため,このモデルを逐次kステップ先予測プロトコルを用いて厳格に評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:03:00 GMT)
A Comprehensive Survey of Mamba Architectures for Medical Image Analysis: Classification, Segmentation, Restoration and Beyond [7.8] Mambaは、医用画像分析におけるテンプレートベースのディープラーニングアプローチに代わるものだ。
線形時間の複雑さがあり、トランスよりも大幅に改善されている。
Mambaは、注意機構のない長いシーケンスを処理し、高速な推論を可能にし、メモリを少なくする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:01:57 GMT)
Informed Routing in LLMs: Smarter Token-Level Computation for Faster Inference [7.7] 本稿では,これらの問題に積極的に対処する新しいパラダイムであるインフォメーションルーティングを紹介する。
我々は、ルーティング決定を行う前に、ユニットの出力を推定する小さな予測モジュールである軽量特徴予測器(LFF)を提案する。
言語モデリングと推論タスクの両方の実験は、情報ルーティングが最先端の効率と性能のトレードオフを達成することを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:59:36 GMT)
AMFT: Aligning LLM Reasoners by Meta-Learning the Optimal Imitation-Exploration Balance [7.7] 大規模言語モデル(LLM)は通常、2段階のパイプライン(SFT)と強化学習(RL)による推論タスクのために微調整される。
最近の単段法では、SFTとRLを原理的に統一しようとするが、2つのパラダイムを動的にバランスさせるメカニズムが欠如している。
我々は,SFTの暗黙的,パスレベルの報酬とRLの明示的,結果に基づく報酬との最適バランスを学習する,新しいシングルステージアルゴリズムである textbf Meta Fine-Tuning (AMFT) を紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:08:20 GMT)
An exploration of the noise sensitivity of the Shor's algorithm [7.7] 本稿では,量子アルゴリズムが固有の雑音耐性特性を持ち,実装障壁を低減することを提案する。
回路レベルのノイズモデルを元の回路に直接適用することにより、ショアのアルゴリズムについて検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:28:19 GMT)
SAM2-3dMed: Empowering SAM2 for 3D Medical Image Segmentation [7.6] SAM2-3dMed を3次元医用画像に応用した SAM2-3dMed を提案する。
スライス相対位置予測(SRPP)モジュールは、双方向のスライス間の依存関係を明示的にモデル化する。
境界検出(Bundary Detection, BD)モジュールは、重要な臓器と組織の境界に沿ったセグメンテーションの精度を高める。
提案手法は,3次元医用画像のセグメンテーション性能を向上するだけでなく,映像中心の基礎モデルを空間データに適用するための一般的なパラダイムを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:23:05 GMT)
Private Quantum Database [7.6] ユーザのプライバシとデータのプライバシを保護する量子データベースを提案する。
ユーザが選択したベースを測定すると、重ね合わせが崩壊し、未クエリ行が物理的にアクセス不能になる。
我々は、相互に偏りのないリレーショナルベース(MUB)上のQRAC(Quantum Random Access Codes)のシーケンスとしてテーブルを符号化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:55:36 GMT)
Beyond Pairwise Connections: Extracting High-Order Functional Brain Network Structures under Global Constraints [7.6] 本稿では,GCM(Global Constraints-oriented Multi- resolution) FBN構造学習フレームワークを提案する。
4種類のグローバル制約(信号同期、被写体識別、予測エッジ数、データラベル)を組み込んで、4つの異なるレベルのFBN構造を学習できるようにする。
実験の結果、GCMは相対的精度を最大30.6%改善し、計算時間を96.3%削減した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:17:21 GMT)
Efficient Bayesian Inference from Noisy Pairwise Comparisons [7.5] Bradley-Terry ベースの手法では、比較結果から項目スコアを更新するが、既存の手法ではレーダの変動を無視するか、収束保証の欠如を無視する。
ベイズ的なBradley-Terry型であるBBQを導入し、レーダの品質、重み付け、信頼できない参加者の排除を明確にモデル化する。
実験の結果、BBQはより早く収束し、よく校正された不確実性推定を行い、より堅牢で解釈可能なランキングを得ることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:37:20 GMT)
A quantum-coherent photon--emitter interface in the original telecom band [7.5] 我々は、元の通信帯域で動作する量子コヒーレント光子エミッタインタフェースを実証する。
この品質は、逆寿命よりもわずか8%幅の変換制限線幅を記録することにより評価される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:41:57 GMT)
Phonikud: Hebrew Grapheme-to-Phoneme Conversion for Real-Time Text-to-Speech [7.4] Phonikudは、完全に特定されたIPA転写を出力する軽量でオープンソースのHebrew grapheme-to-phoneme(G2P)システムである。
我々は、ヘブライ語G2Pのベンチマークとして、IPAアノテーションで転写されたヘブライ語音声のILSpeechデータセットをコントリビュートする。
以上の結果から,Phonikud G2P変換はヘブライ語からの音素を従来手法よりも精度良く予測できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:10:56 GMT)
A Method to Improve the Performance of Reinforcement Learning Based on the Y Operator for a Class of Stochastic Differential Equation-Based Child-Mother Systems [7.4] 本稿では,交流型強化学習における制御性能を高めるために,Y演算子と呼ばれる新しい演算子を提案する。
Y演算子は、子母系のクラスをCritic Networkの損失関数に統合する。
厳密な数学的証明は、演算子の妥当性を確認する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:05:42 GMT)
On Different Notions of Redundancy in Conditional-Independence-Based Discovery of Graphical Models [7.3] 冗長なテストは、学習したモデルのエラーを検出したり、時に修正する可能性があることを示す。
確率分布毎に保持される条件付き(独立性)ステートメントは、誤りを検出して修正することはありそうにない、と我々は主張する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:50:55 GMT)
Accelerating SGDM via Learning Rate and Batch Size Schedules: A Lyapunov-Based Analysis [7.3] 本研究では,動的学習速度およびバッチサイズスケジュール下での勾配降下運動量(SGDM)の収束挙動を解析した。
我々は既存の理論フレームワークを拡張し、ディープラーニングでよく使われる3つの実用的なスケジューリング戦略をカバーする。
一定のバッチサイズは期待されるノルムの収束を保証しないが、バッチサイズの増加は保証しておらず、同時にバッチサイズと学習率の増大は、確実に早く崩壊する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:04:37 GMT)
Visibility-Aware Densification for 3D Gaussian Splatting in Dynamic Urban Scenes [7.3] VAD-GSは3DGSフレームワークで、挑戦的な都市景観の幾何学的復元に適したものだ。
本手法は, ボクセルに基づく可視性推論により, 信頼性の低い幾何学構造を同定する。
多様性を意識したビュー選択を通じて情報的支援ビューを選択し、パッチマッチングベースのステレオ再構築によって行方不明構造を復元する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:22:12 GMT)
Emotion-Disentangled Embedding Alignment for Noise-Robust and Cross-Corpus Speech Emotion Recognition [7.2] 本稿では,音声感情認識モデルの堅牢性向上と一般化のための2段階のアプローチを提案する。
課題条件下での性能向上は,提案手法の有効性を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:17:07 GMT)
Stability of Transformers under Layer Normalization [7.2] 異なる層正規化配置下での深部変圧器の安定性について検討した。
我々は、訓練されたトランスフォーマーにおける隠れ状態の成長に明確な境界を導出する。
我々のフレームワークは、新しいアーキテクチャ修正の下でトランスフォーマーの安定性を正当性チェックする原則的な方法を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:27:20 GMT)
Total Robustness in Bayesian Nonlinear Regression for Measurement Error Problems under Model Misspecification [7.2] 一般非線形回帰における3つの課題すべてに対処する完全ロバスト性をターゲットにした最初のベイズ的非パラメトリックフレームワークを提案する。
シミュレーションと実世界の2つの研究では、推定誤差の低減と、誤特定に対する推定感度の低減が示されている。
したがって、このフレームワークは、データとモデルが共同で不完全である場合に、信頼できる回帰のための実用的で解釈可能なパラダイムを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:00:06 GMT)
Adaptive Decoding via Hierarchical Neural Information Gradients in Mouse Visual Tasks [7.2] 階層的なディープニューラルネットワーク(DNN)は、複雑なデータの中核的な特徴をマイニングするためのツールとして重要な役割を果たしています。
適応トポロジカルビジョン変換器(AT-ViT)と呼ばれる脳領域間の適応トポロジカルデコーディングの手法を提案する。
多くの実験において,視覚課題における階層型ネットワークにおける提案手法の重要性が示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:00:59 GMT)
FedL2T: Personalized Federated Learning with Two-Teacher Distillation for Seizure Prediction [7.1] フェデレートラーニング(FL)は、生データの代わりにモデル更新を共有することで、プライバシ保護による協調トレーニングを可能にする。
我々は、各クライアントに対して優れたパーソナライズされたモデルを生成する、パーソナライズド・フェデレーション・ラーニング・フレームワークであるFedL2Tを提案する。
2つのEEGデータセットの実験では、FedL2Tは最先端のFLメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:52:07 GMT)
On Quantum Computation Using Bias-Preserving Gates [7.0] 計算がZバイアス(またはXバイアス)をノイズに維持するゲートのみを使用するようにすることは有用である。
任意のZバイアス保存ゲートは、集合 X,R_z(theta),CNOT,CCNOT のゲートのみを用いて任意に近似できることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:52:40 GMT)
Differentially Private 2D Human Pose Estimation [7.0] 微分プライベートな2次元ポーズ推定(2D-HPE)のための最初の包括的枠組みを提案する。
プライバシ性能を効果的にバランスするために,低次元部分空間へのノイズ勾配を投影するProjected DP-SGDを採用した。
次に、FDP(Feature Differential Privacy)を導入し、公共の視覚的手がかりを維持しながら、機密機能のみを選択的に民営化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:14:33 GMT)
Domain-Adapted Pre-trained Language Models for Implicit Information Extraction in Crash Narratives [6.9] 本研究では,コンパクトなオープンソース言語モデルが,クラッシュ物語からの推論集約的な抽出を支援するかどうかを考察する。
我々は,Low-Rank Adaption (LoRA) とBERTを用いて,タスク固有の知識をLLMに注入するための微調整手法を適用した。
さらなる分析により、微調整されたPLMはよりリッチな物語の詳細をキャプチャし、データセット内のいくつかの誤ラベル付きアノテーションを修正できることが明らかになった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:45:07 GMT)
Semantic-Condition Tuning: Fusing Graph Context with Large Language Models for Knowledge Graph Completion [6.9] 知識グラフと大規模言語モデルとの融合は、知識グラフ補完のような知識集約的なタスクに不可欠である。
本稿では2つの重要なモジュールからなる新しい知識注入パラダイムであるセマンティック適応グラフチューニング(SCT)を提案する。
SCTはより直接的で強力な信号を提供し、より正確で堅牢な知識推論を可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:22:27 GMT)
One Sentence, Two Embeddings: Contrastive Learning of Explicit and Implicit Semantic Representations [6.9] 本稿では,各文に2つの埋め込みを割り当てる文埋め込み手法であるDualCSEを提案する。
実験により、DualCSEは暗黙の意味と暗黙の意味の両方を効果的にエンコードできることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:36:19 GMT)
Dynamic Weight-based Temporal Aggregation for Low-light Video Enhancement [6.9] 低照度ビデオの強化はノイズ、低コントラスト、色劣化のために困難である。
DWTA-Netは,短期・長期の時間的手がかりを利用した新しいフレームワークである。
DWTA-Netはノイズやアーティファクトを効果的に抑制し、最先端の手法に比べて優れた視覚的品質を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:00:31 GMT)
Convergence of two-timescale gradient descent ascent dynamics: finite-dimensional and mean-field perspectives [6.9] 2時間勾配勾配勾配アルゴリズム(GDA)は、min-maxゲームにおいてナッシュ平衡を求めるために設計された標準勾配アルゴリズムである。
学習速度比が有限次元および平均場設定の収束挙動に及ぼす影響について検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:57:40 GMT)
GRETEL: A Goal-driven Retrieval and Execution-based Trial Framework for LLM Tool Selection Enhancing [6.8] GRETELは、サンドボックス化された計画実行評価サイクルを通じてセマンティックに検索された候補を処理するエージェントワークフローを実装している。
ToolBenchベンチマークに関する包括的な評価は、すべてのメトリクスで大幅に改善されていることを示しています。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:12:51 GMT)
Scrambling-Enhanced Quantum Battery Charging in Black Hole Analogues [6.8] ブラックホールは自然界で最速の量子情報スクランブラを構成する。
ブラックホールの衝突が、予め設定された衝突パラメータの制御されたクエンチを介して帯電に与える影響について検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:47:12 GMT)
FSP-DETR: Few-Shot Prototypical Parasitic Ova Detection [6.7] FSP-DETRは,ロバストな数発検出,オープンセット認識,バイオメディカルタスクの一般化を可能にする統合検出フレームワークである。
本手法は,クラスに依存しないDETRバックボーン上に構築され,元のサポートイメージからクラスプロトタイプを構築し,拡張ビューと軽量トランスフォーマーデコーダを用いて埋め込み空間を学習する。
卵巣、血液細胞、マラリア検出タスクにわたるテストでは、FSP-DETRは以前の数発およびプロトタイプベースの検出器よりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:38:40 GMT)
Agentic-KGR: Co-evolutionary Knowledge Graph Construction through Multi-Agent Reinforcement Learning [6.7] Agentic-KGRは、大規模言語モデル(LLM)と知識グラフ(KG)の共進化を可能にする新しいフレームワークである。
提案手法では,(1)事前定義された境界を超えてグラフを体系的に拡張する動的スキーマ拡張機構,(2)連続最適化によるモデルパラメータと知識構造間の相乗的共進化を可能にする検索強化メモリシステム,(3)適応シーケンス最適化による計算複雑性を低減しつつ,重要な情報を保存する学習可能なマルチスケールプロンプト圧縮手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:00:07 GMT)
Failure Prediction at Runtime for Generative Robot Policies [6.4] 実行中の早期の障害予測は、人間中心で安全クリティカルな環境でロボットをデプロイするために不可欠である。
本稿では,フェールデータを必要としない生成ロボットポリシーの故障予測フレームワークであるFIPERを提案する。
その結果、FIPERは実際の障害と良質なOOD状況とをよく区別し、既存の手法よりも正確に早期に障害を予測できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:09:27 GMT)
Online Topological Localization for Navigation Assistance in Bronchoscopy [6.4] 術中ナビゲーション支援のための画像ベース気管支鏡トポロジカル・ローカライゼーション・パイプラインを提案する。
提案手法はファントムデータのみに基づいて学習し,高コストな実データラベリングを排除し,優れた一般化能力を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:44:39 GMT)
Augmenting Dialog with Think-Aloud Utterances for Modeling Individual Personality Traits by LLM [6.3] 本研究は,テキストチャットにおける個人の個人性をモデル化するために,シンク・アラウド・発話(TAU)を用いた対話データの拡張を提案する。
我々は,訓練されたペルソナLLMが,ビッグファイブに対して人格を得るかどうかを検証した。
その結果, TAU強化データを用いたLLMは, 従来のダイアログデータを用いた場合よりも, 話者のビッグファイブのアグリエブルネスとニューロティシズムと密接に一致していることが判明した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:03:31 GMT)
Vacuum Rabi Splitting and Quantum Fisher Information of a Non-Hermitian Qubit in a Single-Mode Cavity [6.3] 非エルミート量子ビットの自然な拡張は、それを単一モードの空洞に配置することである。
まず、Bogoliubov演算子アプローチを用いて、$mathcalP MathcalT$-symmetric QRMを解く。
例外的に、$mathcalP MathcalT$-symmetric QRM の量子フィッシャー情報は、非エルミート量子ビット成分よりもかなり高い。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:54:57 GMT)
Optimizing Entanglement and Bell Inequality Violation in Top Anti-Top Events [6.3] スピン-スピン相関を対角化する基礎は,スピン相関,絡み合い,ベル不等式違反の最大化に最適であることを示す。
LHCと将来の$e+e-$コライダーのイベントにおいて,絡み合いやベルの不等式違反に対する感受性を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:32:47 GMT)
Bandits with Single-Peaked Preferences and Limited Resources [6.2] アルゴリズムがU$ユーザとK$アームとを逐次一致させるオンラインマッチング問題について検討する。
構造的仮定がなければ、最適マッチングの計算はNPハードであり、オンライン学習は計算不可能である。
我々はオフラインの予算マッチング問題に対する効率的なアルゴリズムを考案し、それを$tilde O(UKT2/3)$を後悔して効率的なオンラインアルゴリズムに活用する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:27:25 GMT)
An uncertainty-aware framework for data-efficient multi-view animal pose estimation [6.2] 科学的研究における動物行動の定量化には多視点ポーズ推定が不可欠である。
我々は,新しいトレーニングとポストプロセッシング技術を組み合わせた包括的枠組みを開発する。
フレームワークコンポーネントは3種の多様な動物種に対して,既存の手法よりも一貫して優れています。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:27:13 GMT)
Estimating Brain Activity with High Spatial and Temporal Resolution using a Naturalistic MEG-fMRI Encoding Model [6.2] 現在の非侵襲的ニューロイメージング技術は、空間分解能と時間分解能の間にトレードオフがある。
我々は,脳磁図(MEG)と機能的磁気共鳴画像(fMRI)を組み合わせたトランスフォーマーベース符号化モデルを開発した。
複数の被験者からのMEGとfMRIの予測と,再建した大脳皮質源の推定値を表す潜在層の推定を訓練した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:18:10 GMT)
Differential Analysis of Pseudo Haptic Feedback: Novel Comparative Study of Visual and Auditory Cue Integration for Psychophysical Evaluation [6.1] 擬似触覚は、視覚的または聴覚的な手がかりを慎重に作り、脳を身体的に適用されない「刺激」の力に騙す。
本研究は,視覚刺激と聴覚刺激が組み合わさって,タブレット上で擬似触覚感を誘発する様子を定量的に比較した心理物理学的な研究である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:22:41 GMT)
Repairing Regex Vulnerabilities via Localization-Guided Instructions [6.0] 正規表現(regexes)は、正規表現拒否(ReDoS)にシステムを公開する
しかし、現在のアプローチはトレードオフによって妨げられている。
信頼性を保ちながら一般化を活用するために設計されたハイブリッド・フレームワーク、ローカライズド・リフレクション(LRR)を導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:15:43 GMT)
Classifier-Augmented Generation for Structured Workflow Prediction [5.9] 本稿では,自然言語記述を実行可能なものに翻訳するシステムを提案する。
フローの構造と詳細な構成の両方を自動的に予測する。
これは、ステージ予測、エッジレイアウト、および自然駆動オーサリングのためのプロパティ生成にまたがって詳細な評価を行う最初のシステムである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:38:25 GMT)
Fine-Tuning Large Language Models with QLoRA for Offensive Language Detection in Roman Urdu-English Code-Mixed Text [5.9] ローマ・ウルドゥー語文における攻撃的言語検出を改善するためのQLoRAに基づく微調整フレームワークを提案する。
ローマ・ウルドゥー語と英語の混成データセットをGoogle Translateを使って英語に翻訳し、英語のLLMを活用する。
私たちはMeta LLaMA 3 8B、Mistral 7B v0.1、LLaMA 2 7B、ModernBERT、RoBERTaなど、いくつかのトランスフォーマーと大規模言語モデルを微調整した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:42:06 GMT)
Can We Reliably Rank Model Performance across Domains without Labeled Data? [5.9] 4つの基本分類器と複数の大規模言語モデルを用いた2段階評価設定を用いて、ランク付け信頼性に影響を与える要因を誤差予測器として分析する。
ドメイン間のパフォーマンスの違いが大きい場合や、エラーモデルの予測がベースモデルの真の失敗パターンと一致した場合、ランキングは信頼性が高くなる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:29:56 GMT)
National Data Platform's Education Hub [5.9] 我々は,国立データプラットフォーム内に第一種教育ハブを構築した。
このハブは、共同研究ワークスペース、教室環境、データチャレンジ設定間のシームレスな接続を可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:06:20 GMT)
RepDL: Bit-level Reproducible Deep Learning Training and Inference [5.9] RepDLは、決定論的かつビットワイズで再現可能なディープラーニングトレーニングと推論のためのオープンソースライブラリである。
RepDLは浮動小数点演算において正しい丸めと順序を強制する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:24:07 GMT)
SecureBERT 2.0: Advanced Language Model for Cybersecurity Intelligence [5.8] サイバーセキュリティアプリケーション向けに開発されたエンコーダのみの言語モデルであるSecureBERT 2.0を提案する。
改良された長文モデリングと階層符号化を導入し、拡張および異種文書の効率的な処理を可能にした。
SecureBERT 2.0は、複数のサイバーセキュリティベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:38:53 GMT)
LiveOIBench: Can Large Language Models Outperform Human Contestants in Informatics Olympiads? [5.8] LiveOIBenchは403のOlympiadレベルの競合プログラミング問題と60のエキスパート設計テストケースを特徴とするベンチマークである。
この問題は2023年から2025年の間に行われた、72の公式のインフォマティクス・オリンピアード(英語版)から直接引き起こされている。
LiveOIBenchは,詳細なサブタスクと広範なプライベートテストケースを備えた,厳密にキュレートされた高品質なタスクという,4つの重要な機能を通じて,自分自身を区別する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:54:24 GMT)
Filling in the Clinical Gaps in Benchmark: Case for HealthBench for the Japanese medical system [5.8] 本研究では,日本におけるHealthBenchの適用性について検討した。
日本語の資源は乏しく、翻訳された複数の質問から構成されることが多い。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:00:56 GMT)
D-TPT: Dimensional Entropy Maximization for Calibrating Test-Time Prompt Tuning in Vision-Language Models [5.8] テスト時適応パラダイムは、ドメインシフトに対する柔軟性を提供する。
VLM(Vision-Language Models)は、様々な下流タスクに一般化機能を利用する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:27:44 GMT)
MAKO: Meta-Adaptive Koopman Operators for Learning-based Model Predictive Control of Parametrically Uncertain Nonlinear Systems [5.8] メタアダプティブ・クープマン演算子 (MAKO) と呼ばれる適応型メタラーニングに基づくモデリング手法を提案する。
提案手法は, モデル精度と制御効率の両面において, 競合するベースラインと比較して優れた性能を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:23:36 GMT)
AdaPM: a Partial Momentum Algorithm for LLM Training [5.7] 本稿では,部分運動量を利用してメモリ効率を向上させる適応学習戦略であるAdaPMを提案する。
提案手法は,効率と性能を両立させながら,メモリ容量を90%以上削減できることを確認した。
AdaPMは、二階統計学上のメモリ効率の手法を組み合わせることで、最大95%のメモリを削減できる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:58:22 GMT)
ShiZhi: A Chinese Lightweight Large Language Model for Court View Generation [5.7] 裁判所ビュー生成に特化して設計された最初の大規模言語モデル(LLM)であるShiZhiを紹介する。
我々は,110万件以上の中国宮廷ビュー生成データセットを構築し,それぞれが対応する裁判所ビューと組み合わせた事実記述を含む。
ShiZhiは、裁判所のビュー生成で58.5 BLEU-1、充電予測で86.1%の精度で92.5%のマクロF1を達成している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:42:17 GMT)
On Uniformly Scaling Flows: A Density-Aligned Approach to Deep One-Class Classification [5.7] 一定のジャコビアン行列式で一様スケールフロー(USF)が正規化されることが示される。
この理論的ブリッジは、USFがフローの密度忠実度と一級法の距離に基づく推論の両方を継承することを意味する。
我々は、現代の異常検出アーキテクチャにおいて、USFを非USFのドロップイン代替として使用することを提唱する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:01:26 GMT)
CarbonX: An Open-Source Tool for Computational Decarbonization Using Time Series Foundation Models [5.5] CarbonXは、炭素強度の予測と計算のためのオープンソースのツールである。
平均絶対パーセンテージ誤差(MAPE)は世界214のグリッドで15.82%とゼロショットで予測されている。
13のベンチマークグリッドで、CarbonXのパフォーマンスは現在の最先端に匹敵する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:49:40 GMT)
Cattle-CLIP: A Multimodal Framework for Cattle Behaviour Recognition [5.5] Cattle-CLIPは、牛の行動認識のためのマルチモーダルなディープラーニングフレームワークである。
これは、時間統合モジュールを追加することで、大規模な画像言語モデルCLIPから適応される。
実験により、キャトル-CLIPは6つの行動に対して96.1%の総合的精度を達成することが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:43:12 GMT)
GraphMERT: Efficient and Scalable Distillation of Reliable Knowledge Graphs from Unstructured Data [5.4] 構造化されていないテキストコーパスから高品質な知識グラフを抽出する,グラフィカルエンコーダのみの小型モデルであるGraphMERTを紹介する。
GraphMERTと同等のKGはモジュラー・ニューロシンボリックスタックを形成し、抽象のニューラルラーニング、検証可能な推論のためのシンボリックKGである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:36:14 GMT)
TripScore: Benchmarking and rewarding real-world travel planning with fine-grained evaluation [5.4] 我々は、詳細な基準を1つの報酬に統一する旅行計画のための総合的なベンチマークを導入する。
提案手法は,旅行専門家のアノテーションと適度に一致し,複数のLCM-as-judgeベースラインを上回ります。
ユーザ意図を一般化するための219のリアルタイムなフリーフォーム要求を含む,4,870の大規模クエリデータセットをリリースする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:22:29 GMT)
SysLLMatic: Large Language Models are Software System Optimizers [5.3] 本稿では,LLMと性能診断フィードバックを統合したシステムであるSysLLMaticと,43の最適化パターンをキュレートしたカタログを提示する。
我々は、HumanEval_CPP(C++の競合プログラミング)、SciMark2(Javaの科学的カーネル)、DaCapoBench(Javaの大規模ソフトウェアシステム)の3つのベンチマークスイートで評価した。
その結果、SysLLMaticは、レイテンシ、スループットエネルギー効率、メモリ使用量、CPU使用量など、ソフトウェアシステムのパフォーマンスを向上できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:01:02 GMT)
MODE: Learning compositional representations of complex systems with Mixtures Of Dynamical Experts [5.3] MODEはグラフィカルなモデリングフレームワークで、ニューラルネットワークのゲーティング機構は複雑なダイナミクスをスパースで解釈可能なコンポーネントに分解する。
我々は,MODEが細胞生物学における重要なサイクリングおよび分岐過程をシミュレートする,挑戦的な予測タスクにどのように成功したかを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:52:31 GMT)
SilvaScenes: Tree Segmentation and Species Classification from Under-Canopy Images in Natural Forests [5.2] そこで我々はSilvaScenesについて紹介する。SilvaScenesは、樹種分類のための新しいデータセットで、アンダーキャノピー画像から木種を抽出する。
我々は、最近のディープラーニングアプローチのベンチマークによって、データセットの妥当性と難易度を実証する。
以上の結果から,木分割は容易であり,平均精度は67.65%と推定されるが,種の分類は35.69%に留まる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:08:35 GMT)
Reliable Active Learning from Unreliable Labels via Neural Collapse Geometry [5.2] アクティブラーニング(AL)は、情報的なサンプルを優先順位付けすることでアノテーションのコストを削減することを約束するが、ラベルがうるさい場合やデータ分散がシフトした場合、その信頼性は低下する。
本稿では,深層ネットワークの創発的幾何学的規則性を活用し,信頼できない監視に対処するフレームワークである能動学習(NCAL-R)を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:50:31 GMT)
NIMO: a Nonlinear Interpretable MOdel [5.1] NIMOは、固有の解釈可能性とニューラルネットワークの表現力を組み合わせたフレームワークである。
我々のモデルは優れた予測性能を維持しつつ、忠実で知性に富む特徴効果を提供できることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:42:05 GMT)
LitE-SQL: A Lightweight and Efficient Text-to-SQL Framework with Vector-based Schema Linking and Execution-Guided Self-Correction [5.1] 2つのコンポーネントを持つ軽量で効率的なフレームワークLitE-を紹介します。
BIRDでは、LitE-は72.10%の実行精度を達成し、Spiderでは88.45%に達し、Retrieverと同等または優れたパフォーマンスを示している。
以上の結果から,高品質のテキスト・トゥ・コレクション・ジェネレーションは軽量モデルで実現可能であり,プライバシに敏感かつリソース制約のある設定に実用的なソリューションを提供することがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:27:47 GMT)
Learning with Incomplete Context: Linear Contextual Bandits with Pretrained Imputation [5.0] PULSE-UCBは、補助データに基づいて訓練された事前学習モデルを利用して、オンライン意思決定中に欠落した特徴を暗示するアルゴリズムである。
その結果、予測された文脈における不確実性が意思決定の質に与える影響と、下流学習を改善するためにどれだけの歴史的データが必要とされるかが定量化される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:47:24 GMT)
Leveraging Shared Prototypes for a Multimodal Pulse Motion Foundation Model [4.9] ProtoMMは、共通の埋め込み空間に不均一なモダリティを固定するために、共有プロトタイプ辞書を導入する新しいフレームワークである。
明示的なネガティブサンプリングではなく,共有プロトタイプを囲む表現をクラスタリングすることで,モダリティ間の相補的な情報を捕捉し,生理的信号に対するコヒーレントな"共通言語"を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:13:38 GMT)
Locally Optimal Private Sampling: Beyond the Global Minimax [4.9] ローカルディファレンシャルプライバシ(LDP)下における分布からのサンプリング問題について検討する。
プライベートディストリビューションがmathcalP$で$Pを与えられると、そのディストリビューションから1つのサンプルを生成して、$f$-divergenceで$P$に近いようにする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:50:48 GMT)
MTMD: A Multi-Task Multi-Domain Framework for Unified Ad Lightweight Ranking at Pinterest [4.8] 従来のTwo-Towerパラダイムの下で,Multi-Task Multi-Domain (MTMD)アーキテクチャを提案する。
MTMDはオフライン損失値を12%から36%改善し、クリックあたりのコストを2%削減した。
9つのプロダクションモデルを置き換えたPinterestの広告レコメンデーションのために、この単一のMTMDフレームワークを本番環境にデプロイしました。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:46:19 GMT)
All Code, No Thought: Current Language Models Struggle to Reason in Ciphered Language [4.7] CoT(Chain-of- Thought)モニタリングは、敵の攻撃やAIのミスアライメントを検出するために広く使われている手法である。
攻撃者やミスアライメントされたモデルは、暗号推論を通じてCoTの監視を回避する可能性がある。
モデルが暗号化された推論を実行できるかどうかを検証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:01:22 GMT)
EMedNeXt: An Enhanced Brain Tumor Segmentation Framework for Sub-Saharan Africa using MedNeXt V2 with Deep Supervision [4.6] MedNeXt V2をベースとした拡張脳腫瘍セグメンテーションフレームワークであるEMedNeXtについて述べる。
我々の解は平均LesionWise DSCが0.897、平均LesionWise NSDが0.541、0.84を0.5mm、1.0mmで達成した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:30:06 GMT)
SurveyG: A Multi-Agent LLM Framework with Hierarchical Citation Graph for Automated Survey Generation [4.5] 大規模言語モデル(LLM)は、調査用紙の自動生成にますます採用されている。
LLMに基づくエージェントフレームワークである textbfSurveyG を提案する。
textbfFoundation、textbfDevelopment、textbfFrontierの3つのレイヤで構成されており、セミナルな作品から漸進的な進歩、新たな方向性までの研究の進化を捉えている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:59:37 GMT)
A Quantum-Inspired Algorithm for Solving Sudoku Puzzles and the MaxCut Problem [4.4] 擬似非制約二項最適化問題の解法として量子インスパイアされたアルゴリズムを提案し,評価する。
このアルゴリズムは、イジング・スピングラス・ハミルトンの基底状態の発見と数学的に等価である。
本研究では,公開資料から得られた中間レベルSudokuパズルに対して,その有効性を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:24:14 GMT)
A mathematical theory for understanding when abstract representations emerge in neural networks [4.4] フィードフォワード非線形ネットワークの最後に隠された層に潜伏変数の抽象表現が現れることが保証されていることを示す。
これらの表現は、所望の出力の構造や入力刺激の意味を反映している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:30:57 GMT)
Prompt-Aware Scheduling for Low-Latency LLM Serving [4.4] 本稿では,PLMタスクスケジューラPARSを紹介する。
最短ジョブ優先(SJF)スケジューリングを、ペアのランキングとマージンランキングの損失で近似する。
応答長ベースのタスク順序付けを効果的に予測し、オーバーヘッドを最小限に抑えてレイテンシを低減する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:42:42 GMT)
Editable Noise Map Inversion: Encoding Target-image into Noise For High-Fidelity Image Manipulation [4.4] 効率的な画像編集の鍵となる戦略は、ソースイメージをターゲット画像に関連する編集可能なノイズマップに変換することである。
編集可能なノイズマップ・インバージョン(ENM Inversion)を提案する。これはコンテンツ保存性と編集性の両方を確保するために最適なノイズマップを探索する新しいインバージョン手法である。
また,ビデオ編集にも容易に適用でき,フレーム間の時間的一貫性とコンテンツ操作が可能となる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:37:34 GMT)
SEKE: Specialised Experts for Keyword Extraction [4.3] キーワード抽出は、文書の中で最も記述的な単語を特定することを含む。
本稿では,専門家(MoE)の手法を併用した新しい教師付きキーワード抽出手法を提案する。
MoEは学習可能なルーティングサブネットワークを使用して、専門家に情報を指示し、入力空間の異なる領域を専門化することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:24:20 GMT)
Robustness and Regularization in Hierarchical Re-Basin [4.3] 本稿では,標準的なMergeManyアルゴリズムを大幅に上回る階層モデルマージ手法を提案する。
我々の新しいアルゴリズムでは、Re-Basinは結合されたモデルに逆方向と頑健な摂動を誘導し、その効果はより強くなる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:17:10 GMT)
Patentformer: A demonstration of AI-assisted automated patent drafting [4.2] 特許弁護士は,正式な法的書面様式で特許出願を作成する発明の法的累積及び技術的理解の両方を有する必要がある。
Patentformerは、特許弁護士を支援するために設計されたAIによる自動特許草案作成プラットフォームである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:00:03 GMT)
Interpretable Machine Learning for Urban Heat Mitigation: Attribution and Weighting of Multi-Scale Drivers [4.2] 都市熱島(UHI)は、しばしば熱波(HW)の間にアクセントを付け、公衆の健康リスクを引き起こす。
本研究は、これらのドライバを運転(D)、都市(U)、局所(L)特徴に分類することを提案する。
解釈可能性の向上と効率の向上を目的として,LUT識別機械学習手法を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:09:35 GMT)
Filtering out mislabeled training instances using black-box optimization and quantum annealing [4.1] 実世界のデータセットで共通する問題であるミスラベルトレーニングインスタンスは、しばしばモデルの一般化を低下させる。
提案手法は、検証損失に基づいてフィルタされたトレーニングサブセットを評価し、後処理を伴う代理モデルに基づくBBOを用いて損失推定を反復的に洗練する。
ノイズの多い多数ビットタスクの実験は、ハイリスクなラベル付きインスタンスの削除を優先する手法の能力を実証している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:35:08 GMT)
Detecting Multilevel Manipulation from Limit Order Book via Cascaded Contrastive Representation Learning [4.1] スポフィングは最も隠蔽的で詐欺的なTBM戦略の1つである。
これらのパターンは通常、リミット・オーダー・ブックの豊かで階層的な情報の中に隠されている。
ケースケード型LOB表現アーキテクチャと教師付きコントラスト学習を組み合わせた表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:32:36 GMT)
InterCorpRel-LLM: Enhancing Financial Relational Understanding with Graph-Language Models [4.1] InterCorpRel-LLMは、グラフマッチング、業界分類、供給関係予測を統合したクロスモーダルフレームワークである。
供給関係識別タスクにおいて、GPT-5を含む強いベースラインを大幅に上回る。
また、ゼロショットの競合の識別に一般化し、ニュアンス付き確証間ダイナミクスをキャプチャする能力を強調している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:18:18 GMT)
Controlled Personalization in Legacy Media Online Services: A Case Study in News Recommendation [4.1] ノルウェーの大手ニュース機関のウェブサイト上で実施したA/Bテストを通じて、制御されたパーソナライゼーションの有効性を評価する。
パーソナライズレベルが低かったとしても,大きなメリットが得られます。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:37:13 GMT)
Geodesic Calculus on Latent Spaces [4.0] 古典的幾何作用素を近似した離散リーマン計算のためのツールを開発する。
偏微分対象を最小化することにより、潜在多様体への近似射影を学習する。
我々は、合成および実データに基づいて訓練された各種オートエンコーダに対するアプローチを評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:25:03 GMT)
When a Robot is More Capable than a Human: Learning from Constrained Demonstrators [4.0] デモンストレーションから学んだ専門家は、審美的な教育、ジョイスティックコントロール、シム・トゥ・リアル・トランスファーといったインターフェースを使って、ロボットに複雑なタスクを教えることができる。
これらのインターフェースは、間接的な制御、セットアップの制限、ハードウェアの安全性による最適な動作を示す専門家の能力をしばしば制限する。
ロボットは、制約のある専門家が示したものよりも優れたポリシーを学べるだろうか?
我々は、エージェントが専門家の行動の直接の模倣を越えて、より短くより効率的な軌道を探索できるようにすることで、この問題に対処する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:48:12 GMT)
Enhancing Faithfulness in Abstractive Summarization via Span-Level Fine-Tuning [4.0] 我々は、スパンレベルのラベルを持つ忠実で不誠実な要約の両方を含む新しいデータセットを導入する。
我々は,LLMを微調整する3つの手法を評価し,その結果の要約の忠実さを向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:19:18 GMT)
PhotonIDs: ML-Powered Photon Identification System for Dark Count Elimination [3.9] 本稿では,機械学習を利用した光子識別システムPhotonIDを紹介する。
PhotonIDsは、光子と暗カウントのリアルタイム識別のための最初のエンドツーエンドソリューションである。
以上の結果から,光nIDは暗カウント除去において31.2倍の信号ノイズ比(SNR)を向上できることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:32:48 GMT)
Can Lessons From Human Teams Be Applied to Multi-Agent Systems? The Role of Structure, Diversity, and Interaction Dynamics [3.9] チーム科学の中核的な側面である構造、多様性、相互作用のダイナミクスを調べるためのマルチエージェントフレームワークを提案する。
私たちの結果は、フラットなチームは階層的なチームよりもパフォーマンスが良い傾向を示します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:59:22 GMT)
What Are They Filtering Out? An Experimental Benchmark of Filtering Strategies for Harm Reduction in Pretraining Datasets [3.8] データフィルタリング戦略は、安全な大規模言語モデルを開発する上で重要な要素である。
これらの戦略が差別に対する脆弱なグループに与える影響について、研究の欠如がある。
本稿では,これらの手法を体系的に評価することを目的とした害軽減のためのデータフィルタリング手法のベンチマーク研究を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:26:10 GMT)
Cost-Efficient Long Code Translation using LLMs while Leveraging Identifier Replacements [3.8] 識別子置換を組み込んだゼロショット符号変換法を提案する。
提案手法は,翻訳中にユーザから取得した長い識別子を一般化されたプレースホルダーに置き換えることで,長文翻訳の効率性と費用対効果を向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:28:15 GMT)
Aggregation on Learnable Manifolds for Asynchronous Federated Optimization [3.8] 曲線学習としてアグリゲーションを取り入れた幾何学的枠組みを導入する。
そこで我々は,線形アグリゲーションを低次曲率成分に置き換えたAsyncBezierを提案する。
これらの利得は、他の方法がより高いローカルな計算予算に割り当てられた場合でも維持されることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:45:11 GMT)
Co-Authoring the Self: A Human-AI Interface for Interest Reflection in Recommenders [3.8] 本稿では,映画レコメンデーションシステムのための人間-AI協調プロファイルを提案する。
静的プロファイルとは異なり、この設計ではユーザーがシステムの推論を直接検査し、修正し、反映させることができる。
1775年のアクティブな映画レコメンデーションユーザによる8週間のオンラインフィールド展開では、ユーザ認識とシステム推論の相違が持続的に現れる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:20:13 GMT)
Towards a Taxonomy of Sustainability Requirements for Software Design [3.8] 本研究は, 現状からサステナビリティ要件を抽出し, 整理するために, 体系的文献レビューを実施している。
特定されたカテゴリごとに、明確な定義、関連するメトリクス、測定値を提供します。
この体系化された参照は、持続可能なソフトウェア開発におけるトレードオフを効果的に定式化し、管理し、調整するのに役立つ。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:20:11 GMT)
SEER: Sustainability Enhanced Engineering of Software Requirements [3.8] 初期のソフトウェア開発フェーズにおける持続可能性に関する懸念に対処するフレームワークであるSEERを紹介します。
フレームワークは、(i)特定のソフトウェア製品に関連する持続可能性要件を一般的な分類学から特定し、(ii)特定されたSRに基づいて持続可能なシステム要件がどのように評価されているかを評価し、(iii)いかなるSRも満たさないシステム要件を最適化する。
Gemini 2.5推論モデルを用いて得られた結果は、様々な領域にわたる幅広いサステナビリティの懸念を正確に識別する上で、提案手法の有効性を示すものである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:48:30 GMT)
GREAT: Generalizable Backdoor Attacks in RLHF via Emotion-Aware Trigger Synthesis [3.8] 我々は、RLHFで一般化可能なバックドアを構築するためのフレームワークであるGREATを開発した。
GREATは、セマンティックな暴力的な要求と感情的な怒りの引き金の両方を特徴とする、脆弱なユーザサブグループに対する有害な応答生成をターゲットにしている。
ベンチマークRLHFデータセットの実験では、GREATは攻撃成功率においてベースラインメソッドよりも大幅に優れていた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:59:14 GMT)
Rethinking How We Discuss the Guidance of Student Researchers in Computing [3.7] ファセット・フレームワーク内でのコンピューティングにおける学生研究者の指導について検討する。
指導の言語を拡大・曖昧化することにより、この手法は教員の責任の広さを明らかにしている。
私は、アドバイスやメンタリングのような特異な用語に対する過度な信頼は、教員の責任の完全な範囲を曖昧にしていると論じます。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:37:06 GMT)
MLLM-Fabric: Multimodal Large Language Model-Driven Robotic Framework for Fabric Sorting and Selection [3.7] 本稿では,マルチモーダル大言語モデル(MLLM)を利用したファブリックソートと選択のためのロボットフレームワークを提案する。
マルチモーダルなロボットプラットフォーム上に構築されたこのシステムは、ファブリック特性のランク付けのために、教師付き微調整と説明誘導蒸留によって訓練される。
実験の結果,Fabric-Llama-90Bは属性ランキングと選択信頼性の両方において,事前学習された視覚言語ベースラインより一貫して優れていた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:37:00 GMT)
Safe, Untrusted, "Proof-Carrying" AI Agents: toward the agentic lakehouse [3.7] APIファーストでプログラム可能なレイクハウスは、安全な設計のエージェントレイクハウスのための適切な抽象化を提供する。
本稿では, エージェントがデータパイプラインを修復する上で, 証明キャリングコードにインスパイアされた正当性チェックを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:18:36 GMT)
iEEG Seizure Detection with a Sparse Hyperdimensional Computing Accelerator [3.6] 頭蓋内脳波検査(iEEG)のためのインプラント可能な装置は、効率よく、正確で、リアルタイムに発作を検出する必要がある。
高密度超次元計算(HDC)はニューラルネットワークよりも効率的であることが証明されているが、それでも超低エネルギーアプリケーションにはかなりのスイッチング電力を消費する。
この研究は、圧縮アイテムメモリ(CompIM)を導入し、空間的バンドルを単純化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:53:37 GMT)
Causal Additive Models with Unobserved Causal Paths and Backdoor Paths [3.6] 因果加法モデル(英語版)は、隠れ変数の存在下で因果発見のための抽出可能で表現可能なフレームワークを提供する。
このようなケースの多くで因果方向を識別できる十分な条件を確立する。
隠れ親を共有する観測変数のペアである弓の親子関係の同定を可能にする条件を導出する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:29:26 GMT)
Student Development Agent: Risk-free Simulation for Evaluating AIED Innovations [3.5] 本研究では,大規模言語モデル(LLM)に基づく学生開発エージェントフレームワークを提案する。
エージェントの予測は,非認知的発達における実際の学生の成果と一致していることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:26:20 GMT)
Few-shot multi-token DreamBooth with LoRa for style-consistent character generation [3.4] オーディオヴィジュアル産業は、AI開発を統合して新しい芸術様式を刺激し、大きな変革を遂げている。
本稿では, 芸術的スタイルを保ち, 人間のデザインした小文字集合の視覚的特徴を共有できる, 事実上無限の新規文字を生成するという課題に対処する。
クラスタリングを用いて個々の文字とその集合スタイルに個別のトークンを割り当てるマルチトークン戦略と,LoRAに基づくパラメータ効率の微調整を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:28:55 GMT)
Chlorophyll-a Mapping and Prediction in the Mar Menor Lagoon Using C2RCC-Processed Sentinel 2 Imagery [3.4] クロロフィルa(Chl-a)のモニタリングは、有害な藻類の開花と誘導緩和を予測するために不可欠である。
衛星ベースのアプローチは、より包括的なビューを提供し、スケーラブルで長期的な、そして転送可能な監視を可能にする。
本研究は,マルメナーの水柱を横断するChl-aを予測・マッピングするための信頼性の高い手法を開発した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:20:25 GMT)
Hybrid Models for Natural Language Reasoning: The Case of Syllogistic Logic [3.4] 本稿では,Sylological fragment をベンチマークとして,事前学習型大言語モデル(LLM)の論理一般化能力について検討する。
シンボリック推論とニューラル計算を組み合わせたハイブリッドアーキテクチャを提案する。
実験の結果,比較的小さな神経成分でも高い効率が維持できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:27:29 GMT)
Robust Driving Control for Autonomous Vehicles: An Intelligent General-sum Constrained Adversarial Reinforcement Learning Approach [3.4] 本稿では,戦略目標の敵とロバストな駆動エージェントからなる,新しいロバストな自律運転手法を提案する。
IGCARLは、最先端の手法よりも成功率を少なくとも27.9%向上させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:21:36 GMT)
DQS: A Low-Budget Query Strategy for Enhancing Unsupervised Data-driven Anomaly Detection Approaches [3.3] 本研究は,既存の教師なし異常検出手法とアクティブラーニングを統合した。
我々は、DQS(dissimilarity-based query strategy)と呼ばれる新しいクエリ戦略を導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:50:47 GMT)
Truncated Kernel Stochastic Gradient Descent with General Losses and Spherical Radial Basis Functions [3.3] 本稿では,大規模教師あり学習のための新しいカーネル勾配統合下降アルゴリズムを提案する。
従来のカーネルSGDと比較して,我々のアルゴリズムは革新的な正規化戦略によって効率とスケーラビリティを向上させる。
我々のフレームワークは、最小二乗、ハマー、ロジスティック損失など、古典的損失関数の幅広いクラスに対応している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:00:59 GMT)
Machine Learning for Detection and Analysis of Novel LLM Jailbreaks [3.3] 大きな言語モデル(LLM)は、悪意のあるユーザが入力テキストの操作を通じて望ましくない応答を要求できるような、さまざまな脆弱性に悩まされる。
いわゆるジェイルブレイクプロンプトは、LLMを騙して安全ガードレールの設置を回避し、開発者のポリシーに受け入れられる応答を維持するように設計されている。
本研究では,異なる機械学習モデルを用いて,jailbreakプロンプトを真の用途と区別する能力について分析する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:08:44 GMT)
The Environmental Impacts of Machine Learning Training Keep Rising Evidencing Rebound Effect [3.3] 過去10年間の著名なAIシステムのトレーニングに関連する環境影響を推定する。
まず、この期間にグラフィクスカードの生産が着実に増加したこと。
ハードウェアの影響は、影響のシフトを避けるために、唯一の使用フェーズではなく、ライフサイクル全体を通して考慮する必要がある。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:49:37 GMT)
Placeit! A Framework for Learning Robot Object Placement Skills [3.2] Placeit!は、剛体物体の有効な配置位置を生成するための進化計算フレームワークである。
私たちのフレームワーク上に構築されたピック&プレースパイプラインは、120の現実世界のデプロイメントに対して90%の成功率を達成した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:08:06 GMT)
Saving SWE-Bench: A Benchmark Mutation Approach for Realistic Agent Evaluation [3.2] SWE-Bench Verifiedのようなソフトウェアエンジニアリングエージェントを評価するための現在のベンチマークは、主にGitHubの問題に由来する。
既存のベンチマークを現実的なユーザクエリに変換する,新たなベンチマークフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:42:02 GMT)
Herb.jl: A Unifying Program Synthesis Library [3.2] Herb.jlは、Juliaプログラミング言語で書かれた統一プログラム合成ライブラリである。
基礎となる合成アルゴリズムを、コミュニケーションと完全に拡張可能なサブコンポーネントにモジュール化することを目的としている。
Herb.jlを使用するメリットを示すために,3つの一般的なユースケースを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:45:36 GMT)
VisuoAlign: Safety Alignment of LVLMs with Multimodal Tree Search [3.2] 本稿では,アクシデント誘導木探索によるマルチモーダル安全アライメントのためのフレームワークであるVisuoAlignを提案する。
VisuoAlignはリスクを積極的に公開し、包括的なデータセット生成を可能にし、複雑なクロスモーダル脅威に対するLVLMの堅牢性を大幅に改善する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:46:58 GMT)
Creation of the Chinese Adaptive Policy Communication Corpus [3.2] CAPC-CGは5色分類でアノテートされた中国の政策指令の最初のオープンデータセットである。
このコーパスには、中国の最高機関が発行する国家法、行政規則、大臣規則が含まれている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:11:57 GMT)
Autonomous Soft Robotic Guidewire Navigation via Imitation Learning [3.1] 血管内手術では、インターベンショニストはカテーテルと呼ばれる細いチューブを細いワイヤーで導かれ、患者の血管内の治療部位へ押し込む。
ロボットの先端を持つガイドワイヤは操作性を高めることができるが、モデリングと制御の課題を提示する。
我々は,目標条件付け,相対的な動作出力,および自動コントラスト染料注入を用いたトランスフォーマーに基づく模倣学習フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:57:09 GMT)
PRNet: Original Information Is All You Have [3.1] PRNetは、原始的な浅い空間的特徴の保存と効率的な利用を優先するリアルタイム検出フレームワークである。
PRNetは、同等の計算制約の下で最先端のメソッドより優れている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:44:39 GMT)
Multiparameter regularization and aggregation in the context of polynomial functional regression [3.1] 本稿では,複数のパラメータの正規化のためのアルゴリズムを導入し,関連するパラメータを扱うための理論的基礎的手法を提案する。
提案手法の有効性は, 人工医療データと実世界の医療データの両方を用いて評価し, 有望な結果が得られた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:06:01 GMT)
Use of Retrieval-Augmented Large Language Model Agent for Long-Form COVID-19 Fact-Checking [2.8] 本研究では,大規模言語モデルと検索拡張生成を組み合わせたエージェントシステムSAFEを提案する。
SAFEには、クレーム抽出のためのエージェントとクレーム検証のためのエージェントの2つが含まれている。
拡張版であるSAFELOTR-RAG + SRAGは、Self-RAGを組み込んでクエリ書き換えによる検索を洗練している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:10:46 GMT)
Explaining Models under Multivariate Bernoulli Distribution via Hoeffding Decomposition [2.8] サブモデル分解によるランダムな入力を伴う予測モデルの振る舞いを解説する。
基礎となる L2 の部分空間は 1 次元であり、汎函数分解は明示的であることを示す。
入力が出力予測に与える影響の明示的な指標を明示的に導出することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:02:34 GMT)
Prime Implicant Explanations for Reaction Feasibility Prediction [2.8] 化学反応の実現可能性を予測する機械学習モデルは、自動合成計画の中心となっている。
素因果説明の新規な定式化(最小限の理由としても知られる)をこの領域に合わせて導入する。
予備実験では、素因果説明という概念が、根底的な真理説明を保守的に捉えていることが示されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:13:39 GMT)
Fast Self-Supervised depth and mask aware Association for Multi-Object Tracking [2.7] マルチオブジェクト追跡 (MOT) 法は、しばしば関連付けにIntersection-over-Union (IoU) を用いる。
本研究では,物体の形状を計測するためにセグメンテーションマスクを用いるが,セグメンテーションIoUは計算しない。
当社のMOT法は,IoUを計算せずに自己教師付きエンコーダを用いてセグメンテーションマスクを精製する最初の方法である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:32:24 GMT)
Modern iOS Security Features -- A Deep Dive into SPTM, TXM, and Exclaves [2.6] XNUカーネルはAppleのオペレーティングシステムの基礎である。
Appleは、より分断化されたカーネルアーキテクチャへの一歩を踏み出した。
本稿では,新たなセキュリティ機構とその相互作用を包括的に分析する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:14:27 GMT)
Principled Operator Learning in Ocean Dynamics: The Role of Temporal Structure [2.5] 本研究では,標準フーリエニューラル演算子(FNO)とその変種であるFNOtDを比較し,海洋PDEの解演算子を学習しながら分散関係を内部化するために修正した。
その結果、積分カーネルのトレーニングにおけるエンタングリング空間と時間により、マルチスケール波動伝搬を捕捉し、海洋力学を効果的に学習できることを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:54:38 GMT)
Simple and Robust Forecasting of Spatiotemporally Correlated Small Earth Data with A Tabular Foundation Model [2.5] 小さな地球データは、限られた短期観測観測と時間的に相関している。
本研究では、時間的相関した小さな地球データの予測を定量化するための、単純で堅牢なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:07:23 GMT)
Unsupervised Multi-Source Federated Domain Adaptation under Domain Diversity through Group-Wise Discrepancy Minimization [2.5] Unsupervised Multi-source Domain adapt (UMDA) は、複数の多様なソースドメインからのラベル付きデータを活用することにより、ラベルなしのターゲットドメインに一般化するモデルを学習することを目的としている。
GALAはスケーラブルで堅牢なUMDAフレームワークで、2つの重要なコンポーネントを導入しています。
GALAは、標準ベンチマークの競合や最先端の結果を一貫して達成し、様々なマルチソース設定で先行メソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:35:27 GMT)
Performance Analysis of Machine Learning Algorithms in Chronic Kidney Disease Prediction [2.5] 世界の人口の約10%は慢性腎臓病(CKD)の影響を受けていると考えられており、腎機能低下の原因となっている。
そこで本研究では,CKDの診断のための疾患予測型コンピュータ支援設計を考案し,提案した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:54:37 GMT)
CausalDynamics: A large-scale benchmark for structural discovery of dynamical causal models [2.5] CausalDynamicsは動的因果モデルの構造的発見を促進するためのフレームワークである。
我々のベンチマークは、線形および非線形に結合した常微分方程式と微分方程式の両方から導出される真の因果グラフで構成されている。
本研究では, ノイズ, 畳み込み, タグ付けされた動的システムにおいて, グラフ再構成のための最先端因果探索アルゴリズムを包括的に評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:12:54 GMT)
Flow-Opt: Scalable Centralized Multi-Robot Trajectory Optimization with Flow Matching and Differentiable Optimization [2.4] Flow-Optは、集中型マルチロボット軌道最適化の計算トラクタビリティ向上のための学習ベースのアプローチである。
我々は,数ミリ秒で散在する環境下で,数十個のロボットの軌跡を生成できることを実証した。
また,提案手法は,競合するベースラインよりも高速にスムーズな軌道列を生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:43:18 GMT)
Entangled Photon Pair Generator via Biexciton-Exciton Cascade in Semiconductor Quantum Dots and its Simulation [2.4] 半導体量子ドットにおけるビエクシトン・エキシトンカスケードを利用した光子対生成器について述べる。
このシステムは、より大きな量子光学実験のためのフレームワークにおいて、自己完結成分として実装され、シミュレートされる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:02:10 GMT)
How Secure is Forgetting? Linking Machine Unlearning to Machine Learning Attacks [2.4] 機械学習(ML)におけるセキュリティ脅威の構造的分析と,そのマシン・アンラーニング(MU)への影響について述べる。
本研究では,バックドアアタック,メンバーシップ推論アタック(MIA),アタック,インバージョンアタックの4つの主要な攻撃クラスについて検討する。
倫理的考察を含むオープンな課題を特定し、将来有望な研究方向性を探求する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:40:33 GMT)
Steering Embedding Models with Geometric Rotation: Mapping Semantic Relationships Across Languages and Models [2.3] 埋め込み空間における一貫した回転操作として意味変換を表現する幾何学的アプローチであるRotor-Invariant Shift Estimation (RISE)を導入する。
RISE操作は高い性能で言語とモデルの両方をまたいで動作することができる。
この研究は、談話レベルの意味変換が多言語埋め込み空間における一貫した幾何学的操作に対応するという最初の体系的な実証を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:51:32 GMT)
CARLE: A Hybrid Deep-Shallow Learning Framework for Robust and Explainable RUL Estimation of Rolling Element Bearings [2.3] Remaining Useful Life (RUL) は、コンポーネント、例えばローリングエレメントのベアリングが障害前にどれくらいの期間動作するかを予測する。
多くのRUL法が存在するが、動作条件が変化すると一般化性や堅牢性に欠けることが多い。
本稿では,これらの課題に対処するために,深層学習と浅層学習を組み合わせたハイブリッドAIフレームワークであるCARLEを紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:43:26 GMT)
PatentVision: A multimodal method for drafting patent applications [2.3] 大規模ビジョン言語モデル (LVLM) は、様々なタスクにまたがる約束を示すが、特許の書き起こしの自動化への応用はまだ未定である。
本稿では,特許クレームや図面などのテキストおよび視覚的なインプットを統合し,完全な特許仕様を生成するフレームワークであるPatentVisionを紹介する。
実験では、テキストのみの手法を超越し、より忠実で人間の記述された標準と整合した出力を生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:12:05 GMT)
Hallucination Filtering in Radiology Vision-Language Models Using Discrete Semantic Entropy [2.3] 個別意味エントロピー(DSE)を用いて幻覚を発生させる可能性のある質問を拒絶することで、X線画像に基づく視覚質問応答(VQA)におけるブラックボックス視覚言語モデル(VLM)の精度を向上させることができる。
この振り返り調査は、2つの公開されていないデータセットを使用してDSEを評価した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:53:33 GMT)
NarraBench: A Comprehensive Framework for Narrative Benchmarking [2.3] 本稿では,ナラベンチ(Narra Bench)について紹介する。
既存のベンチマークでは、ストーリータスクの27%しかうまく捉えられていないと見積もっています。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:04:31 GMT)
Alif: Advancing Urdu Large Language Models via Multilingual Synthetic Data Distillation [2.2] 我々は多言語Urdu- EnglishモデルであるAlif-1.0-8B-Instructを提案する。
高品質な多言語合成データセット(Urdu-Instruct)でモデルを訓練する。
このデータセットには、Urdu-native chain-of-thinktベースの推論、バイリンガル翻訳、文化的関連性、倫理的安全性アライメントが含まれている。
Alif-1.0-8B-インストラクトは、訓練済みのLlama-3.1-8Bをベースとしており、ウルドゥー仕様のLlama-3.1-8B-インストラクトよりも優れた性能を示している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:41:02 GMT)
A Generic Machine Learning Framework for Radio Frequency Fingerprinting [2.2] フィンガープリンティング無線周波数(RF)エミッタは通常、送信信号に特徴付けられる独自のエミッタ特性の発見を伴う。
最も粒度の細かいダウンストリームタスクは、特定の送信者識別(SEI)と呼ばれ、成功させるためにはRFフィンガープリント(RFF)アプローチが必要である。
RFF法は、Emitter Data Association (EDA) やRF Emitter Clustering (RFEC) など、多くの下流タスクもサポートしている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:34:07 GMT)
On Developers' Self-Declaration of AI-Generated Code: An Analysis of Practices [2.2] この研究は、開発者がAI生成コードの自己宣言に使用する方法を理解することを目的としている。
第1フェーズでは、GitHubからAI生成コードスニペットの613のインスタンスを収集しました。
第2フェーズでは,フォローアップ実践者の調査を行い,有効回答は111件であった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:10:42 GMT)
Model-Assisted and Human-Guided: Perceptions and Practices of Software Professionals Using LLMs for Coding [2.2] 大規模言語モデルは、急速に現代のソフトウェア開発の中心的なコンポーネントになりつつある。
本稿では,131名のソフトウェア実践者の国際調査から予備的知見を提示する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:59:56 GMT)
Toward Mechanistic Explanation of Deductive Reasoning in Language Models [2.2] そこで本研究では,小言語モデルを用いて,基礎となるルールを学習することで,帰納的推論課題を解くことができることを示す。
以上の結果から,誘導頭部はルール完了とルール連鎖の実施において中心的な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:49:00 GMT)
A Demonstration of Self-Adaptive Jamming Attack Detection in AI/ML Integrated O-RAN [2.2] 妨害攻撃は ネットワーク性能を著しく低下させる
本稿では,自己適応型ジャマ検出フレームワークであるSAJDについて述べる。
SAJDは、精度と適応性の観点から、最先端のジャミング検出xAppよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:18:00 GMT)
Residual-Informed Learning of Solutions to Algebraic Loops [2.2] フィードフォワードニューラルネットワークは、損失関数における代数ループの残差(エラー)を用いて訓練される。
このトレーニング戦略は曖昧な解の問題も解決し、サロゲートが一貫した解に収束することを可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:16:47 GMT)
Quantum state preparation with optimal T-count [1.9] 任意の$n$-qubit量子状態を誤差$varepsilon$に近似するために、Tゲートがいくつ必要かを示す。
また、これは任意の対角線$n$-qubitユニタリをエラー$varepsilon$に実装するための最適なTカウントであることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:17:26 GMT)
Systematic Assessment of Cache Timing Vulnerabilities on RISC-V Processors [1.9] キャッシュベースのタイミング脆弱性に対するIntel x86-64ベンチマークスイートをRISC-Vに移植する作業について述べる。
次に、このベンチマークを用いて、市販のRISC-Vプロセッサ3プロセッサのセキュリティを評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:15:40 GMT)
High-Fidelity Single-Shot Readout and Selective Nuclear Spin Control for a Spin-1/2 Quantum Register in Diamond [1.9] 量子ネットワークは、単一量子デバイスのサイズと複雑さの制限を克服する方法を提供する。
長寿命の核スピンと組み合わせたダイヤモンド中のグループIVカラーセンターは、有望なビルディングブロックとして現れている。
我々は、そのようなネットワークノードのための実行可能なプラットフォームとして、ゲルマニウム空き(GeV)センターを確立する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:07:12 GMT)
Spatio-Temporal Graph Convolutional Networks for EV Charging Demand Forecasting Using Real-World Multi-Modal Data Integration [1.8] 輸送は温室効果ガスの排出に大きく貢献している。
本研究では,グラフ・コナール・ネットワークと時間的アーキテクチャを組み合わせた時間的予測フレームワークであるTW-GCNを紹介する。
我々は、実世界の交通の流れ、気象条件、および独自のデータを利用して、空間的依存と時間的ダイナミクスの両方を捉える。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:31:17 GMT)
TAWRMAC: A Novel Dynamic Graph Representation Learning Method [1.7] TAWRMACは、時間匿名ウォークスをリスタート、メモリ拡張、Neighbor共起埋め込みと統合する新しいフレームワークである。
TAWRMACは安定で、一般化可能で、コンテキスト対応の埋め込みを提供することで、連続時間動的グラフ学習における技術の状態を前進させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:38:07 GMT)
Disorder operators in two-dimensional Fermi and non-Fermi liquids through multidimensional bosonization [1.7] 障害作用素は量子多体系の非局所観測可能量である。
We study the disorder operator for U(1) symmetric in two-dimensional Fermi and non-Fermi liquid states。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:28:22 GMT)
FATHOMS-RAG: A Framework for the Assessment of Thinking and Observation in Multimodal Systems that use Retrieval Augmented Generation [1.6] 我々は、RAGパイプライン全体を評価するために設計されたベンチマークを導入する。
パイプラインの摂食能力を評価するために設計された93の質問のデータセットを提示する。
クローズドソースパイプラインは、正確性と幻覚の指標の両方で、オープンソースパイプラインを著しく上回ります。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:51:47 GMT)
A Multimodal Approach to SME Credit Scoring Integrating Transaction and Ownership Networks [1.5] 中小企業は経済成長、雇用、イノベーションにおいて重要な役割を担っている。
金融履歴の制限、担保的制約、マクロ経済的なショックへの曝露などにより、クレジットへのアクセスにおいて大きな課題に直面する傾向にある。
本稿では、著名な金融機関が提供したSME融資の大規模データセットを用いて、中小企業信用のリスクをモデル化するための新たなアプローチを提示し、検証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:02:05 GMT)
Judge's Verdict: A Comprehensive Analysis of LLM Judge Capability Through Human Agreement [1.5] 本研究では,Large Language Models (LLMs) を応答精度評価タスクの判定対象として,新たな2段階評価手法を提案する。
RAG(Retrieval-Augmented Generation)やAgentic Pipelines(Agentic Pipelines)からの応答を、地上の真実の答えに対して評価すると、54個のLLMが人間の判断をいかにうまく再現できるかを評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:27:33 GMT)
FLToP CTC: Frame-Level Token Pruning via Relative Threshold for Efficient and Memory-Saving Decoding on Diverse Platforms [1.5] CTCベースのASRシステムは、リソース制限された環境で計算とメモリのボトルネックに直面している。
本稿では,コネクショナリズム時間分類(FLToP CTC)のためのフレームレベルトケンプルーニングを提案する。
FLToP CTCは、無視可能なWER劣化を維持しながら、計算とメモリの要求を減らす。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:32:54 GMT)
Context-Aware Visual Prompting: Automating Geospatial Web Dashboards with Large Language Models and Agent Self-Validation for Decision Support [1.5] リスク分析と意思決定のためのWebベースのダッシュボードの開発は、大きな多次元データの難しさに悩まされることが多い。
ユーザ定義入力からインタラクティブな地理空間ダッシュボードの作成を自動化する生成AIフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:58:15 GMT)
Cross-dataset Multivariate Time-series Model for Parkinson's Diagnosis via Keyboard Dynamics [1.5] パーキンソン病(PD)は世界的な課題となり、1000万人以上の人に影響を与えている。
本稿では,キーストロークダイナミックスを非侵襲的かつスケーラブルなバイオマーカーとして活用し,遠隔PDスクリーニングと遠隔監視を実現するパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:42:08 GMT)
Non-traditional data in pandemic preparedness and response: identifying and addressing first and last-mile challenges [1.5] パンデミックは、従来の公衆衛生データを非伝統的なデータで補完する重要なテストケースとなった。
データセットの約66%がアクセスの問題に悩まされており、NTDのデータ共有は従来の2倍である。
この記事は、NTDを使用して、より広範な公衆衛生状況に直面するロードマップの設計に使用することができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:47:38 GMT)
Quantum Dark Magic: Efficiency of Intermediate Non-Stabiliserness [1.5] 本稿では, 様々なアルゴリズムにおける非安定性の挙動を追跡する手法を提案する。
構造的および非構造的変動的アプローチに対する非安定化性の使用において、異なる効率性を見出した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:42:15 GMT)
Agents in the Sandbox: End-to-End Crash Bug Reproduction for Minecraft [1.4] Minecraftのような継続的な進化を続けるゲームにおいて、特にクラッシュのバグを再現することは、手動で時間をかけ、自動化するのに難しいプロセスです。
本稿では,Minecraftのクラッシュバグの再現をユーザからの報告から直接自動化する,新たなエンドツーエンドフレームワークであるBugCraftを紹介する。
BugCraft-Benchでは、我々のフレームワークはGPT-4.1で34.9%のクラッシュバグを再現し、ベースラインのコンピュータ使用モデルを37%上回った。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:28:14 GMT)
JuliaGrid: An Open-Source Julia-Based Framework for Power System State Estimation [1.4] JuliaGridはオープンソースのフレームワークで、複数のプラットフォームにわたるハイパフォーマンス実行用に設計されている。
可観測性解析、重み付けされた最小二乗および絶対値推定器、悪いデータ分析、およびファサー測定に関連する様々なアルゴリズムを実装している。
JuliaGridは準定常解析のために特別に設計されており、パフォーマンスを高めるために計算データの自動検出と再利用を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:36:04 GMT)
Exploring Cross-Lingual Knowledge Transfer via Transliteration-Based MLM Fine-Tuning for Critically Low-resource Chakma Language [1.4] 限られたデータしか持たないインド・アーリア語として、チャクマは言語モデルにおいてほとんど表現されていない。
本稿では,チャクマ文学からキュレートされ,母語話者によって検証された,文脈的にコヒーレントなバングラ文字翻訳チャクマの新たなコーパスを紹介する。
実験により、微調整された多言語モデルは、バングラ文字のチャクマに適応する際、事前訓練されたモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:07:14 GMT)
Confidence-weighted integration of human and machine judgments for superior decision-making [1.4] 大きな言語モデル(LLM)は、特定の予測タスクにおいて人間を上回ることができる。
1つの可能性として、人間はLSMよりも悪いパフォーマンスをしているにもかかわらず、チームで作業するときに価値を付加できる。
人間と機械のチームは、チームメンバーの自信が十分に調整されたときに、各チームメイトを追い越すことができます。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:03:13 GMT)
Investigating the Impact of Rational Dilated Wavelet Transform on Motor Imagery EEG Decoding with Deep Learning Models [1.4] Rational Discrete Wavelet Transform (RDWT) は、運動画像脳波(EEG)デコードのためのプラグイン前処理ステップとして使用される。
この評価は、High Gamma、BCI-IV-2a、BCI-IV-2bの3つのベンチマークデータセットで実施された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:31:14 GMT)
From Captions to Keyframes: KeyScore for Multimodal Frame Scoring and Video-Language Understanding [1.4] KeyScoreは、キャプションと意味的類似性、時間的代表性、文脈的ドロップインパクトを組み合わせたキャプション対応のフレームスコアリング手法である。
提案手法は効率と性能を両立させ,拡張性とキャプションによる映像理解を可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:42:35 GMT)
MedVKAN: Efficient Feature Extraction with Mamba and KAN for Medical Image Segmentation [1.4] 医用画像セグメンテーションは、伝統的に畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースのモデルに依存してきた。
トランスフォーマーモジュールの代替として,VSSと拡張フィールド畳み込みKAN(EFC-KAN)を統合したVSS拡張KAN(VKAN)モジュールを提案する。
さらに,VKANをU-Netフレームワークに組み込むことで,医用画像の効率的な分割モデルであるMedVKANを実現する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:38:51 GMT)
Myopic Bayesian Decision Theory for Batch Active Learning with Partial Batch Label Sampling [1.3] 筋電図フレームワークにおける(ベイジアン)能動的学習のためのBDTを導出する。
BAIT(V-optimal experimental designに基づくアクティブラーニング)は,BDTと近似から導出可能であることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:28:42 GMT)
The Yang-Baxter integrability of the critical Ising chain [1.3] 一次元臨界逆場イジングモデルがヤン・バクスター積分可能であることを示す。
また、周期的横フィールドイジングモデルに対するクラマース・ワニエ双対性や他の非可逆対称性も見出す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:20:05 GMT)
A Novel Multi-branch ConvNeXt Architecture for Identifying Subtle Pathological Features in CT Scans [1.2] 本稿では,医療画像解析の難題に特化して設計されたマルチブランチConvNeXtアーキテクチャを提案する。
提案モデルでは,厳密なデータ前処理から拡張まで,厳格なエンドツーエンドパイプラインを組み込んでいる。
実験結果から、最終的なROC-AUCは0.9937、バリデーション精度は0.9757、F1スコアは0.9825である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:00:46 GMT)
A Biophysically-Conditioned Generative Framework for 3D Brain Tumor MRI Synthesis [1.2] 我々は,脳腫瘍MRIを合成するために,連続性腫瘍濃度を条件とした最初の生成モデルを導入する。
BraTS 2025 Inpainting Challengeでは,腫瘍濃度を0に設定することで,この構造を健全な組織修復の補完課題に適応させる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:23:33 GMT)
Interpretable Generative and Discriminative Learning for Multimodal and Incomplete Clinical Data [1.2] 実世界の臨床問題は、しばしばマルチモーダルデータによって特徴づけられ、機械学習アルゴリズムに重大な制限を課している。
解釈可能な解を提供しながら,これらの課題を効率的に処理するベイズ的手法を提案する。
本手法は,(1)半教師付き戦略との相互関係を捉えた生成的定式化,(2)特定の下流目標に対する関連情報を特定するための識別的タスク指向定式化を統合したものである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:20:24 GMT)
Big cats: entanglement in 120 qubits and beyond [1.2] 我々は,120個の超伝導量子ビットからなるグリーンベルガー・ホーネ・ザイリンガー状態(GHZ)について報告した。
GHZ状態の検証は容易であるが、ノイズに対する感度が高いため準備は困難である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:30:33 GMT)
A methodology for clinically driven interactive segmentation evaluation [1.1] インタラクティブセグメンテーションは、医用画像セグメンテーションのための堅牢で汎用的なアルゴリズムを構築するための有望な戦略である。
しかし、矛盾する、臨床的に非現実的な評価は、公正な比較を妨げ、現実世界のパフォーマンスを誤って表現する。
本稿では,評価タスクとメトリクスを定義するための臨床的手法を提案し,標準化された評価パイプラインを構築するためのソフトウェアフレームワークを構築した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:00:06 GMT)
Quantum Algorithms for the Minimum Steiner Tree problem with application to Binary Near-Perfect Phylogenies [1.1] バイオインフォマティクスにおける量子アルゴリズムについて, BNPP(Bibinary Near-Perfect Phylogeny Problem)の解法について述べる。
我々は、回路モデルにおいて、複雑性$O(e)(k,l)k)$の最小スタイナーツリー(MST)問題に対して、別の空間正確なアルゴリズムを与える。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:53:16 GMT)
Accent-Invariant Automatic Speech Recognition via Saliency-Driven Spectrogram Masking [1.1] 本稿ではアクセントと方言の分類を認識パイプラインに統合するアクセント不変のASRフレームワークを提案する。
我々のアプローチは、アクセント固有の手がかりを捉え、その予測に最も影響を及ぼす領域をマスキングするためにスペクトログラムベースの分類器を訓練し、データ拡張にマスク付きスペクトログラムを使用することである。
ペルシャ語では、複数の地域アクセントにまたがる新たに収集されたデータセットを導入し、ペルシャ語ASRにおけるアクセント変動のシステマティックなベンチマークを確立した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:41:53 GMT)
WaveNet's Precision in EEG Classification [1.1] 本研究では,脳波信号の生理的,病理学的,アーティファクト的,ノイズ的分類の自動化を目的としたWaveNetに基づくディープラーニングモデルを提案する。
モデルは、70/20/10%のスプリットで209,232個のサンプルをトレーニングし、検証し、テストした。
WaveNetのアーキテクチャは、もともと生音声合成のために開発されたもので、拡張因果畳み込みと残差接続を使用するため、EEGデータによく適している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:21:21 GMT)
Conditional disclosure of secrets with quantum resources [1.1] 秘密の条件開示(英: Conditional revealsure of Secrets、CDS)は、通信、ランダム性、セキュリティの関係を研究する最も単純な暗号設定の一つである。
近年、CDQSと呼ばれるプリミティブの量子アナログが定義され、量子位置検証の文脈で研究される$f$-routingに関連している。
我々は,情報理論設定におけるプライバシと量子リソースの関係をよりよく理解することを目的として,CDQSの体系的研究を開始した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:08:58 GMT)
Safe Farming: Development of a Prevention System to Mitigate Vertebrates Crop Raiding [1.0] 本稿では,農作物が脊椎動物による攻撃から保護される安全農業のモデルを提案する。
異なるセンサーノードがフィールドの周りに配置され、動物や鳥を検知し、必要な信号と情報を生成する。
RNSはその情報を受信すると、動物や鳥には耐え難い超音波音を生成し、フィールドから逃げ出す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:21:04 GMT)
Challenges in designing ethical rules for Infrastructures in Internet of Vehicles [1.0] Internet of Vehicles (IoV) は VANET に Internet of Vehicles (IoV) の概念をもたらした。
本稿では,IoV システムにおける RSU の倫理的ルール設計に係わる重要な課題について述べる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:30:27 GMT)
Exploring human-SAV interaction using LLMs: The impact of psychological factors on user experience [1.0] 本研究では,大規模言語モデル(LLM)を用いた会話型SAVエージェントの迅速な戦略が,ユーザの認識,経験,採用意図にどのように影響するかを検討する。
人為的特徴の異なる4つのSAVエージェントと心理的所有権のトリガーを設計した。
以上の結果から,SAVはより人為的であり,心理的所有権を誘発するように設計されており,SAVの人間的特性に対するユーザの認識が向上したことが示唆された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:55:08 GMT)
Learning Regularizers: Learning Optimizers that can Regularize [1.0] 学習者(LO)は、目的関数に明示的に適用することなく、従来の正規化手法の効果を内部化するように訓練できることを示す。
正規化されたLOは、テスト精度と一般化の点で、不正規化されたLOよりも一貫して優れている。
以上の結果から,LOは本来は正規化特性を学習し,従来は明示的最適損失正規化の必要性を補足することが示唆された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:23:28 GMT)
TriP-LLM: A Tri-Branch Patch-wise Large Language Model Framework for Time-Series Anomaly Detection [1.0] 時系列異常検出は、広範囲のアプリケーションドメインで中心的な役割を果たす。
時系列異常検出(TriP-LLM)のための三分岐パッチワイド言語モデルフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:13:06 GMT)
Online and Offline Robust Multivariate Linear Regression [1.0] 提案手法は,オンライン勾配降下アルゴリズムと平均化バージョン,オフライン固定点アルゴリズムの2つである。
ノイズの分散行列は一般に未知であるため、マハラノビスに基づく勾配勾配アルゴリズムに頑健な推定をプラグインすることを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:04:02 GMT)
The Impact of Sanctions on decentralised Privacy Tools: A Case Study of Tornado Cash [1.0] Tornado Cashは、トランザクションのプライバシを高めるために設計されたスマートコントラクトプロトコルである。
アメリカ合衆国財務省は2022年8月にトルネード・キャッシュに対する制裁を課した。
制裁後,取引量,ユーザ多様性,プロトコル利用の大幅な削減が図られている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:55:32 GMT)
Clustering Deposit and Withdrawal Activity in Tornado Cash: A Cross-Chain Analysis [1.0] Tornado Cashは分散型ミキサーで、暗号技術を使って預金者と引き出し者の間のチェーン上の道を切断する。
本稿では,3つのクラスタリング, (i) アドレス再利用, (ii) トランザクショナルリンク, (iii) 時間整合規則を提案する。
分析の結果, 5.1~12.6%の引き出しは, アドレス再利用や取引リンクを通じて, 既に起源の鉱床まで遡ることができることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:42:24 GMT)
Atomistic origin of low thermal conductivity in quaternary chalcogenides Cu(Cd, Zn)$_2$InTe$_4$ [0.9] CuCd$Te$InTe$_4$のような第四級カルコゲナイド半導体は、低い$mathcalK$を示すように実験的に示されている。
その結果,フェルミ準位以下の反結合状態はフォノン不調和性を高め,熱伝導性フォノンモードの強い散乱を引き起こすことがわかった。
本研究は, カルコゲナイドの低分子量カルアルK$の原子起源を明らかにし, 低熱伝導性半導体の設計の指針となる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:20:26 GMT)
Utilizing dynamic sparsity on pretrained DETR [0.9] 我々は,DETRの層に固有の空間を解析し,再学習せずに利用する方法を2つ導入する。
まず、固定活性化パターンに基づいてニューロンの不活性を予測する手法である静的指標ベーススパシフィケーション(SIBS)を提案する。
そこで我々は,事前訓練されたDETR上にトレーニングした軽量ゲーティング機構であるMGS(Micro-Gated Sparsification)を導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:36:00 GMT)
Incoherent Imaging with Spatially Structured Quantum Probes [0.9] 蛍光や吸収顕微鏡を含む非コヒーレントイメージングは、弱い信号や解像度の制約によって制限されることが多い。
一般化された非コヒーレントイメージングモデルをマッピングするツインビームエコーに基づく新しいイメージングプロトコルを提案する。
注目すべきは、同じプロトコルが複数の立方体の変位場再構成をサポートすることである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:31:01 GMT)
SQuaD: Smart Quantum Detection for Photon Recognition and Dark Count Elimination [0.9] SQuaDは、高タイミング分解能データ取得、マルチスケールデータ分析、インテリジェントな特徴認識と抽出を備えた完全に統合された量子システムである。
我々は、SQuaDを原子(エルビウムイオン)光子源に展開し、通信帯域におけるスピン量子ビットのノイズフリー制御と読み出しを実現する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:27:27 GMT)
Detecting Malicious Pilot Contamination in Multiuser Massive MIMO Using Decision Trees [0.9] 5Gや6Gのような現代の無線通信システムでは、MMIMO(Massive multiple-input multiple-output)が不可欠だが、アクティブな盗聴攻撃には弱い。
そのような攻撃の1つのタイプはパイロット汚染攻撃(PCA)であり、悪意のあるユーザはアップリンク中に認証されたユーザーからパイロット信号をコピーする。
マルチユーザシステムにおける基地局におけるPCA検出にDecision Tree(DT)アルゴリズムを用いることを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:25:53 GMT)
Populism Meets AI: Advancing Populism Research with LLMs [0.8] 我々は,人間のコーダトレーニングを反映する思考の連鎖(CoT)を誘導するルーリックでアンカー誘導の連鎖の結果を提示する。
我々は、モデルの推論をガイドするために、同じドキュメントの適応バージョンでLLMに促すことで、人間のコーダのトレーニングに使用されるプロセスを再現する。
このドメイン固有のプロンプト戦略により、LLMは専門家の人間のコーダと同等の分類精度を達成できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:46:53 GMT)
Gradient-Guided Furthest Point Sampling for Robust Training Set Selection [0.8] GGFPS(Gradient Guided Furthest Point Sampling)は、分子の配置空間の効率的なサンプリングを導くために分子力ノルムを利用するFPS(Furthest Point Sampling)の単純な拡張である。
FPSと一様サンプリングと比較すると,GGFPSを用いた場合,データ効率とロバスト性は優れていた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:41:06 GMT)
Provable avoidance of barren plateaus for the Quantum Approximate Optimization Algorithm with Grover mixers [0.8] 我々は、量子近似最適化アルゴリズム(GM-QAOA)のGrover-mixer変種に関連するリー代数を解析する。
GM-QAOA の DLA が、同じ状態の全ての QAOA 変種の中で最大の可換量を持つことを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:40:21 GMT)
Anemoi: A Semi-Centralized Multi-agent System Based on Agent-to-Agent Communication MCP server from Coral Protocol [0.7] Anemoi は、Coral Protocol の Agent-to-Agent (A2A) 通信 MCP サーバ上に構築された、半集中型の MAS である。
従来のデザインとは異なり、Anemoiは構造的かつ直接的なエージェント間コラボレーションを可能にし、すべてのエージェントが進捗を監視し、結果を評価し、ボトルネックを特定し、リアルタイムに改善を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:12:06 GMT)
Efficient and Accurate Pneumonia Detection Using a Novel Multi-Scale Transformer Approach [0.7] 肺炎検出のための新しいマルチスケールトランスフォーマー手法を提案する。
本手法は肺の分節と分類を統一的な枠組みに統合する。
我々の手法は、"Kermany"データセットで93.75%の精度、"Cohen"データセットで96.04%の精度を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:29:34 GMT)
The Speech-LLM Takes It All: A Truly Fully End-to-End Spoken Dialogue State Tracking Approach [0.7] 従来のマルチモーダルコンテキスト(テキスト履歴と音声の現在方向の組み合わせ)、フル音声履歴、圧縮音声履歴アプローチを評価した。
SpokenWOZコーパスの実験では、入力として完全な会話を提供することで、類似サイズのモデルの中で最高のパフォーマンスが得られることが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:27:01 GMT)
6G-Enabled Digital Twin Framework for Real-Time Cyber-Physical Systems: An Experimental Validation with Industrial Bearing Fault Detection [0.7] 既存の5G対応システムは10msを超えるレイテンシに悩まされており、ミリ秒以下の応答時間を必要とするアプリケーションには不十分である。
本研究の目的は、超低遅延通信とリアルタイム同期を実現する6G対応のDigital Twinフレームワークを開発することである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:11:29 GMT)
Gate Teleportation vs Circuit Cutting in Distributed Quantum Computing [0.7] 分散量子計算は、サブ回路サンプリングと古典的な後処理オーバーヘッドを指数関数的に増加させる。
量子ビットのフォトニックな絡み合いの最近の進歩は、遠隔ゲートの性能を達成するために必要な光リンクメトリクスについて議論している。
我々の研究は、短期的な量子相互接続ハードウェアメトリクスを通知し、ネットワーク対応のハイブリッド量子古典分散計算アプローチを動機づける。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:14:22 GMT)
Site-Level Fine-Tuning with Progressive Layer Freezing: Towards Robust Prediction of Bronchopulmonary Dysplasia from Day-1 Chest Radiographs in Extremely Preterm Infants [0.7] BPD(Bronchopulmonary dysplasia)は、超低出生体重児の35%に発症する慢性肺疾患である。
BPDは生涯にわたる呼吸器合併症、神経発達障害、人工呼吸器による肺傷害、全身合併症を引き起こす。
極低出生体重児163例の胸部X線を用いた深層学習法を開発し,検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:07:57 GMT)
Obfuscation of Unitary Quantum Programs [0.7] プログラム難読化は、機能を維持しながらプログラムの内部動作を隠すことを目的としている。
本研究では,一元的量子プログラムのための最初の量子状態難解化スキームを構築することにより,既存の結果を改善する。
難読化方式の中核には、2つの新しい要素がある: キーホルダーは、シミュレーションベースのセキュリティで認証された量子状態の特定の機能を学ぶことができる機能的量子認証方式と、任意の量子回路を表すコンパイラである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:55:26 GMT)
Prototype Learning to Create Refined Interpretable Digital Phenotypes from ECGs [0.6] プロトタイプベースのニューラルネットワークは、トレーニングデータに固定された学習された代表的な信号パターンと入力を比較して解釈可能な予測を提供する。
PTB-XLデータセットを用いた多ラベルECG分類のためのプロトタイプベースディープラーニングモデルを用いる。
分類専用に訓練された個別の試作機がフェーコード形式での退院診断に関連があるかどうかを評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:46:03 GMT)
Unraveling the switching dynamics in a quantum double-well potential [0.6] 二重井戸ポテンシャルの井戸間における量子粒子の自発スイッチングについて検討する。
スイッチングレートは「階段」と呼ばれるステップライクな低下を示す
さらに, 湿地および中温・低温では, 高励起状態がカスケードおよび直接加熱によって主に占められていることが確認された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:00:06 GMT)
GL-DT: Multi-UAV Detection and Tracking with Global-Local Integration [0.6] 本稿では,Global-Local Detection and Tracking (GL-DT) フレームワークを提案する。
時空間特徴融合(STFF)モジュールを使用して、動きと外観の特徴を共同でモデル化し、グローバルな共同検出戦略と組み合わせている。
実験の結果,提案手法は実時間性能を維持しながらMOTの連続性と安定性を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:37:38 GMT)
Denoised Diffusion for Object-Focused Image Augmentation [0.6] 本研究では、制約データ設定における動物の健康モニタリングを明確にするためのオブジェクト指向データ拡張フレームワークを提案する。
われわれのアプローチは動物を背景から切り離し、動物を変換と拡散に基づく合成によって強化し、現実的で多様なシーンを作り出す。
ドメイン固有のデータを生成することにより,データ共有シナリオにおいてもリアルタイムの動物健康モニタリングソリューションが有効になる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:03:40 GMT)
Unraveling the Black Box of Neural Networks: A Dynamic Extremum Mapper [0.6] ニューラルネットワークにおけるエクストリーム数とパラメータ数との正の相関性を示す。
本稿では,バックプロパゲーションアルゴリズムとは大きく異なる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:52:04 GMT)
Fast and robust parametric and functional learning with Hybrid Genetic Optimisation (HyGO) [0.6] HyGOは、進化的アルゴリズムのグローバルな探索機能と、ロバストな解の探索の高速化を統合している。
パラメトリック問題の場合、HyGOは遺伝的アルゴリズムとDSM(Dowhill Simplex Method)による目標改善を交互に行う。
機能最適化タスクでは、HyGOは遺伝プログラミングとDSMの間で回転する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:45:32 GMT)
From Birdwatch to Community Notes, from Twitter to X: four years of community-based content moderation [0.5] Community Notes(以前はBirdwatchと呼ばれていた)は、2021年1月にXによって開始された最初の大規模クラウドソースコンテンツモデレーションイニシアチブである。
本稿では、コミュニティノートに関する文献の体系的なレビューと、コミュニティノートに関する今後の研究を支援するために、主要なキュレートされたデータセットと付随するソースコードを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:42:54 GMT)
Who Let the Diamonds Out? [0.5] 窒素空力(NV)中心磁力計は、非常に有望な量子センシング技術である。
約400pT/sqrt(Hz)のベクトル感度を実現する完全携帯型手持ちNV型磁気センサを導入する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:13:33 GMT)
Celebrity Profiling on Short Urdu Text using Twitter Followers' Feed [0.5] 本研究は,ウルドゥー語における有名人のプロファイリング問題に対して,現代の機械学習と深層学習技術を適用した。
亜大陸の有名人のフォロワーからの短いウルドゥー語ツイートのデータセットを収集し、前処理した。
cRankが0.65、精度が0.65で性別予測が達成され、その後、年齢、職業、名声予測の適度な結果が得られた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:39:31 GMT)
Two-Photon Induced Coherence without Induced Emission [0.5] 本報告では, 2光子誘起コヒーレンスを誘導放出せずに観察した。
未検出1016nm光子に印加した位相シフト$phi$は632nm光子の検出において2phi$変調をもたらすことを示す。
これは、誘起放出のない真の2光子誘起コヒーレンスを示し、量子増強相測定の可能性を開く。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:47:43 GMT)
Cognitio Emergens: Agency, Dimensions, and Dynamics in Human-AI Knowledge Co-Creation [0.5] 我々は,ヒトとAIのエピステミックパートナーシップの共進化性を捉える枠組みであるCognitio Emergens (CE)を紹介した。
人間とAIのコラボレーションを根本的に共進化的に再認識することで、CEは、人間もAIも独立して達成できない変革的なブレークスルーを可能にしながら、てんかんの完全性を維持するパートナーシップを育むための概念的なツールを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:59:30 GMT)
Exploiting Web Search Tools of AI Agents for Data Exfiltration [0.5] 大規模言語モデル(LLM)は、自然言語処理からWeb検索のような動的まで、複雑なタスクの実行に日常的に使用されている。
ツールコールと検索拡張生成(RAG)の使用により、LLMは機密性の高い企業データの処理と取得が可能になり、その機能と悪用に対する脆弱性の両方を増幅する。
我々は、現在のLLMが間接的にインジェクションアタックを誘導し、どのパラメーター、モデルサイズや製造元が脆弱性を形作り、どの攻撃方法が最も効果的かを分析する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:39:01 GMT)
CAFL-L: Constraint-Aware Federated Learning with Lagrangian Dual Optimization for On-Device Language Models [0.4] ラグランジアンデュアル最適化(CAFL-L)による制約を考慮したフェデレーション学習
ラグランジアンデュアル最適化(CAFL-L)を用いた制約対応フェデレーション学習について紹介する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:06:28 GMT)
Certifying non-classicality and non-Gaussianity through optical parametric amplification [0.4] 光の非ガウス状態は多くの量子情報プロトコルに必須である。
従来の強度検出器と光パラメトリック増幅を組み合わせることで、この手法を効果的に置き換えることができることを示す。
我々は、擬似単光子状態の非ガウス性を証明することに成功した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:55:57 GMT)
A unified Bayesian framework for adversarial robustness [0.4] チャネルを通して敵の不確実性をモデル化する形式的ベイズ的枠組みを導入する。
これは2つの強固化戦略、すなわち、訓練中に制定された積極的防御と、作戦中に制定された反応性防衛と、敵の浄化に適合する。
我々は,我々の方法論を実証的に検証し,敵の不確実性を明示的にモデル化する利点を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:28:30 GMT)
Automated Evolutionary Optimization for Resource-Efficient Neural Network Training [0.4] 我々は、新しい自動機械学習(AutoML)フレームワーク、効率的な学習とロバスト自動化(PETRA)を開発した。
モデルアーキテクチャとトレーニング戦略に進化的最適化を適用する。
PETRAはプルーニング、量子化、損失正規化を含む。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:17:49 GMT)
SWE-Arena: An Interactive Platform for Evaluating Foundation Models in Software Engineering [0.4] SWE-Arenaは、ソフトウェアエンジニアリングタスクの基礎モデル(FM)を評価するために設計されたインタラクティブなプラットフォームである。
SWE-Arenaは、透明でオープンソースのリーダーボードを提供し、複数ラウンドの会話をサポートし、エンドツーエンドのモデル比較を可能にする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:14:30 GMT)
Zk-SNARK Marketplace with Proof of Useful Work [0.4] 本稿では,クライアントアウトソースのzk-SNARKを副産物として計算するProof of Useful Workコンセンサスプロトコルを提案する。
我々はさらにこのメカニズムを活用し、zk-SNARK証明生成をアウトソーシングするための分散市場を設計する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:38:42 GMT)
MSDM: Generating Task-Specific Pathology Images with a Multimodal Conditioned Diffusion Model for Cell and Nuclei Segmentation [0.4] セルと核のセグメンテーションのための画素精度画像-マスクペアを生成するためのマルチモーダルセマンティック拡散モデルを提案する。
生成過程を細胞核形態で条件付けすることで、MSDMは所望のモルフォロジー特性を持つデータセストを生成する。
細胞・核セグメンテーションモデルの堅牢性と一般化性を向上させるために,多モード拡散に基づく拡張の有効性を強調した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:23:14 GMT)
From Explainability to Action: A Generative Operational Framework for Integrating XAI in Clinical Mental Health Screening [0.3] 本稿では,このギャップは翻訳問題であり,生成操作フレームワークを提案する。
このフレームワークは、様々なXAIツールから得られた生の技術的出力を取り込み、臨床ガイドラインでそれらを合成するように設計されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:46:39 GMT)
Discrete time crystals in one-dimensional classical Floquet systems with nearest-neighbor interactions [0.3] NN相互作用を持つ1次元フロケ古典スピン系において、障害のない離散時間結晶(DTC)を示す。
PDTCは物質の急激な非平衡相である。
我々の研究は、量子現象の古典的な相違を考えるとき、量子特性の探索を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:57:46 GMT)
Augmented data and neural networks for robust epidemic forecasting: application to COVID-19 in Italy [0.3] 本稿では,ニューラルネットワークのトレーニングフェーズの改善を目的としたデータ拡張戦略を提案する。
提案手法は,不確実性の組み合わさった適切な構成モデルによる合成データの生成に依存している。
その結果、これらの拡張データセットに基づいてトレーニングされたニューラルネットワークは、予測性能を著しく改善していることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:35:38 GMT)
Toward a Scalable Linear-Cavity Enhanced Warm-Vapor Photonic Quantum Memory [0.2] 量子メモリにおける光子のコヒーレントストレージ、バッファリング、および検索により、線形光学によるフォトニック絡み状態のスケーラブルな生成が可能となる。
原子蒸気中のオフ共鳴カスケード吸収(ORCA)に基づく量子メモリは、このストレージをブロードバンド、ノイズフリー、高効率にすることができる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:06:55 GMT)
AI and Human Oversight: A Risk-Based Framework for Alignment [0.2] 本稿では、基本的権利を守り、人事を強化し、効果的な人的監視機構を組み込むAIシステムを設計するための戦略を検討する。
この論文は、AIモデルのリスクのレベルと人間の監視の適切な形態を結びつけることによって、AIのデプロイに人間が関与する重要な役割を浮き彫りにする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:36:44 GMT)
Vision Language Models: A Survey of 26K Papers [0.2] CVPR, ICLR, NeurIPSが2023~2025年に発行した論文26,104件を対象に, 透明かつ再現可能な研究動向の測定を行った。
タイトルと要約は正規化され、フレーズで保護され、手作りのレキシコンと一致し、最大35のトピックラベルが割り当てられる。
分析では,(1)指示と多段階推論として古典的認識を再構築する多モーダル視覚言語・LLM作品の急激な増加,(2)制御性,蒸留性,速度を中心とした拡散研究による生成手法の着実に拡張,(3)レジリエント3Dの3つのマクロシフトを定量化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:43:17 GMT)
Fiber-optic power limiter device based on carbon nanotubes [0.2] 高分子マトリックスに分散した単層カーボンナノチューブを用いたパワーリミッタを実験的に実証した。
量子鍵分布装置を光射出攻撃から保護するために用いられる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:47:11 GMT)
Brain2Text Decoding Model Reveals the Neural Mechanisms of Visual Semantic Processing [0.2] 本稿では,fMRI信号を直接自然な画像のテキスト記述にデコードする新しいフレームワークを提案する。
視覚情報なしで訓練された新しいディープラーニングモデルは、最先端のセマンティックデコーディング性能を実現する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:46:21 GMT)
Rewiring Development in Brain Segmentation: Leveraging Adult Brain Priors for Enhancing Infant MRI Segmentation [0.1] 乳児検診のセグメンテーション性能を向上させるために、成人脳MRIのセグメンテーションモデルから事前知識を利用する新しいフレームワークであるLODiを提案する。
以上の結果から,成人脳の前頭葉を年齢順応性神経画像解析の基礎として活用することの利点が明らかとなった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:55:43 GMT)
Decomposer Networks: Deep Component Analysis and Synthesis [0.1] 入力を複数の解釈可能なコンポーネントに分解する意味的オートエンコーダを提案する。
Gauss-Seidelスタイルのブロックコーディネートを異なるネットワークにアンロールすることで、DecompNetはコンポーネント間の明示的な競合を強制する。
我々は、その新奇性を、オール・ビュー・ワン残差更新ルールを実装した最初のセマンティック・オートエンコーダとして強調する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:55:13 GMT)
Best of mini-N in-loop Sampling: A Contextual Quality Reward Model for Reliable and Efficient Best-of-N Sampling [0.1] ベスト・オブ・Nサンプリングのような現代の選好アライメント技術は、ペア比較データで訓練された報酬モデルに依存している。
この重要な信頼性ギャップに対処するために、新しいデータ収集およびモデリングフレームワークを導入します。
また,アライメントガードレールとして調整した場合,信頼性障害を70%低減し,推論アクセラレータとして調整した場合,平均推定速度を22%以上向上することを示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 21:47:22 GMT)
Training Feature Attribution for Vision Models [0.1] トレーニング機能属性は、特定のトレーニングイメージの特定の領域にテスト予測をリンクする。
ビジョンデータセットの実験では、トレーニングの特徴の帰属が、きめ細かいテスト固有の説明をもたらすことが示されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:37:13 GMT)
LegalWiz: A Multi-Agent Generation Framework for Contradiction Detection in Legal Documents [0.1] 本稿では,法的領域に対するマルチエージェントの矛盾対応ベンチマークフレームワークを提案する。
合成法スタイルの文書を生成し、6種類の構造的矛盾を注入し、自己と対の矛盾をモデル化する。
このベンチマークは、法的RAGパイプラインにおける矛盾認識評価のための最初の構造化されたリソースの1つを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:46:31 GMT)
Harnessing Self-Supervised Deep Learning and Geostationary Remote Sensing for Advancing Wildfire and Associated Air Quality Monitoring: Improved Smoke and Fire Front Masking using GOES and TEMPO Radiance Data [0.1] この研究は、NASAのTEMPO衛星ミッションによる前例のない時間的データを活用することで、米国西部の山火事の改善と大気汚染管理の可能性を実証している。
本研究では,革新的自己教師型深層学習システムを用いて,山火事前線と煙突の時空間拡散をリアルタイムにマッピングする深層学習の有効性を実証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:19:04 GMT)
H-DES: a Quantum-Classical Hybrid Differential Equation Solver [0.1] 本稿では、微分方程式の系を解くための独自のハイブリッド量子古典アルゴリズムを提案する。
このアルゴリズムは、異なるパラメタライズド回路によって生成された量子状態に直接符号化される試行関数のスペクトル分解に依存する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:16:49 GMT)
Anomalous Diffusion in a Percolating Disordered Dipolar Spin Ensemble [0.1] 本研究では, 核スピンアンサンブルを局所測定により解析し, 核スピンアンサンブルについて検討した。
双極子スピンアンサンブルにおけるパーコレーションネットワークの創発的フラクタル構造上のランダムウォークとしてモデル化したサブ拡散状態への明らかな位相遷移を観察する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:02:31 GMT)
Sim-to-real supervised domain adaptation for radioisotope identification [0.1] 機械学習は、ガンマ分光法を用いて放射性同位体識別の速度と信頼性を向上させる可能性がある。
しかし、訓練のための実験データセットを慎重にラベル付けすることは、しばしば違法に高価である。
教師付き領域適応は,ラジオアイソトープ識別モデルの性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:14:36 GMT)
What's Inside Your Diffusion Model? A Score-Based Riemannian Metric to Explore the Data Manifold [0.1] スコアに基づくリーマン計量を導入し、データ多様体の内在幾何学を特徴づける。
我々のアプローチは、測地学が自然に多様体の輪郭に従う幾何学を生成する。
我々のスコアに基づく測地学は、基礎となるデータ分布を尊重する有意義な垂直変換を捉えていることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:56:24 GMT)
Phase-Aware Deep Learning with Complex-Valued CNNs for Audio Signal Applications [0.0] 本研究では,複合価値畳み込みニューラルネットワーク(CVCNN)の音声信号処理への応用について検討する。
実数値ネットワークでは無視される相情報の保存と活用に重点を置いている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 23:55:35 GMT)
Dr. Bias: Social Disparities in AI-Powered Medical Guidance [0.0] 大規模言語モデル(LLM)は競争力を持つことがますます証明されている。
LLMを医療アドバイス生成に使用すると、社会集団間で体系的に異なる応答が生成されることを示す。
特に、内因性および間質性患者は、読みやすく、より複雑でないアドバイスを受ける。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:06:35 GMT)
AI and Consciousness [0.0] これは、AI意識に関する文献の懐疑的な概要である。
我々はすぐに、いくつかの影響力のある、主流の意識理論に従って意識を持つAIシステムを作成するが、他の影響力のある、主流の意識理論では意識を持たない。
AIの意識に関する、あるいはそれに反対する標準的な議論は、どれも私たちを遠ざけません。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:49:15 GMT)
Federated Data Analytics for Cancer Immunotherapy: A Privacy-Preserving Collaborative Platform for Patient Management [0.0] コネクテッドヘルスは、健康管理に焦点を当てた多分野のアプローチである。
データ分析は、インフォームドな意思決定とヘルス共同創造に重要な洞察を与えることができる。
本論文は,介護連続体全体にわたる利害関係者の統合を目的とした協調的デジタルフレームワークに寄与する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:57:41 GMT)
A Model-Driven Engineering Approach to AI-Powered Healthcare Platforms [0.0] 医療AIに特化したモデル駆動工学(MDE)フレームワークを導入する。
フレームワークは、フォーマルなメタモデル、ドメイン固有言語、そして、ハイレベルな仕様から実行中のソフトウェアに移行するための自動変換に依存しています。
マルチセンター癌免疫療法研究において,本手法について検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:00:12 GMT)
A Decoy-like Protocol for Quantum Key Distribution: Enhancing the Performance with Imperfect Single Photon Sources [0.0] 量子鍵分布(QKD)は単一光子源(SPS)に依存する
我々は,セキュリティを維持しつつ,この制約を緩和するデコイのようなQKDプロトコルを提案する。
我々のプロトコルは、高いチャネル損失下でのGottesman--Lo-Lutkenhaus--Preskillフレームワークより優れている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:02:14 GMT)
deep-REMAP: Probabilistic Parameterization of Stellar Spectra Using Regularized Multi-Task Learning [0.0] Deep-REMAPは、観測されたスペクトルから恒星の大気パラメータを予測するために、正規化されたマルチタスクアプローチを利用する新しいディープラーニングフレームワークである。
我々は、PHOENIX合成スペクトルライブラリ上で深層畳み込みニューラルネットワークを訓練し、転送学習を用いて、観測されたFGK準スペクトルの小さなサブセットでモデルを微調整する。
Deep-REMAPは有効温度(T_rmeff$)、表面重力(log rmg$)、金属性([Fe/H])を正確に回復し、例えば約75KのTの精度を達成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:20:06 GMT)
Weight Initialization and Variance Dynamics in Deep Neural Networks and Large Language Models [0.0] 本稿では,コンパクトなReLU多層パーセプトロンとGPT-2型トランスフォーマの2つの状態に関する理論的・実証的な研究を提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:26:09 GMT)
Violation of Bell inequalities in an analogue black hole [0.0] 準1次元ボース・アインシュタイン凝縮体の流れにおいて実現された類似ブラックホールにおいて、絡み合いと非局所性の信号を評価する。
系の長波長モードは、グリーンベルガー・ホルン・ザイリンガー状態の連続的変動バージョンが部分的トレーシングに抵抗する重畳を実現するという意味で、最大絡み合っていることが示されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:33:50 GMT)
Vector Graph-Based Repository Understanding for Issue-Driven File Retrieval [0.0] 本稿では,大規模ソフトウェアリポジトリをベクトル化された知識グラフに変換するリポジトリ分解システムを提案する。
このグラフは、包摂、実装、参照、呼び出し、継承などの構文関係をエンコードする。
LLMベースのアシスタントは、制約付き、読み取り専用グラフ要求を定式化し、人間指向の説明を生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:13:50 GMT)
Vari-Cool: a non-unitary quantum variational protocol for simulated cooling [0.0] 任意のターゲットハミルトニアンの低エネルギー状態を作成するための変分アプローチを導入する。
我々は,IBMのibm_kingston量子プロセッサ上で,最大28個のシステム量子ビットを14個の浴場に結合した動作を実験的に実証した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:00:00 GMT)
Vacuum tunneling of vortices in two-dimensional $^4$He superfluid films [0.0] 低温Tでは、超流動4ドルHe膜に真空トンネル過程が生じることを期待する。
我々は, 渦と渦の対が境界から遠く離れている内在的過程と, 単一渦がシステムの境界をトンネルして核化する外在的過程とを区別する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:35:30 GMT)
Unsupervised full-field Bayesian inference of orthotropic hyperelasticity from a single biaxial test: a myocardial case study [0.0] 内在的なサンプル間の変動と操作によって引き起こされる組織損傷は、逆同定された組織の挙動に悪影響を及ぼす可能性がある。
パラメータ推定問題における異種変形プロファイルの利用に着目した。
本研究は, 単軸ストレッチ試験による高非線形, オルソトロピック材料モデルのキャラクタリゼーションの可能性を強調した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:59:49 GMT)
Universality in the Anticoncentration of Noisy Quantum Circuits at Finite Depths [0.0] 有限深さでの雑音量子回路の反集束の普遍的性質を示す。
弱雑音系では、異なる種類のノイズが同様の方法で作用し、ビットストリング確率の普遍的な分布につながる。
従来の考え方とは対照的に、遅延時間XEBは、大きな雑音強度であっても、グローバル回路の忠実度にアクセスできることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:41:47 GMT)
Turning Down the Noise: Power-Law Decay and Temporal Phase Transitions [0.0] 我々は、不均一な拡張を伴う一般的なスピンアンサンブルの深夜ダイナミクスを決定する。
定常状態へのアプローチは、ハミルトン力学と消滅する散逸の間の相互作用を反映した権力法則に従う。
我々の正確な解は、明示的に時間依存の散逸を伴うオープン量子系のカスプクラスをアンカーする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:43:01 GMT)
Topology-Enhanced Superconducting Qubit Networks for In-Sensor Quantum Information Processing [0.0] 誘導結合型超伝導フラックス量子ビットネットワークの磁気応答に及ぼすトポロジーの影響について検討する。
断面配列における特異な結合行列は, 線形配列と比較して磁束応答を著しく向上させることがわかった。
これらの結果は、関数指向超伝導量子回路の定量的設計基準を確立する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:40:48 GMT)
Token is All You Price [0.0] 単一の整列(ユーザ-最適)モデルをデプロイし、トークンキャップをユーザをスクリーニングする唯一の手段とする。
この設計は、モデルのトレーニングを価格から切り離し、トークン計測で容易に実装し、ミスアライメント圧力を軽減します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:49:31 GMT)
The foundational value of quantum computing for classical fluids [0.0] 古典物理学問題に対する量子アルゴリズムは、量子情報の流れの新しいパターンを明らかにする。
また、量子力学の基礎を解明する貴重な理論と計算の枠組みも提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:22:41 GMT)
The Impact of 2D Segmentation Backbones on Point Cloud Predictions Using 4D Radar [0.0] 生成点雲の品質に及ぼす高容量セグメンテーションバックボーンの影響について検討した。
以上の結果から,高容量モデルが実際に性能を損なう可能性があるのに対して,最適セグメンテーションバックボーンは最先端(SOTA)よりも23.7%改善できることがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:15:32 GMT)
The Idola Tribus of AI: Large Language Models tend to perceive order where none exists [0.0] 我々は,不適切であるにもかかわらず,大きな言語モデル (LLM) が不適切なパターンを生成する傾向を示す。
この傾向は、Idola Tribusに相当するAIモデルと解釈できる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:51:15 GMT)
The Data Enclave Advantage: A New Paradigm for Least-Privileged Data Access in a Zero-Trust World [0.0] スタンディングパーミッションの時代遅れのモデルは、重大な脆弱性になっている。
現在のセキュリティツールは、ネットワークとAPIのセキュリティに対処している。
我々のアプローチは、ZSP(Zero Standing Privilege)とJIT(Just-in-Time)の原則をデータレベルで実現します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:54:58 GMT)
Text Prompt Injection of Vision Language Models [0.0] そこで本研究では,大規模視覚言語モデルの誤解を招くための簡易かつ効果的なテキストプロンプトインジェクションについて検討する。
我々はこの種の攻撃のアルゴリズムを開発し、実験を通してその有効性と効率を実証した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:26:20 GMT)
Temporal Lifting as Latent-Space Regularization for Continuous-Time Flow Models in AI Systems [0.0] 連続時間力学系に対する適応時間的再パラメータ化の潜時空間定式化を提案する。
機械学習のダイナミクスの観点からすると、テンポラルリフトは連続時間正規化やタイムワープ演算子として機能する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:06:32 GMT)
Subspace Leakage Error Randomized Benchmarking of Mølmer-Sørensen Gates [0.0] シングルキュービットランダム化ベンチマークを2キュービットのモルマー・ソレンセンゲートに適応させる新しい手法を実証する。
制御可能なゲート位相を用いて2状態のサブスペースに作用するクリフォードを生成する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:11:26 GMT)
Structure of quantum measurements implementable with one round of classical communication [0.0] 適応的手法と非適応的手法を区別する方法を示す。
非射影計測が有利な状態アンサンブルの明示的な例について論じる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:37:02 GMT)
Strained Donor-Bound Excitons in $^{28}$Si [0.0] 等方的に濃縮された28ドルSiにおいてドナー結合エキシトン転移(D$0$$rightarrow,$D$0$X)に対する中性ドナーについて検討する。
一軸電子変形ポテンシャル$Xi_mathrmu$は、シリコン中の他の状態や遷移の値よりもかなり大きい。
本結果は,D$0$X遷移に基づくシリコン量子デバイスの設計に重要なパラメータセットを提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:45:40 GMT)
SpectralCA: Bi-Directional Cross-Attention for Next-Generation UAV Hyperspectral Vision [0.0] この研究の関連性は、複雑な環境で確実に運用できる無人航空機の需要の増加にある。
ハイパースペクトルイメージング(HSI)は、UAVベースのコンピュータビジョンにユニークな機会を提供する。
本研究の目的は、航法、物体検出、地形分類のためのUAV知覚にHSIを組み込んだディープラーニングアーキテクチャを開発することである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:53:28 GMT)
SolNet: Open-source deep learning models for photovoltaic power forecasting across the globe [0.0] SolNetは、新しい汎用多変量太陽発電予測器である。
我々はSolNetがデータスカース設定よりも予測性能を向上させることを示す。
転校学習実践者に対するガイドラインと考察を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:06:15 GMT)
Smart navigation of a gravity-driven glider with adjustable centre-of-mass [0.0] 粘性流体に沈着する小型グライダーは, 質量の中心を動的に調整することで移動可能であることを示す。
グライダーが目標地点に正確に到達できるようにするための2つの最適ナビゲーション戦略を見出した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:41:46 GMT)
Slow dynamics from a nested hierarchy of frozen states [0.0] 量子論的に制約されたモデルにおける遅い不均一緩和のメカニズムを同定する。
結合の力によって決定される時間スケールで凍結された状態の階層構造を明らかにする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:26:13 GMT)
Slim Scheduler: A Runtime-Aware RL and Scheduler System for Efficient CNN Inference [0.0] Slim Schedulerは、PPO(Proximal Policy Optimization)強化学習ポリシーとアルゴリズム的、欲求的なスケジューラを統合し、スクリム可能なモデルに対する分散推論を調整する。
この階層的な設計は、検索空間の複雑さを減らし、特定のハードウェアへの過度な適合を緩和し、効率とスループットのバランスをとる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:44:05 GMT)
Slicing Is All You Need: Towards A Universal One-Sided Algorithm for Distributed Matrix Multiplication [0.0] 本稿では分散行列乗算のための一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺一辺
アルゴリズムはパーティショニングとレプリケーションのすべての組み合わせをサポートする。
我々は高レベルなC++ベースのPGASプログラミングフレームワークを用いてアルゴリズムを実装した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:11:39 GMT)
Robustness Analysis for Quantum Systems Controlled by Continuous-Time Pulses [0.0] もともとエネルギーランドスケープコントローラの堅牢性を研究するために開発された技術は、クローズド量子システムの重要なケースに一般化されている。
パラメータの変動に対する感度の低下は、時間不変制御の場合と同様に、完全忠実度と一致することが示されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:16:14 GMT)
Reliability Sensitivity with Response Gradient [0.0] エンジニアリングのリスクは、失敗する可能性とそれが起こるシナリオに関係しています。
システムパラメータの変化に対する失敗確率の感度は、リスクインフォームドな意思決定に関係している。
コンピューターの感度は 確率自体よりも 難しいレベルが少なくとも1つあります
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:14:17 GMT)
Rapid Development of Omics Data Analysis Applications through Vibe Coding [0.0] 私は、現代の大規模言語モデル(LLM)と自律型コーディングエージェントがこの障壁を劇的に減らすことを実証します。
Vibeのコーディングを使って、標準的なタスクを実行できる完全に機能するデータ分析Webサイトを作りました。
ユーザインターフェース、バックエンドロジック、データアップロードパイプラインを含むアプリケーション全体は、4つの自然言語プロンプトを使用して10分以内で開発されました。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:06:27 GMT)
Quantum geometric bounds in spinful systems with trivial band topology [0.0] スピン系における量子幾何学的境界は、スピンギャップによって保護される単一の$mathbbZ$インデックスによって特徴づけられる。
我々の境界はスピントポロジー上の幾何学的条件を提供し、ウィルソンループや非自明なバンドトポロジーに付随する既知の量子幾何学的境界とは異なる。
本研究は,非自明なスピンチャーン数を実現する要素ビスマスの第一原理計算を用いて,これらの知見をベンチマークする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:32:28 GMT)
Quantum Strategies to Overcome Classical Multiplexing Limits [0.0] 短期量子ネットワークは、低い量子通信速度のためにボトルネックに直面している。
これにより、動作速度の低下とノイズ記憶におけるキュービット記憶時間の増加により性能が低下する。
このボトルネックを回避する1つの方法は多重化であり、複数の信号を1つの信号に組み合わせて全体のレートを改善することである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:08:16 GMT)
Quantum Reference Frames in Arbitrary Charge Sectors: Accessibility of Global Properties from Internal Perspectives [0.0] 量子参照フレームの分野における根本的な問題は、システムのグローバルな性質を、そのシステム内で完全に動作するオブザーバによって決定できるかどうかに関するものである。
パースペクショナルアプローチとパースペクティブニュートラルアプローチの両方を任意の固定電荷セクターに拡張する。
以上の結果から,主要なQRFアプローチの関連性を明らかにした。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:56:33 GMT)
Quantum Circuit for Quantum Fourier Transform for Arbitrary Qubit Connectivity Graphs [0.0] 多くの量子デバイス(例えば超伝導体に基づく)は、2量子ゲートの適用に制限がある。
このようなアーキテクチャを実装するために,回路内のCNOTゲートの数を最小限に抑える任意の連結グラフを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:54:00 GMT)
Quality Estimation Reranking for Document-Level Translation [0.0] 品質評価(QE)は、生成した翻訳のプールから最適な候補を採点し、選択することで機械翻訳(MT)を改善することを目的としている。
様々な学習および大規模言語モデル(LLM)に基づくQE指標を用いて,文書レベルの(典型的な文レベルの)翻訳よりも,文書レベルでのQE再ランク付け性能を評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:00:11 GMT)
QBism and relational interpretation of quantum mechanics from the point of view of a contextual quantum realism (CQR) [0.0] 量子力学のリアリスト解釈が提案されている - 文脈量子リアリズム(CQR)
CQRはQBism and Quantum Mechanics (RQM)と比較される
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:22:47 GMT)
PromptGuard at BLP-2025 Task 1: A Few-Shot Classification Framework Using Majority Voting and Keyword Similarity for Bengali Hate Speech Detection [0.0] BLP-2025タスク1Aはベンガルのヘイトスピーチを6つのカテゴリーに分類する必要がある。
従来の教師付きアプローチでは、低リソース言語には高価なラベル付きデータセットが必要である。
PromptGuardを開発した。これは,キーワード抽出のためのカイ二乗統計解析と,意思決定のための適応的過半数投票を組み合わせたフレームワークである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:30:27 GMT)
Progress in the study of the (non)existence of genuinely unextendible product bases [0.0] 真に拡張不可能な製品基盤(GUPB)の存在に関するオープン問題について検討する。
このアプローチを用いて、3量子系において13の大きさの GUPB が存在しないことを確かめる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:52:38 GMT)
Probabilistic bias adjustment of seasonal predictions of Arctic Sea Ice Concentration [0.0] 季節予測システムは、しばしばバイアスを示し、複雑な時間誤差を予測する。
本稿では,条件付き変分オートエンコーダモデルに基づく確率的誤り訂正フレームワークを提案する。
調整された予測は観測分布に適しており、気候学的平均調整された予測よりも誤差が小さいことを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:17:29 GMT)
Post Processing of image segmentation using Conditional Random Fields [0.0] 本研究では,分割画像の明瞭度を向上させるために,条件付ランダム場(CRF)を求める。
提案手法は,低画質・高画質の衛星画像と高画質の航空写真という2つの異なるデータセットに対して評価した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:07:54 GMT)
Partial Self-Correction in Layer Codes [0.0] 良い量子タナー符号に基づく層符号の族が部分的な自己補正を示すことを示す。
結果から,レイヤ符号を部分的自己修正メモリの主候補として3次元に位置づけた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:59:49 GMT)
Optimal Convergence Rate of Lie-Trotter Approximation for Quantum Thermal Averages [0.0] Lie--Trotter 積公式は量子分割関数の基本的な近似である。
本稿では,この近似を2つの鍵系にまたがる定量的な誤差解析を行う。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 22:31:27 GMT)
Nonlocal Games Through Communication Complexity and Quantum Cryptography [0.0] この論文は量子情報理論と量子暗号の基礎的な側面を探求している。
我々は,通信複雑性の原理を活用することにより,非信号相関と量子相関を区別することを目的とする。
本研究では,遠隔者同士が共有メッセージに関する情報を同時に取得することを防止する暗号化方式を構築することを目的とする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:07:24 GMT)
Noisy Quantum Simulation: Performance and Resource Considerations for the Tavis-Cummings and Heisenberg Models [0.0] フォールトトレラント量子コンピュータは、古典的な計算の範囲を超えた複雑な量子システムのシミュレーションを約束する。
これらの課題に対処する2つのテクニックは、ゼロノイズ外挿(ZNE)とインクリメンタル構造学習(ISL)である。
ZNEとISLは、Tavis-Cummings Model(TCM)とHeisenberg spin chain(HSC)の2つのモデルのトロッター時間進化をシミュレーションするためにベンチマークされる。
その結果、ISLは、予測値の精度でZNEを一貫して上回り、HSCシステムでより良好に機能することが示唆された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:46:51 GMT)
No-local-broadcasting theorem for non-signalling behaviours and assemblages [0.0] ノンブロードキャスティング定理は量子情報理論の基本的な結果である。
我々は、Joshi, Grudka, and Horodecki$otimes 4$を、局所的に非局所的な振る舞いを放送できないと推測する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:45:54 GMT)
Multipartite correlation measures and framework for multipartite quantum resources theory [0.0] 我々は、多部量子資源理論のためのより合理的な枠組みを提案する。
マルチパーティ・ステアリングは非対称なマルチパーティ・量子資源であることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:37:23 GMT)
Modern Deep Learning Approaches for Cricket Shot Classification: A Comprehensive Baseline Study [0.0] 本稿では,クリケットショット分類における7つの異なる深層学習手法を比較した,最初の総合的ベースライン研究を提案する。
我々は,従来のCNN-LSTMアーキテクチャ,アテンションベースモデル,ビジョントランスフォーマー,トランスファーラーニングアプローチ,モダンなEfficientNet-GRUの組み合わせを実装し,評価する。
我々の最新のSOTAアプローチは、効率の良いNet-B0とGRUベースの時間モデルを組み合わせることで、92.25%の精度を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:32:29 GMT)
Mitigating Model Drift in Developing Economies Using Synthetic Data and Outliers [0.0] 本研究では, 予期せぬ衝撃に対するモデル安定性を向上させるために, ほとんど探索されていないアプローチである合成外圧器の使用について検討する。
実験の結果, 基本モデルと比較して, ごく少量の合成異常値を加えると安定性が向上することがわかった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:36:49 GMT)
Metaplectic time-frequency representations [0.0] 1932年、ウィグナー分布の導入により時間周波数表現が誕生した。
2012年、Bai, Li and Cheng は、20世紀半ばにファン・ホーヴによって定義され、ウィグナー分布を一般化するために初めてメタプレクティック作用素を使用した。
この研究は、メタプレクティック演算子によって定義される時間周波数表現に関する包括的最新の調査である。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:26:12 GMT)
Mathematical aspects of the decomposition of diagonal U(N) operators [0.0] 任意の対角作用素の分解をより小さい行列のテンソルおよび行列積に証明する。
結果の式とその固有対称性の解析構造を示す。
また、提案された分解の対称性についても論じる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:17:54 GMT)
Magnetotactic bacterial populations studied with a Pound-Drever-Hall atomic magnetometer [0.0] パウンドド・ドレーバー・ホール(PDH)技術を用いてスピン偏光をモニタする光ポンピング磁気センサを実演する。
光フォトンショットノイズによって制限された22.2pT/sqrt(Hz)のノイズフロア、平均時間tu 0.2sの30.8pT/sqrt(Hz)/sqrt(tau)の短期不安定性を示す。
OPMを応用して, 磁場中における磁気細菌(Magnetospirillum gryphiswaldense, MSR-1)の配向性について検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:21:29 GMT)
Machine learning methods fail to provide cohesive atheoretical construction of personality traits from semantic embeddings [0.0] この語彙仮説は、人格の特徴が言語でコード化され、ビッグファイブのようなモデルの基礎となっていることを示唆している。
我々は、機械学習を用いて古典形容詞リストからボトムアップパーソナリティモデルを作成し、その記述ユーティリティをBig Fiveと比較した。
本研究は,ビッグファイブの頑健さを実証し,人格の意味構造が文脈に依存していることを示唆する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:29:33 GMT)
Machine Learning Detection of Lithium Plating in Lithium-ion Cells: A Gaussian Process Approach [0.0] 高速充電中のリチウムめっきは、キャパシティフェードを加速し、破滅的な安全障害を引き起こす重要な劣化機構である。
最近の研究で、DQ/dVのピークが4.0Vを超えることが、めっき開始の確実なサインであると確認されている。
電荷-電圧関係Q(V)を直接キャリブレーションした不確実性を有するプロセスとしてモデル化し,リチウムめっき検出のためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:23:24 GMT)
Localist LLMs -- A Mathematical Framework for Dynamic Locality Control [0.0] 鍵となる革新はローカリティダイヤル(Locality dial)であり、モデル再トレーニングを必要とせず、トレーニングと推論の両方で局所化の度合いを動的に制御する調整可能なパラメータである。
群間隔のペナルティが一定のしきい値を超えると、モデルの注意機構は意味論的に関連するブロックに集中し、無視可能な誤りでエントロピーが低く、忠実度が高いことを証明する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:44:59 GMT)
Leveraging Cellular Automata for Real-Time Wildfire Spread Modeling in California [0.0] 本研究では,重要な環境変数を組み込んだ細胞性オートマトン(CA)に基づく予測モデルを開発した。
2025年太平洋パラセード火災の火傷跡に対する混乱行列を用いたモデルの評価では, 0.860, 精度0.605, 総合F1スコア0.711を得た。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 02:31:57 GMT)
Latent Variable Modeling in Multi-Agent Reinforcement Learning via Expectation-Maximization for UAV-Based Wildlife Protection [0.0] 本稿では,野生生物保護の文脈における予測最大化に基づく潜在変数モデリング手法を提案する。
隠れた環境因子と潜伏変数によるエージェント間ダイナミクスをモデル化することにより,不確実性の下での探索と調整が促進される。
絶滅危惧種のイランヒョウの保護生息地をパトロールする10機のUAVを含むカスタムシミュレーションを用いてEM-MARLフレームワークの実装と評価を行った。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 05:26:40 GMT)
Language Model Guided Reinforcement Learning in Quantitative Trading [0.0] 強化学習(Reinforcement Learning, RL)はそのような問題に適用されているが, 筋電図的行動や不透明な政策によって採用が制限されている。
本稿では,大規模言語モデル(LLM)がRLエージェントを誘導する高レベルのトレーディング戦略を生成するハイブリッドフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:06:15 GMT)
Kibble-Zurek dynamical scaling hypothesis in the Google analog-digital quantum simulator of the $XX$ model [0.0] アナログデジタル量子シミュレーションにおいて、ハミルトンランプをシミュレートするために最先端テンソルネットワークが使用される。
量子臨界点近傍の量子キブル・ズレーク機構に着目する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:32:55 GMT)
It's 2025 -- Narrative Learning is the new baseline to beat for explainable machine learning [0.0] ナラティブラーニング(Narrative Learning)は、モデルを完全に自然言語で定義し、説明的プロンプトを用いて分類基準を反復的に洗練する手法である。
3つの自然データセットと3つのデータセットを用いて、このアプローチの精度と可能性を評価し、それらを7つのベースラインで説明可能な機械学習モデルと比較する実験について報告する。
6つのデータセットのうち5つで、Narrative Learningは、2025年以降の言語モデルの改善により、ベースラインで説明可能なモデルよりも正確になった。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:34:40 GMT)
Is Research Software Science a Metascience? [0.0] 我々はメタサイエンスとRSSを定義し、それらの原則と目的を比較し、それらの重複について検討する。
RSSは、メタサイエンスと整合した学際的なドメインとして最もよく理解されていると我々は主張する。
分類に拘わらず、科学的な厳格さを研究ソフトウェアに適用することで、発見のツールが発見そのものの標準を満たすことを保証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:23:24 GMT)
Interpretable Machine Learning for Predicting Startup Funding, Patenting, and Exits [0.0] 本研究は、資金調達、特許取得、退社を含むスタートアップの成果を予測するための解釈可能な機械学習フレームワークを開発する。
次の資金調達は12ヶ月以内に行われ、24ヶ月以内に特許ストックが成長し、IPO(IPO)や36ヶ月以内に買収される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:20:29 GMT)
Individual utilities of life satisfaction reveal inequality aversion unrelated to political alignment [0.0] 我々は、国の代表的な英国サンプルを用いて、宣言された嗜好実験を使用する。
参加者は、不確実性の条件下で、自分自身と他人の生活満足度を評価。
大多数の参加者は、社会的生活満足度における不平等に対する個人のリスクよりも強い嫌悪感を示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:59:41 GMT)
Imaging of Gate-Controlled Suppression of Superconductivity via the Meissner Effect [0.0] GCS効果として知られる超電流のゲート制御は超伝導トランジスタ論理を可能にする。
我々は、GCSがマイスナースクリーニングの抑制にも現れ、この現象が超伝導の真の特徴として確立されていることを報告した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:26:32 GMT)
Hypothesis testing on invariant subspaces of non-diagonalizable matrices with applications to network statistics [0.0] 不変ベクトルに対するウォルドテストと個々の係数に対する$t$-testはシミュレーションでよく機能する。
統計学者は、不変部分空間推定器の高階への収束率を制御するために、一階のデービス=カハン境界の制御しか必要としない。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:39:49 GMT)
Hierarchical autoregressive neural networks in three-dimensional statistical system [0.0] ANN(Autoregressive Neural Networks)は、いくつかのスピン系に対するモンテカルロアルゴリズムの効率を改善するメカニズムとして最近提案されている。
本稿では,階層型自己回帰ネットワーク(HAN)アルゴリズムを3次元で記述し,その性能について検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:26:43 GMT)
Hierarchical Multi-Modal Threat Intelligence Fusion Without Aligned Data: A Practical Framework for Real-World Security Operations [0.0] 非整合データ用に明示的に設計されたフレームワークである階層型マルチモーダル脅威インテリジェンス・フュージョン(HM-TIF)を提案する。
私たちのアーキテクチャでは、データ可用性と脅威コンテキストに適応する動的重み付けを備えた階層的クロスアテンションを採用しています。
HM-TIF 88.7%の精度で、偽陽性率を32%削減した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:21:46 GMT)
Hartman effect, time-delays, and the non-spatial nature of quantum particles [0.0] 空間性の概念はトンネル工事中に超越されるが、これはその過程が潜在的な障壁の交差であると説明できないからである。
量子非局所性は、量子非親和性の側面として理解されるべきである。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:49:55 GMT)
Green Grid: Smart Tech Meets E-Waste [0.0] インドは2023-24年に170万トン以上を生産し、e-waste世代で世界第3位である。
我々は,AIを活用したe-waste管理プラットフォームであるGreen Gridを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 00:57:47 GMT)
Generating CodeMeta using declarative mapping rules: An open-ended approach using ShExML [0.0] 本研究は,CodeMetaファイルを生成するための宣言型マッピングルールを提案する。
生成されたCodeMetaファイルはSHACLとShExを使用して検証され、生成ワークフロー全体が自動化される。
この作業は、他の開発者がリポジトリにCodeMeta生成ワークフローを組み込むことができる例として使用できる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:15:08 GMT)
Fusing Multi- and Hyperspectral Satellite Data for Harmful Algal Bloom Monitoring with Self-Supervised and Hierarchical Deep Learning [0.0] 有害な藻類の発芽の重症度と種分化を検出・マッピングするための自己教師型機械学習フレームワークを提案する。
運用機器の反射率データをTROPOMI太陽誘起蛍光 (SIF) に融合させることで, 施設ごとのラベル付きデータセットを必要とせず, HAB重大度および種別生成物を生成する。
このフレームワークは、自己監督的な表現学習、階層的な深層クラスタリングを用いて、植物プランクトン濃度と種分化を解釈可能なクラスに分割し、メキシコ湾と南カリフォルニア湾のその場データに対して検証する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:04:32 GMT)
Foraging with the Eyes: Dynamics in Human Visual Gaze and Deep Predictive Modeling [0.0] レヴィ・ウォークを通した動物は、資源の少ない環境に最適化された重い尾の階段を持つことが多い。
人間の視覚的な視線は、画像の時と同様のダイナミクスに従うことを示す。
人間の視覚探索が自然採餌の統計的法則に従属することを示す新たな証拠を提示し, 生成的および予測的枠組みによる視線モデリングの道を開いた。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:45:51 GMT)
Federated k-Means via Generalized Total Variation Minimization [0.0] 我々は、相互接続されたデバイスがプライベートなローカルデータセットにアクセスでき、ローカルデータセットを共有することなくデータセット全体を共同でクラスタリングする必要がある、フェデレーションクラスタリングの問題を考察する。
私たちはk-meansの原則に基づいたハードクラスタリングに重点を置いています。
我々は、GTVMinの例として、連合k平均クラスタリングを定式化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 06:32:28 GMT)
Farewell to Westphalia: Crypto Sovereignty and Post-Nation-State Governaance [0.0] ブロックチェーン技術の主たる応用は、金融セクターではなく、分散型の人的ガバナンスを維持することだ、と私たちは主張する。
ブロックチェーンベースのコミュニティは国家を置き換えるのか?
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:14:57 GMT)
Exploring User Risk Factors and Target Groups for Phishing Victimization in Pakistan [0.0] フィッシング攻撃は世界中で重要なサイバーセキュリティの脅威となっている。
本研究ではパキスタンにおけるフィッシング感受性について検討した。
25人以上の男性、従業員、オンライン買い物客はフィッシングの感受性が比較的高い。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:37:18 GMT)
Exploration of Incremental Synthetic Non-Morphed Images for Single Morphing Attack Detection [0.0] 本稿では,S-MAD(Single-Morphing Detection)における合成顔データの利用について検討する。
プライバシー上の懸念から、大規模なボナファイドイメージのデータセットの可用性の制限に対処する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 20:12:33 GMT)
Exploiting higher-order correlation functions for photon-statistics-based characterization and reconstruction of arbitrary Gaussian states [0.0] ガウス状態に関する事前の仮定なしに相関関数測定のみから状態パラメータを抽出することは不可能であることを示す。
これらの測定が一般的なガウス状態の再構築にどのような状況で利用できるかを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:31:30 GMT)
Executable Epistemology: The Structured Cognitive Loop as an Architecture of Intentional Understanding [0.0] 本稿では、創発的インテリジェンスのための実行可能なフレームワークとして構造化認知ループ(SCL)を紹介する。
SCLは計算的に解釈可能な構造に対する哲学的な洞察を運用し、迅速な実験として「実行可能」な哲学を可能にする。
表現精度ではなく、意図的な理解を通じてその状態を再構築する能力を再定義する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:03:32 GMT)
Evidence Without Injustice: A New Counterfactual Test for Fair Algorithms [0.0] アルゴリズム出力自体の明らかな値が構造的不正に依存することを示す。
我々は、その証拠が現実の世界における証拠であるかどうか、そして、その証拠が関連する不正を伴わずに、近隣の世界における証拠であるかどうかを問う。
証拠が試験に失敗した場合、その証拠が試験に合格する証拠よりも、的確に使用することが道徳的に問題となる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:33:17 GMT)
Evaluating the Quality of the Quantified Uncertainty for (Re)Calibration of Data-Driven Regression Models [0.0] 安全クリティカルなアプリケーションでは、データ駆動モデルは正確で、信頼性の高い不確実性推定を提供する必要がある。
回帰において、様々なキャリブレーション指標と再校正手法が出現している。
ほとんどのリカバリ手法は、測定基準の小さな部分だけを用いて評価されている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:44:21 GMT)
Evaluating LLM-Based Process Explanations under Progressive Behavioral-Input Reduction [0.0] 大規模言語モデル(LLM)は、イベントログから発見されたプロセスモデルの説明を生成するために、ますます使われています。
本報告では, 進行的行動・入出力低下下における説明品質の評価について述べる。
合成ログ上では、説明品質は適度な削減の下で大部分が維持され、実用的なコスト品質のトレードオフが示される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:10:50 GMT)
Entanglement dynamics of light's orbital angular momentum under a Lorentz boost [0.0] 絡み合いの背景にある考え方は、いかなる古典的現実主義の観点にも直感的ではない。
ローレンツ加速下での慣性基準フレームにおける軌道角運動量(OAM)の絡み合いの進化について検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:29:06 GMT)
Entanglement and accidental symmetries in the nucleon-nucleon system [0.0] 中性子-中性子散乱ではエンタングルメント抑制は観測されない。
核相互作用における事故対称性と2核子散乱におけるスピン絡みの関連について検討した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:21:01 GMT)
Efficient Emulation of Neutral Atom Quantum Hardware [0.0] 本研究では,Pasqalのパルスパッケージの計算バックエンドとして,emu-svとemu-mpsの2つのエミュレータを導入する。
Emu-svは高精度な状態ベクトルシミュレーションのために設計されている。
emu-mpsはマトリックス積状態表現やその他の制御された近似を用いて、より大きな原子配列を効率的にシミュレートする。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 19:21:20 GMT)
EcphoryRAG: Re-Imagining Knowledge-Graph RAG via Human Associative Memory [0.0] 本稿では,エンティティ中心の知識グラフRAGフレームワークであるEcphoryRAGを紹介する。
インデックス作成中、EcphoryRAGは対応するメタデータを持つコアエンティティのみを抽出し、格納する。
検索には、まずクエリからキューエンティティを抽出し、スケーラブルなマルチホップ連想検索を実行する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 03:07:27 GMT)
Early-Warning of Thunderstorm-Driven Power Outages with a Two-Stage Machine Learning Model [0.0] 雷雨による停電は、ほとんどの嵐が損傷を起こさないため予測が困難であり、対流過程は急速にカオス的に発生し、利用可能な公開データはノイズと不完全である。
我々は,ミシガンの夏期早期警戒モデル,雷雨関連停電をオープンソース(EAGLE-I,気象用24-48R)のみを用いて開発した。
我々は、アメリカ合衆国エネルギー省のオークリッジ国立研究所(Oak Ridge National Laboratory)が管理している、公開されたMETA-I機能停止データセット(2014-2022)を使用します。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:14:48 GMT)
Distributionally robust approximation property of neural networks [0.0] ニューラルネットワークがオルリッツ空間に密接であることを証明するため、従来の$Lp$-settingを超えた古典的普遍近似定理を拡張できる。
ニューラルネットワークの被覆クラスには、非ポリノミカルアクティベーション関数を持つフィードフォワードニューラルネットワーク、ReLUアクティベーション関数を持つ深い狭いネットワーク、関数入力ニューラルネットワークなど、広く使われているアーキテクチャが含まれる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 09:21:34 GMT)
Digital quantum simulation of bosonic systems and quantum complementarity [0.0] デジタル量子シミュレーション(DQS)は、複雑な量子システムを研究するための強力なアプローチとして登場した。
本稿では,ボゾン系のDQSの一般形式化を利用する。
ウンルーとペソア・ユニオールが行ったアフシャーの実験に類似した実験について検討する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:10:16 GMT)
Convergence Rate for the Last Iterate of Stochastic Gradient Descent Schemes [0.0] Fdelta が凸であるときに SHB が$F_*$ で一定運動量に達することを証明した。
また、Fdelta が凸であるときに SHB が$F_*$ の運動量を得ることを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:02:18 GMT)
Control of photoionization by resonant phase-locked pulse pairs [0.0] ポンププローブ法による原子の2光子イオン化の非線形および共鳴過程について検討した。
プローブパルス中において着衣状態の個体群をコヒーレントに制御する方法を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 14:52:31 GMT)
Constructive Lyapunov Functions via Topology-Preserving Neural Networks [0.0] ONNは収束率、エッジ効率、計算複雑性の順序-最適性能を達成する。
3Mノードのセマンティックネットワークにおける実証的な検証は、ベースライン法よりも99.75%改善されている。
ORTSFをトランスに組み込むことで、14.7%のパープレキシティ低減と2.3の高速化を実現している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:46:52 GMT)
Conditional Flow Matching for Bayesian Posterior Inference [0.0] 本稿では,フローマッチングを用いた多変量後部サンプル作成手法を提案する。
単純なトレーニング目標を提供し、可能性評価へのアクセスを必要としない。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 16:48:28 GMT)
Computational Bell Inequalities [0.0] 本稿では,デバイス非依存の単一プロデューサ対話プロトコルを計算的仮定で解析するための体系的アプローチを提案する。
これはベルの不等式と非局所ゲームとの明示的な対応を確立することで達成される。
計算的仮定がベルの不等式にどのように変換されるかを示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 07:41:41 GMT)
Comparing Knowledge Source Integration Methods for Optimizing Healthcare Knowledge Fusion in Rescue Operation [0.0] 本稿では,知識グラフ構造に基づく医学分野における知識融合の概念モデルを提案する。
知識融合をどのように有効にするか、そして、救助活動のための知識グラフに様々な知識ソースを統合する方法について評価する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:10:14 GMT)
Combined Representation and Generation with Diffusive State Predictive Information Bottleneck [0.0] 分子の重要な表現を特徴付けるために設計された時間的な情報ボトルネックと,1つの共同学習目標における拡散モデルを組み合わせる。
D-SPIB(Diffusive State Predictive Information Bottleneck)と呼ばれるこのプロトコルは、表現学習と生成目標のバランスを、1つの柔軟なアーキテクチャで実現する。
我々は、D-SPIBを複数の分子課題でベンチマークし、トレーニングセット外の物理的条件を探索する可能性を示した。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 18:46:21 GMT)
Coherent oscillations in weakly anharmonic NbSe2 qubit [0.0] 本研究では、弱非調和なNbSe2量子ビットを示す。
我々の装置は、他のvdW量子ビットよりも約2桁大きい緩和時間 T1 = 6.5 +- 0.4 us を示す。
我々の研究は、量子技術へのvdW材料の統合の利点の実証者として機能する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:41:38 GMT)
Classical and quantum chaotic synchronization in coupled dissipative time crystals [0.0] 2つのコヒーレント結合型散逸時間結晶のダイナミクスについて検討する。
古典的な場合と類似して、この挙動を量子カオス同期と解釈する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 12:23:32 GMT)
Chern insulators and topological flat bands in cavity-embedded kagome systems [0.0] キャビティ埋め込み型かごめ系において, チャーン絶縁相が出現することを示す。
また、ほぼ平坦なバンドは、非零チャーン数で位相的に非自明であることが分かる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:49:55 GMT)
Characterizing 5G User Throughput via Uncertainty Modeling and Crowdsourced Measurements [0.0] 本稿では,ダウンリンクユーザスループット推定のための不確実性と説明可能なアプローチを提案する。
先程の4G手法を検証し、R2を8.7%改善し、5G NSAと5G SAに拡張した。
スループットの変動性に対処するために,点推定と校正された信頼区間の両方を出力するモデルであるNGBoostを適用する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:29:32 GMT)
Certifying Quantum Gates via Automata Advantage [0.0] 有限オートマトン理論で研究された公約問題は、量子ゲート品質の音質試験を設計するための自然な枠組みを提供すると論じる。
本稿では, オートマトン理論, 特に最小限のオートマトン理論を用いて, 音質保証を導出する方法を示す。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 17:29:23 GMT)
Beyond the Carnot limit: work extraction via an entropy battery [0.0] 複数の保存量にまたがるアンサンブルの完全なエントロピー能力に乗じることができることを示す。
これにより、標準的なカルノット効率限界を超える効率でエネルギー的な作業が抽出される。
この研究は、スピノルボース=アインシュタイン凝縮体やスピントロニクスのような、近接エネルギーの縮退するスピン統計を必要とする分野に適用できる。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 04:15:42 GMT)
Assessing the Impact of Post-Quantum Digital Signature Algorithms on Blockchains [0.0] 量子後暗号(PQC)は、量子耐性セキュリティへの移行における重要なステップである。
従来の暗号アルゴリズムは量子攻撃に弱い。
PQCは長期的なセキュリティには不可欠だが、ブロックチェーン環境での計算オーバーヘッドは、まだほとんど調査されていない。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:12:53 GMT)
Application of Deep Reinforcement Learning to At-the-Money S&P 500 Options Hedging [0.0] 本稿では,S&P500インデックスのヘッジ・ザ・マネーオプションへの深層Q-ラーニングの適用について検討する。
我々は、価格力学のモデル仮定を明示することなく、ヘッジ決定をシミュレートするために訓練されたツイン遅延Deep Deterministic Policy Gradient (TD3)アルゴリズムに基づくエージェントを開発する。
以上の結果から,DRLは従来のヘッジ法,特に揮発性環境や高コスト環境において優れた性能を発揮することが示唆された。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:35:50 GMT)
Angular Geometry of Atomic Multipole Transitions [0.0] ラビの周波数を計算する簡単な方法は、原子または核多極子モーメントとレーザー場との相互作用について概説する。
結果として得られる表現は、レーザー偏光とベクトル球面調和の間のドット積の形を取る。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:28:38 GMT)
Algorithmic Temperature Induced by Adopted Regular Universal Turing Machine [0.0] 有効温度は、正規普遍チューリングマシンのアルゴリズム構造から自然に現れる。
特に、機械のラッパー言語の冗長性の成長は、プログラム長に対するボルツマンのような指数重み付けを誘導する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:26:13 GMT)
Agentic Exploration of Physics Models [0.0] 我々はSciExplorerを紹介した。SciExplorerはドメイン固有のブループリントを使わずにシステムを探索できるエージェントである。
我々はSciExplorerを、力学力学系、波動進化、量子多体物理学にまたがる幅広いモデルでテストする。
この設定の実証された有効性は、他の領域における同様の科学的探索への扉を開く。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 13:24:19 GMT)
Adaptive Fusion Network with Temporal-Ranked and Motion-Intensity Dynamic Images for Micro-expression Recognition [0.0] マイクロ・エクスプレッション(ME)は微妙で過渡的な顔の変化であり、非常に低強度であり、肉眼ではほとんど知覚できない。
本稿では2つの主な貢献点を持つ新しいMER法を提案する。
まず,時間的進行を重視したテンポラルランク動的画像と,動きの強度を取り入れたフレームリオーダー機構による微妙な動きを強調するモーションインテンシティ動的画像の2つの相補的表現を提案する。
第2に,これら2つの表現を最適に統合することを自動的に学習し,雑音を抑えながら識別的ME特性を向上する適応融合ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 11:03:20 GMT)
Acoustoelectric Amplification in a Piezoelectric-2DEG Heterostructure [0.0] 圧電材料上に積層された2次元電子ガス(2DEG)からなるヘテロ構造体におけるフォノン増幅の量子力学的記述を提供する。
印加ドリフト電圧は、2DEG電子の運動量状態の集団反転を効果的に生成し、フォノンの自然放出を引き起こす。
音波が発射されると、励起された電子は励起された放出によってフォノンを放出し、励起状態に戻る前に劣化した基底状態に戻る。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:36:52 GMT)
ARS: Adaptive Reasoning Suppression for Efficient Large Reasoning Language Models [0.0] 推論抑制(Reasoning Suppression、ARS)は、冗長な推論ステップを動的に抑制する訓練のないアプローチである。
ARSは53%、46.1%、57.9%のトークン、レイテンシ、エネルギー削減を実現し、精度を維持または改善している。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 15:04:19 GMT)
AI Agents for the Dhumbal Card Game: A Comparative Study [0.0] 本研究では,文化的に重要なマルチプレイヤーカードゲームであるDhumbalに対する人工知能(AI)エージェントの評価を行った。
我々はダンバルの力学を形式化し、アプローチ(攻撃的、保守的、均衡的、機会主義的)を含む多様なエージェントを実装する。
パフォーマンスは、勝利率、経済的成果、Jhyapの成功、ラウンド毎に捨てられたカード、リスク評価、意思決定効率によって測定される。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:31:19 GMT)
A one-world interpretation of quantum mechanics [0.0] 我々は、客観的な古典的体系が存在すると仮定し、確率論の標準的な規則が量子システムと相互作用するときに適用されることを問う。
軽微な仮定の下では、量子論からユニタリ力学、崩壊、ボルン則を復元する。
量子状態は古典的な軌道上で純粋に条件づけられているため、デコヒーレンスはない。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:49:41 GMT)
A Semantic Framework for Patient Digital Twins in Chronic Care [0.0] 患者医療デジタルツイン(PMDT)は、生理的、精神社会的、行動的、ゲノム的な情報をコヒーレントなモデルに統合する。
PMDTはセマンティック・インターオペラビリティを確保し、自動推論をサポートし、さまざまな臨床コンテキストでの再利用を可能にする。
データ断片化とセマンティック標準化のギャップを埋めることによって、PMDTは、次世代デジタルヘルスエコシステムの検証された基盤を提供する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 08:34:55 GMT)
A PCA-based Data Prediction Method [0.0] 本稿では,従来の数学と機械学習の両方の要素を含む新しい手法について述べる。
この方法は、既存のデータと候補集合を表すシフト線型部分空間間の距離の概念に基づいている。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 10:33:31 GMT)
A Constructive Framework for Nondeterministic Automata via Time-Shared, Depth-Unrolled Feedforward Networks [0.0] 非決定論的有限オートマトン(NFA)の時間分割・深度制御型フィードフォワードネットワーク(TS-FFN)を用いたフォーマルで建設的なシミュレーションフレームワークを提案する。
我々の定式化は、二進ベクトルとしてのオートマトン状態、スパース行列変換としての遷移、および共有しきい値更新の合成としての$varepsilon$-closuresを含む非決定的分岐を含む非決定論的分岐を象徴的に符号化する。
論文参考訳(メタデータ) (Fri, 10 Oct 2025 01:03:04 GMT)