Fugu-MT: arxivの論文翻訳(概要)

Gemini 2.5: Pushing the Frontier with Advanced Reasoning, Multimodality, Long Context, and Next Generation Agentic Capabilities [1595.0]
Gemini 2.5 Proは私たちの最も有能なモデルであり、フロンティアコーディングと推論ベンチマークでSoTAのパフォーマンスを実現しています。 Gemini 2.5 Flashは計算とレイテンシの要求のごく一部で優れた推論機能を提供する。 Gemini 2.0 FlashとFlash-Liteは低レイテンシと低コストでハイパフォーマンスを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:21:11 GMT)
Step-Audio 2 Technical Report [108.0]
Step-Audio 2は、業界における音声理解と音声会話のために設計された、エンドツーエンドのマルチモーダルな大規模言語モデルである。遅延オーディオエンコーダと推論中心強化学習(RL)を統合することにより、Step-Audio 2は自動音声認識(ASR)および音声理解において有望な性能を達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:23:55 GMT)
Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning [105.3]
我々は182,384サンプルの多種多様な大規模データセットであるtextbfZebra-CoT$を紹介した。スケッチや視覚的推論が特に自然なタスクの4つのカテゴリに注目します。微調整されたベーゲル7Bは高品質な視覚的推論連鎖を生成するモデルを生成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:35:36 GMT)
LLM Data Selection and Utilization via Dynamic Bi-level Optimization [100.2]
本研究では,各バッチ内で選択したデータの重み付けを調整し,トレーニング中の動的データ利用を実現するための新しいデータ重み付けモデル(DWM)を提案する。実験により,DWMはランダムに選択されたデータを用いて訓練されたモデルの性能を向上させることが示された。さらに、トレーニング中にモデルのデータ嗜好がどのように進化するかを分析し、トレーニング中のモデルのデータ嗜好に関する新たな洞察を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:47:12 GMT)
OpenVLThinker: Complex Vision-Language Reasoning via Iterative SFT-RL Cycles [91.9]
我々はOpenVLThinkerを紹介した。OpenVLThinkerはオープンソースの大規模視覚言語モデル(LVLM)の1つである。 OpenVLThinker-7Bは、数学的および一般的な推論を必要とする6つのベンチマークで一貫して性能を向上することを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:04:21 GMT)
Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [88.1]
展開中のシナリオにオンザフライで適応する問題について検討する。 ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。 ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:12:32 GMT)
More is Less: The Pitfalls of Multi-Model Synthetic Preference Data in DPO Safety Alignment [80.0]
直接選好最適化(DPO)は、人間のフィードバックによる強化学習の、シンプルで効果的な代替手段として登場した。我々の研究は、DPOアライメントに関連する、目覚ましい、安全性に特有な現象を明らかにした。選択されたペアと拒否されたペアに対してのみ自己生成されたレスポンスを使用することで、より強力なモデルからのレスポンスを含む構成を大幅に上回る。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:06:23 GMT)
Rethinking Discrete Tokens: Treating Them as Conditions for Continuous Autoregressive Image Synthesis [80.0]
DisConは、離散トークンを生成ターゲットではなく条件信号として再解釈する新しいフレームワークである。 DisConは、ImageNet 256$times $256 世代で gFID スコアが 1.38 に達し、最先端の自己回帰アプローチよりも明確なマージンで優れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:25:49 GMT)
Towards provable probabilistic safety for scalable embodied AI systems [79.3]
エンボディードAIシステムは、様々なアプリケーションでますます普及している。複雑な運用環境での安全性確保は依然として大きな課題である。このパースペクティブは、安全で大規模に実施されたAIシステムを安全クリティカルなアプリケーションに採用するための道筋を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:41:49 GMT)
C2-Evo: Co-Evolving Multimodal Data and Model for Self-Improving Reasoning [78.4]
C2-Evoは、トレーニングデータとモデル機能の両方を共同で進化させる、自動クローズドループ自己改善フレームワークである。 C2-Evoは、複数の数学的推論ベンチマークにおいて、一定の性能向上が得られることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:27:08 GMT)
Assessing Adaptive World Models in Machines with Novel Games [77.9]
我々は、迅速な適応は、環境の内部表現の効率的な構築と洗練と結びついていると論じる。人工知能における世界モデルの現在の理解と評価は依然として狭いままである。そこで本研究では,真で深みがあり,常にリフレッシュするノベルティを持つ,慎重に設計されたゲームスイートをベースとした,新たなベンチマークパラダイムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:07:08 GMT)
LMM4Edit: Benchmarking and Evaluating Multimodal Image Editing with LMMs [76.6]
EBench-18Kは、18K編集画像を含む最初の大規模画像編集ベンチマークである。 EBench-18Kは、21タスクにわたる対応する編集プロンプトを備えた1,080のソースイメージと、17の最先端TIEモデルによって生成された18K+編集イメージと、3つの評価次元から評価された55K+平均評価スコア(MOS)と18K+質問回答(QA)ペアを含む。そして,LMMに基づく画像編集モデル評価のためのLMM4Editを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:11:07 GMT)
Risk and cross validation in ridge regression with correlated samples [72.6]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:18:26 GMT)
Promptomatix: An Automatic Prompt Optimization Framework for Large Language Models [72.5]
LLM(Large Language Models)は、巧妙なプロンプトで最高の性能を発揮するが、プロンプトは手動で、一貫性がなく、非専門家にはアクセスできない。 Promptomatixは、手作業のチューニングやドメインの専門知識を必要とせずに、自然言語のタスク記述を高品質なプロンプトに変換する。システムは、ユーザ意図を分析し、合成トレーニングデータを生成し、プロンプト戦略を選択し、コストを意識した目標を使用してプロンプトを洗練する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:19:51 GMT)
Controllable Video Generation: A Survey [72.4]
本稿では、制御可能なビデオ生成の体系的レビューを行い、理論的基礎と最近の現場の進歩の両方について述べる。まず、主要な概念を導入し、一般的に使われているオープンソースビデオ生成モデルを紹介します。次に、映像拡散モデルにおける制御機構に着目し、生成を誘導する認知過程に異なる種類の条件を組み込む方法について分析する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:05:34 GMT)
A Survey of Deep Learning for Geometry Problem Solving [72.2]
本稿では,幾何学的問題解決におけるディープラーニングの応用について調査する。 i)幾何学的問題解決における関連する課題の包括的概要、(ii)関連するディープラーニング手法の徹底的なレビュー、(iii)評価指標と手法の詳細な分析を含む。我々の目標は、この分野のさらなる発展を促進するために、幾何学的問題解決のためのディープラーニングの包括的で実践的な参照を提供することである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:18:01 GMT)
PyG 2.0: Scalable Learning on Real World Graphs [70.8]
Pyg 2.0は、拡張性と現実世界のアプリケーション機能を大幅に改善した包括的アップデートです。ヘテロジニアスグラフやテンポラルグラフのサポート,スケーラブルな機能/グラフストア,さまざまな最適化など,フレームワークの強化されたアーキテクチャについて詳述する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:55:09 GMT)
Universal Model Routing for Efficient LLM Inference [69.9]
モデルルーティングは,大規模言語モデル(LLM)の推論コストを削減する手法である動的ルーティング問題に対する新しいアプローチであるUniRouteを提案する。これらは理論的に最適なルーティングルールの推定であり、過大なリスクバウンドによってそれらのエラーを定量化する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:27:33 GMT)
Can Indirect Prompt Injection Attacks Be Detected and Removed? [68.7]
間接的インジェクション攻撃の検出・除去の可能性について検討した。検出のために,既存のLCMとオープンソースの検出モデルの性能を評価する。そこで本研究では,(1) インジェクション命令を含む部分をセグメント化して除去するセグメンテーション除去法,(2) 抽出モデルを訓練してインジェクション命令を識別・除去する抽出除去法,の2つの直感的手法を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:59:29 GMT)
Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny [68.0]
強化学習(RL)で訓練された大規模言語モデル(LLM)は、信頼性も拡張性もない、という大きな課題に直面している。有望だが、ほとんど報われていない代替手段は、フォーマルな言語ベースの推論である。生成モデルが形式言語空間(例えばダフニー)で機能する厳密な形式体系におけるLLMの接地は、それらの推論プロセスと結果の自動的かつ数学的に証明可能な検証を可能にする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:13:01 GMT)
NavMorph: A Self-Evolving World Model for Vision-and-Language Navigation in Continuous Environments [67.2]
VLN-CE(Vision-and-Language Navigation in Continuous Environments)は、自然言語命令によって誘導される複雑な環境において、エージェントがシーケンシャルなナビゲーションアクションを実行する必要がある。人間の認知にインスパイアされたNavMorphは、VLN-CEタスクにおける環境理解と意思決定を強化する自己進化型世界モデルフレームワークである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:03:26 GMT)
Defense Against Prompt Injection Attack by Leveraging Attack Techniques [66.7]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクで顕著なパフォーマンスを実現している。 LLMが進化を続けるにつれて、新しい脆弱性、特にインジェクション攻撃が発生する。近年の攻撃手法は, LLMの命令追従能力とデータ内容に注入された命令を識別する能力を活用している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:54:36 GMT)
Global Convergence and Rich Feature Learning in $L$-Layer Infinite-Width Neural Networks under $μ$P Parametrization [66.0]
本稿では, テンソル勾配プログラム(SGD)フレームワークを用いた$L$層ニューラルネットワークのトレーニング力学について検討する。 SGDにより、これらのネットワークが初期値から大きく逸脱する線形独立な特徴を学習できることを示す。このリッチな特徴空間は、関連するデータ情報をキャプチャし、トレーニングプロセスの収束点が世界最小であることを保証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:47:39 GMT)
SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction [65.2]
ビデオオブジェクト(VOS)はコンピュータビジョンにおける中核的なタスクであり、ターゲットオブジェクトの追跡とセグメント化をモデルに要求する。本稿では,従来の特徴マッチングから,高レベルなオブジェクト中心表現のプログレッシブな構築と利用へ移行する概念駆動セグメンテーションフレームワークであるセグメンテーション概念(SeC)を提案する。 SeCはSAM SeCVOSよりも11.8ポイント改善され、最先端のコンセプトを意識したビデオオブジェクトセグメンテーションが新たに確立された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:51:42 GMT)
Towards Compute-Optimal Many-Shot In-Context Learning [63.8]
マルチショットICLにおけるデモ選択のための2つの戦略を提案する。最初の方法は、テストサンプルの類似性に基づいて選択された少数のデモと、キャッシュされるランダムなデモの集合を組み合わせる。第2の戦略は、ランダムなデモをk平均クラスタリングによるテストサンプル表現から選択したセントロイドに置き換えることによって、第1の戦略を改善する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:21:03 GMT)
One-for-More: Continual Diffusion Model for Anomaly Detection [63.5]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:06:04 GMT)
Fractional Spike Differential Equations Neural Network with Efficient Adjoint Parameters Training [63.4]
スパイキングニューラルネットワーク(SNN)は、生物学的ニューロンからインスピレーションを得て、脳に似た計算の現実的なモデルを作成する。既存のほとんどのSNNは、マルコフ特性を持つ一階常微分方程式(ODE)によってモデル化された、神経細胞膜電圧ダイナミクスの単一時間定数を仮定している。本研究では, 膜電圧およびスパイク列車の長期依存性を分数次力学により捉えるフラクタルSPIKE微分方程式ニューラルネットワーク (fspikeDE) を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:20:56 GMT)
HOComp: Interaction-Aware Human-Object Composition [62.9]
HOCompは、人中心の背景画像に前景オブジェクトを合成するための新しいアプローチである。実験結果から,HOCompは一貫した外見を持つ人間と物体の相互作用を効果的に生成することが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:59:21 GMT)
Semantic Segmentation for Preoperative Planning in Transcatheter Aortic Valve Replacement [61.6]
経カテーテル大動脈弁置換術(TAVR)の術前計画のための医療ガイドラインを考察し,セマンティックセグメンテーションモデルを用いて支援できる課題を同定する。まず, 細粒度のTAVR関連擬似ラベルを, 粗粒度の解剖学的情報から抽出し, セグメンテーションモデルを訓練し, スキャンでこれらの構造がどれだけよく見つかるかを定量化する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:24:45 GMT)
MC-Bench: A Benchmark for Multi-Context Visual Grounding in the Era of MLLMs [61.6]
本稿では,マルチコンテキストの視覚的グラウンド化という新しい視覚的グラウンド化タスクを提案する。オープンなテキストプロンプトに基づいて、複数の画像にまたがる関心のインスタンスをローカライズすることを目的としている。我々は20以上の最先端MLLMと基盤モデルをベンチマークし、潜在的にマルチコンテキストの視覚的グラウンド化機能を有する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:59:24 GMT)
Beyond Binary Rewards: Training LMs to Reason About Their Uncertainty [60.0]
本稿ではRLCRについて述べる。RLCRは精度と信頼性を共同で向上する推論モデルを訓練する手法である。多様なデータセット間で、RLCRは精度を損なうことなくキャリブレーションを大幅に改善することを示す。また,言語的信頼度をテスト時に活用し,精度とキャリブレーションを向上させることも実証した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:56:01 GMT)
Reasoning Models Can be Easily Hacked by Fake Reasoning Bias [59.8]
我々は、Reasoning Theatre Bias (RTB)を評価するための総合的なベンチマークTheATERを紹介する。簡単なクイズとフェイク・オブ・サートを含む6種類のバイアスタイプについて検討した。我々は、RTBの最も強力な形式として、'hallow reasoning'-plausibleだが欠陥のある議論を識別する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:20:24 GMT)
A Community-driven vision for a new Knowledge Resource for AI [59.3]
WordNetのような知識リソースの成功にもかかわらず、検証可能な汎用的な知識ソースは、AIインフラストラクチャにおいて重要な欠陥である。本稿では,この知見を要約し,新しい知識基盤に向けたコミュニティ主導のビジョンを概説する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:03:41 GMT)
LLMs syntactically adapt their language use to their conversational partner [58.9]
人間の話者は会話中に言語の使用が互いに一致していることがよく観察されている。大規模言語モデル(LLM)間の会話のコーパスを構築し、2つのLLMエージェントが会話が進むにつれて、より類似した構文的選択をするのを見つける。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:24:10 GMT)
HarmonPaint: Harmonized Training-Free Diffusion Inpainting [58.9]
HarmonPaintは、拡散モデルの注意機構をシームレスに統合する、トレーニング不要な塗装フレームワークである。自己注意の中でマスキング戦略を活用することで、HarmonPaintはモデルの再トレーニングや微調整なしに構造的忠実性を確保する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:14:35 GMT)
Scaling Linear Attention with Sparse State Expansion [58.2]
トランスフォーマーアーキテクチャは、2次計算と線形メモリ成長による長期コンテキストシナリオに苦慮している。本稿では,情報分類として状態更新を概念化し,線形注意のための行スパース更新定式化を提案する。次に、スパースフレームワーク内にスパース状態拡張(SSE)を示し、コンテキスト状態を複数のパーティションに拡張する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:27:31 GMT)
WGRAMMAR: Leverage Prior Knowledge to Accelerate Structured Decoding [58.1]
我々は、ドメイン認識の単純化、制約分解、マスクキャッシングを統合した軽量デコードエンジンであるwgrammarを紹介する。 wgrammarは、既存のシステムよりも最大250倍のスピードアップを実現します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:13:47 GMT)
Mamba-OTR: a Mamba-based Solution for Online Take and Release Detection from Untrimmed Egocentric Video [57.8]
Mamba-OTRは、短いビデオクリップでトレーニングしながら、推論中に時間的再発を利用するように設計されている。 Mamba-OTRは、スライドウインドウ方式で動作する際に、注目すべきmp-mAP45.48を達成する。我々は,今後の研究を支援するため,Mamba-OTRのソースコードを公開します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:23:51 GMT)
Sparrow: Data-Efficient Video-LLM with Text-to-Image Augmentation [57.3]
この研究は、合成データによるスケーリングを再考し、データ中心の観点からビデオLLMの開発に焦点を当てる。本研究では,純粋なテキスト命令データからビデオライクなサンプルを合成するSparrowというデータ拡張手法を提案する。提案手法は,より多くのサンプルを用いてトレーニングしたベースラインに匹敵する,あるいは優れた性能を実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:09:51 GMT)
ShadowCode: Towards (Automatic) External Prompt Injection Attack against Code LLMs [56.5]
本稿では,コード指向の大規模言語モデルに対する(自動)外部プロンプトインジェクションという,新たな攻撃パラダイムを紹介する。コードシミュレーションに基づいて誘導摂動を自動生成する,シンプルで効果的な方法であるShadowCodeを提案する。 3つの人気のあるプログラミング言語にまたがる31の脅威ケースを発生させるため、13の異なる悪意のある目標に対して本手法を評価した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:55:25 GMT)
Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:35:50 GMT)
Unisolver: PDE-Conditional Transformers Are Universal PDE Solvers [55.1]
我々は、多様なデータに基づいて訓練され、多様なPDEで条件付けされた新しいトランスフォーマーモデルUnisolverを提案する。 Unisolverは3つの挑戦的な大規模ベンチマークで一貫した最先端を実現し、優れたパフォーマンスと一般化性を示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:28:30 GMT)
On the Effectiveness of LLM-as-a-judge for Code Generation and Summarization [55.0]
大規模言語モデルは、最近、Q&Aのような複雑な自然言語処理タスクの裁判官として活用されている。コード生成とコード要約という2つのコード関連タスクに対するLLMs-as-a-judgeの有効性について検討した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:40:26 GMT)
Multi-Agent Reinforcement Learning for Sample-Efficient Deep Neural Network Mapping [54.7]
本稿では,サンプル非効率性の課題を克服するために,分散型マルチエージェント強化学習(MARL)フレームワークを提案する。相関解析に基づいて類似のマッピングパラメータを同一エージェントに割り当てるエージェントクラスタリングアルゴリズムを提案する。実験の結果,MARL法は標準単エージェントRLよりも30～300倍効率が向上した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:51:07 GMT)
Scale Your Instructions: Enhance the Instruction-Following Fidelity of Unified Image Generation Model by Self-Adaptive Attention Scaling [54.5]
OmniGenのような統合画像生成モデルの最近の進歩により、単一のフレームワーク内で多様な画像生成および編集タスクの処理が可能になった。テキスト命令が複数のサブインストラクションを含む場合,テキスト命令の無視に悩まされることがわかった。本稿では,サブインストラクション毎に注意力の活性化を動的にスケールするために,自己適応型注意スケーリングを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:25:38 GMT)
R2D2: Remembering, Replaying and Dynamic Decision Making with a Reflective Agentic Memory [53.9]
現在のモデルは、Web構造の可視化と理解が限られているため、効率的なナビゲーションとアクション実行に苦しむことが多い。提案したR2D2フレームワークは,2つのパラダイムを統合することで,これらの課題に対処する。本研究は,記憶を増強したナビゲーションと反射学習を組み合わせることで,Webエージェントの能力が向上することが示唆された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:14:16 GMT)
Seed-X: Building Strong Multilingual Translation LLM with 7B Parameters [53.6]
7Bパラメータサイズを持つオープンソースの言語モデル(LLM)のファミリーであるSeed-Xを紹介する。ベースモデルは、28言語にわたるモノリンガルコンテンツとバイリンガルコンテンツの両方を含む、多種多様な高品質データセットで事前訓練されている。その後、インストラクションモデルは、Chain-of-Thought(CoT)推論によって翻訳され、強化学習(RL)によりさらに強化され、多様な言語対をまたいだより良い一般化が達成される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:54:56 GMT)
VitaGlyph: Vitalizing Artistic Typography with Flexible Dual-branch Diffusion Models [53.6]
アーティスティック・タイポグラフィー(Arttic typography)は、入力文字の意味を想像可能で読みやすい方法で視覚化する技法である。そこで我々は,VitaGlyphと呼ばれる2枝のトレーニング不要な手法を導入し,幾何学的変化を制御可能な,柔軟な芸術的タイポグラフィーを実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:43:53 GMT)
Diffusion Models for Solving Inverse Problems via Posterior Sampling with Piecewise Guidance [52.7]
断片的なガイダンススキームを用いて,逆問題を解決するための新しい拡散型フレームワークが導入された。提案手法は問題に依存しず,様々な逆問題に容易に適応できる。このフレームワークは, (4時間), (8時間) の超分解能タスクに対して, (23%), (24%) および (24%) の無作為マスクを塗布する場合の (25%) の推論時間を短縮する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:35:14 GMT)
Curating Demonstrations using Online Experience [52.6]
また,Demo-SCOREは手作業によるキュレーションを伴わずに,効果的に準最適動作を識別できることが示唆された。 Demo-SCOREは、全てのオリジナルのデモンストレーションで訓練された基本方針と比較して、結果のポリシーにおいて15～35%以上の絶対的な成功率を達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:32:33 GMT)
Language model developers should report train-test overlap [52.5]
30人のモデル開発者のプラクティスを文書化して、トレイン-テストの重複を報告しているのは9人だけです。私たちの仕事は、モデル評価に対するコミュニティ全体の信頼を高めるために、電車とテストの重複に対する透明性を高めることを願っています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:36:25 GMT)
STAR: A Benchmark for Astronomical Star Fields Super-Resolution [51.8]
54,738個のフラックス一貫性の星体画像対を含む大規模SRデータセットSTARを提案する。本稿では,Flux-Invariant Super Resolution (FISR)モデルを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:28:28 GMT)
GUI-G$^2$: Gaussian Reward Modeling for GUI Grounding [51.5]
グラフィカルユーザインタフェース (GUI) は、自然言語の命令を、自律的なインタラクションのための正確なインターフェース位置にマッピングする。ターゲット要素を中心としたガウス分布を自然に形成する人間のクリック行動に動機付けられ,GUIガウスグラウンドング・リワード(GUIガウスグラウンドディング・リワード)を導入する。 GUI-G$2$のUI-TARS-72BはScreenSpot-Proで24.7%向上した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:50:36 GMT)
Text-to-SPARQL Goes Beyond English: Multilingual Question Answering Over Knowledge Graphs through Human-Inspired Reasoning [51.2]
mKGQAgentは、自然言語の質問をSPARQLクエリに変換し、モジュール化された解釈可能なサブタスクに変換するタスクを分解する。 2025年のText2SPARQLチャレンジにおいて、DBpediaとCorporateベースのKGQAベンチマークに基づいて評価され、私たちのアプローチは、他の参加者の中で第一に行われました。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:23:03 GMT)
Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report [51.2]
本報告では,フロンティアリスクの包括的評価について述べる。サイバー犯罪、生物学的および化学的リスク、説得と操作、制御不能な自律型AIR&D、戦略的騙しと計画、自己複製、共謀の7つの分野における重要なリスクを特定します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:44:38 GMT)
LLM4MEA: Data-free Model Extraction Attacks on Sequential Recommenders via Large Language Models [50.8]
近年の研究では、モデル抽出攻撃(MEA)に対するシーケンシャルレコメンデータシステムの脆弱性が実証されている。事前のMEAにおけるブラックボックス攻撃は、データ選択のランダムサンプリングによるレコメンデータシステムの脆弱性を明らかにするのに効果がない。 LLM4MEAは,Large Language Models (LLMs) を人間のようなランク付けとして活用してデータを生成する新しいモデル抽出法である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:20:23 GMT)
Semi-off-Policy Reinforcement Learning for Vision-Language Slow-thinking Reasoning [50.7]
本稿では、視覚言語によるスローtHInking reAsoningのためのシンプルでスケーラブルなセミオフポリシーRLであるSOPHIAを提案する。 SOPHIAは、訓練可能なLVLMからのオンラインの視覚的理解と、言語モデルからの非政治的なスロー思考推論を組み合わせることで、セミ・オフ・ポリティクスの行動モデルを構築している。 8Bおよび38BサイズのInternVL2.5およびInternVL3.0を用いた実験はSOPHIAの有効性を示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:59:34 GMT)
ICR Probe: Tracking Hidden State Dynamics for Reliable Hallucination Detection in LLMs [50.2]
隠れた状態を活用する幻覚検出法は、主に静的および孤立した表現に焦点を当てている。隠れ状態の更新に対するモジュールの寄与を定量化する新しいメトリック ICR Score を導入する。本稿では,隠れ状態の層間進化を捉えた幻覚検出手法 ICR Probe を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:44:26 GMT)
Hierarchical Budget Policy Optimization for Adaptive Reasoning [49.6]
階層的予算政策最適化(Hierarchical Budget Policy Optimization, HBPO)は、モデルが問題固有の推論深度を犠牲にすることなく学習できる強化学習フレームワークである。 HBPOは効率指向トレーニングにおける探索空間崩壊の課題に対処し、長い出力長の罰則を体系的に長い推論経路から遠ざける。大規模な実験により、HBPOは平均トークン使用量を最大60.6%削減し、4つの推論ベンチマークで精度を3.14%改善した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:29:44 GMT)
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning [49.5]
実際の研究から5.1Kの複雑な経路問題を持つデータセットであるBioMazeを紹介する。 CoT法やグラフ拡張推論法などの手法の評価は,LLMが経路推論に苦慮していることを示している。そこで本稿では,インタラクティブなサブグラフベースのナビゲーションにより推論を強化するLLMエージェントであるPathSeekerを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:56:33 GMT)
FISHER: A Foundation Model for Multi-Modal Industrial Signal Comprehensive Representation [49.5]
FISHERはマルチモーダル産業信号解釈表現の基礎モデルである。 FISHERはSTFTサブバンドをモデリングユニットとし、事前トレーニングのために教師の学生SSLフレームワークを採用する。上位のSSLモデルと比較して、FISHERは汎用性と優れた機能を示し、パフォーマンスは5.03%まで向上した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:31:16 GMT)
MEGA: Memory-Efficient 4D Gaussian Splatting for Dynamic Scenes [49.4]
本稿では,4DGSのためのメモリ効率フレームワークを提案する。 TechnicolorとNeural 3D Videoのデータセットで約190$times$と125$times$のストレージ削減を実現している。レンダリング速度とシーン表現の品質を維持し、フィールドに新しい標準を設定する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:55:59 GMT)
Effects of quantum geometry on the decoherence induced by black holes [49.2]
ここでは、量子ブラックホールの幾何学自体の量子的側面が結果に大きな影響を及ぼす可能性があることを指摘した。文献の様々な理由で提案された領域の領域の選択値に対して、地平線によって引き起こされるデコヒーレンス(英語版)は無視できるほど小さな値に制限されていることが判明した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:00:25 GMT)
Modeling Public Perceptions of Science in Media [49.1]
本稿では,ニュースの持続性,重要度,驚き度など,12次元にわたる公的な認識をモデル化する計算フレームワークを提案する。我々は、米国と英国の多様な人口から2,101人の参加者から10,489のアノテーションで、大規模な科学ニュースの認識データセットを作成します。我々は,公共の知覚スコアを高い性能で予測するNLPモデルを開発した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:13:52 GMT)
Predicting the Reliability of an Image Classifier under Image Distortion [48.9]
画像分類タスクでは、深層学習モデルは画像歪みに弱い。品質管理のためには、画像分類器が歪みレベルで信頼できない/信頼できないかを予測することが重要である。我々の解決策は、歪みレベルと「信頼できない」「信頼できない」ラベルからなるトレーニングセットを構築し、歪みレベルを分類するために機械学習予測モデル(歪み分類器と呼ばれる)を訓練することである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:06:37 GMT)
METER: Multi-modal Evidence-based Thinking and Explainable Reasoning -- Algorithm and Benchmark [48.8]
本稿では,画像,ビデオ,音声,映像コンテンツにまたがる偽造検出のための統合ベンチマークMETERを紹介する。我々のデータセットは4つのトラックから構成されており、それぞれのトラックは実際のvsフェイク分類だけでなく、エビデンスチェーンに基づく説明も必要である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:42:51 GMT)
Diffusion-Modeled Reinforcement Learning for Carbon and Risk-Aware Microgrid Optimization [48.7]
DiffCarl(ディフカール)は、マルチマイクログリッドシステムのインテリジェントな操作のための、拡散モデルによる炭素およびリスクを考慮した強化学習アルゴリズムである。従来のアルゴリズムと最先端のDRLソリューションを2.3-30.1%削減した。また、炭素を意識しない変種よりも28.7%低い炭素排出量を達成し、性能の変動を減少させる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:27:07 GMT)
Aligning AI with Public Values: Deliberation and Decision-Making for Governing Multimodal LLMs in Political Video Analysis [48.1]
AIモデルが政治的トピックにどう対処すべきかは議論されているが、依然として困難であり、より優れたガバナンスが必要である。本稿では、政治的に敏感なビデオを中心に、個人的および集団的な議論を通じて、大規模言語モデルのガバナンスについて検討する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:07:13 GMT)
Illuminating Darkness: Learning to Enhance Low-light Images In-the-Wild [47.4]
野生で収集された大規模で高解像度な4K+データセットであるLow-Light smartphone dataset (LSD)を紹介した。 LSDには6,425点の正確に整列された低照度と標準照度の画像ペアが含まれており、8000点以上のダイナミックな屋内と屋外のシーンから選択されている。そこで本研究では,彩度と彩度を別々に符号化し,色構造との絡み合いを低減するハイブリッドモデルTFFormerを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:10:47 GMT)
Towards Autonomous Sustainability Assessment via Multimodal AI Agents [46.8]
電子デバイスのクレードル・トゥ・ゲート二酸化炭素排出量を計算するためのマルチモーダルAIエージェントを導入する。このアプローチは、専門家時間の数週間から数ヶ月を1分未満に短縮し、データ可用性のギャップを埋める。炭素フットプリントは専門的なLCAの19%以内であり、プロプライエタリなデータはゼロである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:49:25 GMT)
Reasoning Does Not Necessarily Improve Role-Playing Ability [46.4]
ロールプレイング大型言語モデル(LLM)の適用は、学術分野と商業分野の両方で急速に拡大している。我々は、直接ゼロショットロールプレイングの有効性、Chain-of-Thought(CoT)によるロールプレイング、推論最適化LDMを用いたロールプレイングを比較した。以上の結果から,CoTはロールプレイング性能を低下させ,推論最適化LDMはロールプレイングに不適であり,中国のロールプレイング性能は英語ロールプレイング性能を上回っていることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:01:16 GMT)
X-Intelligence 3.0: Training and Evaluating Reasoning LLM for Semiconductor Display [46.4]
我々は半導体ディスプレイ産業向けに開発された最初の高性能推論モデルであるX-Intelligence 3.0を提案する。このモデルは、業界の複雑な課題に対する専門家レベルの理解と推論を提供するように設計されています。比較的コンパクトな32億のパラメータにもかかわらず、X-Intelligence 3.0は複数の評価でSOTA DeepSeek-R1-671Bを上回っている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:23:15 GMT)
Atomic Calibration of LLMs in Long-Form Generations [46.0]
大型言語モデル(LLM)は幻覚に悩まされることが多く、現実世界のアプリケーションにとって大きな課題となっている。我々は,原子の反応を原子のクレームに分解することで,ファクトリティのキャリブレーションをきめ細かなレベルで評価する新しい手法である原子キャリブレーションを導入する。実験の結果,原子キャリブレーションは長文生成に適しており,マクロキャリブレーションの結果も改善できることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:31:45 GMT)
Predictive Hydrodynamic Simulations for Laser Direct-drive Implosion Experiments via Artificial Intelligence [45.8]
この研究は、レーザー駆動インロージョン実験のために人工知能(AI)によって強化された予測的流体力学シミュレーションを提示する。レーザ波形とターゲット半径に応じてインロジョン特性を予測するために, トランスフォーマベース深層学習モデルであるMulti-Netを構築した。本研究では、複雑なレーザー融合実験のためのシミュレーションの予測能力を向上するデータ駆動型AIフレームワークを実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:57:40 GMT)
A2Mamba: Attention-augmented State Space Models for Visual Recognition [45.7]
本稿では,トランスフォーマー-マンバハイブリッドネットワークアーキテクチャであるA2Mambaを提案する。 A2SSMのキーステップは、空間的にSSMの隠された状態を集約することで、異種交叉アテンションを実行する。私たちのA2Mambaは、視覚認識タスクにおいて、以前のConvNet-、Transformer-、およびMambaベースのアーキテクチャよりも優れています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:17:08 GMT)
Higher Gauge Flow Models [45.0]
より高次ゲージフローモデルはL$_infty$-代数を利用して、リー代数を効果的に拡張する。この拡張により、高次幾何学と高次群に関連する高次対称性を生成フローモデルの枠組みに統合することができる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:16:06 GMT)
High temperature superradiant phase transition in novel quantum structures with complex network interface [45.0]
複素ネットワークにおける2レベル系と光電場との超強相互作用を可能にする新しい量子材料の概念を提案する。ネットワークの統計特性を,まず$langlekrangle$,次に正規化された$zetaequivlanglek2rangle/langlekrangle$,ノード次分布のモーメントによって特徴付ける。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:56:45 GMT)
ETCH: Generalizing Body Fitting to Clothed Humans via Equivariant Tightness [44.8]
Equivariant Tightness Fitting for Clothed Humans(ETCH)は、布の表面マッピングを推定する新しいパイプラインである。 CAPEと4D-Dressの実験では、ETCHは最先端の手法よりも大幅に優れていた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:49:25 GMT)
LongSplat: Online Generalizable 3D Gaussian Splatting from Long Sequence Images [44.6]
LongSplatは、長時間画像入力のためのオンラインリアルタイム3Dガウス再構成フレームワークである。 GIRは3Dガウスパラメータを構造化されたイメージライクな2Dフォーマットにエンコードする。 LongSplatは、リアルタイムの新規ビュー合成において最先端の効率品質トレードオフを実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:43:51 GMT)
Dens3R: A Foundation Model for 3D Geometry Prediction [44.1]
Dens3Rは幾何学的密度予測のための3次元基礎モデルである。画像対マッチング機能と本質的不変性モデリングを統合することにより、Dens3Rは複数の幾何学的量を正確に回帰する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:22:30 GMT)
GenMol: A Drug Discovery Generalist with Discrete Diffusion [43.3]
Generalist Molecular Generative Model (GenMol) は、多種多様な薬物発見シナリオを扱うために単一の離散拡散モデルのみを使用する汎用的なフレームワークである。 GenMolは、非自己回帰的双方向並列デコードにより、シーケンスアタッチメントベースのフラグメント埋め込みシーケンスを生成する。 GenMol は、de novo 生成とフラグメント制約生成において、以前の GPT ベースモデルよりも大幅に優れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:03:34 GMT)
Relativistic Quantum Fields Are Universal Entanglement Embezzlers [41.9]
絡み合いの埋め込みは、補助系の参照状態から絡み合った量子状態を抽出する直感的な可能性を指す。エンベジングエンタングルメントの操作タスクとフォン・ノイマン代数の数学的分類との深い関係を明らかにする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:14:29 GMT)
Banzhida: Advancing Large Language Models for Tibetan with Curated Data and Continual Pre-Training [40.9]
バンジーダ(Banzhida)は、チベット語で生成するAIを進化させる多言語大言語モデルである。現在までに最大のチベット事前訓練コーパスをキュレートし、様々な情報源からのデータを収集している。我々は、新しい高品質のチベットベンチマークを作成し、それらを既存の公開ベンチマークで補完する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:15:52 GMT)
Quantum Annealing Hyperparameter Analysis for Optimal Sensor Placement in Production Environments [39.6]
ハードウェアが成熟すると、量子コンピューティングがコスト効率、大規模最適化問題にどのように貢献するかを示す。我々はこの問題を1ホットとバイナリエンコーディングによる2次非制約バイナリ最適化の定式化に変換する。以上の結果から,量子アニールは実世界のシナリオから派生したインスタンスを解くことができることが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:35:51 GMT)
CausalStep: A Benchmark for Explicit Stepwise Causal Reasoning in Videos [39.5]
CausalStepはビデオの段階的因果推論のベンチマークである。ビデオは因果的にリンクされたユニットに分割し、厳密な段階的な質問応答プロトコルを強制する。ベンチマークには、6つのカテゴリに100の動画と、1,852のマルチチョイスQAペアが含まれている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:29:13 GMT)
MONITRS: Multimodal Observations of Natural Incidents Through Remote Sensing [39.5]
我々は,1万件以上のFEMA災害イベントを,時空間衛星画像とニュース記事からの自然言語アノテーションで表現した新しいデータセットであるMONITRSを提示する。既存のMLLMをデータセットに微調整することで,災害監視タスクの性能が大幅に向上することが実証された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:59:09 GMT)
Learning Streaming Video Representation via Multitask Training [38.8]
オフラインの動画理解とは異なり、ストリーミングビデオ理解にはフレーム単位でビデオストリームを処理し、過去の情報を保存し、低レイテンシの決定を行う能力が必要である。本稿では,事前学習した視覚変換器に因果的注意を組み込むことにより,StreamFormerと呼ばれる新しいストリーミングビデオバックボーンを開発する。オンラインアクション検出、オンラインビデオインスタンスセグメンテーション、およびビデオ質問応答に関する広範な実験を行う。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:34:45 GMT)
InfiniteHBD: Building Datacenter-Scale High-Bandwidth Domain for LLM with Optical Circuit Switching Transceivers [37.9]
光回路スイッチング(OCS)を用いたトランシーバレベルの接続性と動的スイッチングを統一するトランシーバ中心型HBDアーキテクチャを提案する。各トランシーバにOCSを埋め込むことで、InfiniteHBDは再構成可能なポイント・ツー・マルチポイント接続を実現し、位相を可変サイズの環に適応させることができる。 InfiniteHBD は NVL-72 の31%,NVL-72 と TPUv4 よりも 1 桁低いGPU廃棄物率,ノード故障比が 7% 未満の場合,ほぼ 0 桁のクロスToR トラフィックを実現している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:35:24 GMT)
confopt: A Library for Implementation and Evaluation of Gradient-based One-Shot NAS Methods [37.7]
ワンショットニューラルアーキテクチャサーチ(NAS)は、アーキテクチャ空間を探索するコストを大幅に削減した。しかし、勾配に基づくNAS法の評価はDARTSベンチマークに大きく依存している。本稿では,勾配に基づくNAS手法の開発と評価を効率化するライブラリであるConfoptを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:44:28 GMT)
Evaluating Social Acceptance of eXtended Reality (XR) Agent Technology: A User Study (Extended Version) [37.7]
本稿では,eXtended Reality(XR)エージェント技術の社会的受容性を評価するユーザスタディについて述べる。このシステムは、モジュラーツールキットによって実現された仮想アバターとのユーザインタラクションを含む。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:14:05 GMT)
A resource theoretical unification of Mpemba effects: classical and quantum [37.7]
ムペンバ効果(Mpemba effect)は、もともと特定の熱力学の下では、当初より高温の試料は冷たいものよりも速く冷却できるという観察を指していた。この研究は、情報理論に広く用いられている資源理論が、メペンバ物理学を体系化するための統一的な原理を提供することを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:28:16 GMT)
StreamME: Simplify 3D Gaussian Avatar within Live Stream [37.5]
StreamMEは、プリキャッシュされたデータなしでライブビデオストリームからヘッドアバターを同期的に記録し、再構成する。提案手法は3次元Splatting (3DGS) 上に構築され, 変形可能な3DGSにおけるガウシアンへの依存を解消する。本手法は,VRシステムやオンライン会議において,顔のプライバシを保護し,通信帯域を削減する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:33:30 GMT)
DP2Guard: A Lightweight and Byzantine-Robust Privacy-Preserving Federated Learning Scheme for Industrial IoT [37.4]
DP2Guardは、プライバシーと堅牢性の両方を強化する軽量PPFLフレームワークである。特異値分解とコサイン類似性を用いて勾配特徴を抽出するハイブリッド防衛戦略を提案する。信頼スコアに基づく適応アダプティブアグリゲーションスキームは、履歴行動に応じてクライアントの重みを調整する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:06:39 GMT)
Balanced Image Stylization with Style Matching Score [36.5]
Style Matching Score (SMS) は拡散モデルを用いた画像スタイリングの新しい最適化手法である。 SMSはスタイルのアライメントとコンテンツ保存のバランスを保ち、最先端のアプローチよりも優れています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:52:34 GMT)
Make Me Happier: Evoking Emotions Through Image Diffusion Models [36.4]
本稿では,感情を誘発するイメージを合成することを目的とした,感情誘発画像生成の新たな課題を提案する。本稿では、ソースイメージを効果的に理解し、編集し、望ましい感情や感情を伝える拡散モデルを提案する。我々は、人間の心理物理学実験を行い、すべての手法を体系的にベンチマークする新しい評価基準を導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:46:09 GMT)
Advancing Robustness in Deep Reinforcement Learning with an Ensemble Defense Approach [36.3]
本稿では,自律走行シナリオにおける敵攻撃を軽減するために,アンサンブルに基づく新しい防御アーキテクチャを提案する。 FGSM攻撃時のベースラインと比較して、我々のアンサンブル法は平均報酬を5.87から18.38(213%以上)に改善し、ハイウェイシナリオとマージシナリオにおける平均衝突速度を0.50から0.09(82%減少)に低減し、全てのスタンドアロン防衛戦略を上回っている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:15:11 GMT)
Unconventional Floquet topological phases in the SSH lattice [36.1]
局所的な摂動に頑健なエッジ状態で知られるトポロジカル材料は、次世代量子技術への期待を抱いている。本稿では,Floquet位相位相を動的に誘導・切り替えするために,高周波単色駆動と変調振幅パルスを用いることを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:34:58 GMT)
Towards a Universal 3D Medical Multi-modality Generalization via Learning Personalized Invariant Representation [35.5]
本稿では,様々なモダリティにまたがるパーソナライズされた不変表現を近似することで,パーソナライズされた一般化を実現するアプローチを提案する。我々は、パーソナライズされた$X_h$の学習の実現可能性とメリットを検証し、この表現が多種多様な医療タスクにおいて非常に一般化可能であり、伝達可能であることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:47:17 GMT)
LENS-DF: Deepfake Detection and Temporal Localization for Long-Form Noisy Speech [35.4]
LENS-DFは、オーディオディープフェイクの検出と時間的局在のトレーニングと評価のための、新しく包括的なレシピである。自己教師型学習フロントエンドと単純なバックエンドに基づいて実験を行う。その結果、LENS-DFで生成されたデータを用いてトレーニングしたモデルは、従来のレシピでトレーニングしたモデルよりも一貫して優れていた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:31:13 GMT)
Adaptive Bayesian Single-Shot Quantum Sensing [35.4]
変分量子センシングにおいて、プローブ量子システムはパラメータ化量子回路を介して生成される。本稿では,ベイズ推定を用いて能動情報ゲインを最適化する適応プロトコルを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:35:27 GMT)
CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning [35.1]
最適化のための自動強化学習フレームワークを導入する。 A100でトレーニングされたNVIDIA-L1は、250のBenchカーネルすべてに平均でx17.7のスピードアップを提供し、ピーク時のスピードアップはx449に達する。 H100ではx17.8、3090ではx19.0、L40ではx16.5、H800ではx14.7、H20ではx13.9である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:42:18 GMT)
Comparison of Optimised Geometric Deep Learning Architectures, over Varying Toxicological Assay Data Environments [34.8]
本研究では,グラフ畳み込みネットワーク(GCN),グラフ注意ネットワーク(GAT),グラフ同型ネットワーク(GIN)の性能の比較を行った。エリア・アンダー・ザ・カーブ(AUC)のスコアは0.728-0.849(全ての折り畳み平均値)である。 GINはGCNとGATを一貫して上回り、最も有毒な7つのアッセイの上位5位を占めた。これは、GINがデータ依存環境に最適なアーキテクチャであるのに対して、GATはデータに最適なアーキテクチャであることを示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:38:11 GMT)
PICACO: Pluralistic In-Context Value Alignment of LLMs via Total Correlation Optimization [33.6]
In-Context Learningは、大規模言語モデル(LLM)を人間の価値と整合させる大きな可能性を示している。 LLMの入力プロンプトの理解は依然として不可知であり、ICAが値の緊張に対処する能力を制限する。この問題に対処する新しい多元的ICA手法であるPICACOを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:14:56 GMT)
Characterizing Online Activities Contributing to Suicide Mortality among Youth [33.2]
近年の若年自殺の増加は、オンライン体験がこの公衆衛生問題にどのように貢献するかを緊急に理解する必要があることを浮き彫りにしている。 2013-2022年における死亡調査のオープンテキストサマリー29,124件を用いて,自死の文脈化に関係があると考えられる12種類のオンライン活動を特定するためのセマンティック分析を行った。我々の研究は、自殺リスクの異なる段階に対応する、自己への害、他人への害、対人関係、オンライン活動レベル、ライフイベントに関連するいくつかのオンライン活動を明らかにする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:55:51 GMT)
Hierarchical Safety Realignment: Lightweight Restoration of Safety in Pruned Large Vision-Language Models [33.0]
階層型安全実現(HSR)という,新規で軽量なアプローチを提案する。 HSRはまず、それぞれの注意ヘッドの安全への貢献を定量化し、最も重要なものを同定し、選択的に神経細胞を復元する。我々は,HSRを各種モデルおよびプルーニング戦略で検証し,安全性能の顕著な改善を継続的に達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:32:33 GMT)
Data Processing for the OpenGPT-X Model Family [32.8]
データ選択と要件定義から始まり、最終的なフィルタリングデータの準備まで、すべてのデータ処理手順を説明します。我々は、データセットの詳細な分析を提供し、透明性を高め、ヨーロッパのデータ規制と整合する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:46:10 GMT)
CM-UNet: A Self-Supervised Learning-Based Model for Coronary Artery Segmentation in X-Ray Angiography [32.7]
CM-UNetは、注釈なしデータセットの自己教師付き事前学習と限られた注釈付きデータでの転送学習を利用する。 500点ではなく18点の注釈付き画像で微調整されたCM-UNetは、Diceのスコアが15.2%低下した。これは、X線血管造影による冠動脈セグメンテーション改善における自己教師的学習の重要性を強調した最初の研究の1つである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:27:34 GMT)
The Ever-Evolving Science Exam [32.2]
The *Ever-Evolving Science Exam (EESE)* was introduced the **Ever-Evolving Science Exam (EESE)*。 1)5つの分野と500以上のサブフィールドにまたがる専門的な科学インスタンス(クエスト・アンサー・ペア)と,2)定期的に更新された500インスタンスサブセット**EESE*,サンプルと検証により,リーク耐性,低オーバヘッド評価を実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:22:16 GMT)
Advancing Visual Large Language Model for Multi-granular Versatile Perception [31.8]
Visual Large Language Model を取り入れた多言語・多言語知覚フレームワーク MVP-LM を提案する。我々のフレームワークは、ボックスとマスクの予測とともに、単語ベースと文ベースの両方の知覚タスクを統合するように設計されている。 MVP-LMは、CoTにインスパイアされたデータセット統一戦略と合わせて、革新的なマルチグラニュラリティデコーダを備えている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:09:14 GMT)
Engineering Non-Hermitian Quantum Evolution Using a Hermitian Bath Environment [31.4]
非エルミートサブシステムによる量子バスネットワークのエンジニアリングは、量子ビット冷却、状態安定化、フォールトトレラント量子計算のための有望な戦略として登場した。完全エルミートフォトニックプラットフォーム内で非エルミートサブシステムを構築するための体系的枠組みを導入する。特に、実際の損失を伴わない制御された指数的崩壊吸収は、離散-連続結合とランツォス変換によって有限1-次元導波路鎖で実現される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:14:05 GMT)
LibEER: A Comprehensive Benchmark and Algorithm Library for EEG-based Emotion Recognition [31.4]
脳波に基づく感情認識(EER)は、人間の感情を理解し分析する可能性から注目されている。この分野には、説得力のあるベンチマークと包括的なオープンソースライブラリが欠けている。 EERの公平な比較を容易にするために設計された総合ベンチマークおよびアルゴリズムライブラリであるLibEERを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:31:06 GMT)
TRIDENT: Benchmarking LLM Safety in Finance, Medicine, and Law [31.3]
大規模言語モデル(LLM)は、法律、金融、医療といったリスクの高い領域にますます展開されている。まず,AMA Principles of Medical Ethics, ABA Model Rules of Professional Conduct, CFA Institute Code of Ethicsに基づいて,LLMのドメイン固有の安全原則を定義した。法、金融、医療分野におけるLLMの安全性に特化したベンチマークであるTrident-Benchを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:52:29 GMT)
Cross-Modal Distillation For Widely Differing Modalities [31.0]
我々は,教師モデルを導入し,学生モデルに差別的知識を伝達することでマルチモーダル学習を行う。蒸留によるこの知識伝達は、広く異なるモダリティ間の大きなドメインギャップが、容易に過度な適合をもたらすため、簡単ではない。本稿では,2つの軟式制約付き知識蒸留法と品質ベース適応重みモジュールを用いて,試料の重み付けを行う。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:34:00 GMT)
Estimating Treatment Effects with Independent Component Analysis [30.8]
独立成分分析(ICA)は部分線形回帰(PLR)モデルにおける因果効果推定に有効であることを示す。線形ICAはガウスの共同設立者や非線形ニュアンスの存在下でも正確に複数の治療効果を推定できることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:16:23 GMT)
Learning to Call: A Field Trial of a Collaborative Bandit Algorithm for Improved Message Delivery in Mobile Maternal Health [30.7]
インドのキルカリ・プログラムは、何百万人もの母親に毎週の音声通話を通じて重要な母体健康情報を提供している。現在のランダムな呼び出しスケジューリングは、しばしばミスコールとメッセージ配信の削減をもたらす。本研究では,母親の好みの通話時間を学習することで,通話タイミングの最適化を目的とした協調的帯域幅アルゴリズムのフィールドトライアルを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:42:17 GMT)
Quantum Geometry of Data [30.7]
量子認知機械学習は、データを量子幾何学としてエンコードする方法を示す。 QCMLでは、データの特徴は学習されたエルミート行列によって表現され、データポイントはヒルベルト空間の状態にマッピングされる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:27:22 GMT)
When LLMs Copy to Think: Uncovering Copy-Guided Attacks in Reasoning LLMs [30.5]
大規模言語モデル(LLM)は、脆弱性検出やコード理解といったタスクを可能にする自動コード解析に不可欠なものになっている。本稿では,CGA(Copy-Guided Attacks)と呼ばれる,新たなプロンプトベースの攻撃のクラスを特定し,検討する。 CGAは、コード解析タスクにおいて、無限ループ、早期終了、偽の拒絶、意味的歪みを確実に誘導することを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:21:36 GMT)
ThinkAct: Vision-Language-Action Reasoning via Reinforced Visual Latent Planning [30.0]
視覚言語アクション(VLA)推論タスクでは、エージェントはマルチモーダル命令を解釈し、長期計画を実行し、動的環境で適応的に行動する必要がある。既存のアプローチは通常、エンドツーエンドでVLAモデルをトレーニングし、明示的な推論なしに入力を直接アクションにマッピングする。本稿では,高レベルの推論と低レベルのアクション実行を,強化された視覚的潜在計画を通じて橋渡しする,デュアルシステムフレームワークであるThinkActを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:59:46 GMT)
Self-Contradiction as Self-Improvement: Mitigating the Generation-Understanding Gap in MLLMs [29.8]
MLLMは、モデル自体の理解に基づいて、入力プロンプトと不一致とみなす画像を生成する自己コントラディションを示す。私たちの経験的結果は、自己矛盾は主に誤解ではなく、プロンプトと一致しない弱い世代から生じます。このような内部監督による標準的なポストトレーニング手法の適用は、生成と統一の両方をうまく改善する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:56:39 GMT)
ReMeREC: Relation-aware and Multi-entity Referring Expression Comprehension [29.5]
ReMeRECは、自然言語の記述に基づいて、イメージ内の特定のエンティティやリージョンをローカライズすることを目的としている。まず、ReMeXと呼ばれる関係認識型マルチエンタリティRECデータセットを構築した。次に,複数のエンティティのローカライズに視覚的およびテキスト的手がかりを併用した新しいフレームワークReMeRECを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:23:48 GMT)
Quantum Cognition Machine Learning for Forecasting Chromosomal Instability [29.5]
循環腫瘍細胞(CTC)の形態から染色体不安定性の正確な予測は、液体生検診断における高い転移能を有するCTCのリアルタイム検出を可能にする。本稿では,転移性乳癌患者のCTCにおける形態予測的染色体不安定性を推定するための量子認知機械学習(QCML)の応用について紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:53:00 GMT)
FLAIN: Mitigating Backdoor Attacks in Federated Learning via Flipping Weight Updates of Low-Activation Input Neurons [29.2]
フェデレートラーニング(FL)は、複数のクライアントが中央サーバの調整の下で、機械学習モデルを協調的にトレーニングすることを可能にする。バックドア攻撃は悪質な入力でのみ活性化されるニューロンを悪用する FLのバックドア攻撃に対するFLAIN(Flipping Weight Updates of Low-Activation Input Neurons)を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:55:26 GMT)
AtrousMamaba: An Atrous-Window Scanning Visual State Space Model for Remote Sensing Change Detection [29.0]
本稿では,グローバルな文脈情報の統合と微粒な局所的詳細情報の抽出のバランスをとる新しいモデルであるAtrousMambaを提案する。 AWVSS(Atrous window scan visual state space)モジュールを活用することで、バイナリチェンジ検出(BCD)とセマンティックチェンジ検出(SCD)のためのエンド・ツー・エンドのMambaベースのフレームワークを設計する。 6つのベンチマークデータセットの実験結果は、提案フレームワークが既存のCNNベース、Transformerベース、Mambaベースの手法より優れていることを示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:36:16 GMT)
Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [28.5]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。 AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:37:51 GMT)
Efficient RL for optimizing conversation level outcomes with an LLM-based tutor [28.2]
大規模言語モデル(LLM)は、人間フィードバック(RLHF)フレームワークによる既存の強化学習に基づいて構築される。学生の低次元潜在状態表現を用いて対話履歴を表現し,LLMに基づくチュータを強化する手法を提案する。我々のモデルは軽量であり、チューターの次の発話を直接出力するために、チューターポリシーをエンドツーエンドにトレーニングする以前の作業よりも計算資源を少なくする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:56:46 GMT)
HIPPO-Video: Simulating Watch Histories with Large Language Models for Personalized Video Highlighting [27.9]
パーソナライズされたビデオハイライトのための新しいデータセットであるHIPPO-Videoを紹介する。データセットには2,040対(履歴、給与スコア)が含まれており、170のセマンティックカテゴリにわたる20,400のビデオをカバーしている。提案手法は,これらの個人化された時計履歴を利用して,嗜好条件付きセグメント・サリエンシスコアを推定する手法である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:24:33 GMT)
DOFA-CLIP: Multimodal Vision-Language Foundation Models for Earth Observation [27.9]
本稿では,1つのトランスフォーマーバックボーンを通じてフレキシブルなスペクトル構成でEOモダリティに適応する視覚言語基盤モデルであるDOFA-CLIPを提案する。提案手法では, 大規模EO画像テキストデータセットであるGeoLangBind-2Mの構築, マルチビジョン基盤モデルによるCLIP特徴の空間的認識を高める VECT と呼ばれる新しいトレーニング戦略, モータリティを意識した知識集約(MaKA)モジュールの構築を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:05:39 GMT)
Optimal Pure Differentially Private Sparse Histograms in Near-Linear Deterministic Time [27.9]
そこで本研究では,純微分プライベートなスパースヒストグラムを,サイズ$d gg n$の領域から引き出された参加者に対してリリースするアルゴリズムを提案する。我々の手法は最適な$ell_infty$-estimation誤差を達成し、ワードRAMモデルで厳密に$O(n ln ln d)$時間で実行します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:17:59 GMT)
The Cost of Compression: Tight Quadratic Black-Box Attacks on Sketches for $\ell_2$ Norm Estimation [27.8]
線形スケッチによる次元の低減は強力で広く使われている手法であるが、敵の入力に弱いことが知られている。 Rk X n$ の固定されたスケッチ行列 A は、高次元ベクトル v $in Rn$ を、低次元スケッチ A v in $Rk$ に写像する。我々は、tilde(O)($k2$)クエリを使用して、ノルム推定の失敗を引き起こすか、クエリ分布の最適推定器が失敗する逆入力を構築する、普遍的で非適応的な攻撃を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:25:05 GMT)
Deformable Cluster Manipulation via Whole-Arm Policy Learning [27.5]
本稿では,3次元点雲とプロプリセプティブタッチインジケータという2つのモードを統合したモデルフリーポリシーの学習フレームワークを提案する。我々の強化学習フレームワークは,カーネル平均埋め込みによる分散状態表現を利用して,学習効率の向上とリアルタイム推論を実現する。我々は、このフレームワークを電力線クリアランスシナリオに展開し、エージェントが複数のアームリンクを利用して非閉塞性を実現する創造的戦略を生成することを観察する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:58:30 GMT)
Comparative validation of surgical phase recognition, instrument keypoint estimation, and instrument instance segmentation in endoscopy: Results of the PhaKIR 2024 challenge [27.5]
3つの医療機関から収集した腹腔鏡下胆嚢摘出術13例からなる新しいデータセットについて紹介した。既存のデータセットとは異なり、同じデータ内の機器の局所化と手続き的コンテキストを共同で調べることができる。バイオメディカル画像解析の課題に対するBIASガイドラインに従って,結果と知見を報告する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:10:42 GMT)
Many-body delocalization with a two-dimensional 70-qubit superconducting quantum simulator [27.4]
十分に強い障害を持つ量子多体系は、多体局在(MBL)と呼ばれる非平衡現象を示す。制御有限サイズ2DシステムにおけるMBL体制のロバスト性について実験的に検討した。我々の結果は、MBL状態が1つの空間次元を超えた不安定性を予測する雪崩理論と一致している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:02:05 GMT)
PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models [27.3]
マルチモーダル大規模言語モデル (MLLM) は視覚言語タスクにおいて顕著な成功を収めた。膨大なインターネットソースデータへの依存は、プライバシーとセキュリティの重大な懸念を引き起こす。マシン・アンラーニング(MU)はこれらの問題に対処するための重要な手法として登場した。 PEBenchはMLLMにおけるMUの徹底的な評価を容易にするために設計された新しいベンチマークである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:49:12 GMT)
RealBench: Benchmarking Verilog Generation Models with Real-World IP Designs [27.0]
本稿では,実世界のIPレベルのVerilog生成タスクを対象とした最初のベンチマークであるRealBenchを紹介する。 RealBenchは複雑で構造化された、実世界のオープンソースIP設計、マルチモーダルおよびフォーマット設計仕様、厳密な検証環境を備えている。様々なLLMおよびエージェントの評価によると、最も優れたLLMの1つであるo1-previewでさえ、モジュールレベルのタスクでは13.3%のpass@1しか達成せず、システムレベルのタスクでは0%である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:29:23 GMT)
Finding Dori: Memorization in Text-to-Image Diffusion Models Is Less Local Than Assumed [27.0]
データプライバシと知的財産権に関する懸念は、トレーニングデータを必然的に複製する可能性があるため、依然として残っている。近年の緩和努力は、複製を誘発する原因となる重量を特定して刈り取ることに重点を置いている。プルーニング後も、入力プロンプトのテキスト埋め込みに対する微調整は、データ複製を再トリガーするのに十分であることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:02:38 GMT)
GroundFlow: A Plug-in Module for Temporal Reasoning on 3D Point Cloud Sequential Grounding [26.4]
3次元点雲(SG3D)における連続的な接地は、詳細なステップで日々の作業のためにテキスト命令に従うことによって、オブジェクトのシーケンスを探索することを指す。現在の3Dビジュアルグラウンド法では,各ステップから有用な時間情報を抽出することなく,複数のステップでテキスト命令を処理している。 GroundFlow - 3Dポイントクラウドシーケンシャルグラウンド上での時間的推論のためのプラグインモジュール。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:31:10 GMT)
CogStream: Context-guided Streaming Video Question Answering [26.4]
本稿では,コンテキスト誘導型ストリーミングビデオ推論(CogStream)という課題を紹介する。 CogStreamは実世界のストリーミングビデオシナリオをシミュレートする。半自動パイプラインによって生成される広範囲で階層的な問合せ対を特徴とする高密度な注釈付きデータセットを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:54:49 GMT)
Positive Style Accumulation: A Style Screening and Continuous Utilization Framework for Federated DG-ReID [25.6]
FedDG-ReIDは、分散ソースドメインデータを通じて、効果的にソースとターゲットドメインに一般化できるグローバルサーバモデルを学ぶことを目的としている。既存の手法は主にスタイル変換によるサンプルの多様性を改善する。我々は,モデルの一般化性能に有益で有害なスタイルを,肯定的あるいは否定的なスタイルとして定義する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:21:00 GMT)
Quantum Internet in a Nutshell -- Advancing Quantum Communication with Ion Traps [25.5]
本稿では,小さな量子誤り訂正符号の量子通信プロトコルへの組み入れについて検討する。これらの符号はノイズレベルを抑えるのに役立ち、チャネルのノイズプロファイルを監視するのに役立ちます。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:27:01 GMT)
How Deep Is Representational Bias in LLMs? The Cases of Caste and Religion [25.3]
我々は、宗教と鋳造のための大きな言語モデルにおける表現バイアスの存在と「粘り強さ」を定量化する。 GPT-4の反応は、文化的に支配的な集団を、その統計的表現をはるかに超越している。以上の結果から, LLMにおける表現バイアスは, 学習データにおける分布バイアスよりも, あらゆる品質に偏りがあることが示唆された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:28:37 GMT)
A Comprehensive Data-centric Overview of Federated Graph Learning [25.2]
本調査では,データ特性とデータ利用という2段階のデータ中心分類を提案する。各分類レベルは3つの基準で定義され、それぞれが異なるデータ中心の構成を表す。この調査では、事前訓練された大規模モデルとのFGL統合を調査し、現実的な応用を示し、GMLの新たなトレンドに沿った今後の方向性を強調している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:49:24 GMT)
M-SpecGene: Generalized Foundation Model for RGBT Multispectral Vision [25.1]
一般化RGBTマルチスペクトル基盤モデル(M-SpecGene)を構築した。 M-SpecGeneは、大規模な広義データから自己教師付き方法でモダリティ不変表現を学習することを目的としている。本稿では,2つのモードにまたがる情報密度を定量化するために,CMSS(Cross-Modality Structure Sparsity)メトリクスを導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:00:49 GMT)
InternAgent: When Agent Becomes the Scientist -- Building Closed-Loop System from Hypothesis to Verification [24.8]
InternAgentは、自律科学研究を行うための統合クローズドループマルチエージェントフレームワークである。 12の科学研究課題にまたがる多目的性を実証した。複数の科学分野において有望な性能向上を達成し、人的努力に比べて大幅にコストを削減した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:05:22 GMT)
MegaScience: Pushing the Frontiers of Post-Training Datasets for Science Reasoning [24.7]
1kの大学レベルの教科書から抽出した真正な参照回答を特徴とするオープンデータセットであるTextbookReasoningを提案する。私たちは、合計125万のインスタンスからなる高品質なオープンソースデータセットの大規模な混合であるMegaScienceを紹介します。実験により,我々のデータセットはより簡潔な応答長で優れた性能と訓練効率が得られることを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:59:03 GMT)
Towards Resilient Safety-driven Unlearning for Diffusion Models against Downstream Fine-tuning [24.2]
テキスト・ツー・イメージ(T2I)拡散モデルは、印象的な画像生成品質を達成し、パーソナライズされたアプリケーション向けに微調整されている。これらのモデルはしばしば有毒な事前訓練データから安全でない行動を継承し、安全性の懸念が高まる。本稿では、下流の微調整に対するレジリエンスを高める安全駆動型アンラーニングフレームワークResAlignを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:40:16 GMT)
Watermark Anything with Localized Messages [24.1]
我々は、Watermark Anything Model (WAM)と呼ばれる局所画像透かしのためのディープラーニングモデルを導入する。 WAM埋め込み装置は入力画像を不知覚に修正し、抽出器は受信した画像を透かし及び非透かし領域に分割する。 WAMはスプリシング画像中の透かし領域を特定し、複数の小さな領域から1ビット未満の誤差で異なる32ビットメッセージを抽出することができる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:48:18 GMT)
Multi-modal vision-language model for generalizable annotation-free pathology localization and clinical diagnosis [24.1]
医療画像から病理を自動的に定義することは、疾患の出現と進展を理解するのに役立つ。既存のディープラーニングモデルは専門家のアノテーションに依存しており、オープンな臨床環境での一般化機能が欠如している。視覚言語モデルを提案する。局在のない病理(AFLOC) 胸部X線画像の220万対のデータセットについて実験を行い、8つの外部データセットに対して広範な検証を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:21:54 GMT)
DREAM: Scalable Red Teaming for Text-to-Image Generative Systems via Distribution Modeling [23.9]
テキスト・トゥ・イメージ(T2I)生成モデルは、性や暴力的なイメージなどの有害なコンテンツを生成できる。 Red Teamingは、T2Iシステムから安全でない出力を抽出できる多様なプロンプトを積極的に識別することを目的としている。我々は,与えられたT2Iシステムから様々な問題のあるプロンプトを自動的に発見する,スケーラブルなレッド・チーム・フレームワークであるDREAMを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:10:22 GMT)
Detect Any Sound: Open-Vocabulary Sound Event Detection with Multi-Modal Queries [23.8]
マルチモーダルクエリによってガイドされるオープン語彙SEDのための問合せベースのフレームワークを提案する。 DASMはSEDをフレームレベルの検索タスクとして定式化し、音声機能はテキストやオーディオプロンプトからのクエリベクトルと一致している。 DASMは、局所化精度と新しいクラスへの一般化のバランスを効果的に保ち、オープン語彙設定においてCLAPベースの手法より優れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:24:01 GMT)
SplitMeanFlow: Interval Splitting Consistency in Few-Step Generative Modeling [23.5]
Flow Matchingのような生成モデルは最先端のパフォーマンスを達成したが、しばしば計算コストのかかる反復サンプリングプロセスによって妨げられている。この分野の先導的手法であるMeanFlowは、平均速度と瞬間速度を接続する差分IDを強制することによって、この分野を学習する。この研究において、この微分定式化はより基本的な原理の限定的な特別な場合であると主張する。 SplitMeanFlowは、学習目的として、この代数的一貫性を直接強制する新しいトレーニングフレームワークです。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:26:58 GMT)
EarthCrafter: Scalable 3D Earth Generation via Dual-Sparse Latent Diffusion [23.4]
Aerial-Earth3Dは、これまでで最大の3D空中データセットで、アメリカ本土で撮影された50万のキュレートされたシーン(それぞれ600m×600m)で構成されています。各シーンは、ポーズアノテートされたマルチビューイメージ、深度マップ、ノーマル、セマンティックセグメンテーション、カメラのポーズを提供し、地形の多様性を保証するための明確な品質制御を提供する。我々は,スパースデカップリング型潜水拡散による大規模3次元地球生成に適したフレームワークであるEarthCrafterを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:46:48 GMT)
FedDPG: An Adaptive Yet Efficient Prompt-tuning Approach in Federated Learning Settings [23.3]
本稿ではFedDPG(Federated Dynamic Prompt Generator)を紹介する。 FedDPGは動的プロンプト生成ネットワークを組み込んで、与えられた入力に基づいてコンテキスト認識プロンプトを生成する。 3つのNLPベンチマークデータセットの実験では、FedDPGは、グローバルモデルの性能の観点から、最先端のパラメータ効率の高い微調整方法よりも優れていることが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:47:12 GMT)
EmotiCrafter: Text-to-Emotional-Image Generation based on Valence-Arousal Model [23.3]
連続感情画像コンテンツ生成(C-EICG)の新たな課題について紹介する。本稿では,テキストプロンプトとValence-Arousal値に基づいて画像を生成する感情画像生成モデルであるEmotiCrafterを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:47:31 GMT)
Dyna3DGR: 4D Cardiac Motion Tracking with Dynamic 3D Gaussian Representation [23.2]
本研究では,明示的な3次元ガウス表現と暗黙的な神経運動場モデリングを組み合わせた新しいフレームワークである動的3次元ガウス表現(Dyna3DGR)を提案する。本手法は心構造と運動を同時に自己監督的に最適化し,広範囲なトレーニングデータやポイント・ツー・ポイント対応の必要性を解消する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:06:50 GMT)
MotionShot: Adaptive Motion Transfer across Arbitrary Objects for Text-to-Video Generation [23.1]
MotionShotは、参照ターゲット対応をきめ細かい方法で解析するためのフレームワークである。顕著な外観や構造の違いがあっても、物体を横切る動きをコヒーレントに転送することができる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:51:05 GMT)
Now and Future of Artificial Intelligence-based Signet Ring Cell Diagnosis: A Survey [22.8]
署名環細胞(SRC)は、末梢転移と予後不良の確率が高い。本稿は,2008年から2025年6月までのAI駆動型SRC分析に関する包括的調査である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:32:02 GMT)
ResearcherBench: Evaluating Deep AI Research Systems on the Frontiers of Scientific Inquiry [22.6]
我々は、ディープAI研究システムの能力を評価することに焦点を当てた最初のベンチマークであるResearcherBenchを紹介する。現実の科学的シナリオから専門的に選択された65の質問のデータセットを収集した。 OpenAI Deep ResearchとGemini Deep Researchは、他のシステムよりも格段に優れており、オープンエンドのコンサルティングの質問では特に強みがある。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:51:26 GMT)
Toward A Causal Framework for Modeling Perception [22.6]
機械学習(ML)における認識本稿では,知覚を因果的にモデル化するための最初のアプローチを提案する。我々は2種類の確率因果知覚(構造知覚とパラメトリック知覚)を定義した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:40:35 GMT)
AV-Reasoner: Improving and Benchmarking Clue-Grounded Audio-Visual Counting for MLLMs [22.4]
CG-AV-Countingは、手動で注釈付き手掛かり付き数え上げベンチマークで、1,027のマルチモーダル質問と5,845の注釈付き手掛かりを497本の長ビデオで紹介する。ブラックボックスとホワイトボックスの評価の両方をサポートし、エンドツーエンドと推論ベースのカウントのための包括的なテストベッドとして機能する。 AV-Reasonerは、GRPOとカリキュラム学習で訓練されたモデルであり、関連するタスクからカウント能力を一般化する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:00:35 GMT)
INTER: Mitigating Hallucination in Large Vision-Language Models by Interaction Guidance Sampling [22.0]
大規模視覚言語モデル(LVLM)における幻覚は、現実世界のアプリケーションに重大な課題をもたらす。 textbfInter: textbfInteraction Guidance Samplingを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:33:11 GMT)
Toward Long-Tailed Online Anomaly Detection through Class-Agnostic Concepts [21.9]
異常検出(AD)は、所定の画像の欠陥領域を特定する。最近の研究はADを研究し、異常な画像のないADの学習、長い尾の分散トレーニングデータ、および全てのクラスに統一モデルを用いている。オンラインAD学習も検討されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:35:50 GMT)
Exploring Gender Bias in Large Language Models: An In-depth Dive into the German Language [21.9]
大規模言語モデル(LLM)における性別バイアス評価のためのドイツの5つのデータセットを提案する。データセットは、ジェンダーバイアスというよく確立された概念に基づいており、複数の方法論を通してアクセス可能である。 8種類の多言語 LLM モデルで報告された本研究は,ドイツ語の性差にかかわる独特な課題を明らかにした。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:09:41 GMT)
Energy-Efficient and Real-Time Sensing for Federated Continual Learning via Sample-Driven Control [21.9]
リアルタイムセンシング(RTS)システムは、現実のダイナミクスに適応するために、継続的に知識を取得し、更新し、統合し、適用しなければならない。本稿では,データ分散が人工知能(AI)モデルの性能に与える影響について検討する。本研究では,RTS機能を有するモバイルエッジネットワークを対象としたSCFL(Sample-driven Control for Federated Continual Learning)技術を開発した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:35:04 GMT)
GR-3 Technical Report [21.9]
GR-3は、大規模な視覚言語アクション(VLA)モデルである。抽象概念を含む新しいオブジェクト、環境、命令を一般化する際、例外的な能力を示す。 GR-3は、両手動操作や移動動作を必要とするタスクを含む、長い水平および外接なタスクの処理に長けている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:04:37 GMT)
Enhancing Remote Sensing Vision-Language Models Through MLLM and LLM-Based High-Quality Image-Text Dataset Generation [21.6]
重要な課題は、高品質で大規模な画像テキストペアリングトレーニングデータの不足にある。 RS画像の高品質なテキストキャプションを生成するために,MpGIという2段階の手法を提案する。識別モデルであるCLIPと、画像からテキストへの生成モデルであるCoCaという2つのVLFMをデータセットを用いて微調整した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:54:53 GMT)
DFR: A Decompose-Fuse-Reconstruct Framework for Multi-Modal Few-Shot Segmentation [21.5]
DFR(Decompose, Fuse, Reconstruct)は、マルチモーダルガイダンスを数発のセグメンテーションで効果的に活用するという課題に対処する新しいフレームワークである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:21:32 GMT)
CP-uniGuard: A Unified, Probability-Agnostic, and Adaptive Framework for Malicious Agent Detection and Defense in Multi-Agent Embodied Perception Systems [21.5]
コラボレーティブ・パーセプション(CP)は、マルチエージェント自律運転とマルチエージェントロボットシステムにとって有望な技術であることが示されている。 CPでは、egoエージェントは、その協力者からメッセージを受け取る必要があるため、悪意のあるエージェントからの攻撃に対して脆弱である。我々は、CP-uniGuardという統合された、確率に依存しない、適応的なフレームワークを提案し、その協調ネットワークにおける悪意のあるエージェントを正確に検出し、排除する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:52:44 GMT)
New Mechanisms in Flex Distribution for Bounded Suboptimal Multi-Agent Path Finding [21.3]
MAPF (Multi-Agent Path Finding) は、衝突のない経路の集合を見つける問題である。その目的は、各エージェントの経路コストを、開始位置から目標位置への移動時間として定義するパスコスト(SOC)の総和を最小化することである。 EECBSは、有界-最適MAPFの第一のアルゴリズムであり、ソリューションのSOCは、最大でユーザ指定因子である$w$を最適から遠ざけている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:25:29 GMT)
A Multimodal Deviation Perceiving Framework for Weakly-Supervised Temporal Forgery Localization [21.1]
本研究は,時間的偽造の局所化を弱めるための枠組みを提案する。ビデオレベルのアノテーションのみを使用して、時間的部分的な鍛造セグメントを特定することを目的としている。大規模な実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:55:16 GMT)
Learning to Bid in Non-Stationary Repeated First-Price Auctions [20.9]
第一価オークションはデジタル広告市場で大きな注目を集めている。第一価格オークションにおける最適な入札戦略を決定することはより複雑である。対戦者の最多入札の順序のクラスに対する動的後悔の最小最大最適評価法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:09:24 GMT)
R-Bot: An LLM-based Query Rewrite System [20.9]
本稿では,LLMに基づく問合せ書き換えシステムであるR-Botを提案する。まず,複数ソースのリライトエビデンス作成パイプラインを設計し,クエリリライトエビデンスを生成する。次に,構造解析と意味解析を組み合わせたハイブリッド・セマンティック検索手法を提案する。実世界のデータセットと広く使われているベンチマークに関する包括的な実験を行い、システムの優れた性能を実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:20:40 GMT)
Tell Me Without Telling Me: Two-Way Prediction of Visualization Literacy and Visual Attention [20.9]
視覚データ探索における注意パターンは,参加者のリテラシーレベルと相関することを示す。これらの知見を活用する2つの計算モデル(Lit2SalとSal2Lit)を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:18:45 GMT)
VICI: VLM-Instructed Cross-view Image-localisation [20.8]
UAVM 2025 Challengeには,狭いFOVストリートレベルの画像と対応する衛星画像とのマッチングに焦点を当てたハイパフォーマンスなソリューションが提案されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:13:07 GMT)
VGGT-Long: Chunk it, Loop it, Align it -- Pushing VGGT's Limits on Kilometer-scale Long RGB Sequences [20.7]
VGGT-Long(VGGT-Long)は、モノクローナル3D再構築の限界を、キロスケールで無界の屋外環境に広げるシステムである。 KITTIデータセットとVirtual KITTIデータセットを用いて本手法の評価を行った。結果は、現実の環境でスケーラブルなモノラルな3Dシーンに基礎モデルを活用する可能性を強調している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:39:04 GMT)
Cross-Encoder Rediscovers a Semantic Variant of BM25 [20.7]
そこで本研究では,MiniLMのクロスエンコーダ(Cross-Encoder)バージョンについて検討し,その関連性や格納場所について検討する。従来のBM25のセマンティックなバリエーションを解釈可能な方法で採用し、局所的なコンポーネントを特徴とする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:10:57 GMT)
Accurate and Efficient Fine-Tuning of Quantized Large Language Models Through Optimal Balance [20.7]
大規模言語モデル(LLM)は、様々な領域で素晴らしいパフォーマンスを示している。パラメータ量子化とローランド適応(LoRA)を組み合わせた既存ソリューション QA-BLoRA(Quantization-Aware Fine-tuning with Balanced Low-Rank Adaptation)を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:00:38 GMT)
MultiTaskDeltaNet: Change Detection-based Image Segmentation for Operando ETEM with Application to Carbon Gasification Kinetics [20.5]
MultiTaskDeltaNet(MTDN)は、セグメンテーションタスクを変更検出問題として創造的に再認識する新しいディープラーニングアーキテクチャである。 In-situ Environmental TEM(ETEM)ビデオのデータを用いた評価では、MTDNは従来のセグメンテーションモデルよりも大きな優位性を示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:52:35 GMT)
SciFi-Benchmark: Leveraging Science Fiction To Improve Robot Behavior [20.5]
我々は824のSF文学において重要な瞬間にまたがるベンチマークを生成する。我々は、それぞれのキーモーメントを最先端のLLMで再現し、同様の状況で質問を生成する。モデルが人間の価値とどのように一致しているかの近似を、人間の声による回答のセットで測定する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:13:07 GMT)
CMP: A Composable Meta Prompt for SAM-Based Cross-Domain Few-Shot Segmentation [20.5]
CD-FSS(Cross-Domain Few-Shots)は、限られたデータとドメインシフトのため、依然として困難である。最近のSegment Anything Model (SAM) のような基礎モデルは、一般的なセグメンテーションタスクにおいて顕著なゼロショット一般化能力を示している。 i) セマンティック展開のための参照補完・変換(RCT)モジュール,(ii) 自動メタプロンプト合成のための構成可能メタプロンプト生成(CMPG)モジュール,(iii) ドメインの差分緩和のための周波数認識インタラクション(FAI)モジュールの3つの主要なモジュールを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:42:23 GMT)
FlowEdit: Inversion-Free Text-Based Editing Using Pre-Trained Flow Models [20.5]
事前訓練されたテキスト・トゥ・イメージ(T2I)拡散/フローモデルを用いて実際の画像を編集する場合、しばしば画像が対応するノイズマップに逆転する。本稿では、インバージョンフリー、最適化フリー、モデル非依存のT2Iフローモデルのテキストベースの編集方法であるFlowEditを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:07:56 GMT)
FinResearchBench: A Logic Tree based Agent-as-a-Judge Evaluation Framework for Financial Research Agents [20.4]
FinResearchBenchはロジックツリーベースのエージェント・アズ・ア・ジャッジであり、金融調査エージェントに特化したターゲットである。ファイナンシャル・リサーチ・ドメインにおける7つの重要なタスクの総合的かつ自動評価を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:40:25 GMT)
Probing Ranking LLMs: A Mechanistic Analysis for Information Retrieval [20.4]
我々は、LLMのランク付けにおけるニューロンの活性化を調べるために、探索に基づく分析を用いる。本研究は,語彙信号,文書構造,問合せ文書間相互作用,複雑な意味表現など,幅広い機能カテゴリにまたがる。我々の発見は、より透明で信頼性の高い検索システムを開発するための重要な洞察を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:18:08 GMT)
LLM-Driven Collaborative Model for Untangling Commits via Explicit and Implicit Dependency Reasoning [20.1]
コミット回避のための新しいコラボレーティブコンサルテーションフレームワークであるColaUntangleを提案する。 ColaUntangleは、LLM(Large Language Model)駆動エージェントをマルチエージェントアーキテクチャに統合する。我々は,マルチバージョンプログラム依存グラフ(delta-PDG)を構築し,エージェントが記号深度と意味深度の両方でコード関係を推論できるようにする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:42:13 GMT)
Unveiling the Potential of Segment Anything Model 2 for RGB-Thermal Semantic Segmentation with Language Guidance [20.1]
本稿では,RGB-サーマル知覚のための言語指導によるSAM2のポテンシャルを解放する新しいSAM2駆動型ハイブリッドインタラクションパラダイムを提案する。 ShiFNetは、公開ベンチマークで最先端のセグメンテーション性能を達成し、PST900で89.8%、FMBで67.8%に達した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:20:58 GMT)
laplax -- Laplace Approximations with JAX [20.0]
laplaxはオープンソースのPythonパッケージで、jaxでLaplace近似を実行する。 laplaxは、迅速なプロトタイピングと実験のためのフレキシブルで研究者に優しいフレームワークを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:49:30 GMT)
FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation [19.7]
本稿では,大規模テキスト・ツー・イメージ(T2I)拡散モデルとイメージ・ツー・イメージ(I2I)パラダイムをプラグ・アンド・プレイ方式で適用する,新しい,簡潔かつ効率的なアプローチを提案する。本手法は,周波数帯域のタイプや帯域幅を調整するだけで,参照画像の導出係数と導出強度の両方を柔軟に制御できる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:14:29 GMT)
SVAgent: AI Agent for Hardware Security Verification Assertion [19.4]
本稿では,革新的なSVA自動生成フレームワークであるSVAgentを提案する。 SVAAgentは、元の複雑な要求を構造化され、徐々に解決可能な微細な問題解決チェーンに変換する。実験により、SVAgentは幻覚やランダムな答えの影響を効果的に抑制できることが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:36:06 GMT)
Antithetic Sampling for Top-k Shapley Identification [19.2]
説明可能なAIの内外におけるShapleyの価値は、その公理的な特異性に起因している。ほとんどの研究は、すべての特徴のShapley値の均一な近似を調査し、無意味な特徴のサンプルを不必要に消費する。対照的に、$k$の最も重要な特徴を特定することは、既に十分に洞察に富むものであり、多武装の盗賊の分野と結びついたアルゴリズム的機会を活用する可能性をもたらす。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:31:37 GMT)
Constraint-Aware Feature Learning for Parametric Point Cloud [19.2]
パラメトリック点雲はCAD形状から採取され、工業生産においてますます一般的になりつつある。 CAD固有の深層学習法の多くは幾何学的特徴に重点を置いており、CADの形状に固有の制約を見下ろしている。 3つのコンポーネントによるディープラーニングに優しい制約表現を導入し、制約対応機能学習ネットワーク(CstNet)を設計する。 CstNetは、パラメトリックポイントクラウド分析に適した、制約を意識した最初のディープラーニング手法である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:42:29 GMT)
Memory-Augmented SAM2 for Training-Free Surgical Video Segmentation [18.7]
トレーニング不要なビデオオブジェクトセグメンテーション戦略である Memory Augmented (MA)-SAM2 を導入する。 MA-SAM2は、複雑な楽器の動きから生じる閉塞や相互作用に対して強い堅牢性を示す。 MA-SAM2は追加のパラメータを導入せず、さらなるトレーニングも必要とせず、EndoVis 2017とEndoVis 2018データセットでSAM2よりも4.36%と6.1%のパフォーマンス向上を達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:04:11 GMT)
Test-Time-Matching: Decouple Personality, Memory, and Linguistic Style in LLM-based Role-Playing Language Agent [18.7]
TTM(Test-Time-Matching)は、テスト時間スケーリングとコンテキストエンジニアリングによる、トレーニング不要なロールプレイングフレームワークである。我々のフレームワークは、これらの機能を制御されたロールプレイングに利用する、構造化された3段階生成パイプラインを含んでいる。高忠実なロールプレイングのパフォーマンスを実現し、多様な言語スタイルのシームレスな組み合わせや、個性や記憶のバリエーションも実現している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:47:44 GMT)
Alto: Orchestrating Distributed Compound AI Systems with Nested Ancestry [18.7]
複合AIアプリケーションは、生成言語モデル、ドキュメントレトリバー、埋め込みモデルなどのサブコンポーネントをチェーンする。複合AIシステムにおける並列性やパイプライン化といった従来のシステム最適化の適用は、各コンポーネントに異なる制約があるため、難しい。本稿では,ストリーミングと並列処理による複合AIクエリの自動実行を最適化するフレームワークAltoを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:06:16 GMT)
A Unifying Scheme for Extractive Content Selection Tasks [18.6]
本研究では,テキストインストラクション誘導型コンテンツ選択(IGCS)を,このような設定に有効な統合フレームワークとして提案する。このフレームワークを促進するために,様々なコンテンツ選択タスクをカバーする最初の統一ベンチマークであるigcsbenchを紹介する。また、多様なコンテンツ選択タスクに活用可能な、大規模な総合的な合成データセットも作成します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:02:54 GMT)
A High Magnifications Histopathology Image Dataset for Oral Squamous Cell Carcinoma Diagnosis and Prognosis [18.5]
Multi-OSCCは口腔扁平上皮癌1,325例からなる新しい病理組織像データセットである。 x200,x400,x1000倍率の6つの高分解能組織像を呈し,コアとエッジの腫瘍領域を2倍率で観察した。このデータセットは、再発予測(REC)、リンパ節転移(LNM)、腫瘍分化(TD)、腫瘍浸潤(TI)、硬膜外浸潤(PI)の6つの重要な臨床的タスクに対して豊富に注釈付けされている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:48:45 GMT)
Gemini 2.5 Pro Capable of Winning Gold at IMO 2025 [18.3]
大規模言語モデル(LLM)は、AIMEのような数学的なベンチマークでうまく機能するが、オリンピアードレベルのタスクと競合する。新たにリリースされたIMO 2025問題では、GoogleのGemini 2.5 Proを使って、データの汚染を避けています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:49:50 GMT)
ADCD-Net: Robust Document Image Forgery Localization via Adaptive DCT Feature and Hierarchical Content Disentanglement [18.3]
ADCD-Netは、RGB/DCT法定トレースを適応的に活用する頑健な文書フォージェリーローカライゼーションモデルである。提案するADCD-Netは,5種類の歪みの平均値が20.79%向上し,より優れたフォージェリーローカライゼーション性能を示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:48:23 GMT)
PUSA V1.0: Surpassing Wan-I2V with $500 Training Cost by Vectorized Timestep Adaptation [18.2]
Pusaは、一貫したビデオ拡散フレームワーク内で微細な時間的制御を可能にする、画期的なパラダイムである。 We set a new standard for image-to-video (I2V) generation, to achieve a VBench-I2V total score 87.32%。この研究は、次世代のビデオ合成のためのスケーラブルで効率的で多用途なパラダイムを確立する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:09:37 GMT)
Deliberative Searcher: Improving LLM Reliability via Reinforcement Learning with constraints [18.1]
提案するtextbfDeliberative Searcher は,探索に基づくオープンドメイン質問応答の検索と確実なキャリブレーションを統合した最初のフレームワークである。このエージェントはウィキペディアのデータに対して多段階のリフレクションと検証を行い、ソフトな信頼性制約の下で精度を最適化する強化学習アルゴリズムで訓練される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:09:34 GMT)
Unreal is all you need: Multimodal ISAC Data Simulation with Only One Engine [17.9]
Great-Xは、Unreal Engine内のSionnaのレイトレーシングを再構築する、シングルエンジンのマルチモーダルデータツインプラットフォームである。我々は、オープンソースの、大規模、低高度のUAVマルチモーダル合成データセット、Great-MSDを構築した。本稿では,CSI をベースとした UAV 3D ローカライゼーションアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:28:32 GMT)
ROADWork Dataset: Learning to Recognize, Observe, Analyze and Drive Through Work Zones [17.9]
作業ゾーンを認識し,観察し,分析し,運転するROADWorkデータセットを提案する。私たちのデータセットの微調整モデルは、ワークゾーンにおける知覚とナビゲーションを大幅に改善します。作業ゾーンのビデオから,ナビゲーションの目標を予測し,予測可能な経路を計算する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:55:25 GMT)
Choosing Coordinate Forms for Solving ECDLP Using Shor's Algorithm [17.8]
Shorのアルゴリズムは楕円曲線離散問題(ECDLP)を時間内に解く能力でよく知られている。本研究により, 射影座標はショア法を用いてCDLPに取り組む際に, アフィン座標と同等の利点を示さないことが明らかとなった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:00:45 GMT)
Depth Gives a False Sense of Privacy: LLM Internal States Inversion [17.6]
大きな言語モデル(LLM)は、日々のルーチンにますます統合されていますが、プライバシと安全性の懸念を生じさせています。近年の研究では、データの局所性を確保するために、初期層推論をアウトソースする協調推論が提案されている。逆入力の意味的類似性とトークンマッチング率を大幅に向上させる4つの逆攻撃を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:15:11 GMT)
Identifying Pre-training Data in LLMs: A Neuron Activation-Based Detection Framework [17.4]
大規模言語モデル(LLM)のパフォーマンスは、著作権のある資料やプライベート情報を含むトレーニングデータと密接に結びついている。 LLMにおけるトレーニングデータと非トレーニングデータの差分ニューロン活性化パターンを解析する新しいアルゴリズムであるNA-PDDを導入する。また、厳密なデータ変換を用いて、トレーニングデータと非トレーニングデータ間の一貫した時間分布を確保するための、時間的偏りのないベンチマークであるCCNewsPDDを導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:05:30 GMT)
PromptAL: Sample-Aware Dynamic Soft Prompts for Few-Shot Active Learning [17.3]
アクティブラーニング(AL)は、モデルトレーニングを最適化し、ラベル付けに最も有用なサンプルを選択することでアノテーションコストを削減することを目的としている。我々は、textbfPromptAL(Few-Shot textbfActive textbfL用のSample-Aware Dynamic Soft textbfPrompts)と呼ばれるハイブリッドALフレームワークを提案する。このフレームワークは、現在の経験的分布とターゲット分布との整合性において、ラベルのない各データポイントの寄与を考慮に入れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:17:42 GMT)
Learning Temporal Abstractions via Variational Homomorphisms in Option-Induced Abstract MDPs [17.3]
大規模言語モデル(LLMs)は、明示的なChain-of-Thoughtプロンプトを通じて、顕著な推論能力を示している。モデルがすべてのステップに対して明示的なテキストを生成することなく、潜在空間で"考え"する、効率的で暗黙的な推論のためのフレームワークを開発する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:22:58 GMT)
Online Episodic Memory Visual Query Localization with Egocentric Streaming Object Memory [17.3]
モデルがオンラインストリームを処理するタスクであるVisual Online 2D(OVQ2D)を導入し、各フレームを一度だけ観察し、完全なビデオ履歴ではなく、コンパクトなメモリを用いてオブジェクトのローカライゼーションを検索する。他のオンラインアプローチよりもESOMビデオの方が優れていることを実証していますが、OVQ2Dは依然として挑戦的であり、最高のパフォーマンスはわずか4%の成功です。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:45:31 GMT)
Quality Text, Robust Vision: The Role of Language in Enhancing Visual Robustness of Vision-Language Models [17.3]
頑健な微調整のための既存の敵の訓練手法は、視覚的堅牢性を高める上での言語の役割を概ね見落としている。本研究では,QT-AFT(Quality Text-guided Adversarial Fine-Tuning)を提案する。 QT-AFTは、16のゼロショットデータセットで評価された、最先端のゼロショット対向ロバスト性とクリーンな精度を達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:13:30 GMT)
A Multi-granularity Concept Sparse Activation and Hierarchical Knowledge Graph Fusion Framework for Rare Disease Diagnosis [17.1]
本稿では,多粒度スパース活性化と階層的知識グラフを組み合わせたフレームワークを提案する。提案手法では,4つの相補的マッチングアルゴリズムと多様性制御,および正確な概念活性化のための5段階のフォールバック戦略を用いる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:23:04 GMT)
FLLIC: Functionally Lossless Image Compression [16.9]
機能的ロスレス画像圧縮(FLLIC)と呼ばれる,関節の認知と圧縮の新しいパラダイムを提案する。 FLLICは雑音画像の調音・圧縮における最先端性能を実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:05:23 GMT)
Technical report: Impact of Duration Prediction on Speaker-specific TTS for Indian Languages [16.8]
本研究では,非自己回帰型連続正規化フロー(CNF)に基づく音声モデルを,公開言語データを用いて学習する。ゼロショット・話者固有生成のための複数の継続時間予測戦略を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:38:30 GMT)
Toward a Lightweight and Robust Design for Caching with Predictions [16.7]
textscGuardは軽量なロバスト化フレームワークで、学習強化型キャッシュアルゴリズムの堅牢性を2H_k + 2$に向上させる。 textscGuardは、一貫性と堅牢性の間の、現在のよく知られたトレードオフを実現している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:26:28 GMT)
Experience is the Best Teacher: Grounding VLMs for Robotics through Self-Generated Memory [16.5]
本稿では,視覚言語モデル(VLM)を現実体験の自己生成記憶を構築することで,ロボットに基盤付ける枠組みを提案する。 ExpTeachでは、VLMは自律的にアクションを計画し、結果を検証し、失敗を反映し、クローズドループでロボットの動作に適応する。実験では、4つの困難なロボット作業において、リフレクションは成功率を36%から84%に改善することを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:48:49 GMT)
Hierarchical Reasoning Model [16.2]
HRMは、中間プロセスの明示的な監督なしに、1つのフォワードパスでシーケンシャルな推論タスクを実行する。 2700万のパラメータしか持たず、HRMは1000のトレーニングサンプルのみを使用して複雑な推論タスクで例外的なパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:45:57 GMT)
Revisiting Randomization in Greedy Model Search [16.2]
特徴サブサンプリングによってランダム化される欲求前方選択推定器のアンサンブルを提案し,解析する。計算効率を大幅に向上させる動的プログラミングに基づく新しい実装を設計する。ランダム化アンサンブルが縮小と類似しているという一般的な信念とは対照的に、トレーニングエラーと自由度を同時に低減できることが示される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:23:35 GMT)
Beyond Label Semantics: Language-Guided Action Anatomy for Few-shot Action Recognition [16.1]
Few-shot Action Recognition (FSAR)は、ビデオ内の人間のアクションを分類することを目的としており、カテゴリごとにラベル付けされた少数のサンプルのみである。ラベルセマンティクスを超えた新しいフレームワークであるLGA(Language-Guided Action Anatomy)を提案する。テキストでは、既製のLCMにラベルをアトミックな動作記述のシーケンスに解剖するよう促す。ビデオの場合、Visual Anatomy Moduleはアクションをアトミックビデオフェーズにセグメントし、アクションのシーケンシャルな構造をキャプチャする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:16:25 GMT)
Streamlining Prediction in Bayesian Deep Learning [16.1]
本研究は, サンプリング不要な単一前方通過によるBDLの合理化予測について検討する。我々は、後続の予測分布に対する近似を解析的に計算する。本稿では,ViT や GPT-2 などのトランスフォーマーにアプローチを示し,その性能を回帰および分類タスクで評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:42:17 GMT)
Benchmarking LLM Privacy Recognition for Social Robot Decision Making [15.8]
ソーシャルロボット(Social Robot)は、人間のコミュニケーション規範に従って人間と対話するエンボディエージェントである。本研究では,家庭社会ロボットの文脈において,既成のLLMがどの程度プライバシに意識されているかを検討する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:36:59 GMT)
USP: Unified Self-Supervised Pretraining for Image Generation and Understanding [15.7]
Unified Self-supervised Pretraining (USP) は、変分オートエンコーダ(VAE)潜時空間におけるマスク付き潜時モデリングにより拡散モデルを初期化するフレームワークである。 USPは、拡散モデルの収束速度と生成品質を大幅に改善しながら、理解タスクにおいて同等のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:51:02 GMT)
Evaluating Intermediate Reasoning of Code-Assisted Large Language Models for Mathematics [15.7]
我々は,コード支援型LCM生成プログラムを,数理推論タスクに応答して詳細に解析する。この結果から, モデルの性能が, 問題の解法として実装された論理に大きく影響していることが示唆された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:52:51 GMT)
Multimodal Forecasting of Sparse Intraoperative Hypotension Events Powered by Language Model [14.7]
術中低血圧 (IOH) は全身麻酔下で頻繁に発生し, 心筋損傷や死亡率の増加などの副作用と強く関連している。その重要性にもかかわらず、IOH予測はイベントのばらつきと、さまざまな患者にまたがる静的データと動的データを統合することの難しさによって妨げられている。スパース低血圧事象を正確に識別し識別する多モーダル言語モデルフレームワークである textbfIOHFuseLM を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:34:56 GMT)
Graph Neural Networks Gone Hogwild [14.7]
グラフニューラルネットワーク(GNN)は、分散分散分散マルチエージェントシステムにおけるエージェントの状態表現を学習する強力なツールであるように見える。 GNNは、推論中にノードが非同期に更新されると、破滅的に誤った予測を生成する。我々は、GNNを、非同期な"hogwild"推論に対して確実に堅牢なアーキテクチャのクラスとして識別する。我々は「エネルギーGNN」と呼ばれる暗黙的に定義されたGNNアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:42:16 GMT)
DCG-SQL: Enhancing In-Context Learning for Text-to-SQL with Deep Contextual Schema Link Graph [14.6]
本稿では,実演を効果的に検索し,クエリを生成する新しい手法を提案する。質問とデータベースのスキーマ項目のキー情報と関連性を含むDeep Contextual Link Graphを構築した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:42:57 GMT)
Curve-Aware Gaussian Splatting for 3D Parametric Curve Reconstruction [14.6]
本稿では,多視点エッジマップから直接3次元パラメトリック曲線を再構成するためのエンドツーエンドフレームワークを提案する。パラメトリック曲線とエッジ指向ガウス成分の双方向結合機構を提案する。提案手法は,既存の手法に比べて高い効率と優れた性能を達成し,トレーニング中のパラメータ数を著しく削減する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:42:46 GMT)
LoRA is All You Need for Safety Alignment of Reasoning LLMs [14.6]
本稿では,SFT に LoRA を使用すれば,その推論能力を損なうことなく,安全のためにモデルを効果的に整列させることができることを示す。これは、安全ウェイト更新を低ランク空間に制限することは、推論ウェイトとの干渉を最小限にするからである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:25:16 GMT)
MPO: An Efficient Post-Processing Framework for Mixing Diverse Preference Alignment [14.5]
Mixing Preference Optimization (MPO)は、単一目的ポリシーを集約するための後処理フレームワークである。 MPOは様々な好みにまたがるバランスの取れた性能を実現し、計算コストを大幅に削減した既存モデルより優れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:25:08 GMT)
Test-time Prompt Refinement for Text-to-Image Models [14.5]
我々は、TIRと呼ばれる基礎となるT2Iモデルの追加トレーニングを必要としないテスト時間プロンプトリファインメントフレームワークを導入する。提案手法では,各生成ステップに続いて,事前訓練されたマルチモーダル大言語モデル(MLLM)が出力画像とユーザのプロンプトを解析する。このクローズドループ戦略は、ブラックボックスT2Iモデルとのプラグアンドプレイ統合を維持しながら、複数のベンチマークデータセット間のアライメントと視覚的コヒーレンスを改善することを実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:30:13 GMT)
LSSGen: Leveraging Latent Space Scaling in Flow and Diffusion for Efficient Text to Image Generation [14.4]
合成を高速化するための一般的な戦略は、低分解能で早期に復調を行うことである。ピクセル空間におけるダウンスケールとアップスケールの伝統的な手法は、しばしばアーティファクトや歪みをもたらす。本稿では,bf遅延空間スケーリング生成(LSSGen)を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:05:21 GMT)
Should Bias Always be Eliminated? A Principled Framework to Use Data Bias for OOD Generation [14.3]
本稿では, 推論中の不変表現を補うために, バイアスを戦略的に活用する新しいフレームワークを提案する。我々は、合成データセットと標準領域一般化ベンチマークの両方の実験を通して、我々のアプローチを検証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:17:48 GMT)
Adaptive Graph Pruning for Multi-Agent Communication [14.2]
大規模言語モデル(LLM)に基づくマルチエージェントシステムは,様々なタスクにおいて顕著な性能を示した。本稿では,タスク適応型マルチエージェント協調フレームワークであるAdaptive Graph Pruning (AGP)を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:10:04 GMT)
CompLeak: Deep Learning Model Compression Exacerbates Privacy Leakage [14.2]
我々は3つの広く使用されている圧縮構成を調べる最初のプライバシリスクフレームワークであるCompLeakを提案する。 CompLeakには3つのバリエーションがあり、圧縮されたモデルとオリジナルのモデルの数にアクセスできる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:02:46 GMT)
SPACT18: Spiking Human Action Recognition Benchmark Dataset with Complementary RGB and Thermal Modalities [14.2]
スパイクカメラ、バイオインスパイアされた視覚センサー、各ピクセルに光強度を蓄積して非同期に発火し、例外的な解像度のスパイクを提供する。この研究は、エネルギー効率、超低消費電力のビデオ理解、特にスパイクベースのデータを用いた行動認識の研究を促進するデータセットに貢献する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:59:14 GMT)
One-Shot Affordance Grounding of Deformable Objects in Egocentric Organizing Scenes [13.7]
ロボット工学における変形可能なオブジェクト操作は、コンポーネント特性の不確かさ、多様な構成、視覚的干渉、曖昧なプロンプトなどによる重大な課題を呈している。自己中心型組織シーンにおける変形性物体のワンショット強調グラウンド(OS-AGDO)の新たな手法を提案する。実験結果から,本手法は最先端手法よりも有意に優れていることが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:51:33 GMT)
Differentially Private Set Representations [13.6]
本研究では,大宇宙からの大きさの集合を$k$で表すために,差分プライベート(DP)機構の問題を考察する。最初の構成では、$(epsilon,delta)$-DP表現を生成し、エラー確率は1/(eepsilon + 1)$で、少なくとも1.05 k epsilon cdot log(e)$ bitsで空間を使用する。また、最大$k epsilon cdot log(e)$ bitsの空間を用いて、同じエラーを持つ純粋な$epsilon$-DP表現のための第2のアルゴリズムも提示する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:29:03 GMT)
Synthetic Data Matters: Re-training with Geo-typical Synthetic Labels for Building Detection [13.6]
対象地域の都市配置に合わせた合成データを用いて,テスト時に再学習モデルを提案する。対象地域の都市構造を忠実に再現する地球型合成データを生成する。実験では、ドメインギャップに応じて、パフォーマンスが大幅に向上し、中央値の12%が改善された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:53:13 GMT)
A computational transition for detecting correlated stochastic block models by low-degree polynomials [13.4]
2つの相関ブロックモデル $mathcalS(n,tfraclambdan;k,epsilon;s)$ を共通の親ブロックモデル $mathcalS(n,tfraclambdan;k,epsilon)$ からサブサンプリングする。このモデルを一対の独立した ErdHos'enyi グラフと区別する検出問題に対して、隣接点のエントリのエンブロー度に基づくテストに焦点をあてる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:52:19 GMT)
Disability Across Cultures: A Human-Centered Audit of Ableism in Western and Indic LLMs [13.4]
大規模言語モデル(LLM)は、オンラインヘイトを識別し緩和するためにますます使われています。オンラインアクティビズムに関するほとんどの研究は、西洋のAIモデルを用いた西洋の聴衆に焦点を当てている。これらのモデルは、インドのような西欧以外の地域で、有能な損害を認識するために適切に装備されているか?
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:51:41 GMT)
Q-Frame: Query-aware Frame Selection and Multi-Resolution Adaptation for Video-LLMs [13.3]
適応型フレーム選択とマルチテンポラリスケーリングのための新しいアプローチであるビデオQFrameを紹介する。 Q-Frameは、CLIPのようなテキスト画像マッチングネットワークによって生成されたトレーニング不要のプラグイン・アンド・プレイ戦略を採用している。ベンチマークデータセットの広範な実験を通じて,Q-Frameの有効性を実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:42:31 GMT)
Faithful, Interpretable Chest X-ray Diagnosis with Anti-Aliased B-cos Networks [13.3]
B-cosネットワークは、標準線形層を重み入力アライメント機構で置き換えることで、有望なソリューションを提供する。標準的なB-cosモデルは、説明地図の深刻なエイリアスに悩まされ、臨床用途には適さない。 FLCing (FLC) とBlurPool (BP) を用いたアンチエイリアス戦略を導入し, 説明品質を大幅に改善した。マルチラベル分類をサポートするために,B-cosネットワークを拡張した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:56:02 GMT)
Evaluating Uncertainty and Quality of Visual Language Action-enabled Robots [13.3]
ロボット操作タスクのためのVLAモデルに特化して設計された8つの不確実性指標と5つの品質指標を提案する。我々は,3つの最先端VLAモデルから908のタスク実行を成功させる大規模実証実験により,その有効性を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:15:59 GMT)
A Single-step Accurate Fingerprint Registration Method Based on Local Feature Matching [13.2]
指紋画像の歪みは指紋認識性能の低下につながる。 2つの指紋を整列するエンドツーエンドの指紋登録アルゴリズムを提案する。実験結果から,本手法は1ステップの登録だけで,最先端のマッチング性能を達成できることが証明された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:29:46 GMT)
Talking Like a Phisher: LLM-Based Attacks on Voice Phishing Classifiers [13.2]
大規模言語モデル (LLM) は、逆ビッシング文字を生成するために利用される。我々は,迅速なエンジニアリングとセマンティックな難読化を利用する,系統的なアタックパイプラインを構築した。 LLM生成転写産物はMLに基づく分類器に対して実用的かつ統計的に有効であることが明らかとなった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:26:49 GMT)
GASPnet: Global Agreement to Synchronize Phases [13.1]
トランスフォーマーアーキテクチャは、キーとクエリ間の合意に基づいて、ネットワーク内の情報の選択とルーティングを行う。本稿では、トランスフォーマーの注意操作の側面と魅力的な神経科学理論、すなわち同期による結合を結合する新しいメカニズムを提案する。その結果,CNNネットワークよりも精度が向上し,ノイズに対する堅牢性が向上し,一般化能力も向上した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:10:33 GMT)
Improving Code LLM Robustness to Prompt Perturbations via Layer-Aware Model Editing [13.1]
大規模言語モデル(LLM)は、急激な摂動に対して非常に敏感である。ターゲットパラメータの更新によってLCMの堅牢性を高める新しいアプローチであるCREMEを導入する。実験の結果,CREMEは摂動プロンプトでPass@1の精度を63%向上することがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:57:55 GMT)
ToFe: Lagged Token Freezing and Reusing for Efficient Vision Transformer Inference [13.0]
そこで我々は,各段階で重要なトークンを識別し,重要でないトークンを一時的に凍結する新しいToken Freezing and Reusingフレームワークを紹介した。 ToFeは、トップ1精度の2%以下でLV-ViTモデルの計算コストを50%削減する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:17:44 GMT)
Autonomous Data Selection with Zero-shot Generative Classifiers for Mathematical Texts [12.9]
本稿では,高品質な数学的テキストを自動的にキュレートする自動データ選択(AutoDS)を提案する。人間のアノテーションや専用のデータフィルタのトレーニングを必要とする従来のアプローチとは異なり、AutoDSはモデルのロジットのみに依存する。我々は、自動ドメイン固有データキュレーションの今後の研究を容易にするために、キュレートされたAutoMathTextデータセットをリリースする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:17:48 GMT)
A Human-Centered Approach to Identifying Promises, Risks, & Challenges of Text-to-Image Generative AI in Radiology [12.9]
私たちは、責任あるモデル開発に対する人間中心のアプローチを開発します。我々は,医学生,放射線学研修生,放射線技師の立場から,テキスト・トゥ・CTスキャン・ジェネシスが医学教育,訓練,実践において果たす役割を明らかにする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:53:25 GMT)
Prototype-Guided Pseudo-Labeling with Neighborhood-Aware Consistency for Unsupervised Adaptation [12.8]
CLIPのような視覚言語モデルに対する教師なし適応では、ゼロショット予測からの擬似ラベルは大きなノイズを示すことが多い。本稿では,プロトタイプの整合性と近傍の整合性を統合することで,CLIPの適応性能を向上させる適応型擬似ラベルフレームワークを提案する。提案手法は、教師なし適応シナリオにおける最先端性能を実現し、計算効率を維持しつつ、より正確な擬似ラベルを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:08:24 GMT)
Towards Robust Foundation Models for Digital Pathology [12.7]
本研究は,非生物学的特徴に対するFMロバスト性に関する最初の系統的研究である。 PathoROBは3つの新しいメトリクスを持つロバストネスベンチマークである。その結果,非破壊的FM表現は下流の誤診や臨床症状の原因となることが判明した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:51:53 GMT)
Spatial 3D-LLM: Exploring Spatial Awareness in 3D Vision-Language Models [12.5]
新しい時代は、大規模言語モデル(LLM)を拡張して3Dビジョン言語タスクに取り組むという、エキサイティングな可能性を解き放ちました。本研究では,3次元視覚言語タスクの空間認識を高めるために設計された3次元MLLMであるSpatial 3D-LLMを提案する。本稿では,3次元物体距離計測と3次元レイアウト編集の2つの新しいタスクを紹介し,モデルの空間認識能力を評価するために3次元命令データセットであるMODELを構築した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:32:35 GMT)
Compatibility of Max and Sum Objectives for Committee Selection and $k$-Facility Location [12.4]
各クライアントが選択した施設への距離の和または最大を最小化しようとする4つの異なる目的について検討する。一度に1つの目標を最適化するのではなく、これらの目標が相互にどのように互換性があるかを調査する。この結果から,施設群や代表委員会を選定する場合,複数の目的に適するソリューションを同時に構築することが可能であることが示唆された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:47:35 GMT)
SAGE: A Visual Language Model for Anomaly Detection via Fact Enhancement and Entropy-aware Alignment [12.4]
VLM(Vision-Language Models)は、しばしば産業の異常検出と推論に苦しむ。 SAGEは、自己ガイドFact Enhancement (SFE)とEntropy-aware Direct Preference Optimization (E-DPO)を通じて、異常推論を強化するVLMベースのフレームワークである。 SAGEはゼロショットおよびワンショット設定下での産業異常データセット上での優れたパフォーマンスを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:11:41 GMT)
WakenLLM: A Fine-Grained Benchmark for Evaluating LLM Reasoning Potential and Reasoning Process Stability [12.3]
大規模言語モデル(LLM)は、しばしばラベルemphUnknownを出力するが、現在の評価は、そのような答えがなぜ発生するかというよりも、真正であるかどうかにのみ焦点を絞っている。これは、2つの異なるケースを曖昧にする: (i) 真に不確定な入力と (ii) モデルが解けない解決可能な問題である。本研究では,emphUnknown応答の比率をモデル能力に寄与するフレームワークを導入し,誘導刺激がそれらを正しい(emphKnown)あるいは本質的に不確定な結果に変換することができるかどうかを検証した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:21:48 GMT)
GraspDiffusion: Synthesizing Realistic Whole-body Hand-Object Interaction [12.3]
最近の生成モデルは高品質な画像を合成できるが、しばしば手を使って物体と相互作用する人間の生成に失敗する。本稿では,人間と物体の相互作用の現実的なシーンを生成する新しい生成法であるGraspDiffusionを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:28:06 GMT)
GeoFlow-SLAM: A Robust Tightly-Coupled RGBD-Inertial and Legged Odometry Fusion SLAM for Dynamic Legged Robotics [12.0]
GeoFlow-SLAMは、攻撃的かつ高周波な動作を行うロボティクスのための堅牢で効果的なRGBD慣性SLAMである。本手法は,テクスチャレスシーンにおける特徴マッチングと視覚的特徴障害の3つの重要な課題に対処する。提案アルゴリズムは,収集した脚ロボットとオープンソースデータセット上で,最先端のSOTA(State-of-the-art)を実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:30:03 GMT)
AMMNet: An Asymmetric Multi-Modal Network for Remote Sensing Semantic Segmentation [11.9]
Asymmetric Multi-Modal Network (AMMNet) は、RGB-DSM入力ペアに適した3つの設計で堅牢なセグメンテーションを実現する新しい非対称アーキテクチャである。 AMMNetは、計算とメモリの要求を低減しつつ、マルチモーダルネットワーク間の最先端のセグメンテーション精度を実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:07:19 GMT)
A DPI-PAC-Bayesian Framework for Generalization Bounds [11.9]
我々は、DPI-PAC-Bayesianを略した統一データ処理不等式PAC-Bayesianフレームワークを開発した。我々は、R'enyiの発散と、データ非依存の事前分布とアルゴリズム依存の後続分布との間で測定された任意の$f$-divergenceの両値に対して、二項Kulback-Leibler一般化ギャップの明示的境界を求める。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:47:15 GMT)
Efficient Strategy Learning by Decoupling Searching and Pathfinding for Object Navigation [11.8]
オブジェクトナビゲーションのための2段階リワード機構(TSRM)は、エピソード内の探索とパスフィニングの動作を分離する。また,Depth Enhanced Masked Autoencoders (DE-MAE) の事前学習手法を提案する。さらに,探索経路長(SSSPL)を重み付けした探索成功度尺度を提案し,エージェントの探索能力と探索効率を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:17:30 GMT)
Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning [11.8]
本稿では,大規模言語モデルのファミリーであるスレッド推論モデル(TIM)と,推論ランタイムであるTIMRUNを提案する。 TIMRUNにホストされたTIMは、単一の言語モデル推論内で、事実上無制限のワーキングメモリとマルチホップツールコールをサポートする。我々は,GPUメモリ上で最大90%のKVキャッシュを動作させる場合でも,高い推論スループットを保っていることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:30:04 GMT)
SpiroLLM: Finetuning Pretrained LLMs to Understand Spirogram Time Series with Clinical Validation in COPD Reporting [11.8]
COPDは気流制限が持続する主要な慢性呼吸器疾患である。 COPD診断のための現在のAIモデルは、分類結果の出力に限られている。スピロLLMは,スピログラムを理解可能な最初のマルチモーダル大言語モデルである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:44:12 GMT)
From Flat to Round: Redefining Brain Decoding with Surface-Based fMRI and Cortex Structure [11.8]
人間の脳活動(例えばfMRI)から視覚刺激を再構築することは神経科学とコンピュータビジョンを橋渡しする。球面上の空間的コヒーレントな2次元球面データとしてfMRI信号を明示的にモデル化する新しいスフィア・トークンーザを提案する。また、構造MRIデータの統合も提案し、個々の解剖学的変動をパーソナライズした符号化を可能にする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:34:39 GMT)
Mangosteen: An Open Thai Corpus for Language Model Pretraining [11.7]
既存の大規模コーパスは英語や言語に依存しないパイプラインに依存している。 Mangosteen: タイのDolmaパイプラインを通じて構築された47億のタイ語対応コーパスを紹介します。パイプライントリムを202万から2500万のドキュメントにまとめた上で,SEA-HELM NLGを3から11に引き上げた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:22:35 GMT)
VulCoCo: A Simple Yet Effective Method for Detecting Vulnerable Code Clones [11.7]
VulCoCoは、脆弱なコードクローンを検出する軽量でスケーラブルなアプローチである。まず、様々なクローンタイプにまたがる合成ベンチマークを構築します。我々の実験によると、VulCoCoは精度@kと平均精度(MAP)で最先端の手法よりも優れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:54:57 GMT)
Self-Correcting Code Generation Using Small Language Models [11.4]
自己補正は、言語モデルが連続的な改善を通じて出力を修正および改善できるようにすることで、コード生成の可能性を実証している。マルチターンコード修正のための小型言語モデルの能力向上を目的としたアプローチであるCoCoSを紹介する。 1Bスケールのモデルでは、CoCoSはMBPPで35.8%、HumanEvalで27.7%の改善を実現している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:35:58 GMT)
Recurrent Inference Machine for Medical Image Registration [11.4]
本稿では,リカレント推論画像登録(RIIR)ネットワークと呼ばれる新しい画像登録手法を提案する。 RIIRは、メタラーニングによる登録問題の解法として反復的に定式化される。実験の結果、RIIRはトレーニングデータの5%しか持たない深層学習法よりも優れていた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:10:44 GMT)
Reinforce Lifelong Interaction Value of User-Author Pairs for Large-Scale Recommendation Systems [11.3]
本稿では,UAペア間の相互作用に基づいて,ユーザ-認証ペアのライフサイクルインタラクション値(RLIV-UA)の強化にRLを導入する。オフライン実験とオンラインA/Bテストでは、RLIV-UAモデルは比較手法よりも高いユーザ満足度と高いプラットフォーム利益を達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:58:55 GMT)
Lande g-factor measurements for the 5d6s 3D2 hyperfine levels of 176Lu+ [11.2]
5d6sの5d6sの3$D$$超微細度が176$Lu$+$のときのLande g-factorsの測定を5～7$の分数的不正確性に対して報告する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:27:55 GMT)
PRAC3 (Privacy, Reputation, Accountability, Consent, Credit, Compensation): Long Tailed Risks of Voice Actors in AI Data-Economy [11.2]
本稿では,強制的制約を伴わない音声の合成複製が,個人を様々な脅威に晒す方法を明らかにする。本稿では,プライバシ,評価,説明責任,同意,信用,補償を合成音声経済におけるデータ柱として活用するPRAC3フレームワークを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:39:39 GMT)
VL-CLIP: Enhancing Multimodal Recommendations via Visual Grounding and LLM-Augmented CLIP Embeddings [11.2]
マルチモーダル学習は今日,eコマースレコメンデーションプラットフォームにおいて重要な役割を担っている。 CLIPのような既存のビジョン言語モデルは、eコマースレコメンデーションシステムにおいて重要な課題に直面している。視覚的理解のきめ細かな理解のためにVisual Groundingを統合することにより,CLIPの埋め込みを強化するフレームワークであるVL-CLIPを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:45:43 GMT)
Latent Space Alignment for AI-Native MIMO Semantic Communications [11.2]
本稿では,意味コミュニケーションにおける意味的ミスマッチに対処する新しい手法を提案する。ニューラルネットワークベースのモデルは、電力予算と複雑さの制約の下でセマンティックプリコーダ/デコーダを学ぶ。目的指向のセマンティックコミュニケーションシナリオにおいて,提案手法の有効性を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:16:18 GMT)
Unsupervised Joint Learning of Optical Flow and Intensity with Event Cameras [11.1]
イベントカメラは、シーンの外観に関する情報を得るために動きに依存している。本稿では,単一ネットワークを用いた光フロー(動き)と画像強度(出現)を共同で推定する教師なし学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:55:19 GMT)
Can LLMs Generate Reliable Test Case Generators? A Study on Competition-Level Programming Problems [11.1]
大規模言語モデル(LLM)は、推論中に複雑なタスクに対処できるコード生成において顕著な能力を示している。テストケースジェネレータ(LLM生成)のベンチマークであるTCGBenchを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:07:10 GMT)
Livatar-1: Real-Time Talking Heads Generation with Tailored Flow Matching [11.1]
Livatarはリアルタイム音声駆動音声ヘッドビデオ生成フレームワークである。 HDTFデータセット上の8.50 LipSync Confidenceで、競争力のあるリップシンク品質を実現する。スループットは141 FPSに達し、1つのA10 GPU上でエンドツーエンドのレイテンシは0.17秒である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:02:29 GMT)
Budget Allocation Policies for Real-Time Multi-Agent Path Finding [11.1]
リアルタイムMAPFは、計画と実行がインターリーブされる現実的なMAPFセットアップを具現化する。 RT-MAPFの既存のソリューションは、計画期間毎にMAPFアルゴリズムのウィンドウバージョンを反復的に呼び出す。標準MAPFアルゴリズムのウィンドウ化バージョンにおける計画予算の配分について検討する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:32:55 GMT)
One Polyp Identifies All: One-Shot Polyp Segmentation with SAM via Cascaded Priors and Iterative Prompt Evolution [11.0]
本稿では,1つの注釈付き画像からプロンプトを自動的に生成する,SAMに基づくワンショットポリープセグメンテーションフレームワークOP-SAMを提案する。本手法では,意味的ラベル伝達のための相関ベース事前生成(CPG)と,ポリプサイズに適応するためのスケールカスケード事前融合(SPF)を導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:19:56 GMT)
MMS Player: an open source software for parametric data-driven animation of Sign Language avatars [11.0]
MMS-Playerは、MMS(MultiModal Signstream)と呼ばれる新しい手話表現フォーマットから手話アニメーションを合成することができる。 MMSは、記号、タイミング、および屈折の並行実行に関する情報を追加することで、光沢ベースの表現を強化する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:06:13 GMT)
Explicit Context Reasoning with Supervision for Visual Tracking [11.0]
RSTrackは3つのコアメカニズムを通じてコンテキスト推論を明示的にモデル化し、監督する。実験の結果,RSTrackは複数のベンチマークデータセット上で最先端のパフォーマンスを実現することがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:07:50 GMT)
Routine: A Structural Planning Framework for LLM Agent System in Enterprise [11.0]
エンタープライズ環境におけるエージェントシステムの展開は、しばしばいくつかの課題によって妨げられる。一般的なモデルは、ドメイン固有のプロセス知識が欠如し、非組織的な計画、主要なツールの欠如、実行の安定性が低下します。本稿では、明確な構造、明示的な命令、シームレスなパラメータパッシングを備えたマルチステップエージェント計画フレームワークであるRuleineを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:01:32 GMT)
ResidualPlanner+: a scalable matrix mechanism for marginals and beyond [11.0]
ノイズの限界は、データリリースを保護する一般的な形式の機密性である。本稿ではResidualPlannerとResidualPlanner+という2つの高度にスケーラブルな行列機構を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:43:11 GMT)
An effective physics-informed neural operator framework for predicting wavefields [10.9]
我々はヘルムホルツ方程式を効率的に解くために物理インフォームド畳み込みニューラル演算子(PICNO)を導入する。 PICNOは、均質媒質と速度モデルに対応する背景波動場を入力関数空間とし、散乱波動場を出力関数空間として生成する。限られたトレーニングサンプルであっても、精度の高い精度の予測が可能になる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:22:30 GMT)
Unpacking Ambiguity: The Interaction of Polysemous Discourse Markers and Non-DM Signals [10.9]
英語におけるDMポリセミーと非DM信号の共起関係について検討する。ポリセムDMは、より多様な非DMと共起するが、共起信号の総数は必ずしも増加しない。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:36:31 GMT)
Stable and Accurate Orbital-Free DFT Powered by Machine Learning [10.8]
ホーエンバーグとコーンは、電子エネルギーと1粒子の電子密度は、密度に関して機能するエネルギーを最小化することで得られることを示した。この研究は、機械学習が理論とホヘンベルクとコーンのビジョンの実践的実現の間のギャップを狭める上で重要な役割を果たすことを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:04:26 GMT)
Universal Wavelet Units in 3D Retinal Layer Segmentation [10.8]
本稿では,オプティカルコヒーレンス・トモグラフィ(OCT)ボリュームから3次元網膜層セグメンテーションに波長可変ウェーブレット単位(UwUs)を適用した最初の研究について述べる。我々は3つのウェーブレットベースのダウンサンプリングモジュール、OrthLattUwU、BiorthLattUwU、LS-BiorthLattUwUを運動補正MGU-Netアーキテクチャに統合する。特にLS-BiorthLattUwUによるDiceスコアの精度向上を図り,ボリューム医用画像における可変ウェーブレットフィルタの有用性を強調した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:11:33 GMT)
MRI-CORE: A Foundation Model for Magnetic Resonance Imaging [10.7]
MRI-CORE(MRI-CORE)は、身体18箇所で1万1000万回以上のMRIボリュームから600万回以上スライスして訓練された視覚基盤モデルである。実験では,13個のデータ制限セグメンテーションタスク,画像分類,ゼロショットセグメンテーションにおいて,最先端手法よりも優れた性能を示す。また、最も有用な基礎モデルを生成する戦略と、事前学習タスクデータと下流タスクデータとの類似性に関する新たな分析結果も提示する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:20:31 GMT)
Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning [10.7]
本稿では,Qwen3基礎モデルに基づく金融大規模言語モデルのエージェントFin-R1シリーズを紹介する。我々の最適化アプローチは、高品質で体系的な財務タスク分類と包括的信頼性保証フレームワークを統合している。実験により,Agensar-Fin-R1が財務タスクにおける最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:52:16 GMT)
RadAlign: Advancing Radiology Report Generation with Vision-Language Concept Alignment [10.7]
RadAlignは、視覚言語モデルの予測精度と大きな言語モデルの推論能力を組み合わせた、新しいフレームワークである。本フレームワークは, 幻覚の低減, 自動医用画像の進歩, 予測AIと生成AIの統合による報告分析を両立させながら, 強力な臨床解釈可能性を維持している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:16:32 GMT)
Toward Scalable Video Narration: A Training-free Approach Using Multimodal Large Language Models [10.6]
本稿では,ビデオキャプションを高密度に生成する新しいトレーニングフリーパイプラインであるVideoNarratorを紹介する。 VideoNarratorは、既製のMLLMとビジュアル言語モデルがキャプションジェネレータとして機能する柔軟なパイプラインを活用することで、課題に対処する。実験の結果,これらの成分の相乗的相互作用はビデオナレーションの品質と精度を著しく向上させることが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:16:37 GMT)
RIS-aided Latent Space Alignment for Semantic Channel Equalization [10.6]
我々は,無線通信において,厳密なビットレベルの精度を保証するのではなく,意図した意味を伝達することに焦点を当てた新しいパラダイムを導入する。これらのシステムは、しばしばデータから直接意味を学習し、エンコードするためにディープニューラルネットワーク(DNN)に依存しており、より効率的な通信を可能にしている。本研究では、再構成可能なインテリジェントサーフェス(RIS)の存在を利用する物理・意味チャネル等化フレームワークを提案する。提案手法は, 様々なシナリオや無線チャネル条件において, 従来型, 意味的, 意味的, 意味的チャネル等化へのアプローチを一貫して上回っていることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:51:35 GMT)
Note on Follow-the-Perturbed-Leader in Combinatorial Semi-Bandit Problems [10.4]
小型不変半帯域問題におけるFollow-the-Perturbed-Leader(FTPL)ポリシーの最適性と複雑性について検討する。我々は条件付き幾何再サンプリング(CGR)をサイズ不変半帯域設定に拡張し、計算の複雑さをオリジナルのGRの$O(d2)$から$Oleft(mdleft(log(d/m)+1right)$に縮める。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:29:46 GMT)
MAN++: Scaling Momentum Auxiliary Network for Supervised Local Learning in Vision Tasks [10.2]
ローカル学習を教師するMOmentum Auxiliary Network++ (MAN++) を提案する。 MAN++は、GPUメモリ使用量を大幅に削減しつつ、エンドツーエンドのトレーニングに匹敵するパフォーマンスを実現していることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:50:19 GMT)
Quantum thermodynamics in a rotating BTZ black hole spacetime [10.2]
我々は、スカラー背景場に対する複雑な応答を符号化する検出器の完全なダイナミクスを導出する。 BTZブラックホールからホーキング放射を受けると、検出器の熱分解過程に固有の非対称性が現れる。特に、検出器は非平衡系の量子Mpemba効果に類似して、冷却するよりも常に速く加熱する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:32:17 GMT)
An Integrated Framework of Prompt Engineering and Multidimensional Knowledge Graphs for Legal Dispute Analysis [10.0]
このフレームワークは3段階の階層的なプロンプト構造と3層知識グラフを含んでいる。 4つの支援方法により、正確な法的概念の検索が可能となる。感度は9.9%-13.8%、特異度は4.8%-6.7%、引用精度は22.4%-39.7%だった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:41:16 GMT)
Multi-Label Classification with Generative AI Models in Healthcare: A Case Study of Suicidality and Risk Factors [9.9]
本研究では、自殺関連因子(SrFs)の多ラベル分類(MLC)における生成型大規模言語モデル(LLMs)、特にGPT-3.5およびGPT-4.5の使用について検討する。本稿では,新しいエンドツーエンド生成パイプラインを提案するとともに,ラベルセットレベルのメトリクスや,エラー解析のためのマルチラベル混同行列など,高度な評価手法を提案する。本研究は,SIとSAの融合などの系統的誤りパターンを明らかにし,ラベル付けに慎重な傾向を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:44:44 GMT)
Koel-TTS: Enhancing LLM based Speech Generation with Preference Alignment and Classifier Free Guidance [9.9]
Koel-TTSは拡張エンコーダデコーダトランスフォーマーTSモデルのスイートである。拡張エンコーダデコーダトランスフォーマーTSモデルのスイートであるKoel-TTSを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:32:13 GMT)
Reducing GPU Memory Fragmentation via Spatio-Temporal Planning for Efficient Large-Scale Model Training [9.8]
本稿では,ディープラーニングフレームワークのためのGPUメモリアレータSTWeaverを紹介し,メモリ割り当て動作の時間的規則性を利用してフラグメンテーションを低減する。プラグPyTorchとして開発されたSTWeaverは、密度とスパースモデルの両方で平均79.2%(最大100%)のフラグメンテーション比を、無視できるオーバーヘッドで減少させる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:39:07 GMT)
Can External Validation Tools Improve Annotation Quality for LLM-as-a-Judge? [9.7]
大規模言語モデル(LLM)の評価とフィードバックを提供するため、モデル応答に対するペアワイズな嗜好が広く収集されている。一部のドメインでは、高品質なペアワイズ比較はAIと人間から得るのが難しい。本稿では,これらのドメインに対して高品質なフィードバックを提供するためのツール利用エージェントシステムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:57:09 GMT)
The FIX Benchmark: Extracting Features Interpretable to eXperts [9.7]
FIX(Features Interpretable to eXperts)は、機能の集合が専門家の知識とどの程度うまく一致しているかを測定するベンチマークである。ドメインエキスパートと共同でFIXScoreを提案する。特徴に基づく一般的な説明手法は、専門家が特定した知識と不一致であることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:03:48 GMT)
Influence of dark matter on quantum entanglement and coherence in curved spacetime [9.6]
完全流体暗黒物質(PFDM)は、現代の宇宙論において重要な課題である。 PFDMは量子エンタングルメントとコヒーレンスを強化または分解することができる。異なる量子場は、曲線化された時空において、PFDMに対する大きな異なる応答を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:34:46 GMT)
Risk In Context: Benchmarking Privacy Leakage of Foundation Models in Synthetic Tabular Data Generation [9.6]
低データ設定では、しばしば合成データの主要なモチベーションであり、これらのモデルは機密レコードに過度に適合し、頻繁な再トレーニングを必要とする。最近の研究では、大規模な事前トレーニングされたトランスフォーマーを使用して、インコンテキスト学習(ICL)を通じて行を生成する。 3つの基礎モデル(GPT-4o-mini, LLaMA 3.3 70B, TabPFN v2)を、健康、金融、政策から35の現実世界のテーブルの4つのベースラインに対してベンチマークする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:59:08 GMT)
EBaReT: Expert-guided Bag Reward Transformer for Auto Bidding [9.5]
我々は,自動入札をシーケンス決定問題として定式化する。本稿では,データ品質と不確実性報酬に関する懸念に対処するため,エキスパート誘導型バグリワード変換器(EBaReT)を提案する。提案手法は,最先端入札方式に比べて優れた性能を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:56:36 GMT)
EndoControlMag: Robust Endoscopic Vascular Motion Magnification with Periodic Reference Resetting and Hierarchical Tissue-aware Dual-Mask Contro [9.5]
本研究では,内視鏡環境に適合したマスク条件の血管運動拡大機能を備えたトレーニングフリーフレームワークであるEndoControlMagを紹介する。提案手法は2つの重要なモジュールを特徴付ける: エラーの蓄積を防ぐために、動画を動的に更新された参照フレームでショートオーバーラップするクリップに分割する定期参照リセット方式。本研究では,EndoVMM24データセット上でのEndoControlMagの評価を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:11:23 GMT)
Learning Patient-Specific Spatial Biomarker Dynamics via Operator Learning for Alzheimer's Disease Progression [9.5]
アルツハイマー病(英語: Alzheimers disease、AD)は、複雑で多因子性神経変性疾患である。近年の治療法の進歩にもかかわらず、個別の疾患軌跡を正確に予測できる予測モデルはまだ限られている。本稿では、AD進行のパーソナライズされたモデリングのための機械学習に基づく演算子学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:52:28 GMT)
Many-Body Physics from Spin-Phonon Coupling in Rydberg Atom Arrays [9.4]
スピンフォノン結合を生じる光ツイーザに原子振動を取り入れた結果について検討する。熱平衡系の系では、この結合が弱い駆動限界において新しい対称性を破る位相をもたらすことが分かる。我々の結果は、最先端のRydberg原子配列実験で容易に検証できる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:41:15 GMT)
Generating Search Explanations using Large Language Models [9.3]
大規模言語モデル(LLM)は様々な問題に対して例外的な性能を示した。本研究では,エンコーダデコーダとデコーダのみのLLMを併用して,検索結果の説明を生成することで,そのギャップを解消する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:29:39 GMT)
Bipartite Patient-Modality Graph Learning with Event-Conditional Modelling of Censoring for Cancer Survival Prediction [9.3]
がん生存予測のための検閲の事象条件モデルを用いたバイパーティイト型患者モダリティグラフ学習(CenSurv)を提案する。 CenSurvは、動的モーメント累積信頼度を用いて信頼できる検閲データを選択し、これらの検閲データにより正確な生存時間を割り当て、トレーニングに非検閲データとして組み込む。 5つの公的ながんデータセットに関する総合的な評価は、最高の最先端よりもCenSurvの方が優れていることを示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:54:52 GMT)
BiLO: Bilevel Local Operator Learning for PDE Inverse Problems. Part II: Efficient Uncertainty Quantification with Low-Rank Adaptation [9.2]
不確かさの定量化と偏微分方程式(PDE)による逆問題(英語版)は、幅広い科学的・工学的応用の中心である。本稿では,PDE制約付き最適化問題に対するBilevel Local Operator Learning (BiLO) をベイズ推論フレームワークに拡張する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:20:20 GMT)
MolPIF: A Parameter Interpolation Flow Model for Molecule Generation [9.1]
本稿では,理論基礎,トレーニング,推論手順を詳細に記述した補間フローモデル(PIF)を提案する。次に、構造に基づく薬物設計のためのMolPIFを開発し、ベースラインと比較して様々な指標で優れた性能を示す。本研究では,パラメータ空間に基づく分子生成モデルの有効性を検証し,モデル設計の新しい視点を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:58:21 GMT)
Knowledge-aware Diffusion-Enhanced Multimedia Recommendation [9.1]
マルチメディアレコメンデーションのためのコントラスト学習パラダイム(KDiffE)を用いた知識認識拡散拡張アーキテクチャを提案する。まず最初に、本来のユーザアイコングラフを使用して、注目を意識した行列をグラフニューラルネットワークに組み込む。そこで,本研究では,知識を意識したコントラッシブな視点を構築するために,ノイズの少ないタスク関連知識グラフを生成するための誘導拡散モデルを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:47:56 GMT)
Generative Sign-description Prompts with Multi-positive Contrastive Learning for Sign Language Recognition [9.0]
本稿では,GSP-MC法を提案する。 GSP-MC法はまた、二重エンコーダアーキテクチャを用いて、階層的なスケルトン特徴と複数のテキスト記述を双方向にアライメントする。実験では、中国のSLR500(97.1%)とトルコのAUTSLデータセット(97.07%の精度)の既存の手法に対する最先端のパフォーマンスを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:46:21 GMT)
Revealing Bias Formation in Deep Neural Networks Through the Geometric Mechanisms of Human Visual Decoupling [9.0]
ディープニューラルネットワーク(DNN)はしばしば、オブジェクト認識中に特定のカテゴリに対するバイアスを示す。本稿では,クラス固有の知覚多様体の幾何学的複雑さをモデルバイアスにリンクする幾何学的解析フレームワークを提案する。本稿では,知覚多様体の幾何学的性質を計算するために設計された知覚多様体幾何学ライブラリを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:04:11 GMT)
The BabyView dataset: High-resolution egocentric videos of infants' and young children's everyday experiences [9.0]
このデータセットには、6か月から3歳までの子どもの、家庭内での縦断的、縦断的な自己中心的なビデオが含まれている。我々は、自己教師型言語と視覚モデルを訓練し、配布外タスクへの移行を評価する。私たちのデータセットは、堅牢で人間らしいAIシステムにとって、オープンな課題のひとつです。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:34:57 GMT)
SDGOCC: Semantic and Depth-Guided Bird's-Eye View Transformation for 3D Multimodal Occupancy Prediction [8.7]
SDG-OCCと呼ばれる新しいマルチモーダル占有予測ネットワークを提案する。ジョイントセマンティックとディープ誘導ビュー変換と、融合により占有されるアクティブ蒸留が組み込まれている。提案手法は,Occ3D-nuScenesデータセットをリアルタイムに処理することで,最先端(SOTA)性能を実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:49:40 GMT)
From Text to Actionable Intelligence: Automating STIX Entity and Relationship Extraction [8.6]
AZERGはセキュリティアナリストが自動的に構造化STIX表現を生成するのを支援するために設計されたツールである。タスク固有の微調整を適用し、関連するエンティティを正確に抽出し、STIX仕様に従ってそれらの関係を推測する。我々のモデルは、T1の84.43%、T2の88.49%、T3の95.47%、現実世界のシナリオでの84.60%のF1スコアを達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:27:09 GMT)
Progressive-Resolution Policy Distillation: Leveraging Coarse-Resolution Simulations for Time-Efficient Fine-Resolution Policy Learning [8.4]
本稿では,岩盤掘削シミュレータを用いた補強学習(RL)による自律掘削の枠組みを提案する。ファインレゾリューションシミュレーションは現実世界の挙動を忠実に模倣するが、かなりの計算時間と挑戦的なサンプル収集を必要とする。本稿では,政策移行の失敗につながる可能性のあるドメインギャップを回避するため,保守的な政策移行を伴う中間分解能シミュレーションを通じて政策を段階的に伝達する,プログレッシブ・リゾリューション・ポリシー蒸留(PRPD)と呼ばれる新しい政策学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:30:12 GMT)
The surprising strength of weak classifiers for validating neural posterior estimates [8.4]
コンフォーマルC2STは、様々なベンチマークで古典的な差別テストより優れている。これらの結果は,現代シミュレーションに基づく推論のための実用的,理論的に基礎的な診断として,共形C2STを確立した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:30:06 GMT)
CoLT: The conditional localization test for assessing the accuracy of neural posterior estimates [8.4]
神経後続推定 (q(theta mid x) ) は真で未知の真の後進 (p(theta mid x) ) に対する正確な近似である。我々は, (p(theta mid x) ) と (q(theta mid x) ) の一致を検知する原理的手法である EmphConditional Localization Test (CoLT) を導入する。我々の理論的結果は、すべての(x)における分布の等式を評価するために必要かつ十分な条件を確立する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:38:59 GMT)
HoliTracer: Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery [8.4]
本稿では,大規模RSIからベクトル化された空間オブジェクトを水平に抽出する最初のフレームワークであるHoliTracerを紹介する。 HoliTracerでは,コンテキストアテンションネット(CAN)を用いて大規模RSIのセグメンテーションを強化する。建物、水域、道路を含む大規模なRSIデータセットの実験は、ホリトラッカーが最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:55:00 GMT)
Swift-Sarsa: Fast and Robust Linear Control [8.3]
Javed、Sharifnassab、Sutton(2024年)は、True Online TD($lambda$)をステップサイズ最適化で拡張する、TD学習のための新しいアルゴリズム、SwiftTDを導入した。 SwiftTDは、Atariゲームから派生した様々な予測タスクでTrue Online TD($lambda$)とTD($lambda$)を上回った。我々はSwiftTDを拡張して、$textit-Sarsa$というオンデマンドの強化学習アルゴリズムを開発することで、制御問題に対処する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:08:38 GMT)
Neural Approaches for Multi-Objective Routing on Multigraphs [8.3]
マルチグラフ上での多目的ルーティングに対処するグラフニューラルネットワークに基づく2つの手法を提案する。最初のアプローチは、ツアーが完了するまでエッジを自動回帰的に選択することで、マルチグラフ上で直接動作する。第2のモデルは、まず学習されたプルーニング戦略を介してマルチグラフを単純化し、その結果の単純なグラフのルーティングを実行する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:31:06 GMT)
Temporally-Constrained Video Reasoning Segmentation and Automated Benchmark Construction [8.2]
本稿では,対象対象物が文脈的関連性を持つ場合に暗黙的に推論することを必要とする新しいタスクの定式化である,時間制約付きビデオ推論セグメンテーションを導入する。また、MVORデータセットからの映像を用いた52のサンプルを含む時間制約付きビデオRSデータセットであるTCVideoRSを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:59:21 GMT)
Working with AI: Measuring the Occupational Implications of Generative AI [8.2]
ユーザとMicrosoft Bing Copilot間の200万の匿名会話のデータセットを分析します。私たちは、人々が情報収集や執筆に携わるAI支援を求める最も一般的な作業活動を見つけます。 AI自身が実行している最も一般的な活動は、情報と援助、執筆、教育、助言を提供することである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:32:56 GMT)
Designing for Difference: How Human Characteristics Shape Perceptions of Collaborative Robots [8.1]
反社会的ロボット行動は一貫して最低と評価され、高齢者とのコラボレーションはより敏感な評価を導いた。これらの結果は、人間の特徴と相互作用パラダイムの両方が協調ロボットの受容性に影響を与えることを示唆している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:36:08 GMT)
Beyond English: Evaluating Automated Measurement of Moral Foundations in Non-English Discourse with a Chinese Case Study [8.1]
本研究では、非英語コーパスにおける道徳的基礎(MF)を測定するための計算手法について検討する。本研究は,中国語を事例として,機械翻訳テキスト,局所言語語彙,多言語言語モデル,および多言語モデル(LLM)に英語リソースを適用し,非英語テキストのMFを測定することの有効性を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:23:40 GMT)
Search-based Generation of Waypoints for Triggering Self-Adaptations in Maritime Autonomous Vessels [8.1]
海上自律船(AV)の自己適応により、予期せぬ状況に対処する行動に適応することができる。 AVのナビゲーションソフトウェアに焦点をあて、適応を通して操作中の動作に適応する必要がある。本稿では,WPgenと呼ばれる多目的探索に基づく手法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:10:12 GMT)
Towards a deeper GCN: Alleviate over-smoothing with iterative training and fine-tuning [7.8]
Graph Convolutional Networks (GCNs) は、過度なスムーシングによるディープアーキテクチャのパフォーマンス低下に悩まされている。本稿では,その表現能力を維持しつつ,深いGCNを段階的に構築する新たなトレーニング戦略である層ワイド・グラデュアル・トレーニング(LGT)を提案する。 LGTはベンチマークデータセットで最先端のパフォーマンスを実現し、32層設定でも精度を大幅に向上する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:07:33 GMT)
Improving U-Net Confidence on TEM Image Data with L2-Regularization, Transfer Learning, and Deep Fine-Tuning [7.8]
TEM画像のナノスケール欠陥は、複雑なコントラスト機構と複雑な欠陥構造により、はるかに大きな変化を示す。これらの課題は多くの場合、ラベル付きデータが少なくなり、アノテーションエラーの率も高くなる。本研究では,自然画像に用いた大規模・事前学習モデルを用いて移動学習について検討した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:27:33 GMT)
Distilled Large Language Model in Confidential Computing Environment for System-on-Chip Design [7.8]
大規模言語モデル(LLM)は、回路設計タスクでますます使われ、通常、複数の訓練を経ている。トレーニングされたモデルと関連するトレーニングデータは、秘密の知的財産権(IP)と見なされ、露出から保護されなければならない。 Confidential Computingは、Trusted Execution Environments(TEEs)を通じてデータとモデルを保護するための有望なソリューションを提供する
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:41:27 GMT)
DenseSR: Image Shadow Removal as Dense Prediction [7.8]
シングルイメージシャドウ除去(SR)は、一様でない内容劣化と固有の曖昧さによって妨げられる。伝統的な手法は、しばしばシャドウ内部の詳細を同時に回復し、鋭い境界を維持するのに失敗する。そこで我々は,DenseSRを提案し,より密集した予測の観点から問題にアプローチし,復元の質を強調する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:22:09 GMT)
Physics-Driven Neural Network for Solving Electromagnetic Inverse Scattering Problems [7.6]
物理駆動型ニューラルネットワーク(PDNN)を用いた逆散乱問題(ISP)に対する新しい解法を提案する。 PDNNは、収集された散乱場の入力と予測された解に対応する散乱場の計算のみを訓練する。提案手法は, 複合損失散乱器を用いた場合であっても, 復元精度が高く, 安定性が高いことを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:04:50 GMT)
TTMBA: Towards Text To Multiple Sources Binaural Audio Generation [7.5]
本稿では,時間的・空間的制御を併用したテキスト・マルチソース音声生成(TTMBA)のケースド手法を提案する。事前訓練された大言語モデル(LLM)は、各音声イベントの時間と空間の詳細とともに、テキストを構造化形式に分割する。事前訓練されたモノオーディオ生成ネットワークは、イベント毎に異なる期間で複数のモノオーディオを生成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:16:07 GMT)
RAVine: Reality-Aligned Evaluation for Agentic Search [7.4]
RAVineは、検索を伴うエージェントLLMのための現実対応eValuationフレームワークである。 RAVineは、マルチポイントクエリと、ユーザの意図を反映した長文の回答をターゲットにしている。 RAVineを使って一連のモデルをベンチマークし、いくつかの洞察を得た。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:08:12 GMT)
The Trust Fabric: Decentralized Interoperability and Economic Coordination for the Agentic Web [7.4]
AIエージェントエコシステムの断片化は、相互運用性、信頼、経済調整に対する緊急の要求を生み出している。 3つのコアイノベーションを中心に構築された分散フレームワークであるNanda Unified Architectureを紹介します。 Systemは経済調整のためのX42/H42マイクロペイメントと、Synergeticsの特許であるAgentTalkプロトコルを組み込んだセキュリティフレームワークMAESTROを導入している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:28:06 GMT)
Bayesian preference elicitation for decision support in multiobjective optimization [7.3]
我々は、ペア比較に基づいて、ベイズモデルを用いて意思決定者のユーティリティ関数を推定する。原則的エレケーション戦略は、探索とエクスプロイトのバランスをとるために、クエリを対話的に選択する。溶出相の最後には、高品質な溶液の還元メニューを生成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:14:20 GMT)
Are Foundation Models All You Need for Zero-shot Face Presentation Attack Detection? [7.3]
顔認識システムは攻撃提示(AP)に対して脆弱である本稿では,ゼロショットプレゼンテーションアタック検出(PAD)手法について述べる。まず,確立された実験シナリオにおける基礎モデルの有効性と一般性を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:38:21 GMT)
Practical Insights into Knowledge Distillation for Pre-Trained Models [7.2]
本研究では,事前学習モデルにおける知識蒸留(KD)プロセスの強化について検討する。事前訓練されたモデル間で知識を伝達するための多くのKDアプローチが採用されているにもかかわらず、KDの応用に関する包括的な理解は欠如している。本研究は,標準KD,調整KD(最適化温度および重みパラメータ),深層相互学習,データ分割KDなど,複数のKD技術の比較を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:21:30 GMT)
Vision-based Conflict Detection within Crowds based on High-Resolution Human Pose Estimation for Smart and Safe Airport [7.2]
本稿では,集団における衝突行動の分類を行う機械学習モデルの開発について述べる。支持ベクトルマシン(SVM)は94.37%の精度を達成した。結果として得られたモデルは、膨大な数の潜在的な乗客に対処するために改良が加えられた場合、空港内に配備される可能性がある。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:57:54 GMT)
The spatiotemporal Born rule is quasiprobabilistic [7.1]
補正項によって逐次測定に関連する確率を修正した場合、二部演算子によって一意に符号化された準確率分布が得られることを示す。また、時相ボルン則とともに量子チャネルに対するベイズ反転の概念が適用されると、準確率的ベイズ則の逐次測定に自然に到達することを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:02:13 GMT)
On small perturbations of coherent information [7.1]
量子キャパシティ(Quantum capacity)は、任意の小さな誤差の確率で量子チャネルによって送信できる量子情報の量である。我々は、入力状態の小さな摂動に対して量子チャネルのコヒーレントな情報の振る舞いを分析する摂動的手法を開発する。我々の基準が1ショットの量子容量の超増感性、また1ショットのプライベート容量と1ショットの量子容量の間の正のギャップを検出するのにいかに十分な条件をもたらすかを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:02:27 GMT)
DisCoPatch: Taming Adversarially-driven Batch Statistics for Improved Out-of-Distribution Detection [7.0]
バッチ正規化 (BN) で訓練された敵判別器では、実検体と敵検体は独自のバッチ統計を持つ異なる領域を形成する。本稿では,この機構を利用した教師なし適応変分自動エンコーダフレームワークであるDisCoPatchを紹介する。 DisCoPatchは、公開OOD検出ベンチマークで最先端の結果を達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:26:49 GMT)
Navigating Large-Pose Challenge for High-Fidelity Face Reenactment with Video Diffusion Model [6.9]
Face Reenactmentは、駆動ビデオから静的なソースイメージに動きを移すことで、リアルなトーキングヘッドビデオを生成することを目的としている。大規模なポーズ変化下での高忠実度顔再現のための新しいフレームワークである顔再現ビデオ拡散モデル(FRVD)を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:23:43 GMT)
MotionLab: Unified Human Motion Generation and Editing via the Motion-Condition-Motion Paradigm [6.9]
textbfMotion-Condition-Motionを提案する。これは様々なタスクを3つの概念(震源運動、条件運動、目標運動)で統一した定式化を可能にする。このパラダイムに基づいて,修正フローを組み込んだ統合フレームワーク textbfMotionLab を提案し,ソース動作からターゲット動作へのマッピングを学習する。特に、MotionLabは有望な機能と推論効率を、複数のベンチマークで示しています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:47:07 GMT)
iShumei-Chinchunmei at SemEval-2025 Task 4: A balanced forgetting and retention multi-task framework using effective unlearning loss [6.8]
機械学習は、大規模言語モデルからのセンシティブな情報を効率的に消去することに焦点を当てている。そこで本研究では, より制御可能な非学習損失, エフェクト・アンラーニング損失を提案する。我々のシステムは大会のリーダーボードで5位にランクインした。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:21:54 GMT)
Towards Enforcing Company Policy Adherence in Agentic Workflows [6.8]
大規模言語モデル(LLM)エージェントは、従来のビジネスプロセス自動化に代わる柔軟でスケーラブルな代替手段を約束する。本研究では,エージェントにおけるビジネスポリシーの遵守を強化するための決定論的,透過的,モジュール的な枠組みを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:00:37 GMT)
Quantum surface effects on quantum emitters coupled to surface plasmon polariton [6.8]
表面プラズモン分極 (SPP) は量子技術における多くの応用に影響を与えた。最近の実験では、非局所光学応答、電子の流出、ランダウ減衰を含む金属の量子表面効果(QSE)が古典的電磁理論を無効にすることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:16:28 GMT)
Task-Specific Zero-shot Quantization-Aware Training for Object Detection [6.7]
量子化は、ネットワークサイズと計算複雑性を減らすための重要な技術である。 ZSQは、事前訓練されたモデルから生成された合成データを用いてこの問題に対処する。本稿では,オブジェクト検出ネットワークのためのタスク固有ZSQフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:28:29 GMT)
Quantum teleportation of an elemental silicon nanophotonic CNOT gate [6.7]
大規模量子コンピュータは、古典的なコンピュータでは克服できないような実用的な問題に効果的に取り組む能力を持っている。これらの量子コンピュータを構築する上での大きな課題は、リモートキュービットと絡み合いのためのスケーラブルなモジュールを実現することである。量子ゲート・テレポーテーションはローカルな操作と古典的な通信と共有の絡み合いだけを必要とする我々は、スケーラブルなシリコンチッププラットフォームを用いたオンチップ制御NOT(CNOT)ゲートの量子テレポーテーションを実験的に実証した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:29:49 GMT)
Beyond Single-Channel: Multichannel Signal Imaging for PPG-to-ECG Reconstruction with Vision Transformers [6.7]
本稿では,視覚変換器(ViT)をコアネットワークとして利用する新しいPSG-to-ECG再構成手法を提案する。 ViTの自己保持機構を活用することで、我々のアプローチは、ビート間の依存性とビート内依存性の両方を効果的に捉えることができる。実験の結果,提案手法は既存の1次元畳み込み方式よりも優れていた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:06:36 GMT)
Computational Performance Bounds Prediction in Quantum Computing with Unstable Noise [6.7]
量子デバイスにおけるノイズは、この優位性を実現する上で重要な障壁となる。次世代の量子中心型スーパーコンピュータは本質的に、効率的で正確なノイズ特性を必要とする。計算性能境界を予測するために,QuBoundというデータ駆動型ワークフローを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:00:09 GMT)
A Method for the Architecture of a Medical Vertical Large Language Model Based on Deepseek R1 [6.6]
本稿では,知識獲得,モデル圧縮,計算強化といった課題に対処する,軽量な医療用大規模言語モデルアーキテクチャを提案する。我々は,Low-Rank Adaptation (LoRA) を用いて,DeepSeek-R1-Distill-70BからDeepSeek-R1-Distill-7Bへの知識伝達パイプラインを設計した。提案手法では,USMLEでは92.1%の精度を維持しながら,メモリ消費を64.7%削減し,12.4%のレイテンシをベースライン推論モデルと比較した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:26:53 GMT)
A Review of Privacy Metrics for Privacy-Preserving Synthetic Data Generation [6.5]
差分プライバシー(DP)は、個人が機密データを共有する際にどのように保護されているかを確立するPP-SDGメカニズムの特性である。しかし、DPが提示するプライバシー予算(varepsilon$)を解釈することは困難である。本稿では、17の異なるプライバシー指標の仮定と数学的定式化について述べる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:17:56 GMT)
Dutch CrowS-Pairs: Adapting a Challenge Dataset for Measuring Social Biases in Language Models for Dutch [6.5]
オランダ語モデルにおけるバイアスを測定するための、米国固有のCrowS-Pairsデータセットのオランダ版が紹介されている。得られたデータセットは、性的指向、ジェンダー、障害などの9つのカテゴリのバイアスをカバーする1463の文ペアで構成されている。 CrowS-Pairsデータセットの英語版とフランス語版を使用して、英語(BERTとRoBERTa)とフランス語(FlauBERTとCamemBERT)でバイアスを評価した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:38:02 GMT)
Biases in LLM-Generated Musical Taste Profiles for Recommendation [6.5]
推奨のための大規模言語モデル(LLM)は、消費データから自然言語(NL)のユーザ嗜好プロファイルを生成することができる。しかし、ユーザーがこれらのプロフィールを自分の好みを正確に表現しているかどうかは不明だ。本研究では、音楽ストリーミングの文脈でこの問題について研究し、大規模で文化的に多様なカタログによってパーソナライズに挑戦する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:44:10 GMT)
Pyramid Hierarchical Masked Diffusion Model for Imaging Synthesis [6.5]
本稿では,新しい画像合成ネットワークであるピラミッド階層型マスケッド拡散モデル(PHMDiff)を提案する。 2つの挑戦的データセットの実験により、PHMDiffはPak Signal-to-Noise Ratio(PSNR)とStructure similarity Index Measure(SSIM)の両方で優れた性能を発揮することが示された。医療画像モダリティの多次元画像合成フレームワークであるPHMDiffモデルは,他の手法に比べて大きな優位性を示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:30:54 GMT)
SpeLLM: Character-Level Multi-Head Decoding [6.5]
SpeLLMは、複数の出力ヘッドを通して文字レベルの文字列を予測することで、入力と出力の語彙を分離する手法である。 SpeLLMでは、$k$のリニアヘッドが1つの文字を同時に予測し、モデルがより大きな出力空間を表現できるようにする。 4つの事前学習 LLM を用いた実験により,SpeLLM 変種は下流タスク上での競合性能を実現し,ランタイムを5.1%削減した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:07:06 GMT)
MGSR: 2D/3D Mutual-boosted Gaussian Splatting for High-fidelity Surface Reconstruction under Various Light Conditions [6.4]
新しいビュー合成(NVS)と表面再構成(SR)は3次元ガウススプラッティングにおける必須課題である(3D-GS) 表示品質と3次元再構成精度を両立させる表面再構成用2D/3D多孔型ガウススプラッティングであるMGSRを提案する。我々はMGSRをオブジェクトレベルとシーンレベルの両方において、多種多様な合成および実世界のデータセットで評価し、レンダリングおよび表面再構成において高い性能を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:29:01 GMT)
AI-enhanced conversational agents for personalized asthma support Factors for engagement, value and efficacy [6.4]
英国における喘息関連死亡件数はヨーロッパで最も多い。基礎治療を受ける患者はわずか30%である。喘息を患う人々にリーチするための代替アプローチが必要だ。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:21:00 GMT)
GATEBLEED: Exploiting On-Core Accelerator Power Gating for High Performance & Stealthy Attacks on AI [6.4]
本稿では,CPUの動作限界を抑えるために使用したアグレッシブパワーゲーティングにより,タイミング側および隠蔽チャネルであるGATEBLEEDを示す。 GateBLEEDは、従来の保護措置の下でも、ローカルおよびリモートのタイミング推定のリスクを負う。我々は,Intel AMXに最適化されたトランスモデルに対して,エンド・ツー・エンドのマイクロアーキテクチャ推論攻撃を実装し,メンバシップ推定精度81%を達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:41:43 GMT)
Learning Text Styles: A Study on Transfer, Attribution, and Verification [6.4]
この論文は、3つの相互接続された柱を通してテキストスタイルの計算的理解と操作を促進する。テキスト・スタイル・トランスファー (TST) は、コンテンツ保存中にスタイル特性を変更し、オーサリング・アトリビューション (AA) は、スタイリスティック・フィンガープリントによるテキストの作者を特定し、オーサリング・検証 (AV) は、2つのテキストが同一のオーサシップを共有するかどうかを決定する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:38:39 GMT)
GEMINUS: Dual-aware Global and Scene-Adaptive Mixture-of-Experts for End-to-End Autonomous Driving [6.3]
GEMINUSは、Global Expert、Scene-Adaptive Experts Group、Dual-Aware Routerを特徴とするエンドツーエンドの自動運転フレームワークである。 Global Expertはデータセット全体に基づいてトレーニングされており、堅牢なパフォーマンスを備えている。 Scene-Adaptive Expertsは、対応するシーンサブセットに基づいてトレーニングされ、適応的なパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:58:25 GMT)
T-GRAB: A Synthetic Diagnostic Benchmark for Learning on Temporal Graphs [6.2]
時間的グラフ推論ベンチマーク(T-GRAB)を導入し,TGNNの時間的推論能力を体系的に探究する。 T-GRABは、主要な時間的スキルを分離する制御された解釈可能なタスクを提供する。これらの課題に対して,11の時間グラフ学習手法を評価し,時間パターンを一般化する能力の根本的な欠点を明らかにした。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:14:41 GMT)
Pragmatic Policy Development via Interpretable Behavior Cloning [6.2]
本稿では,患者の行動方針の解釈可能なモデルを用いて,各患者の状態において最も頻繁に選択される行動から治療方針を導出する。このフレームワークによって導かれるポリシーは,オフラインのRLで得られるものに対して,解釈可能な代替手段を提供することで,現在の実践を上回り得ることを実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:34:35 GMT)
Three-local Conserved Charge Implies Quantum Integrability [6.1]
隣接する3つのサイトが支持する電荷演算子の保存は、すべての高次保存電荷の存在を保証するのに十分である。これはグラボフスキーとマチューの長年の予想を定理として成立させる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:24:39 GMT)
Learning Causally Predictable Outcomes from Psychiatric Longitudinal Data [6.1]
縦断的生医学データの因果推論は依然として中心的な課題である。本アルゴリズムは, 結果集約のための非負の, 臨床的に解釈可能な重みを学習する。我々のアルゴリズムは因果関係の回復における最先端の手法より一貫して優れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:45:17 GMT)
Analogy making as amortised model construction [5.9]
人間は、新しい状況をナビゲートするために内部モデルを構築します。これらのプロセスにおいて類推が中心的な役割を担っていると我々は主張する。従来のコンストラルから派生した抽象モジュールが、新しいモジュールの組み立て可能なビルディングブロックとして機能するフレームワークをスケッチする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:16:45 GMT)
WhatsApp Tiplines and Multilingual Claims in the 2021 Indian Assembly Elections [5.8]
本研究は、2021年のインド議会選挙で451人のユーザーから580人のユニーククレーム(チップ)を分析した。我々は、これらの主張を選挙、COVID-19、その他の3つのカテゴリーに分類し、言語間のバリエーションを観察する。その結果、言語間でのクレームの類似性が明らかとなり、同じファクトチェッカーに複数の言語でヒントを提出するユーザもいた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:35:42 GMT)
The Impact of Pseudo-Science in Financial Loans Risk Prediction [5.8]
金融融資におけるリスク予測への機械学習の直接適用による人々の行動予測における疑似科学的仮定の社会的影響について検討する。本研究は,社会的に最適なモデルが,この下流作業において有意な精度の損失を生じさせないことを示すものである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:53:13 GMT)
Revisiting Pre-trained Language Models for Vulnerability Detection [5.7]
プレトレーニング言語モデル(PLM)の急速な進歩は、様々なコード関連タスクに対して有望な結果を示した。しかし、現実世界の脆弱性を検出する効果は依然として重要な課題である。本稿では、より小さなコード固有のPLMと大規模PLMにまたがる17のPLMを広範囲に評価するRevisitVDを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:58:49 GMT)
LDRFusion: A LiDAR-Dominant multimodal refinement framework for 3D object detection [5.7]
既存のLiDAR-Camera融合法は3次元物体検出において大きな成果を上げている。我々は,LDRFusionを提案する。LDRFusionは,マルチセンサフュージョンのための新しい2段階改良フレームワークである。当社のフレームワークは,複数のカテゴリと難易度をまたいだパフォーマンスを継続的に達成しています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:35:52 GMT)
R1-Track: Direct Application of MLLMs to Visual Object Tracking via Reinforcement Learning [5.6]
単一のオブジェクト追跡は、その後のビデオフレームにおけるターゲットのスケールを連続的にローカライズし、推定することを目的としている。 Qwen2.5-VLはイメージペア間のテンプレートマッチングに苦労している。グループ相対政策最適化(GRPO)強化学習法を用いてQwen2.5-VLを微調整した。結果として得られたR1-Trackは、GOT-10kベンチマークで顕著な性能を達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:39:40 GMT)
Efficient quantum state tomography with auxiliary systems [5.6]
量子状態トモグラフィ(quantum state tomography)は、未知の量子状態の密度行列を再構成するために用いられる量子情報科学の技法である。量子システムのサイズが大きくなるにつれて、量子状態トモグラフィーの測定設定とサンプリング要求の数は、量子ビットの数とともに指数関数的に増加する。本研究は, 測定条件の低減とサンプリング効率の向上を図るため, 補助システムに基づく状態トモグラフィー手法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:40:14 GMT)
Coordinate-based Speed of Sound Recovery for Aberration-Corrected Photoacoustic Computed Tomography [5.6]
光音響CT(PACT)は、超音波と同様の非侵襲的な画像モダリティであり、広範囲の医療応用がある。従来のPACT画像は、組織内の音の異種速度(SOS)による波面歪みによって劣化する。本稿では,リングアレイPACTシステムにおいて,SOSと高品質な画像を復元する,効率的な自己教師型共同再構築手法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:07:26 GMT)
HausaNLP: Current Status, Challenges and Future Directions for Hausa Natural Language Processing [5.5]
Hausaは、世界で1億2000万の第一言語(L1)と8000万の第二言語(L2)を持つ低リソース言語である。本稿では,Hausa NLPの現状を概観し,既存の資源,研究コントリビューション,基本的なNLPタスク間のギャップを体系的に検討する。アクセシビリティを高め、さらなる開発を促進するために、データセット、ツール、研究成果を集約する、キュレートされたカタログであるHausaNLPを紹介します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:36:47 GMT)
No-go theorems for logical gates on product quantum codes [5.5]
符号のホモロジー積は、量子誤り訂正符号のための汎用的なフレームワークを提供する。非クリフォード論理ゲートがハイパーグラフ製品コード上で容易に実装できないことを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:46:45 GMT)
PRISM: High-Resolution & Precise Counterfactual Medical Image Generation using Language-guided Stable Diffusion [5.5]
医用画像のための信頼性と一般化可能な深層学習システムの開発は、素早い相関関係、データ不均衡、データセットにおける限られたテキストアノテーションなどにより、大きな障害に直面している。 PRISMは,基礎モデルを利用して高分解能・言語誘導型医用画像対物を生成するフレームワークである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:26:39 GMT)
Analysis of Post-Quantum Cryptography in User Equipment in 5G and Beyond [5.4]
量子コンピューティングは、ポスト量子暗号(PQC)への移行につながった。本稿では,ユーザ機器(UE)におけるNIST選択PQCアルゴリズムの5Gネットワーク上でのUE通信に対する実装と性能評価について述べる。我々は、様々な暗号化構成とクライアント負荷の下で、ハンドシェイクレイテンシ、CPUおよびメモリ使用率、帯域幅、再送信率に基づいて性能を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:21:16 GMT)
Perovskite-R1: A Domain-Specialized LLM for Intelligent Discovery of Precursor Additives and Experimental Design [5.4]
ペロブスカイト太陽電池 (PSCs) は、次世代の太陽電池技術の主要な候補として急速に出現している。長期の安定、環境の持続可能性、スケーラブルな製造といった課題は、商業化を妨げ続けている。プリキュラ付加工学はPSCの性能と耐久性を向上させることでこれらの問題に対処することを約束している。本稿では,PSC前駆体の発見と設計に適した高度な推論機能を備えた特殊大言語モデル(LLM)であるPerovskite-R1を紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:48:32 GMT)
L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models [5.3]
量子化学習(QAT)とローランド適応(LoRA)を統合したL4Qを提案する。メモリ最適化レイヤ設計を採用することで、L4QはQATのメモリオーバーヘッドを大幅に削減し、トレーニングコストはLoRAに匹敵する。この量子化法と微調整法の組み合わせにより精度が向上することを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:10:11 GMT)
Voice-based AI Agents: Filling the Economic Gaps in Digital Health Delivery [5.2]
本稿では,大言語モデル(LLM)を利用した音声アシスタントが,予防ケアと継続的患者モニタリングの強化に果たす役割について検討する。本稿では,AIエージェントが費用対効果の高い医療サービスをいかに提供できるかを示す経済モデルを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:01:06 GMT)
Tri-Learn Graph Fusion Network for Attributed Graph Clustering [5.2]
本稿では,GCN,オートエンコーダ(AE),グラフ変換器からなる新しいディープクラスタリングフレームワークを提案する。このフレームワークは、ユニークな3つの学習機構と特徴融合戦略を通じて、グローバルおよびローカル情報の識別と一貫性を高める。 ACMデータセットで約0.87%、Reutersデータセットで14.14%、USPSデータセットで7.58%の精度向上を実現している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:44:20 GMT)
Multilevel Picard approximations and deep neural networks with ReLU, leaky ReLU, and softplus activation overcome the curse of dimensionality when approximating semilinear parabolic partial differential equations in $L^p$-sense [5.2]
我々は,Lmathfrakp$-senseでKolmogorov PDEの解を近似できるマルチレベルPicard近似とReLUによるディープニューラルネットワーク,リークReLU,ソフトプラスアクティベーションを証明した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:23:15 GMT)
INTEGRALBENCH: Benchmarking LLMs with Definite Integral Problems [5.2]
INTEGRALBENCH(インテガルベンチ)は、大言語モデル(LLM)の性能を確定的な積分問題で評価するために設計されたベンチマークである。現状の9つのLCMの評価結果から,問題難易度とモデル精度の相関が顕著であることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:44:36 GMT)
Robust Noisy Pseudo-label Learning for Semi-supervised Medical Image Segmentation Using Diffusion Model [5.2]
半教師付き医用画像セグメンテーションは、限られた注釈付きデータと豊富なラベルなしデータを利用して正確なセグメンテーションを実現することを目的としている。既存の手法は、擬似ラベルが導入したノイズにより、潜在空間における意味分布を構成するのにしばしば苦労する。提案手法は,プロトタイプに基づくコントラッシブコントラストの整合性を強制することにより,意味ラベルの遅延構造に制約を導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:21:55 GMT)
A Hybrid CNN-VSSM model for Multi-View, Multi-Task Mammography Analysis: Robust Diagnosis with Attention-Based Fusion [5.2]
乳がんの早期かつ正確な検診は乳がん検出に不可欠である。既存のAIアプローチは、単一ビューのインプットや単一タスクのアウトプットに注目して、不足している。本研究では,4つの標準マンモグラフィビュー全てを処理する,新しいマルチビュー・マルチタスクハイブリッドディープラーニングフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:52:18 GMT)
Optimizing Entanglement and Bell Inequality Violation in Top Anti-Top Events [5.2]
スピン-スピン相関を対角化する基礎は,スピン相関,絡み合い,ベル不等式違反の最大化に最適であることを示す。 LHCと将来の$e+e-$コライダーのイベントにおいて,絡み合いやベルの不等式違反に対する感受性を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:40:34 GMT)
Pixels to Principles: Probing Intuitive Physics Understanding in Multimodal Language Models [5.1]
本稿では,直感的な物理課題に対するMLLM(State-of-the-the-art multimodal large language model)の体系的評価について述べる。オープンソースモデルであるInternVL 2.5、Qwen 2.5 VL、LLaVA-OneVision、およびプロプライエタリなGemini 2.0 Flash Thinkingを評価した。最新のモデルでさえ、不確実なシナリオと物理的に妥当な区別を確実にするのに苦労している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:24:42 GMT)
Fundamental limits of distributed covariance matrix estimation via a conditional strong data processing inequality [5.1]
本研究では,複数のエージェントがガウス以下のランダムベクトルから引き出されたサンプルの異なる成分を観測するシナリオについて検討する。中央サーバは、各エージェントが通信する限られたビット数を用いて、完全な共分散行列を推定しようとする。我々の主な技術ツールは、条件付き強データ処理不等式(C-SDPI)係数と呼ばれる、強データ処理不等式(SDPI)の新たな一般化である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:50:02 GMT)
Romance, Relief, and Regret: Teen Narratives of Chatbot Overreliance [5.1]
われわれは13～17歳のユーザーによるReddit投稿318件を分析した。十代の若者たちは、感情的なサポートや創造的な表現にチャットボットを使い始めるのが普通でした。彼らの投稿では、心理的苦痛の兆候、再発のサイクル、そして解離の困難が繰り返し現れていた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:23:27 GMT)
Equivariant Goal Conditioned Contrastive Reinforcement Learning [5.0]
Contrastive Reinforcement Learning (CRL)は、ラベルのない相互作用から有用な構造化表現を抽出するための有望なフレームワークを提供する。等変制約を用いた潜在空間をさらに構造化する等変CRLを提案する。我々のアプローチは、状態ベースと画像ベースの両方の設定において、さまざまなシミュレーションタスクにおいて、強いベースラインを一貫して上回ります。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:13:45 GMT)
ShrinkBox: Backdoor Attack on Object Detection to Disrupt Collision Avoidance in Machine Learning-based Advanced Driver Assistance Systems [4.9]
本稿では,衝突回避ML-ADASにおける物体検出を目的とした新しいバックドア攻撃であるShrinkBoxを紹介する。 ShrinkBox は YOLOv9m オブジェクト検出器で 96% の攻撃成功率 (ASR) で実現可能であることを示す。その結果,ShrinkBoxは平均絶対誤差(MAE)を3倍以上に増大させることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:04:29 GMT)
Computational aspects of the trace norm contraction coefficient [4.9]
定数係数内での量子チャネルのトレースノルム収縮係数の近似はNPハードであることが示される。また、縮約係数上の半定値プログラミング上界の収束階層も確立する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:22:07 GMT)
Enhancing Domain Diversity in Synthetic Data Face Recognition with Dataset Fusion [4.9]
アーキテクチャ的に異なるバックボーンを用いて生成した2つの最先端合成顔データセットを組み合わせることで,その解を提案する。この融合は、モデル固有のアーティファクトを減らし、ポーズ、照明、人口動態の多様性を高め、アイデンティティ関連の特徴を強調することで、顔認識モデルを暗黙的に規則化する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:36:48 GMT)
Comparing Behavioural Cloning and Reinforcement Learning for Spacecraft Guidance and Control Networks [4.9]
誘導制御ネットワーク(G&CNET)は、宇宙船の誘導制御(G&C)アーキテクチャに代わる有望な代替手段を提供する。 G&CNETのトレーニングでは、最適な軌道を模倣する行動クローニング(BC)と、試行錯誤を通じて最適な行動を学ぶ強化学習(RL)の2つの主要なパラダイムが出現する。我々は、連続スラスト宇宙船軌道最適化タスクにおいて、特にG&CNETを訓練するために、BCとRLを体系的に評価する。我々は、G&CNETに適した新しいRLトレーニングフレームワークを導入し、報酬とともに分離されたアクションと制御周波数を取り入れた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:43:38 GMT)
OMNISEC: LLM-Driven Provenance-based Intrusion Detection via Retrieval-Augmented Behavior Prompting [4.7]
Provenance-based Intrusion Detection Systems (PIDS) はエンドポイントの脅威分析に広く利用されている。攻撃手法の進化により、ルールは攻撃者の全ての特性を動的にモデル化することはできない。異常検出システムは、通常の行動の変化と実際の攻撃行動とを区別できないため、重大な偽陽性問題に直面している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:40:20 GMT)
Attention-Based Fusion of IQ and FFT Spectrograms with AoA Features for GNSS Jammer Localization [4.7]
ジャミング装置はグローバルナビゲーション衛星システム(GNSS)からの信号を妨害する古典アングル・オブ・アーリバル (AoA) 法はマルチパス環境において精度を低下させる。本研究では,ジャミング源の距離,方位,標高を推定しながら干渉の検出と分類を行う新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:44:20 GMT)
Deep RL Dual Sourcing Inventory Management with Supply and Capacity Risk Awareness [4.6]
介入モデルを利用して大規模最適化問題に強化学習(RL)を効率的に適用する方法を検討する。我々は,サプライチェーン最適化におけるマルチソース多周期在庫管理問題である,現実世界の挑戦的アプリケーションに対するアプローチを実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:26:31 GMT)
A Social Data-Driven System for Identifying Estate-related Events and Topics [4.5]
本稿では、ソーシャルメディアコンテンツから不動産関連事象を検出し分類するための言語モデルに基づくシステムを提案する。我々のシステムは階層的な分類フレームワークを用いて、まず関連するポストをフィルタリングし、それらを実行可能な不動産関連トピックに分類する。この統合されたアプローチは、都市管理、運用対応、状況認識のためのタイムリーでデータ駆動的な洞察をサポートする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:48:42 GMT)
FedWSQ: Efficient Federated Learning with Weight Standardization and Distribution-Aware Non-Uniform Quantization [4.5]
フェデレートラーニング(FL)は、データ不均一性や通信制約といった重要な課題により、しばしばパフォーマンス劣化に悩まされる。 We present a novel FL framework called FedWSQ, which integrates weight standardization (WS) and the proposed distribution-aware non-uniform Quantization (DANUQ)。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:52:09 GMT)
A Collaborative Framework Integrating Large Language Model and Chemical Fragment Space: Mutual Inspiration for Lead Design [4.5]
AutoLeadDesignは、化学フラグメントを持つ大規模言語モデルでエンコードされた広範なドメイン知識を刺激する鉛化合物設計フレームワークである。 2つの臨床関連ターゲット(PRMT5とSARS-CoV-2 PLpro)をターゲットにした実験的な鉛設計キャンペーンは、リード化合物のデノボ生成におけるAutoLeadDesignの能力を示している。設計プロセスのトレースにより、AutoLeadDesignは、伝統的に専門家の意思決定に依存しているフラグメントベースのドラッグデザインと類似したメカニズムを共有していることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:22:33 GMT)
CHIMERA: Compressed Hybrid Intelligence for Twin-Model Enhanced Multi-Agent Deep Reinforcement Learning for Multi-Functional RIS-Assisted Space-Air-Ground Integrated Networks [4.4]
マルチファンクショナル再構成可能なインテリジェントサーフェス(MF-RIS)を用いて,空間空地ネットワーク(SAGIN)アーキテクチャを提案する。 MF-RISは同時に増幅し、収穫し、無線エネルギーを供給できる。 CHIMERAスキームは従来のベンチマークよりも大幅に優れている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:40:56 GMT)
Exploring Large Language Models for Analyzing and Improving Method Names in Scientific Code [4.4]
LLM(Large Language Models)の最近の進歩は、コード分析タスクを自動化する新しい機会を提供する。そこで本研究では,Python ベースの Jupyter Notebooks から抽出した 496 のメソッド名に対して,文法パターンの解析能力に関する4つの LLM の評価を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:33:49 GMT)
A Coalition Game for On-demand Multi-modal 3D Automated Delivery System [4.4]
都市環境におけるラストマイル配送に対処するため、2つのオーバーレイネットワークで運用するUAVとADRの連合ゲームを導入する。戦略的協調が全体のルーティング効率をいかに向上させるかを把握するためのモード間の協調構造について検討する。ミシサガ市におけるケーススタディの結果から,ラストマイル配送の応用に関するいくつかの数値実験が実施されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:52:59 GMT)
Spectral Algorithms under Covariate Shift [4.3]
スペクトルアルゴリズムはスペクトル正則化技術を利用してデータを分析・処理する。トレーニングデータとテストデータの分布が異なる場合のスペクトルアルゴリズムの収束挙動について検討する。本稿では,密度比情報を学習プロセスに組み込んだ正規化重み付き新しい重み付きスペクトルアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:33:16 GMT)
Physically Consistent Image Augmentation for Deep Learning in Mueller Matrix Polarimetry [4.3]
ミューラー行列偏光法は、試料との偏光相互作用に関する重要な情報を取得する。回転やフリップのような標準的な変換は、ミューラー行列像の偏光特性を保たない。物理的に一貫した回転とフリップをミュラー行列に適用する多目的シミュレーションフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:48:00 GMT)
ReasonVQA: A Multi-hop Reasoning Benchmark with Structural Knowledge for Visual Question Answering [4.3]
本稿では,視覚質問応答(VQA)タスクのための新しいデータセットReasonVQAを提案する。我々のデータセットは構造化百科事典の知識と自動的に統合され、低コストのフレームワークを用いて構築される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:55:09 GMT)
Improving ASP-based ORS Schedules through Machine Learning Predictions [4.2]
手術室スケジューリング(ORS)問題は、日常手術室の手術スケジュールの最適化を扱う。異なる手術の開始時刻を決定し、必要なリソースを割り当てることなど、多くの制約の対象となる難しい問題である。我々は、過去のデータから手術期間を予測する機械学習アルゴリズムを用いて、仮スケジュールを計算する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:56:46 GMT)
Broadband Relaxation Dynamics of Boron-Vacancy Centers in Hexagonal Boron Nitride [4.2]
六方晶窒化ホウ素(mathrmhBN$)の負電荷のホウ素空孔センター(mathrmV_B-$)は、量子センシングの潜在的な応用に注目されている。本研究では, 温度15～250ドルK, 磁場7～250ドルTに対するmathrmV_B-$中心のスピン緩和ダイナミクスについて検討した。この結果は,2次元スピン欠陥プラットフォームに基づく高磁場サブテラヘルツ量子センサへの道を開いた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:31:26 GMT)
Emerging Frameworks for Objective Task-based Evaluation of Quantitative Medical Imaging Methods [4.2]
定量的イメージング(QI)は、複数の臨床応用において強い将来性を示している。 QI法の臨床翻訳には,臨床関連課題に対する客観的評価が不可欠である。 QI手法の評価研究を行うための4つの新しいフレームワークについて概説する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:47:46 GMT)
Satellite Connectivity Prediction for Fast-Moving Platforms [4.1]
衛星接続は、航空機、車両、列車などの高速移動物体にとって重要である。このような場合の信頼性の高い接続を維持するには、衛星ビーム、星座、軌道の切り替えを頻繁に行う必要がある。機械学習(ML)アルゴリズムは、過去の接続データを分析し、特定の場所でネットワーク品質を予測する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:33:48 GMT)
Improving Model Classification by Optimizing the Training Dataset [4.0]
Coresetsはデータ削減に対する原則的なアプローチを提供し、大規模なデータセットでの効率的な学習を可能にする。下流の分類品質を向上させるために,コアセット生成プロセスを調整するための体系的なフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:10:11 GMT)
Quantum Dark Magic: Efficiency of Intermediate Non-Stabiliserness [4.0]
本稿では, 様々なアルゴリズムにおける非安定性の挙動を追跡する手法を提案する。構造的および非構造的変動的アプローチに対する非安定化性の使用において、異なる効率性を見出した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:52:11 GMT)
Unidirectional perfect absorption induced by chiral coupling in spin-momentum locked waveguide magnonics [3.9]
キラルマグノン-光子カップリングは、イットリウム鉄ガーネット(YIG)球面のマグノンモードとスピンモメンタム同期導波管モードとを結合させることにより実現される。本研究は, スピンモメンタムロックデバイス内でのキラル光-マター相互作用を探索し, 利用するための新しいプラットフォームを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:33:48 GMT)
Divisive Decisions: Improving Salience-Based Training for Generalization in Binary Classification Tasks [3.9]
既存のサリエンシ誘導訓練手法は、モデルのクラスアクティベーションマップ(CAM)と人間の参照サリエンシマップを比較する損失項を組み込むことで、モデル一般化を改善する。以前の作業では、誤ったラベルクラスのために得られたモデルの正当性である偽クラスCAM(s)を無視していた。本仮説は,真偽クラスモデルのCAMをトレーニング戦略に取り入れ,重要な特徴を識別するための新しいポストホックツールである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:17:08 GMT)
eX-NIDS: A Framework for Explainable Network Intrusion Detection Leveraging Large Language Models [3.8]
本稿では,フローベースネットワーク侵入検知システム(NIDS)における解釈可能性を高めるためのフレームワークであるeX-NIDSを紹介する。提案フレームワークでは、NIDSによって悪意のあるものとしてラベル付けされたフローは、最初にPrompt Augmenterと呼ばれるモジュールによって処理される。このモジュールは、これらのフローからコンテキスト情報とサイバー脅威インテリジェンス(CTI)関連の知識を抽出する。このリッチでコンテキスト固有のデータは、LLMの入力プロンプトと統合され、NIDSによってフローが悪質であると認識された理由の詳細な説明と解釈を生成できる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:26:21 GMT)
Leveraging Personalized PageRank and Higher-Order Topological Structures for Heterophily Mitigation in Graph Neural Networks [3.8]
グラフニューラルネットワーク(GNN)はノード分類タスクに優れるが、接続ノードが同様のラベルを共有するホモフィリーを仮定することが多い。ヘテロ親和グラフの既存のモデルは、主に高階構造からのマルチスケール情報を見渡すペアワイズ関係に依存している。我々は高階パーソナライズされたPageRankとグラフニューラルネットワークを組み合わせた新しいモデルHPGNNを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:28:18 GMT)
Custom Algorithm-based Fault Tolerance for Attention Layers in Transformers [3.7]
トランスフォーマーと大規模言語モデル(LLM)は、多数のAIアプリケーションを変換し、特別なハードウェアアクセラレーターの必要性を高めている。これらのアクセラレーターの大きな課題は、ランダムなハードウェア故障によるエラーを効率的に検出することである。従来のアルゴリズムベースのフォールトトレランス(ABFT)技術は、個々の行列乗法を検証するが、完全な注意機構を扱うには不十分である。本研究は,注目層のクエリ,キー,値行列の3つの行列全体のオンライン正規化を,単一のチェックで計算する新しい手法であるFlash-ABFTを提案する。 Flash-ABFTはハードウェアの5.3%のオーバヘッドしか発生しない
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:11:13 GMT)
Toward Realistic Evaluations of Just-In-Time Vulnerability Prediction [3.6]
Just-in-timeの脆弱性予測(JIT-VP)は、脆弱性のあるコミットを特定し、潜在的なセキュリティリスクを早期に警告する、積極的なアプローチである。本研究は,脆弱性関連コミットと脆弱性中立コミットの両方を含む,より現実的な設定でJIT-VP技術の有効性を評価する。 8つの最先端JIT-VP技術に関する実証分析により,実環境に適用した場合の予測性能が著しく低下することが判明した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:23:35 GMT)
Automatic Fine-grained Segmentation-assisted Report Generation [3.6]
本稿では,レポート生成のためのLLaVAアーキテクチャの拡張であるASaRGを紹介する。提案手法は,LLaVAベースラインに比べてCE F1スコアが0.89%向上した。私たちのコードは後日公開される予定です。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:16:20 GMT)
Survival Modeling from Whole Slide Images via Patch-Level Graph Clustering and Mixture Density Experts [3.6]
スライド画像全体(WSI)から癌特異的生存を予測するためのモジュラーフレームワークを提案する。大規模なWSIに対処するために,Quantile-based thresholding を用いた動的パッチ選択を用いて予後情報組織領域を分離する。第3に、局所的な特徴を文脈化するために、クラスタ内関係とクラスタ間関係の両方をモデル化する注意機構を用いる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:32:36 GMT)
IPPRO: Importance-based Pruning with PRojective Offset for Magnitude-indifferent Structural Pruning [3.6]
重要度と多くの関連した近代的重要度基準は、しばしば刈り取り決定の能力を制限する。本稿では,この支配的効果に挑戦する新しい刈り取り戦略を提案し,各フィルターの刈り取りに公正な機会を与える。我々の研究は、プルーニングにおけるサイズマッターの神話を誇示し、重要ベースのプルーニングのフロンティアを広げている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:37:08 GMT)
Feature Construction Using Network Control Theory and Rank Encoding for Graph Machine Learning [3.5]
グラフにおける平均制御可能性の概念と、新しいランクエンコーディング手法を用いて、ソーシャルネットワーク分類タスクにおけるグラフニューラルネットワーク(GNN)の性能を向上させる。その結果,機能空間に平均制御性を導入することで,GNNの性能が大幅に向上することが示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:51:41 GMT)
AI for Better UX in Computer-Aided Engineering: Is Academia Catching Up with Industry Demands? A Multivocal Literature Review [3.5]
Computer-Aided Engineering (CAE)は、シミュレーションの専門家が複雑なモデルを最適化することを可能にするが、効率とアクセシビリティを制限するユーザエクスペリエンス(UX)の課題に直面している。人工知能(AI)はCAEプロセスを強化する可能性を実証しているが、これらの分野とUXに焦点を当てた研究はいまだに断片化されている。本稿では,CAEソフトウェアにおけるAIのUX向上に関する多言語文献レビュー(MLR)について,学術研究と産業実装の両面で検討する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:39:45 GMT)
Harmonization in Magnetic Resonance Imaging: A Survey of Acquisition, Image-level, and Feature-level Methods [3.5]
バッチ・エフェクト」または「サイト・エフェクト」は、真の生物学的信号の曖昧さ、統計力の低下、学習ベースモデルに障害がある。画像調和は、意味のある生物学的情報を保持しながら、そのようなサイト関連バイアスを排除または緩和することを目的としている。本総説では, 医用画像調和分野における重要な概念, 方法論の進歩, 公開データセット, 現状の課題, 今後の方向性について概説する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:06:02 GMT)
SoK: Concurrency in Blockchain -- A Systematic Literature Review and the Unveiling of a Misconception [3.5]
並行性と並列性は両刃の剣である。スループットが向上する一方で、競合条件や非決定性、デッドロックやライブロックといった脆弱性も導入されている。本稿では、スマートコントラクトに関する最初の調査を行い、重要な側面に整理された体系的な文献レビューを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:22:11 GMT)
Conthereum: Concurrent Ethereum Optimized Transaction Scheduling for Multi-Core Execution [3.5]
Conthereumはブロック内並列トランザクション実行のための並行ソリューションである。 Conthereumの中心には、新しくて軽量で高性能なスケジューラがある。標準的な8コアマシンでは,計算能力の増大に伴い,ほぼ線形スループットが向上することを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:55:27 GMT)
On exploration of an interior mirror descent flow for stochastic nonconvex constrained problem [3.4]
ヘッセン障壁法とミラー降下法は連続流の離散近似として解釈できることを示す。厳密な相補性条件が成立すれば、これらの急激な定常点を回避できるような2つの十分な条件を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:18:19 GMT)
VulGuard: An Unified Tool for Evaluating Just-In-Time Vulnerability Prediction Models [3.4]
VulGuardは、脆弱性予測(JIT-VP)研究のためのGitHubリポジトリからのコミットの抽出、処理、分析を効率化する自動化ツールである。コミット履歴を自動的にマイニングし、きめ細かいコード変更、コミットメッセージ、ソフトウェアエンジニアリングメトリクスを抽出し、下流分析のためにフォーマットします。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:18:44 GMT)
Adapt, But Don't Forget: Fine-Tuning and Contrastive Routing for Lane Detection under Distribution Shift [3.4]
データセット間の分散シフトは、微調整中に破滅的な忘れ物を引き起こす可能性がある。本フレームワークは,分布毎に異なるモデルをトレーニングするよりも,パラメータをはるかに少なくしながら,ほぼ最適F1スコアを実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:39:15 GMT)
Towards Railway Domain Adaptation for LiDAR-based 3D Detection: Road-to-Rail and Sim-to-Real via SynDRA-BBox [3.4]
我々は,現実的な鉄道シナリオにおいて,物体検出やその他の視覚に基づくタスクを支援するために設計された合成データセットであるSynDRA-BBoxを紹介する。我々の知る限りでは、鉄道領域における2次元および3次元物体検出に適した、初めての合成データセットである。最先端の半教師付きドメイン適応法を鉄道状況に適用し、合成データの3次元オブジェクト検出への転送性を実現する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:04:49 GMT)
Quantitative Quantum Soundness for Bipartite Compiled Bell Games via the Sequential NPA Hierarchy [3.3]
両部構成されたベルゲーム毎に、最初の量子音響量境界を示す。より一般的には、全ての二部ゲームにおいて、コンパイルされたスコアが新しく定式化されたシーケンシャルなNavascu'es-Pironio-Ac'in階層によって与えられる境界を超えないことが示される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:31:41 GMT)
Rethinking LLM-Based RTL Code Optimization Via Timing Logic Metamorphosis [3.3]
RTL最適化の特定の領域に対応する4つのサブセットからなるRTL最適化評価のための新しいベンチマークを提案する。 LLMは論理演算を効果的に最適化し、既存のコンパイラベースのメソッドより優れている。 LLMは、複雑なタイミング論理を持つRTLコード上の既存のコンパイラベースのメソッドよりもパフォーマンスが良くない。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:57:02 GMT)
Interpretable Topic Extraction and Word Embedding Learning using row-stochastic DEDICOM [3.3]
テキストコーパスのポイントワイド相互情報行列にDEDICOMの行確率変化を導入し、潜在トピッククラスタを同定する。本稿では,制約付きDEDICOMアルゴリズムを効率的に学習する手法と,そのトピックモデリングと単語埋め込み性能の質的評価を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:30:32 GMT)
Introducing Quality Estimation to Machine Translation Post-editing Workflow: An Empirical Study on Its Usefulness [3.2]
英語・中国語機械翻訳後編集における文レベルの品質評価の有用性について検討した。その結果,QEは編集後時間を大幅に短縮することが明らかとなった。インタビューデータは、不正確なQEが後編集プロセスを妨げる可能性があることを示唆している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:25:00 GMT)
Canonical Correlation Patterns for Validating Clustering of Multivariate Time Series [3.2]
我々は、無限相関空間を有限の解釈可能な参照パターンに識別する数学的に定義された検証対象として正準相関パターンを導入する。制御条件を越えた完全基底真理を持つ合成データセットを用いて、正準パターンが信頼性のある検証ターゲットを提供することを示す。本研究は,高吸収領域における厳密な相関に基づくクラスタリング検証のための方法論的基礎を確立する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:51:48 GMT)
SiLQ: Simple Large Language Model Quantization-Aware Training [3.1]
大規模言語モデルは、推論時間遅延、モデルサイズ、エネルギー消費を減らすために定量化することができる。妥当な時間で精度の損失を最小限に抑えた量子モデルを提供することが課題である。ここでは、先行する量子化手法よりも優れた、単純でエンドツーエンドな量子化対応トレーニング手法を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:17:53 GMT)
Statistical Assertions for Debugging Quantum Circuits and States in CUDA-Q [3.1]
本稿では,Q-Qツールの統計的アサーションに基づくワークフローを提案する。我々のツールは、回路内の任意の点における量子ビットの状態に関する貴重な洞察を提供する。我々は、フィッシャーの正確なテストとモンテカルロ法を組み合わせることで、製品状態のアサーションの信頼性を向上させる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:09:56 GMT)
The Sweet Danger of Sugar: Debunking Representation Learning for Encrypted Traffic Classification [3.1]
本稿では、表現学習モデルを利用して交通表現を作成する提案を批判的に再評価する。 Pcap-Encoderは,プロトコルヘッダから特徴を抽出する,LMに基づく表現学習モデルである。この結果から,データセット作成とモデルトレーニングの欠陥が明らかとなり,より優れた,より意識的なテスト設計が求められた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:32:50 GMT)
Structural Effect and Spectral Enhancement of High-Dimensional Regularized Linear Discriminant Analysis [3.1]
正規化線形判別分析(RLDA)は、分類と次元減少のための広く使われているツールである。既存のRLDAの理論分析では、データ構造が分類性能に与える影響についての明確な洞察が欠けていることが多い。本稿では,より高度な分類精度と次元減少を実現するためのスペクトル拡張判別分析(SEDA)アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:16:48 GMT)
Enhancing supply chain security with automated machine learning [3.0]
本稿では,不正行為の検出,メンテナンスニーズの予測,材料バックオーダの予測によるサプライチェーンのセキュリティ向上を目的とした自動MLフレームワークを提案する。その結果, 不正検出はサンプリング手法による88%の精度, 機械故障予測は93.4%の精度, 材料後方予測は89.3%の精度を達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:22:57 GMT)
Deep Unfolding Network for Nonlinear Multi-Frequency Electrical Impedance Tomography [3.0]
本稿では,古典的反復的再構築の利点と解釈性を,深層学習の力と戦略的に融合させるモデルベース学習パラダイムを提案する。このアプローチは、グラフニューラルネットワーク(GNN)を、反復的プロキシ正規化ガウスニュートン(PRGN)フレームワークに統合する。特に、GNNアーキテクチャは、非線形フォワードモデルの解法で用いられる不規則な三角形メッシュ構造を保持し、重なり合う組織分画の正確な再構成を可能にする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:14:41 GMT)
Graph Neural Network-Based Distributed Optimal Control for Linear Networked Systems: An Online Distributed Training Approach [2.9]
グラフリカレントニューラルネットワーク(GRNN)を用いた離散時間線形ネットワークシステムの最適分散制御問題について検討する。まず、GRNNに基づく分散最適制御法を提案し、これを自己教師付き学習問題とみなし、その後、(合意に基づく)勾配にインスパイアされた計算によって分散オンライントレーニングを実現し、また、提案したGRNNベースの制御下での線形ネットワークシステムの閉ループ安定性を、GRNNベースの制御器の非線形活性化関数が局所セクター境界と傾斜制限の両方であると仮定して提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:45:36 GMT)
LLMxCPG: Context-Aware Vulnerability Detection Through Code Property Graph-Guided Large Language Models [2.9]
本稿では,コードプロパティグラフ(CPG)とLarge Language Models(LLM)を統合し,堅牢な脆弱性検出を行う新しいフレームワークを提案する。より簡潔で正確なコードスニペット表現を提供するアプローチの能力は、より大きなコードセグメントの分析を可能にします。実証的な評価は、検証済みデータセット間でLLMxCPGの有効性を示し、最先端のベースラインよりもF1スコアが15～40%改善されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:36:33 GMT)
Pre-Training LLMs on a budget: A comparison of three optimizers [2.8]
我々は、デファクト標準のAdamW、より単純なLion、そして2階のSophiaの3つの主要な変種を比較した。より良い一般化のために、私たちは2つの異なるベースアーキテクチャでトレーニングし、単一と複数エポックのアプローチを使用します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:48:53 GMT)
Diffusion-Based Electrocardiography Noise Quantification via Anomaly Detection [2.7]
ECGノイズに対処する既存の手法は、アーティファクト分類やデノナイジングに依存しており、アノテーションの不整合と一般化性に制約されている。クリーンなECG信号の正規分布をモデル化する拡散型フレームワークを提案し, 明示的なアーティファクトラベルを必要とせず, 偏差をノイズとして識別する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:48:23 GMT)
Constructing Quantum Many-Body Scars from Hilbert Space Fragmentation [2.7]
量子多体傷(QMBS)は異常な非熱的挙動を示すエキゾチック多体状態である。格子内の凍結領域を部分的に活性化する準粒子を注入することにより,正確なQMBSを構築することができることを示す。本研究により,量子多体散乱とヒルベルト空間断片化の直接接続が確立され,正確な近似QMBSを体系的に構築する方法が確立された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:50:20 GMT)
OPC: One-Point-Contraction Unlearning Toward Deep Feature Forgetting [2.7]
機械学習は、プライバシ、法的、倫理的要件を満たすために、訓練されたモデルから特定のデータやクラスの影響を取り除こうとする。既存の未学習の手法では、未学習モデルの現象は、モデル応答のみを調整することで、忘れるふりをする傾向がある。我々は,一点抽出(OPC)という新しい汎用的未学習アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:40:21 GMT)
Combined Image Data Augmentations diminish the benefits of Adaptive Label Smoothing [2.7]
本稿では,この適応ラベル平滑化フレームワークを,ランダムクロップ以外のアグレッシブ拡張に拡張する。この結果から, 適応ラベルの平滑化は, 訓練データ分布が限定的, 均質な画像変換型に支配される場合にのみ適用すべきであることが示唆された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:21:37 GMT)
Static Analysis for Detecting Transaction Conflicts in Ethereum Smart Contracts [2.7]
本稿では,スマートコントラクトにおける潜在的なトランザクション競合を検出するための新しい静的解析手法を提案する。本手法は,Solidity契約における状態変数アクセスパターンを解析することにより,書き込み,書き込み,関数呼び出しの競合を識別する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:40:15 GMT)
CTSL: Codebook-based Temporal-Spatial Learning for Accurate Non-Contrast Cardiac Risk Prediction Using Cine MRIs [2.7]
既存の方法は、心室心筋のヒト精製マスクに基づく教師あり学習を必要とする。セグメンテーションマスクを必要としない生のCineデータから学習する自己教師型フレームワーク,すなわちCodebookベースの時間空間学習(TSL)を導入する。高信頼度MACEリスク予測は我々のモデルにより達成され、心臓リスク評価のための迅速で非侵襲的なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:12:41 GMT)
An Experimental Study of Split-Learning TinyML on Ultra-Low-Power Edge/IoT Nodes [2.6]
スプリット学習(SL)は、センサ上の推論プロセスの一部を実行し、残りの部分を同伴装置にオフロードする。本稿では,Espressif ESP32-S3基板上に構築されたTinyML+SLテストベッドについて述べる。我々は、8ビット整数に量子化され、分割され、オーバー・ザ・エアの更新によってノードに配信されるMobileNetV2画像認識モデルの性能をベンチマークする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:50:12 GMT)
ViP$^2$-CLIP: Visual-Perception Prompting with Unified Alignment for Zero-Shot Anomaly Detection [2.6]
ゼロショット異常検出(ZSAD)は、外部補助データのみに依存するため、ターゲットドメインのトレーニングサンプルを使わずに異常を検出することを目的としている。既存のCLIPベースのメソッドは、手作りまたは静的学習可能なプロンプトを介してモデルのZSAD電位を活性化しようとする。 ViP$2$-CLIPは、グローバルおよびマルチスケールのローカルビジュアルコンテキストを融合させ、微粒なテキストプロンプトを適応的に生成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:34:53 GMT)
Towards Understanding the Challenges of Bug Localization in Deep Learning Systems [2.6]
我々は、ディープラーニングシステムにおけるバグのローカライズに関する課題をより深く理解するために、大規模な実証的研究を行っている。まず,ディープラーニングシステムの2,365バグと,従来のソフトウェアによる2,913バグを用いて,既存の4つのテクニックのバグローカライズ性能を判定する。第2に,ディープラーニングシステムにおけるバグタイプの違いが,バグのローカライゼーションに与える影響を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:00:53 GMT)
Recent Advances in Malware Detection: Graph Learning and Explainability [2.6]
この調査は、グラフ学習と説明可能性の間の相互作用に焦点を当てている。これらのコンポーネントを統合することで、グラフ学習と説明可能性が堅牢で解釈可能でスケーラブルなマルウェア検出システムの構築にどのように貢献するかを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:54:41 GMT)
Aitomia: Your Intelligent Assistant for AI-Driven Atomistic and Quantum Chemical Simulations [2.5]
AitomiaはAIを利用したプラットフォームで、AI駆動の原子論と量子化学(QC)シミュレーションの実行を支援する。チャットボットとAIエージェントを備えており、専門家や非専門家が原子論シミュレーションのセットアップと実行を支援する。相富は、原子論的なシミュレーションを行う際の障壁を低くし、シミュレーションを民主化し、関連する分野での研究と開発を加速することが期待されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:10:54 GMT)
Evaluating Generative AI Tools for Personalized Offline Recommendations: A Comparative Study [2.5]
ジェネレーティブAIツールは、さまざまなドメインでパーソナライズされたレコメンデーションをサポートすることに、ますます重要になっている。本研究は、反復的外傷のリスクがある個人に適した非デジタルアクティビティを推奨する場合、最も広く使用されている5つの生成AIツールの性能とユーザ満足度を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:47:26 GMT)
Towards Automated Regulatory Compliance Verification in Financial Auditing with Large Language Models [2.5]
我々は,様々なモデル構成における規制コンプライアンスの領域において,一般公開されたLarge Language Models (LLM) の効率性について検討する。オープンソースのLlama-270億モデルは,非コンプライアンスや真の負の発生を検出する上で,優れた性能を示す。 GPT-4のようなプロプライエタリなモデルは、特に非英語の文脈において、様々なシナリオで最高の性能を発揮する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:39:54 GMT)
Axiomatizing Rumsfeld Ignorance [2.5]
ラムスフェルト無知は無知という観点で定義可能であり、既存の結果と公理化問題は自明である。 2つのアクセシビリティ関係は、一方が他方の任意の部分集合であるように異なるものと仮定する。主な結果は、様々な適切な二フレームクラスに対する公理化である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:25:53 GMT)
Edge-case Synthesis for Fisheye Object Detection: A Data-centric Perspective [2.5]
フィッシュアイカメラは、大きな歪みを導入し、従来のデータセットでトレーニングされたオブジェクト検出モデルに固有の課題を提起する。本稿では,モデルの盲点を特定する上で重要な課題に着目し,検出性能を体系的に向上するデータ中心パイプラインを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:07:07 GMT)
Pixel-Resolved Long-Context Learning for Turbulence at Exascale: Resolving Small-scale Eddies Toward the Viscous Limit [2.5]
乱流は空気力学、核融合、燃焼など多分野の応用において重要な役割を果たしている。私たちの知る限り、これは乱流のための最初のAIモデルであり、小さな渦を散逸する範囲まで捉えることができる。これは乱流のための最初のAIモデルで、小さな渦を散逸範囲まで捉えることができる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:33:33 GMT)
From Cracks to Crooks: YouTube as a Vector for Malware Distribution [2.4]
本稿では、サイバー犯罪者がYouTubeを利用してマルウェアを拡散する方法について検討する。フリーソフトウェアやゲーム不正を促進するキャンペーンに焦点を当てている。自動検出システムを回避するために、YouTubeの多言語メタデータ機能を悪用する新しい回避テクニックを提示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:08:49 GMT)
Towards Accurate and Efficient 3D Object Detection for Autonomous Driving: A Mixture of Experts Computing System on Edge [2.4]
本稿では,低レイテンシかつ高精度な3Dオブジェクト検出を同時に実現する自律走行車(AV)のための最適計算システムを提案する。このシステムは、LiDARとカメラデータを効果的に融合させることで、スパース3D点雲と高密度2D画像の相補的な強度を利用して、堅牢なマルチモーダル表現を生成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:29:09 GMT)
Large-scale stochastic simulation of open quantum systems [2.3]
本稿では,大規模オープン量子系をシミュレーションするスケーラブルで恥ずかしい並列アルゴリズムであるテンソルジャンプ法(TJM)を紹介する。この研究は、大規模オープン量子システムのシミュレーションにおける重要な一歩である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:14:08 GMT)
CIMR: Contextualized Iterative Multimodal Reasoning for Robust Instruction Following in LVLMs [2.2]
CIMRは、コンテキスト対応の反復推論と自己補正モジュールを導入した、新しいフレームワークである。 CIMRの精度は91.5%で、GPT-4V、LLaVA-1.5、MiniGPT-4、InstructBLIPなどの最先端モデルを上回る。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:39:18 GMT)
Harnessing RLHF for Robust Unanswerability Recognition and Trustworthy Response Generation in LLMs [2.2]
本稿では, 自己認識型無解性学習システム(SALU)を導入し, 生成過程に直接不解性検出を深く統合する手法を提案する。 SALUは、標準的な質問回答(QA)と、解決不可能なクエリに対する明示的な棄権生成の両方のために、マルチタスク学習フレームワークを使用して訓練されている。ハイブリッド LLM-classifier システムを含む強力なベースラインを一貫して上回り、質問に対する正しい回答や棄却の全体的な精度を向上する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:44:18 GMT)
Fine-Grained Alignment and Noise Refinement for Compositional Text-to-Image Generation [2.1]
テキスト制約を考慮に入れた目標を組み込んだ,革新的な学習自由度手法を提案する。本手法は,提案する目的関数にのみ依存し,構成性を大幅に向上し,人的評価の24%向上を実現した。私たちのきめ細かいノイズ改善は効果を証明し、パフォーマンスを最大5%向上させます。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:17:37 GMT)
The Unified Cognitive Consciousness Theory for Language Models: Anchoring Semantics, Thresholds of Activation, and Emergent Reasoning [2.1]
大規模言語モデル(LLM)は潜在パターンの膨大なリポジトリであるが、構造化されたガイダンスがなければ、明確な推論、セマンティックグラウンド、ゴール指向インテリジェンスが欠如している。統一認知意識理論(UCCT: Unified Cognitive Consciousness Theory)は、LCMを外部メカニズム、少数ショットプロンプト、RAG、微調整、マルチエージェント推論を必要とする無意識の基質として再解釈する統一モデルである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:57:05 GMT)
Benchmarking machine learning models for predicting aerofoil performance [2.0]
本稿では,風力・潮流エネルギー産業におけるエアロフォイルの性能を解析するための従来の手法の代替としてニューラルネットワーク(NN)の有用性について検討する。本研究では,4つのニューラルネットワーク(MLP,PointNet,GraphSAGE,GUNet)を攻撃角度25角で訓練し,流体流の予測とリフト係数の算出を行う。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:40:20 GMT)
CL-Polyp: A Contrastive Learning-Enhanced Network for Accurate Polyp Segmentation [2.0]
CL-Polypを提案する。本手法は, コントラスト学習を用いて, エンコーダの識別的特徴抽出を強化する。臨床ポリープセグメンテーションにおける最先端の手法を一貫して超越している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:47:49 GMT)
Do Large Language Models Have a Planning Theory of Mind? Evidence from MindGames: a Multi-Step Persuasion Task [2.0]
我々は、MindGames: a novel planning theory of Mind (PToM) taskを提示する。ヒトはPTOMタスクにおいて,o1-preview(LLM)を著しく上回っていることがわかった。これらの結果は、人間のような社会的推論と心の理論の間に大きなギャップがあることを示唆している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:15:27 GMT)
LangBiTe: A Platform for Testing Bias in Large Language Models [2.0]
大規模言語モデル(LLM)は、フォーラム、ウェブサイト、ソーシャルメディア、その他のインターネットソースから抽出された膨大な量のデータに基づいて訓練されている。 LangBiTeを使うことで、開発チームはテストシナリオを調整し、ユーザ定義の倫理的要件に従ってテストケースを自動生成し、実行することが可能になる。 LangBiteは、LLMのバイアス評価と、最初の倫理的要件と得られた洞察の間のエンドツーエンドトレーサビリティを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:10:18 GMT)
Multimodal Coordinated Online Behavior: Trade-offs and Strategies [2.0]
協調したオンライン行動は、デジタルエコシステム分析において重要な焦点となっている。伝統的な手法は、単一のタイプの相互作用に焦点をあてて、しばしばモノモーダルなアプローチに依存する。本研究では,多モード協調動作検出の動作方法の比較を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:38:15 GMT)
Learning from Data Streams: An Overview and Update [1.9]
教師付きデータストリーム学習の基本的定義と設定を再構築する。教師付きデータストリーム学習タスクを構成するものについて、新たに検討する。データストリームから学ぶことは、シングルパスやオンライン学習のアプローチを強制しない、という点が主な重点です。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:44:07 GMT)
Quantum Entrepreneurship Lab: Training a Future Workforce for the Quantum Industry [1.9]
量子起業研究所(Quantum Entrepreneurship Lab, QEL)はミュンヘン工科大学(TUM)の1学期制のプロジェクトベースコースである。 QELは、量子セクターにおける学術研究と産業応用のギャップを埋めることを目的としている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:04:07 GMT)
Benchmarking pig detection and tracking under diverse and challenging conditions [1.9]
オブジェクト検出のためのPigDetectと、マルチオブジェクト追跡のためのPigTrackの2つのデータセットをキュレートした。対象物検出では,ランダムなサンプル画像のみを用いて達成可能なものよりも,困難なトレーニング画像により検出が向上することを示す。マルチオブジェクト追跡において,SORTに基づく手法は,エンドツーエンドのトレーニング可能なモデルに比べて優れた検出性能が得られることを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:36:51 GMT)
Few-Shot Learning in Video and 3D Object Detection: A Survey [1.9]
少ないショット学習により、オブジェクト検出モデルでは、いくつかの例でのみ与えられた新しいクラスを認識できる。少ない3D検出により、コストのかかる3Dアノテーションの必要性を最小限に抑えることで、実用的な自動運転の展開が可能になる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:37:20 GMT)
Novel Multi-Agent Action Masked Deep Reinforcement Learning for General Industrial Assembly Lines Balancing Problems [1.8]
本稿では,マルコフ決定過程 (MDP) として定式化された汎用産業組立ラインの数学的モデルを提案する。提案モデルは,タスクとリソーススケジューリングを最適化するために,深層強化学習(DRL)エージェントを訓練するための仮想環境を構築するために使用される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:34:36 GMT)
Adaptive Inventory Strategies using Deep Reinforcement Learning for Dynamic Agri-Food Supply Chains [1.8]
本研究は,アグリフード製品の在庫管理とリードタイムの不確実性に着目した。価値とポリシーに基づくDRLアプローチの両方の利点を、不確実性下での在庫最適化に組み合わせた、新しいDeep Reinforcement Learning (DRL)アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:02:54 GMT)
Modeling the Sacred: Considerations when Using Religious Texts in Natural Language Processing [1.8]
宗教的な文章は文化的に重要な価値の表現である。機械学習モデルは、トレーニングデータにエンコードされた文化的価値を再現する確率を持っている。本稿は,NLPによるこのようなテキストの使用が,モデルバイアスを超えた考察を提起するものであることを論じる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:58:13 GMT)
Spiking neurons as predictive controllers of linear systems [1.8]
現在のスパイク制御は、アナログ制御を近似するためにスパイク信号のフィルタリングに依存する。本稿では,スパース神経活動を伴うタスク特異的スパイキング制御のためのスケーラブルな方法を提案する。物理的に制約されたシステムでは、予測制御が必要であり、制御信号は最終的に下流システムの受動力学を利用して目標に到達する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:50:11 GMT)
Sparser2Sparse: Single-shot Sparser-to-Sparse Learning for Spatial Transcriptomics Imputation with Natural Image Co-learning [1.8]
本稿では,S2S-ST(Single-shot Sparser-to-Sparse)について述べる。我々のフレームワークは、コトレーニングのために広く利用可能な自然画像とともに、単一かつ低コストでサンプル化されたSTデータセットのみを必要とする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:58:38 GMT)
LLM-Enhanced Reranking for Complementary Product Recommendation [1.7]
本稿では,Large Language Models (LLMs) を利用したモデルに依存しないアプローチを提案する。当社のアプローチは、補完的な製品レコメンデーションにおける正確性と多様性のバランスを効果的に保ち、少なくとも50%の精度測定値、2%の多様性測定値がデータセット全体を対象とした推奨項目の平均で上昇していることを実証しています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:15:45 GMT)
Network Analytics for Anti-Money Laundering -- A Systematic Literature Review and Experimental Evaluation [1.7]
本稿では,Web of Science and Scopus の97論文をもとに,広範囲かつユニークな文献レビューを行う。我々は、ほとんどの研究はエキスパートベースのルールと手動の機能に依存していると結論付け、ディープラーニングの手法は勢いを増している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:16:19 GMT)
ReMi: A Random Recurrent Neural Network Approach to Music Production [1.7]
生成的人工知能は、エネルギー消費、著作権侵害、創造的萎縮に関する懸念を提起する。音楽家を置き換えることを目的としたエンドツーエンドの音楽生成とは対照的に、我々のアプローチはデータの不要さと計算能力の低下を両立させながらクリエイティビティを高める。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:56:12 GMT)
Holstein mechanism in single-site model with unitary evolution [1.7]
単電子系におけるホルスタイン機構について検討し, 一元的進化は非断熱条件下でのフェルミオンとボソン作用素の両方に本質的に関係することを示した。結果として生じるユニタリダイナミクスとボソン周波数依存は、異なる短時間(強弱崩壊)と長時間(指数崩壊)の挙動によって証明された量子相転移を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:07:00 GMT)
Temporally Consistent Dynamic Scene Graphs: An End-to-End Approach for Action Tracklet Generation [1.7]
TCDSG、Temporally Consistent Dynamic Scene Graphsは、時間を通して対象と対象の関係を検出し、追跡し、リンクするエンドツーエンドのフレームワークである。私たちの研究は、マルチフレームビデオ分析における新しい標準を設定し、監視、自律ナビゲーションなどにおける、高インパクトなアプリケーションのための新たな道を開く。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:23:25 GMT)
Attacking interpretable NLP systems [1.5]
本稿では,解釈可能な自然言語処理システムに対するブラックボックス攻撃であるAdvCharを紹介する。本稿では,AdvCharが入力サンプルの平均で2文字だけ変更することで,現在のディープラーニングモデルの予測精度を大幅に低減できることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:20:00 GMT)
Shared Control of Holonomic Wheelchairs through Reinforcement Learning [1.5]
最先端の研究は、非ホロノミックロボットのナビゲーションの安全性を向上させるための共有制御の可能性を示した。本稿では,2次元ユーザ入力と3次元モーション出力を併用した強化学習手法を提案する。本手法は,車いすをスマートに配向し,良好なスムーズさや競争力のあるスムーズさを示すとともに,衝突のないナビゲーションを確実にすることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:31:11 GMT)
Optimization of DNN-based HSI Segmentation FPGA-based SoC for ADS: A Practical Approach [1.5]
本研究では,FPGA ベースの SOC 上にデプロイされた DNN ベースの HSI セグメンテーションプロセッサの実用的共同設計のための最適化手法を提案する。応用圧縮技術により設計されたDNNの複雑さは、元の操作の24.34%、元のパラメータの1.02%に大幅に減少し、セグメンテーション精度を著しく低下させることなく、推論タスクの2.86倍のスピードアップを達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:09:04 GMT)
Balancing Robustness and Efficiency in Embedded DNNs Through Activation Function Selection [1.5]
安全クリティカルなアプリケーションのための機械学習ベースの組み込みシステムは、ソフトエラーによる摂動に対して堅牢でなければならない。ハイパースペクトル画像のセマンティックセグメンテーションのために開発されたエンコーダ・デコーダ畳み込みモデルと自律運転システムへの応用に焦点を当てた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:50:19 GMT)
ACT: Bridging the Gap in Code Translation through Synthetic Data Generation & Adaptive Training [1.5]
Auto-Train for Code Translation (ACT)は、オープンソースのLarge Language Models (LLM)を社内で微調整することで、コード翻訳機能を改善することを目的としている。 ACTの自動パイプラインはこれらのモデルの性能を大幅に向上させ、オープンソースアクセシビリティとクローズドソースソリューションのパフォーマンスのギャップを狭める。我々の結果は、ACTがオープンソースモデルの有効性を一貫して強化し、企業や開発者が安全で信頼性の高い代替手段を提供することを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:35:35 GMT)
A Partitioned Sparse Variational Gaussian Process for Fast, Distributed Spatial Modeling [1.5]
次世代のエネルギースーパーコンピュータは、エクサスケール計算が可能である。これらのマシンでは、ディスクに保存できるものよりもはるかに多くの計算が可能になります。その場でトレーニングできる機械学習アルゴリズムには、緊急に必要なものがあります。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:20:07 GMT)
GG-BBQ: German Gender Bias Benchmark for Question Answering [1.5]
ドイツ語大言語モデル(LLM)における性別バイアスを,Parrishらによる質問回答のためのバイアスベンチマークを用いて評価した。特に、この英語データセットの性同一性サブセットのテンプレートは、機械でドイツ語に翻訳された。性別バイアス評価のためのデータセットを作成する際には,手作業による翻訳の改訂が不可欠であることがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:02:28 GMT)
Denoising-While-Completing Network (DWCNet): Robust Point Cloud Completion Under Corruption [1.4]
ポイントクラウドの完成は、自動運転、拡張現実、ロボット工学における3Dコンピュータビジョンタスクにとって不可欠である。既存のコンプリートネットワークは、合成データに基づいて訓練されており、現実世界の劣化に苦戦している。本稿では,ノイズ管理モジュールで拡張された補完フレームワークDWCNetを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:34:21 GMT)
Prompt4Trust: A Reinforcement Learning Prompt Augmentation Framework for Clinically-Aligned Confidence Calibration in Multimodal Large Language Models [1.4]
Prompt4Trustは,MLLMにおける信頼度校正をターゲットとした即時強化のための,最初の強化学習フレームワークである。従来のキャリブレーション技術とは異なり、Prompt4Trustは安全で信頼性の高い臨床診断に最も重要なキャリブレーションの側面を特に優先している。実験では,より大きなMLLMに対してゼロショットの一般化が期待できることを示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:52:39 GMT)
A Mixed-Order Phase Transition in Continuous-Variable Quantum Networks [1.4]
量子ネットワーク(QN)は、主に離散可変(DV)アーキテクチャによって駆動されている。エンタングルメント・パーコレーションの新形式-ネガティビティ・パーコレーション理論(NegPT)を提案する。我々は,NegPTは,大域的絡み合いの急激な変化とノード間の長距離相関によって同時に,混合次相転移を示すことを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:09:21 GMT)
Time to Split: Exploring Data Splitting Strategies for Offline Evaluation of Sequential Recommenders [1.4]
シーケンシャルなレコメンデーションのための共通評価プロトコルは、現実世界のシナリオと一致しない。グローバルな時間分割は、これらの問題を、異なる将来の期間に基づいて評価することで解決する。以上の結果から, 離脱や離脱などの分裂は, より現実的な評価戦略と十分に一致していない可能性が示唆された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:20:52 GMT)
Physical models realizing the transformer architecture of large language models [1.4]
2017年のトランスフォーマーアーキテクチャの導入は、自然言語処理の最も顕著な進歩となった。我々は、トークンのヒルベルト空間上のフォック空間におけるオープン量子系として、トランスフォーマーアーキテクチャに基づいて、大きな言語モデルを実現する物理モデルを構築する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:01:10 GMT)
Quantum Computational-Sensing Advantage [1.4]
量子センシングと量子コンピューティングの融合は、最近量子コンピューターセンシングの概念を生み出した。この利点は純粋に計算量子優位性よりもはるかに低いハードウェア要求で実現できる。我々は、量子計算センサと量子計算センシングの利点の展望を概観して結論付けている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:02:06 GMT)
SFNet: A Spatio-Frequency Domain Deep Learning Network for Efficient Alzheimer's Disease Diagnosis [1.3]
アルツハイマー病(英語: Alzheimer's disease、AD)は、高齢者に主に影響を及ぼす進行性神経変性疾患である。 SFNetは、空間領域情報と周波数領域情報を同時に利用して、3D MRIベースのAD診断を強化する最初のエンドツーエンドディープラーニングフレームワークである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:33:00 GMT)
ORANSight-2.0: Foundational LLMs for O-RAN [1.3]
ORANSight-2.0 は Open Radio Access Networks (O-RAN) 向けに特別に開発された LLM を開発する先駆的イニシアチブである。 ORANSight-2.0ファインチューンモデルは1Bから70Bパラメータの範囲で、プロプライエタリなクローズドソースモデルへの依存を著しく低減した。 ORANSight-2.0のコアとなるRANSTRUCTは、RAG(Retrieval-Augmented Generation)ベースの命令チューニングフレームワークである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:40:41 GMT)
V-RoAst: Visual Road Assessment. Can VLM be a Road Safety Assessor Using the iRAP Standard? [1.3]
道路安全評価は、特に低所得国・中所得国(LMICs)では、重要だが費用がかかる従来の手法では、専門家のアノテーションとトレーニングデータが必要であるが、教師付き学習ベースのアプローチでは、地域をまたいだ一般化が困難である。道路安全属性を分類するために視覚言語モデル (VLM) を用いたゼロショット視覚質問応答フレームワークである textitV-RoAst を導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:18:50 GMT)
Steering Out-of-Distribution Generalization with Concept Ablation Fine-Tuning [1.3]
微調整された大きな言語モデルは意図しないアウト・オブ・ディストリビューションの一般化につながる可能性がある。本稿では,LCMがファインチューニングからどのように一般化するかを制御するために,CAFT(Concept Ablation Fine-Tuning)を導入する。 CAFTは、微調整中に線形射影の概念を非難し、意図しない一般化からモデルを遠ざける。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:45:04 GMT)
AUTOPSY: A Framework for Tackling Privacy Challenges in the Automotive Industry [1.3]
AUTOPSYプロジェクトは、自動車分野におけるプライバシーエンジニアリングプロセスをサポートすることであった。本稿では,プライバシ技術(PET)の強化を目的としたプロジェクトの結果について述べる。さらに、アーキテクチャの配置フレームワークを評価するために、データベースのサービスのためのデモレータを構築しました。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:32:20 GMT)
Ownership Verification of DNN Models Using White-Box Adversarial Attacks with Specified Probability Manipulation [1.3]
画像分類タスクのためのディープニューラルネットワーク(DNN)モデルのオーナシップ検証のための新しいフレームワークを提案する。これにより、元のモデルを提示することなく、正当な所有者と第三者の両方によるモデルの同一性を検証することができる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:25:39 GMT)
AI-based Clinical Decision Support for Primary Care: A Real-World Study [1.3]
介護における大規模言語モデルに基づく臨床意思決定支援の効果について検討した。我々は、潜在的なドキュメンテーションと臨床的意思決定エラーを特定することによって、臨床医の安全ネットとして機能するツールであるAI Consultを研究した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:37:33 GMT)
Typed-RAG: Type-Aware Decomposition of Non-Factoid Questions for Retrieval-Augmented Generation [1.3]
非ファクトイド質問(NFQ)の型認識分解のためのフレームワークであるTyped-RAGを提案する。具体的には、Typed-RAGはNFQを事前に定義された型に分類する。その後、質問を集中サブクエリに分解し、それぞれが1つの側面にフォーカスする。これらのサブクエリの結果を組み合わせることで、Typed-RAGはより情報的かつ文脈的に整合した応答を生成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:37:29 GMT)
NeuroHD-RA: Neural-distilled Hyperdimensional Model with Rhythm Alignment [1.2]
心電図(ECG)に基づく疾患検出のための新規かつ解釈可能な枠組みを提案する。本稿では、RR間隔に基づくリズム認識およびトレーニング可能な符号化パイプライン、生理学的信号セグメンテーション戦略を導入する。我々のフレームワークは、エッジ互換のECG分類のための効率的でスケーラブルなソリューションを提供し、解釈可能でパーソナライズされた健康モニタリングの強力な可能性を秘めている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:00:46 GMT)
Uncertainty-Aware Knowledge Transformers for Peer-to-Peer Energy Trading with Multi-Agent Reinforcement Learning [1.2]
本稿では、不確実性認識予測とマルチエージェント強化学習(MARL)を統合したピアツーピア(P2P)エネルギートレーディングの新しい枠組みを提案する。提案手法は、不確実性のある知識変換器(KTU)と呼ばれる異種確率確率変換器に基づく予測モデルを用いて、予測の不確実性を明確に定量化する。実験の結果、不確実性を考慮したディープQネットワーク(DQN)は、P2Pトレーディングなしでのエネルギー購入コストを最大5.7%削減し、P2Pトレーディングで3.2%削減し、それぞれ6.4%と44.7%の増加を示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:46:28 GMT)
SenWiCh: Sense-Annotation of Low-Resource Languages for WiC using Hybrid Methods [1.2]
低リソース言語10言語にまたがる多文語を含む文のデータセットをリリースする。データセット作成を容易にするために,本論文では,有意な半自動アノテーション手法を提案する。その結果、効果的な多意味的曖昧化のためのターゲットデータセット作成と評価の重要性が浮き彫りになった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:15:48 GMT)
Application of LLM Guided Reinforcement Learning in Formation Control with Collision Avoidance [1.2]
マルチエージェントシステム(Multi-Agent Systems、MAS)は、個々のエージェントの協調作業を通じて複雑な目的を達成する。本稿では,効果的な報酬関数を設計する上での課題を克服する新しい枠組みを提案する。タスクの優先順位付けにおいて,大規模言語モデル(LLM)を付与することにより,オンライン上で動的に調整可能な報酬関数を生成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:26:00 GMT)
LPTR-AFLNet: Lightweight Integrated Chinese License Plate Rectification and Recognition Network [1.1]
LPTR-AFLNetという,中国のナンバープレートの修正・認識のための軽量統一ネットワークを提案する。パースペクティブ変換補正モジュール(PTR)と最適化されたナンバープレート認識ネットワークであるAFLNetを組み合わせている。 LPTR-AFLNetによる2線プレート画像の視線歪みの補正と認識における異常な性能を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:54:32 GMT)
Enhancing patent retrieval using automated patent summarization [1.1]
本稿では,特許文書の簡潔で目的特異的な要約を生成するための,最近の抽出および抽象的な要約手法の適用について述べる。実験の結果,要約に基づくクエリにより,先行検索の有効性が著しく向上した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:14:44 GMT)
Leveraging Synthetic Data for Question Answering with Multilingual LLMs in the Agricultural Domain [1.0]
農業における大規模言語モデル(LLM)は一般的に、局所的および多言語的文脈における精度を欠いた一般的なアドバイザリを提供する。本研究では,多言語合成農業データセット(ヒンディー語,パンジャービ語,ヒンディー語,パンジャービ語)を農業用文書および微調整言語用LPMから生成する。キュレートされた多言語データセットに対する評価は,事実的正確性,妥当性,農業的コンセンサスにおいて有意な改善を示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:25:10 GMT)
Confidence Optimization for Probabilistic Encoding [1.0]
距離計算を調整するための信頼度対応機構を導入する。我々は、従来のKL分散に基づく分散正規化を、分散を直接制約するより単純なL2正規化項に置き換える。本手法はBERTモデルとRoBERTaモデルの両方の性能と一般化を大幅に改善する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:32:27 GMT)
Visual-Language Model Knowledge Distillation Method for Image Quality Assessment [1.0]
CLIPのような視覚言語モデルに基づくマルチモーダル手法は、IQAタスクにおいて例外的な一般化機能を示す。本研究は,CLIPのIQA知識を用いたアーキテクチャ上の利点を生かしたモデル学習の指導を目的とした,視覚言語モデル知識蒸留手法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:17:49 GMT)
Ultrastable, low-error dynamic polarization encoding of deterministically generated single photons [1.0]
自由空間サニャック干渉計を用いた単一光子量子ビットに対する偏光エンコーダの最初の実演について報告する。量子ビット誤り率 0.69(2)% が達成され、単一の光子を符号化する高速情報に対して、これまで報告された最小の誤り率を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:29:54 GMT)
Tournament of Prompts: Evolving LLM Instructions Through Structured Debates and Elo Ratings [0.9]
我々は,エロの選考による議論駆動評価を通じて,進化を促す新しいフレームワークであるDEEVOを紹介する。 Eloの格付けをフィットネスプロキシとして利用することで、DEEVOは同時に改善を推進し、迅速な人口の貴重な多様性を保ちます。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:01:11 GMT)
Sensor Drift Compensation in Electronic-Nose-Based Gas Recognition Using Knowledge Distillation [0.9]
従来の研究では、ドリフト補償の有望な結果が報告されていたが、統計的に有意な検証は得られなかった。これは、電子鼻ドリフト緩和のためのKDの最初の応用であり、従来の最先端DRCA法よりも大幅に優れていた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:16:03 GMT)
TTS-1 Technical Report [0.9]
Inworld TTS-1は、Transformerベースの2つの自動回帰テキスト音声モデルのセットである。 TTS-1とTS-1-Maxは低レイテンシで48kHzの高分解能音声を生成することができる。私たちはまた、MITライセンスの下でトレーニングとモデリングのコードをオープンソースにしています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:57:11 GMT)
BioGraphFusion: Graph Knowledge Embedding for Biological Completion and Reasoning [0.9]
そこで我々は,BioGraphFusionを紹介した。 3つの重要なバイオメディカルタスクにわたる実験により、バイオグラフフュージョンは最先端のKE、GNN、アンサンブルモデルよりも優れた性能を示した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:03:12 GMT)
Sparse-View 3D Reconstruction: Recent Advances and Open Challenges [0.9]
濃密な画像取得が不可能なアプリケーションには,スパースビュー3D再構成が不可欠である。この調査は、ニューラル暗黙のモデルと明示的なポイントクラウドベースのアプローチの最新の進歩をレビューする。我々は, 幾何正規化, 明示的な形状モデリング, 生成的推論がアーティファクトの緩和にどのように利用されているかを分析する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:57:28 GMT)
Advancing Risk and Quality Assurance: A RAG Chatbot for Improved Regulatory Compliance [0.9]
高度に規制された産業におけるリスク・アンド・クオリティ(R&Q)の保証には、複雑な規制フレームワークの定期的なナビゲーションが必要である。本稿では,Large Language Models(LLMs)とハイブリッド検索,R&Qクエリ処理の強化を両立させた新しい検索拡張生成(RAG)システムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:46:44 GMT)
Parallelism Meets Adaptiveness: Scalable Documents Understanding in Multi-Agent LLM Systems [0.8]
大規模言語モデル(LLM)エージェントは、協調的なタスク補完の約束が増していることを示している。既存のマルチエージェントフレームワークは、静的で固定されたロールと限定的なエージェント間通信に依存していることが多い。本稿では,3つのコア機構による適応性を実現するための協調フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:42:51 GMT)
AURA: A Multi-Modal Medical Agent for Understanding, Reasoning & Annotation [0.8]
AURAは、医用画像の包括的分析、説明、評価のために特別に設計された最初の視覚的言語説明性エージェントである。 AURAは、より透明性があり、適応可能で、臨床的に整合したAIシステムに向けた大きな進歩を示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:24:18 GMT)
Meta-Learning for Cold-Start Personalization in Prompt-Tuned LLMs [0.8]
本稿では,パラメータ効率のよいプロンプトチューニングを行うためのメタラーニングフレームワークを提案する。 MovieLens-1M、Amazon Reviews、Recboleでは、当社の適応モデルは、NDCG@10、HR@10、MRRの強力なベースラインよりも優れています。 275msの適応率により、金融システムのリアルタイムリスクプロファイリングが成功している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:07:23 GMT)
Scene Text Detection and Recognition "in light of" Challenging Environmental Conditions using Aria Glasses Egocentric Vision Cameras [0.7]
Scene Text Detection and Recognition (STDR) は、自我中心の視覚レンズを通じて簡単に選択できる。本稿では, 現実シナリオにおけるSTDRアルゴリズムの性能に, 照明, 距離, 解像度などの環境変数がどのような影響を及ぼすかを検討する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:12:00 GMT)
3LM: Bridging Arabic, STEM, and Code through Benchmarking [0.7]
3LMはアラビア語用に特別に設計された3つのベンチマークのスイートである。 1つ目は、アラビア語の教科書と教育用ワークシートから自然に派生した、STEM関連の質問応答ペアのセットである。 2つ目は、同じソースを用いて合成されたSTEM質問である。第3のベンチマークは、2つの広く使用されているコードベンチマークを注意深く翻訳することで構築されたコード生成に焦点を当てている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:43:45 GMT)
Do large language vision models understand 3D shapes? [0.7]
大規模視覚言語モデル(LVLM)は、世界の一般的な視覚的理解を達成するための主要なA.Iアプローチである。この研究は、LVLMが3次元形状を真に理解しているかどうかを、モデルが全く同じ3次元形状の物体を識別しマッチングする能力をテストすることで検証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:46:37 GMT)
MCP-MedSAM: A Powerful Lightweight Medical Segment Anything Model Trained with a Single GPU in Just One Day [0.7]
医用画像のセグメンテーションは、解剖学的構造や病変の特定に焦点をあてて、医療画像を意味のある領域に分割する。 Anything Model(SAM)は、様々なタスクのパフォーマンスを改善するために、医学領域に適応するよう研究者に促している。 MCP-MedSAMは、40GBのメモリを持つ単一のA100 GPU上で1日以内にトレーニングできるように設計された、強力で軽量な医療SAMモデルである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:08:28 GMT)
DeSamba: Decoupled Spectral Adaptive Framework for 3D Multi-Sequence MRI Lesion Classification [0.7]
DeSambaは、分離された表現を抽出し、病変分類のための空間的特徴とスペクトル的特徴を適応的に融合するように設計されたフレームワークである。 DeSambaは62.10%のTop-1精度、63.62%のF1スコア、87.71%のAUC、93.55%のTop-3精度を達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:14:23 GMT)
Human-AI Co-Creation: A Framework for Collaborative Design in Intelligent Systems [0.7]
本稿では、AIが自動化や効率向上にのみ使用されるだけでなく、アイデア、視覚的概念化、意思決定に積極的に参加する、人間とAIの共創の創発的パラダイムについて考察する。具体的には, GPT-4のような大規模言語モデル(LLM)と, 提案, 批判, リビジョンの反復サイクルにデザイナを関与させる創造的エージェントとして, 安定拡散(Stable Diffusion)のようなマルチモーダル拡散モデルを使用することを検討する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:29:33 GMT)
Learning novel representations of variable sources from multi-modal $\textit{Gaia}$ data via autoencoders [0.6]
本稿では,複数のガイアデータ生成物を取り込み,恒星とクエーサーの変動の教師なし分類を実現する機械学習手法の提案と評価を行う。 3つの変分オートエンコーダ(VAE)のトレーニングには400万ガリアDR3ソースのデータセットが使用される 1つのVAEは、ガイアXP低分解能スペクトルで、もう1つは、ガイアG帯の大きさ差の分布に基づく新しいアプローチで、もう1つは折り畳まれたガイアG帯光曲線で訓練されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:11:47 GMT)
Qubit-Efficient Quantum Algorithm for Linear Differential Equations [0.6]
本稿では,線形常微分方程式(ODE)を証明可能な実行保証で解くための量子アルゴリズムを提案する。我々のアルゴリズムは1つのアシラ量子ビットしか使用せず、例えばODEの係数行列が$k$-localであるとき、局所性保存である。また,提案アルゴリズムとリンドブラディアンシミュレーションの関連性,および相互作用するハタノ・ネルソンモデルへの応用について考察する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:08:34 GMT)
Optimal schedule of multi-channel quantum Zeno dragging with application to solving the k-SAT problem [0.6]
一般化された測定値を用いた多チャンネルZenoドラッグのより深い解析を行う。まず、有限測定時間分解能の影響を含む収束時間に関する解析上界を計算した。次に、最適制御理論を適用し、低次元設定に対して収束時間を低くする最適ドラッギングスケジュールを得る。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:46:19 GMT)
FedMultiEmo: Real-Time Emotion Recognition via Multimodal Federated Learning [0.6]
車内感情認識は、適応運転支援システム、そして究極的には乗員の安全を支えている。我々は2つの相補的なモダリティを意思決定レベルで融合させるプライバシー保護フレームワークであるFedMultiEmoを紹介する。開発システムは18ラウンドに収束し、平均ラウンドタイムは120秒、メモリフットプリントは200MB以下である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:55:39 GMT)
Optimization and generalization analysis for two-layer physics-informed neural networks without over-parametrization [0.6]
本研究は、物理インフォームドニューラルネットワーク(PINN)を用いた最小二乗回帰の解法における勾配降下(SGD)の挙動に焦点を当てる。ネットワーク幅が$epsilon$と問題のみに依存するしきい値を超えると、トレーニング損失と期待損失は$O(epsilon)$以下になる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:24:22 GMT)
Avoiding spectral pollution for transfer operators using residuals [0.6]
スペクトル汚染のない遷移作用素のスペクトル特性を計算するためのアルゴリズムを提案する。ケーススタディは、既知のスペクトルを持つブラスキー写像の族からタンパク質の折り畳みの分子動力学モデルまで様々である。提案手法は,幅広いアプリケーションにまたがるスペクトル推定のための堅牢なツールを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:01:05 GMT)
Mind the Gap: Evaluating the Representativeness of Quantitative Medical Language Reasoning LLM Benchmarks for African Disease Burdens [0.6]
既存のLCMベンチマークでは、高い所得設定による検査シラビと疾患プロファイルを主に反映している。 Alama Health QAはケニアのクリニカル・クリニカル・プラクティス・ガイドラインに固定された検索拡張生成フレームワークを用いて開発された。アラマは関連性およびガイドラインアライメントで最高であり、PubMedQAは臨床的有用性で最低であった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:05:30 GMT)
A Goal-Oriented Reinforcement Learning-Based Path Planning Algorithm for Modular Self-Reconfigurable Satellites [0.6]
本稿では、自己再構成可能な衛星の再構成のための目標指向強化学習に基づく経路計画アルゴリズムを提案する。本モデルでは,4ユニットと6ユニットからなるモジュール型衛星群において,任意の目標設定を達成できる95%と73%の成功率を達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:50:39 GMT)
Bootstrapped Control Limits for Score-Based Concept Drift Control Charts [0.6]
適応型教師付き学習モデル(コンセプトドリフト検出)で表される予測関係の変化のモニタリングは広く行われている問題である。汎用的で強力なフィッシャースコアに基づくコンセプトドリフト手法が最近提案されている。我々は制御限界(CL)を計算するための新しいブートストラップ法を開発した。これは、特にサンプルサイズと/または偽アラームレートが小さい場合に、より正確な偽アラームレートの制御を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:36:51 GMT)
Machine learning-based multimodal prognostic models integrating pathology images and high-throughput omic data for overall survival prediction in cancer: a systematic review [0.6]
病理組織学と分子データを統合するマルチモーダル機械学習は、がんの予後を保証している。我々は,全スライド画像(WSI)と高スループットオミクスを組み合わせて,全体の生存率を予測する研究を体系的に検討した。全ての研究は、不明瞭/高い偏見、外部検証の制限、臨床的有用性にはほとんど焦点が当てられなかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:02:51 GMT)
Meta-learning of Gibbs states for many-body Hamiltonians with applications to Quantum Boltzmann Machines [0.6]
パラメトリックハミルトニアンの効率的な熱状態調製のためのメタラーニングアルゴリズムを2つ導入する。我々は,最大8-qubitの逆場イジングモデルと2-qubitのハイゼンベルクモデルに対して,すべてのフィールド項で検証する。我々は,量子ボルツマンマシン(QBM)を,すべてのフィールド項を持つ2キュービットハイゼンベルクモデルで訓練するために,アルゴリズムを適用した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:17:50 GMT)
Never Come Up Empty: Adaptive HyDE Retrieval for Improving LLM Developer Support [0.5]
我々は,300万以上のJavaおよびPython関連Stack Overflowポストの検索コーパスを構築し,回答を受け付けている。開発者からの質問に答えるために様々なRAGパイプライン設計を評価し、正確で信頼性の高い応答を生成する上での有効性を評価した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:46:00 GMT)
PlantSAM: An Object Detection-Driven Segmentation Pipeline for Herbarium Specimens [0.5]
植物領域検出のための YOLOv10 とセグメンテーションのための Segment Anything Model (SAM2) を統合した自動セグメンテーションパイプラインである PlantSAM を紹介する。 YOLOv10はSAM2を誘導するバウンディングボックスプロンプトを生成し、セグメンテーション精度を高める。 PlantSAMは最先端のセグメンテーション性能を達成し、IoUは0.94、Dice係数は0.97である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:02:39 GMT)
Software is infrastructure: failures, successes, costs, and the case for formal verification [0.5]
この40ドル(約4万4000円)で起きた大規模なソフトウェア障害のコストを思い出します。これらのコストは、フォーマルなソフトウェア検証、特にプログラム分析の研究、研究、適用を正当化するものであると我々は主張する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:41:24 GMT)
A simple quantum simulation algorithm with near-optimal precision scaling [0.5]
量子シミュレーションは量子コンピュータの基礎的な応用である。本稿では, 量子ハミルトン動力学シミュレーションアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:56:24 GMT)
Speech as a Multimodal Digital Phenotype for Multi-Task LLM-based Mental Health Prediction [0.5]
うつ病検出のための3モーダルマルチメディアデータソースとして,患者音声データの処理を提案する。提案手法は,抑うつ早期警戒データセットを用いて,3モーダル長手MLLを特徴とする手法である。バランスの取れた精度は70.8%で、これは一方向、単一タスク、および非縦方向のそれぞれの方法よりも高い。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:46:53 GMT)
LingBench++: A Linguistically-Informed Benchmark and Reasoning Framework for Multi-Step and Cross-Cultural Inference with LLMs [0.5]
LingBench++は、大規模言語モデル(LLM)を評価するためのベンチマークおよび推論フレームワークである。構造化された推論トレース、ステップワイズ評価プロトコル、90以上の言語にまたがるリッチな型付けメタデータを提供する。本稿では,外部知識源と反復推論を用いたモデルが,精度と解釈性の両方において単一パスアプローチより優れていることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:57:44 GMT)
Hierarchical Reinforcement Learning Framework for Adaptive Walking Control Using General Value Functions of Lower-Limb Sensor Signals [0.4]
階層強化学習を用いて,低域外骨格に対する適応制御戦略を開発する。提案手法は,エクソスケルトン制御適応の複雑なタスクを,地形戦略適応のための高レベルフレームワークと予測情報を提供する低レベルフレームワークに分解する。本研究では,実際のセンサ信号と予測センサ信号を政策ネットワークに組み込むことにより,制御システムの意思決定能力を向上させることを目的とした2つの手法について検討した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:47:04 GMT)
Navigation through Non-Compact Symmetric Spaces: a mathematical perspective on Cartan Neural Networks [0.4]
これらの概念の初期の実装は、Cartan Neural Networksのモニカーの下で双子の論文で紹介されている。現在の論文は、カルタンニューラルネットワークを支える数学的構造を拡張し、それらの層の幾何学的性質を詳述している。これらの論文は、群理論構造を利用したニューラルネットワークの完全に幾何学的に解釈可能な理論への第一歩となる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:34:53 GMT)
Transformer Based Building Boundary Reconstruction using Attraction Field Maps [0.4]
本稿では,グラフ畳み込みネットワーク(GCN)を利用した新たな深層学習手法を提案する。当社のモデルであるDecoupled-PolyGCNは、APの6%、ARの10%で既存の手法より優れており、正確で規則化された建物のフットプリントを提供する能力を示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:53:03 GMT)
Ten Essential Guidelines for Building High-Quality Research Software [0.4]
本稿では,高品質な研究ソフトウェアを開発するための10のガイドラインを提案する。ガイドラインは開発ライフサイクルのすべての段階をカバーする。彼らは計画、クリーンで可読なコードを書くこと、バージョン管理の使用、テスト戦略の実装の重要性を強調している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:22:41 GMT)
ASP-Assisted Symbolic Regression: Uncovering Hidden Physics in Fluid Mechanics [0.3]
本研究は, 矩形流路内の3次元非圧縮性流れをモデル化するために, シンボリック回帰を適用した。 PySRライブラリを利用することで、数値シミュレーションデータから直接コンパクトな記号方程式を導出した。本稿では,SR と Answer Set Programming の知識表現フレームワークを統合する革新的な手法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:16:20 GMT)
Fast and Scalable Gene Embedding Search: A Comparative Study of FAISS and ScaNN [0.3]
大規模類似性探索は、ゲノムおよびプロテオミクス配列間の相同性、機能的類似性、新規性を検出するバイオインフォマティクスの基本課題である。埋め込み型類似性探索法について検討し, 生の配列アライメントを超えて, より深い構造的・機能的パターンを抽出する潜在表現を学習する。この結果から,メモリと実行効率の両面での計算上の優位性と,検索品質の向上が注目され,従来のアライメント重ツールに代わる有望な代替手段が提供される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:28:54 GMT)
On the Differential Topology of Expressivity of Parameterized Quantum Circuits [0.3]
量子回路は量子コンピューティングにおいて重要な役割を果たす。このような問題のクラスを解くための回路の適合性を測定する必要がある。この貢献の焦点となる変種は、いわゆる次元表現性である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:51:49 GMT)
Explainable Vulnerability Detection in C/C++ Using Edge-Aware Graph Attention Networks [0.2]
本稿では,C/C++コードの脆弱性検出のためのグラフベースのフレームワークであるExplainVulDを提案する。平均精度88.25パーセント、F1スコア48.23パーセントをReVealデータセット上で30の独立ランで達成している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:49:14 GMT)
Evolutionary Feature-wise Thresholding for Binary Representation of NLP Embeddings [0.2]
Thresholdingは、連続的な埋め込みをバイナリ表現に変換する一般的な方法である。本稿では,各特徴の最適しきい値を特定するためのコーディネート検索に基づく最適化フレームワークを提案する。我々の最適なバーコード表現は、様々なNLPアプリケーションで有望な結果を示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:29:34 GMT)
Controllable Hybrid Captioner for Improved Long-form Video Understanding [0.2]
ビデオデータは極めて密度が高く、高次元である。テキストベースの動画コンテンツの要約は、生よりはるかにコンパクトな方法でコンテンツを表現する方法を提供する。静的なシーン記述でメモリを豊かにするビジョン言語モデル(VLM)を導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:09:00 GMT)
Beating the natural Grover bound for low-energy estimation and state preparation [0.2]
多体ハミルトニアンの基底状態エネルギーの推定は、量子物理学の多くの分野において中心的な課題である。量子アルゴリズムは、任意の$k$-body Hamiltonian $H$を与えられた場合、基底状態エネルギーの見積もりを計算する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:10:08 GMT)
Secondary Bounded Rationality: A Theory of How Algorithms Reproduce Structural Inequality in AI Hiring [0.2]
論文では、AIシステムは技術的・社会的制約を通じて人間の認知と構造的バイアスを継承し、増幅すると主張している。アルゴリズムのプロセスが、エリート的信用権の特権化やネットワークのホモフィリーといった歴史的不平等を、明らかに有益な官僚的な結果にどのように変えるかを示す。我々は、この自己強化不平等を打破するために、対物公正テスト、資本認識監査、規制介入を含む緩和戦略を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:25:59 GMT)
Bayesian Deep Learning for Convective Initiation Nowcasting Uncertainty Estimation [0.2]
本研究では,最近提案された5つのベイズ深層学習手法の確率と不確実性予測について検討した。不確実性は, 確率的予測の正当性, 不確実性が大小の誤差でどの程度分離されたかによって評価された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:29:53 GMT)
A Quantum Superposition of Black Hole Evaporation Histories: Recovering Unitarity [0.2]
ブラックホールの蒸発は重力と量子物理学の界面でもっとも顕著な現象の1つである。ホーキングの半古典的扱いでは、物質は量子力学であり、時空は定性であり、古典的な蒸発は、全体的な進化の統一性が明らかに失われる。ここでは、ブラックホールの蒸発に関するおもちゃの量子モデルを定式化し、ブラックホールが完全に蒸発し、完全に蒸発しない重畳状態へと進化し、ホーキング粒子が異なるエネルギーレベルのコヒーレントな重畳状態にあるのと一致する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:39:34 GMT)
The Postman: A Journey of Ethical Hacking in PosteID/SPID Borderland [0.1]
本稿では, Poste Italiane による SPID の実装である PosteID 上で実施した脆弱性評価活動について述べる。この活動により、重要な特権のエスカレーションの脆弱性が発見され、最終的にパッチが当てられた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:38:51 GMT)
TaxCalcBench: Evaluating Frontier Models on the Tax Calculation Task [0.1]
米国の個人所得税の計算は、膨大な量の英文を理解することを必要とするタスクである。我々は、個人所得税率を計算できるモデルの能力を決定するためのベンチマークであるTaxCalcBenchを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:37:59 GMT)
Mapping Industry Practices to the EU AI Act's GPAI Code of Practice Safety and Security Measures [0.1]
本報告では、EU AI Actの汎用AI(GPAI)コード(第三ドラフト)で提案されている安全とセキュリティ対策と、主要なAI企業によって自発的に採用されている現在のコミットメントとプラクティスとを詳細に比較する。本分析は、各個別の措置に関連する現在の公的な文書からの抜粋を文書化した草案の安全安全部門(コミットII.1-II.16)に焦点をあてる。本報告書は、法律遵守の表示であってはならない。また、慣行法又は企業の方針に関する規定的な視点も持っていない。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:27:15 GMT)
LLM as a code generator in Agile Model Driven Development [0.0]
この研究は、これらの課題を克服するための実行可能な戦略としてモデル駆動開発(MDD)を擁護します。我々は GPT4 をコードジェネレータとして利用する Agile Model Driven Development (AMDD) アプローチを提案する。 GPT4自動生成機能を適用すると、JADEおよびPADEフレームワークと互換性のあるJavaとPythonコードが生成される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:02:57 GMT)
Weak-coupling bound states in semi-infinite topological waveguide QED [0.0]
原子-光子結合状態は通常、原子と環境の結合が十分に強いときに形成される。量子エミッタが、位相的に保護された表面状態を示す構造的な貯水池に弱結合している場合、これらの状態とエミッタとのハイブリッド化が形成されることを示す。弱結合状態間の振動は、予測可能かつ可逆的にエミッタから格子へ粒子を移動させるのに有効であることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:20:59 GMT)
VRU-Accident: A Vision-Language Benchmark for Video Question Answering and Dense Captioning for Accident Scene Understanding [0.0]
MLLM(Multimodal large language model)は、自動運転車におけるシーン理解と意思決定の強化を約束している。本稿では,VRUを含む高リスク交通シナリオにおけるMLLMの評価を目的とした,視覚言語ベンチマークであるVRU-Accidentを提案する。これまでの研究とは異なり、我々のベンチマークはVRU車両事故に特化しており、空間的時間的ダイナミクスと事故の因果的セマンティクスの両方を捉えたリッチできめ細かいアノテーションを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:15:14 GMT)
Unified Sparse-Matrix Representations for Diverse Neural Architectures [0.0]
本稿では,畳み込み,再帰,自己アテンション操作をスパース行列乗法として適用する統一行列順序フレームワークを提案する。この研究は、多様なニューラルネットワークアーキテクチャのための数学的に厳密な基質を確立し、原理化されたハードウェア対応ネットワーク設計のための道を開く。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:07:02 GMT)
Understanding Generalization, Robustness, and Interpretability in Low-Capacity Neural Networks [0.0]
低容量ネットワークにおけるキャパシティ、スパシティ、ロバスト性を調査するためのフレームワークを導入する。トレーニングされたネットワークは、極大プルーニング(最大95%の間隔)に対して堅牢であることを示す。この研究は、単純なニューラルネットワークを管理するトレードオフの明確で実証的なデモンストレーションを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:43:03 GMT)
Towards Trustworthy AI: Secure Deepfake Detection using CNNs and Zero-Knowledge Proofs [0.0]
TrustDefenderは、リアルタイム拡張現実(XR)ストリームでディープフェイク画像を検出するフレームワークである。私たちの研究は、没入的でプライバシーに敏感なアプリケーションにおいて、信頼できるAIの基礎を確立します。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:47:46 GMT)
Toward Routine CSP of Pharmaceuticals: A Fully Automated Protocol Using Neural Network Potentials [0.0]
結晶構造予測(CSP)は、多型に関連するリスクを特定し評価するための医薬品開発において有用なツールである。本稿では,これらの障壁を克服するために,完全自動化された高スループットCSPプロトコルを提案する。プロトコルの効率は、新しいニューラルネットワークポテンシャル(NNP)であるLavo-NNによって駆動される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:26:16 GMT)
Thermal operations from informational equilibrium [0.0]
熱演算は量子系の熱力学の限界を導出する際、顕著な役割を果たした量子チャネルである。これらのチャネルは純粋に量子情報理論の特性によって特徴付けられる。触媒チャネルは、完全退化ハミルトニアンに対してギブス保存写像の洗練された階層構造を提供し、二重ユニタリ量子回路と密接に関連していることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:35:08 GMT)
Thermal modifications of mesons and energy-energy correlators from real-time simulations of a $U(1)$ lattice gauge theory [0.0]
実時間シミュレーションによる1+1$次元におけるU(1)$格子ゲージ理論の熱的性質について検討する。この結果は、ゲージ理論における境界状態の熱膨張と有限温度エネルギー-流の相関に関する初めてのリアルタイムテクスタイブ-イニシアト研究である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:00:00 GMT)
The Joys of Categorical Conformal Prediction [0.0]
Conformal Prediction (CP) は、有限サンプルキャリブレーションされた予測領域を提供する不確実性表現技術である。 CPは本質的に不確実量化(UQ)機構であり,その基本UQ能力は構造的特徴であることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:10:06 GMT)
Testing the variety hypothesis [0.0]
この問題のいわゆる「サンプル複雑性」の上限を証明し、これを半代数的決定問題に還元する方法を示す。これは、与えられた次元と次数の実代数多様体の空間のハウスドルフ幾何学を定量的に研究することによってなされる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:40:55 GMT)
Tailoring Dynamical Codes for Biased Noise: The X$^3$Z$^3$ Floquet Code [0.0]
バイアスノイズ下での性能が向上した動的コードであるX$3$Z$3$Floquet符号を提案する。我々の研究は、素数量子誤り訂正符号としてX$3$Z$3$を定めている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:11:25 GMT)
Tagging fully hadronic exotic decays of the vectorlike $\mathbf{B}$ quark using a graph neural network [0.0]
対生成ベクトル型$B$クォークのLHC確率を、新しいゲージシンクレット(pseudo)スカラー場$Phi$と$b$クォークに外部的に崩壊させる。標準模型の背景が大きく、レプトニックハンドルがないため、調査は困難である。この課題を克服するために、グラフニューラルネットワークとディープニューラルネットワークを組み合わせたハイブリッドディープラーニングモデルを用いる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:46:59 GMT)
Synthetic Data Generation Using Large Language Models: Advances in Text and Code [0.0]
大規模言語モデル(LLM)は、自然言語とコードドメインの両方で合成トレーニングデータ生成を変換している。我々は、プロンプトベースの生成、検索拡張パイプライン、反復的な自己精製といった重要なテクニックを強調した。本稿では,生成テキストにおける事実的不正確性,文体的あるいは分布的リアリズムの不足,バイアス増幅のリスクなど,関連する課題について論じる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:28:00 GMT)
Symbolic Graph Intelligence: Hypervector Message Passing for Learning Graph-Level Patterns with Tsetlin Machines [0.0]
一般グラフ分類のための多層的シンボルフレームワークを提案する。各グラフは構造化メッセージパッシングを通じて符号化され、ノード、エッジ、属性情報は束縛され、シンボリックハイパーベクターにバンドルされる。本手法をTUDatasetベンチマークで検証し,ニューラルグラフモデルと比較して強力なシンボル透過性を持つ競合精度を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:47:56 GMT)
Supernova: Achieving More with Less in Transformer Architectures [0.0]
Supernovaはデコーダのみの変換器で、計算効率を維持しながらより大きなモデルの性能を実現する。重要な革新は、最先端の圧縮性能を実現するカスタム128,000バイトレベルのBPEトークンライザである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:27:02 GMT)
Studies of properties of bipartite graphs with quantum programming [0.0]
両部グラフの$G(U,V,E)$に対応するマルチキュービット量子状態について検討する。得られた状態の絡み合い距離は任意の二部グラフ構造に対して解析的に導出される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:49:57 GMT)
Spectral signature of high-order photon processes enhanced by Cooper-pair pairing [0.0]
超伝導回路は、強い相互作用と低い損失を結合するのに適している。我々の結果は、マイクロ波量子光学における高次光子相互作用の新しい状態を開く。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:16:55 GMT)
Some classes of finite-dimensional ladder operators [0.0]
有限次元ヒルベルト空間におけるはしご作用素の特別なクラスについて研究する。我々は、クーンの切り詰めたバージョン、それらのエム・プシュド変換、および閉鎖上で作用する作用素の第3の族を考える。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:20:10 GMT)
Soft Computing Approaches for Predicting Shade-Seeking Behaviour in Dairy Cattle under Heat Stress: A Comparative Study of Random Forests and Neural Networks [0.0]
熱ストレスは地中海の気候において乳牛が直面する主な福祉と生産性の問題の1つである。我々は2つのソフトコンピューティングアルゴリズム、ランダムフォレスト(Random Forests)とニューラル・ニューラルネットワーク(Neural Networks)を評価し、高解像度の行動データと微小気候データに基づいてトレーニングした。最高のニューラルネットワーク(3つの隠れ層、16のニューロン、学習速度 = 10e-3)は平均で14.78に達し、ランダムフォレスト(10の木、深さ = 5)は14.97に達し、最も高い解釈性を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:50:26 GMT)
SoK: Securing the Final Frontier for Cybersecurity in Space-Based Infrastructure [0.0]
本研究では、地上、宇宙、衛星、衛星等を含む宇宙のサイバー攻撃ベクトルの範囲を分析した。また、宇宙インフラに関連する緩和策の有効性を評価する。本論文は,最先端技術ソリューションの開発とテストにおける潜在的研究課題を明らかにする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:51:31 GMT)
Simulation of quantum contextuality with invasive-measurement maps [0.0]
文脈性は、量子を物理系の古典的な記述から分離する決定的な特徴である。本稿では,線形写像を用いて文脈性を特徴付ける一般的な手法を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:28:40 GMT)
Shot-Efficient ADAPT-VQE via Reused Pauli Measurements and Variance-Based Shot Allocation [0.0]
ADAPT-VQEにおけるショット要求を減らすための2つの統合戦略を提案する。まず,次のADAPT-VQEイテレーションの演算子選択ステップにおいて,VQEパラメータ最適化時に得られるパウリ測定結果を再利用する。第2に、分散に基づくショットアロケーションをハミルトンおよび演算子勾配測定の両方に適用する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:34:49 GMT)
Self-Supervised Inductive Logic Programming [0.0]
正のラベル付きやゼロあるいはそれ以上のラベル付き例から新しい設定で学習する新しいMILアルゴリズムを提案する。我々はこのアルゴリズムをPokeerと呼ばれる新しいMILシステムでPrologに実装する。我々はPokerと最先端のMILシステムLouiseを比較し、文脈自由言語とL-System言語の文法を学習する実験を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:57:24 GMT)
Screen2AX: Vision-Based Approach for Automatic macOS Accessibility Generation [0.0]
我々はScreen2AXを紹介した。Screen2AXは1つのスクリーンショットからリアルタイムでツリー構造されたアクセシビリティメタデータを自動生成する最初のフレームワークである。本手法では,視覚言語およびオブジェクト検出モデルを用いてUI要素を階層的に検出,記述,整理し,Desktopのシステムレベルのアクセシビリティ構造を反映する。我々はScreen2AXがネイティブアクセシビリティ表現よりも2.2倍の性能向上を実現し、ScreenSpotベンチマークの最先端のOmni V2システムを上回ることを実証した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:38:12 GMT)
Scarred ferromagnetic phase in the long-range transverse-field Ising model [0.0]
いくつかの小さな磁区からなる単純な初期条件が、これらの不足状態に選択的に出現することを示します。これにより特別な動的相が出現し、この相はスカーレッド強磁性相と呼ばれる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:12:31 GMT)
SDBench: A Comprehensive Benchmark Suite for Speaker Diarization [0.0]
最先端の話者ダイアリゼーションシステムでさえ、異なるデータセット間でエラー率のばらつきが高い。 SDBenchは,話者ダイアリゼーション性能を一貫した,きめ細かい分析を行うためのオープンソースのベンチマークスイートである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:11:26 GMT)
Rural School Bus Routing and Scheduling [0.0]
ロングスクールバスは生徒のパフォーマンスと幸福に悪影響を及ぼす。本稿では,農村部バス路線とスケジュールの設計に焦点をあてる。学生の乗車時間を最小化しつつ、これらの複雑さに対処する農村バスのルーティングとスケジューリングモデルを定式化する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:39:42 GMT)
Revisiting boundary-driven method for transport: Finite-size effects and the role of system-bath coupling [0.0]
2つのアプローチから計算したdc拡散定数 $mathcalD_textdc$ を比較して比較する。我々は,システムバス結合に強い依存を示す$mathcalD_textdc$という,両者の明確なミスマッチを見出した。現実的な解決法として,我々は境界駆動フレームワーク内での時間依存輸送係数の計算を提唱する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:35:03 GMT)
Rethinking Data Input for Point Cloud Upsampling [0.0]
ポイントクラウドのアップサンプリングは、3D再構築のようなタスクには不可欠だ。既存の方法はパッチベースの入力に依存しており、ポイントクラウドモデルの完全な入力とパッチベースの入力の違いと原則について議論する研究はない。 PU1KおよびABCデータセットに関する実験により、パッチベースの入力がモデル全体の入力を一貫して上回っていることが明らかとなった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:55:00 GMT)
Reconfigurable qubit states and quantum trajectories in a synthetic artificial neuron network with a process to direct information generation from co-integrated burst-mode spiking under non-Markovianity [0.0]
量子情報処理とスパイキング計算を併用した状態で機能する人工ニューロンネットワークを提案する。これにより、クォービットのコヒーレンス状態と絡み合い、タンデムで読み出しや基本演算のような関数を実行することができる。これにより、高度な機能を備えた情報パケットの生成と計算処理が可能になり、ルーティングにおけるセキュリティレベルが向上する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:02:06 GMT)
Rabi oscillations and entanglement between two atoms interacting by the Rydberg blockade studied by the Jaynes-Cummings Model [0.0]
Rydberg原子は、2量子ビットゲートと原子光量子インターフェースのためのビルディングブロックを約束している。我々は、リドベルク封鎖と量子化された放射場によって相互作用する2つのリドベルク原子間の相互作用を研究する。この結果は,将来の長距離量子通信のためのコンポーネントとして,原子光量子インタフェースの考え方に関係している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:58:47 GMT)
Quantum synchronization between two strongly driven YIG spheres mediated via a microwave cavity [0.0]
単一モードマイクロ波キャビティを介して間接的に結合された2つの強駆動マグノンモードの同期について検討した。インプット・アウトプット・フォーマリズムを用いて、古典的および量子的同期がカップリング、デチューニング、駆動の適切な選択のために出現することを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:56:31 GMT)
Quantum Theory of Optical Spin Texture in Chiral Tellurium Lattice [0.0]
そこで我々は,Teの電子的構造に類似したスピン分解型深部顕微鏡光バンド構造を開発した。格子レベルでは、Teのキラリティが光波内の深部微視的な光スピンテクスチャとして現れることが明らかとなった。本フレームワークは光学活性の有限モメンタム源を明らかにするとともに, キラル結晶材料における光-物質相互作用の顕微鏡的基盤を提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:23:44 GMT)
Quantum Speed Limits Based on Schatten Norms: Universality and Tightness [0.0]
一般物理過程における有限次元量子系の量子速度制限(QSL)について論じる。 QSLは、量子状態空間の幾何学的特徴を利用して、Schatten $alpha$-normsを用いて得られた。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:20:47 GMT)
QRetinex-Net: Quaternion-Valued Retinex Decomposition for Low-Level Computer Vision Applications [0.0]
低照度で撮影された画像は、しばしばカラーシフト、低コントラスト、ノイズ、その他コンピュータビジョンの精度を損なうアーティファクトを示している。レチネックス理論は、画像SをリフレクタンスRと照明Iの画素級積と見なすことでこの問題に対処する。第1次四元数レチネックスの定式化では、シーンは四元数値の反射率と照明のハミルトン積として記述される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:17:24 GMT)
Pulse-Level Simulation of Crosstalk Attacks on Superconducting Quantum Hardware [0.0]
超伝導量子コンピュータにおけるハードウェアのクロストークは、深刻なセキュリティ上の脅威となる。パルスレベルにおけるアクティブクロストーク攻撃のシミュレーションに基づく研究について述べる。最大論理誤差の原因となるパルスと結合構成を同定する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:52:43 GMT)
Pulling Back the Curtain: Unsupervised Adversarial Detection via Contrastive Auxiliary Networks [0.0]
本稿では,補助的特徴表現内での敵対行動を明らかにするために,補助的コントラストネットワーク(U-CAN)による教師なし敵検出を提案する。本手法は、既存の非教師付き対向検出手法を超越し、4つの異なる攻撃方法に対して優れたF1スコアを達成している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:30:16 GMT)
Project Patti: Why can You Solve Diabolical Puzzles on one Sudoku Website but not Easy Puzzles on another Sudoku Website? [0.0]
私は5つの人気ウェブサイトで1000以上のスドクパズルを分析し、各ウェブサイトの難易度を特徴付ける。提案した2つの指標に基づいて,単純な教師なし分類器を用いた普遍評価システムを構築した。本稿では,初期スドクの実践者が,スドクパズルの解法に利用できるアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:32:30 GMT)
Privacy-Preserving Multimodal News Recommendation through Federated Learning [0.0]
本稿では,ニュースレコメンデーションのための新しいマルチモーダル・フェデレーション・ラーニング・ベースのアプローチを提案する。このフレームワークは、リコメンデーションモデルを大規模なサーバ保守型ニュースモデルと、サーバとクライアント間で共有される軽量ユーザモデルに分割する。実世界のニュースデータセットの実験は、既存のシステムと比較して強い性能を示している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:04:45 GMT)
Preliminary suggestions for rigorous GPAI model evaluations [0.0]
本論文では,汎用AI(GPAI)評価プラクティスの予備的なコンパイルについて述べる。これには、人間の隆起研究とベンチマーク評価のための提案が含まれている。提案は評価ライフサイクルの4つの段階(設計、実装、実行、ドキュメント)にまたがる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:27:42 GMT)
Practical blueprint for low-depth photonic quantum computing with quantum dots [0.0]
核融合型量子コンピューティングはフォトニクスに基づくフォールトトレラント計算の魅力的なモデルである。量子ドットと線形光学を用いたフォトニック量子コンピュータの完全な青写真を提案する。時間ビン量子ビット符号化、再構成可能なエンタングル光子源、光接続の少ないフュージョンベースのアーキテクチャを備えている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 01:59:25 GMT)
Performance of Parity QAOA for the Signed Max-Cut Problem [0.0]
パリティアーキテクチャにおける量子近似アルゴリズムの最適化性能(パリティQAOA)について検討する。固定回路深さでのアルゴリズムの比較により、Parity QAOAはSWAPネットワークに基づく従来のQAOA実装よりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:05:59 GMT)
Part Segmentation of Human Meshes via Multi-View Human Parsing [0.0]
並行して、人間のパーシングの分野は、画像から身体部分と衣服/アクセサリーラベルを予測することに焦点を当てている。この研究は、大規模なヒューマンメッシュの頂点ごとのセマンティックセマンティックセグメンテーションを可能にすることによって、これらの2つのドメインをブリッジすることを目的としている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:42:34 GMT)
Parametric Amplification of Spin-Motion Coupling in Three-Dimensional Trapped-Ion Crystals [0.0]
3次元結晶(3D)は、量子センシングや量子シミュレーションへの応用のために、捕捉されたイオンシステムをスケールアップする経路を提供する。工学的コヒーレントなスピン-モーション結合と大きな結晶における効果的なスピン-スピン相互作用は技術的な課題を引き起こす。パラメトリック増幅による3次元結晶における相互作用の高速化の可能性を探る。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:28:01 GMT)
PAC Off-Policy Prediction of Contextual Bandits [0.0]
本稿では,文脈的盗賊の政治外評価について検討する。それは、異なる、潜在的に未知の行動ポリシーの下で収集されたデータを用いて、ターゲットポリシーのパフォーマンスを定量化することを目的としている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:12:29 GMT)
P-CoT: A Pedagogically-motivated Participatory Chain-of-Thought Prompting for Phonological Reasoning in LLMs [0.0]
本研究では,テキストベース大規模言語モデル(LLM)における音韻論的推論の可能性について検討する。 PhonologyBenchベンチマークを用いて、韻律語生成、g2p変換、音節カウントなどのタスクを評価する。我々の評価では, 少数ショット学習が不整合性向上をもたらす一方で, 新規な Pedagogically-motivated Participatory Chain-of-Thought (P-CoT) の導入により, 即時的な性能向上が期待できる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:52:25 GMT)
On-chip stencil lithography for superconducting qubits [0.0]
ヨーゼフソン接合部(JJs)の影の蒸発によく用いられる有機レジストは、残留汚染、熱安定性の低下、典型的な表面洗浄条件下での相溶性により制限される。 JJ製造のための無機SiO$/Si$_3$N$_4$オンチップステンシルリソグラフィーマスクを開発した。ステンシルマスクはアグレッシブ洗浄剤に耐性があり、1200textCまでの高温に耐え、JJ材料探索とインターフェース最適化のための新たな道を開く。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:31:21 GMT)
On two-dimensional tensor network group symmetries [0.0]
4サイクルの指数を持つ有限群の2次元テンソルネットワーク表現を導入する。これらの異常対称性がテンソルネットワーク基底状態に作用するときに現れる(2+1)D相を特徴付ける。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:28:59 GMT)
Old Quantum Mechanics by Bohr and Sommerfeld from a Modern Perspective [0.0]
ボーアの原子モデルとソマーフェルトによる拡張について、波動力学の数学的観点から検討する。量子化規則とエネルギー準位の導出は、半古典的手法を用いて再検討される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:10:15 GMT)
Obscured but Not Erased: Evaluating Nationality Bias in LLMs via Name-Based Bias Benchmarks [0.0]
大きな言語モデル(LLM)は、明示的な人口統計マーカーが存在しない場合でも、特定の国籍に対する潜在バイアスを示す。文化的に表象的な名前で明示的な国籍ラベルを置換することの影響を調査するために,新しい名称ベースのベンチマーク手法を導入する。私たちの実験では、小さなモデルの方が精度が低く、大きなモデルに比べてバイアスが大きいことが示されています。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:54:49 GMT)
Nonequilibrium regimes for quasiparticles in superconducting qubits with gap-asymmetric junctions [0.0]
ギャップ非対称性が遷移エネルギーよりも大きいクビットは準粒子デコヒーレンスの影響を受けにくい。このトラップにより、ギャップ非対称性は準粒子を平衡から切り離すのに寄与する。温度が上昇するにつれて、4つの定性的に異なる状態が可能であることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:05:07 GMT)
NPO: Learning Alignment and Meta-Alignment through Structured Human Feedback [0.0]
我々は,人間のループ内決定システムにおけるフィードバック駆動型適応を運用するアライメント対応学習フレームワークであるNPOを提案する。 NPOは、構造化されたフィードバックの下で測定可能で、監視可能で、再現可能なアライメント損失の形式化を導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:23:18 GMT)
Multiparameter estimation with position-momentum correlated Gaussian probes [0.0]
本研究では, 位置モメンタム相関が同時推定設定において有利であるかどうかを考察する。我々はこの共同推定タスクに新しい精度境界を導出する。このような相関関係が温度推定を改善するための資源となることを実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:33:18 GMT)
Multi-qubit Rydberg gates between distant atoms [0.0]
我々は中性原子配列の多ビットゲートを実現するための効率的なプロトコルを提案する。我々は、強い遮断相互作用を持つRydberg状態に原子を転送するために、大域的なレーザーパルスを適用した。レイドベルク励起の数、すなわち結果の状態のパリティは、多ビット入力状態に依存する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:58:39 GMT)
Multi-objective Portfolio Optimization Via Gradient Descent [0.0]
自動微分を用いた勾配勾配勾配を用いた多目的ポートフォリオ最適化(MPO)のためのベンチマークフレームワークを提案する。単目的のセットアップから複雑な多目的のケースまで,6つの実験シナリオでフレームワークを評価した。提案手法は,複数の目的と制約をモデル化する柔軟性を向上しつつ,競争性能を向上することを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 15:55:00 GMT)
Mitigating higher-band heating in Floquet-Hubbard lattices via two-tone driving [0.0]
高エネルギーレベルに対する多光子共鳴は、強い駆動量子系におけるフロック加熱の避けられない源である。我々は、最近開発されたマルチ光子共鳴の2トーンアプローチを、ハバード系における揺らぎ格子に拡張する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:22:05 GMT)
Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS Thesauri [0.0]
我々は,SKOSセサウリの自動翻訳のためのオープンソースでモジュール化された,利用可能なパイプラインであるWOKIEを紹介する。この研究は、言語多様性が知識リソースのアクセス、再利用、セマンティック相互運用性を制限することができるDH(Digital Humanities)において重要なニーズに対処する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:20:41 GMT)
Mapping the Parasocial AI Market: User Trends, Engagement and Risks [0.0]
110のAIコンパニオンプラットフォームをスキャンすると、グローバル市場が急速に成長していることがわかる。英国だけでも、これらのプラットフォームは月間4600万から9100万の訪問者を集めている。マッチング指向のAIコンパニオンは、英国訪問の44%を占めている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:33:42 GMT)
MLRU++: Multiscale Lightweight Residual UNETR++ with Attention for Efficient 3D Medical Image Segmentation [0.0]
セグメント化精度と計算効率のバランスをとるために設計されたマルチスケール軽量Residual UNETR++アーキテクチャ。 4つの公開ベンチマークデータセットの実験は、MLRU++が最先端のパフォーマンスを達成することを示した。 MLRU++は, 3次元画像分割タスクに対して, 実用的で高性能なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:30:44 GMT)
Linear-time classical approximate optimization of rugged-energy-landscape cubic-lattice classical spin glasses [0.0]
本稿では, 粗いエネルギー景観の量子スピードアップを実証するために, サブシステムに基づく古典最適化を考慮すべきであることを示す。また, 後者の単調な誤差は, 粗さスペクトルの高端における粗さの増加とともに減少することがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:33:45 GMT)
Leveraging Distribution Matching to Make Approximate Machine Unlearning Faster [0.0]
Approximate Machine Unlearning(AMU)は、保持されたデータセットサブセットの特別な微調整を通じて、モデルを特定のトレーニングデータを忘れることを可能にする。分類指向AMUを高速化する2つの補完手法を提案する。まず、新しい分布マッチングデータセット凝縮(DC)である textbfBlend は、視覚的に類似した画像を共有混合重みとマージすることで、保持されたセットサイズを大幅に削減する。第2に、損失中心の方法である textbfAccelerated-AMU (A-AMU) は、学習対象を拡大し、収束を早める。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:27:10 GMT)
Language Detection by Means of the Minkowski Norm: Identification Through Character Bigrams and Frequency Analysis [0.0]
本研究では,モノグラムとビッグラムの周波数ランキングを利用した言語決定性アルゴリズムの数学的実装について検討する。本手法は,150文字未満のテキストに対して80%以上の精度を達成し,より長いテキストや古いテキストに対して100%の精度を達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:11:01 GMT)
LOCOFY Large Design Models -- Design to code conversion solution [0.0]
本稿では,デザインからコードへのシームレスな変換を実現するために,デザインとWebページに特化して訓練された大規模デザインモデルを紹介した。データエンジニアリングと適切なモデルアーキテクチャの修正を取り入れたトレーニングと推論パイプラインを開発した。提案モデルでは, 新規なプレビューマッチスコア測定値を用いて, エンド・ツー・エンドの設計・コード変換精度を実証した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 03:54:57 GMT)
Josephson Traveling-Wave Parametric Amplifier with Inverse Kerr Phase Matching [0.0]
超伝導進行波パラメトリック増幅器(TWPA)は、高汎用デバイスとして登場している。この技術の主な課題は、低騒音性能を維持しながら、最小利得リップルで十分な利得を達成することである。本稿では,TWPAにおける逆Kerr位相マッチング手法の実験的検討を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:53:29 GMT)
Isocoherent Work Extraction from Quantum Batteries: Basis-Dependent Response [0.0]
コヒーレンスに制約のある最大作業(CCMW)は、コヒーレンス保存ユニタリを介して抽出できる最大作業量である。より高次元においても、ある数値的な結論の中でCCMWと入力量子コヒーレンスの間の閉形式関係を導出できることが示される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:07:55 GMT)
Information-acquiring von Neumann architecture of a computer: Functionality and subjectivity [0.0]
我々は,コンピュータの情報取得型フォン・ノイマンアーキテクチャを,きめ細かなあるいは粗いモデルで設計する。このアーキテクチャは、与えられた入力純状態からシステム内の他の出力純状態に変換するハミルトニアン過程(機能)と、情報を取得する物理過程(主観性)の両方を可能にする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:55:37 GMT)
Improving Source Code Similarity Detection Through GraphCodeBERT and Integration of Additional Features [0.0]
本稿では,新たな出力特徴を分類プロセスに統合したソースコード類似性検出手法を提案する。我々のアプローチはGraphCodeBERTモデルに基づいており、カスタム出力特徴層と特徴表現を改善するための結合機構で拡張されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:21:09 GMT)
Improving Predictions on Highly Unbalanced Data Using Open Source Synthetic Data Upsampling [0.0]
特徴空間のスパース領域におけるギャップを埋める多様なデータポイントを生成することにより,少数群の予測精度を向上させることができることを示す。我々はMOSTLY AIによるオープンソースソリューションであるSynthetic Data SDKの有効性を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:11:32 GMT)
Hybrid quantum lattice model: Polaritons, photons, and spin waves propagation [0.0]
低次元系における量子励起の伝播の制御は量子技術にとって重要である。本稿では,各格子ユニットが2レベルシステムと相互作用する単一モード共振器を統合する1次元ハイブリッド量子格子モデルを提案する。この構成は、光-物質結合と量子ビット相互作用の相互作用によって、偏光子、スピン波、光子のコヒーレントな伝播を可能にする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:13:57 GMT)
Hybrid Reward-Driven Reinforcement Learning for Efficient Quantum Circuit Synthesis [0.0]
量子回路の効率的な合成のための強化学習フレームワークが導入された。このフレームワークは、ターゲット状態に向かってエージェントを誘導する静的なドメインインフォームド報酬と、カスタマイズ可能な動的ペナルティを組み合わせたものだ。最大7キュービットのグラフ状態準備タスクのベンチマークを行い、アルゴリズムが最小深度回路を常に発見できることを実証した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:39:20 GMT)
Hear Your Code Fail, Voice-Assisted Debugging for Python [0.0]
Pythonプラグインはサイレントエラーを実行可能な聴覚診断に変換する。システムは18%のCPUオーバーヘッドで1.2秒未満の音声レイテンシを実現する。 pyttsx3テキスト音声変換とTkinterベースのGUI視覚化を使用する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:49:40 GMT)
Ground-State-Based Model Reduction with Unitary Circuits [0.0]
我々は基底状態のユニタリ変換に基づく低エネルギー有効モデルを得る。半充填時の1次元および2次元2次元2乗格子ハバードモデルを用いて,本手法を検証した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:44:33 GMT)
Graph Learning Metallic Glass Discovery from Wikipedia [0.0]
材料ネットワーク表現からの高度なデータ学習を提案する。ノード要素は言語モデルによってウィキペディアから符号化される。さまざまな言語からのウィキペディアの埋め込みを用いて,素材設計における自然言語の能力を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:30:03 GMT)
Functionals in the Clouds: An abstract architecture of serverless Cloud-Native Apps [0.0]
クラウドネイティブアプリケーション CNApp(分散システム)は、通信プロトコルを介して対話する独立したコンポーネント(マイクロサービス)の集合体である。我々の貢献は厳密に理論的であり、関数と関係の計算と密接に関連するCNAppの抽象的アーキテクチャに依存しています。提案された理論的アプローチは、John Backus 1978 citeBackusによって提案された関数レベルでプログラミングの元々のアイデアを実装する試みである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:48:48 GMT)
From model-based learning to model-free behaviour with Meta-Interpretive Learning [0.0]
モデル」とは、環境の状態とエージェントの判断が環境に与える影響を記述する理論である。モデルに基づくエージェントは、そのモデルを使用して将来の行動の効果を予測することができ、今後の計画を立てるが、環境の状態を知る必要がある。モデルフリーエージェントは計画することができないが、モデルなしで行動し、環境を完全に観察する必要がない。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:28:08 GMT)
From homeostasis to resource sharing: Biologically and economically aligned multi-objective multi-agent AI safety benchmarks [0.0]
我々は、AIの安全性に関する現在主流の議論で無視されている生物学的、経済的動機付けのテーマを紹介します。これらのテーマには、有界および生物学的目的に対するホメオスタシス、非有界、手段的、ビジネス目的に対するリターンの減少、持続可能性原理、資源共有が含まれる。上記のテーマで8つの主要なベンチマーク環境を実装し、エージェントAIにおける重要な落とし穴と課題を明らかにします。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:08:03 GMT)
From Contracts to Code: Automating Smart Contract Generation with Multi-Level Finite State Machines [0.0]
本研究では,スマートコントラクトの実行を表現・追跡する多レベル有限状態マシンモデルを提案する。多レベル有限状態マシンの階層構造は、契約のモジュラリティとトレーサビリティを高める。モデルの潜在的な脆弱性を評価するために、セキュリティ分析も行います。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:41:30 GMT)
Flat-band thermodynamics reveals enhanced performance across Otto, Carnot, and Stirling cycles [0.0]
マジックアングルツイスト二層グラフェン(MATBG)は、外部磁場下で顕著な電子的性質を示す。我々は,3つの異なる量子熱力学サイクル下でのMATBGの動作相図を包括的に解析する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:32:58 GMT)
Features extraction for image identification using computer vision [0.0]
この研究は、視覚変換器(ViT)およびジェネレーティブ・ディバイザ・ネットワーク(GAN)などのアプローチに焦点を当てている。実験により,両手法のメリットと限界,およびコンピュータビジョンの進歩における実用的応用について検討した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:43:52 GMT)
Fast quantum gates for exchange-only qubits using simultaneous exchange pulses [0.0]
本稿では,同時交換パルスを用いた単一量子ゲートの実装を高速化する。 2量子ゲートにおける3つのスピンのサブシーケンスはより少ないステップで実装可能であることを示す。我々は、SiGe量子ドットデバイスにおいて、$X$回転の同時交換実装を実験的に実証し、特徴付ける。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:20:21 GMT)
Fast charge noise sensing using a spectator valley state in a singlet-triplet qubit [0.0]
励起谷状態の1電子を持つシリコン一重項量子ビットを用いた荷電ノイズのリアルタイム検出法を提案する。共振器の分散読み出しは、連続して古典的な交換変動の測定を可能にする。重要なことに、このプロトコルはスピンコヒーレンスを保持し、キュービット論理ゲートと並行して実行できる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:53:14 GMT)
Families of Optimal Transport Kernels for Cell Complexes [0.0]
我々は,ホッジ・ラプラシア行列を用いて,細胞複合体信号分布間のワッサーシュタイン距離を明示的に表現する。これにより、CW錯体を比較し、最適な輸送マップを定義するための構造的に意味のある尺度が導かれる。特徴情報と構造情報の両方を同時に含むため, 融合グロモフ-ワッサーシュタイン距離をCW錯体に拡張する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:21:28 GMT)
False signatures of non-ergodic behavior in disordered quantum many-body systems [0.0]
エルゴード型孤立量子多体系は固有状態熱化仮説(ETH)を満たす ETHは、障害現実化の平均値が取られるとき、エネルギーウィンドウ内で局所観測可能量の期待値がどうなるかを規定していない。本研究では、乱れた量子多体系における局所観測値の期待値を分析する際に、エネルギー窓の調整方法を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:19:32 GMT)
Exploring the Effects of Mass Dependence in Spontaneous Collapse Models [0.0]
自然崩壊モデルは、量子力学における長年の計測問題を、客観的波動関数の崩壊を含むように理論のダイナミクスを変更することで解決することを目的としている。これらのモデルの中心的な特徴は、質量密度への依存であり、どのように、いつ崩壊が起こるかに直接影響を及ぼす。我々は,崩壊モデルの将来の発展と実証テスト可能性に重要な意味を持つ,限られた範囲の大量依存関数のみが実現可能であることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:49:50 GMT)
Exact distinguishability between real-valued and complex-valued Haar random quantum states [0.0]
我々はHaarランダム状態のスペクトル分解を解析的に計算する。実数値状態 $t$-designs の近似パラメータに下界を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:23:46 GMT)
Evaluating Ensemble and Deep Learning Models for Static Malware Detection with Dimensionality Reduction Using the EMBER Dataset [0.0]
本研究では,EMBERデータセットを用いた静的マルウェア検出における機械学習アルゴリズムの有効性について検討した。 LightGBM, XGBoost, CatBoost, Random Forest, Extra Trees, HistGradientBoosting, k-Nearest Neighbors (KNN), TabNetの8つの分類モデルを評価した。モデルは精度、精度、リコール、F1スコア、AUCに基づいて評価され、予測性能とロバスト性の両方を調べる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 18:45:10 GMT)
Ethics through the Facets of Artificial Intelligence [0.0]
懸念は、AIのぼやけた理解、どのように使用できるか、社会でどのように解釈されたかに起因している、と我々は主張する。本稿では,AI利用の倫理的評価のための枠組みを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:21:37 GMT)
Escaping the Krylov space during finite precision Lanczos [0.0]
有限精度算術における固有ベクトルの数値列は、正確なランツォスベクトルで表される真のベクトル空間から逃れることを示す。これは作用素成長仮説の解釈に真の脅威をもたらす。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:22:21 GMT)
Entanglement of a spin-1/2 Ising-Heisenberg diamond spin cluster in the thermal bosonic bath [0.0]
熱ボゾン浴の影響下でのイシン・ハイゼンベルク相互作用によるダイヤモンドスピンクラスターの時間進化について検討した。環境がシステム内の絡み合いの存在にどのように影響するかを実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:24:13 GMT)
Enhancing the Performance of Quantum Neutral-Atom-Assisted Benders Decomposition [0.0]
本稿では、混合整数線形プログラム(MILP)を解くためのハイブリッドベンダー分解フレームワークについて、これまでの研究の強化について述べる。マスター問題は、擬似非拘束バイナリ最適化(QUBO)モデルとして再構成され、自動変換技術を用いて中性原子量子プロセッサ上で解決される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:40:58 GMT)
Enhanced Quantum Mpemba Effect with Squeezed Thermal Reservoirs [0.0]
量子ムペンバ効果(Quantum Mpemba Effect、QMpE)は、量子系をその定常状態に指数関数的に加速することができる現象である。条件が満たされた場合,QMpEが効果的に誘発されることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:42:20 GMT)
Emergent Cognitive Convergence via Implementation: A Structured Loop Reflecting Four Theories of Mind (A Position Paper) [0.0]
我々は、心の4つの有力な理論にまたがる構造的収束の発見を報告する。この収束はエージェントフローと呼ばれる実践的なAIエージェントアーキテクチャ内で発生した。本稿では,エージェントフローで観測される設計レベルの規則性をキャプチャする記述的メタアーキテクチャとしてPEACEを紹介する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:54:45 GMT)
Einstein's Electron and Local Branching: Unitarity Does not Require Many-Worlds [0.0]
我々は、単一電子源と不透明半球検出器アレイを用いて、アインシュタインの電子回折に関する1927年の思考実験を再考した。 many-Worlds Interpretation (MWI) と Branched Hilbert Subspace Interpretation (BHSI) を比較した。我々の分析は、ユニタリティが並列世界を必要とするという考えに挑戦し、むしろより単純な視点を提唱する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 00:33:08 GMT)
Edge of Stochastic Stability: Revisiting the Edge of Stability for SGD [0.0]
我々は,ミニバッチ勾配降下(SGD)列車が異なる体制で「エッジ・オブ・安定性(EoSS)」と呼ばれることを示す。この体制では、2/eta$で安定化されるのは*バッチ・シャープネス* であり、これは対応する勾配に沿ったミニバッチ・ヘッセンの方向曲率である。その結果、Batch Sharpnessよりも一般的に小さい$lambda_max$が抑制され、より小さなバッチとより大きなステップサイズがよりフラットなミニマを好むという長年の経験的な観察と一致している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:43:59 GMT)
Dynamical and Emission Properties of Quantum Emitters driven by Ultra-Short Laser Pulses [0.0]
高性能量子技術の開発は、高忠実度で固体エミッタの量子状態を作成する能力に依存している。共振型Rabi発振、断熱型ラピッドパス(ARP)、Notch-filtered ARPの3つの単一パルスコヒーレント制御プロトコルを理論的に比較した。以上の結果より,NARPは内因性スペクトル分離性と高忠実度断熱路とを一意に組み合わせていることが明らかとなった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:26:35 GMT)
Dynamical analog spacetimes from nonlinear perturbations in a topological material [0.0]
トポロジカル材料内に包括的非線形アナログ重力場を構築する。進化する音場地平線の形成を数値的に実証し,アナログホーキング温度を定量化する。この研究は、幅広い種類の量子材料で非線形創発時空を探索するための基礎となる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:22:12 GMT)
Dichotomy theorem separating complete integrability and non-integrability of isotropic spin chains [0.0]
一般スピン$S$と隣り合う相互作用を持つ等方性スピン鎖を局所保存量の有無で検討する。 1つの量が 0 であるか否かは、2つのシナリオを鋭く分離する、という二分法定理を証明します。この定理はまた、$Sleq 13.5$に対する可積分性と非可積分性の完全な分類としても機能する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:56:41 GMT)
Decoding Translation-Related Functional Sequences in 5'UTRs Using Interpretable Deep Learning Models [0.0]
UTR-STCNetは可変長5'UTRの柔軟かつ生物学的基盤モデリングのためのトランスフォーマーベースのアーキテクチャである。 Saliency-Aware Token Clustering (SATC)モジュールは、サリエンシスコアに基づいて、ヌクレオチドトークンを有意義な単位に反復的に集約する。 Saliency-Guided Transformer(SGT)ブロックは、軽量なアテンション機構を使用して、ローカルおよび遠位規制の依存関係をキャプチャする。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:51:13 GMT)
Data-Driven Adaptive Gradient Recovery for Unstructured Finite Volume Computations [0.0]
双曲的保存則に対する非構造有限体積法における勾配再構成の強化のための新しいデータ駆動手法を提案する。提案手法は,DeepONetアーキテクチャを改良して,従来の構造化グリッド手法を非構造化メッシュに拡張する。提案アルゴリズムは従来の2階有限体積解法よりも高速かつ高精度である。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:23:57 GMT)
Covariant path integrals for quantum fields back-reacting on classical space-time [0.0]
古典場と相互作用する量子場の構成空間パス積分を導入する。ダイナミクスが完全に正であることを証明することによって、これを一貫して行うことができることを示す。時空距離を古典的に扱う一般相対性理論の経路積分定式化を導入する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:56:17 GMT)
Constructing material network representations for intelligent amorphous alloys design [0.0]
本研究では,二元系および三元系アモルファス合金の発見を加速する材料ネットワークを提案する。異なる年数で合成されたアモルファス合金を精査することにより, 動的材料ネットワークを構築し, 合金発見の歴史を追究する。過去に設計されたいくつかの革新的な材料がネットワークにコード化されており、新しい合金設計を導く上での予測力を実証している。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 08:19:23 GMT)
Conformal Predictions for Human Action Recognition with Vision-Language Models [0.0]
本研究では, コンフォーマル予測技術が, 最先端の人間の行動認識システムの信頼性を高める方法について検討する。 CPは、基礎となるVision-Language Modelを変更することなく、候補クラスの平均数を著しく削減できることを示す。追加のキャリブレーションデータを用いることなく,ソフトマックス予測の温度を調整することを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:31:49 GMT)
Concurrent Fermionic Simulation Gate [0.0]
単一ゲートサイクル内にアイソワップとc相操作を統合する新しいゲートを提案する。理論上は、二色パラメトリックドライブを異なる周波数で使用し、量子ビットを超伝導するためのこのゲートの実現の可能性を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:22:15 GMT)
Combining Language and Topic Models for Hierarchical Text Classification [0.0]
本稿では、PLMとトピックモデルを用いて、分類モデルのトレーニングに使用されるテキスト文書から特徴を抽出する。トピックモデルから抽出した特徴を用いた場合, PLMで得られた特徴のみを用いた場合に比べて, 分類性能が低下することがわかった。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:45:51 GMT)
Clocking and controlling attosecond currents in a scanning tunnelling microscope [0.0]
2色レーザーパルスによるアト秒電流の方向制御を行う。非断熱トンネルは基礎となる物理的メカニズムであり、現在のバースト持続時間は860である。アト秒バーストを方向制御するこの前例のない能力は、原子、分子、凝縮系の超高速電荷ダイナミクスを撮像することができる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:34:24 GMT)
Classical-quantum systems breaking conservation laws [0.0]
重力が量子化されなければならないかどうかは、基礎物理学における最大の開問題の一つである。古典粒子と相互作用する量子ビットを考察し、対応するハイブリッド系が角運動量保存に反することを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:19:00 GMT)
ChatChecker: A Framework for Dialogue System Testing and Evaluation Through Non-cooperative User Simulation [0.0]
ChatCheckerは複雑な対話システムの自動評価とテストのためのフレームワークである。大きな言語モデル(LLM)を使用して、多様なユーザインタラクションをシミュレートし、対話のブレークダウンを特定し、品質を評価する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:40:34 GMT)
Causal Graph Fuzzy LLMs: A First Introduction and Applications in Time Series Forecasting [0.0]
本研究では, GPT-2 とファジィ時系列 (FTS) と因果グラフを組み合わせた新しい LLM フレーム CGF-LLM を提案する。主な目的は、ファジフィケーションと因果解析の並列適用により、数値時系列を解釈可能な形式に変換することである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:03:13 GMT)
Canonical Representations of Markovian Structural Causal Models: A Framework for Counterfactual Reasoning [0.0]
反事実的推論は、「アリスがアスピリンを飲んだら、何故回復したのか」といった反事実的疑問に答えることを目的としている。構造因果モデルの正準表現(canonical representations of structure causal model)とも呼ばれる反ファクトモデルを導入する。構造因果モデルと比較して、観察的制約や介入的制約を変更することなく、多くの反事実的概念を特定できる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 09:13:02 GMT)
Can You Trust an LLM with Your Life-Changing Decision? An Investigation into AI High-Stakes Responses [0.0]
大規模言語モデル (LLMs) は、高い評価のライフアドバイスを求める声が高まっているが、自信はあるが誤った回答を提供するための標準的な安全策は欠如している。本稿では,3つの実験を通して,これらの故障モードについて検討する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:11:13 GMT)
Building a robust OAuth token based API Security: A High level Overview [0.0]
本稿では,このようなトークンベースのAPIセキュリティシステムを構築するために必要な基礎について述べる。その意図は、セキュアでスケーラブルなトークンベースのAPIセキュリティシステムを構築するために必要な基礎知識を開発者に提供することである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:14:14 GMT)
Bringing Balance to Hand Shape Classification: Mitigating Data Imbalance Through Generative Models [0.0]
我々は、RWTHドイツ語手話ハンドシェープデータセットに基づいて訓練されたEfficientNet分類器を使用する。提案手法はRWTHデータセットの最先端精度を5%向上させる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 20:41:29 GMT)
Beyond Algorethics: Addressing the Ethical and Anthropological Challenges of AI Recommender Systems [0.0]
AI駆動型推薦システム(RS)による倫理的・人類学的課題の検討私は、algorethicsを含む既存の倫理的アプローチは必要だが最終的には不十分であると主張する。本稿では、学際的視点、規制戦略、教育イニシアチブを統合した、人間中心のRS設計のための包括的枠組みを提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:22:08 GMT)
Benchmarking Classical and Quantum Models for DeFi Yield Prediction on Curve Finance [0.0]
我々はXGBoost, Random Forest, LSTM, Transformer, Quantum Neural Network (QNN), Quantum Feature Map (QSVM-QNN) の6つのモデルをベンチマークした。実験MAE, RMSE, 方向精度のモデル性能について検討した。 XGBoostはテストMAEが1.80で、Random Forestは1.77と71.36%で最高方向精度(71.57%)を達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 06:55:20 GMT)
Bayesian symbolic regression: Automated equation discovery from a physicists' perspective [0.0]
記号回帰は、データから閉形式の数学的モデルを学習するプロセスを自動化する。シンボリック回帰に対する標準的なアプローチは、モデル選択基準、正規化のアプローチ、モデル空間の探索に依存する。本稿では,確率論的アプローチが基本的考察と明示的な近似からモデル妥当性を確立する方法を示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:53:15 GMT)
BIDWESH: A Bangla Regional Based Hate Speech Detection Dataset [0.0]
本研究は,バングラヘイトスピーチデータセットであるBIDWESHを紹介する。 BD-SHSコーパスから9,183のインスタンスを3つの主要地域方言に翻訳し、注釈付けすることで構築された。その結果得られたデータセットは、バングラでヘイトスピーチの検出を進めるための言語的にリッチでバランスの取れた、包括的なリソースを提供する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 02:53:48 GMT)
Argument Quality Annotation and Gender Bias Detection in Financial Communication through Large Language Models [0.0]
我々は3つの最先端のLCMの財務的議論に言及する能力を評価する。分析モデルに性別バイアスを注入する逆攻撃を導入する。以上の結果から,LDMをベースとしたアノテーションは,人間よりもアノテータ間のアノテータ間の合意度が高いことが判明した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 17:54:45 GMT)
Application-Driven Benchmarking of the Traveling Salesperson Problem: a Quantum Hardware Deep-Dive [0.0]
この研究は、トラベリングセールスパーソン問題(Traveing Salesperson Problem)の例として、様々なハードウェアアーキテクチャの比較分析を含む。量子ハードウェア上で現実世界のアプリケーションを走らせるのに必要なステップを強調します。中性原子系、イオントラップ、超伝導ハードウェア上での模範量子アルゴリズムの相対効率に関する結果。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 11:22:04 GMT)
Analysis of Threat-Based Manipulation in Large Language Models: A Dual Perspective on Vulnerabilities and Performance Enhancement Opportunities [0.0]
大規模言語モデル(LLM)は、脅威ベースの操作に対する複雑な応答を示す。本研究は,3つのLLMによる3,390個の実験応答の包括的解析を行った。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:13:08 GMT)
An advanced AI driven database system [0.0]
本稿では人工知能(AI)がサポートする新しいデータベースシステムを提案する。自然言語処理(NLP)ベースの直感的インタフェースを用いてデータ管理を改善することを目的としている。このシステムは、LLM(Large Language Models)と高度な機械学習アルゴリズムを統合することで、データベースの可能性を強化することを目的としている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 16:10:45 GMT)
An Efficient Algorithm for Generating Minimal Unique-Cause MC/DC Test cases for Singular Boolean Expressions [0.0]
MC/DC(Modified Condition/Decision Coverage)は、重要なシステムの信頼性と安全性を確保するための構造的カバレッジ基準である。 Unique-Cause MC/DCは高い保証を提供するが、その効率的なテスト生成に関する研究は不足している。本稿は,N条件のSBEに対して,100%ユニクカスMC/DCを保証するため,N + 1ケースの最小限のテストセットを直接構築する決定論的アルゴリズムである'Robin's Rule'を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:13:57 GMT)
Alternative Loss Function in Evaluation of Transformer Models [0.0]
本稿では,アルゴリズム投資戦略における予測生成モデルの最適化に有効な平均絶対目標損失関数を提案する。 MADL関数の結果は Transformer と LSTM モデルで比較され,ほぼすべてのケースにおいて Transformer が LSTM で得られた結果よりも有意に優れていることを示す。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:57:25 GMT)
Algorithmic neutrality [0.0]
アルゴリズム中立性:それは可能か? アルゴリズム中立性とは何か? アルゴリズム中立性:その規範的重要性は何か?
論文参考訳（メタデータ） (Tue, 22 Jul 2025 19:35:58 GMT)
Agentic RAG with Knowledge Graphs for Complex Multi-Hop Reasoning in Real-World Applications [0.0]
INRAExplorerは、INRAE(フランス国立農業・食品・環境研究所)の科学的データを探索するエージェントRAGシステムである。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:03:10 GMT)
Advanced U-Net Architectures with CNN Backbones for Automated Lung Cancer Detection and Segmentation in Chest CT Images [0.0]
本研究では, 各種畳み込みニューラルネットワーク(CNN)のバックボーンと統合したU-Netアーキテクチャの有効性について検討し, 胸部CT画像における肺がんの自動検出とセグメンテーションについて検討した。 U-Netモデルは3つのCNNバックボーン(ResNet50、VGG16、Xception)で開発された。分類において、U-Net with Xceptionを用いたCNNモデルは99.1%の精度、99.74パーセントのリコール、99.42パーセントのF1スコアを達成した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:40:12 GMT)
Adaptive Relative Pose Estimation Framework with Dual Noise Tuning for Safe Approaching Maneuvers [0.0]
本研究は、適応非線形フィルタリングによる高度なコンピュータビジョン技術を統合する完全なパイプラインを提案する。画像前処理によって強化された畳み込みニューラルネットワーク(CNN)は、チェッカー画像から構造マーカーを検出する。 UKFフレームワークは、非線形相対力学を処理し、完全な相対的ポーズを推定する能力のために選択される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 04:13:03 GMT)
Adaptive Multi-task Learning for Multi-sector Portfolio Optimization [0.0]
本研究では,複数の分野にまたがる主要な時間空間間の関連性を定量化し,学習する,データ適応型マルチタスク学習手法を提案する。このアプローチは、複数の因子モデルの同時推定を改善するだけでなく、マルチセクタポートフォリオの最適化も強化する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:24:24 GMT)
Adaptive Gaussian Mixture Models-based Anomaly Detection for under-constrained Cable-Driven Parallel Robots [0.0]
本稿では,センサを追加せずに,トルクデータのみを用いて異常を検出できるかどうかを検討する。ガウス混合モデル(GMM)に基づく適応無教師外乱検出アルゴリズムを導入した。提案手法は,100%真の正の速度と95.4%の平均真の負の速度を1秒間検出遅延で達成する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:39:28 GMT)
AI-Enhanced Precision in Sport Taekwondo: Increasing Fairness, Speed, and Trust in Competition (FST.ai) [0.0]
「FST.ai」は、スポーツテコンドーにおける能力向上を目的とした、AIを活用した新しいフレームワークである。キーアクションの識別と分類を自動化し、意思決定時間を数分から秒に短縮する。この枠組みは、柔道、空手、フェンシング、さらにはサッカーやバスケットボールのようなチームスポーツのようなアクション検出を必要とする幅広いスポーツに適応することができる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:19:12 GMT)
A photon density wavefunction [0.0]
真空中のマクスウェルの方程式は、正式にシュル「オーディンガーの方程式」の形でキャストすることができる。光子を数えることができるので、EM場から導かれるより説得力のある波動関数が存在する必要がある。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:55:42 GMT)
A novel approach to navigate the taxonomic hierarchy to address the Open-World Scenarios in Medicinal Plant Classification [0.0]
既存の薬草分類法は、しばしば階層的な分類や未知の種を正確に識別することができないことが観察された。 DenseNet121,Multi-Scale Self-Attention (MSSA) と階層分類のためのカスケード分類器を組み合わせた新しい手法を提案する。提案するモデルサイズは,既存の最先端技術に比べて約4倍小さく,現実のアプリケーションに容易にデプロイできる。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 21:32:15 GMT)
A charge-density machine-learning workflow for computing the infrared spectrum of molecules [0.0]
分子の赤外スペクトルの計算のための機械学習ワークフローを提案する。我々はJacobi-Legendreクラスタ展開を用いて収束密度関数理論計算の実空間電荷密度を予測する。このスキームは、PySCF符号の数値的枠組みの中で実装され、気体相におけるウラシル分子の赤外スペクトルに適用される。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:18:04 GMT)
A Target-based Multi-LiDAR Multi-Camera Extrinsic Calibration System [0.0]
マルチLiDARおよびマルチカメラセンサスイートに適したターゲットベース外部キャリブレーションシステムを提案する。このシステムにより、LiDARとカメラの相互校正を、事前知識が限られている。その結果,提案手法の有効性が示された。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 14:15:28 GMT)
A Study on Variants of Conventional, Fuzzy, and Nullspace-Based Independence Criteria for Improving Supervised and Unsupervised Learning [0.0]
我々は、教師なし学習者を設計するために、すべての独立基準を見直した。独立度基準を3つ使い,非教師付き・監督型次元減少法の設計に使用した。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 22:02:50 GMT)
A Simple and Efficient Joint Measurement Strategy for Estimating Fermionic Observables and Hamiltonians [0.0]
量子化学と相関するフェルミオン系に関係のあるフェルミオン可観測物とハミルトンを簡易に推定する手法を提案する。提案手法は,N$モードフェルミオン系におけるマヨラナ作用素の任意の積のノイズバージョンを共同測定する手法の実装に基づいている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 12:49:43 GMT)
A Relational (Re)Turn: Revisit Interactive Art through Interaction and Aesthetics [0.0]
この論文は、対話型芸術における相互作用の概念を再考し、社会文化的起源から人間とコンピュータのパラダイムにおける狭まりまで、その進化をたどるものである。相互対象的および技術的に媒介する美学としてのリレーショナルインタラクションの再生を提案する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 13:46:28 GMT)
A Parameter-Efficient Quantum Anomaly Detection Method on a Superconducting Quantum Processor [0.0]
本稿では,新しい量子機械学習手法を提案する。実用的な画像異常検出のための効率的な量子異常検出(PEQAD)。 PEQADは従来のモデルと比較してパラメータ効率と精度の両方を達成することを目的としている。超伝導量子プロセッサ上での一般画像データセットに対する量子異常検出法の最初の実装を実証する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 23:46:35 GMT)
A Distributional View of High Dimensional Optimization [0.0]
我々は、古典的な最適化の失敗点を調査することで、この見方を動機付けます。ランダムに描画された目的関数の最適化を検討する。さらに、この分布ビューは勾配降下の最適ステップサイズ制御に関する洞察を与える。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 07:56:01 GMT)
A Data-Driven Machine Learning Approach for Predicting Axial Load Capacity in Steel Storage Rack Columns [0.0]
冷間成形鋼構造物の軸受荷重特性を予測するための機械学習(ML)フレームワークを提案する。この方法論は堅牢なモデル選択と解釈可能性を強調し、従来の分析手法の限界に対処する。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 10:16:53 GMT)
A Compact Post-quantum Strong Designated Verifier Signature Scheme from Isogenies [0.0]
我々は、コンパクトで量子抵抗的なSDVSスキームである$mathsfCSItext-SDVS$を紹介した。 $mathcalO(lambda)$のキーとシグネチャは、$mathcalO(lambda)$のサイズであり、既存の量子後SDVSスキームにおける典型的な$mathcalO(lambda)$バウンドよりも大幅に改善されている。
論文参考訳（メタデータ） (Tue, 22 Jul 2025 05:51:44 GMT)