One Image is Worth a Thousand Words: A Usability Preservable Text-Image Collaborative Erasing Framework [127.1] 我々は、最初のテキストイメージ協調概念消去(Co-Erasing)フレームワークを紹介する。
Co-Erasingは、テキストプロンプトと、プロンプトによって誘導されるそれに対応する望ましくないイメージによって、この概念を共同で記述する。
我々は,テキストガイドによる画像概念の洗練戦略を設計し,特定のテキスト概念に最も関係のある視覚的特徴に焦点を当てるようモデルに指示する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:25:50 GMT)
Exploring Federated Unlearning: Review, Comparison, and Insights [101.6] フェデレーション・アンラーニングは、フェデレーション・システムで訓練されたモデルからデータを選択的に除去することを可能にする。
本稿では,既存のフェデレーション・アンラーニング手法について検討し,アルゴリズムの効率,モデル精度への影響,プライバシ保護の有効性について検討する。
フェデレートされたアンラーニング手法を評価するための統一ベンチマークであるOpenFederatedUnlearningフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:53:29 GMT)
LoFT: LoRA-fused Training Dataset Generation with Few-shot Guidance [96.7] 本稿では,Few-shot Guidanceを用いたLoRA-Fused Training-data Generationという新しいデータセット生成フレームワークを提案する。
提案手法は,個々の実画像にLoRA重みを微調整し,推定時に融合させ,実画像の特徴を組み合わせた合成画像を生成し,データの多様性と忠実度を向上させる。
実験の結果,LoFT生成データに対するトレーニングは,他の合成データセット法より一貫して優れており,データセットのサイズが大きくなるにつれて精度が著しく向上することがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:17:55 GMT)
Feasibility with Language Models for Open-World Compositional Zero-Shot Learning [96.7] オープンワールド構成ゼロショット学習では、全ての状態オブジェクトの組み合わせは目に見えないクラスと見なされる。
本研究は、外部補助知識を用いて状態-対象の組み合わせの実現可能性を決定することに焦点を当てる。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:37:08 GMT)
LLMs unlock new paths to monetizing exploits [85.6] 大規模言語モデル(LLM)はすぐにサイバー攻撃の経済性を変えるだろう。
LLMは、敵がユーザーごとにカスタマイズされた攻撃を起動することを可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:05:25 GMT)
V-MAGE: A Game Evaluation Framework for Assessing Vision-Centric Capabilities in Multimodal Large Language Models [84.3] 本稿では,視覚中心型多機能ゲーム評価(V-MAGE)について紹介する。
V-MAGEは、30以上の慎重に構築された評価シナリオからなる5つの異なるビデオゲームを特徴としている。
V-MAGEは、動的かつインタラクティブな設定において、MLLMの視覚的および推論能力を改善するために実行可能な洞察を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:29:40 GMT)
PointArena: Probing Multimodal Grounding Through Language-Guided Pointing [79.8] ポインティングは、視覚的コンテキスト内で言語を接地するための基本的で直感的なメカニズムとして機能する。
多様な推論シナリオを対象とするマルチモーダル評価のための総合的なプラットフォームであるPointArenaを紹介した。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:37:26 GMT)
Rethinking the Role of Prompting Strategies in LLM Test-Time Scaling: A Perspective of Probability Theory [79.6] 本稿では、標準的で現実的なスケーリング設定である多数決に焦点をあてる。
サンプリング時間と計算オーバーヘッドが増加するにつれて、より優れた初期性能を持つ複雑なプロンプト戦略が、次第に単純なチェーン・オブ・サート(Chain-of-Thought)に遅れることが示される。
本稿では,スケーリング性能を迅速かつ正確に予測し,大規模なサンプリング時間で最良の戦略を選択するための確率理論に基づく手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:28:57 GMT)
ShifCon: Enhancing Non-Dominant Language Capabilities with a Shift-based Contrastive Framework [78.1] ShifConはShiftベースのContrastiveフレームワークで、他の言語の内部の前進プロセスを支配的な言語に合わせる。
非支配的な言語の表現を支配的な言語サブスペースに移行し、モデルパラメータにエンコードされた比較的リッチな情報にアクセスできるようにする。
実験により、我々のShifConフレームワークは、非支配言語の性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:16:34 GMT)
Conceptual framework for the application of deep neural networks to surface composition reconstruction from Mercury's exospheric data [77.4] 本研究では、ディープニューラルネットワーク(DNN)を用いた中性外気圏のその場測定から水銀のレゴリス元素組成の導出の可能性について検討する。
本稿では,下記表層リゴリスの化学成分を予測した制御フィードフォワードDNNアーキテクチャを提案する。
表面と外圏の相互作用や、外圏の形成に至る過程を推定する指標として機能する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:52:45 GMT)
AgentDAM: Privacy Leakage Evaluation for Autonomous Web Agents [75.9] 我々は、AIウェブナビゲーションエージェントがデータ最小化のプライバシー原則に従うかどうかを測定する新しいベンチマークAgentDAMを紹介する。
我々のベンチマークは、現実的なWebインタラクションシナリオをエンドツーエンドでシミュレートし、既存のWebナビゲーションエージェントに適応する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:47:55 GMT)
On DeepSeekMoE: Statistical Benefits of Shared Experts and Normalized Sigmoid Gating [75.3] DeepSeekMoEは、共有専門家戦略の展開と正規化されたシグモイドゲーティングメカニズムの2つのユニークな特徴から際立っている。
本研究では, 共有専門家戦略と正規化シグモイドゲーティングの両方において, サンプル効率の利得を明らかにするために, 専門家推定タスクの収束解析を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:58:18 GMT)
DexGarmentLab: Dexterous Garment Manipulation Environment with Generalizable Policy [75.0] 衣料品の操作は、衣服カテゴリー、ジオメトリー、変形の多様性のために重要な課題である。
DexGarmentLabは,デキスタラスな(特にバイマニュアルな)衣料品の操作に特化して設計された最初の環境である。
15のタスクシナリオのための大規模な高品質な3Dアセットを備え、服のモデリングに適したシミュレーション技術を洗練し、シム・トゥ・リアルのギャップを減らす。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:26:59 GMT)
CoMP: Continual Multimodal Pre-training for Vision Foundation Models [72.3] 我々は、VFM(Vision Foundation Models)をマルチモーダルな方法で継続的に事前訓練する。
我々は、慎重に設計されたマルチモーダル事前学習パイプラインであるCoMPを紹介する。
DINOv2、SigLIP、AIMv2のような主要なVFMは、マルチモーダル理解タスクにおいて著しく改善されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:36:32 GMT)
HiFlow: Training-free High-Resolution Image Generation with Flow-Aligned Guidance [70.7] HiFlowはトレーニング不要でモデルに依存しないフレームワークで、事前トレーニングされたフローモデルの解像度ポテンシャルを解放する。
HiFlowはT2Iモデルの高解像度画像合成の品質を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:11:45 GMT)
ZeroSearch: Incentivize the Search Capability of LLMs without Searching [69.6] 我々はZeroSearchを紹介した。ZeroSearchは、学習中にシミュレーションされた検索を備えた実検索エンジンを使用するための、大規模言語モデルの能力を動機付けるフレームワークである。
提案手法は,LLMを有用な文書とノイズの両方を生成可能な検索モジュールに変換するための,軽量な教師付き微調整から始まる。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:53:00 GMT)
Conditioning Matters: Training Diffusion Policies is Faster Than You Think [69.3] 拡散政策は、視覚言語アクション(VLA)モデルを構築するための主流パラダイムとして登場した。
条件拡散政策訓練の基本的な課題は, 生成条件の識別が困難である場合, 訓練対象が限界行動分布をモデル化することである。
条件に依存しない条件付きフローマッチングにおけるソース分布を変更するソリューションであるCocosを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:14:22 GMT)
Automatic Reward Shaping from Confounded Offline Data [69.1] 本稿では,DQN(Deep Q-Network)に基づいて,観測データのバイアスの解消に頑健な新しい強化学習アルゴリズムを提案する。
提案手法は,12個のAtariゲームに対して適用され,観察された動作および目標ポリシーへの入力がミスマッチおよび観測されていない共同創設者が存在するすべてのゲームにおいて,標準DQNを一貫して支配していることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:40:01 GMT)
Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model? [67.3] RLVR(Reinforcement Learning with Verifiable Rewards)は近年,大規模言語モデル(LLM)の推論性能の向上に成功している。
本研究はRLVRの現状を批判的に考察する。
現在のトレーニング設定では、根本的な新しい推論パターンが生まれていないことが分かりました。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:39:33 GMT)
Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching [67.1] 大規模言語モデル(LLM)は最新の情報の提供に苦慮することが多い。
既存のアプローチは、通常、新しいドキュメントのトレーニングを継続する。
効率的なヒューマンラーニングにおけるFeynman Techniqueの成功に感銘を受けて、セルフチューニングを紹介した。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:30:57 GMT)
Inspiring the Next Generation of Segment Anything Models: Comprehensively Evaluate SAM and SAM 2 with Diverse Prompts Towards Context-Dependent Concepts under Different Scenes [66.1] 我々は2Dおよび3D画像とビデオで11のCD概念上のSAMを徹底的に定量的に評価する。
我々は,手動,自動,中間的な自己プロンプトをサポートするSAMとSAM2の統一的な評価フレームワークを開発した。
この研究は、文脈に依存しない概念と文脈に依存した概念のセグメンテーションにおける将来の研究を導くための貴重な洞察を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:53:41 GMT)
Imputation-free and Alignment-free: Incomplete Multi-view Clustering Driven by Consensus Semantic Learning [65.8] 不完全なマルチビュークラスタリングでは、欠落したデータがビュー内のプロトタイプシフトとビュー間のセマンティック不整合を誘導する。
コンセンサスセマンティクス学習(FreeCSL)のためのIMVCフレームワークを提案する。
FreeCSLは、最先端の競合他社と比較して、IMVCタスクの信頼性と堅牢な割り当てを実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:37:10 GMT)
WildDoc: How Far Are We from Achieving Comprehensive and Robust Document Understanding in the Wild? [64.6] 本稿では,自然環境における文書理解の評価に特化して設計されたWildDocについて紹介する。
WildDoc上での最先端MLLMの評価は、従来のベンチマークと比べて性能が大幅に低下し、モデルの頑健さが不十分であることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:09:46 GMT)
Learning hidden cascades via classification [64.5] 拡散モデルの特徴を学習するための部分的可観測性を考慮した機械学習フレームワークを提案する。
本手法を2種類の合成ネットワーク上で評価し,実世界のインサイダー取引ネットワークに拡張する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:23:52 GMT)
Creating General User Models from Computer Use [62.9] 本稿では,コンピュータとのインタラクションを観察することでユーザについて学習する汎用ユーザモデル(GUM)のアーキテクチャを提案する。
GUMは、ユーザ(例えばデバイスのスクリーンショット)の非構造化観察を入力として受け取り、ユーザの知識と好みをキャプチャする信頼度重み付け命題を構築する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:00:31 GMT)
Training of Scaffolded Language Models with Language Supervision: A Survey [62.6] 本調査は,戦後のLM周辺における新規構造物の設計と最適化に関する文献を整理した。
本稿では,この階層構造を足場型LMと呼び,ツールを用いた多段階プロセスに統合されたLMに焦点を当てる。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:01:03 GMT)
Pseudo-Label Quality Decoupling and Correction for Semi-Supervised Instance Segmentation [62.6] Semi-Supervised Instance (SSIS)は、画像ピクセルを別個のオブジェクトインスタンスに分類し、グループ化する。
この学習パラダイムは、通常、インスタンスカテゴリやピクセルマスクのノイズの多い擬似ラベルによって生じる不安定なパフォーマンスの重大な課題に直面します。
上記の課題に対処するために, PseudoLabel Quality Decoupling and Correction (PL-DC) フレームワークを新たに導入する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:07:17 GMT)
Sparsing Law: Towards Large Language Models with Greater Activation Sparsity [62.1] 活性化空間性は、除去できる活性化出力の中に、かなり弱い分散要素が存在することを表す。
PPL-$p%$ sparsity, a accurate and performance-aware activation sparsity metric。
我々は、SiLUよりも活性化関数としてReLUが効率的であることを示し、より多くのトレーニングデータを利用してアクティベーション空間を改善することができることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:29:10 GMT)
Dynam3D: Dynamic Layered 3D Tokens Empower VLM for Vision-and-Language Navigation [61.2] VLN(Vision-and-Language Navigation)は、生体エージェントが空間移動を利用して3D環境をナビゲートするコアタスクである。
ナビゲーション動作予測において3D-VLMを学習するための視覚入力として,言語整列,一般化,階層的な3D表現を利用する動的階層化3D表現モデルDynam3Dを提案する。
我々のDynam3Dは3Dインスタンスのオンラインエンコーディングとローカライズが可能であり、それを動的に更新することで、ナビゲーションのための大規模な探索と長期記憶機能を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:46:27 GMT)
GIE-Bench: Towards Grounded Evaluation for Text-Guided Image Editing [60.7] テキスト誘導画像編集モデルを評価するための新しいベンチマークを導入する。
このベンチマークには、20種類のコンテンツカテゴリにわたる高品質な編集例が1000以上含まれている。
我々は、GPT-Image-1をいくつかの最先端編集モデルと比較する大規模な研究を行っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:55:54 GMT)
Structured Preference Optimization for Vision-Language Long-Horizon Task Planning [60.3] 視覚言語タスクプランニングの既存の方法は、短期水平タスクでは優れているが、動的環境における複雑な長期水平計画では不足することが多い。
これらの課題は、ロングホライゾンタスクのための高品質な推論プロセスを生成するために、効果的にモデルを訓練することの難しさから生じる。
本研究では,長期タスク計画における推論と行動選択の促進を目的とした構造的選好最適化(SPO)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:07:36 GMT)
Is Compression Really Linear with Code Intelligence? [60.1] textitFormat Annealingは、事前訓練されたモデルの本質的な能力を同等に評価するために設計された、軽量で透明なトレーニング手法である。
我々の経験的結果は、測定されたコードインテリジェンスとビット・パー・キャラクタ(BPC)の基本的な対数関係を明らかにする。
私たちの研究は、コードインテリジェンスの開発における圧縮の役割をより微妙に理解し、コードドメインにおける堅牢な評価フレームワークに貢献します。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:59:14 GMT)
Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.9] 本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:13:26 GMT)
Learning to Deblur Polarized Images [59.3] 偏光カメラは、1枚のショットで異なる偏光子角度で4つの直線偏光画像をキャプチャすることができる。
オンチップのマイクロ偏光器は光の一部を遮蔽するため、センサーの露出時間が長い場合が多いため、捕獲された偏光画像はぼやけやすい。
そこで本研究では,偏光を意識してこの問題を解決するために,偏光画像デブロアリングパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:45:25 GMT)
Towards Anomaly-Aware Pre-Training and Fine-Tuning for Graph Anomaly Detection [59.0] グラフ異常検出(GAD)は近年注目度が高まりつつあるが、2つの重要な要因があるため、依然として困難である。
Anomaly-Aware Pre-Training and Fine-Tuning (APF)は、GADの課題を軽減するためのフレームワークである。
10のベンチマークデータセットに関する総合的な実験は、最先端のベースラインと比較してAPFの優れたパフォーマンスを検証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:28:49 GMT)
On the Interconnections of Calibration, Quantification, and Classifier Accuracy Prediction under Dataset Shift [58.9] 本稿では,データセットシフト条件下でのキャリブレーションと定量化の3つの基本問題間の相互接続について検討する。
これらのタスクのいずれか1つに対するオラクルへのアクセスは、他の2つのタスクの解決を可能にすることを示す。
本稿では,他の分野から借用した高度に確立された手法の直接適応に基づく各問題に対する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:42:55 GMT)
Disentangling CLIP for Multi-Object Perception [58.7] CLIPのような視覚言語モデルは、シーン内の1つの顕著なオブジェクトを認識するのに優れていますが、複数のオブジェクトを含む複雑なシーンで苦労しています。
DCLIPはCLIP機能を2つの相補的な目的から切り離すフレームワークである。
実験の結果,DCLIPはCLIPと比較してクラス間特徴類似度を30%削減できることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:06:07 GMT)
CompAlign: Improving Compositional Text-to-Image Generation with a Complex Benchmark and Fine-Grained Feedback [58.3] 最先端のT2Iモデルは、テキストプロンプトによって高解像度の画像を生成することができる。
しかし、複数の対象、属性、空間的関係を規定する構成的なシーンを正確に描写することは困難である。
我々は3次元空間的関係の描写を評価することに焦点を当てた、挑戦的なベンチマークであるCompAlignを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:23:58 GMT)
Breaking the Batch Barrier (B3) of Contrastive Learning via Smart Batch Mining [57.4] B3(Breaking the Batch Barrier)は、コントラスト学習(CL)のための高品質なバッチをキュレートする新しいバッチ構築戦略である。
私たちのアプローチは、トレーニング済みの教師埋め込みモデルを使用して、データセットのすべての例をランク付けすることから始まります。
次に、このグラフにコミュニティ検出アルゴリズムを適用して、互いに強い負となるサンプルのクラスタを識別する。
クラスタは、バッチ内の負に富んだバッチを構築するために使用される。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:25:43 GMT)
$\mathcal{A}LLM4ADD$: Unlocking the Capabilities of Audio Large Language Models for Audio Deepfake Detection [57.3] オーディオ大言語モデル(ALLM)は様々なオーディオ処理タスクにおいて大きな進歩を遂げた。
ADDのためのALLM駆動フレームワークであるmathcalALLM4ADD$を提案する。
提案手法は,特にデータスカースシナリオにおいて,偽音声検出において優れた性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:10:03 GMT)
Masking in Multi-hop QA: An Analysis of How Language Models Perform with Context Permutation [56.7] MHQA(Multi-hop Question Answering)は、質問に答えるために複雑なレイヤを追加し、より難しいものにします。
本稿では,様々な構成で検索結果(検索文書)を置換することで,言語モデルがマルチホップ質問にどう反応するかを考察する。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:29:47 GMT)
To Think or Not to Think: Exploring the Unthinking Vulnerability in Large Reasoning Models [56.2] 大規模推論モデル (LRM) は、最終的な答えを生成する前に明確な推論トレースを生成することで複雑なタスクを解決するように設計されている。
LRM(Unthinking)と呼ばれる重要な脆弱性を明らかにし、特別なトークンを操作することで思考プロセスを回避できます。
本稿では,この脆弱性を悪意と有益の両方の観点から検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:32:49 GMT)
AVA: Attentive VLM Agent for Mastering StarCraft II [56.1] Intentive VLM Agent (AVA) は、人工エージェントの認識と人間のゲームプレイ体験を一致させるマルチモーダルのStarCraft IIエージェントである。
我々のエージェントは、ゲームプレイ中に人間の認知過程をより密にシミュレートするRGB視覚入力と自然言語観察を組み込むことにより、この制限に対処する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:21:12 GMT)
HAFLQ: Heterogeneous Adaptive Federated LoRA Fine-tuned LLM with Quantization [56.0] LLM(Federated Fine-tuning of Pre-trained Large Language Models)は、さまざまなデータセットにまたがるタスク固有の適応を可能にすると同時に、プライバシの保護を可能にする。
本研究では, HAFLQ (Heterogeneous Adaptive Federated Low-Rank Adaptation Fine-tuned LLM with Quantization) を提案する。
テキスト分類タスクの実験結果から,HAFLQはメモリ使用量を31%削減し,通信コストを49%削減し,精度を50%向上し,ベースライン法よりも高速な収束を実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:03:52 GMT)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [55.9] Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。
分子理解を改善するために,分子エンコーダの相補的な情報を統合するモジュールを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:51:18 GMT)
A Generative Framework for Causal Estimation via Importance-Weighted Diffusion Distillation [55.5] 観察データから個別化された治療効果を推定することは因果推論における中心的な課題である。
逆確率重み付け(IPW)は、この問題に対するよく確立された解決策であるが、現代のディープラーニングフレームワークへの統合は依然として限られている。
本稿では,拡散モデルの事前学習と重み付きスコア蒸留を組み合わせた新しい生成フレームワークであるIWDDを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:00:52 GMT)
GeoMM: On Geodesic Perspective for Multi-modal Learning [55.4] 本稿では,マルチモーダル学習における測地線距離を新しい距離測定基準として導入する。
我々のアプローチは、現在のマルチモーダル学習に測地距離を適用するための包括的な戦略を取り入れている。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:12:41 GMT)
Concept-Guided Interpretability via Neural Chunking [54.7] ニューラルネットワークは、トレーニングデータの規則性を反映した生の集団活動のパターンを示す。
本稿では,ラベルの可利用性と次元性に基づいて,これら新たな実体を抽出する3つの手法を提案する。
私たちの研究は、認知原則と自然主義的データの構造の両方を活用する、解釈可能性の新しい方向性を指し示しています。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:49:43 GMT)
VideoHallu: Evaluating and Mitigating Multi-modal Hallucinations on Synthetic Video Understanding [54.2] VideoHalluは、Veo2、Sora、Klingといったモデルによって生成された合成ビデオから構築された3000以上のビデオQAペアのベンチマークである。
マルチモーダル大言語モデル(MLLM)の批判的思考能力は,人間に知覚的に明らかだが,言語先行により幻覚することが多い異常に対して評価する。
これらのモデルはMVBenchやMovieChatのような実世界の多くのベンチマークでよく機能するが、合成ビデオにおける物理に基づく基本的な推論と常識的推論に苦戦している。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:58:10 GMT)
Dynamic Base model Shift for Delta Compression [53.5] デルタ圧縮はデルタパラメータの冗長性を減少させることでコスト削減を試みる。
既存のメソッドはデフォルトでベースモデルとして事前訓練されたモデルを使用し、各タスクのデルタパラメータを圧縮する。
デルタ圧縮を行う前にベースモデルを対象タスクに動的に適応させる動的ベースモデルシフト(DBMS)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:11:19 GMT)
DiCo: Revitalizing ConvNets for Scalable and Efficient Diffusion Modeling [53.3] Diffusion Transformer (DiT) は、視覚生成のための有望な拡散モデルであるが、計算オーバーヘッドが大きい。
本稿では,効率的かつ表現力のある拡散モデルを構築するための代替ビルディングブロックとして,畳み込みを再考する。
標準のConvNetモジュールから完全に構築された拡散モデルのファミリであるDiffusion ConvNet(DiCo)を紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:54:04 GMT)
DDAE++: Enhancing Diffusion Models Towards Unified Generative and Discriminative Learning [53.3] 生成前訓練は差別的な表現をもたらし、統一された視覚生成と理解への道を開くことが示されている。
この研究は自己条件付けを導入し、ネットワークに固有のリッチなセマンティクスを内部的に活用し、独自のデコード層をガイドする。
提案手法は、FIDの生成と認識の精度を1%の計算オーバーヘッドで向上させ、多様な拡散アーキテクチャで一般化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:47:16 GMT)
Delta Attention: Fast and Accurate Sparse Attention Inference by Delta Correction [52.1] 変圧器は二次的な複雑さを持ち、長いシーケンスに対して高い推論コストとレイテンシをもたらす。
本稿では、この分布シフトを修正するためのシンプルで斬新で効果的な手順を提案する。
1Mトークンのプリフィル処理では,Flash Attention 2の32倍の速度で,約98.5%の間隔を維持することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:48:33 GMT)
EdgeOL: Efficient in-situ Online Learning on Edge Devices [51.9] 予測精度、微調整実行時間、エネルギー効率を最適化するエッジオンライン学習フレームワークであるEdgeOLを提案する。
実験結果から、EdgeOLは、全体の微調整実行時間を64%削減し、エネルギー消費を52%削減し、オンラインの即時学習戦略よりも平均推定精度を1.75%向上させることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:48:12 GMT)
Learning Equivariant Non-Local Electron Density Functionals [51.7] 等変グラフニューラルネットワーク(GNN)に基づく新しい非局所XC関数であるEquivariant Graph Exchange correlation (EG-XC)を導入する。
この点の雲に同変GNNを適用することにより、スケーラブルで正確な分子レンジ相互作用をキャプチャする。
EG-XCは、QM9上のデータ効率と分子サイズの外挿に優れ、5倍以上の分子で訓練された整合力場である。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:38:56 GMT)
LGBQPC: Local Granular-Ball Quality Peaks Clustering [51.6] 密度ピーククラスタリング(DPC)アルゴリズムは、任意の形状のクラスタを検出する能力において、かなりの注目を集めている。
近年のDPCとグラニュラーボールコンピューティングの統合により、GBベースのDPCアルゴリズムが実現され、計算効率が向上した。
本稿では,ローカルGB品質ピーククラスタリング(LGBQPC)アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:26:02 GMT)
Learning Dense Hand Contact Estimation from Imbalanced Data [51.5] 密接な接触推定の学習には2つの大きな課題がある。
まず、ほとんどのサンプルが接触していないハンドコンタクトデータセットからクラス不均衡の問題が存在する。
第2に、手接触データセットには、指先で示されるほとんどの手接触と空間的不均衡の問題が含まれている。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:54:25 GMT)
Learning to Cover: Online Learning and Optimization with Irreversible Decisions [50.6] 我々は,個別かつ不可逆な意思決定を対象とするオンライン学習と最適化の問題を定義した。
各期間において、意思決定者は、オープンする施設を選択し、それぞれの成功に関する情報を受け取り、将来の決定を導くために分類モデルを更新する。
目的は,多数の施設を対象とする地平線を特徴とし,カバー対象を反映するチャンス制約の下で施設開口を最小化することである。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:16:21 GMT)
Surgical Foundation Model Leveraging Compression and Entropy Maximization for Image-Guided Surgical Assistance [50.5] 低侵襲手術(MIS)におけるリアルタイム映像理解の重要性
手術ビデオからコンパクトで情報的表現を学習するための,新しい自己教師型フレームワークであるCompress-to-Explore (C2E)を提案する。
C2Eは、エントロピー最大化デコーダを使用して、臨床的に関連する詳細を保持しながら画像を圧縮し、ラベル付きデータなしでエンコーダのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:02:24 GMT)
Novel computational workflows for natural and biomedical image processing based on hypercomplex algebras [49.8] ハイパーコンプレックス画像処理は、代数的および幾何学的原理を含む統一パラダイムで従来の手法を拡張している。
このワークル平均は、自然・生体画像解析のための四元数と2次元平面(四元数 - ピクセルを表す - を2次元平面に分割する)を分割する。
提案手法は、画像の自動処理パイプラインの一部として、カラー外観(例えば、代替リフレクションやグレースケール変換)と画像コントラストを規制することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:31:51 GMT)
Probing the Vulnerability of Large Language Models to Polysemantic Interventions [49.6] 2つの小モデル(Pythia-70MとGPT-2-Small)の多意味構造について検討する。
解析の結果,両モデルに共通する一貫した多意味トポロジーが明らかになった。
興味深いことに、この構造を利用して、2つの大きなブラックボックス命令調整モデルに効果的な介入を組み込むことができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:20:42 GMT)
Long-term Causal Inference via Modeling Sequential Latent Confounding [49.6] 長期因果推論は、様々な科学的領域において重要な問題であるが難しい問題である。
本稿では, 条件付き付加的等価バイアス(CAECB)の仮定に基づくアプローチを提案する。
提案した仮定は、時間的短期的な結果にまたがる逐次的共起バイアス間の機能的関係を述べる。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:26:48 GMT)
Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music [49.2] ポップミュージックでは、1人のアーティストが好みの質を達成するために様々な音色やテクスチャを使用する場合があり、歌手が使用するボーカル範囲内でのボーカルレジスタを特定することは困難である。
本稿では,メル・スペクトログラム画像のテクスチャ的特徴の分析を通じて,男性ポップミュージックの音声信号に声帯を分類する2つの方法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:41:28 GMT)
MedCaseReasoning: Evaluating and learning diagnostic reasoning from clinical case reports [49.0] MedCaseReasoningはLarge Language Models(LLM)を評価するための最初のオープンアクセスデータセットである。
データセットには14,489の診断的質問・回答ケースが含まれており、それぞれに詳細な推論文がペアリングされている。
我々は,MedCaseReasoning上での最先端の推論LPMを評価し,診断と推論に重大な欠点を見出した。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:34:36 GMT)
Optimal Allocation of Privacy Budget on Hierarchical Data Release [49.0] 本稿では,階層データリリースにおける最適プライバシ予算割り当ての問題に対処する。
データの粒度とプライバシー損失のトレードオフを考慮しつつ、全プライバシー予算の対象となるデータユーティリティの最大化を目指している。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:25:11 GMT)
Illusion or Algorithm? Investigating Memorization, Emergence, and Symbolic Processing in In-Context Learning [48.7] 大規模トランスフォーマー言語モデル(LM)は、Webスケールデータによる次世代の予測のみを訓練することで、幅広いタスクを解決できる。
この能力の背後にあるメカニズムは、ICL(In-context Learning)と呼ばれ、議論の余地があり、理解が不十分なままである。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:50:42 GMT)
DRAGON: A Large-Scale Dataset of Realistic Images Generated by Diffusion Models [48.3] DRAGONは25の拡散モデルの画像からなる包括的なデータセットである。
データセットには、多様な対象を表す多様な画像が含まれている。
DRAGONは、合成コンテンツの検出および属性技術の開発と評価において、法医学的なコミュニティを支援するように設計されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:50:34 GMT)
SoftCoT++: Test-Time Scaling with Soft Chain-of-Thought Reasoning [48.3] テスト時間スケーリング(TTS)とは、推論中に余分な計算を割り当てることで推論性能を向上させる手法である。
CoconutとSoftCoTの最近の研究は、連続的な潜在空間における思考が推論性能をさらに向上させることを示した。
我々はSoftCoT++を導入して,SoftCoTをTest-Time Scalingパラダイムに拡張し,多様な思考経路の探索を可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:47:50 GMT)
MPS-Prover: Advancing Stepwise Theorem Proving by Multi-Perspective Search and Data Curation [48.2] 本稿では,制限を克服する新しいATPシステムであるMPS-Proverを紹介する。
MPS-Proverには、パフォーマンスを犠牲にすることなく、冗長なトレーニングデータの約40%を産み出す、非常に効果的なポストトレーニングデータキュレーション戦略と、多目的のツリーサーチメカニズムの2つの重要なイノベーションが含まれている。
大規模な評価では、MPS-Proverは、miniF2FやProofNetなど、複数の挑戦的なベンチマークで最先端のパフォーマンスを達成している。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:56:03 GMT)
ForensicHub: A Unified Benchmark & Codebase for All-Domain Fake Image Detection and Localization [48.1] ForensicHubは、オールドメインの偽画像検出とローカライゼーションのための最初の統一ベンチマークである。
科学的なパイプラインをデータセット、変換、モデル、評価者間で交換可能なコンポーネントに分解する。
FIDLモデルアーキテクチャ、データセットの特徴、評価標準に関する8つの重要な実行可能な洞察を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:49:59 GMT)
Real-Time Verification of Embodied Reasoning for Generative Skill Acquisition [47.1] 生成的スキル獲得により、エンボディエージェントは、スケーラブルで進化するコントロールスキルのレパートリーを積極的に学ぶことができる。
本稿では,実時間検証の原則を具体化技術学習に体系的に統合するフレームワークであるVERGSAを提案する。
我々の知る限り、本手法は検証駆動型生成スキル獲得のための総合的なトレーニングデータセットとして最初のものである。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:19:13 GMT)
CROC: Evaluating and Training T2I Metrics with Pseudo- and Human-Labeled Contrastive Robustness Checks [46.9] CROC(Contrastive Robustness Checks)を提案する。
我々は100万以上の対照的なプロンプトイメージ対の擬似ラベル付きデータセットを生成する。
また、このデータセットを使ってCROCScoreをトレーニングしています。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:39:44 GMT)
Visual Watermarking in the Era of Diffusion Models: Advances and Challenges [46.5] 拡散モデルに関連する透かし技術の長所と長所を解析する。
我々は、進化する偽りの脅威に対して、透かしの堅牢性を維持するための談話を進めることを目的としている。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:17:14 GMT)
Towards Multi-Agent Reasoning Systems for Collaborative Expertise Delegation: An Exploratory Design Study [45.9] 本稿では, 協調推論性能が3つの重要な設計次元にどう影響するかを系統的に検討する。
この結果,専門知識の整合性はドメイン・コンテンセントが高く,文脈的推論タスクに最も効果的であることが判明した。
最後に,マルチエージェントシステムを専門知識でスケールアップすることによる影響を実証的に検討し,より効率的な通信プロトコル設計の必要性を強調した。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:41:23 GMT)
ProxyPrompt: Securing System Prompts against Prompt Extraction Attacks [45.6] ProxyPromptは,プロンプトをプロキシに置き換えることで,プロンプトの漏出を防止する新しい防御機構である。
このプロキシは、抽出されたプロンプトを難読化しながら元のタスクのユーティリティを保持し、攻撃者がタスクを再現したり、機密情報にアクセスできないようにする。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:13:45 GMT)
NeuralSurv: Deep Survival Analysis with Bayesian Uncertainty Quantification [45.6] 我々はベイズの不確実性定量化を取り入れた最初のディープサバイバルモデルであるNeuralSurvを紹介する。
モデルサイズを線形にスケールする座標アセット更新を用いた平均場変分アルゴリズムを導入する。
実験では、NeuralSurvは最先端のディープサバイバルモデルよりも優れたキャリブレーションを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:53:21 GMT)
Generalization Bounds for Quantum Learning via Rényi Divergences [45.5] この研究は、量子学習アルゴリズムの期待される一般化誤差に基づいて、上界の新たなファミリーを確立することにより、量子学習の理論的理解を推し進める。
私たちの主な貢献は、量子的および古典的R'enyi発散の観点でこれらの境界の導出である。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:21:31 GMT)
Question-Answering Dense Video Events [45.1] DeVE-QA - 10.6Kビデオ上の26Kイベントに関する78Kの質問を含むデータセットを構築する。
改良のために,階層型キャプションモジュール,時間的イベントメモリモジュール,自己整合性チェックモジュールを強調表示する,トレーニング不要なMLLMアプローチであるDeViを提案する。
実験によると、DeViは密集した質問に答え、関連するビデオの瞬間をグラウンド化するのに優れている。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:24:31 GMT)
Reinforcement Learning for AMR Charging Decisions: The Impact of Reward and Action Space Design [45.0] 大規模ブロック積み重ね倉庫における自律移動ロボットの充電戦略を最適化するための新しい強化学習(RL)設計を提案する。
本研究は、フレキシブルな設定から、よりガイド付きでドメインインフォームドな設計構成まで、さまざまな報酬とアクション空間の構成がエージェントのパフォーマンスにどのように影響するかに焦点を当てる。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:33:29 GMT)
Generative Models in Computational Pathology: A Comprehensive Survey on Methods, Applications, and Challenges [44.8] 生成モデリングは、計算病理学において有望な方向として現れてきた。
生成モデルは、データ効率の学習、合成データ拡張、マルチモーダル表現などの機能を提供する。
このレビューは、この分野における最近の進歩の総合的な合成を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:44:50 GMT)
Accurate KV Cache Quantization with Outlier Tokens Tracing [44.7] KVキャッシュの量子化は有望なソリューションであり、メモリ使用量と精度のバランスが良い。
これまでの研究によると、キーはチャネルで分散され、バリューはトークンで分散されている。
提案手法は,2ビット量子化による大幅な精度向上を実現し,メモリ使用率を6.4倍,スループットを2.3倍に向上させることができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:23:12 GMT)
SoLoPO: Unlocking Long-Context Capabilities in LLMs via Short-to-Long Preference Optimization [44.2] 大規模言語モデル(LLM)は、現実世界の長文情報を効果的に活用する上で、依然として課題に直面している。
我々は、$textbfS$h$textbfo$rt-to-$textbfLo$ngというフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:08:48 GMT)
Energy efficiency analysis of Spiking Neural Networks for space applications [43.9] スパイキングニューラルネットワーク(SNN)は理論的に優れたエネルギー効率のために非常に魅力的である。
本研究では,EuroSATデータセットのシーン分類に応用したSNN手法の数値解析と比較を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:29:50 GMT)
GuardReasoner-VL: Safeguarding VLMs via Reinforced Reasoning [43.9] 本稿では,GardReasoner-VLと呼ばれる推論に基づく新しいVLMガードモデルを提案する。
123Kサンプルと631K推論ステップを備えた推論コーパスであるGuardReasoner-VLTrainを構築する。
性能とトークン効率のバランスをとるために,精度,フォーマット,トークンコストを一体化して,長さ認識型安全報酬を設計する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:46:10 GMT)
Federated Low-Rank Adaptation for Foundation Models: A Survey [43.9] Low-Rank Adaptation (LoRA)は、トレーニング可能なパラメータの数を劇的に減らし、微調整基礎モデルのリソース効率の良い代替手段を提供する。
本調査では,LoRAが基礎モデルのファインチューニングにどのように統合されているかを検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:19:51 GMT)
HelpSteer3-Preference: Open Human-Annotated Preference Data across Diverse Tasks and Languages [43.8] 提案するHelpSteer3-Preferenceは,4万以上のサンプルからなる高品質な人手による選好データセットである。
これらのサンプルは、STEM、コーディング、多言語シナリオに関連するタスクを含む、大規模言語モデル(LLM)の様々な現実世界のアプリケーションにまたがる。
HelpSteer3-Preference を用いて、RM-Bench (82.4%) と JudgeBench (73.7%) で最高性能を達成するリワードモデル (RM) を訓練する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:31:19 GMT)
TACO: Rethinking Semantic Communications with Task Adaptation and Context Embedding [43.7] 本研究は,タスク固有の情報を協調的に取得し,下流のタスク性能とコンテキスト情報を向上する,新しい意味コミュニケーションフレームワークを提案する。
画像データセットやコンピュータビジョンタスクの厳密な実験を通じて,ダウンストリームタスクの性能向上,一般化性の向上,帯域幅効率の向上,再構築遅延の低減など,既存の作業と比較して有望な改善が見られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:03:52 GMT)
Deep Symbolic Optimization: Reinforcement Learning for Symbolic Mathematics [43.6] ディープシンボリック最適化(Deep Symbolic Optimization, DSO)は、科学的な発見のためのシンボリック最適化を可能にする新しい計算フレームワークである。
1つの顕著な例は方程式発見であり、記号形式で表される数学的モデルを自動的に導出することを目的としている。
本章では、DSOフレームワークの概要を概観し、科学的な発見においてシンボル最適化を自動化するための変換可能性について説明する。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:31:19 GMT)
Object-Centric Representations Improve Policy Generalization in Robot Manipulation [43.2] 我々は,オブジェクト中心表現(OCR)を,視覚入力を完了したエンティティの集合に分割する構造的な代替品として検討する。
我々は、シミュレーションおよび実世界の操作タスクのスイート全体にわたって、視覚的エンコーダ中心、グローバル、そして密集したメソッドをベンチマークする。
この結果から,OCRに基づく政策は,タスク固有の事前訓練を必要とせずに,一般化設定において,密接かつグローバルな表現よりも優れていたことが判明した。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:06:37 GMT)
Equal is Not Always Fair: A New Perspective on Hyperspectral Representation Non-Uniformity [42.8] ハイパースペクトル画像(HSI)の表現は、広汎な非一様性によって根本的に挑戦される。
フェアネス指向のフレームワークであるFairHypを提案する。
本研究は,HSIモデリングにおける構造的必要条件として公正性を再定義し,適応性,効率,忠実性のバランスをとるための新たなパラダイムを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:00:11 GMT)
Diffusion Learning with Partial Agent Participation and Local Updates [42.0] 拡散学習(diffusion learning)は、エッジデバイスに高度なインテリジェンスを提供するフレームワークである。
本稿では,局所的更新と部分的エージェント参加を考慮した拡散学習手法を提案する。
得られたアルゴリズムは平均二乗誤差感覚において安定であり、平均二乗偏差(MSD)性能の厳密な解析を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:33:49 GMT)
EnvInjection: Environmental Prompt Injection Attack to Multi-modal Web Agents [41.8] マルチモーダル大言語モデル(MLLM)ベースのWebエージェントは、Webページのスクリーンショットに基づいてアクションを生成することにより、Webページ環境と対話する。
環境的プロンプトインジェクション攻撃は環境を操作してWebエージェントを誘導し、特定のアタッカー・チョーゼンアクションを実行する。
既存の攻撃は、有効性やステルス性に限界があるか、現実の環境では非現実的である。
これらの制限に対処する新しい攻撃であるEnvInjectionを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:00:26 GMT)
Securing Visually-Aware Recommender Systems: An Adversarial Image Reconstruction and Detection Framework [41.7] ビジュアル・アウェア・レコメンデーション・システム(VARS)はアイテム・イメージの敵攻撃に対して脆弱である。
本稿では,VARSをセキュアにするための逆画像再構成・検出フレームワークを提案する。
提案手法は,(1)グローバル・ビジョン・トランスフォーマーに基づく画像再構成による局所摂動を特徴とする敵攻撃からVARSを保護し,(2)新しいコントラッシブ・ラーニング・アプローチを用いて敵の事例を正確に検出する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:22:15 GMT)
UniHR: Hierarchical Representation Learning for Unified Knowledge Graph Link Prediction [41.5] 統一知識グラフリンク予測のための階層表現学習フレームワーク(UniHR)を提案する。
HiDRモジュールは、ハイパーリレーショナルKG、テンポラルKG、ネストされた事実KGをトリプルベース表現に統合する。
HiSLにはファクト内およびファクト間メッセージパッシングが組み込まれており、個々のファクト内のセマンティック情報を強化することに重点を置いている。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:46:54 GMT)
Insertion Language Models: Sequence Generation with Arbitrary-Position Insertions [41.5] Insertion Language Models (ILM)を導入し、任意の位置にトークンを挿入することを学習する。
ILMはトークン間の強い依存関係を表現することができ、任意の順序でシーケンスを生成する能力により、正確にシーケンスをモデル化することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:40:07 GMT)
XtraGPT: LLMs for Human-AI Collaboration on Controllable Academic Paper Revision [41.4] XtraGPTはオープンソースの大規模言語モデル(LLM)の最初のスイートである。
我々は140,000以上の命令-応答ペアで注釈付けされたトップレベルの会場から7,040件の研究論文のデータセットを紹介した。
XtraGPTは、同じスケールのベースラインを著しく上回り、プロプライエタリなシステムの品質にアプローチする。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:02:19 GMT)
NoPE: The Counting Power of Transformers with No Positional Encodings [41.4] 特異なハードアテンション機構を持つNOPE変換器は、最近、正規言語のみを表現できることが示されている。
本論文は, 平均的ハードアテンション機構において, NoPE変換器は驚くほど表現力が高いことを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:56:59 GMT)
Descriptive Image-Text Matching with Graded Contextual Similarity [41.1] 画像とテキストの文脈的類似度を段階的に学習するために,DITMと呼ばれる記述的画像テキストマッチングを提案する。
各文の記述性スコアを累積項の周波数逆文書頻度(TF-IDF)で定式化し、両者の相似性をバランスさせる。
本手法は文記述性を利用して,2つの重要な方法で堅牢な画像テキストマッチングを学習する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:08:35 GMT)
Practitioner Motives to Use Different Hyperparameter Optimization Methods [41.1] プログラム型ハイパーパラメータ最適化(HPO)法は,機械学習(ML)モデルにおいて非常にサンプル効率が高い。
しかし、実践者はグリッド探索のような効率の悪い手法を頻繁に使い、最適化されていないモデルに繋がる可能性がある。
この研究は、実践者がなぜ異なるHPOメソッドを使うのかをよりよく理解するための概念的基盤を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:40:20 GMT)
PoE-World: Compositional World Modeling with Products of Programmatic Experts [41.1] 世界がどのように機能するかを学ぶことは、複雑な環境に適応できるAIエージェントの構築の中心である。
LLM(Large Language Models)を用いたプログラム合成の最近の進歩は、ソースコードとして表現された世界モデルを学ぶための代替アプローチを提供する。
このアプローチは,数個の観測結果から複雑な世界モデルを学習できることを示し,これらをモデルベース計画エージェントに組み込むことで,AtariのPongとMontezumaのRevengeの未確認レベルに対する効率的な性能と一般化を実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:28:42 GMT)
On the Security Risks of ML-based Malware Detection Systems: A Survey [40.8] マルウェアはユーザーのプライバシーとデータの完全性に永続的な脅威をもたらす。
これに対抗するために、機械学習(MLベース)マルウェア検出(MD)システムを開発した。
これらのシステムは近年ますます攻撃を受けており、実際の有効性を損なうものとなっている。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:15:31 GMT)
Memory-Efficient Orthogonal Fine-Tuning with Principal Subspace Adaptation [40.7] 主部分空間適応を用いたメモリ効率の良い直交微調整(MOFT)を提案する。
直交微調整のメモリフットプリントを大幅に削減しつつ,キーベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:26:48 GMT)
Med-R$^2$: Crafting Trustworthy LLM Physicians via Retrieval and Reasoning of Evidence-Based Medicine [40.7] 大言語モデル(LLM)は臨床シナリオにおいて顕著な機能を示した。
我々はEvidence-Based Medicine(EBM)プロセスに準拠した新しいフレームワークであるMed-R2を紹介する。
実験の結果, Med-R2はバニラRAG法よりも14.74%改善し, 微調整法に比べて3.32%向上した。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:18:59 GMT)
Scalability of Reinforcement Learning Methods for Dispatching in Semiconductor Frontend Fabs: A Comparison of Open-Source Models with Real Industry Datasets [40.4] 我々は,オープンソースのシミュレーションモデルと実業界データセットを比較し,最適化手法のスケーリング方法を評価する。
提案した進化戦略に基づく手法は、同等の政策段階に基づく手法よりもはるかに優れていることを示す。
進化戦略を用いて,2桁のタドネス向上と1桁のスループット向上を観察した。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:32:29 GMT)
Explaining Strategic Decisions in Multi-Agent Reinforcement Learning for Aerial Combat Tactics [40.1] マルチエージェント強化学習(MARL)は、複雑なシナリオにおける自律エージェント間の協調を可能にする。
機密性の高い軍事状況におけるMARLの実践的展開は、説明可能性の欠如によって制約される。
本研究は,MARLの空戦シナリオを模擬した説明可能性手法の現況をレビューし,評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:36:30 GMT)
Improving Medium Range Severe Weather Prediction through Transformer Post-processing of AI Weather Forecasts [39.6] 本研究では,デコーダのみのトランスフォーマーネットワークをAIによる天気予報処理に活用する手法を提案する。
本手法は,予測リードタイムをシーケンシャルトークンとして扱うことで,トランスフォーマーが複雑な時間的関係を学習できるようにする。
その結果,変圧器を用いた後処理は,高密度ニューラルネットワークと比較して予測能力を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:22:07 GMT)
VISTA: Enhancing Vision-Text Alignment in MLLMs via Cross-Modal Mutual Information Maximization [39.3] 現在のマルチモーダル大言語モデル(MLLM)は、モダリティアライメントにおいて重要な課題に直面している。
本稿では,MLLMにおいて広く使用されているクロスエントロピー損失の系統的情報理論解析を行う。
本稿では,視覚テキストアライメント(Vision-Text Alignment, VISTA)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:43:02 GMT)
InfiJanice: Joint Analysis and In-situ Correction Engine for Quantization-Induced Math Degradation in Large Language Models [39.3] LLM(Large Language Models)は、GSM8K、MATH、AIMEといった複雑な推論ベンチマークにおいて、優れたパフォーマンスを示している。
モデル量子化は、メモリフットプリントと推論レイテンシを低減するための有望なアプローチとして登場した。
量子化は、数学的推論の精度を最大69.81%低下させることができることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:11:40 GMT)
On the Role of Weight Decay in Collaborative Filtering: A Popularity Perspective [38.9] CF (Collaborative Filtering) は, 歴史的ユーザ・イテムインタラクションからの情報を高密度ID埋め込みテーブルにエンコードすることで, 大規模レコメンデーションシステムを実現する。
これらのパイプラインのコアコンポーネントの1つは非常に見過ごされている、と私たちは主張する。
PRISM(Popularity-awaRe Initialization Strategy for Embedd Magnitudes)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:41:57 GMT)
HumaniBench: A Human-Centric Framework for Large Multimodal Models Evaluation [38.6] 我々は32Kの実世界の画像質問対の総合的なベンチマークであるHumaniBenchを紹介する。
HumaniBenchは、公正性、倫理、理解、推論、言語の傾き、共感、堅牢性を含む7つのHuman Centered AI(HCAI)の原則を評価している。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:09:44 GMT)
Automating the Search for Artificial Life with Foundation Models [38.4] 本稿では、視覚言語基礎モデルを用いて、この機会の実現に成功したことを初めて提示する。
提案したアプローチは、自動人工生命探索(ASAL)と呼ばれ、ターゲット現象を生成するシミュレーションを見つける。
ASALは、Boids、Particle Life、Game of Life、Lenia、Neural Cellular Automataなど、さまざまなALife基板で効果的に動作する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:19:02 GMT)
GODBench: A Benchmark for Multimodal Large Language Models in Video Comment Art [38.4] ビデオコメントアートはユーモア、風刺、感情共鳴を伝達する創造的なコンテンツを提供することによってユーザーのエンゲージメントを高める。
我々は、ビデオとテキストのモダリティを統合した新しいベンチマークであるGODBenchを紹介し、コメントアートを構成するMLLMの能力を体系的に評価する。
また,MLLMの創造性向上を目的とした多段階推論フレームワークRipple of Thought (RoT)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:56:40 GMT)
Safety in Large Reasoning Models: A Survey [38.4] 大規模推論モデル(LRM)は、数学やコーディングといったタスクにおいて、高度な推論能力を活用して、極めて優れた成果を上げている。
本稿では,新たに出現した安全リスク,攻撃,防衛戦略を精査し,精査したLEMの包括的調査を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:10:42 GMT)
Do we really have to filter out random noise in pre-training data for language models? [38.3] インターネットから収集された事前学習されたテキストデータは、必然的にデコードエラーや規制されていないウェブコンテンツに起因するランダムノイズを含む。
その結果, モデルが2.7Bにスケールアップされた場合でも, NTPの損失はランダムノイズの比率よりも有意に低かった。
モデルパラメータの知識を必要とせず,通常の特徴と摂動特徴の勾配を整列させることにより,下流タスクヘッドの認知能力を明確に向上する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:43:21 GMT)
Niobium coaxial cavities with internal quality factors exceeding 1.5 billion for circuit quantum electrodynamics [37.7] ニオブやタンタルのようなグループV材料は、回路量子電磁力学(cQED)プラットフォームの性能を拡大するための一般的な選択肢となっている。
ニオブの複雑な表面化学は、ミリケルビン温度と単光子パワーにおいてデコヒーレンスの主要なモードの同定を困難にする。
我々はニオブ同軸四面体キャビティを用いて、エッチング化学、大気暴露の長期化、特に水酸化ニオブの進化前後の空洞条件が単一光子コヒーレンスに与える影響を調べた。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:48:07 GMT)
ShiQ: Bringing back Bellman to LLMs [37.7] 実装が簡単でありながら、非政治的でトークンに関する学習をサポートする実用的なアルゴリズムである ShiQ for Shifted-Q を構築します。
合成データと実世界のベンチマーク(UltraFeedbackやBFCL-V3など)でShiQを評価し、シングルターンLLMとマルチターンLLMの両方での有効性を実証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:12:11 GMT)
The Ripple Effect: On Unforeseen Complications of Backdoor Attacks [37.5] 裏口PTLMを微調整した下流モデルにおいて, バックドア合併症が広範に存在することを示す。
本稿では,マルチタスク学習を活用して,下流タスクの事前知識を必要とせずに,コンプレックスを軽減するバックドアコンプレックス低減手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:59:53 GMT)
Efficient and Comprehensive Feature Extraction in Large Vision-Language Model for Pathology Analysis [37.1] 大規模視覚言語モデル(LVLM)は、入力解像度の制約によって制限され、病理画像解析の効率と精度を損なう。
課題誘導型機能拡張と課題誘導型詳細機能補完の2つの革新的戦略を提案する。
OmniPathは診断精度と効率において既存の方法よりも優れていた。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:17:33 GMT)
Statistical Guarantees for Lifelong Reinforcement Learning using PAC-Bayes Theory [37.0] EPICは生涯強化学習のための新しいアルゴリズムである。
新たなタスクへの迅速な適応を可能にする、世界政策と呼ばれる共有ポリシの配布を学習する。
様々な環境における実験により、EPICは寿命の長いRLにおいて既存の手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:52:52 GMT)
WASP: Benchmarking Web Agent Security Against Prompt Injection Attacks [37.0] 我々は、Pmptインジェクション攻撃に対するWeb Agent Securityのエンドツーエンド評価のための新しいベンチマークであるWASPを紹介する。
高度な推論能力を含むトップレベルのAIモデルでさえ、単純で低便なヒューマンインジェクションによって騙される可能性があることを示す。
攻撃は最大86%で部分的には成功したが、最先端のエージェントでさえ、攻撃者の目標を完全に満たすのに苦労することが多い。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:42:29 GMT)
XRAG: eXamining the Core -- Benchmarking Foundational Components in Advanced Retrieval-Augmented Generation [36.8] Retrieval-augmented Generation (RAG) は、Large Language Models (LLMs) の生成能力と関連するデータの検索を相乗化する
我々は,高度なRAGモジュールの基本コンポーネントの性能を徹底的に評価する,オープンソースのモジュールであるXRAGを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:13:36 GMT)
From Rankings to Insights: Evaluation Should Shift Focus from Leaderboard to Feedback [36.7] 包括的できめ細かい結果を提供する評価フレームワークであるbftextFeedbackerを紹介します。
プロジェクトのホームページとデータセットはhttps://liudan193.io/Feedbacker.comで公開されています。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:26:22 GMT)
Fourier Transformer: Fast Long Range Modeling by Removing Sequence Redundancy with FFT Operator [36.7] トランスモデルは、計算的に要求されることが知られており、長いシーケンスでは不当にコストがかかる。
本稿では,シークエンスにおける冗長性を段階的に除去する,シンプルかつ効果的なFourier Transformerを提案する。
本モデルは,長距離モデリングベンチマークLRAにおいて,トランスフォーマーベースモデル間の最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:42:33 GMT)
Audio Turing Test: Benchmarking the Human-likeness of Large Language Model-based Text-to-Speech Systems in Chinese [36.2] 我々は,多次元中国語コーパスデータセットATT-Corpusとチューリングテストにインスパイアされた評価プロトコルの組み合わせであるAudio Turing Test (ATT)を紹介する。
ATTは評価者に声が人間に聞こえるかどうかを判断するよう依頼する。
また、自動評価のためのオートATTとして、人間の判断データを用いたQwen2-Audio-Instructを微調整する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:57:23 GMT)
Mix Data or Merge Models? Balancing the Helpfulness, Honesty, and Harmlessness of Large Language Model via Model Merging [36.0] 本稿では, 3H 対応 LLM の構築におけるモデルマージとデータ混合手法の有効性を体系的に比較する。
そこで本稿では,新しいtextbfReweighting textbfEnhanced Task textbfSingular textbfMerging method, textbfRESMを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:35:39 GMT)
On the Universality of Self-Supervised Learning [36.0] 優れた表現は普遍性を示すべきであり、識別可能性、一般化可能性、移動可能性という3つの重要な性質によって特徴づけられる。
我々は3つの相補的な次元から普遍性を明示的にモデル化する新しいフレームワークであるGeneral SSLを提案する。
理論的一般化バウンダリを導出し、GeSSLの最適化プロセスが一貫して、目に見えないタスクによく一般化する表現につながることを保証します。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:49:48 GMT)
RanDeS: Randomized Delta Superposition for Multi-Model Compression [35.8] モデルマージを圧縮・検索方式として再構成し、モデル検索中に無関係なデルタの和からタスクの干渉が発生することを示した。
このアプローチは、視覚的タスクと言語タスクの両方において、干渉を大幅に低減し、パフォーマンスを向上することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:02:12 GMT)
InfantAgent-Next: A Multimodal Generalist Agent for Automated Computer Interaction [35.3] 本稿では,マルチモーダル方式でコンピュータと対話できる汎用エージェントであるtextscInfantAgent-Nextを紹介する。
ひとつの大きなモデルに複雑に構築するか、モジュール性のみを提供する既存のアプローチとは異なり、当社のエージェントはツールベースと純粋な視覚エージェントを統合しています。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:43:27 GMT)
SynCL: A Synergistic Training Strategy with Instance-Aware Contrastive Learning for End-to-End Multi-Camera 3D Tracking [34.9] SynCLは、検出と追跡のためのマルチタスク学習を共用するために設計された、新しいプラグアンドプレイのシナジスティックトレーニング戦略である。
重み付きクロスアテンションに基づくデコーダのためのタスク固有ハイブリッドマッチングモジュールを提案する。
また、追跡クエリに対する自己中心的な注意の障壁を突破するために、インスタンス対応のContrastive Learningを導入します。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:24:49 GMT)
Self-Supervised Representation Learning for Nerve Fiber Distribution Patterns in 3D-PLI [34.8] 3D-PLI(3D-PLI)は、高分解能の髄質神経線維の微細構造を観察できる顕微鏡イメージング技術である。
3D-PLIにおけるファイバアーキテクチャのオブザーバ非依存的特徴付けのためのベストプラクティスはまだ提供されていない。
自己教師付き表現学習を用いた3次元PLI画像における神経線維構造を特徴付けるための完全データ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:57:48 GMT)
Most General Explanations of Tree Ensembles [34.4] 「AIシステムの主な疑問は、なぜこの決定がこのようにされたのかである。」
私たちは、AI決定に対して最も一般的な帰納的説明を見つける方法を示します。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:42:01 GMT)
From Embeddings to Accuracy: Comparing Foundation Models for Radiographic Classification [34.1] 広範なデータセットに基づいて事前訓練されたファンデーションモデルは、大幅に高度な機械学習を備えている。
本研究は、汎用と医療分野固有の基礎モデルの両方から導かれる埋め込みの有用性を評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:39:46 GMT)
Towards Robust and Controllable Text-to-Motion via Masked Autoregressive Diffusion [34.0] マスク付きモデリングと拡散過程を組み合わせて動きを生成する,ロバストな動き生成フレームワークMoMADiffを提案する。
我々のモデルはフレキシブルなユーザ提供仕様をサポートし、動き合成の空間的側面と時間的側面の両方を正確に制御できる。
提案手法は, 動作品質, 命令忠実度, 定着度において, 常に最先端のモデルより優れる。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:06:15 GMT)
Patient-Specific Dynamic Digital-Physical Twin for Coronary Intervention Training: An Integrated Mixed Reality Approach [33.9] 既存のトレーニングシステムは、心臓生理学の正確なシミュレーションを欠いている。
本研究は4D-CTAに基づく総合的動的心モデル研究フレームワークを開発する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:13:55 GMT)
Digital quantum simulation of squeezed states via enhanced bosonic encoding in a superconducting quantum processor [33.6] 超伝導量子プロセッサ上での単一モード圧縮状態をシミュレーションするための完全ディジタル手法を提案する。
最大2n個のフォトニックフォック状態からn個のqubitにマッピングすることで、Gray-codeベースのエンコーディングを活用し、ゲートオーバヘッドを低減する。
さらに、フォック状態のシミュレーションを偶数光子のみで制限することで、資源利用を最適化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:02:25 GMT)
iAgent: LLM Agent as a Shield between User and Recommender Systems [33.3] レコメンダシステムは、通常、ユーザーがプラットフォームレコメンデーションアルゴリズムの制御下で直接露出される、ユーザープラットフォームパラダイムを取り入れている。
本稿では,エージェントがユーザとレコメンダシステムの間の保護シールドとして機能する,新しいユーザエージェントプラットフォームパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:43:24 GMT)
Maximizing Asynchronicity in Event-based Neural Networks [33.3] 本稿では,高度に表現的で一般化可能なイベント・バイ・イベント表現を生成する新しいA2SフレームワークであるEVA(EVent Asynchronous representation learning)を紹介する。
EVAは、認識タスクのA2Sメソッドよりも優れており、Gen1データセット上で47.7 mAPを達成している。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:07:50 GMT)
Understanding Nonlinear Implicit Bias via Region Counts in Input Space [33.3] 我々は、同じ予測ラベルを持つ入力空間内の連結領域のカウントによって、暗黙バイアスを特徴づける。
小さい領域のカウントは幾何学的に単純な決定境界と一致し、良い一般化性能とよく相関している。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:34:19 GMT)
Measuring Variable Importance in Heterogeneous Treatment Effects with Confidence [33.1] 因果機械学習は、複雑なデータから個々の治療効果を推定する約束を持っている。
本稿では,条件付き置換法(CPI)に基づくアルゴリズムPermuCATEを提案する。
シミュレーションおよび実世界の健康データセットにおけるPermuCATEの利点を実証的に示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:44:55 GMT)
Linear Attention Sequence Parallelism [33.1] リニアアテンションシーケンス並列(Linear Attention Sequence Parallelism、LASP)は、線形アテンションに基づくトランスフォーマーモデルのための効率的なシーケンス並列(SP)アプローチである。
LASPは128GPU上で4096Kまでのシーケンス長をスケールし、既存のSPメソッドよりも8$times$長い。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:34:33 GMT)
LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis [32.8] ルート原因分析(RCA)は複雑なシステムの信頼性と性能を高めるために重要である。
LEMMA-RCAは複数のドメインとモダリティにまたがる多様なRCAタスク用に設計された大規模なデータセットである。
本研究では, LEMMA-RCAの性能評価を行い, 8つのベースライン法の性能評価を行った。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:42:17 GMT)
From Fibers to Cells: Fourier-Based Registration Enables Virtual Cresyl Violet Staining From 3D Polarized Light Imaging [32.7] 脳の微細構造の様々な側面を包括的に評価するには、補完的なイメージング技術を用いる必要がある。
細胞構造解析における金の標準は、細胞体染色組織の光顕微鏡イメージングである。
画像間翻訳の深層学習手法を利用して,空間的に細胞レベルで整列した3D-PLIの仮想染色を生成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:59:15 GMT)
Diffusion-NPO: Negative Preference Optimization for Better Preference Aligned Generation of Diffusion Models [32.6] 既存の選好アライメント手法は、無条件/負条件の出力を扱う重要な役割を欠いていると論じる。
我々は、ネガティブな嗜好に特化して訓練されたモデルを訓練する、単純だが汎用的な効果的なアプローチを提案する。
提案手法は,SD1.5,SDXL,動画拡散モデル,選好最適化モデルなどのモデルとシームレスに統合する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:38:23 GMT)
Understanding Why Adam Outperforms SGD: Gradient Heterogeneity in Transformers [32.0] SGDを含む勾配に基づく最適化とAdamの簡易な変種である符号に基づく最適化について検討した。
本研究は,変換器の最適化課題に関する洞察を提供し,将来的なアルゴリズム設計のためのガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:15:17 GMT)
Heterogeneity-Aware Client Sampling: A Unified Solution for Consistent Federated Learning [31.5] フェデレートラーニング(FL)は通常、多様なコミュニケーションと計算能力を持つクライアントを伴います。
FLにおける異種通信と計算が不整合を駆動するメカニズムを根本的に明らかにする。
汎用手法としてフェデレーテッド・ヘテロジニティ・アウェア・クライアントサンプリング(FedACS)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:31:36 GMT)
CleanPatrick: A Benchmark for Image Data Cleaning [31.5] CleanPatrickは、画像領域でデータクリーニングを行うための最初の大規模ベンチマークである。
933名の医療従事者から496,377名のバイナリアノテーションを収集した。
項目応答理論にインスパイアされたアグリゲーションモデルを使用し、続いて専門家によるレビューを行い、高品質な基底真理を導出する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:29:41 GMT)
A Survey on the Safety and Security Threats of Computer-Using Agents: JARVIS or Ultron? [31.1] 本稿では,EmphComputer-Using Agentsの安全性とセキュリティの脅威に関する知識の体系化について述べる。
CUAは、デスクトップアプリケーション、Webページ、モバイルアプリをナビゲートするなど、自律的にタスクを実行することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:56:42 GMT)
Visual Planning: Let's Think Only with Images [30.7] 我々は、特に空間的情報や幾何学的情報を含むタスクにおいて、言語が推論において最も自然で効果的なモダリティであるとは限らないと論じる。
そこで本研究では,テキストから独立して,純粋に視覚的な表現によるプランニングを可能にする,ビジュアルプランニングという新たなパラダイムを提案する。
このパラダイムでは、計画は視覚領域におけるステップバイステップの推論を符号化する一連の画像を通して実行される。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:17:22 GMT)
BLEUBERI: BLEU is a surprisingly effective reward for instruction following [30.0] 基本的な文字列マッチングの指標であるBLEUは、一般的な命令追従データセット上での人間の嗜好と一致して、強い報酬モデルと驚くほど一致していることを示す。
BLEUBERI学習モデルは、報酬モデル誘導RLを用いて訓練されたモデルと競合することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:11:43 GMT)
Prototype Augmented Hypernetworks for Continual Learning [29.9] 連続学習(CL)は、先行知識を忘れずに一連のタスクを学習することを目的としているが、新しいタスクの更新は、しばしば以前に学んだ重みを上書きし、破滅的な忘れ(CF)を引き起こす。
本稿では,学習可能なタスクプロトタイプを前提とした単一ハイパーネットワークフレームワークであるPrototype-Augmented Hypernetworks (PAH)を提案する。
我々は,PAHが最先端性能を達成し,試料や頭部を保存せずに,それぞれ1.7%,4.4%の精度で74.5%,63.7%の精度を達成できることを実証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:21:05 GMT)
TestAgent: A Framework for Domain-Adaptive Evaluation of LLMs via Dynamic Benchmark Construction and Exploratory Interaction [29.7] 大規模言語モデル(LLM)は、様々な垂直領域に徐々に展開されている。
現在の評価方法は、実世界の要求に合致しない静的でリソース集約的なデータセットに依存している。
textbfBenchmark+は従来の質問応答ベンチマークを、より柔軟な戦略基準のフォーマットに拡張します。
我々は,これらの概念を実装したエージェントベースの評価フレームワークであるtextbftextscTestAgentを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:34:13 GMT)
Towards Unsupervised Training of Matching-based Graph Edit Distance Solver via Preference-aware GAN [29.5] グラフ編集距離 (Graph Edit Distance, GED) は、様々なアプリケーションで広く使われている基本的なグラフ類似度尺度である。
最近の最先端ハイブリッドGEDソルバは有望な性能を示した。
GED計算のための新しい教師なしGANベースのフレームワークであるGEDRankerを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:45:31 GMT)
Leveraging Automatic CAD Annotations for Supervised Learning in 3D Scene Understanding [29.1] 合成CADモデルの自動検索によって生成されたデータは,教師付き深層学習モデルの訓練において,高品質な基底真理として利用できることを示す。
本結果は,アノテーションのコストを大幅に削減しつつ,モデル性能を向上させる自動3Dアノテーションの可能性を強調した。
3Dシーン理解における将来の研究を支援するため、トレーニングされたモデルとともにSCANnotate++と呼ばれるアノテーションをリリースします。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:45:15 GMT)
Retrievable Domain-Sensitive Feature Memory for Multi-Domain Recommendation [29.0] 本稿では、分布とモデル予測への影響の両方において、様々な領域に有意な差異のある特徴に焦点を当てる。
特徴集合とドメインの区別を最もよく反映する特徴を特定するために,ドメイン依存的特徴属性法を提案する。
我々は、ドメイン依存機能からドメイン固有情報を抽出し、モデルを検索して統合するメモリアーキテクチャを設計する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:02:49 GMT)
Creativity or Brute Force? Using Brainteasers as a Window into the Problem-Solving Abilities of Large Language Models [28.8] 我々は、モデルが使用する推論戦略のタイプをより深く調査するために、長い物語形式で書かれたブレインティーザに基づくベンチマークを導入する。
ブレインティーザは、創造的な洞察を使った数ステップのソリューションや、より残酷な力を使ったより長いソリューションなど、複数のアプローチで解決することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:23:34 GMT)
Exploration by Random Distribution Distillation [28.7] textbfRandom textbfDistribution textbfDistillation (RDD) という新しい手法を提案する。
RDDは、通常の分布からターゲットネットワークの出力をサンプリングする。
RDDはカウントベースと予測エラーの両方のアプローチを効果的に統合することを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:38:21 GMT)
Unveiling Attractor Cycles in Large Language Models: A Dynamical Systems View of Successive Paraphrasing [28.6] 反復変換は、固定点や極限サイクルを含む引き付け子として知られる安定な構成をもたらす。
この視点を入力テキストを出力テキストに反復的にマッピングする大規模言語モデル(LLM)に適用すると、長期的な振る舞いを特徴づけるための原則化されたアプローチが得られる。
代々の言い回しはそのような力学を探求するための説得力のあるテストベッドとして機能し、言い回しは言語的変化を伴う同じ基礎的な意味を再表現する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:18:05 GMT)
Ensuring Safety in an Uncertain Environment: Constrained MDPs via Stochastic Thresholds [28.5] 本稿では,マルコフ決定過程(CMDP)をしきい値に制約し,未知かつ不確実な環境下での強化学習の安全性を目標とした。
我々は、不確実かつ動的環境との相互作用から採取したGrowingWindow推定器を利用して閾値を推定し、悲観的・楽観的閾値(SPOT)を設計する。
SPOTは悲観的および楽観的なしきい値設定の両方で強化学習を可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:13:34 GMT)
Exploratory Diffusion Model for Unsupervised Reinforcement Learning [28.4] 非教師なし強化学習(URL)は、報酬のない環境で多様な状態やスキルを探索し、エージェントを事前訓練することを目的としている。
既存の手法は、探索されたデータをモデル化し、さらなる探索を促進するために本質的な報酬を設計する。
実験データに適合する拡散モデルの強い表現能力を利用する探索拡散モデル(ExDM)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:18:02 GMT)
M4-SAR: A Multi-Resolution, Multi-Polarization, Multi-Scene, Multi-Source Dataset and Benchmark for Optical-SAR Fusion Object Detection [28.4] 光またはSAR画像を用いた単一ソースリモートセンシングオブジェクト検出は複雑な環境では困難である。
マルチレゾリューション,マルチポーラライゼーション,マルチシーン,マルチソースSARデータセット(M4-SAR)という,光SAR融合オブジェクト検出のための最初の包括的データセットを提案する。
標準化された評価を実現するため、6つの最先端マルチソース融合手法を統合する統一ベンチマークツールキットを開発した。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:10:07 GMT)
VeriThoughts: Enabling Automated Verilog Code Generation using Reasoning and Formal Verification [28.2] 本稿では、推論に基づくVerilogコード生成用に設計された新しいデータセットであるVeriThoughtsを紹介する。
我々は,生成したハードウェア記述の品質と正確性を評価するために,形式的検証手法に基づく新しいベンチマークフレームワークを構築した。
We present a suite of small-scale model based for Verilog generation。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:33:14 GMT)
The Final Layer Holds the Key: A Unified and Efficient GNN Calibration Framework [28.1] グラフニューラルネットワーク(GNN)は、グラフベースのタスクにおいて顕著な効果を示した。
しかしながら、彼らの予測的自信は、しばしば誤解され、通常、自信不足を示す。
本稿では,この問題に対処するための簡易かつ効率的なグラフキャリブレーション法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:02:17 GMT)
X2C: A Dataset Featuring Nuanced Facial Expressions for Realistic Humanoid Imitation [28.0] 感情的な人間とロボットのコミュニケーションに従事するヒューマノイドロボットには、現実的な表情を模倣する能力が不可欠である。
現実的なヒューマノイド模倣のためのニュアンス表情を特徴とするデータセットであるX2Cを紹介する。
ヒトからヒトへの表情模倣フレームワークであるX2CNetは、ニュアンス付きヒューマノイド表現と、その根底にある制御値との対応をX2Cから学習する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:48:19 GMT)
Reinforcement Learning Finetunes Small Subnetworks in Large Language Models [27.6] 強化学習(Reinforcement Learning, RL)は、大規模な言語モデルにおいて、タスクのパフォーマンスと人間の価値との整合性を大幅に向上させる。
驚くべきことに、このような大きな利益は、パラメータの5%から30%の小さなサブネットワークだけを更新することによるものです。
本稿では,この現象をRLにより引き起こされるパラメータ更新時空間性と呼ぶ。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:42:28 GMT)
Learnable Residual-Based Latent Denoising in Semantic Communication [27.5] ASemComフレームワークはノイズの多いチャネル上でのロバストな画像伝送のために提案されている。
学習可能な遅延デノイザを受信機に組み込むことで、受信した信号を前処理してチャネルノイズを除去する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:23:54 GMT)
Probabilistic Uncertain Reward Model [27.4] 本稿では、優先データから生じる報酬分布を学習するための確率的不確実リワードモデル(PURM)を提案する。
PURMは従来の手法よりも精度が高く,不確実性も高いことを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:58:13 GMT)
EmoFace: Emotion-Content Disentangled Speech-Driven 3D Talking Face Animation [27.3] 感情枝とコンテンツ枝からなる2ストリームネットワークであるEmoFaceを提案する。
EmoFaceは、感情機能とコンテンツ機能を分析し、融合させる、新しいMesh Attentionメカニズムを採用している。
3次元顔アニメーションタスクで採用される地平の比率を調整するため、中間監督を伴う新たな自己成長トレーニングスキームを導入するのは、今回が初めてである。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:08:18 GMT)
Continuous Optimization for Feature Selection with Permutation-Invariant Embedding and Policy-Guided Search [27.3] 我々は,特徴選択の知識を連続的な埋め込み空間に保存するエンコーダ・デコーダパラダイムを開発した。
埋め込み空間の探索を指導するために,政策に基づく強化学習アプローチも採用している。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:08:16 GMT)
34 Examples of LLM Applications in Materials Science and Chemistry: Towards Automation, Assistants, Agents, and Accelerated Scientific Discovery [27.3] 大規模言語モデル(LLM)は、材料科学と化学研究の多くの側面を再構築している。
最近の進歩は、最新のモデルのクラスが構造化データと非構造化データを統合することができることを示している。
第2回Large Language Model Hackathon for Applications in Materials Science and Chemistryで開発された34のプロジェクトを通して,LLMの応用を概観する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:37:58 GMT)
AutoRAN: Weak-to-Strong Jailbreaking of Large Reasoning Models [27.1] 本稿では,大規模な推論モデル(LRM)をターゲットとした,最初の自動的,弱いジェイルブレイク攻撃フレームワークであるAutoRANについて述べる。
コアとなるAutoRANは、ターゲットモデルの高レベル推論構造をシミュレートするために、弱い、整合性の低い推論モデルを活用する。
GPT-o3/o4-mini やGemini-2.5-Flash など,最先端の LRM に対する AutoRAN の評価を行った。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:37:12 GMT)
Beyond Time: Cross-Dimensional Frequency Supervision for Time Series Forecasting [27.0] クロス次元周波数損失(X-Freq)と呼ばれる純粋周波数領域管理手法を提案する。
X-Freqは、長期予測データセットで平均3.3%、短期予測で27.7%の予測性能を向上させることができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:17:15 GMT)
Decentralized Multi-Authority Attribute-Based Inner-Product Functional Encryption: Noisy and Evasive Constructions from Lattices [26.9] ノイズの多い内積機能に対するマルチオーソリティ属性に基づく機能暗号化について検討する。
我々は,(1)マルチオーソリティ属性に基づく(ノイズの多い)内積関数暗号(MA-AB(N)IPFE)と(2)マルチオーソリティ属性に基づく回避内積関数暗号(MA-evIPFE)の2つの新しいプリミティブを提案する。
我々のスキームは、標準LWE仮定と新たに導入された仮定の下でランダムオラクルモデルにおいて静的に安全であることが証明されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:03:23 GMT)
An Axiomatic Assessment of Entropy- and Variance-based Uncertainty Quantification in Regression [26.8] 教師付き回帰における不確実性対策を厳格に評価するために,一連の公理を導入する。
我々は、不確実性表現とそれに対応する不確実性尺度に対する一般的なアプローチを一般化する。
本研究は,信頼性の高い不確実性評価のための理論的知見と実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:26:11 GMT)
PhiNet v2: A Mask-Free Brain-Inspired Vision Foundation Model from Video [26.6] PhiNet v2は、強力な拡張に頼ることなく、時間的視覚入力を処理するトランスフォーマーベースの新しいアーキテクチャである。
我々はPhiNet v2が最先端のビジョン基盤モデルと比較して競争力を発揮することを示した。
この研究は、より生物学的に妥当なコンピュータビジョンシステムに向けた重要な一歩である。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:23:30 GMT)
GLDiTalker: Speech-Driven 3D Facial Animation with Graph Latent Diffusion Transformer [26.6] Graph Latent Transformerに基づく音声駆動型3次元顔アニメーションモデル
GLDiTalkerは、量子化された時間潜在空間内の信号を拡散することで、不一致を解消する。
Graph-Enhanced Space Quantized Learning Stageはリップ同期の精度を保証し、Space-Time Powered Latent Diffusion Stageは動きの多様性を高める。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:25:25 GMT)
Is PRM Necessary? Problem-Solving RL Implicitly Induces PRM Capability in LLMs [26.5] 我々は,RLトレーニングとPRM能力の関係を系統的に調査する。
本研究は,問題解決能力とプロセス管理能力が相補的な推論の次元を表わすことを示した。
本稿では,モデルが生成したソリューションを自律的に評価・再評価するイントロスペクティブフレームワークであるSelf-PRMを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:23:26 GMT)
Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation [26.4] 本稿では,ユーザの役割特定タスクと,ユーザの役割を明示的にモデル化することを目的とした行動論理モデリングタスクを紹介する。
本稿では,Large Language Model (LLM) とレコメンデーションシステムの効率的な統合フレームワークを用いて,これらのタスクを明示的に解くことができることを示す。
また,抽出したユーザ・イテム論理グラフは,幅広いレコメンデーションタスクに有用な一般的な知識であることを実証的に示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:26:41 GMT)
Mask-Enhanced Autoregressive Prediction: Pay Less Attention to Learn More [26.2] Mask-Enhanced Autoregressive Prediction (MEAP)は、MLM(Masked Language Modeling)をNTP(Next-Token Prediction)にシームレスに統合する訓練パラダイムである。
集中的な実験では、MEAPはキー情報検索と長文推論タスクにおいてNTPを大幅に上回っている。
分析の結果,MEAPの有効性は,非マスキングトークンの少ないセットに集中することにより,より目立たしい注意点の獲得に寄与することが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:21:12 GMT)
MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems [25.5] MoEアーキテクチャは、LLM(Large Language Models)を効率的にスケーリングするためにますます好まれている。
既存のベンチマークは、これらのトレードオフを正確に捉えることができないことが多い。
我々は,MoEシステム用に特別に設計されたベンチマークであるMoE-CAPを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:28:38 GMT)
TAIJI: MCP-based Multi-Modal Data Analytics on Data Lakes [25.1] モデルコンテキストプロトコル(MCP)に基づく新しいマルチモーダルデータ分析システムを提案する。
まず,データレイクにおけるマルチモーダルデータのクエリに適したセマンティック演算子階層を定義する。
次に、MPPベースの実行フレームワークを紹介し、各MPPサーバは、特定のデータモダリティに最適化された特別な基礎モデルをホストする。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:03:30 GMT)
PSDiffusion: Harmonized Multi-Layer Image Generation via Layout and Appearance Alignment [25.0] PSDiffusionは、同時多層テキスト・画像生成のための統合拡散フレームワークである。
我々のモデルは、1つのRGB背景と複数のRGBAフォアグラウンドを持つ多層画像を自動的に生成することができる。
本手法では,層状画像を並列かつ協調的に生成するグローバル層対話機構を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:23:35 GMT)
Attend to Not Attended: Structure-then-Detail Token Merging for Post-training DiT Acceleration [24.9] 本研究は,拡散過程を伴わない領域における不規則な特徴冗長性への参加という,新しい概念を提案する。
我々は, 特徴冗長度の位置と度合いを, 構造的詳細記述に基づく分析を行った。
SDTMは,特徴冗長性を動的に圧縮する構造的詳細トークンマージ手法である。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:27:38 GMT)
SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training [24.8] 我々は、ブラックウェルGPUにおける新しいFP4 Coreを活用して、注意計算を高速化する。
実験により、FP4の注意は、プラグ・アンド・プレイ方式で様々なモデルの推論を加速できることが示された。
トレーニングタスクへの低ビットの注意を開拓しました。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:01:54 GMT)
QVGen: Pushing the Limit of Quantized Video Generative Models [24.7] ビデオ拡散モデル(DM)により高品質なビデオ合成が可能となったが、その膨大な計算とメモリ要求は現実の展開に重大な課題をもたらす。
提案するQVGenは,高速かつ推論効率の高いビデオDMに適した,QAT(quantization-aware training)フレームワークである。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:59:40 GMT)
Fairness-aware Anomaly Detection via Fair Projection [24.7] 教師なしの異常検出は、金融、医療、ソーシャルメディア、サイバーセキュリティなどの社会的影響の高いアプリケーションにおいて重要である。
これらのシナリオでは、異常検出システムからのバイアスの可能性は、異なるグループに対して不公平な扱いをし、さらに社会的バイアスを悪化させる可能性がある。
フェアネスを意識した新しい異常検出法であるFairADを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:26:00 GMT)
MPMA: Preference Manipulation Attack Against Model Context Protocol [24.6] Model Context Protocol (MCP)は、大きな言語モデル(LLM)のインタフェースマッピングを標準化し、外部データやツールにアクセスする。
サードパーティ製のMSPサーバをカスタマイズしたバージョンは、潜在的なセキュリティ上の脆弱性を露呈する。
本稿では,MPMA(MPP Preference Manipulation Attack)と呼ばれる新しいセキュリティ脅威を最初に紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:55:12 GMT)
Token-Level Uncertainty Estimation for Large Language Model Reasoning [24.6] 大きな言語モデル(LLM)は印象的な機能を示していますが、その出力品質はさまざまなアプリケーションシナリオで相容れないままです。
本稿では, LLMの自己評価と, 数学的推論における生成品質の自己向上を可能にするトークンレベルの不確実性推定フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:47:32 GMT)
Context-Aware Probabilistic Modeling with LLM for Multimodal Time Series Forecasting [24.6] 本稿では,文脈を考慮した確率的マルチモーダル時系列予測手法であるCAPTimeを提案する。
提案手法はまず,事前学習した時系列エンコーダを用いて時間パターンを符号化し,学習可能なインタラクションを通じてテキストコンテキストと整列する。
多様な時系列予測タスクの実験では、CAPTimeの精度と一般化が優れている。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:23:53 GMT)
Learning from Less: Guiding Deep Reinforcement Learning with Differentiable Symbolic Planning [24.5] 本稿では,記号計画を強化学習に統合する新しいフレームワークとして,識別可能な記号プランナ(Dylan)を提案する。
ディランは報酬を動的に形作る報酬モデルとして、人間の優先順位を活用し、中間のサブタスクを通してエージェントを誘導する。
実験により、DylanはRLエージェントの性能を大幅に改善し、未確認タスクへの一般化を容易にすることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:52:36 GMT)
MegaScale-MoE: Large-Scale Communication-Efficient Training of Mixture-of-Experts Models in Production [24.4] 本稿では,大規模混合実験(MoE)モデルの効率的なトレーニングに適した生産システムであるMegaScale-MoEについて述べる。
MegaScale-MoEは、各MoE層における注意とFFNのための通信効率の戦略をカスタマイズする。
MegaScale-MoEは1.41Mトークン/秒のトレーニングスループットを実現し、Megatron-LMと比較して1.88$timesの効率向上を実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:52:16 GMT)
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets [24.4] 大規模言語モデル(LLM)エージェントは人間の振る舞いをモデル化するためのシミュレーションツールとして注目を集めている。
社会経済システムのシミュレートにLLMを活用する新しいマルチエージェントフレームワークであるTwinMarketを紹介した。
我々のアプローチは、個人の意思決定と集団社会経済パターンの間の複雑な相互作用に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:19:05 GMT)
UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations [24.2] UniSkillは、ラベルなしで大規模なクロスボデーメントビデオデータから、エンボディディメントに依存しないスキル表現を学ぶフレームワークである。
シミュレーションと実環境の両方における実験により、我々のクロス・エボディメントのスキルは、ビデオのプロンプトが見えない場合でも、ロボットが適切な行動を選択するのに成功していることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:24:45 GMT)
MAS-Attention: Memory-Aware Stream Processing for Attention Acceleration on Resource-Constrained Edge Devices [24.1] 本稿では,メモリ制約付きエッジアクセラレータ上での正確なアテンション推定高速化手法を提案する。
エッジコンピューティングのシナリオではFLAT (State-of-the-art attention fusion Method) と比較して,2.75倍のスピードアップと54%のエネルギー消費削減が見られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:56:30 GMT)
Item-Language Model for Conversational Recommendation [24.0] ユーザインタラクション信号をエンコードするテキスト整列アイテム表現を生成するために,ILM(Item-Language Model)を提案する。
項目エンコーダにおける言語アライメントの重要性とユーザインタラクション知識の両立を実証する広範な実験を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:41:00 GMT)
EIAD: Explainable Industrial Anomaly Detection Via Multi-Modal Large Language Models [23.9] 工業異常検出(IAD)は製造中の製品品質を確保するために重要である。
本稿では,コア特徴抽出からダイアログ機能を分離する専用マルチモーダル欠陥ローカライゼーションモジュールを提案する。
私たちはまた、Defect Detection Question Answering (DDQA) という、最初のマルチモーダル産業異常検出トレーニングデータセットにも貢献する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:25:03 GMT)
Who Taught You That? Tracing Teachers in Model Distillation [23.6] 学生の先生はアウトプットに基づいて特定できますか?
本稿では, 要約, 質問応答, 指示追従を含む実作業蒸留の目標について検討する。
語彙的特徴を用いた識別モデルの設計を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:21:20 GMT)
Improving Inference-Time Optimisation for Vocal Effects Style Transfer with a Gaussian Prior [23.4] Style Transfer with Inference-Time optimisation (ST-ITO) は、参照音声の応用効果を生のオーディオトラックに転送する手法である。
本稿では,音声プレセットデータセットであるDiffVoxから派生したガウス先行データをパラメータ空間上に導入する。
結果の最適化は最大姿勢推定と等価である。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:40:31 GMT)
A Self-Improving Coding Agent [23.4] LLM(Large Language Models)は、LLMエージェントを世界に向けて展開することへの関心を喚起している。
本稿では,基本的なコーディングツールを備えたエージェントシステムが,自らを自律的に編集し,ベンチマークタスクの性能を向上させることを実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:58:56 GMT)
LLM Agents Are Hypersensitive to Nudges [23.4] 人間の選択分布と表面的類似性にもかかわらず、モデルは微妙ながら重要な方法で異なることを示す。
ゼロショット・チェーン・オブ・シンキング(CoT)のような単純なプロンプト戦略は、選択分布をシフトさせ、人間のデータによる少数ショット・プロンプトは、よりアライメントを高めることができることを示す。
これらの結果は、複雑な環境でユーザに代わって行動するエージェントやアシスタントとしてモデルをデプロイする前に、行動テストが必要であることを示唆している。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:53:05 GMT)
Disentangling Reasoning and Knowledge in Medical Large Language Models [23.4] 大きな言語モデルにおける医学的推論は、臨床医の診断的思考をエミュレートすることを目的としている。
MedQA-USMLE、MedMCQA、PubMedQAといった現在のベンチマークでは、推論と事実のリコールが混在していることが多い。
バイオメディカルモデル(HuatuoGPT-o1, MedReason, m1)と一般ドメインモデル(DeepSeek-R1, o4-mini, Qwen3)を評価する。
我々は、推論重大例に基づいて微調整と強化学習を用いてBioMed-R1を訓練する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:16:27 GMT)
Search and Refine During Think: Autonomous Retrieval-Augmented Reasoning of LLMs [23.3] 大きな言語モデルは印象的な推論能力を示してきたが、本質的には知識貯水池によって制限されている。
Retrieval-augmented reasoningは、LCMが外部リソースをクエリできるようにすることによって、この制限を緩和する。
本稿では,新しい探索・復調思考のパラダイムを取り入れた強化学習フレームワークであるAutoRefineを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:11:29 GMT)
MPPFND: A Dataset and Analysis of Detecting Fake News with Multi-Platform Propagation [23.1] 複数のプラットフォーム間の伝搬構造をキャプチャするMPPFNDデータセットを導入する。
グラフニューラルネットワークを用いて社会的文脈の特徴を抽出するマルチプラットフォームフェイクニュース検出モデル(APSL)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:59:31 GMT)
DynamicRAG: Leveraging Outputs of Large Language Model as Feedback for Dynamic Reranking in Retrieval-Augmented Generation [23.1] リランカは、生成品質と説明可能性を高めるために、検索した文書の精錬において重要な役割を果たす。
本稿では,リランカが検索した文書の順序と数の両方を動的に調整する新しいRAGフレームワークであるDynamicRAGを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:47:07 GMT)
LegoSLM: Connecting LLM with Speech Encoder using CTC Posteriors [22.8] 音声エンコーダと大言語モデル(LLM)を橋渡しする新しいパラダイムであるLegoSLMを提案する。
好成績なUSMモデルとGemmaモデルを用いて,提案手法がASRおよび音声翻訳タスクにおいて良好な性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:15:19 GMT)
Shuttle Between the Instructions and the Parameters of Large Language Models [22.7] 本稿では、命令と大規模言語モデル(LLM)のパラメータ間の相互マッピングをモデル化し、学習するために、新しいニューラルネットワークフレームワークShiP(textbfShuttle between the textbf Instructions and the textbfParameters)を提案する。
その結果, ShiP は誘導能力において既存のベースライン法よりも優れた性能を示し, 誘導能力においてその性能を大きく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:54:01 GMT)
Just Functioning as a Hook for Two-Stage Referring Multi-Object Tracking [22.7] Referring Multi-Object Tracking (RMOT) は、ビデオ中の自然言語表現によって指定されたターゲット軌跡をローカライズすることを目的としている。
2段階RMOTのための新しいフック型フレームワークJustHookを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:34:02 GMT)
A Dataset for Spatiotemporal-Sensitive POI Question Answering [22.6] QuestionAnswering (QA) には十分な時間的センシティブな質問がなく、モデルの時間的推論能力を評価するのに不十分である。
私たちはPoint of Interest(POI)を中心とした新しいデータセットPOI-QAを紹介します。
私たちのデータセットは、状態レベルの依存関係を解析し、状態ペアをナビゲートするモデルに挑戦します。
POI-QAは、時間力学に敏感なアルゴリズムを進化させるための堅牢なベンチマークである。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:05:35 GMT)
On the Role of Speech Data in Reducing Toxicity Detection Bias [22.4] マルチリンガルな MuTox データセットに対して,高品質なグループアノテーションセットを作成する。
次に、これらのアノテーションを利用して、音声およびテキストに基づく毒性分類器を体系的に比較する。
以上の結果から,推測中の音声データへのアクセスは,グループ言及に対する偏見の低減に役立つことが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:45:14 GMT)
GuideBench: Benchmarking Domain-Oriented Guideline Following for LLM Agents [22.4] 大規模言語モデル(LLM)は、ユーザ指示に従うことができ、現実世界のアプリケーションで決定を下すことができる自律エージェントとして広くデプロイされている。
GuideBench は LLM のパフォーマンスに対するガイドラインを評価するために設計されたベンチマークである。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:32:23 GMT)
Foundation model for mass spectrometry proteomics [22.4] 本稿では,質量スペクトルの1つの基礎モデルの下で,様々なスペクトル予測タスクを統合することを提案する。
これらの事前訓練されたスペクトル表現を用いることで、下流の4つのタスクの性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:40:07 GMT)
Supervised contrastive learning from weakly-labeled audio segments for musical version matching [21.9] 本稿では,弱い注釈付きセグメントから学習する手法を提案する。
これら2つの要素により、標準トラックレベル評価において最先端の結果を得るだけでなく、セグメントレベル評価においてブレークスルー性能を得る。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:57:33 GMT)
Towards Robust Spiking Neural Networks:Mitigating Heterogeneous Training Vulnerability via Dominant Eigencomponent Projection [21.5] スパイクニューラルネットワーク(SNN)は離散的なスパイクを通じて情報を処理し、極めて低いエネルギーレベルで操作することができる。
実験では、SNNがメインストリームのメソッドを使ってトレーニングされている場合、直接エンコーディングと時間によるバックプロパゲーションが組み合わさると、重大な脆弱性が明らかになる。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:29:49 GMT)
Boosting Robustness in Preference-Based Reinforcement Learning with Dynamic Sparsity [21.4] この研究は、動的スパーストレーニングの原理を利用してロバスト報酬モデルを学ぶ最初のPbRLアルゴリズムであるR2Nを提案する。
シミュレーション教師による実験では、R2Nはタスク関連機能に焦点を合わせるために、ニューラルネットワークの疎結合に適応できることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:52:41 GMT)
Spectral Policy Optimization: Coloring your Incorrect Reasoning in GRPO [21.4] グループ相対政策最適化(GRPO)は、グループ内のすべてのサンプル応答が正しくない場合に停止する。
GRPOにおける全負サンプルグループ内の応答多様性をAIフィードバックを用いて導入するフレームワークを提案する。
提案手法を実証的に検証し,様々なモデルサイズにまたがる性能向上を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:02:05 GMT)
MIR-Bench: Can Your LLM Recognize Complicated Patterns via Many-Shot In-Context Reasoning? [21.1] 我々は、パターン認識のための最初のマルチショットインコンテキスト推論ベンチマークであるMIR-Benchを提案する。
テキスト内推論における多くの新しい問題について検討し,多くの知見を得た。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:10:15 GMT)
RefPose: Leveraging Reference Geometric Correspondences for Accurate 6D Pose Estimation of Unseen Objects [21.0] RefPoseは、参照画像と幾何対応をガイダンスとして活用するオブジェクトポーズ推定の革新的なアプローチである。
RefPoseは、競争力のあるランタイムを維持しながら、最先端の結果を達成することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:17:58 GMT)
Think Twice Before You Act: Enhancing Agent Behavioral Safety with Thought Correction [20.8] 内部推論プロセスは、ツールの使用とその後のアクションに大きな影響を与えます。
エージェントの思考における小さな偏差は、カスケード効果を誘発し、不可逆的な安全事故を引き起こす可能性がある。
Thought-Alignerはアクションを実行する前に、各ハイリスクな思考を即時に修正する。
修正された思考はエージェントに再導入され、より安全な後続の判断とツールの相互作用が保証される。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:00:15 GMT)
Linear Convergence of the Frank-Wolfe Algorithm over Product Polytopes [20.8] 積ポリトープ上のFrank-Wolfeアルゴリズムの線形収束について検討する。
約$mu$-Polyak-Lojasiewicz の凸対象に対しては、結果の条件数で定量化される線形収束率を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:50:55 GMT)
Enhanced Multiuser CSI-Based Physical Layer Authentication Based on Information Reconciliation [20.5] 物理層認証(PLA)は、ローエンドのInternet of Thingsネットワークのための費用対効果の高いソリューションである。
我々は、PLAの性能を高めるために任意のビット数を用いる量子化戦略とともに、極符号を用いた情報和解方式を開発する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:11:04 GMT)
Toward Evaluative Thinking: Meta Policy Optimization with Evolving Reward Models [20.3] トレーニングを通じて報酬モデルのプロンプトを動的に洗練するメタリワードモデルを統合するフレームワークを導入する。
MPOでは、メタリワードモデルは、進化するトレーニングコンテキストを監視し、高いアライメントを維持するための報酬モデルのプロンプトを継続的に調整する。
広範囲に手作りの報酬プロンプトによって導かれるモデルと同等以上のパフォーマンスが得られる。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:22:27 GMT)
SubGCache: Accelerating Graph-based RAG with Subgraph-level KV Cache [20.3] SubGCacheは、同じような構造的なプロンプトでクエリ間での計算を再利用することで、推論レイテンシを低減することを目的としている。
2つの新しいデータセットの実験では、SubGCacheは推論遅延を同等に減らし、生成品質も改善している。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:39:41 GMT)
Bidirectional Distillation: A Mixed-Play Framework for Multi-Agent Generalizable Behaviors [20.3] BiDistは、空間内一般化の限界を克服する新しい混合プレイフレームワークである。
BiDistは、過去のポリシーの複雑でコストのかかる保存を必要とせずに、簡潔で効率的なソリューションとして機能する。
本研究は, 多様な協調的, 競争的, 社会的ジレンマ課題におけるBiDistの顕著な一般化能力を示すものである。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:31:10 GMT)
Tool-Aided Evolutionary LLM for Generative Policy Toward Efficient Resource Management in Wireless Federated Learning [20.1] Federated Learning (FL)は、エッジデバイス間の分散モデルトレーニングを、プライバシフレンドリな方法で実現している。
本稿では,無線FL環境におけるデバイス選択のための適切なポリシーを生成するためのツール支援進化大言語モデル(T-ELLM)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:07:29 GMT)
UrbanMind: Urban Dynamics Prediction with Multifaceted Spatial-Temporal Large Language Models [19.9] UrbanMind は多面的都市動態予測のための空間時空間 LLM フレームワークである。
UrbanMindのコアとなるMuffin-MAEは、特殊なマスキング戦略を備えた多面式フュージョンマスク自動エンコーダである。
複数の都市にまたがる実世界の都市データセットの実験は、UrbanMindが一貫して最先端のベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:38:06 GMT)
What External Knowledge is Preferred by LLMs? Characterizing and Exploring Chain of Evidence in Imperfect Context [19.8] 本稿では,マルチホップQAを扱う際に,LLMが好む不完全な文脈における外部知識に着目した。
犯罪手続法における証拠の連鎖(CoE)に着想を得て, LLMが好む知識は, 問題との関連と, 知識の相互支援の両方を維持すべきである,と特徴づける。
我々は,自動CoE判別手法を提案し,LLMの有効性,忠実さ,堅牢性をCoEで評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:49:37 GMT)
Learning When to Think: Shaping Adaptive Reasoning in R1-Style Models via Multi-Stage RL [19.7] 大規模推論モデル(LRM)は、最終的な答えを生成する前に、明示的でステップバイステップの推論シーケンスを生成するのに熟練している。
この過度に考える問題に対処するため、適応的思考能力を備えたLEMの装備方法について検討する。
推論ポリシーを段階的に最適化する多段階強化学習フレームワークであるAutoThinkを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:01:57 GMT)
Meta-World+: An Improved, Standardized, RL Benchmark [19.6] この研究は、メタワールドの過去のバージョンを活用しながら、これらの成果を文学から曖昧にすることを目指している。
私たちはMeta-Worldの新しいオープンソースバージョンをリリースし、過去の結果に満ちており、技術的には人間工学的であり、ユーザーはタスクセットに含まれるタスクをよりコントロールできるようになります。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:24:03 GMT)
MergeBench: A Benchmark for Merging Domain-Specialized LLMs [19.5] モデルマージを大規模に評価するための総合評価スイートであるMergeBenchを紹介する。
MergeBenchは、2Bから9BスケールのLlamaやGemmaファミリなど、最先端のオープンソース言語モデルを構築している。
マルチタスク性能, 忘れられたこと, 実行効率にまたがる8つの代表的なマージ手法を評価した。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:02:55 GMT)
Sample Efficient Reinforcement Learning via Large Vision Language Model Distillation [19.5] 大規模視覚言語モデル(LVLM)からより効率的な強化学習エージェントへ知識を抽出するフレームワークであるLVLM to Policy(LVLM2P)を紹介する。
提案手法はLVLMを教師として活用し,RLエージェントが収集した軌跡に基づく指導行動を提供する。
LVLM2Pは,ベースラインRLアルゴリズムのサンプル効率を大幅に向上させることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:15:54 GMT)
Towards Robust Evaluation of STEM Education: Leveraging MLLMs in Project-Based Learning [19.5] プロジェクトベースラーニング(PBL)は、様々な高度に相関したマルチモーダルデータを含んでおり、STEM分野において重要な教育的アプローチとなっている。
MLLM(Multimodal large language model)の急速な発展に伴い、研究者は情報検索、知識理解、データ生成といったタスクを強化する可能性を探り始めた。
既存のベンチマークは、自由形式の出力構造と厳格な人間の専門家による検証プロセスの両方を提供することで不足しており、実際の教育タスクを評価する上での有効性を制限している。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:01:01 GMT)
Task-Specific Data Selection for Instruction Tuning via Monosemantic Neuronal Activations [19.3] 重要なボトルネックは、タスク固有のパフォーマンスを最大化するために、最も関連性の高いデータを選択することです。
既存のデータ選択アプローチには、不安定な影響に基づく方法や、より安定した分布アライメント方法が含まれる。
タスク関連データをよりよく識別するために、この分野に専用の類似度指標を導入します。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:30:37 GMT)
RefRef: A Synthetic Dataset and Benchmark for Reconstructing Refractive and Reflective Objects [19.1] RefRefRefデータセットは、3つの異なるバックグラウンドタイプに配置された、さまざまな複雑性を持つ50のオブジェクトで構成されている。
本稿では,ニューラルレンダリングのための正確な光経路を計算するオラクル法と,これらの仮定を回避したアプローチを提案する。
我々はこれらを最先端のいくつかのメソッドと比較し、全てのメソッドがオラクルにかなり遅れていることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:22:31 GMT)
Integrated Data Analysis of Plasma Electron Density Profile Tomography for HL-3 with Gaussian Process Regression [19.1] HL-3トカマクにおけるプラズマ電子密度プロファイルトモグラフィーのための統合データ解析モデルを提案する。
このモデルでは遠赤外レーザー干渉計からの線積分測定と周波数変調連続波反射計による点測定を組み合わせている。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:11:52 GMT)
Towards Adapting Open-Source Large Language Models for Expert-Level Clinical Note Generation [19.1] 本研究では,オープンソースのLLaMA-213億パラメータモデルに対する包括的ドメイン・タスク特化プロセスを提案する。
私たちのプロセスには、継続的な事前トレーニング、教師付き微調整、AIと人間のフィードバックからの強化学習が含まれています。
得られたLLaMA-Clinicは,医師が作成したものと同等の精度で臨床記録を作成できる。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:16:11 GMT)
TreeKV: Smooth Key-Value Cache Compression with Tree Structures [19.1] TreeKVは、スムーズなキャッシュ圧縮のためにツリー構造を利用するトレーニング不要の手法である。
PG19とOpenWebText2の言語モデリングタスクのベースラインモデルを一貫して上回っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:32:36 GMT)
A Systematic Analysis of Base Model Choice for Reward Modeling [19.1] 本稿では,ベースモデル選択が報酬モデルの性能に及ぼす影響を体系的に分析する。
結果は、最も一般的な(すなわちデフォルト)選択と比較して、パフォーマンスが最大14%向上できることを示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:27:03 GMT)
Nearest Neighbor Multivariate Time Series Forecasting [19.0] そこで本研究では,k-nearest 近傍の単純な k-nearest 予測フレームワークを提案する。
キャッシュされたシリーズの大きなデータストア上で、最も近い隣の検索メカニズムで予測する。
データセット全体から多変数にまたがる分散だが類似したパターンを抽出する機能も備えている。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:41:33 GMT)
Training-Free Bayesianization for Low-Rank Adapters of Large Language Models [19.0] TFB(Training-Free Bayesianization)は、トレーニングなしでトレーニングされた低ランクアダプタをベイズアダプタに変換するフレームワークである。
TFBは既存の手法よりも優れた不確実性推定と一般化を実現する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:43:14 GMT)
Regularity and Stability Properties of Selective SSMs with Discontinuous Gating [18.7] 本稿では, 連続時間選択SSMの安定性と規則性について検討する。
我々は、本質的なエネルギー散逸が過去の状態を指数的に忘れることを保証することを確証する。
本研究は,安定かつ信頼性の高い深層選択型SSMの理解と設計のための厳密な枠組みを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:08:40 GMT)
FP64 is All You Need: Rethinking Failure Modes in Physics-Informed Neural Networks [18.7] PINNは、PDE残留損失が収束する障害モードを示し、解誤差は大きい。
標準のFP32では、LBFGSはその収束試験を早めに満足し、急激な故障フェーズでネットワークを凍結することを示した。
この結果から,厳密な算術精度がニューラルネットワークを用いた信頼性PDE解決の鍵であることが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:38:13 GMT)
Augmented Object Intelligence with XR-Objects [18.6] 本稿では,デジタルと物理の境界線を曖昧にすることを目的としたインタラクションパラダイムであるXRの文脈における拡張オブジェクトインテリジェンスについて検討する。
我々は,オープンソースのプロトタイプシステムであるXR-Objectsの形で,AOIの概念を実装した。
このシステムにより、アナログオブジェクトは情報を伝えるだけでなく、詳細を問い合わせたりタスクを実行するといったデジタルアクションを開始することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:29:57 GMT)
$XX^{t}$ Can Be Faster [18.4] RXTX は行列の積を変換$XXt$ for $Xin mathbbRntimes m$ で計算する新しいアルゴリズムである。
RXTXは、State-of-the-Artアルゴリズムよりも5%$少ない乗算と5%$少ない演算(加算と乗算)を使用する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:23:27 GMT)
Approximation and Generalization Abilities of Score-based Neural Network Generative Models for Sub-Gaussian Distributions [18.4] スコアベースニューラルネットワーク生成モデル(SGM)の近似と能力について検討する。
我々のフレームワークは普遍的であり、以前の研究よりも軽度の仮定の下でSGMの収束率を確立するために利用することができる。
我々の分析では、スコア関数のリプシッツ連続性や、ターゲット密度の厳密な正下界など、いくつかの重要な仮定を取り除いている。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:38:28 GMT)
Graph and Simplicial Complex Prediction Gaussian Process via the Hodgelet Representations [18.4] 我々はガウスのプロセスフレームワークを単純化コンプレックス(SC)に拡張し、より高階の単純化でサポートされているエッジレベルの属性と属性の処理を可能にする。
我々は,GPがグラフやSCレベルの予測に広く使われるように,様々なアプリケーションにわたる予測を強化することを実証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:33:42 GMT)
Textured mesh Quality Assessment using Geometry and Color Field Similarity [18.2] フィールドメッシュ品質指標(FMQM)と呼ばれる新しい点ベースTMQA法を提案する。
FMQMは、符号付き距離場と、最も近い表面点色場という新しい色場を利用して、効果的なメッシュ特徴記述を実現する。
3つのベンチマークデータセットの実験結果から、FMQMは最先端(SOTA)のTMQA指標より優れていることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:41:24 GMT)
GenoArmory: A Unified Evaluation Framework for Adversarial Attacks on Genomic Foundation Models [18.2] ゲノミック・ファンデーション・モデル(GFM)に対する最初の統合逆攻撃ベンチマークを提案する。
我々は,4つの広く採用されている攻撃アルゴリズムと3つの防衛戦略を用いて,最先端の5つのGFMの対角的ロバスト性を評価する。
GFMの安全性を向上させるために設計された新しい逆サンプルデータセットであるGenoAdvを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:29:56 GMT)
Facets in Argumentation: A Formal Approach to Argument Significance [18.2] 議論は、議論のモデル化と推論のための人工知能(AI)の中心的なサブ領域である。
意思決定と列挙の推論のための新しい概念(顔)を導入する。
複雑さについて検討し、ファセットを含むタスクが拡張を数えるのよりもはるかに容易であることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:29:38 GMT)
Ready2Unlearn: A Learning-Time Approach for Preparing Models with Future Unlearning Readiness [18.1] 本稿では、将来の未学習プロセスを容易にするために設計された学習時間最適化アプローチであるReady2Unlearnを紹介する。
Ready2Unlearnは、未学習のモデル状態を生成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:33:59 GMT)
On Next-Token Prediction in LLMs: How End Goals Determine the Consistency of Decoding Algorithms [18.0] クロスエントロピー損失を用いて訓練された次のトーケン予測は、ほとんどの大きな言語モデルの基礎である。
本稿では、これらのアルゴリズムのいくつかを検証し、損失関数として符号化された様々な目標に対する一貫性について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:38:45 GMT)
A Scalable Approach to Clustering Embedding Projections [18.0] 本稿では, 点ではなく, 投影された2次元空間におけるカーネル密度推定を用いた効率的なクラスタリング手法について述べる。
このアルゴリズムは、数百ミリ秒で2次元密度マップから高品質なクラスタ領域を生成することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:13:18 GMT)
From Image to Video, what do we need in multimodal LLMs? [17.8] 本稿では、ロバストなビデオLLMを構築するリソース効率開発パイプラインRED-VILLMを紹介する。
我々は、時間情報を把握する能力を備えたバックボーン画像LLMを具現化して、時間適応型プラグアンドプレイ構造を考案する。
我々のアプローチは、よりコスト効率が高くスケーラブルなマルチモーダルモデルの進歩の可能性を強調します。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:50:09 GMT)
HAPO: Training Language Models to Reason Concisely via History-Aware Policy Optimization [17.8] 本稿では,歴史対応政策最適化(HAPO)について述べる。
HAPOは、この履歴状態に基づいて新しい長さ報酬関数を用いて、正しい解の発見を動機付けている。
実験の結果,HAPOはLLMの簡潔推論能力を効果的に誘導し,33~59%の精度低下と2~5%の精度低下を生じることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:21:28 GMT)
Diffusion Model in Hyperspectral Image Processing and Analysis: A Review [17.7] ハイパースペクトル画像処理と分析は、リモートセンシング、農業、環境モニタリングにおいて重要な意味を持つ。
従来のモデルは複雑なデータを扱うのに限界があり、分析の需要の増大を満たすことは困難である。
近年、拡散モデル(Diffusion Model)は、新しい生成モデルとして、ハイパースペクトル画像処理においてユニークな利点を示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:59:48 GMT)
EmotionHallucer: Evaluating Emotion Hallucinations in Multimodal Large Language Models [17.7] MLLMにおける感情幻覚を検出し解析するための最初のベンチマークであるEmotionHallucerを紹介する。
これに基づいて、感情心理学知識と実世界のマルチモーダル知覚という2つの次元から感情幻覚を評価する。
PEP-MEKフレームワークは,選択したモデル間で感情の幻覚検出を平均9.90%改善する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:14:08 GMT)
RAGSynth: Synthetic Data for Robust and Faithful RAG Component Optimization [17.6] RAGは知識集約タスクにおけるLLMの性能を向上させることができる。
既存のレトリバーは、公開知識に大きく依存し、様々な論理的複雑さと手がかり完全性のクエリに苦労する。
データ構築モデリングとそれに対応する合成データ生成実装を含むフレームワークであるRAG Synthを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:38:25 GMT)
GSFF-SLAM: 3D Semantic Gaussian Splatting SLAM via Feature Field [17.6] GSFF-SLAMは3次元ガウススプラッティングに基づく新しい意味論的SLAMシステムである。
提案手法は, 様々な2次元先行情報, 特にスパース信号と雑音信号を用いた意味的再構成を支援する。
2D基底真理を利用する場合、GSFF-SLAMは95.03% mIoUで最先端のセマンティックセグメンテーション性能を達成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:51:06 GMT)
Group Think: Multiple Concurrent Reasoning Agents Collaborating at Token Level Granularity [17.4] グループ思考は、複数の並行推論エージェントとして機能する単一の大きな言語モデルである。
グループシンクは、互いに部分的な生成の進捗を共通的に可視化することで、新しい並行推論パラダイムを導入している。
このきめ細かいトークンレベルのコラボレーションにより、Group Thinkは冗長な推論を削減し、レイテンシを大幅に低減しつつ、品質を向上させることができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:40:35 GMT)
Customizing Visual-Language Foundation Models for Multi-modal Anomaly Detection and Reasoning [17.3] 我々は、異常検知器や推論器として幅広い知識と堅牢な推論能力を持つ汎用視覚言語基盤モデルをカスタム構築する。
提案手法では,タスク記述,クラスコンテキスト,正規性ルール,参照イメージなど,さまざまなプロンプト型について検討する。
予備研究は、モデルをカスタマイズするための条件として視覚的および言語的プロンプトを組み合わせることで、異常検出性能が向上することを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:04:38 GMT)
KVShare: An LLM Service System with Efficient and Effective Multi-Tenant KV Cache Reuse [17.3] マルチテナントシナリオ下で要求間でKVキャッシュを共有するKVキャッシュ管理モジュールを提案する。
KVShareはTTFTを最大9.39倍に削減し、完全なKV再計算に比べてスループットを1.2倍に向上させる。
KVShareはSOTA法に比べて精度が20.38%向上している。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:42:48 GMT)
VIN-NBV: A View Introspection Network for Next-Best-View Selection for Resource-Efficient 3D Reconstruction [17.2] Next Best View (NBV)アルゴリズムは、最小限のリソース、時間、キャプチャ数を使って最適な画像のセットを取得することを目的としている。
本稿では,ビューの再現性向上を直接予測するビューイントロスペクション・ネットワーク(VIN)を提案する。
VIN-NBVは,制約条件で操作した場合,カバレッジベースライン上で30%の動作で復元品質が向上することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:17:43 GMT)
Large Vision Model-Enhanced Digital Twin with Deep Reinforcement Learning for User Association and Load Balancing in Dynamic Wireless Networks [17.0] 本稿では,無線ネットワークのための大型ビジョンモデル (LVM) 拡張ディジタルツイン (DT) を提案する。
本稿では,動的ユーザ数,分布,移動パターンを有するネットワークにおけるユーザアソシエーションとロードバランシングのための並列DRL法を提案する。
数値計算の結果,LVM強化DTは実環境とほぼ同等の訓練効果が得られることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:02:55 GMT)
Empowering Agentic Video Analytics Systems with Video Language Models [17.0] AVASは、オープンエンドで高度なビデオ分析のために設計されたVLMベースのシステムである。
AVASは,1)長時間あるいは連続的なビデオストリームの効率的なインデックス作成のためのイベント知識グラフ(EKG)のリアルタイム構築,2)複雑なクエリを扱うためにEKGを利用するエージェント検索生成機構である。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:00:32 GMT)
Ophora: A Large-Scale Data-Driven Text-Guided Ophthalmic Surgical Video Generation Model [16.9] 眼科手術では、手術映像を解釈し、その後の手術を予測することができるAIシステムの開発には、高品質なアノテーションを備えた多数の眼科手術ビデオが必要である。
我々は,眼科手術映像を自然言語で生成できる先駆的モデルであるOphoraについて紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:47:49 GMT)
Multi-Modal Multi-Task (M3T) Federated Foundation Models for Embodied AI: Potentials and Challenges for Edge Integration [16.9] 具体的AIのためのフェデレーションファンデーションモデル(FFM)を紹介する。
統合されたフレームワークの下で、具体化されたAIエコシステムにおけるFFMの重要なデプロイメント次元を収集します。
具体的な課題を特定し、実行可能な研究の方向性を想定する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:49:36 GMT)
From Trade-off to Synergy: A Versatile Symbiotic Watermarking Framework for Large Language Models [16.9] 本稿では, シリアル, パラレル, ハイブリッドの3つの戦略を持つ多種多様な共生型透かしフレームワークを提案する。
このハイブリッドフレームワークはトークンエントロピーとセマンティックエントロピーを使用して透かしを適応的に埋め込み、検出可能性、堅牢性、テキスト品質、セキュリティのバランスを最適化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:33:36 GMT)
GrowSplat: Constructing Temporal Digital Twins of Plants with Gaussian Splats [16.7] 本稿では,3次元ガウススプラッティングとロバストなサンプルアライメントパイプラインを組み合わせることで,植物の時間的デジタルツインを構築するための新しい枠組みを提案する。
オランダの植物エコ・フェノタイピング・センターのデータに対するアプローチを評価し,セコイア種とキノア種の詳細な時間的再構成を実証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:56:15 GMT)
FairPO: Robust Preference Optimization for Fair Multi-Label Learning [16.7] マルチラベル分類における公平性の促進を目的とした新しいフレームワークであるFairPOを提案する。
私たちのフレームワークでは、ラベルのセットは特権グループと非特権グループに分割されています。
学習問題をグループに対するロバストな最適化とすることで、より低いパフォーマンスを持つグループに対するトレーニングの重点を調整できる。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:47:32 GMT)
When Thinking Fails: The Pitfalls of Reasoning for Instruction-Following in LLMs [16.7] 連鎖推論は命令追従精度を著しく低下させる。
これは、推論によって引き起こされる命令追従の失敗を体系的に公開する最初の作業である。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:36:00 GMT)
IPGO: Indirect Prompt Gradient Optimization for Parameter-Efficient Prompt-level Fine-Tuning on Text-to-Image Models [16.6] テキストから画像への拡散モデルは、テキストプロンプトから画像を生成するのに優れているが、コンテンツセマンティクス、美学、人間の嗜好と最適以下の関係を示すことが多い。
本研究では, パラメータ効率のよい新しいフレームワーク, Indirect Prompt Gradient Optimization (IPGO) を提案する。
IPGOは、プロンプト埋め込みの初めと終わりに連続的に微分可能な埋め込みを注入することで、ローランク構造を回転から柔軟性と非線形性で活用することで、プロンプト埋め込みを強化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:18:32 GMT)
Hierarchical Bracketing Encodings for Dependency Parsing as Tagging [16.5] シーケンスラベリング依存解析のための符号化のファミリを提示する。
最適な階層的ブラケットを導出し,12個の異なるラベルのみを用いて射影木を符号化する記号数を最小化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:01:28 GMT)
From Uncertain to Safe: Conformal Fine-Tuning of Diffusion Models for Safe PDE Control [16.2] 偏微分方程式(PDE)制約制御のための深層学習が注目されている。
我々は,安全制約下での最適制御を実現するために,PDE制御のためのセーフ拡散モデル(SafeDiffCon)を提案する。
我々は,1次元バーガー方程式,2次元非圧縮流体,制御核融合問題という3つの制御課題についてSafeDiffConを評価した。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:16:50 GMT)
Conditional Hierarchical Bayesian Tucker Decomposition for Genetic Data Analysis [16.1] 4種類のがんに共通する危険因子を見つけるために,患者の変異に基づいて遺伝子および生物学的経路群を作成する。
遅延ディリクレ割り当てを複数の次元に拡張し、階層的トピックモデリングのための異なる手法を設計する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:01:28 GMT)
Urban Representation Learning for Fine-grained Economic Mapping: A Semi-supervised Graph-based Approach [16.0] SemiGTXは、セクター経済マッピングのための半教師付きグラフ学習フレームワークである。
GDPは、統一されたモデルの中で、一次、二次、第三のセクターを同時にマッピングする。
中国のパールリバーデルタ地域で実施された実験は、既存の手法と比較してモデルの性能が優れていることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:12:08 GMT)
Permutation Randomization on Nonsmooth Nonconvex Optimization: A Theoretical and Experimental Study [16.0] ランダム化を組み込んだ勾配ベースのネットワークは、複雑な最適化よりも優れた性能を示すことが多い。
置換ランダム化は勾配に基づく振る舞いを妨害する。
置換ランダム化は基礎となる基底線の収束を保存することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:28:38 GMT)
HOME-3: High-Order Momentum Estimator with Third-Power Gradient for Convex and Smooth Nonconvex Optimization [16.0] モメンタムベースの機械学習モデルは、高度な機械学習モデルの最適化に不可欠である。
我々の研究は、このアプローチに対する理論的支援と実証的支援の両方を提供する。
いずれの場合も、高次勾配は従来の低次運動量より一貫して優れる。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:13:58 GMT)
Unsupervised Detection of Distribution Shift in Inverse Problems using Diffusion Models [15.9] 本稿では,間接的(破損した)測定のみを用いて分布変化を推定するための教師なしの指標を提案する。
この結果から, クリーンな画像から算出したKLの偏差を近似したスコアベースの測定値が得られた。
この結果から,分布外分布スコアと分布内分布スコアとの整合性はKLのばらつきを減少させ,複数の逆問題における再構成品質の向上につながることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:44:58 GMT)
Online Bandit Learning with Offline Preference Data for Improved RLHF [15.8] ノイズの多い選好フィードバックを持つオフラインデータセットでウォームスタートできるオンライン学習のための後部サンプリングアルゴリズムを提案する。
生成したエキスパートの“コンピテンス”をモデル化することで、そのようなデータセットを最も効果的に利用できることを示します。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:56:04 GMT)
Multi-Objective Preference Optimization: Improving Human Alignment of Generative Models [15.8] 制約付きKL正規化最適化としてアライメントをフレーム化するMOPOアルゴリズムを提案する。
以前の作業とは異なり、MOPOはペアワイズ好みのデータを直接操作し、ポイントワイズ報酬の仮定を必要とせず、プロンプトコンテキストエンジニアリングを避ける。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:58:26 GMT)
Active RLHF via Best Policy Learning from Trajectory Preference Feedback [15.8] 嗜好型強化学習(PbRL)における最良政策識別の問題に対処する。
本稿では,Top-Two Thompson Smplingにヒントを得た新しいアルゴリズムであるPosterior Smpling for Preference Learning(mathsfPSPL$)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:31:29 GMT)
Graph Representational Learning: When Does More Expressivity Hurt Generalization? [15.5] グラフニューラルネットワーク(GNN)は、構造化データを学ぶための強力なツールである。
グラフ間の構造的類似性の異なる度合いをキャプチャするプレメトリックの族を導入する。
私たちは、トレーニングとテストグラフ、モデルの複雑さ、トレーニングセットサイズの間の距離に依存する一般化境界を導出します。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:28:34 GMT)
Fast and Robust Visuomotor Riemannian Flow Matching Policy [15.3] 拡散に基づくビジュモータポリシーは、複雑なロボットタスクの学習に長けている。
RFMPは、フローマッチングの容易なトレーニングと高速な推論機能を継承するモデルである。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:41:41 GMT)
Espresso: High Compression For Rich Extraction From Videos for Your Vision-Language Model [15.3] 固定長シーケンスに空間的特徴と時間的特徴を別々に圧縮する新しいアーキテクチャである$textttEspresso$を導入する。
実験により、固定長圧縮とセグメントワイド処理を組み合わせることで、プールベースのアプローチに代わるスケーラブルで競争力のある代替手段が提供されることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:23:46 GMT)
Certifying Stability of Reinforcement Learning Policies using Generalized Lyapunov Functions [15.3] 最適制御・強化学習(RL)に基づく制御ポリシ下での閉ループシステムの安定性の証明問題について検討する。
古典的なリャプノフ法は、リャプノフ関数の厳格な段階的減少を必要とするが、そのような証明は学習された制御ポリシーのために構築することは困難である。
ニューラルネットワーク残差項でRL値関数を増大させることにより、一般化されたリアプノフ関数を学習するためのアプローチを定式化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:36:40 GMT)
Are We Truly Forgetting? A Critical Re-examination of Machine Unlearning Evaluation Protocols [15.0] 本稿では,下流のタスククラスと意味的類似性を示すクラスを忘れる,厳密なアンラーニング評価手法を提案する。
われわれのベンチマークは、現実的な条件下での未学習アルゴリズム評価のための標準化されたプロトコルとして機能することを願っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:22:05 GMT)
Mergenetic: a Simple Evolutionary Model Merging Library [14.8] 進化モデルマージのためのオープンソースライブラリであるMergeneticを紹介する。
我々は,メルジェネティックが,控えめなハードウェアを用いてタスクや言語間で競合する結果をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:43:23 GMT)
Temporally-Grounded Language Generation: A Benchmark for Real-Time Vision-Language Models [14.7] 視覚言語モデル(VLM)は、画像キャプションやビデオ質問応答などのオフラインタスクにおいて顕著な進歩を見せている。
リアルタイムの対話環境はVLMに新たな要求を課し、意味論的に正確であるだけでなく正確なタイミングで発話を生成する必要がある。
時間同期型インターリーブ(VLM-TSI)$.textbfVision-Languageモデルは、時間同期型で視覚的および言語的トークンをインターリーブするモデルである。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:48:30 GMT)
COBIAS: Assessing the Contextual Reliability of Bias Benchmarks for Language Models [14.6] 大規模言語モデル(LLM)は、トレーニング対象のWebデータからバイアスを受け取り、ステレオタイプや偏見を含むことが多い。
これらのバイアスを評価し緩和するための現在の手法はバイアスベンチマークデータセットに依存している。
本稿では,モデルが現れる可能性のあるさまざまなコンテキストを考慮し,モデルロバスト性を偏りのある文に評価するコンテキスト信頼性フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:00:45 GMT)
Alexandria: A Library of Pluralistic Values for Realtime Re-Ranking of Social Media Feeds [14.5] ソーシャルメディアフィードのランキングアルゴリズムは、目的としてエンゲージメントに集中しすぎると失敗する。
ソーシャルメディアのアルゴリズムに$textitlibrary of valuesを提示する。
我々は,ユーザの希望値に基づいて,X/Twitterフィードをリアルタイムで再ランクするブラウザエクステンションを開発した。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:13:04 GMT)
Constrained Online Decision-Making: A Unified Framework [14.5] 本稿では,段階的実現可能性制約による逐次意思決定の一般的な定式化について検討する。
本稿では,既存の制約付き学習問題を抽出する統一的なアルゴリズムフレームワークを提案する。
この結果は、理論と実践の両方において、制約付きシーケンシャルな意思決定のための原則化された基盤を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:25:55 GMT)
SOLAR: Scalable Optimization of Large-scale Architecture for Reasoning [14.4] 我々は,CoT(Chain-of-Thought),ToT(Tree-of-Thought),GoT(Graph-of-Thought)トポロジを動的に最適化し,精度と効率を向上させるフレームワークであるSOLARを提案する。
また,各課題にポストトレーニングと推論スケーリングを適応的に組み合わせたカリキュラムベースアプローチであるTopological-Scalingを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:02:04 GMT)
A Classical View on Benign Overfitting: The Role of Sample Size [14.4] モデルは任意に小さなトレーニングとテストエラーの両方を同時に達成する。
この振舞いはニューラルネットワークの特徴であり、しばしば低い(しかしゼロではない)トレーニングエラーを達成するが、それでもよく一般化される。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:37:51 GMT)
TabTreeFormer: Tabular Data Generation Using Hybrid Tree-Transformer [14.3] TabTreeFormerは、ツリーベースのモデルの帰納バイアスを統合するハイブリッドトランスフォーマーアーキテクチャである。
TabTreeFormerは、実用性、忠実性、プライバシの指標を競争効率で一貫して上回ります。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:34:38 GMT)
Do Theory of Mind Benchmarks Need Explicit Human-like Reasoning in Language Models? [14.3] 心の理論 (Theory of Mind, ToM) とは、心の状態を他人に説明できる能力である。
大規模言語モデルの最近の進歩は、ToMベンチマークで有望なパフォーマンスを示している。
これらのベンチマークは、明示的なヒューマンライクな推論プロセスを必要とするのか、それとも、代替戦略によってモデルが成功するのか?
論文参考訳(メタデータ) (Fri, 16 May 2025 07:38:52 GMT)
Questioning Representational Optimism in Deep Learning: The Fractured Entangled Representation Hypothesis [14.3] 我々は、オープンエンド検索プロセスを通じて進化したニューラルネットワークと、従来の勾配降下法で訓練されたネットワークを比較した。
両方のネットワークは同じ出力動作を生成するが、内部表現は劇的に異なる。
大規模なモデルでは、FERは一般化、創造性、(連続的な)学習といったコアモデルの能力が低下している可能性がある。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:28:34 GMT)
Connecting the Dots: A Chain-of-Collaboration Prompting Framework for LLM Agents [14.2] 大規模言語モデル(LLM)は複雑な推論タスクの実行において素晴らしいパフォーマンスを示している。
私たちは、知識とプロンプトを低コストで組み合わせたコラボレーションプロンプトフレームワークであるCochainを提案します。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:14:42 GMT)
Group-in-Group Policy Optimization for LLM Agent Training [14.2] Group-in-Group Policy Optimization (GiGPO) は、LLMエージェントのきめ細かいクレジット割り当てを実現する新しいRLアルゴリズムである。
我々は、Qwen2.5-1.5B-InstructとQwen2.5-7B-Instructを用いて、ALFWorldとWebShopという2つの挑戦的エージェントベンチマーク上でGiGPOを評価した。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:26:59 GMT)
Improving the Data-efficiency of Reinforcement Learning by Warm-starting with LLM [14.1] 本稿では,RL(Reinforcement Learning)アルゴリズムを温めるために,高品質なデータ収集におけるLLM(Large Language Model)の利用について検討する。
我々のアルゴリズムであるLOROは、最適ポリシーに収束し、高いサンプル効率を持つ。
CartPole や Pendulum など,OpenAI の複数の環境において,LORO がベースラインアルゴリズムより優れていることを実証的に示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:03:39 GMT)
Sobolev Training of End-to-End Optimization Proxies [14.1] 本研究は,ソボレフ訓練パラダイムを用いて,問題解決者の感性から終末プロキシへの統合について検討する。
ソボレフのトレーニングでは、誤差を最大56%減らし、最悪のケースは最大400%減った。
ラベル付きソリューションを使わずにトレーニングされた平均分散ポートフォリオタスクに対して、自己監督型ソボレフトレーニングは、中リスク領域における平均最適性ギャップを半減する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:10:01 GMT)
MatryoshkaKV: Adaptive KV Compression via Trainable Orthogonal Projection [14.1] KVキャッシュは、大規模言語モデルの推論におけるデファクト技術となっている。
本稿では,低ランクな投影行列を用いて,キャッシュ特性を次元を小さくした空間に変換する。
提案手法は, 平均KVキャッシュ圧縮率60%で90%以上の性能を維持することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:40:01 GMT)
NeuroLifting: Neural Inference on Markov Random Fields at Scale [14.0] 大規模なマルコフランダムフィールド(MRFs)での推論は、批判的だが難しい課題である。
本稿では,グラフニューラルネットワーク(GNN)を利用した新しい手法であるNeuroLiftingを紹介する。
従来のリフト技術を非パラメトリックニューラルネットワークフレームワークに拡張することで、NeuroLiftingはニューラルネットワークのスムーズなロスランドスケープから恩恵を受けることができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:18:23 GMT)
SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning [14.0] SpecReasonは、LEM推論を加速するシステムである。
最終回答の正確性を維持する上で、思考トークンのセマンティックな柔軟性を利用する。
バニラLEM推論よりも1.4-3.0times$のスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:27:32 GMT)
CellCLIP -- Learning Perturbation Effects in Cell Painting via Text-Guided Contrastive Learning [13.9] 本稿では,HCSデータのためのクロスモーダルコントラスト学習フレームワークであるCellCLIPを紹介する。
我々のフレームワークは、現在のオープンソースモデルよりも優れており、クロスモーダル検索と生物学的に意味のある下流タスクの両方において、最高のパフォーマンスを示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:07:51 GMT)
Discriminating image representations with principal distortions [13.8] 本稿では,画像表現の集合を局所的な幾何学的に比較する枠組みを提案する。
複雑なモデル間の局所的な感度差を探索するために、我々のフレームワークがどのように利用できるかを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:45:01 GMT)
How Good is Your Wikipedia? Auditing Data Quality for Low-resource and Multilingual NLP [13.8] 本稿では,ウィキペディアのデータ品質を,様々な品質フィルタリング手法を応用して,非英語環境におけるデータ品質を批判的に検証する。
データ品質プルーニングは、パフォーマンスを損なうことなく、リソース効率の高いトレーニングに有効な手段であることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:52:16 GMT)
TimeCapsule: Solving the Jigsaw Puzzle of Long-Term Time Series Forecasting with Compressed Predictive Representations [13.7] 我々は高次元情報圧縮の原理に基づいたモデルであるTimeCapsuleを紹介する。
本稿では,圧縮表現領域の内部予測について提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:17:47 GMT)
Zero-Shot Statistical Tests for LLM-Generated Text Detection using Finite Sample Concentration Inequalities [13.7] コンテンツの証明は、教育機関、ソーシャルメディアプラットフォーム、企業など、多くの組織の機能に不可欠である。
LLM(Large Language Models)が生成するテキストが、人間が生成したコンテンツとほとんど区別できないようになるにつれて、この問題はますます難しくなってきている。
本稿では,あるテキストが与えられた場合,特定の LLM が生成したかどうかを特定できるのか,という問いに答える。
LLM生成したテキストは、歴史に完全に依存したシーケンシャルなプロセスとしてモデル化し、ゼロショット統計テストを設計し、2つの異なるLCM集合によって生成されたテキストを区別する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:45:11 GMT)
Effective Probabilistic Time Series Forecasting with Fourier Adaptive Noise-Separated Diffusion [13.6] FALDAは時系列予測のための新しい確率的フレームワークである。
コンポーネント固有のアーキテクチャが組み込まれており、個々の時間的コンポーネントをカスタマイズしたモデリングを可能にする。
6つの実世界のベンチマーク実験は、FALDAが既存の確率予測手法を一貫して上回っていることを示している。
FALDAはまた、最先端(SOTA)ポイント予測アプローチよりも優れた全体的なパフォーマンスを実現し、最大9%の改善を実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:32:34 GMT)
High-efficient long-distance device-independent quantum secret sharing based on single-photon sources [13.6] デバイス非依存の量子シークレット共有(DI QSS)は、実験機器のセキュリティ仮定を緩和し、QSSの最高セキュリティレベルを提供する。
従来のDI QSSプロトコルでは、マルチパーティントの絡み合った状態を生成し、長距離の絡み合った分布を実装する必要がある。
本稿では,ほぼオンデマンドな単一光子源をベースとした高効率長距離DI QSSプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:22:07 GMT)
Second SIGIR Workshop on Simulations for Information Access (Sim4IA 2025) [13.6] 情報アクセス(IA)のシミュレーションは、そのトピックに関する様々なチュートリアルやワークショップで示されているように、最近関心を集めている。
Sim4IAワークショップの第2回は,方法論とツールキットの最近の発展を基盤として,研究者や実践者たちを再び集結させて,この分野の今後の展望を議論するための,対話的で魅力的なフォーラムを形成することを目的としています。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:48:59 GMT)
LARGO: Latent Adversarial Reflection through Gradient Optimization for Jailbreaking LLMs [13.4] LARGOは,流水性脱獄プロンプトを発生させる新規な潜伏自己反射攻撃である。
AdvBenchやJailbreakBenchのようなベンチマークでは、AutoDANを含む主要なジェイルブレイクテクニックを44ポイント上回っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:12:16 GMT)
Evaluating Vision-Language Models as Evaluators in Path Planning [13.4] 大規模言語モデル(LLM)は、エンド・ツー・エンド・プランニングにおいて限定的な有効性を持つことが示されている。
本稿では,複雑な経路計画シナリオにおける計画評価器としてVLMを評価する新しいベンチマークであるPathEvalを紹介する。
分析の結果,これらのモデルがベンチマークにおいて重大な課題に直面していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:46:31 GMT)
Towards Cross-modal Retrieval in Chinese Cultural Heritage Documents: Dataset and Solution [13.3] クロスモーダル検索は中国文化遺産の理解と解釈において重要な役割を担っている。
中国文化遺産に関する特別なデータセットが不足している。
そこで我々は,中国語-CLIPを微調整した学習自由な局所アライメント戦略であるLACLIPを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:52:46 GMT)
Adversarially Robust Spiking Neural Networks with Sparse Connectivity [13.2] SNN(Sparse and adversarially robust spiking Neural Network)の作成を目的としたニューラルネットワーク変換アルゴリズムを提案する。
提案手法は,SNNのエネルギー効率の高いアーキテクチャと新しい変換アルゴリズムを組み合わせることで,疎結合とアクティベーションによるエネルギー効率とメモリ効率の向上を実現する。
我々のモデルでは、メモリに格納される重量の最大100倍の削減を実現し、密度の高いSNNに比べてエネルギー効率が8.6倍向上することが示されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:52:51 GMT)
Intervention-Aware Forecasting: Breaking Historical Limits from a System Perspective [13.2] 我々は、外部介入を組み込むように設計されたインターベンション対応時系列予測(IATSF)フレームワークを提案する。
合成シナリオと実世界のシナリオ間で時間同期されたテキスト介入データからなるリークフリーベンチマークを提案する。
FIATSは最先端の手法を超越しており、予測改善は外部介入をモデル化することによるものであることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:34:08 GMT)
Evolutionary training-free guidance in diffusion model for 3D multi-objective molecular generation [13.1] EGDは、拡散サンプリングプロセスに直接進化的演算子を組み込む、トレーニング不要のフレームワークである。
単一およびマルチターゲットの3D条件生成タスクでは、EGDは最先端条件拡散法を精度良く上回り、1世代あたり最大5倍高速に動作します。
EGDは任意の3Dフラグメントを生成分子に埋め込むことができ、複数の衝突特性を1つの統一プロセスで最適化することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:32:40 GMT)
TCC-Bench: Benchmarking the Traditional Chinese Culture Understanding Capabilities of MLLMs [13.1] TCC-Benchは、MLLMによる伝統的な中国文化の理解を評価するためのベンチマークである。
文化的に豊かで視覚的に多様なデータを含み、博物館の工芸品、日常生活のシーン、漫画、その他の文化的に重要な文脈のイメージを取り入れている。
テキストのみのモードでGPT-4oを利用する半自動パイプラインを採用し、候補問題を生成し、続いて人間によるキュレーションを行い、データ品質を保証し、潜在的なデータ漏洩を回避する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:10:41 GMT)
Security Analysis of Mode-Pairing Quantum Key Distribution with Flexible Pairing Strategy [13.0] フレキシブルで効率的なペアリング戦略を備えた改良されたデコイ状態MP-QKDプロトコルを提案する。
我々は,デコイ状態MP-QKDの絡み合いモデルを提案することにより,提案方式の安全性を実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:12:55 GMT)
Speculative Decoding via Hybrid Drafting and Rollback-Aware Branch Parallelism [13.0] 投機的復号化において分岐並列性を解放する新しいフレームワーク textbfSpecBranch を提案する。
SDにおける分岐並列化の可能性を詳細に分析し、並列化とトークンロールバックのトレードオフに鍵となる課題があることを認識する。
我々の実験は、SpecBranchがtextbf1.8$times sim$ textbf4.5$times$ speedups against the auto-regressive decoding and reduces rollback tokens by $textbf50$% for aligned model。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:45:05 GMT)
Time Travel is Cheating: Going Live with DeepFund for Real-Time Fund Investment Benchmarking [12.8] LLM(Large Language Models)は、財務タスクにまたがる顕著な機能を示す。
複雑なファンド投資を管理するための現実的な効果は、まだ不十分に評価されている。
我々は,LLMをリアルタイム市場環境で厳格に評価するために設計された,ライブファンドベンチマークツールであるDeepFundを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:00:56 GMT)
Quantifying the Capability Boundary of DeepSeek Models: An Application-Driven Performance Analysis [12.8] DeepSeek-R1は様々なベンチマークで最先端のパフォーマンスを達成した。
我々は、拡張されたA-EvalベンチマークであるA-Eval-2.0を用いてDeepSeekとその関連モデルを評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:20:01 GMT)
Towards Principled Task Grouping for Multi-Task Learning [12.8] マルチタスク学習(MTL)は、タスク間の共有情報を活用し、学習効率と精度を向上させることを目的としている。
MTLは、多くの場合、タスク間の正と負の転送を効果的に管理するのに苦労し、パフォーマンス改善を妨げます。
本稿では,MTLにおけるタスクグループ化の原則的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:42:41 GMT)
Efficient Uncertainty Estimation via Distillation of Bayesian Large Language Models [12.7] 本稿では,不確実性推定のためのテスト時間サンプリングの必要性を解消する可能性を検討する。
既成のベイズ式LLMを非ベイズ式LLMに蒸留し, 予測分布のばらつきを最小限に抑える。
実験により,トレーニングデータにおける不確実性推定能力は,未確認テストデータにうまく一般化できることが実証された。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:26:03 GMT)
HaHeAE: Learning Generalisable Joint Representations of Human Hand and Head Movements in Extended Reality [12.7] HaHeAEは、XRにおける手と頭の動きの一般化可能な関節表現を学習するための、新しい自己指導手法である。
提案手法は, 再建品質の点で, 一般的な自己管理手法よりも74.0%高い性能を示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:19:15 GMT)
Rethinking Irregular Time Series Forecasting: A Simple yet Effective Baseline [12.7] 我々はこれらの課題に対処するためにAPNと呼ばれる一般的なフレームワークを提案する。
我々は、適応的なパッチ適用を実現するための新しいTAPA(Time-Aware Patch Aggregation)モジュールを設計する。
モデルの有効性を維持しながら、過去の情報を効果的に統合するために、単純なクエリーモジュールを使用します。
複数の実世界のデータセットに対する実験結果から、APNは既存の最先端の手法よりも効率と精度で優れていることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:42:00 GMT)
When to Speak, When to Abstain: Contrastive Decoding with Abstention [12.6] 大規模言語モデル(LLM)は、事前訓練された(パラメトリック)知識と外部(文脈)知識を活用することで、様々なタスクにまたがる例外的なパフォーマンスを示す。
本稿では,LLMが関連する知識が利用可能であれば応答を生成でき,それ以外は無視できる新しい学習自由復号法であるContrastive Decoding with Abstentionを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:29:41 GMT)
SlimSpeech: Lightweight and Efficient Text-to-Speech with Slim Rectified Flow [12.6] 整流に基づく軽量かつ効率的な音声合成システムであるSlimSpeechを紹介する。
実験の結果,提案手法は1ステップのサンプリングにより大規模モデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:11:05 GMT)
L-WISE: Boosting Human Visual Category Learning Through Model-Based Image Selection and Enhancement [12.5] 画像の摂動は、人間が真実のクラスを正確に報告する能力を高めることができることを示す。
本研究では,人間の視覚的学習を,テスト時に人間の分類精度を向上させる方法で強化することを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:36:12 GMT)
ImputeINR: Time Series Imputation via Implicit Neural Representations for Disease Diagnosis with Missing Data [12.5] ImputeINRは時系列計算の新しいアプローチである。
極端に希薄な観測値でも微細な不純物を生成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:50:15 GMT)
REI-Bench: Can Embodied Agents Understand Vague Human Instructions in Task Planning? [12.5] 言語学者は、そのような曖昧さは表現(RE)を参照することからしばしば生じることを示唆している。
本稿では,人間の指示におけるREsの不明瞭さがLLMに基づくロボットタスク計画にどのように影響するかを考察する。
本稿では,あいまいなRE(REI-Bench)を用いた最初のロボットタスク計画ベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:27:15 GMT)
Model Selection for Off-policy Evaluation: New Algorithms and Experimental Protocol [12.5] オフライン強化学習のためのモデルフリー・モデルベースセレクタを開発した。
従来のモデルフリープロトコルと比較して、新しいプロトコルではより安定した生成と候補値関数の制御が可能である。
我々の新しいモデルフリーセレクタであるLSTD-Tournamentは有望な経験的性能を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:18:19 GMT)
Safety Evaluation and Enhancement of DeepSeek Models in Chinese Contexts [12.4] DeepSeek-R1は例外的な推論機能とオープンソース戦略で有名だ。
DeepSeek-R1は有害なプロンプトを処理する際に100%の攻撃成功率を達成する。
我々は,DeepSeek-R1モデルシリーズ全体の安全性向上を目標としている。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:29:19 GMT)
Unifying Segment Anything in Microscopy with Multimodal Large Language Model [12.4] 我々は、顕微鏡クローズドメインデータの学習にMLLMを用いて、uLLSAMと呼ばれる顕微鏡内のセグメンテーションをガイドすることを提案する。
SAMがグローバルなVLKプロンプトを受信すると、その性能は大幅に向上するが、境界輪郭知覚には欠点がある。
本手法は,9つのドメイン内顕微鏡データセットに対して,Diceの7.71%,SAの12.10%の性能向上を実現し,最先端の性能を実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:55:56 GMT)
OntoURL: A Benchmark for Evaluating Large Language Models on Symbolic Ontological Understanding, Reasoning and Learning [12.4] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる能力を示しているが、構造化された記号的知識を処理する能力はまだ探索されていない。
ドメイン知識の形式的記号表現を扱う上で,LLMの習熟度を評価するために設計された最初の総合ベンチマークであるOntoURLを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:26:06 GMT)
Two-Stage Random Alternation Framework for One-Shot Pansharpening [12.4] 本稿では,任意のマルチスペクトル(MS)/パンクロマティック(PAN)ペアに対して,インスタンス固有の最適化を行う2段階ランダム交互化フレームワーク(TRA-PAN)を提案する。
TRA-PANは、縮小解像度画像からの強い監督制約とフル解像度画像の物理的特性を効果的に統合する。
実験の結果,TRA-PANは実世界のシナリオにおいて,定量的な測定値と視覚的品質において,最先端(SOTA)手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:39:40 GMT)
The Curious Case of Class Accuracy Imbalance in LLMs: Post-hoc Debiasing via Nonlinear Integer Programming [12.3] 大規模言語モデル(LLM)は優れた知識ベースであるが、テキスト分類における全てのクラスで同等に機能するのに苦労する。
本稿では,LLMにおけるクラス精度の不均衡の事例について考察する。
バイアス識別の難しさと再トレーニングの到達性の難しさを克服するため,出力確率のみを用いたポストホックバランスクラスの精度について検討した。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:12:39 GMT)
Time-R1: Towards Comprehensive Temporal Reasoning in LLMs [12.1] textitTime-R1は,時間的包括的能力を持つ中規模(3B-パラメータ)の大規模言語モデルを実現するフレームワークである。
Time-R1は、最先端の671B DeepSeek-R1を含む200倍以上のモデルで性能が向上している。
この研究は、思慮深く設計されたプログレッシブRL微調整により、より小さく効率的なモデルで時間的性能を向上できるという強い証拠を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:46:28 GMT)
Verifiably Forgotten? Gradient Differences Still Enable Data Reconstruction in Federated Unlearning [12.1] Federated Unlearning(FU)は、データプライバシ規制の重要なコンプライアンスメカニズムとして登場した。
本稿では,新しい学習ベース再構築攻撃フレームワークであるForgotten Data (IGF) のグラディエント差分を変換する手法を提案する。
IGFは、構造的およびセマンティックなキューの両方をキャプチャする複合的な損失によって最適化された、調整されたピクセルレベルの逆変換モデルを組み込んでいる。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:28:30 GMT)
MutualNeRF: Improve the Performance of NeRF under Limited Samples with Mutual Information Theory [12.1] 本稿では,限定サンプル下でのニューラルレーシアンスフィールド(NeRF)性能向上フレームワークであるMutualNeRFを紹介する。
我々は、画像間の相関を均一に測定する指標として、単純だが理論的に堅牢な概念であるMutual Informationを導入する。
限られたサンプル下での実験では、異なる設定で最先端のベースラインよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:50:08 GMT)
SoK: Decoding the Enigma of Encrypted Network Traffic Classifiers [12.0] TLS 1.3のような現代の暗号化プロトコルは、従来のネットワークトラフィック分類(NTC)手法に挑戦している。
本稿では,MLに基づくNTC研究を包括的に分析し,その設計選択の分類とベンチマークスイートを開発する。
時代遅れのデータセット、設計選択の監視、そして根拠のない仮定の結果に広く依存していることを示します。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:36:50 GMT)
MOSAAIC: Managing Optimization towards Shared Autonomy, Authority, and Initiative in Co-creation [12.0] 人間と共同創造型AIの適切なバランスを取ることは、計算クリエイティビティにおけるオープンな研究課題である。
MOSAAICは共同創造における制御のキャラクタリゼーションとバランスをとるための新しいフレームワークである。
MOSAAICの適用性を実証するため、既存の6つの共創造型AIケーススタディにおける制御の分布を分析した。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:41:44 GMT)
Fourier Low-rank and Sparse Tensor for Efficient Tensor Completion [11.9] 我々は、新しいモデル、UnderlineFourier UnderlineLow-rankとUnderlineSparse UnderlineTensor(FLoST)を提案する。
FLoSTは変換を用いてテンソルを時間次元に沿って分解する。
低周波成分と低周波成分と低周波成分を疎らさで捕捉し、滑らかな変動と局所的な変動の両方を効率的にモデル化するハイブリッド構造をもたらす。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:54:07 GMT)
Random Client Selection on Contrastive Federated Learning for Tabular Data [11.9] Vertical Federated Learning (VFL)は、複数のパーティでプライバシ保護モデルトレーニングを可能にすることによって、コラボレーション機械学習に革命をもたらした。
中間計算共有時の情報漏洩に弱いままである。
コントラシブ・フェデレート・ラーニング(CFL)は、これらのプライバシー問題を表現学習によって緩和するために導入された。
本稿では,CFL環境における勾配に基づく攻撃の包括的実験的解析について述べる。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:20:02 GMT)
Thousand Voices of Trauma: A Large-Scale Synthetic Dataset for Modeling Prolonged Exposure Therapy Conversations [11.9] Thousand Voices of Traumaは、PTSDの長期露光療法プロトコルに基づく、3000件のセラピー会話の総合ベンチマークデータセットである。
データセットには500のユニークなケースが含まれており、それぞれが治療の進行を反映する6つの会話視点を通して探索されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:12:03 GMT)
Improve Rule Retrieval and Reasoning with Self-Induction and Relevance ReEstimate [11.9] 本稿では,ルール検索の課題を体系的に解決する。
スパースや密集したレトリバーを用いて関連するルールを直接検索するバニラ検索法は、しばしば低い精度に悩まされる。
本稿では,Large Language Models (LLMs) を用いて潜在的な推論規則を導出する新しい手法であるSelf-Induction Augmented Retrieval (SIAR)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:22:42 GMT)
mmRAG: A Modular Benchmark for Retrieval-Augmented Generation over Text, Tables, and Knowledge Graphs [11.9] マルチモーダルRAGシステムを評価するためのモジュール型ベンチマークであるmmRAGを紹介する。
我々のベンチマークでは、テキスト、テーブル、知識グラフにまたがる6つの多様な問合せデータセットからのクエリを統合する。
文書関連性を注釈化し、データセット関連性を導出するための標準情報検索手順に従う。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:31:29 GMT)
Joint Graph Estimation and Signal Restoration for Robust Federated Learning [11.8] 本稿では,雑音の多いコミュニケーション下でのフェデレート学習(FL)におけるモデルパラメータのロバスト集約手法を提案する。
提案手法は,バイアスデータと雑音条件下での分類精度を最大2ドル~5ドルに向上することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:17:59 GMT)
CheX-DS: Improving Chest X-ray Image Classification with Ensemble Learning Based on DenseNet and Swin Transformer [11.8] 自己注意機構はコンピュータビジョンの分野に導入され、優れた性能を示している。
本稿では,胸部X線医学領域におけるロングテール多ラベルデータの分類に有効なモデルであるCheX-DSを提案する。
このモデルは医療画像のための優れたCNNモデルDenseNetと、新しく普及したSwin Transformerモデルに基づいている。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:10:01 GMT)
Constrained Preferential Bayesian Optimization and Its Application in Banner Ad Design [11.8] 本稿では、不等式制約を初めて組み込んだPBOの拡張である制約優先ベイズ最適化(CPBO)を提案する。
技術的評価の結果, CPBO法は, 実現可能な領域の探索に焦点をあて, 最適解の同定に成功していることがわかった。
また,CPBOを用いたバナー広告デザインのためのデザイナ・イン・ザ・ループシステムを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:41:07 GMT)
Strategic Classification with Randomised Classifiers [11.7] 戦略的分類の問題は、学習者が戦略的に修正された特徴に基づいてエージェントを分類するモデルを構築する必要がある。
特定の条件下では、最適ランダム化分類器は最適な決定論的分類器よりも精度が高いことを示す。
我々は、ランダム化は、実質的な欠点を導入することなく、実際に直面する可能性のある問題を緩和する可能性があると結論付けている。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:45:06 GMT)
On the Feasibility of Using LLMs to Autonomously Execute Multi-host Network Attacks [11.7] 本当のサイバー攻撃は、しばしばマルチホストネットワーク攻撃であり、複数のホストにまたがる複数のステップの実行を含む。
現在、LLMがマルチホストネットワークアタックを自律的に実行できる範囲はよく理解されていない。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:55:52 GMT)
EA-3DGS: Efficient and Adaptive 3D Gaussians with Highly Enhanced Quality for outdoor scenes [11.6] 3D Gaussian Splatting (3DGS) は高品質なレンダリングとリアルタイムの速度で優れた性能を示した。
本研究では,屋外シーンを対象とした高品質なリアルタイムレンダリング手法EA-3DGSを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:00:13 GMT)
Qronos: Correcting the Past by Shaping the Future... in Post-Training Quantization [11.5] 我々は、ニューラルネットワークの重みを逐次ラウンドで更新する新しいトレーニング後の量子化アルゴリズムであるQronosを紹介した。
Qronosは、ウェイトとアクティベーションの量子化の両方によるエラーを明示的に修正するだけでなく、以前のレイヤの量子化によるエラーも修正する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:04:25 GMT)
Using Reinforcement Learning to Train Large Language Models to Explain Human Decisions [11.4] 本研究では,多目的認知モデルとして,事前訓練された大規模言語モデルの可能性について検討する。
結果に基づく報酬を用いた強化学習を用いて、人間のリスク選択を説明するための明確な推論トレースを生成するためのLSMを誘導する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:22:05 GMT)
Beyond the Heatmap: A Rigorous Evaluation of Component Impact in MCTS-Based TSP Solvers [11.4] Heatmap + Monte Carlo Tree Search (MCTS)' のパラダイムは、最近トラベルセールスマン問題 (TSP) を解決するための重要なフレームワークとして登場した。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:31:51 GMT)
Reasoning with OmniThought: A Large CoT Dataset with Verbosity and Cognitive Difficulty Annotations [11.4] OmniThoughtは、教師モデルとして2つの強力なLEMによって生成される200万のチェーン・オブ・シント(CoT)プロセスを備えた大規模なデータセットである。
OmniThoughtの各CoTプロセスには、新しいReasoning Verbosity(RV)とCognitive Difficulty(CD)スコアがアノテートされている。
我々はさらに、より強力な推論能力と最適なCoT出力長と難易度を備えた高性能LEMのシリーズを訓練・リリースする。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:15:30 GMT)
Gradient-based Sample Selection for Faster Bayesian Optimization [11.2] 大予算のシナリオでは、標準GPモデルを直接活用することは、計算時間とリソース要求において大きな課題に直面します。
本稿では,勾配に基づくサンプル選択ベイズ最適化(GSSBO)を提案し,BOの計算効率を向上させる。
提案手法は,ベースライン法に匹敵する最適化性能を維持しつつ,BOにおけるGPフィッティングの計算コストを大幅に削減する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:19:26 GMT)
FOReCAst: The Future Outcome Reasoning and Confidence Assessment Benchmark [11.1] FOReCAstはモデルを予測し、その信頼性を評価するためのベンチマークである。
ブール問題、時間枠予測、量推定を含む様々な予測シナリオにまたがる。
実世界のアプリケーションに対して、予測精度と信頼性校正の両方を包括的に評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:08:20 GMT)
Supervised Models Can Generalize Also When Trained on Random Label [11.1] 教師なし学習は、教師なしモデルも、出力$y$の情報を使わずにトレーニングできるかどうかという疑問を提起する。
モデルをより滑らかに、すなわち $hatf=Sy$ の形に定式化し、$y$ とは独立により滑らかな行列 $S$ を構築する。
我々は、リニアおよびカーネルリッジのレグレッション、スムーズなスプライン、ニューラルネットワークの$y$のトレーニングされたバージョンが、標準の$y$ベースのバージョンと同じようなパフォーマンスを示し、最も重要なのは、ランダムな推測よりもはるかに優れていることである。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:51:44 GMT)
Predicting Student Dropout Risk With A Dual-Modal Abrupt Behavioral Changes Approach [11.0] Dual-Modal Multiscale Sliding Window (DMSW) モデルは,学術的パフォーマンスと行動データを統合し,最小限のデータを用いて行動パターンをキャプチャする。
DMSWモデルでは従来の手法に比べて予測精度が15%向上し,高リスクの生徒を早期に特定できるようになった。
これらの知見は、ドロップアウト予測における理論と実践のギャップを埋め、教育者は学生の維持と成果を高める革新的なツールとなる。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:02:55 GMT)
Semantic Caching of Contextual Summaries for Efficient Question-Answering with Language Models [11.0] 大規模言語モデル(LLM)は、リアルタイムの質問応答と検索拡張生成のために、エッジとクラウドプラットフォームにデプロイされることが増えている。
本稿では,文脈要約を保存・再利用するためのセマンティックキャッシング手法を提案する。
本手法は,全文書処理に匹敵する解の精度を維持しつつ,冗長計算を最大50~60%削減する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:04:31 GMT)
AI Idea Bench 2025: AI Research Idea Generation Benchmark [11.0] 本稿では,言語モデル(LLM)が生み出すアイデアを定量的に評価し,比較するフレームワークであるAI Idea Bench 2025を紹介する。
このフレームワークは、3,495のAI論文とその関連するインスパイアされた作業の包括的なデータセットと、堅牢な評価方法論で構成されている。
評価システムは、2次元のアイデア品質を測る。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:37:51 GMT)
Missing Data Imputation by Reducing Mutual Information with Rectified Flows [10.9] 本稿では,データとそれに対応するマスクの相互情報を逐次低減する,新しいデータ計算手法を提案する。
提案アルゴリズムは, インプットされたデータの結合分布とマスクの欠落とのKLのばらつきを反復的に最小化する。
この枠組みの下での最適計算は、流速場が整流学習目標を最小化するODEの解法に対応していることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:15:02 GMT)
Ranked Voting based Self-Consistency of Large Language Models [10.9] 多数決投票は、連鎖推論を強化する効果的な方法と考えられている。
各推論プロセスにおいてランク付けされた回答を生成することを提案する。
我々は、即時投票、ボルダカウント投票、平均相互投票の3つのランク付け方法を使用している。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:09:43 GMT)
TwinTURBO: Semi-Supervised Fine-Tuning of Foundation Models via Mutual Information Decompositions for Downstream Task and Latent Spaces [10.9] 本稿では,限られたラベル付きデータに対するトレーニングの課題に対処する,半教師付き微調整フレームワークを提案する。
いくつかのデータセットの実験では、極低ラベル条件下での分類タスクが大幅に改善された。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:58:49 GMT)
Towards Self-Improvement of Diffusion Models via Group Preference Optimization [10.6] グループ優先最適化(GPO)は、外部データを必要とせずに性能を向上させる効果的な自己改善手法である。
GPOは、安定拡散3.5媒体の正確なカウントとテキストレンダリング能力を20パーセント改善する。
プラグアンドプレイ方式では、推論中に余分なオーバーヘッドは発生しない。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:04:57 GMT)
Leveraging Large Language Models for Effective Label-free Node Classification in Text-Attributed Graphs [10.5] Locleは、LLMによるラベルなしノード分類を費用対効果で行う、アクティブなセルフトレーニングフレームワークである。
これは、GNNを用いて少数の「クリティカル」サンプルを反復的に識別し、LLMとGNNの両方で情報的擬似ラベルを抽出する。
ラベルのないノード分類では、同じクエリ予算で最先端のメソッドをLLMに大幅に上回ります。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:58:58 GMT)
Space Group Equivariant Crystal Diffusion [10.5] 3次元結晶は、空間群と呼ばれる離散アイソメトリー群に不変である。
SGEquiDiffは、自然に空間群不変確率で空間群制約を扱う結晶生成モデルである。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:45:04 GMT)
SupertonicTTS: Towards Highly Scalable and Efficient Text-to-Speech System [10.5] 音声合成におけるスケーラビリティと効率を向上させるために,新しい音声合成システムであるSupertonicTTSを提案する。
SupertonicTTSは、連続潜時表現のための音声オートエンコーダ、テキストからラテントマッピングのためのフローマッチングを利用するテキストからラテントモジュール、発話レベルの持続時間予測器の3つのコンポーネントから構成される。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:42:31 GMT)
MedGUIDE: Benchmarking Clinical Decision-Making in Large Language Models [10.5] MedGUIDEは,Large Language Models (LLMs) を評価するための新しいベンチマークであり,ガイドラインに一貫性のある臨床診断を行う能力について紹介する。
MedGUIDEは17種類の癌にまたがる55のNCCN決定木から構築されている。
本研究では,10の臨床的,言語学的基準において,専門家ラベル付き報酬モデルとLLM-as-a-judgeアンサンブルを組み合わせた2段階の品質選択プロセスを適用し,高品質なサンプル7,747を選定した。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:21:52 GMT)
UGoDIT: Unsupervised Group Deep Image Prior Via Transferable Weights [10.4] UGoDITは、訓練中にごく少数のサブサンプル測定ベクトルMしか利用できない低データ方式のために設計されている。
本手法は,共有エンコーダとMアンタングルデコーダを最適化することにより,転送可能な重みの集合を学習する。
医療用(マルチコイルMRI)と自然用(超分解能・非線形劣化)の画像回復タスクの両面でUGoDITを評価した。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:05:28 GMT)
Re-ranking Using Large Language Models for Mitigating Exposure to Harmful Content on Social Media Platforms [10.4] ゼロショットおよび少数ショット設定において,Large Language Models (LLMs) を用いた新たな階層化手法を提案する。
提案手法は, ラベル付きデータを必要とすることなく, 有害なコンテンツ露出を効果的に軽減し, コンテンツシーケンスを動的に評価・再ランクする。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:25:28 GMT)
Let the Trial Begin: A Mock-Court Approach to Vulnerability Detection using LLM-Based Agents [10.4] VulTrialは、自動脆弱性検出を強化するために設計された法廷インスパイアされたフレームワークである。
セキュリティ研究者、コード作者、モデレーター、レビューボードの4つの役割専門エージェントを雇用している。
GPT-3.5とGPT-4oを使用して、VulTrialはそれぞれのベースラインに対して102.39%、84.17%の性能を向上させる。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:54:10 GMT)
The foundations of cost-sensitive causal classification [10.4] 本研究は,統一評価フレームワークの試作により,コスト感受性と因果分類を統合した。
本研究は,従来の分類が,パフォーマンス指標の範囲における因果分類の特定の事例であることを示す。
提案手法は,コスト依存型因果学習手法の開発への道を開くものである。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:01:40 GMT)
Ambiguity Resolution in Text-to-Structured Data Mapping [10.3] 自然言語における曖昧さは、構造化されたデータマッピングに対する正確なテキストを実現するための重要な障害である。
本稿では,概念不足の予測を通じて曖昧なエージェントツールを呼び出し,大規模言語モデル(LLM)の性能を向上させるための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:39:30 GMT)
FlowHFT: Imitation Learning via Flow Matching Policy for Optimal High-Frequency Trading under Diverse Market Conditions [10.3] 高周波トレーディング(英: high- frequency trading、HFT)は、市場状態を継続的に監視し、入札を行い、ミリ秒の速度で注文を求める投資戦略である。
従来のHFTアプローチは、過去のデータとモデルに適合し、将来の市場状態も同様のパターンに従うと仮定する。
本稿では,フローマッチングポリシーに基づく新しい模倣学習フレームワークであるFlowHFTを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:14:09 GMT)
Can We Trust AI Agents? A Case Study of an LLM-Based Multi-Agent System for Ethical AI [10.1] AIベースのシステムは、多様なタスクをサポートすることによって数百万に影響を及ぼすが、誤情報、偏見、誤用といった問題に直面している。
本研究では,Large Language Models (LLM) を用いたAI倫理の実践について検討する。
エージェントがAIインシデントデータベースから現実のAI倫理問題に関する構造化された議論を行うプロトタイプを設計する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:05:27 GMT)
Autoencoder-Based Hybrid Replay for Class-Incremental Learning [10.1] クラスインクリメンタルラーニング(CIL)では、タスクの混乱と忘れを緩和するために効果的なインクリメンタルラーニング戦略が不可欠である。
本稿では,新しいハイブリット・オートエンコーダ(HAE)を活用して圧縮機として機能する,オートエンコーダベースのハイブリッド・リプレイ(AHR)戦略を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:29:53 GMT)
TokenWeave: Efficient Compute-Communication Overlap for Distributed LLM Inference [10.1] 大規模言語モデル(LLM)の分散推論は、NVLINKのような高速な相互接続によって接続されたGPUでも最大20%のオーバーヘッドを発生させることができる。
これらの課題に対処するため、TokenWeaveを紹介します。
TokenWeaveは、推論バッチ内のトークンを、ウェーブアウェア方式で2つのほぼ等しいサブセットに分割するToken-Splitting手法を提案する。
私たちの評価では、複数のモデルやワークロードで29%のレイテンシ向上、最大26%のスループット向上を実現しています。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:53:50 GMT)
GraphOracle: A Foundation Model for Knowledge Graph Reasoning [9.9] 知識グラフ間の推論を統一する関係中心基盤モデルであるtextbftextscGraphOracleを紹介する。
クエリ依存型アテンション機構は,関係性と実体性の両方について帰納的表現を学習するために開発された。
多様な知識グラフの事前学習と、数分レベルの微調整により、実体、関係、グラフ全体に対する効果的な一般化が可能となる。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:14:57 GMT)
Signal attenuation enables scalable decentralized multi-agent reinforcement learning over networks [9.9] 本稿では,MARLにおける信号減衰の分散化を,レーダネットワークにおける目標検出のための電力割当を行うための実証的な特別な事例を考慮し,その分散化を可能にすることを示す。
我々のアプローチは、私たちが考慮している特定のレーダネットワーク問題に向けられているが、無線通信やレーダネットワークにおけるさらなる問題への将来の拡張に有用なモデルを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:14:37 GMT)
Grounding Synthetic Data Evaluations of Language Models in Unsupervised Document Corpora [9.9] 言語モデル(LM)は進化を続け、応答品質と一貫性を改善している。
モデル品質、応答適性、推論能力を評価するために、数多くの評価ベンチマークが作成されている。
本稿では,文書群を基盤としたファクトベース合成データモデル評価の自動化手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:35:01 GMT)
From Pixels to Perception: Interpretable Predictions via Instance-wise Grouped Feature Selection [9.8] 本稿では,入力画像のインスタンスワイドスペーシングにより,本質的に解釈可能な予測を行う手法を提案する。
空間化と人間の知覚を一致させるために,意味的に意味のあるピクセル領域の空間におけるマスキングを学習する。
半合成および自然な画像データセットに実証的に示し、我々の本質的に解釈可能な分類器は、最先端のベンチマークよりも有意義で人間の理解可能な予測を生成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:23:52 GMT)
Survey of End-to-End Multi-Speaker Automatic Speech Recognition for Monaural Audio [9.8] モナラ多話者自動音声認識(ASR)は、データ不足と、個々の話者に単語を認識・帰属させることが本質的に困難であるため、依然として困難である。
近年、カスケードシステムからエンド・ツー・エンド(E2E)アーキテクチャへの移行が進み、誤りの伝播が減少し、音声コンテンツと話者アイデンティティの相乗効果が向上した。
この調査は、マルチスピーカーASRのためのE2Eニューラルアプローチの体系的な分類を提供し、最近の進歩と比較分析を強調している。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:21:59 GMT)
Degree-Conscious Spiking Graph for Cross-Domain Adaptation [9.8] スパイキンググラフネットワーク(SGN)は、脳にインスパイアされた神経力学をエミュレートすることによって、グラフ分類において大きな可能性を証明している。
本稿ではまず,SGNにおけるドメイン適応問題を提案するとともに,クロスドメイン適応のためのDegree-Consicious Spiking Graphという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:24:56 GMT)
Seeing Sound, Hearing Sight: Uncovering Modality Bias and Conflict of AI models in Sound Localization [9.7] 人間はAIを一貫して上回り、聴覚情報に頼ることによって、対立や欠落した視覚に対して優れたレジリエンスを示す。
3次元シミュレーションによって生成されたステレオオーディオ画像データセットを用いて最先端モデルを微調整する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:13:25 GMT)
Review-Instruct: A Review-Driven Multi-Turn Conversations Generation Method for Large Language Models [9.7] マルチターン対話データを生成する既存の方法は、命令の多様性と品質の両方を保証するために苦労している。
Ask-Respond-Review」プロセスを通じて複数回会話を合成する新しいフレームワークであるReview-Instructを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:59:07 GMT)
Anti-Sensing: Defense against Unauthorized Radar-based Human Vital Sign Sensing with Physically Realizable Wearable Oscillators [9.6] レーダは、壁を通してさえ、繊細な生理データをキャプチャする能力を持つため、プライバシー上の懸念が高まる。
我々は、未承認レーダーによるセンシングを防止するために設計された、新しい防御機構であるアンチセンシングを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:07:08 GMT)
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient [9.5] 本稿では,SSM(State Space Model)ベースの世界モデルDramaを提案し,メモリと計算の複雑さを$O(n)$で実現した。
また, 早期のトレーニングにおいて, 誤った世界モデルによって引き起こされる準最適性を緩和する新しいサンプリング手法を提案する。
ドラマは、標準のラップトップのような市販のハードウェアでアクセス可能で、トレーニングできる。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:49:48 GMT)
FreeA: Human-object Interaction Detection using Free Annotation Labels [9.5] FreeAは自己適応型言語駆動型HOI検出法である。
手動のアノテーションを必要とせずに、潜在HOIラベルを生成する。
監督の弱いHOIコンペティターの間で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:52:04 GMT)
A Fast Kernel-based Conditional Independence test with Application to Causal Discovery [9.4] FastKCIは、スケーラブルで並列化可能なカーネルベースの条件付き独立テストである。
実世界の生産データに関する合成データセットとベンチマークの実験は、FastKCIが元のKCIテストの統計力を維持していることを検証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:14:57 GMT)
Quantum Lattice Kinetic Scheme for Solving Two-dimensional and Three-dimensional Incompressible Flows [9.4] ほとんどの量子LBMは、非線形衝突を避けるために$tau$ = 1を固定し、与えられたレイノルズ数に対してシミュレーションを固定メッシュサイズに制限する。
平衡分布関数 (EDF) に定数パラメータ$A$を導入し, 流体の粘度を独立に調整できる量子格子速度論的スキーム(LKS)を提案する。
2Dおよび3DTaylor-Green渦流と蓋駆動キャビティ流について評価し,量子LKSが古典LKSと同じ精度で収束することを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:41:46 GMT)
Human-Aligned Bench: Fine-Grained Assessment of Reasoning Ability in MLLMs vs. Humans [9.3] マルチモーダル推論と人的パフォーマンスのアライメントのためのベンチマークであるHuman-Aligned Benchを提案する。
両言語(中国語と英語)の多モーダル質問や純粋テキストベースの質問など、文脈的推論のみに依存する9,794の多モーダル質問を収集した。
マルチモーダル推論におけるMLLMの性能と人為的性能との間には顕著な違いがある。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:41:19 GMT)
reBEN: Refined BigEarthNet Dataset for Remote Sensing Image Analysis [9.3] BigEarthNetは、リモートセンシング画像解析のためのディープラーニング(DL)研究を支援するために構築された、大規模でマルチモーダルなリモートセンシングデータセットである。
reBENデータセットは、Sentinel-1とSentinel-2の画像パッチの549,488対で構成されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:49:37 GMT)
Know Your Mistakes: Towards Preventing Overreliance on Task-Oriented Conversational AI Through Accountability Modeling [9.3] 本稿では,ユーザ過度に対処するタスク指向対話エージェントのための説明責任モデルを提案する。
実験結果から,提案手法はAIエージェントエラーの信頼性の高い推定を可能にするだけでなく,デコーダがより正確な動作を生成することを示唆している。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:33:23 GMT)
Uncertainty Quantification for LLM-Based Survey Simulations [9.3] 本研究では,大規模言語モデル(LLM)を用いて質問に対する人間の反応をシミュレートする。
提案手法は,不完全なLLMシミュレーション応答を集団パラメータの信頼セットに変換する。
重要な革新は、シミュレーションされたレスポンスの最適な数を決定することである。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:19:23 GMT)
DecompileBench: A Comprehensive Benchmark for Evaluating Decompilers in Real-World Scenarios [9.3] 既存のアプローチは主に、合成マイクロベンチマークや主観的人間格付けによる統語的正当性に焦点を当てている。
DecompileBenchはリバースエンジニアリングにおけるデコンパイラの効果的な評価を可能にする最初の総合的なフレームワークである。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:07:43 GMT)
RGB-Event Fusion with Self-Attention for Collision Prediction [9.3] 本稿では,動的物体を持つ無人航空機の時間と衝突位置を予測するニューラルネットワークフレームワークを提案する。
提案したアーキテクチャは、2つの異なるエンコーダ分岐で構成されており、1つはモダリティ、次に自己アテンションによる融合により予測精度が向上する。
核融合モデルでは, 平均で1%, 0.5mを超える距離で10%の精度で予測精度が向上するが, メモリで+71%, FLOPで+105%のコストがかかることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:32:32 GMT)
Modeling Cell Dynamics and Interactions with Unbalanced Mean Field Schrödinger Bridge [9.2] CytoBridgeは、Un Balanced MeanField Schr"odinger Bridge (UMFSB) 問題を近似するために設計されたディープラーニングアルゴリズムである。
ニューラルネットワークを通じて細胞移行、増殖、相互作用を明示的にモデル化することで、CytoBridgeはこれらのプロセスをデータから直接学習する柔軟性を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:55:13 GMT)
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation [9.2] MTVCrafterは、人間の画像アニメーションのための生の3Dモーションシーケンスをモデル化する最初のフレームワークである。
2Dレンダリングされたポーズ画像と比較して、4Dモーショントークンはより堅牢な時間的手がかりを提供する。
MTVCrafterは様々なスタイルやシナリオで様々なオープンワールドキャラクター(シングル/複数、フル/半ボディ)を一般化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:31:35 GMT)
Improving Assembly Code Performance with Large Language Models via Reinforcement Learning [9.2] 大規模言語モデル(LLM)は、幅広いプログラミングタスクにおいて強力なパフォーマンスを示している。
本稿では,PPO(Proximal Policy Optimization)を用いたLLM学習のための強化学習フレームワークを提案する。
我々のモデルであるQwen2.5-Coder-7B-PPOは96.4%のテストパス率を獲得し、gcc-O3ベースライン上での平均速度は1.47倍である。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:40:45 GMT)
Auto-bidding in real-time auctions via Oracle Imitation Learning (OIL) [9.2] マルチスロット第2価格オークションにおける自動入札エージェントのトレーニングフレームワークを提案する。
広告キャンペーンが終了すると、各インプレッション機会の最適入札を決定することは、複数の選択knapsack問題とみなすことができるという知見を活用できる。
本稿では,印象の機会と広告スロットをほぼ最適に組み合わせた「オークル」アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:21:13 GMT)
Patho-R1: A Multimodal Reinforcement Learning-Based Pathology Expert Reasoner [9.2] 我々は、病理教科書と現実世界の病理の専門家を活用して、高品質で推論指向のデータセットを構築する。
Patho-R1はマルチモーダルなRLベースの病理組織Reasonerで、3段階のパイプラインを通じてトレーニングされた。
PathoCLIPは、継続事前訓練に使用される同じフィギュアキャプションコーパスで訓練された。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:12:50 GMT)
Global Convergence of Adaptive Sensing for Principal Eigenvector Estimation [9.2] Ojaのような部分空間追跡アルゴリズムはより効率的な代替手段を提供するが、通常はフル次元の観測を必要とする。
我々は,この適応センシング手法が雑音の存在下でのグローバル収束を実現することを証明した。
結果は、フル次元サンプルの取得が困難またはコストがかかるアプリケーションに重要な意味を持つ。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:41:11 GMT)
Neural-Inspired Advances in Integral Cryptanalysis [9.2] ニューラルネットワークを用いて、積分特性に関連する特徴を学習する。
これらの結果は,ニューラルネットワークを用いた特徴探索の枠組みを検証した。
我々は,モデル精度と計算効率のバランスをとるミドルサーチフレームワークにおける会議を開発する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:05:13 GMT)
Entropy-Guided Sampling of Flat Modes in Discrete Spaces [9.1] 既存のサンプリングアルゴリズムは、しばしばモードボリュームを見落とし、フラットモードを効果的に捉えるのに苦労する。
本研究では, 局所エントロピーを連続的補助変数によるサンプリングプロセスに組み込んだEmphEntropic Discrete Langevin Proposal (EDLP)を提案する。
局所対数対数離散分布におけるEDLPの非漸近収束保証を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:46:16 GMT)
A Light and Smart Wearable Platform with Multimodal Foundation Model for Enhanced Spatial Reasoning in People with Blindness and Low Vision [9.1] 盲目と低視力(pBLV)を持つ人々は、限られた視覚的手がかりのために、環境をナビゲートし、オブジェクトを見つけるのに苦労している、重大な課題に直面しています。
視覚障害者のための現在のマルチモーダル大言語(MLLM)モデルでは、これらのタスクを効果的に支援するために必要な空間推論機能が欠如している。
視覚障害者を対象とした空間拡張型多モーダル大規模言語モデルを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:32:25 GMT)
LDIR: Low-Dimensional Dense and Interpretable Text Embeddings with Relative Representations [9.0] 我々はDense and Interpretable text embeddeds with Relative representations (LDIR)を提案する。
その次元の数値は、最遠点サンプリングを通して異なるアンカーテキストと意味的関連性を示す。
LDIRを複数の意味的テキスト類似性、検索、クラスタリングタスクで検証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:48:09 GMT)
Deep Latent Variable Model based Vertical Federated Learning with Flexible Alignment and Labeling Scenarios [9.0] フェデレートラーニング(FL)は、プライベートデータを公開せずに協調学習を可能にすることで大きな注目を集めている。
任意のアライメントとラベリングシナリオ下でのトレーニングと推論の両方に対応可能な統合フレームワークを提案する。
本手法は, 上位の競合相手に対して平均9.6ポイントの差がある160例において, 全ベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:30:15 GMT)
VitaGraph: Building a Knowledge Graph for Biologically Relevant Learning Tasks [9.0] 複数の公開データセットの統合と精錬によって構築された包括的生物学的知識グラフを提案する。
得られたリソースは、計算生物学と精密医療の研究を進めるための最先端のプラットフォームとして機能する、一貫性があり信頼性の高い生物学的知識グラフである。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:43:04 GMT)
FLOW-BENCH: Towards Conversational Generation of Enterprise Workflows [8.9] 本稿では,(i)FLOW-BENCH,(i)FLOW-BENCH,(i)NLベースのBPAツールを評価するための高品質な自然言語命令と構造化ビジネスプロセス定義のデータセット,(ii)FLOW-GEN,(ii)LLMを用いて自然言語をPython構文の中間表現に変換するアプローチについて述べる。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:14:19 GMT)
No Gold Standard, No Problem: Reference-Free Evaluation of Taxonomies [8.9] 品質評価のための基準フリーメトリクスを2つ導入する。
1つ目は、意味的類似性と分類学的類似性との相関を計算して頑健性を評価する。
2つ目は、論理的妥当性を評価するために自然言語推論を使用する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:25:40 GMT)
Balancing LoRA Performance and Efficiency with Simple Shard Sharing [8.8] textbfOptimal textbfShard textbfIntegration in textbfLoRAは、単純なシャード共有機構を通じて、このトレードオフに対処する新しいPEFTアプローチである。
Fossilsは、標準的なLoRAと、その顕著な変種を、モデルパフォーマンスメトリクスと計算効率の両方で大幅に上回っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:21:57 GMT)
Massive-STEPS: Massive Semantic Trajectories for Understanding POI Check-ins -- Dataset and Benchmarks [8.8] 重み付きSTEPS(POIチェックイン理解のための主観的意味軌道)を提示する。
Massive-STEPSは、Semantic Trailsデータセット上に構築された、大規模で一般公開されたベンチマークデータセットである。
大規模STEPSは地理的に多様な12の都市にまたがっており、以前のデータセットよりも最新の、文化的に多様なモデルが特徴である。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:29:18 GMT)
Topology-Aware Knowledge Propagation in Decentralized Learning [8.7] 本研究では,デバイス間におけるアウト・オブ・ディストリビューション(OOD)知識の伝播について検討する。
一般的な分散学習アルゴリズムは、OODの知識をすべてのデバイスに効果的に広めるのに苦労している。
デバイス間のOOD知識の伝播を促進するためのトポロジ対応アグリゲーション戦略を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:53:33 GMT)
MultiLink: Multi-class Structure Recovery via Agglomerative Clustering and Model Selection [8.7] ノイズや外乱によって汚染されたデータセットにおいて,異なるクラスの複数の構造を復元する問題に対処する。
我々は,複数のモデルのクラスを同時に扱うMultiLinkという新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:32:02 GMT)
Distance-based measures and Epsilon-measures for measurement-based quantum resources [8.6] 量子資源理論は、量子資源を定量化するための構造化されエレガントな枠組みを提供する。
量子状態や測定値の集合が部分的にしか知られていない現実的なシナリオでは、従来のリソース測度はリソースの内容の取得に不足することが多い。
エプシロン測定は堅牢な代替手段であり、特に貴重である。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:56:28 GMT)
Navigating the Alpha Jungle: An LLM-Powered MCTS Framework for Formulaic Factor Mining [8.5] 本稿では,大規模言語モデル (LLM) とモンテカルロ木探索 (MCTS) を統合する新しいフレームワークを提案する。
重要な革新は、MCTS探究のガイダンスであり、各候補因子の金銭的バックテストから、豊かで定量的なフィードバックによってである。
実世界の株式市場データを用いた実験結果から, LLMをベースとしたフレームワークは, 予測精度, 取引性能, 解釈性の向上とともに, より効率的なアルファマイニングソリューションを提供することにより, 既存の手法よりも優れた性能を示すことが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:14:17 GMT)
EcoSafeRAG: Efficient Security through Context Analysis in Retrieval-Augmented Generation [8.5] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の静的知識制限を補う
ギャップを埋めるために、EcoSafeRAGは文レベルの処理とベイト誘導コンテキストの多様性検出を使用する。
実験によると、EcoSafeRAGはプラグインとプレイのデプロイで最先端のセキュリティを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:40:32 GMT)
ZeroTuning: Unlocking the Initial Token's Power to Enhance Large Language Models Without Training [8.5] 初期トークンの注意の調整は、その後のトークンよりも注意分布を鋭くしたり、平らにすることを示す。
我々は、この特別なトークンに頭部特異的な注意調整を適用することにより、LCMの性能を向上させる訓練不要のアプローチであるZeroTuningを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:52:24 GMT)
Fast and Robust Localization for Humanoid Soccer Robot via Iterative Landmark Matching [8.5] 本稿では,ヒューマノイドロボットの反復的ランドマークマッチング(ILM)による高速でロバストなローカライズ手法を提案する。
提案手法の有効性を実験を通じて徹底的に評価し, ヒューマノイドロボットARTEMISで検証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:11:27 GMT)
MetaML-Pro: Cross-Stage Design Flow Automation for Efficient Deep Learning Acceleration [8.4] 本稿では、リソース制約のあるハードウェア上にディープニューラルネットワーク(DNN)をデプロイするための最適化戦略の体系化と自動化のための統一的なフレームワークを提案する。
提案手法は,2つの重要な問題に対処する: (i) カスタム最適化戦略のエンコードと (ii) クロスステージ最適化探索のエナリングである。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:40:23 GMT)
FairSHAP: Preprocessing for Fairness Through Attribution-Based Data Augmentation [8.4] 既存の前処理アプローチでは、不公平の原因となる機能やインスタンスを特定するための透過的なメカニズムが欠如している。
FairSHAPは、Shapley値の属性を利用して、個人とグループの両方の公正性を改善する新しい前処理フレームワークである。
モデルに依存しない透明な方法として、FairSHAPは既存の機械学習パイプラインにシームレスに統合し、バイアスの原因に関する実用的な洞察を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:48:19 GMT)
Explain What You Mean: Intent Augmented Knowledge Graph Recommender Built With LLM [8.4] Intent Knowledge Graph Recommender (IKGR)は、検索拡張生成と、知識グラフの構築と密度化のための符号化アプローチを活用する新しいフレームワークである。
IKGRは対話知識グラフから潜伏したユーザ・イテム親和性を学習し、相互の意図的接続を通じてさらに高密度化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:07:19 GMT)
TigerLLM -- A Family of Bangla Large Language Models [8.3] バングラ語モデルのファミリーであるTigerLLMを紹介します。
以上の結果から,これらのモデルがすべてのオープンソース代替品を上回り,GPT3.5のような大型のプロプライエタリモデルを上回る結果が得られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:08:08 GMT)
Securing Federated Learning against Backdoor Threats with Foundation Model Integration [8.2] フェデレートラーニング(FL)は、プライバシを保護しながら、分散モデルトレーニングを可能にする。
近年,ファンデーションモデル(FM)のFLへの統合により性能が向上したが,新たなバックドア攻撃機構が導入された。
FLにおけるバックドア攻撃とバックドア攻撃の両方に対処する新しいデータフリー防衛戦略を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:15:40 GMT)
PeerGuard: Defending Multi-Agent Systems Against Backdoor Attacks Through Mutual Reasoning [8.2] マルチエージェントシステムは、複雑なタスクを完了させたり、協力したり、競合したりする自律エージェントとして、高度なAIモデルを活用する。
重要性は増しているが、マルチエージェントシステムの安全性はいまだに未調査である。
本研究では,マルチエージェントシステムにおけるバックドア脆弱性を調査し,エージェントインタラクションに基づく防御機構を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:08:29 GMT)
An HCAI Methodological Framework (HCAI-MF): Putting It Into Action to Enable Human-Centered AI [8.1] 人間中心人工知能(Human-centered AI, HCAI)は、AIシステムの設計、開発、展開、使用において人間を優先する設計哲学である。
文学の隆盛にもかかわらず、その実践のための方法論的指導の欠如はHCAIの実践に課題をもたらしている。
本稿では,5つの主要コンポーネントからなる総合HCAI方法論フレームワーク(HCAI-MF)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:24:06 GMT)
MetaSym: A Symplectic Meta-learning Framework for Physical Intelligence [8.0] 本稿では,新しいディープラーニングフレームワークMetaSymを紹介する。
特に、MetaSymはシンプレクティックエンコーダと自己回帰デコーダから得られる強いシンプレクティックインダクティブバイアスをメタアテンションと組み合わせている。
この原理的な設計は、コアの物理的不変性を保ちつつ、フレキシブルでデータ効率の良いシステム不均一性への適応を可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:28:49 GMT)
Attention-Based Reward Shaping for Sparse and Delayed Rewards [7.8] 本研究では,アテンションに基づくリワードシェイピング(ARES)を提案する。
ARESは完全にオフラインでトレーニングでき、ランダムなアクションを取るエージェントによって生成された小さなデータセットやエピソードを使用しても意味のある形の報酬を生成することができる。
その結果、ARESは遅延した報酬設定での学習を著しく改善し、RLエージェントが非現実的な量のデータを必要とするシナリオでトレーニングしたり、さらには学習不可能なシナリオでトレーニングできることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:43:05 GMT)
Analyzing Patterns and Influence of Advertising in Print Newspapers [7.8] 本稿では,インド全土の印刷新聞の広告実践について,新しいデータ駆動アプローチを用いて検討する。
我々は,画像処理とOCR技術を用いて,印刷新聞のデジタル版から記事や広告を高精度に抽出するパイプラインを開発した。
この手法を、複数の地域と3つの言語にまたがる5つの人気新聞に適用し、数十万の広告を含む12,000以上のエディションのデータセットを収集した。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:05:53 GMT)
Visual Anomaly Detection under Complex View-Illumination Interplay: A Large-Scale Benchmark [7.6] M2AD(Multi-View Multi-Illumination Anomaly Detection)を導入する。
M2ADは、119,880の高解像度画像からなる大規模なベンチマークであり、VADの堅牢性を明示的に調査するために設計された。
現状のVAD手法は,M2ADにおいて極めて困難であり,ビューイルミネーションの相互作用によってもたらされる大きな課題が示される。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:46:23 GMT)
Bidirectional Information Flow (BIF) -- A Sample Efficient Hierarchical Gaussian Process for Bayesian Optimization [7.6] Bidirectional Information Flow (BIF)は、オンライントレーニングのための効率的なH-GPフレームワークである。
BIFは、オンライントレーニングのためのH-GPにおいて、親モデルと子モデル間の双方向情報交換を確立する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:26:03 GMT)
CARES: Comprehensive Evaluation of Safety and Adversarial Robustness in Medical LLMs [7.6] 医療における大規模言語モデル(LLM)の安全性を評価するためのベンチマークであるCARES(Clinical Adversarial Robustness and Evaluation of Safety)を紹介する。
CARESには、8つの医療安全原則にまたがる18,000以上のプロンプト、4つの有害レベル、4つのプロンプトスタイルがあり、悪意のあるユースケースと良心的なユースケースの両方をシミュレートしている。
我々の分析によると、多くの最先端のLSMは、有害なプロンプトを微妙に言い換えるジェイルブレイクに対して脆弱でありながら、安全で非典型的なクエリを過剰に再利用している。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:25:51 GMT)
CRISP: Clustering Multi-Vector Representations for Denoising and Pruning [7.6] ColBERTのようなマルチベクターモデルは、コンテキスト化されたトークンレベルの埋め込みによってクエリやドキュメントを表現することによって、最先端のパフォーマンスを提供する。
このオーバーヘッドを軽減するための一般的なアプローチは、モデルのフリーズベクターをクラスタ化することであるが、この戦略の有効性は、これらの埋め込みの固有のクラスタビリティによって制限される。
本稿では,エンドツーエンドのトレーニングプロセス内で,本質的にクラスタリング可能な表現を直接学習する,新しいマルチベクタトレーニング手法CRISPを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:26:16 GMT)
Covering Multiple Objectives with a Small Set of Solutions Using Bayesian Optimization [7.5] この問題のモチベーションの例としては、薬物設計が挙げられる。
本稿では,多目的被覆ベイズ最適化(MOCOBO)を提案する。
その結果,MOCOBOにより得られたKT溶液のカバレッジは,各目的を個別に最適化したT溶液のカバレッジと一致するか,ほぼ一致していることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:42:43 GMT)
Learning Multimodal AI Algorithms for Amplifying Limited User Input into High-dimensional Control Space [7.5] 現在の侵襲的補助技術は、重度麻痺患者の高次元運動制御信号を推定するために設計されている。
非侵襲的な代替手段は、しばしばアーティファクトを起こしやすい信号に依存し、長いユーザートレーニングを必要とし、厳密なタスクに対して堅牢な高次元制御を提供するのに苦労する。
本研究では、失われた運動機能に対するインテリジェント補償機構として、人間中心型マルチモーダルAIアプローチを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:31:40 GMT)
2DNMRGym: An Annotated Experimental Dataset for Atom-Level Molecular Representation Learning in 2D NMR via Surrogate Supervision [7.5] 2DNMRにおける機械学習に基づく表現学習のために設計された最初のアノテート実験データセットである2DNMRGymを紹介する。
2DNMRGymは、サロゲートの監視設定を採用する:モデルは、以前に検証されたメソッドからアルゴリズム生成アノテーションを使用して訓練される。
2Dおよび3D GNNおよびGNN変換器モデルを用いてベンチマーク結果を提供し、将来の作業の強力な基盤を確立する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:02:05 GMT)
PARSEC: Preference Adaptation for Robotic Object Rearrangement from Scene Context [7.4] PARSECは、観察されたシーンコンテキストからユーザの組織的嗜好を学習し、部分的に配置された環境にオブジェクトを置くためのベンチマークである。
ContextSortLMは、事前および現在のシーンコンテキストからのユーザの好みに適応することで、オブジェクトを部分的に配置した環境に配置する再構成モデルである。
以上の結果から,複数のシーン・コンテキスト・ソースを利用するパーソナライズド・アレンジメント・モデルの方が,単一のコンテキスト・ソースに依存するモデルよりも優れていることが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:40:44 GMT)
INSIGHT: Enhancing Autonomous Driving Safety through Vision-Language Models on Context-Aware Hazard Detection and Edge Case Evaluation [7.4] INSIGHTは、危険検出とエッジケース評価を強化するために設計された階層型視覚言語モデル(VLM)フレームワークである。
本手法は,マルチモーダルデータ融合を用いて意味表現と視覚表現を統合し,運転シナリオの正確な解釈を可能にする。
BDD100Kデータセットの実験結果は、既存のモデルよりもハザード予測の正確性と正確性を大幅に改善したことを示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:26:42 GMT)
Exploiting Radiance Fields for Grasp Generation on Novel Synthetic Views [7.3] 新規なビュー合成は, つかみポーズを生成する際に, 追加のコンテキストを提供できることを示す最初の結果を示す。
Graspnet-1billionデータセットに対する実験により、新しいビューが力量閉鎖の把握に寄与したことが示された。
将来的には、単一入力画像で構築した放射場からのグリップ抽出を改善するために、この作業を拡張できることを願っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:23:09 GMT)
Call for Rigor in Reporting Quality of Instruction Tuning Data [7.3] 研究は、インストラクションチューニング(IT)データの品質の重要性を強調している。
この実践から生じる潜在的な問題を実証し、データ品質を検証する上で慎重に検討する必要があることを強調する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:19:00 GMT)
Understanding and Characterizing Obfuscated Funds Transfers in Ethereum Smart Contracts [7.2] 詐欺契約は、DeFiとNFTエコシステムの台頭とともに急速に発展してきた。
本稿では,不正契約の金銭的リスクを,難読化がいかに増幅するかを系統的に検討する。
ObfProbeは、難読化テクニックを明らかにするためにバイトコードレベルのスマートコントラクト分析を実行するフレームワークである。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:42:51 GMT)
Is Grokking a Computational Glass Relaxation? [7.2] トレーニング性能がほぼ完璧に到達した後,ニューラルネットワークが突然一般化するグラッキング現象について検討する。
グラッキングの記憶-一般化遷移におけるNOエントロピー障壁は、グラキングを一階相転移と定義する以前の理論に挑戦する。
グラッキングの非平衡な性質に触発され、ワンランダウ分子動力学に基づくおもちゃのWanDを開発し、グラッキングを制約なく排除し、高ノルム一般化解を求めることができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:20:02 GMT)
Probing phase transition and underlying symmetry breaking via entanglement entropy scanning [7.2] 絡み合いは量子物理学において重要な役割を果たす。
多くのボディシステムからどれだけの情報を抽出できるかは、まだ未解決の問題だ。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:08:02 GMT)
Scaling Reasoning can Improve Factuality in Large Language Models [7.2] 複雑なオープンドメイン質問応答(QA)シナリオにおいて,大規模言語モデル(LLM)の推論を徹底的に検討する。
推論トレースを豊かにするために、我々は知識グラフからの事実情報を、推論トレースへの経路の形で導入する。
本研究は,1回の動作において,より小さな推論モデルにより,従来の命令調整モデルと比較して,実際の精度が顕著に向上することが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:39:33 GMT)
EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video [7.1] EgoDexは、これまでで最大かつ最も多様な人体操作のデータセットである。
ビデオの撮影時間は829時間で、3Dの手と指の追跡データをペアリングして記録する。
このデータセットは、194種類のテーブルトップタスクにおいて、日常的な家庭内オブジェクトとの多様な操作行動をカバーする。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:34:47 GMT)
SpecMemo: Speculative Decoding is in Your Pocket [7.1] 投機的復号化は本質的に、いくつかの候補トークンを生成するために余分なメモリ割り当てを犠牲にすることに依存する。
より微細なレベルでメモリ割り当てをスマートに制御できるSpecMemoというデバイス対応推論エンジンを提案する。
SpecMemoのメモリ管理では、MT-Benchでの投機的復号化から全体のスループットの96%を維持しています。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:12:29 GMT)
Quantum data generation in a denoising model with multiscale entanglement renormalization network [7.0] 我々は,様々な種類のNISQ量子プロセッサに適用可能な,高効率なノイズ耐性量子データ生成法を提案する。
具体的には、量子データ生成のためのマルチスケールエンタングルメント再正規化ネットワーク(MERA)に基づく量子復号化確率モデル(QDM)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:18:01 GMT)
RH: An Architecture for Redesigning Quantum Circuits on Quantum Hardware Devices [7.0] 本稿では,量子ハードウェア上での大規模量子回路の再設計を実現するアーキテクチャを提案する。
ランダムな量子回路モジュールを標準のEQ-GANフレームワークにプリプションすることで、量子状態学習からユニタリ変換学習までその能力を拡張する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:58:53 GMT)
CounterQuill: Investigating the Potential of Human-AI Collaboration in Online Counterspeech Writing [6.9] 我々は,人間とAIの協調システムであるCounterQuillを紹介した。
CounterQuillは、計算思考に基づく3段階のワークフローに従う。
我々の発見は、ユーザーがオンラインヘイトスピーチを認識し、反映し、反応する方法について、AIシステムがいかにユーザーを教育できるかを強調している。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:49:10 GMT)
Lower Bounds on Learning Pauli Channels with Individual Measurements [6.9] ダイアモンドノルムでパウリチャネルを学習するためのサンプル複雑性の低い境界を示す。
未知チャネルへの入力に絡み合った補助システムを使用しない戦略を検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:08:44 GMT)
ImprovNet -- Generating Controllable Musical Improvisations with Iterative Corruption Refinement [6.9] ImprovNetは、表現力と制御性のある即興演奏を生成するトランスフォーマーベースのアーキテクチャである。
ジャンル固有のスタイルでメロディーを調和させ、短期間の即時継続および補充タスクを実行することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:56:53 GMT)
Learning The Likelihood Test With One-Class Classifiers for Physical Layer Authentication [6.9] 物理層認証(PLA)機構では、受信したメッセージが正規のユーザまたは侵入者によって送信されたかどうかを検証者が判定する。
ニューラルネットワーク(NN)と1クラスの最小二乗サポートマシン(OSVM)モデルでそれをどのように行うかを示す。
我々は、人工データセットを必要とせずに、可能性テスト(LT)として動作するPLA検証器を訓練する修正勾配降下法(SGD)アルゴリズムを導出する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:11:50 GMT)
Noise Injection Systemically Degrades Large Language Model Safety Guardrails [6.8] 大規模言語モデル(LLM)の安全ガードレールは有害な出力を防ぐ重要な要素である。
本稿では,モデルアクティベーションにノイズを系統的に注入することにより,LLMの安全性向上のロバスト性について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:33:25 GMT)
A Fourier Space Perspective on Diffusion Models [6.8] 拡散モデルは、画像、オーディオ、タンパク質、材料などのデータモダリティに関する最先端の生成モデルである。
フーリエ空間における拡散モデルの前方過程の帰納バイアスについて検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:13:02 GMT)
Open-Source Multi-Viewpoint Surgical Telerobotics [6.8] 腹腔内に1つ以上の調整可能な視点を導入することで,外科医の新たな可視化・協調戦略を開拓できると推測した。
我々は,ハイパフォーマンスビジョンコンポーネントを統合し,da Vinci Research Kit制御ロジックを改良することにより,マルチビューポイント・マルチセンサーロボット手術システムを構築している。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:41:27 GMT)
A Local Polyak-Lojasiewicz and Descent Lemma of Gradient Descent For Overparametrized Linear Models [6.7] 正方形損失を学習した2層線形ニューラルネットワークの勾配降下に対する線形収束率を導出した。
我々の収束分析は、事前の結果を改善するだけでなく、ステップサイズに対するより良い選択を示唆している。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:57:22 GMT)
Enantiospecific Two-Photon Electric-Dipole Selection Rule of Chiral Molecules [6.7] エナンチオマーの識別は、化学や薬理学におけるキラル分子の研究において重要である。
多くの光学的アプローチは、3つのマイクロ波またはレーザービームによって誘導されるエナンチオ特異な環状電気-双極子遷移に依存する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:36:53 GMT)
Analog Foundation Models [6.6] アナログインメモリコンピューティング(AIMC)は、ニューラルネットワーク計算の速度と電力効率を改善するための有望な計算パラダイムである。
AIMCは、ノイズ計算や入力と量子化に関する厳密な推論といった基本的な課題を導入している。
低精度アナログハードウェア上で堅牢な適応と実行を実現するための,汎用的なスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:24:45 GMT)
Enhancing Network Anomaly Detection with Quantum GANs and Successive Data Injection for Multivariate Time Series [6.6] 本稿では,異常検出のためのQGANアーキテクチャを提案する。
データ再アップロードとSuDaIを統合することで、アプローチは古典的なデータを量子状態に効率的にマッピングする。
QGANは、異常検出において高いリコールとF1スコアとともに高い精度を達成し、古典モデルと比較して低いMSEを達成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:47:42 GMT)
Logo-LLM: Local and Global Modeling with Large Language Models for Time Series Forecasting [6.5] 時系列予測は複数のドメインで重要であり、時系列データはローカルパターンとグローバル依存関係の両方を示す。
大規模言語モデル(LLM)を時系列予測に適用する最近の手法は、LCMをブラックボックスエンコーダとして扱うことにより、この制限を継承する。
マルチスケールの時間的特徴を明示的に抽出し,モデル化する新しいLLMベースのフレームワークであるLogo-LLMを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:10:49 GMT)
Hybrid-Emba3D: Geometry-Aware and Cross-Path Feature Hybrid Enhanced State Space Model for Point Cloud Classification [6.5] 本稿では、幾何学的特徴結合とクロスパス特徴ハイブリッド化により強化された双方向マンバモデルであるHybrid-Emba3Dを提案する。
デザインされたコラボレーティブ・フィーチャー・エンハンサーはデュアルパス・ハイブリダイゼーションを採用し、局所的な突然変異やスパースキーシグナルを効果的に処理する。
実験結果から,モデルNet40では新たなSOTA分類精度が95.99%向上し,0.03Mが加わった。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:30:20 GMT)
Towards Low-Latency Event-based Obstacle Avoidance on a FPGA-Drone [6.5] 本研究は,FPGA加速器における衝突回避行動予測のための従来のRGBモデルに対して,イベントベースビジョンシステム(EVS)の性能を定量的に評価する。
EVSモデルは、RGBモデルと比較して、はるかに高い有効フレームレート(1kHz)、低時間時間(-20ms)、空間予測誤差(-20mm)を達成する。
これらの結果は、リアルタイム衝突回避のためのイベントベースのビジョンの利点を浮き彫りにして、リソース制約のある環境に展開する可能性を示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:20:01 GMT)
Context parroting: A simple but tough-to-beat baseline for foundation models in scientific machine learning [6.4] 物理系に適用された基礎モデルは正確な予測を与えることができるが、基礎となる物理の有意義な表現を開発できないことを示す。
代わりに、基礎モデルは、単純なゼロショット予測戦略である文脈パロットによって予測されることが多い。
テキストで訓練された大規模言語モデルを時系列予測のために再利用できる理由を説明する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:14:47 GMT)
Embedding-to-Prefix: Parameter-Efficient Personalization for Pre-Trained Large Language Models [6.4] 大規模言語モデル(LLM)は、文脈に関連のあるコンテンツを生成するのに優れている。
本研究では,LLMの隠れ表現空間にコンテキスト埋め込みを注入するパラメータ効率の高いEmbeding-to-Prefix(E2P)を提案する。
我々は2つの公開データセットとプロダクション環境でのE2Pの評価を行い、ペルソナチャットでの対話パーソナライゼーション、PENSにおける文脈的見出し生成、音楽とポッドキャストの大規模パーソナライゼーションについて検討した。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:34:25 GMT)
CTP: A hybrid CNN-Transformer-PINN model for ocean front forecasting [6.3] 本稿では,畳み込みニューラルネットワーク(CNN),トランスフォーマーアーキテクチャ,物理インフォームドニューラルネットワーク(PINN)を統合した新しい深層学習フレームワークを提案する。
南シナ海(SCS)と黒潮(KUR)地域の1993年から2020年にかけての実験結果から,一段・多段の予測において,最先端(SOTA)性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:00:11 GMT)
A Multi-scale Representation Learning Framework for Long-Term Time Series Forecasting [6.3] 長期時系列予測(LTSF)は、エネルギー消費や天気予報といった実用的な設定において幅広い用途を提供する。
この研究は、多粒度情報の最適部分利用を含むLTSFの重要な問題に直面している。
提案手法は,様々なスケールにわたる明瞭で同時的な予測を用いて,複雑な時間的ダイナミクスを適切に解き放つ。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:26:32 GMT)
Adaptive Robust Optimization with Data-Driven Uncertainty for Enhancing Distribution System Resilience [6.3] 極度の気象現象が電力システムに緊張を与え、純粋な反応の限界を露呈している。
本稿では,積極的なインフラ投資と反応応答を統合した三段階最適化フレームワークを提案する。
実データと合成データの両方に対する実験により,従来の2段階法よりも一貫して優れた結果が得られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:43:31 GMT)
Neural Importance Sampling of Many Lights [6.3] 局所的な情報に基づいて,シェーディングポイント毎の光選択分布を予測するニューラルネットワークを提案する。
本手法は多様で難易度の高いシーンにまたがって優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:23:34 GMT)
DMind Benchmark: Toward a Holistic Assessment of LLM Capabilities across the Web3 Domain [6.3] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて印象的なパフォーマンスを達成した。
DMind Benchmarkは、9つの重要なサブフィールドをカバーする総合的なWeb3指向評価スイートである。
評価対象はChatGPT, Claude, DeepSeek, Gemini, Grok, Qwenなど26モデルである。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:00:59 GMT)
Artifacts of Idiosyncracy in Global Street View Data [6.3] 都市レイアウトのような都市の慣用性は、世界中の28都市のストリートビューデータに偏りをもたらす可能性があることを示す。
そこで本稿では,都市におけるイディオコネラシーの理解を深めるために,そのような分布を評価する手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:40:53 GMT)
JamendoMaxCaps: A Large Scale Music-caption Dataset with Imputed Metadata [6.2] JamendoMaxCapsは、Jamendoプラットフォームから362,000以上のフリーライセンスのインストゥルメンタルトラックを備えた、大規模なミュージックキャプションデータセットである。
データセットには、最先端のキャプションモデルによって生成されたキャプションが含まれており、暗黙のメタデータで強化されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:57:01 GMT)
Blockchain-Enabled Decentralized Privacy-Preserving Group Purchasing for Energy Plans [6.1] グループ購入は、ディスカウントされたエネルギー計画のために特定のエネルギー提供者にスイッチ決定を調整することで、消費者の購買力を集約する新興パラダイムである。
伝統的に、グループ購入は信頼できる第三者によって仲介され、プライバシーと透明性の欠如に悩まされている。
本稿では、プライバシ保護ブロックチェーンとセキュアなマルチパーティ計算によって強化された、分散型プライバシ保護グループ購入の新たなパラダイムを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:26:15 GMT)
NeuSEditor: From Multi-View Images to Text-Guided Neural Surface Edits [6.0] NeuSEditorは、多視点画像から得られる暗黙の面をテキストガイドで編集する新しい方法である。
我々のアーキテクチャは、シーンを前景と背景に効率的に分離し、シーン固有の要素を変更することなく正確な修正を可能にする。
本手法は,連続的なデータセット更新やソースプロンプトの必要性を排除し,編集ワークフローを簡素化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:57:01 GMT)
A Plasticity-Aware Method for Continual Self-Supervised Learning in Remote Sensing [6.0] リモートセンシング(RS)における連続自己教師学習(CSSL)手法の注目度が高まっている。
既存のCSSLメソッドは、新しいタスクを学習しながら、破滅的な忘れを防ぐことに重点を置いている。
本稿では,タスクの逐次学習を目的とした新しいCSSL手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:19:25 GMT)
Benchmarking Critical Questions Generation: A Challenging Reasoning Task for Large Language Models [6.0] 批判的質問生成(CQs-Gen)の課題は、システムが仮定を公開し、議論における推論に挑戦する質問を生成できるようにすることにより、批判的思考を促進することである。
この領域への関心が高まっているにもかかわらず、適切なデータセットと自動評価基準の欠如によって進歩が妨げられている。
本研究は,システムの開発とベンチマークを支援するための総合的なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:08:04 GMT)
Channel coding against quantum jammers via minimax [6.0] 完全量子任意可変チャネル(FQAVC)の容量を、異なる共有リソースモデルの下で特徴付けるために、ミニマックスアプローチを導入する。
FQAVCの絡み合い支援と共有ランダム性支援能力は、一般の量子対向が存在する場合でも、対応する化合物チャネルのものと一致していることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:28:56 GMT)
Semantic Aware Linear Transfer by Recycling Pre-trained Language Models for Cross-lingual Transfer [6.0] SALTは、ターゲット言語からの埋め込みをリサイクルする新しい言語間移動技術である。
実験の結果,SALTは他のトランスファー手法よりも優れており,言語適応時の収束の高速化による損失の低減が期待できることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:30:22 GMT)
Potential failures of physics-informed machine learning in traffic flow modeling: theoretical and experimental analysis [5.9] 本研究では,交通流モデリングにおける物理インフォームド・機械学習(PIML)手法の性能について批判的に検討する。
実験により、物理残留物はLWRおよびARZベースのPIMLモデルの性能を劣化させることができることが明らかになった。
Courant-Friedrichs-Lewy (CFL) 条件をPIMLのデータセット適合性の指標として同定した。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:55:06 GMT)
A High-Performance Thermal Infrared Object Detection Framework with Centralized Regulation [5.9] 本稿では,CRT-YOLO(CRT-YOLO)と呼ばれる,高効率な熱物体検出フレームワークについて述べる。
提案モデルでは,高効率なマルチスケール赤外アテンションモジュールを統合した。
2つのベンチマークデータセットで行った実験は、我々のCRT-YOLOモデルが従来の手法よりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:43:24 GMT)
Gaussian Weight Sampling for Scalable, Efficient and Stable Pseudo-Quantization Training [5.9] PQT(Pseudo-quantization Training)は、完全量子化トレーニング(FQT)の課題に対処する。
我々は,最大1Bパラメータと300Bトークンを有するGPT2およびLlama2モデルの事前学習中に,重量サンプリングを伴うPQTが(3)安定であることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:14:12 GMT)
MatTools: Benchmarking Large Language Models for Materials Science Tools [5.9] MatToolsは2つの補完的なコンポーネントの上に構築されている。材料シミュレーションツールのQAベンチマークと、現実世界のツール使用ベンチマークだ。
QAベンチマークは69, QA225ペアで構成され、LLMが材料科学ツールを理解する能力を評価する。
実世界のベンチマークには49のタスク(138のサブタスク)が含まれており、材料プロパティの計算に機能的なPythonコードを生成する必要がある。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:43:05 GMT)
In-Model Merging for Enhancing the Robustness of Medical Imaging Classification Models [5.9] In-model merging(InMerge)を提案する。
異なるCNNアーキテクチャに対する本手法の有効性と有効性を示す。
提案したInMerge学習モデルは、典型的に訓練されたモデルをかなりのマージンで上回る。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:45:05 GMT)
Reachability Barrier Networks: Learning Hamilton-Jacobi Solutions for Smooth and Flexible Control Barrier Functions [5.8] 制御バリア関数(CBF)は、一般的な制御フレームワークに安全保証を付加する一般的な方法である。
物理インフォームドニューラルネットワーク(PINN)を用いて,ハミルトン・ヤコビ最適制御解の計算によりCBFのスムーズな近似を生成する。
我々は、RBNは低次元において非常に正確であり、高次元における標準的な神経CBFアプローチよりも安全であることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:30:13 GMT)
Efficient End-to-End Learning for Decision-Making: A Meta-Optimization Approach [5.8] 本稿では,最適化問題を近似する効率的なアルゴリズムを学習するメタ最適化手法を提案する。
我々は,学習方法の指数収束,近似保証,一般化境界を証明した。
この手法は計算効率に優れ、高品質な近似を高速に生成し、既存の手法と比較して問題の大きさでスケールする。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:27:50 GMT)
Dual-Balancing for Physics-Informed Neural Networks [5.8] 偏微分方程式(PDE)を解くための新しい学習パラダイムとして、物理情報ニューラルネットワーク(PINN)が登場した。
PINNは、難解な多目的最適化の問題のため、精度が悪く、収束が遅い。
本稿では,バランシングとイントラバランシングを統合し,損失重みを動的に調整する新しいDual-Balanced PINN(DB-PINN)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:00:54 GMT)
Deepfake Forensic Analysis: Source Dataset Attribution and Legal Implications of Synthetic Media Manipulation [5.8] Generative Adrial Networks (GANs) が生成する合成メディアは、認証の検証とデータセットの起源のトレースに課題を提起する。
本稿では,GAN生成画像のトレーニングデータセット(例えば CelebA や FFHQ)を解釈可能な特徴解析により識別する新しい法医学的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:47:18 GMT)
Rethinking the Mean Teacher Strategy from the Perspective of Self-paced Learning [5.7] 半監督的医用画像分割は手作業によるアノテーションのコスト削減の可能性から注目されている。
本研究では,教師データに対するMT戦略を,時間的ラグ型教師モデルと地上の真理ラベルとの出力合意によって制御されたセルフペースト学習の形式として再解釈する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:14:06 GMT)
Bipartite reweight-annealing algorithm of quantum Monte Carlo to extract large-scale data of entanglement entropy and its derivative [5.7] 我々はR'enyiエンタングルメントエントロピー(EE)の大規模データを抽出できる量子モンテカルロスキームを提案する。
我々は、相転移点と臨界指数を決定するのに強力であることが証明されたEEの多くの倍数(sim beta Ld$, d は空間次元)を得る。
次に、EEとそのデリバティブを用いて相転移点、臨界指数、および様々な相を見つける可能性を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:38:33 GMT)
STEP: A Unified Spiking Transformer Evaluation Platform for Fair and Reproducible Benchmarking [5.7] スパイキングトランスフォーマーは、スパイキングニューラルネットワークの効率と自己注意の表現力を組み合わせるための有望なアーキテクチャとして登場した。
分類,セグメンテーション,検出など,幅広いタスクをサポートするスパイキングトランスフォーマー用の統一ベンチマークフレームワークを提案する。
本研究では, スパイク空間, ビット幅, メモリアクセスを考慮したエネルギー推定モデルを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:50:14 GMT)
AW-GATCN: Adaptive Weighted Graph Attention Convolutional Network for Event Camera Data Joint Denoising and Object Recognition [5.7] イベントカメラは、必須のオブジェクト構造を超えた大量の冗長でノイズの多いデータを生成する。
本稿では,イベントベースオブジェクト認識のための適応グラフベースノイズデータ除去フレームワークを提案する。
提案手法は,正規化密度解析,多因子エッジ重み付け機構,適応グラフに基づく認知戦略に基づく適応イベントセグメンテーションを統合する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:26:00 GMT)
Cell Library Characterization for Composite Current Source Models Based on Gaussian Process Regression and Active Learning [5.6] 高精度な要求、大量のデータ、広範囲なシミュレーションコストは、CCSの特徴付けに深刻な課題をもたらす。
本稿では,アクティブラーニング(AL)を用いた新しいガウスプロセス回帰(GPR)モデルを導入し,評価フレームワークを効率的かつ正確に構築する。
提案手法は, 平均絶対誤差2.05 ps, 電流波形2.27%, 電圧, 温度 (PVT) 角, TSMC 22nm 角に対して平均絶対誤差2.05 ps, 相対誤差2.27%を達成し, 従来の商用ツール, 学習ベースアプローチよりも優れていた。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:24:41 GMT)
User-centric Vehicle-to-Grid Optimization with an Input Convex Neural Network-based Battery Degradation Model [5.6] バッテリー劣化とV2G収益のバランスをとるために,多目的最適化に基づくデータ駆動型V2G手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:42:00 GMT)
A Review on Discriminative Self-supervised Learning Methods in Computer Vision [5.6] 自己教師付き学習(SSL)はコンピュータビジョンにおける変革的アプローチとして急速に発展してきた。
本稿では,人間のラベルを必要としないプレテキストタスクを解くことによって,表現の学習に焦点を当てた識別的SSL手法の包括的分析を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:08:40 GMT)
Relative Overfitting and Accept-Reject Framework [5.5] 性能上の利点と欠点のあるモデルの違いについて検討する。
その補完的な強みに基づいて、アプリケーションフレームワークであるAccept-Rejectを提案しました。
メインストリームアーキテクチャと事前学習されたメインストリームモデルに基づいた自己構築モデルを使用して、アプローチを検証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:05:07 GMT)
Covariance Density Neural Networks [5.4] グラフニューラルネットワークは、ネットワークデータのモデル化と予測方法を再定義した。
シグナルをモデル化する基盤となる正しいグラフ構造を選択することには、コンセンサスがない。
我々は,脳波脳波画像分類において,被験者に依存しない脳波脳波画像分類において高い性能が得られることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:38:13 GMT)
Accelerating Parameter Initialization in Quantum Chemical Simulations via LSTM-FC-VQE [5.4] 我々はLong Short-Term Memory Neural Networkを用いて量子化学シミュレーションを高速化する。
LSTMを小さな分子から最適化されたパラメータで訓練することにより、モデルはより大きなシステムに対する高品質な初期化を予測することを学ぶ。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:19:00 GMT)
Optimal Control for Transformer Architectures: Enhancing Generalization, Robustness and Efficiency [5.4] 最適制御理論の観点からトランスフォーマーを考察し、連続時間定式化のツールを用いて、トレーニングとアーキテクチャ設計に関する実用的な洞察を導出する。
このフレームワークは、一般化や堅牢性を含む望ましい理論的保証を提供しながら、既存のTransformerモデルの性能を改善している。
我々は,テキスト生成,感情分析,画像分類,点雲分類を動機とするタスクについて,広範囲にわたる7つの実験を行った。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:31:10 GMT)
A Cautionary Tale on Integrating Studies with Disparate Outcome Measures for Causal Inference [5.3] 本稿では,異なる結果尺度と研究を統合することで効率が向上するかどうかを考察する。
両指標をリンクする3つの仮定(強度の程度が異なる)を導入する。
本研究は,異なる結果のデータセットを融合させる際に,適切な仮定選択の必要性を強調した。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:08:28 GMT)
TANTE: Time-Adaptive Operator Learning via Neural Taylor Expansion [5.3] 適応的なステップサイズで連続時間予測を生成する演算子学習フレームワークを提案する。
TANTEはテイラー展開を現在の状態に実行することで将来の状態を予測し、ニューラルネットワークは高次の時間微分と局所収束半径の両方を学ぶ。
これにより、ソリューションのローカルな振る舞いに基づいて、モデルがロールアウトを動的に調整できる。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:27:25 GMT)
GenKnowSub: Improving Modularity and Reusability of LLMs through General Knowledge Subtraction [5.2] 本稿では,一般的な知識とタスク固有の適応の絡み合いを解消するモジュラーフレームワークを提案する。
各タスク固有モジュールからこの一般知識成分を抽出することにより、タスク関連情報にのみ焦点をあてた残余モジュールを得る。
Phi-3モデルと標準Arrowをベースラインとして研究した結果,一般知識を用いて一貫した性能向上が得られることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:23:59 GMT)
FALCON: False-Negative Aware Learning of Contrastive Negatives in Vision-Language Pretraining [5.2] 我々は、ハードと偽の負のトレードオフのバランスをとる学習ベースのミニバッチ構築戦略であるFALCONを提案する。
FALCONは、ミニバッチ構築中に各アンカーインスタンスの適切な硬さの負のサンプルを動的に選択する負のマイニングスケジューラを使用している。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:50:05 GMT)
Density Ratio-based Causal Discovery from Bivariate Continuous-Discrete Data [5.1] 連続変数の条件密度比の単調性を分析することによって因果方向を決定する新しい手法を提案する。
我々の理論的解析は、連続変数が離散変数を引き起こすとき条件密度比が単調性を示すが、逆方向ではないことを示す。
この特性は、異なるタイプの変数間の因果方向を、強い分布仮定や情報内容の違いから生じる偏見を伴わずに比較するための、原則化された基礎を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:34:04 GMT)
DRA-GRPO: Exploring Diversity-Aware Reward Adjustment for R1-Zero-Like Training of Large Language Models [5.1] 本稿では,報酬計算に意味的多様性を明示的に組み込む手法である$textitDiversity-aware Reward Adjustment$ (DRA)を提案する。
DRAは、サブモジュール・ミューチュアル・インフォメーション(SMI)を使用して、冗長な補完を減らし、様々なものに対する報酬を増幅する。
最先端のパフォーマンスを平均58.2%の精度で達成し、微調整サンプルは7000点、訓練費は約55ドルだった。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:35:33 GMT)
Where You Place the Norm Matters: From Prejudiced to Neutral Initializations [5.1] バッチ正規化(Batch Normalization)やレイヤ正規化(Layer Normalization)といった正規化レイヤは、現代のニューラルネットワークの中心的なコンポーネントである。
本研究では,隠れ層内の正規化の存在と配置が,学習開始前のネットワーク予測の統計的特性に与える影響について検討する。
我々の研究は、正規化が早期訓練行動にどのように影響するかを原則的に理解し、より制御され、解釈可能なネットワーク設計のためのガイダンスを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:38:30 GMT)
Programmable metasurfaces for future photonic artificial intelligence [5.1] フォトニックニューラルネットワーク(PNN)は、エネルギー効率、レイテンシ、スループットの観点から、従来のデジタルニューラルネットワークに挑戦する可能性がある。
本稿では,フィールドプログラマブルなメタ曲面技術が,スケーラブルなフォトニックAIアクセラレータを実現する上で重要なハードウェア要素となる可能性について論じる。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:50:01 GMT)
Exact multiple anomalous mobility edges in a flat band geometry [5.0] 異常なモビリティエッジは、準周期系における新たな局在化遷移の形式を表す。
平面バンドモデルの幾何学的構造を利用して正確なAMEを構築する
本研究は,準周期系におけるAMEの存在と特性に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:44:19 GMT)
Whitened Score Diffusion: A Structured Prior for Imaging Inverse Problems [5.0] 標準スコアの代わりに白色スコア関数を学習する新しいSDEベースのフレームワークであるWhitened Score(WS)拡散モデルを提案する。
WS DM は任意のガウス雑音に対して FM と等価性を確立し、スペクトル誘導バイアスを調整可能とし、構造的雑音を伴う逆問題を撮像するための強いベイズ偏差を与える。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:29:57 GMT)
StRuCom: A Novel Dataset of Structured Code Comments in Russian [5.0] StRuComはロシアのコードドキュメンテーション用に設計された最初の大規模データセットである。
ロシアのGitHubリポジトリからの人によるコメントと合成生成されたコメントを組み合わせることで、Python、Java、JavaScript、C#、Go標準への準拠を保証する。
StRuCom上のQwen2.5-Coderモデル(0.5B-7B)は、ベースラインモデル上でのchrf++とBERTScoreの統計的に有意な改善を示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:22:07 GMT)
A Multi-modal Fusion Network for Terrain Perception Based on Illumination Aware [5.0] 道路地形は自動運転車(AV)の運転安全確保に重要な役割を担っている
カメラやライダーを含む既存のAVセンサーは、照明や気象条件の変化に影響を受けやすい。
本稿では,外受容と固有受容の両面を利用した照明対応多モード核融合ネットワーク(IMF)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:02:22 GMT)
Head-Tail-Aware KL Divergence in Knowledge Distillation for Spiking Neural Networks [4.9] エネルギー効率のよい計算手法としてスパイキングニューラルネットワーク(SNN)が登場している。
SNNは、ニューラルネットワーク(ANN)と比較して、しばしばパフォーマンスギャップを示す
論文参考訳(メタデータ) (Fri, 16 May 2025 15:19:42 GMT)
ReaCritic: Large Reasoning Transformer-based DRL Critic-model Scaling For Heterogeneous Networks [4.9] ヘテロジニアスネットワーク(HetNets)は、多様なユーザ要件と時間変化のある無線条件のために、インテリジェント管理において重要な課題を提起する。
本稿では,ReaCriticを提案する。ReaCriticは,Deep Reinforcement Learningに推論能力をもたらす,大きな推論変換に基づく批判モデルスケーリングスキームである。
幅広い値ベースおよびアクタークリティカルなDRLアルゴリズムと互換性があり、動的無線環境における一般化を促進する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:42:08 GMT)
Beyond CVaR: Leveraging Static Spectral Risk Measures for Enhanced Decision-Making in Distributional Reinforcement Learning [4.8] 金融、ヘルスケア、ロボティクスといった分野では、最悪のシナリオを管理することが重要です。
分散強化学習(DRL)は、リスク感受性を意思決定プロセスに組み込む自然な枠組みを提供する。
より広範な静的スペクトルリスク対策(SRM)を最適化する収束保証付きDRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:53:05 GMT)
Yet Another Diminishing Spark: Low-level Cyberattacks in the Israel-Gaza Conflict [4.8] イスラエル・ガザ紛争において、低レベルのサイバー犯罪俳優によるWebの偽装とDDoS攻撃の実証的証拠を報告した。
我々の定量的測定は、ハマス主導の攻撃とその後の宣戦布告によるサイバー攻撃の即時増加を示している。
ロシアによるウクライナ侵攻の余波に類似したパターンが見られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:01:57 GMT)
SecReEvalBench: A Multi-turned Security Resilience Evaluation Benchmark for Large Language Models [4.8] 本稿ではSecReEvalBench, Security Resilience Evaluation Benchmarkを紹介する。
Prompt Attack Resilience Score、Prompt Attack Refusal Logic Score、ChainベースのAttack Resilience Score、ChainベースのAttack Rejection Time Scoreの4つの新しいメトリクスを定義している。
また、中立的なプロンプトと悪意のあるプロンプトの両方を組み込んだ、ベンチマーク用にカスタマイズされたデータセットも導入しています。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:34:44 GMT)
Anti-aliasing of neural distortion effects via model fine tuning [4.8] 本稿では,教師による微調整手法を用いて,ニューラルモデルにおけるエイリアスを低減する手法を提案する。
本手法は長期記憶ネットワーク(LSTM)と時間畳み込みネットワーク(TCN)のエイリアス化を著しく抑制することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:40:33 GMT)
SurgPose: Generalisable Surgical Instrument Pose Estimation using Zero-Shot Learning and Stereo Vision [4.7] 本稿では,手術器具に対する6自由度ポーズ推定パイプラインを提案する。
私たちはFoundationPoseやSAM-6Dといった最先端のゼロショットRGB-Dモデルを活用しています。
ロボットによる最小侵襲手術におけるゼロショットRGB-Dポーズ推定のための新しいベンチマークを設定した。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:58:03 GMT)
Rethinking Optimal Verification Granularity for Compute-Efficient Test-Time Scaling [4.7] テストタイムスケーリング(TTS)は,大規模言語モデル(LLM)の推論能力の向上に有効であることが証明された。
検証は,(1)推論性能と(2)計算効率に影響を与えると同時に,TTSにおいて重要な役割を担っている。
本稿では、ビーム探索を一般化する統一アルゴリズムである可変粒度探索(VG-Search)と、可変粒度パラメータgによるベストオブNサンプリングを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:24:48 GMT)
Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning [4.7] この研究は、訓練されたモデルによる物理場の生成における物理方程式の相当な相違に直面する。
HMT-PFという名称の物理場生成モデルは、ハイブリッドのMamba-Transformerアーキテクチャに基づいて開発されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:40:56 GMT)
Developing and Integrating Trust Modeling into Multi-Objective Reinforcement Learning for Intelligent Agricultural Management [4.7] 本研究は、RLに基づく農業経営における透明性、ユーザビリティ、信頼に焦点を当てている。
我々は、AIベースの受精戦略に対する農家の信頼度を定量化する新しい数学的モデルを開発するために、確立された信頼枠組みを採用している。
従来の方法とは異なり、私たちのアプローチは信頼を直接ポリシーの最適化に組み込んでおり、技術的に堅牢で経済的に実現可能で、コンテキスト対応で、社会的に受け入れられるAIレコメンデーションを保証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:52:16 GMT)
Benchmarking Spatiotemporal Reasoning in LLMs and Reasoning Models: Capabilities and Challenges [4.7] 本稿では,Large Language Models (LLMs) とLarge Reasoning Models (LRMs) を3段階の推論複雑性で体系的に評価する。
モデルが直接、あるいはPython Code Interpreterによって応答する26の課題をキュレートします。
LRMは、様々な難易度を持つタスク間で堅牢なパフォーマンスを示し、しばしば従来の第一原理に基づく手法と競合する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:32:35 GMT)
Automating High Quality RT Planning at Scale [4.7] 高品質な処理計画を生成するスケーラブルなソリューションであるAIRTP(Automated Iterative RT Planning)システムを紹介した。
当社のAIRTPパイプラインは,OAR(Organ-at-risk Contouring),ヘルパー構造生成,ビーム設定,最適化,計画品質改善など,臨床ガイドラインに準拠し,重要なステップを自動化します。
計画品質の比較分析により、自動パイプラインが手作業で生成されたものと同等の品質の処理計画を生成することが明らかになった。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:24:06 GMT)
Nosy Layers, Noisy Fixes: Tackling DRAs in Federated Learning Systems using Explainable AI [4.6] フェデレートラーニング(FL)は、協調モデルトレーニングの強力なパラダイムとして登場した。
データレコンストラクション攻撃(DRA)に弱い。
DRArmorは、DRAのターゲット検出と緩和戦略とExplainable AIを統合した、新しい防御機構である。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:28:15 GMT)
OT Score: An OT based Confidence Score for Unsupervised Domain Adaptation [4.5] 本稿では,新しい理論解析から得られた信頼度尺度である最適輸送(OT)スコアを紹介する。
OTスコアは,様々な適応シナリオにおいて,既存の信頼度を著しく上回ることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:09:05 GMT)
Automatic Speech Recognition for African Low-Resource Languages: Challenges and Future Directions [4.5] アフリカにおける低資源言語は、研究と実践の双方において、著しく過小評価されている。
本研究では,これらの言語に対するASRシステムの開発に支障をきたす主要な課題について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:57:39 GMT)
POCAII: Parameter Optimization with Conscious Allocation using Iterative Intelligence [4.5] POCAIIはハイパーパラメータ最適化予算を管理するフレキシブルなスキームである。
低予算なハイパーパラメータ最適化方式では優れた性能を示す。
現実世界の問題への幅広い応用がある。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:05:07 GMT)
GLOVA: Global and Local Variation-Aware Analog Circuit Design with Risk-Sensitive Reinforcement Learning [4.5] GLOVAは、PVT変動に対するロバスト性を改善するために、多様なランダムミスマッチの影響を効果的に管理するアナログ回路サイズフレームワークである。
GLOVAはサンプル効率の最大80.5$times$改善と76.0$times$時間短縮を実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:05:45 GMT)
Investigating Language Preference of Multilingual RAG Systems [4.4] MRAGシステムは、クエリとドキュメント間の言語的バリエーションによって、関連する情報を取得するのに苦労する。
本稿では,翻訳された多言語パスを相補的なモデル知識で融合するフレームワークであるDual Knowledge Multilingual RAGを提案する。
実験結果から,DKM-RAGは言語嗜好を緩和し,多様な言語環境における性能向上を図っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:51:11 GMT)
Automated Synthesis of Fault-Tolerant State Preparation Circuits for Quantum Error Correction Codes [4.3] 任意のCSSコードに対するフォールトトレラントな状態準備回路の自動化手法を提案する。
距離3を超える非決定論的状態準備回路の一般構成を提供する。
結果として得られたメソッドは、ミュンヘン量子ツールキットの一部として公開されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:27:21 GMT)
Simple and Effective Specialized Representations for Fair Classifiers [4.3] 本稿では,特徴関数距離に基づく公平な分類手法を提案する。
特徴関数を利用することで,従来の手法に比べて安定で効率的な解が得られる。
本手法はロバスト性および計算効率を保ち,実世界の応用のための実用的な解法である。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:59:46 GMT)
Benchmarking Unsupervised Online IDS for Masquerade Attacks in CAN [4.3] CAN(Vehicular Control Area Network)は、悪意のある敵によるマスクレード攻撃の影響を受けやすい。
我々は,CANにおけるマスクレード攻撃に対する4種類の非深層学習(DL)に基づく非教師なしオンライン侵入検知システム(IDS)のベンチマーク研究を紹介する。
ベンチマークしたIDSは全ての攻撃タイプを検出するには有効ではないが,時系列クラスタの階層構造の変化を検出する手法が最適であることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:44:43 GMT)
Mixture of Routers [4.2] 我々は、Mixture of Routers (MoR) と呼ばれる効率的な微調整法を提案する。
MoRはジョイントセレクションに複数のサブルータを使用し、学習可能なメインルータを使用してサブルータの重みを決定する。
その結果、MoRは、ほとんどのタスクにおいてベースラインモデルよりも優れており、平均的なパフォーマンス改善は1%であることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:18:06 GMT)
Unveiling the Black Box: A Multi-Layer Framework for Explaining Reinforcement Learning-Based Cyber Agents [4.2] RLをベースとした攻撃者に対する統一的多層説明可能性フレームワークを提案する。
MDPレベルでは、サイバー攻撃を部分的に観測可能なマルコフ決定プロセス(POMDP)としてモデル化する。
政策レベルでは、Q値の時間的進化を分析し、優先体験再生(PER)を用いて批判的な学習遷移を表面化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:29:55 GMT)
CLT and Edgeworth Expansion for m-out-of-n Bootstrap Estimators of The Studentized Median [4.2] m-out-of-nブートストラップはmサブサンプルをnサイズの元のサンプルから置き換えることなく繰り返し描画することで統計量の分布を近似する。
エコノメトリ、バイオ統計学、機械学習にまたがる幅広い適用性にもかかわらず、ブートストラップの音質に対する厳密なパラメータなし保証はいまだに解明されていない。
本稿では,n 個のデータセットの m-of-n 再サンプリングから得られたサンプル定量値の推定器を解析することにより,そのような保証を確立する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:14:49 GMT)
Can Authorship Attribution Models Distinguish Speakers in Speech Transcripts? [4.1] オーサシップ検証は、2つの異なる書き込みサンプルが同じ著者を共有するかどうかを決定するタスクである。
本稿では,新たな課題を提起する書き起こし音声の属性について考察する。
そこで本研究では,人間が書き起こした会話音声の書き起こしに焦点をあてた話者属性のための新しいベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:04:56 GMT)
Analytical Fidelity Calculations for Photonic Linear Cluster State Generation [4.1] 我々は,線形クラスタ状態を生成するプロトコルのプロセスを通じて,大域密度行列を追跡するアルゴリズムを開発した。
本研究では,3光子および7光子線形クラスター状態に対する準ユニティエンタングゲートの忠実度と準ユニティ状態忠実度が到達可能であることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:08:37 GMT)
Automated Identification of Logical Errors in Programs: Advancing Scalable Analysis of Student Misconceptions [4.1] 本稿では,学生のプログラミングソリューションにおける論理的誤りを自動的に検出するスケーラブルなフレームワークを提案する。
我々のフレームワークは、サブツリーベースアテンションニューラルネットワーク(SANN)による説明可能な抽象構文木(AST)埋め込みモデルに基づいている。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:32:51 GMT)
When Mitigations Backfire: Timing Channel Attacks and Defense for PRAC-Based RowHammer Mitigations [4.0] RH軽減効果を損なうことなくPRACによるタイミングチャネルを除去する防御であるTPRAC(Timing-Safe PRAC)を提案する。
評価の結果、TPRACは1024のRH閾値で3.4%のオーバヘッドしか発生せず、タイミングチャネルを閉じていることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:35:54 GMT)
Steering Risk Preferences in Large Language Models by Aligning Behavioral and Neural Representations [4.0] ステアリングベクトルを明らかにするための原理的アプローチを提案する。
我々は,大規模言語モデルから潜在リスクの選好を抽出することに注力する。
得られた操舵ベクトルが目標動作に合わせてLLM出力を正常かつ確実に変調することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:23:10 GMT)
Fine-Tuning Discrete Diffusion Models with Policy Gradient Methods [4.0] 非微分可能報酬に対する離散拡散モデルを微調整するための、効率的で、広く適用でき、理論的に正当化されたポリシー勾配アルゴリズムを提案する。
複数の離散的生成タスクに対する数値実験により,本手法のスケーラビリティと効率性を実証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:22:08 GMT)
Enhancing Low-Resource Minority Language Translation with LLMs and Retrieval-Augmented Generation for Cultural Nuances [4.0] 本研究では,Large Language Models (LLMs)とRetrieval-Augmented Generation (RAG)を統合することで,低リソース言語を翻訳する際の課題について検討する。
BLEUスコアは12% (辞書のみ) から31% (RAG with Gemini 2.0) まで様々である。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:59:14 GMT)
IRLBench: A Multi-modal, Culturally Grounded, Parallel Irish-English Benchmark for Open-Ended LLM Reasoning Evaluation [4.0] 本稿では、英語とアイルランド語を併用したIRLBenchについて紹介する。
私たちのベンチマークは、2024年のアイリッシュリービング認定試験から開発された12の代表的な被験者で構成されています。
モデルが有効なアイルランド語の応答を80%以下に抑え、正しい答えが55.8%であるのに対し、最高のパフォーマンスのモデルでは76.2%が英語である。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:02:05 GMT)
Probing Subphonemes in Morphology Models [3.9] 音素を直接訓練したトランスフォーマーにおける音韻的特徴符号化の言語に依存しない探索手法を提案する。
音素の埋め込みにおいて,トルコ語における最終音素発声のような局所的な音韻的特徴がよく捉えられるのに対し,母音調和のような長距離依存は変圧器のエンコーダで表現されるのがよいことを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:27:40 GMT)
Semantically-Aware Game Image Quality Assessment [3.9] 既存の非参照画像とビデオ品質評価法(NR-IQA/VQA)はゲーム環境に一般化できない。
本研究では,ゲームに適した NR-IQA モデルを提案する。
このモデルは、ゲーム固有の歪みを検出し定量化するために、知識蒸留されたゲーム歪み特徴抽出器を使用する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:12:19 GMT)
Relation Extraction Across Entire Books to Reconstruct Community Networks: The AffilKG Datasets [3.9] AffilKGは6つのデータセットの集合で、完全な書籍スキャンと大きなラベル付き知識グラフをペアにした最初のものである。
各データセットにはアフィリエイトグラフがあり、人と組織間のメンバ関係をキャプチャするシンプルなKGである。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:24:32 GMT)
ASR-FAIRBENCH: Measuring and Benchmarking Equity Across Speech Recognition Systems [3.9] ASR-FAIRBENCHのリーダーボードを導入し,ASRモデルの精度と等価性をリアルタイムで評価する。
提案手法は,人口集団間でのSOTA ASRモデルの性能格差を顕著に示し,より包括的なASR技術開発を促進するためのベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:31:31 GMT)
Superoscillating Quantum Control Induced By Sequential Selections [3.9] 弱測定の枠組み内での逐次選択によって実現された超振動量子制御プロトコルを提案する。
我々の研究成果は、様々な量子プラットフォームにまたがる超振動を用いた量子状態操作とウェーブ・パケット制御のための新しい道を開く。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:17:45 GMT)
Bayesian Inverse Problems Meet Flow Matching: Efficient and Flexible Inference via Transformers [3.9] 本研究では,複雑な後部分布から高速かつ柔軟なサンプリングを可能にするために,条件付きフローマッチングと変圧器ベースのアーキテクチャを統合する新しいフレームワークを提案する。
提案手法の有効性は, 単純な非線形モデル, 病気の動的フレームワーク, ダーシーフロー部分微分方程式の3つの問題に適用することによって実証される。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:52:08 GMT)
Predictive Models for Chronic Heart Failure [3.9] 慢性心不全(HF)の管理は、現代医療において重要な課題である。
本稿では,HFリスクのある患者を識別するための機械学習(ML)技術に基づく予測モデルを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:36:29 GMT)
Temporal fine-tuning for early risk detection [3.8] Web上の早期リスク検出(ERD)は、社会的および健康的な問題に直面しているユーザを素早く特定することを目的としている。
標準的な分類基準は十分ではなく、正確さと遅延を明示的に考慮する特定の指標に頼っている。
本稿では,時間を明示的に組み込むことで,トランスフォーマーモデルに基づくチューニングを可能にする,時間的微調整という,まったく異なる戦略を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:17:03 GMT)
Reinforcement Learning Closures for Underresolved Partial Differential Equations using Synthetic Data [3.8] 部分微分方程式(Partial Differential Equations)は、疫病から量子力学、金融市場まで幅広い現象を記述している。
近年の計算科学の進歩にもかかわらず、このようなPDEを現実世界のアプリケーションに適用するには、広範囲の時間スケールを解決する必要があるため、コストがかかる。
本稿では,製造ソリューションの手法を用いて得られた合成データを用いて,PDEのクロージャモデルを開発するためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:34:42 GMT)
Co-Evolutionary Defence of Active Directory Attack Graphs via GNN-Approximated Dynamic Programming [3.8] 我々は,Active Directoryにおける攻撃と防御の相互作用を,アダプティブアタックとプロアクティブディフェンダーの間のStackelbergゲームとしてモデル化する。
本稿では,GNNDP(Graph Neural Network Approximated Dynamic Programming)を併用して攻撃戦略をモデル化する,共進化型防衛フレームワークを提案する。
本フレームワークは,攻撃者や防御者の政策を洗練し,一般化を改善し,早期収束を防ぐ。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:37:50 GMT)
Inexact Column Generation for Bayesian Network Structure Learning via Difference-of-Submodular Optimization [3.8] 最先端のBNSLIPの定式化は、指数関数的に多くの変数と制約に悩まされる。
このような課題に対処するためのIPの標準的なアプローチは、行と列の生成テクニックを採用することである。
我々の行と列の生成アプローチは、最先端のスコアベースアプローチよりも高い品質のソリューションが得られることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:23:19 GMT)
Efficient Attention via Pre-Scoring: Prioritizing Informative Keys in Transformers [3.7] HyperAttentionは、単一レベルのLSHベースのクラスタリングと均一な残留サンプリングを組み合わせることで、競争効率を達成する。
本稿では,HyperAttentionが重要なキーの優先順位付けに役立てる前処理機構を提案する。
ChatGLM2(131kトークンコンテキスト)の実験では、コンプレックスが12から8.3に減少し、標準のHyperAttentionを上回っている。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:35:11 GMT)
CrypticBio: A Large Multimodal Dataset for Visually Confusing Biodiversity [3.7] 我々はCrypticBioについて紹介する。
iNaturalistのコミュニティアノテーターの間では、実際の種誤認の傾向から批判され、CrypticBioは67K種にまたがる52Kの独特な暗号グループを含んでいる。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:35:56 GMT)
Evaluating Design Decisions for Dual Encoder-based Entity Disambiguation [3.7] 本稿では、文脈ラベルの動詞化と効率的なハードネガティブサンプリングを含む文書レベルのデュアルモデルを提案する。
AIDA-Yagoに関する総合的な実験は、我々のアプローチの有効性を検証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:44:07 GMT)
Pretrained hybrid transformer for generalizable cardiac substructures segmentation from contrast and non-contrast CTs in lung and breast cancers [3.7] 放射線治療計画(RTP)のためのAI自動セグメンテーションは、トレーニングデータセットとは異なる特徴を持つ臨床ケースに適用した場合、劣化する可能性がある。
肺がんおよび乳癌患者の心下組織を分断するために, プレトレーニングしたトランスフォーマーをハイブリッドトランスフォーマー畳み込みネットワーク (HTN) に改良した。
HTNは, 画像, 患者特性の異なるCTからの心筋部分構造を, 確固たる精度(幾何学的, 線量的測定値)で示していた。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:48:33 GMT)
Resolving the Ambiguity of Complete-to-Partial Point Cloud Registration for Image-Guided Liver Surgery with Patches-to-Partial Matching [3.7] 画像ガイド下肝外科では,術前データと術中データとの整合が重要となる。
あいまいさを解決するために,プラグ・アンド・プレイモジュールとしてパッチ・ツー・パーティルマッチング戦略を提案する。
術中視認性に乏しい症例に対して, 登録成績の向上に有効かつ効果的であることが証明された。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:45:27 GMT)
Chatting with Papers: A Hybrid Approach Using LLMs and Knowledge Graphs [3.7] このデモでは、大規模な言語モデルと知識グラフを組み合わせて、コレクションによるナビゲーションをサポートする新しいワークフローのtextitGhostWriterが報告されている。
textitGhostWriterは、バックエンドの textitEverythingDataに基づいて、コレクションと'クエリとチャット'が可能なインターフェイスを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:51:51 GMT)
LD-Scene: LLM-Guided Diffusion for Controllable Generation of Adversarial Safety-Critical Driving Scenarios [3.7] LD-Sceneは、Large Language Models (LLMs)とLatent Diffusion Models (LDMs)を統合する新しいフレームワークである。
提案手法は,現実的な運転分布をキャプチャするLCMと,ユーザクエリを逆損失関数に変換するLCMベースのガイダンスモジュールを備える。
我々のフレームワークは、敵行動のきめ細かい制御を提供し、特定の運転シナリオに合わせたより効果的なテストを容易にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:41:05 GMT)
Enhancing Secrecy Energy Efficiency in RIS-Aided Aerial Mobile Edge Computing Networks: A Deep Reinforcement Learning Approach [3.6] 本稿では,再構成可能なインテリジェントサーフェス(RIS)支援無人航空機(UAV)モバイルエッジコンピューティング手法を提案する。
本稿では,航空MECの軌道,タスクオフロード分割,UE送信スケジューリング,RIS位相シフトを協調的に最適化する総合最適化手法を提案する。
数値計算の結果,提案手法はAMECエネルギーを保ちながら正常なタスクオフロードを効果的に保護できることが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:18:46 GMT)
X-Edit: Detecting and Localizing Edits in Images Altered by Text-Guided Diffusion Models [3.6] 実験結果から,X-Editはテキスト誘導拡散モデルによって修正された画像の編集を正確にローカライズすることが示された。
これは、高度な画像編集技術によって導入された操作を検出し、ピンポイントする堅牢な法医学ツールとしてのX-Editの可能性を強調している。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:29:38 GMT)
What Can We Learn From MIMO Graph Convolutions? [3.6] ほとんどのグラフニューラルネットワーク(GNN)は、グラフフーリエ領域から導出される一般グラフ畳み込みの近似を利用する。
我々は、多くの線形メッセージパッシングニューラルネットワークを一般化する局所グラフ畳み込み(LMGC)を導入する。
実験の結果,LMGCは様々な手法の利点を組み合わせられることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:13:09 GMT)
SpecEdge: Scalable Edge-Assisted Serving Framework for Interactive LLMs [3.4] 大規模言語モデル(LLM)は多くのモダンなアプリケーションに電力を供給するが、大規模で費用がかかり、リソースを消費する。
私たちは、エッジとサーバGPU間でLLMワークロードを分割する、エッジ支援推論フレームワークであるSpecEdgeを紹介します。
SpecEdgeはサーバのスループットを2.22倍にすることでコスト効率を1.91倍に向上し、サーバのみのベースラインに比べてトークン間のレイテンシを11.24%削減する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:17:59 GMT)
Infrastructure for AI Agents [3.4] AIエージェントはオープンな環境でインタラクションを計画し実行します。
多くの研究はエージェントの振る舞いの修正に重点を置いている。
エージェントインフラストラクチャの概念を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:02:38 GMT)
Have Multimodal Large Language Models (MLLMs) Really Learned to Tell the Time on Analog Clocks? [3.3] 画像上の複雑な疑問に答えられる多モーダル大規模言語モデルでは、アナログクロックの時間を知るのに苦労する。
これはおそらく、トレーニングセットの異なる時間におけるクロックによるイメージの欠如によるものだ。
本研究では、MLLMの抽象化と一般化の限界を説明するために、異なるクロックを持つテストにモデルを配置する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:04:34 GMT)
Uncertainty Quantification for Prior-Data Fitted Networks using Martingale Posteriors [3.3] 本論文では,マルティンゲール後部に基づく推定のためのベイズ後部構造を構築するための,原理的かつ効率的なサンプリング手法を提案する。
いくつかのシミュレーションおよび実世界のデータ例は、推論応用における我々の手法の不確かさの定量化を示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:47:43 GMT)
The Lazy Student's Dream: ChatGPT Passing an Engineering Course on Its Own [3.2] 本稿では,Large Language Models (LLMs) の制御系コースを成功させる能力について包括的に検討する。
現実的な学生の利用パターンをシミュレートする「最小限の努力」プロトコルの下で,ChatGPTを用いてLCMの性能を評価する。
我々の分析は、制御システム工学における数学的定式化、コーディングの課題、理論的概念を扱う際のAIの強みと限界に関する定量的洞察を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:45:08 GMT)
Humble your Overconfident Networks: Unlearning Overfitting via Sequential Monte Carlo Tempered Deep Ensembles [3.2] グラディエント・ハミルトン・モンテカルロの提案を逐次モンテカルロ法(SMC)に組み込むことにより,スケーラブルな変種を導入する。
我々のSMCSGHMCアルゴリズムは、画像分類、分布外検出、伝達学習タスクにおける勾配降下アンサンブルよりも優れている。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:10:04 GMT)
Fairness-Utility Trade-off via Wasserstein Projection [3.2] 本稿では,最小限の有効性を確保しつつ,人口格差に関連する公平度基準を強制するフェアネスフレームワークを提案する。
このアプローチは、公正度基準を満たすために適合度スコアを調整し、許容できないパフォーマンスの損失を招くことなく成果を最適化することで、株式と実用性のバランスをとる。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:29:06 GMT)
Can AI automatically analyze public opinion? A LLM agents-based agentic pipeline for timely public opinion analysis [3.2] 本研究では,マルチタスク公開世論分析のための LLM エージェントベースエージェントパイプラインの提案と実装を行う。
従来の方法とは異なり、ドメイン固有のトレーニングデータを必要とせずに、エンドツーエンドで完全に自動化された分析ワークフローを提供する。
単一の自然言語クエリを通じて、タイムリーで統合された公開世論分析を可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:09:28 GMT)
Time-dependent Hole States in Multiconfigurational Time-Dependent Hartree-Fock Approaches: Applications in Photoionization of Water Molecule [3.1] 本研究では, 体固定水分子の1光子イオン化過程について検討した。
一中心展開に基づくMCTDHF法の実次元実装を提案する。
我々は、$mathrmHO+$の電子状態間のアト秒コヒーレンスの超高速制御について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:42:37 GMT)
Time-dependent Hole States in Multiconfigurational Time-Dependent Hartree-Fock Approaches: A Time-Domain Generalization of Extended Koopmans' Theorem [3.1] 多重構成時間依存Hartree-Fock理論の枠組みの中で、拡張クープマンの定理の時間領域一般化を導入する。
この定式化は自然に、多電子系から1つの電子を除去することによって形成される時間依存のホール状態をもたらす。
本研究では,時間依存性のテクストイニシアチブ波動関数から直接穴埋め可観測体を抽出する体系的手法を開発した。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:24:34 GMT)
The Future is Sparse: Embedding Compression for Scalable Retrieval in Recommender Systems [3.0] 本稿では,高次元の疎活性化空間に密着した埋め込みを投影する軽量で学習可能な埋め込み圧縮手法について述べる。
提案手法は,大規模レコメンデータの効率向上に有効であることを示すものである。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:51:52 GMT)
Toward Mixed Analog-Digital Quantum Signal Processing: Quantum AD/DA Conversion and the Fourier Transform [3.0] 我々は、アナログデジタル量子信号処理の新たなパラダイムを開発する。
量子信号のアナログデジタル変換を自然に行う方法を示す。
そこで,この量子アナログデジタル変換により,CV-DVハードウェア上での量子アルゴリズムの新たな実装が可能となることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:34:23 GMT)
Comparative Analysis of Black-Box Optimization Methods for Weather Intervention Design [3.0] 気象管理の目的は、最適なタイミング、位置、強度で介入を行うことで、災害リスクを軽減することである。
最適化プロセスは、気象現象の大規模で複雑なため、非常に困難である。
そこで本研究では,ブラックボックス最適化に基づく気象介入設計手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:22:59 GMT)
Disambiguating Reference in Visually Grounded Dialogues through Joint Modeling of Textual and Multimodal Semantic Structures [3.0] フレーズ接頭辞を含むマルチモーダル参照解決は、言及と現実世界のオブジェクト間の意味的関係を理解することを目的としている。
本稿では,オブジェクトの埋め込みに参照埋め込みをマッピングすることで,テキストとマルチモーダルの参照解決を統一するフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:14:58 GMT)
RAN Tester UE: An Automated Declarative UE Centric Security Testing Platform [2.9] 本稿では,自動,適応型,スケーラブルなユーザ機器(UE)ベースのRANセキュリティテストフレームワークを提案する。
市販の市販ハードウェアとオープンソースソフトウェアで構築された5Gソフトウェアテストベッドの結果。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:12:38 GMT)
Benchmarking performance, explainability, and evaluation strategies of vision-language models for surgery: Challenges and opportunities [2.9] 視覚言語モデル(VLM)は多様な視覚データに強い適応性を示す。
腹腔鏡下手術や内視鏡下粘膜下郭清など,さまざまな外科的データセットにまたがるVLMのベンチマークを行った。
我々のベンチマークでは、手術シーンにおける言語と適切な領域を一貫してリンクするモデルの能力において、重要なギャップが明らかになっている。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:42:18 GMT)
Generalization Error Analysis for Selective State-Space Models Through the Lens of Attention [2.9] 状態空間モデル(SSM)は、シーケンスモデリングタスクのためのトランスフォーマーの魅力的な代替品として登場した。
本稿では,マンバモデルの背後にあるコアアーキテクチャコンポーネントである選択SSMの理論的一般化分析について述べる。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:25:14 GMT)
Shackled Dancing: A Bit-Locked Diffusion Algorithm for Lossless and Controllable Image Steganography [2.9] Shackled Dancing Diffusion または SD$2$, プラグ・アンド・プレイ・ジェネレーション・ステガノグラフィー法を紹介する。
ビットポジションロックと拡散サンプリングインジェクションを組み合わせることで、生成軌道に埋め込む制御可能な情報を可能にする。
本手法は,画像の忠実さを損なうことなく,無作為性と制約のバランスを良好に保ち,ステガナリシスに対する堅牢性を向上する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:38:58 GMT)
Completely Weakly Supervised Class-Incremental Learning for Semantic Segmentation [2.8] 本研究は,セマンティックセグメンテーションのためのクラスインクリメンタル学習の完全弱化という課題に対処する。
そこで本研究では,ローカライザからの擬似ラベルと基礎モデルのシーケンスを組み合わせることで,ロバストな擬似ラベルを生成することを提案する。
また,従来のクラスと新しいクラスの両方を含む多様なイメージをガイダンスで生成する,先進的なデータ拡張手法も導入する。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:43:36 GMT)
A Radon-Nikodým Perspective on Anomaly Detection: Theory and Implications [2.7] ラドン-ニコディム誘導体をバニラ損失関数に乗じると、ボード全体の性能が向上する。
RN-Derivativeアルゴリズムは,多変量データセットの68%において最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:04:58 GMT)
Communication-Efficient Federated Learning Based on Explanation-Guided Pruning for Remote Sensing Image Classification [2.7] Federated Learning(FL)は、複数のクライアントが協力してグローバルモデルをトレーニングする分散機械学習パラダイムである。
クライアントと中央サーバの間で送信されるモデル更新の量が多いため、ほとんどのFLシステムは高い転送コストを伴っている。
本稿では、RS画像分類の文脈において、通信効率の高いFLのための説明誘導型プルーニング戦略を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:14:55 GMT)
"Explain, Don't Just Warn!" -- A Real-Time Framework for Generating Phishing Warnings with Contextual Cues [2.7] アンチフィッシングツールは一般的に一般的な警告を表示し、なぜウェブサイトが悪意があると考えられるのかをユーザーに限定的に説明する。
本稿では、既存の検出機構を強化するために設計された、リアルタイムで説明可能なフィッシング警告システムであるPhishXplainを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:06:08 GMT)
Minimizing False-Positive Attributions in Explanations of Non-Linear Models [2.6] Suppressor変数は、対象とする結果に依存することなく、モデル予測に影響を与える可能性がある。
このギャップに対処する新しいXAI技術であるPatternLocalを紹介します。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:06:12 GMT)
MoCLIP: Motion-Aware Fine-Tuning and Distillation of CLIP for Human Motion Generation [2.6] この研究は、モーションエンコーディングヘッドを備えた微調整のCLIPモデルであるMoCLIPを導入し、コントラスト学習とテザリング損失を用いて、モーションシーケンスをトレーニングした。
実験により,MoCLIPは競合FIDを維持しながらTop-1,Top-2,Top-3の精度を向上し,テキスト間アライメントが向上した。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:11:00 GMT)
Physics-informed Temporal Alignment for Auto-regressive PDE Foundation Models [2.6] 本稿では,逆問題解に着想を得た自己教師型学習フレームワークPITAを提案する。
PITAは、物理インフォームド制約を自己超越信号に統合することにより、それぞれのPDE軌道上の異なる時間ステップで発見された物理力学を整列させる。
実験により、PITAは、様々な時間依存PDEデータに基づいて、既存の基礎モデルの精度と堅牢性を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:08:47 GMT)
Flash Invariant Point Attention [2.5] Invariant Point Attention (IPA) は構造生物学における幾何認識モデリングの鍵となるアルゴリズムである。
我々は、ハードウェア効率のよいFlashAttentionを活用して、GPUメモリの線形スケーリングとシーケンス長のウォールクロック時間を実現する、IPAの分解改質であるFlashIPAを紹介する。
FlashIPAは、計算コストを大幅に削減しながら、標準のIPA性能に適合または超過する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:19:05 GMT)
Redundancy-Aware Pretraining of Vision-Language Foundation Models in Remote Sensing [2.5] VLMプリトレーニングは、多数の画像とテキストのペアから画像と言語のアライメントを学ぶことを目的としている。
遠隔センシングにおけるVLM事前学習のための重み付け機能集約(WFA)戦略を導入する。
i)非言語的独特性と(ii)学習に基づく注意の2つの手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:08:05 GMT)
Policy Gradient with Second Order Momentum [2.4] 第2次モメンタムによるポリシーグラディエント(PG-SOM)は、強化学習政策のための軽量な2次最適化スキームである。
PG-SOMは古典的なREINFORCE更新を2つの指数関数的に重み付けされた統計量で強化している。
標準制御ベンチマークの実験では、サンプル効率が2.1倍に向上し、第1次やフィッシャー・マトリクスのベースラインに比べてかなりのばらつきが減少した。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:23:53 GMT)
Revisiting Stochastic Approximation and Stochastic Gradient Descent [2.4] 近似(SA)とグラディエントDescent(SGD)を新たに検討する
我々は、SAの収束に十分な新しい条件を導出する。
また、零次 SGD の収束に十分な条件を導出する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:10:58 GMT)
Toward Foundation Model for Multivariate Wearable Sensing of Physiological Signals [2.4] 本稿では,ウェアラブルセンシングデータから情報表現を抽出するための,最初のマルチモーダル・ユビキタス基盤モデルを提案する。
具体的には,センサ内およびセンサ間の両方の信号パターンを検出するための特別な連絡トークンを共用したチャネル認識型アテンション機構を設計する。
本モデルでは, メンタルヘルス, 身体状態推定, バイタルサイン推定, 疾患リスク評価など, 11のパブリックなウェアラブルセンシングデータセットに対して, 異常な一般化性を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:24:58 GMT)
Forensics of Error Rates of Quantum Hardware [2.3] 元の回路とトランスパイル回路からバックエンドの誤差率を推定する。
法医学では、トランスパイレーションプロセスのキュービットマッピングとルーティングステップが、単一キュービットと2キュービットのゲートエラーの少ないキュービットとキュービットのペアを選択するという事実を利用する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:25:12 GMT)
The Effects of Moral Framing on Online Fundraising Outcomes: Evidence from GoFundMe Campaigns [2.3] 本研究は、モラル・フレーミングが、資金援助と社会支援の両方を含む資金調達結果に与える影響について検討する。
我々は、ケア、公正、および(グループ内の)忠誠の3つの道徳的枠組みに注目し、キャンペーンのアピールにおける彼らの存在を測定した。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:31:56 GMT)
Out-of-distribution generalisation is hard: evidence from ARC-like tasks [2.3] アウト・オブ・ディストリビューションの一般化は、人間と動物の知能の目印と考えられている。
合成一般化の正しい特徴を学習できないアルゴリズムがまだ存在することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:28:45 GMT)
Lasso and Partially-Rotated Designs [2.3] 我々は新しい$textitsemirandom$ family of designを導入し、秘密に関する RE 定数は 0 から外される。
その結果,Lassoは予測誤差$O(k log d / lambda_min n)$を高い確率で達成していることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:25:08 GMT)
Informed, but Not Always Improved: Challenging the Benefit of Background Knowledge in GNNs [2.2] バックグラウンド知識(BK)グラフは、グラフベースの機械学習パイプラインで使用される。
我々は,BKが重要な実世界の課題である癌分類サブタイプにおいて果たす役割について検討する。
我々は、BKを用いた最先端のGNNが、非インフォームドモデルより優れていることを発見した。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:21:00 GMT)
Multimodal Event Detection: Current Approaches and Defining the New Playground through LLMs and VLMs [2.2] 本稿では,ソーシャルメディア上でのイベント検出の課題について考察する。
我々は、Unimodal ModernBERTやConvNeXt-V2、マルチモーダル融合技術、GPT-4oやLLaVAといった先進的な生成モデルなど、様々なモデルを採用しています。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:07:21 GMT)
ScholarMate: A Mixed-Initiative Tool for Qualitative Knowledge Work and Information Sensemaking [2.2] ScholarMateは、人間の監視とAI支援を統合することで、質的分析を強化するために設計された対話型システムである。
ScholarMateは、研究者が非線形キャンバス上のテキストスニペットを動的に配置し、対話し、AIを活用してテーマ提案、マルチレベル要約、エビデンスベースのテーマ命名を可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:13:48 GMT)
Solving Large-Scale QUBO with Transferred Parameters from Multilevel QAOA of low depth [2.1] 本稿では,QAOAパラメータを用いた高速ハイブリッドマルチレベルアルゴリズムの提案と遺伝的アルゴリズムによる強化について述べる。
その結果、短期量子デバイス上での最適化のためのスケーラブルな方法として、マルチレベルQAOAの実用可能性を強調した。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:18:36 GMT)
Stability and List-Replicability for Agnostic Learners [2.1] 無限のリトルストーン次元を持つクラスは、過大な誤差に依存する安定性パラメータを許容しても、安定してPACを学習できないことを証明している。
また、人口減少の少ない分布に非依存的な設定を限定しても、有限仮説クラスのみがグローバルに安定に学習可能であることも証明した。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:06:48 GMT)
Modeling cognitive processes of natural reading with transformer-based Language Models [2.0] これまでの研究では、NグラムやLSTMネットワークのようなモデルが、眼球運動の振る舞いを説明する際の予測可能性の影響を部分的に説明できることが示されている。
本研究では, トランスフォーマーモデル(GPT2, LLaMA-7B, LLaMA2-7B)を評価し, この関係性について検討した。
以上の結果から,これらの構造は,リオ植物学のスペイン語読解者から記録されたガゼ期間の変動を説明する上で,先行モデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:47:58 GMT)
Heart2Mind: Human-Centered Contestable Psychiatric Disorder Diagnosis System using Wearable ECG Monitors [2.0] Heart2Mind(ハート2ミンド)は、ウェアラブル心電図(ECG)モニターを用いたヒト中心の精神疾患診断システムである。
本システムは,(1)極性H9/H10デバイスからのリアルタイムデータ取得のための心臓モニタリングインタフェース(CMI),(2)統合時間周波数領域分析によるRRI時系列処理を行うマルチスケールテンポラル周波数変換器(MSTFT),(3)自己反転説明(SAE)と競合可能な大言語モデル(LLM)を組み合わせた検査可能な診断インタフェース(CDI)からなる。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:21:08 GMT)
CUBIC: Concept Embeddings for Unsupervised Bias Identification using VLMs [2.0] 高い人間の理解可能な概念を解釈する手法は、熱のような低レベルの特徴に依存する方法よりも効果的である。
概念に基づく手法の大きな課題は、そのようなラベル付けの概念を示す画像アノテーションの欠如である。
CUBICは、あらかじめ定義された候補や、特定のバイアスに結びついたモデル失敗の例に依存しない。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:57:15 GMT)
Conditional Deep Generative Models for Belief State Planning [2.0] 本研究では, 条件付き深層生成モデル (cDGM) を用いて信念を表現する手法を提案する。
我々は,無作為なロールアウト軌跡から得られたデータに基づいてcDGMを訓練し,鉱物探査POMDPの解法の有効性を示した。
cDGMは、信頼度と計画性能の両方のタスク非依存の尺度において、粒子フィルタのベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:06:41 GMT)
Unbiased observable estimation via noisy channel mixtures for fault-tolerant quantum computation [2.0] 量子アルゴリズムのフォールトトレラントコンパイルから生じるようなユニタリエラーは、体系的にオブザーバブル推定をバイアスする。
観測変数の期待値のバイアスを補正する別の方法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:48:54 GMT)
Fault Diagnosis across Heterogeneous Domains via Self-Adaptive Temporal-Spatial Attention and Sample Generation [1.9] 自己適応時空間アテンションネットワーク(TSA-SAN)と呼ばれる断層診断モデルを提案する。
提案手法は最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:14:10 GMT)
MergePrint: Merge-Resistant Fingerprints for Robust Black-box Ownership Verification of Large Language Models [1.9] モデルマージを継続することのできる頑健な指紋を埋め込むための新しいフィンガープリント手法であるMergePrintを提案する。
MergePrintはブラックボックスのオーナシップの検証を可能にする。モデルが特定の指紋入力に対してターゲット出力を生成するかどうかのみを所有者が確認する必要がある。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:31:25 GMT)
Diverging Towards Hallucination: Detection of Failures in Vision-Language Models via Multi-token Aggregation [1.9] 視覚言語モデル(VLM)は、今や多くのマルチモーダルタスクにおいて人間のパフォーマンスと競合するが、それでもオブジェクトを幻覚させるか、安全でないテキストを生成する。
初期ロジットの完全配列を解析することで,診断情報が大幅に向上することが実証された。
マルチトークンの信頼性評価(MTRE, Multi-Token Reliability Estimation)は, マルチトークンの対数比と自己アテンションを用いて, 最初の10トークンからログを集約する軽量なホワイトボックス手法である。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:00:19 GMT)
Automated Real-time Assessment of Intracranial Hemorrhage Detection AI Using an Ensembled Monitoring Model (EMM) [1.9] 本稿では,複数の専門家レビューを用いた臨床コンセンサスプラクティスに触発されたEMM(Ensembled Monitoring Model)を紹介する。
EMMは内部AIコンポーネントや中間出力へのアクセスを必要とせずに独立して動作する。
EMMがAI生成予測の信頼度をうまく分類し、異なる行動を提案することを実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:50:42 GMT)
Decentralized Framework for Teleportation in Quantum Core Interconnects [1.9] マルチコア量子コンピューティングシステムにおけるテレポーテーションのための分散化フレームワークを提案する。
双方向のテレポーテーションは、エンドツーエンドの通信遅延を大幅に40%削減する。
その結果、大規模量子システムの性能を向上させるために、分散テレポーテーションの有意義な可能性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:53:44 GMT)
Focus on the Likely: Test-time Instance-based Uncertainty Removal [1.9] 本研究では,不確実なモデル予測を改善するための2つの新しいテスト時間微調整手法を提案する。
最も可能性の高いクラスを欲求的に選択する代わりに、予測を洗練させるために、潜在的クラスに関する追加のステップであるemphfocusを導入する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:21:29 GMT)
MIRACL-VISION: A Large, multilingual, visual document retrieval benchmark [1.8] MIRACL-VISIONは多言語視覚文書評価評価ベンチマークである。
MIRACL-VISIONは18の言語をカバーし、MIRACLデータセットの拡張である。
我々は,多言語機能に対する最先端のVLMベースの埋め込みモデルのギャップを観察する。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:22:19 GMT)
Cloud-Based AI Systems: Leveraging Large Language Models for Intelligent Fault Detection and Autonomous Self-Healing [1.8] 本稿では,クラウドシステムにおけるインテリジェントな障害検出と自己修復機構を実現するために,LLM(Massive Language Model)に基づく新しいAIフレームワークを提案する。
提案手法は, 故障検出精度, システムダウンタイム低減, 復旧速度の観点から, 従来の故障検出システムよりも有意に優れている。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:02:57 GMT)
Resolving Oversmoothing with Opinion Dissensus [1.8] 我々は,GNNにおける過剰な会話と,意見力学文学におけるコンセンサス(つまり完全合意)の類似性を紹介する。
複数のGNNモデルのメッセージパッシングアルゴリズムは,グラフ構造によらず,すべての入力に対してコンセンサスに収束することが示されている線形意見力学モデルと等価であることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:51:27 GMT)
Geodesic Algorithm for Unitary Gate Design with Time-Independent Hamiltonians [1.8] ターゲット量子ゲートの時間非依存なハミルトニアンを$n$ qubitsで求めるアルゴリズムを提案する。
提案アルゴリズムは,ToffoliやFredkinといった標準マルチキュービットゲートの勾配降下法より優れている。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:46:03 GMT)
Quantum Lifshitz points in an altermagnetic metal [1.8] 我々は、$d$-waveの反磁性金属における2つの三臨界量子Lifshitz点の存在を予測した。
我々は、対応するリフシッツ点を、それぞれ場駆動または反磁性駆動と分類する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:39:29 GMT)
Classifying Shelf Life Quality of Pineapples by Combining Audio and Visual Features [1.8] マルチモーダル・マルチビュー分類モデルを構築し,音質と視覚特性に基づいて,パイナップルを4つの品質レベルに分類した。
対向的な音響視覚マスク付きオートエンコーダを改良し,クロスモーダル分類モデルを訓練した。
実験は様々なデータおよびモデル構成で評価され,提案したクロスモーダルモデルにより84%の精度が得られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:14:30 GMT)
Foundation Models for AI-Enabled Biological Design [1.8] サーベイは、タンパク質工学、小さな分子設計、ゲノム配列設計といったタスクに大規模で自己監督的なモデルを適用することに焦点を当てている。
調査は、オープンな問題と今後の方向性に関する議論から締めくくり、生物学的配列生成の質を改善するための具体的な次のステップを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:17:37 GMT)
Nitrogen-vacancy centre in lonsdaleite: a novel nanoscale sensor? [1.7] ヘキサゴナルダイヤモンド(英: hexagonal diamond)は、炭素のエキゾチックな同素体である。
純粋なsp$3$結合格子のため、サブバンドギャップ欠陥中心をホストすることが期待できる。
ヘキサゴナルダイヤモンドナノ結晶における窒素空孔色中心のテクスタイブ初期モデリングを行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:30:36 GMT)
HessFormer: Hessians at Foundation Scale [1.5] 我々は、よく知られたTransformersパッケージとうまく統合されたソフトウェアパッケージ textbfHessFormer をリリースします。
実装の根底にあるのは分散ベクトルランクゾスラチャーアルゴリズムで、パブリックな消費のためにリリースしています。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:27:43 GMT)
Implementing transferable annealing protocols for combinatorial optimisation on neutral atom quantum processors: a case study on smart-charging of electric vehicles [1.5] 本稿では,類似した局所構造を持つ問題インスタンス間のパラメータ転送可能性の有望性に基づいて構築する。
本研究は,共有ジオメトリを持つグラフ族上の最大独立集合問題に対して,最適パラメータが自然に集中していることを明らかにする。
Orion Alphaプラットフォームでの実験結果から,最大100ドル(約1万1000円)の量子ビット問題へのスケーリングによるアプローチの有効性が検証された。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:52:01 GMT)
SubROC: AUC-Based Discovery of Exceptional Subgroup Performance for Binary Classifiers [1.5] SubROCはモデルマイニングに基づくフレームワークで、分類モデルの長所と短所を確実かつ効率的に見つけることができる。
共通評価尺度(ROCとPR AUC)、高速で徹底的なサブグループ探索のための効率的な探索空間プルーニング、クラス不均衡の制御、冗長なパターンの調整、重要度テストなどが組み込まれている。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:18:40 GMT)
Changing the Kernel During Training Leads to Double Descent in Kernel Regression [1.5] 帯域幅をゼロにすることで便宜上、モデル選択の必要性を回避できる。
この知見をニューラルネットワークに適用し、トレーニング中にニューラルタンジェントカーネル(NTK)を変更することで、NTKが帯域幅をゼロに減らしているかのように振る舞うことができることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:32:41 GMT)
The fate of the Fermi surface coupled to a single-wave-vector cavity mode [1.5] 我々は,フェルミ流体長に匹敵する単一波長の超低温フェルミガス中の原子間の空間変調・無限範囲相互作用について検討した。
我々は、密度波(超ラジアント)不安定性が魅力的な側で支配的であるのに対して、反発相互作用には欠如していることを発見した。
そのような対称性を破る不安定性がなくても、フェルミ曲面は常に等方的形状から非自明に変形する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:07:20 GMT)
PoseBench3D: A Cross-Dataset Analysis Framework for 3D Human Pose Estimation [1.5] 本稿では,各手法を各種データセット上で評価する,標準化されたテスト環境を提案する。
本稿では,事前および将来のモデルを体系的に再評価するための統合フレームワークであるPoseBench3Dを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:49:23 GMT)
Multi-Stage Speaker Diarization for Noisy Classrooms [1.5] 本研究では,NvidiaのNeMoダイアリゼーションパイプラインを用いた多段ダイアリゼーションモデルの有効性を検討した。
ダイアリゼーション精度に対する聴覚の影響を評価し,様々な音声活動検出モデルを比較した。
また、フレームレベルのVAD予測と自動音声認識(ASR)ワードレベルのタイムスタンプを統合するハイブリッドVAD手法についても検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:35:06 GMT)
THELMA: Task Based Holistic Evaluation of Large Language Model Applications-RAG Question Answering [1.5] THELMAはRAG(Retrieval Augmented Generation)ベースの質問応答(QA)アプリケーションのための参照フリーフレームワークである。
フレームワークは、開発者とアプリケーションオーナーがラベル付きソースや参照応答を必要とせずに、エンドツーエンドのRAG QAパイプラインを評価し、監視し、改善するのに役立つ。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:42:04 GMT)
Digital currency hardware wallets and the essence of money [1.5] デジタルウォレットの設計と実装に関する多くの提案は、ウォレットの目的は、カストディアルアカウントによるオフライン支払いを可能にすることであると仮定している。
我々は、特に支払いの未来と現金の将来に関して、デジタル通貨ソリューションが解決しようとしている本質的な問題を評価する。
消費者の利益は、信頼されたハードウェアを使わずに、デジタル資産がアカウント外で保持され、オフラインに保存され、オンラインに保存されるであろうと予測するデジタル通貨の設計アプローチにより、より良く機能するであろうと結論付けている。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:47:16 GMT)
Planar Velocity Estimation for Fast-Moving Mobile Robots Using Event-Based Optical Flow [1.4] 本稿では,車輪と表面のトラクションの仮定から分離した速度推定手法を提案する。
提案手法は1:10スケールの自律レースプラットフォーム上でのフィールド実験により評価される。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:00:33 GMT)
A Perturbation and Speciation-Based Algorithm for Dynamic Optimization Uninformed of Change [1.4] Perturbation and Speciation-Based Particle Swarm Optimization (PSPSO) は、非インフォームド動的最適化のための頑健なアルゴリズムである。
PSPSOは、投射に基づくニチング、不活性化、DOPを処理するための新しいランダム摂動機構を組み合わせたものである。
PSPSOは、一般化された移動ピークベンチマークにおいて、高次元性または高周波数変化を持つ関数の強度を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:53:37 GMT)
DRL-Based Injection Molding Process Parameter Optimization for Adaptive and Profitable Production [1.4] 本研究では, 射出成形におけるリアルタイムプロセス最適化のための新しい深部強化学習(DRL)フレームワークを提案する。
実際の製造コストを反映し、樹脂、モールド摩耗、電気価格を取り入れた利益関数が開発された。
実験により,DRLフレームワークは季節変動や運用変動に動的に適用可能であることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:35:31 GMT)
On the Nonconvexity of Push-Forward Constraints and Its Consequences in Machine Learning [1.4] プッシュフォワード操作により、地図を通して確率測度を再分配することができる。
統計学において重要な役割を担い、最適な輸送の影響から生成モデルへの多くの問題である。
本研究の目的は,予測やアルゴリズム学習の問題を研究者がよりよく理解することである。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:24:26 GMT)
Flexible Generation of Preference Data for Recommendation Analysis [1.4] HYDRAは3つの主要な要素によって駆動される新しいデータ生成モデルである。
我々は、よく知られたベンチマークデータセットに対する広範な実験を通して、HYDRAの有効性を実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:53:01 GMT)
Tales of the 2025 Los Angeles Fire: Hotwash for Public Health Concerns in Reddit via LLM-Enhanced Topic Modeling [1.4] この研究は、2025年のロサンゼルスの山火事におけるRedditの談話を分析します。
385件の投稿と114,879件のパサデとイートン火災に関するコメントを集めています。
我々は、状況意識(SA)と危機ナラティブ(CN)という2つの主要なカテゴリからなる潜在トピックを分類する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:41:06 GMT)
MCU: Improving Machine Unlearning through Mode Connectivity [1.4] モード接続を利用して非学習経路を非線形に発見する,MCU(Mode Connectivity Unlearning)と呼ばれる新しいMUフレームワークを提案する。
性能と効率をさらに向上するために,未学習の有効性を向上するだけでなく,計算オーバーヘッドを低減するパラメータマスク戦略を導入する。
論文参考訳(メタデータ) (Fri, 16 May 2025 04:56:47 GMT)
Generalizable Vision-Language Few-Shot Adaptation with Predictive Prompts and Negative Learning [1.4] ヴィジュアル言語モデル(VLM)の核となる課題は、ほとんどない
PromptFuseNLは、予測的プロンプトチューニングと2分岐正負の学習を組み合わせることで、数ショットの一般化を向上する統合フレームワークである。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:39:34 GMT)
Transforming Decoder-Only Transformers for Accurate WiFi-Telemetry Based Indoor Localization [1.3] WiFiGPT(Generative Pretrained Transformer (GPT) ベースのシステム) を提案する。
提案手法は, 従来型の遠隔測定手法に適合し, しばしば超越する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:47:32 GMT)
ViTextVQA: A Large-Scale Visual Question Answering Dataset for Evaluating Vietnamese Text Comprehension in Images [1.3] VQA(Visual Question Answerinng)は、自然言語と画像を同時に処理する能力を必要とする複雑なタスクである。
本稿では,シーンテキストの理解を専門とするベトナム初の大規模データセットについて紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:56:46 GMT)
Improved Bag-of-Words Image Retrieval with Geometric Constraints for Ground Texture Localization [1.2] 下向きカメラを用いた地中テクスチャのローカライゼーションは、低コストで高精度なローカライゼーションソリューションを提供する。
地盤テクスチャローカライゼーションのためのBad-of-words (BoW)画像検索システムを改良した。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:37:18 GMT)
SynRailObs: A Synthetic Dataset for Obstacle Detection in Railway Scenarios [1.2] SynRailObsは多種多様な気象条件と地理的特徴を表すために設計された高忠実な合成データセットである。
我々は実世界の鉄道環境で実験を行い、バラストとバラストレスの両方の線路で試験を行った。
その結果,SynRailObsは鉄道安全への応用において,障害物検出を推し進める大きな可能性を秘めていることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:49:55 GMT)
Among Us: A Sandbox for Measuring and Detecting Agentic Deception [1.2] 我々は、言語ベースのエージェントが長期的かつオープンな偽装を示す社会的偽装ゲームである$textitAmong Us$を紹介した。
RLで訓練されたモデルは、検出するよりも、比較的優れた騙しを生み出すことが分かりました。
また、2つのSAE機能は、偽造検出でうまく機能するが、モデルがより少ない嘘をつくように操ることができない。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:14:51 GMT)
Halting Recurrent GNNs and the Graded $μ$-Calculus [1.2] グラフニューラルネットワーク(GNN)は、グラフ構造化データを扱う機械学習モデルのクラスである。
現在のGNNの提案では、グラフのサイズがモデルに与えられるか、終了保証の欠如に悩まされていると仮定している。
本稿では,繰り返しGNNの停止機構を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:46:36 GMT)
Divided by discipline? A systematic literature review on the quantification of online sexism and misogyny using a semi-automated approach [1.2] 性差別、性差別、性別に基づくヘイトスピーチを検知し、識別する計算ツールが開発されている。
本総説では, セクシズムと誤認の定義, 学際的な相違, 自動検出方法, 関連する課題, デザインに基づく介入の5つのテーマにまとめる。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:50:26 GMT)
ArtA: Automating Design Space Exploration of Spin Qubit Architectures [1.2] 本稿では、量子ドットスピン量子ビットアーキテクチャのための最初の設計空間探索(DSE)を紹介する。
ArtAは17の最適化構成を利用でき、従来のブルートフォース方式に比べて探索時間を最大99.1%削減できる。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:52:18 GMT)
Words in Motion: Extracting Interpretable Control Vectors for Motion Transformers [1.2] トランスフォーマーベースのモデルは、解釈が難しい隠された状態を生成する。
隠れた状態を解析し、推論で修正し、動き予測に焦点をあてる。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:15:04 GMT)
Generalization Guarantees for Learning Branch-and-Cut Policies in Integer Programming [1.2] 混合整数プログラミング(MIP)は最適化問題のための強力なフレームワークを提供する。
ブランチ・アンド・カット (B&C) は最先端の解法において主要なアルゴリズムである。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:00:02 GMT)
A Stability Principle for Learning under Non-Stationarity [1.2] 非定常環境における統計的学習のための多目的フレームワークを開発する。
我々は、人口損失が強く凸している場合やリプシッツのみにおいて、最小限の最小値である後悔境界を対数的要因まで証明する。
本研究は,需要予測と病院看護スタッフの実際のデータ実験を通じて,本手法の実用性を評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:26:15 GMT)
Face Consistency Benchmark for GenAI Video [1.1] 本稿では,AI生成ビデオ中の文字の一貫性を評価し,比較するフレームワークとして,FCB(Face Consistency Benchmark)を提案する。
この研究は、AIビデオ生成技術における文字の一貫性を改善するための重要なステップである。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:41:44 GMT)
Enhancing Mathematics Learning for Hard-of-Hearing Students Through Real-Time Palestinian Sign Language Recognition: A New Dataset [1.1] 本研究は,パレスチナ手話音声認識システムの開発により,難聴者に対する数学教育のアクセシビリティを高めることを目的とする。
最先端のコンピュータビジョン技術を活用するために、VitModelはジェスチャー分類のために微調整された。
このモデルは97.59%の精度を達成し、高い精度と信頼性を持つ数学的記号の認識の有効性を示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:14:25 GMT)
MTevent: A Multi-Task Event Camera Dataset for 6D Pose Estimation and Moving Object Detection [1.1] MTeventは、非常にダイナミックな環境での6次元ポーズ推定と移動物体検出のために設計されたデータセットである。
セットアップはステレオカメラとRGBカメラで、それぞれ平均16秒で75のシーンを撮影しています。
RGB画像上でNVIDIAのFoundationPoseを用いて6次元ポーズ推定を行い,0.22の平均リコールを実現した。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:18:21 GMT)
ShorterBetter: Guiding Reasoning Models to Find Optimal Inference Length for Efficient Reasoning [1.0] そこで本研究では,手動による指導を必要とせずに,推論モデルによる最適なCoT長の学習を可能にする,簡易かつ効果的な強化学習手法を提案する。
ShorterBetterは、ドメイン内およびドメイン外推論タスクの出力長を50%-80%削減する。
我々の推論トレース分析は、不要な反復、過剰な自己検証、代替品の過剰探索を減らし、ショーターベッターが推論トレースの構造を洗練することを示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:59:40 GMT)
QuXAI: Explainers for Hybrid Quantum Machine Learning Models [1.0] この研究は、ハイブリッド機械学習システムにおける機能の重要性を説明するための説明器QuXAIを紹介する。
我々のモデルは、量子特徴写像を取り入れたHQMLモデルの作成、Q-MEDLEYの使用、特徴ベースの推論の組み合わせ、量子変換ステージの保存、および結果の属性の可視化を含む。
以上の結果から,Q-MEDLEYはHQMLモデルにおいて重要な古典的側面を表現し,ノイズを分離し,既存のXAI技術とよく競合することを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:30:51 GMT)
Beyond real: Alternative unitary cluster Jastrow models for molecular electronic structure calculations on near-term quantum computers [1.0] 短期量子デバイスは、浅い回路深度でも表現可能な波動関数アンスアゼを必要とする。
K-fold Unitary cluster Jastrow (uCJ) ans"atze は$O(kN2) のトロッター回路のスケーリングと線形深度回路の実装を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:59:37 GMT)
Towards understanding evolution of science through language model series [1.0] AnnualBERTは、科学的テキストの時間的進化を捉えるために設計された一連の言語モデルである。
2008年まで発行された170万のarXiv論文の全文をスクラッチから事前訓練したRoBERTaモデルと、年間ベースでarXiv論文の漸進的に訓練されたモデルのコレクションで構成されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:12:41 GMT)
Can Global XAI Methods Reveal Injected Bias in LLMs? SHAP vs Rule Extraction vs RuleSHAP [1.0] 生成AIシステムは、情報の拡散だけでなく、誤情報や偏見の拡散にも役立ちます。
説明可能なAI(XAI)は、AIシステムの有効性を明らかにし、誤った振る舞いや偏見を公開することを目的としている。
本稿では,ルール抽出やSHAPといったグローバルXAI手法の言語モデルにおけるバイアス検出への応用について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:48:44 GMT)
Parameterized Synthetic Text Generation with SimpleStories [1.0] 本稿では,英語と日本語のそれぞれ200万のサンプルからなる,シンプルな言語による大規模な合成物語データセットを提案する。
複数の抽象化レベルにおけるパラメータ化プロンプトにより,大規模にストーリー特性を制御できる。
私たちは、エンド・ツー・エンドのトレーニングプロセスを研究する新しい方法を実現するために、モデル作成のすべての構成要素をオープンソースにしています。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:38:19 GMT)
DMN-Guided Prompting: A Low-Code Framework for Controlling LLM Behavior [0.9] 決定モデルと表記法(DMN)は、構造化されたユーザフレンドリな方法で決定ロジックを定義するための標準化されたグラフィカルなアプローチを提供する。
本稿では、複雑な決定ロジックをより小さく管理可能なコンポーネントに分解するDMN誘導プロンプトフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:09:36 GMT)
Analysis of Customer Journeys Using Prototype Detection and Counterfactual Explanations for Sequential Data [0.9] 本稿では,顧客旅行の分析を行う3つのステップからなる新しいアプローチを提案する。
まず、シーケンスデータ間の距離を定義し、代表シーケンスを特定し視覚化する。
第2に、この距離に基づいて購入の可能性を予測する。
第三に、あるシーケンスが購入を示唆しない場合、購入の確率を高めるために偽造シーケンスが推奨される。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:17:53 GMT)
GROQLoco: Generalist and RObot-agnostic Quadruped Locomotion Control using Offline Datasets [0.9] GROQLocoはスケーラブルで注目度の高いフレームワークで、複数の四足歩行ロボットと地形をまたいだ1つの汎用的なロコモーションポリシーを学習する。
本フレームワークは,ロボット固有のエンコーディングを組み込まずに,すべてのロボットからの固有受容データを直接操作する。
我々の実験は、高度に多様な四足歩行ロボットと地形を横断する強力なゼロショット移動を実証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:17:01 GMT)
Can an Easy-to-Hard Curriculum Make Reasoning Emerge in Small Language Models? Evidence from a Four-Stage Curriculum on GPT-2 [0.8] 発達的に順序付けられたカリキュラムは、小言語モデルにおける透明性とサンプル効率を著しく改善することを示した。
最終回答の成功は、依然として従来のランニングを約30%遅れており、私たちのサリエンシ調査は、最も難しい段階で言語知識の頭を抱えています。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:08:31 GMT)
Uncertainty quantification with approximate variational learning for wearable photoplethysmography prediction tasks [0.8] Photoplethysmographyは、血液の相対的な変化に関する情報を符号化する。
ディープネットワークは、ウェアラブル測定デバイスから取得した大量のデータを扱うのに適している。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:21:45 GMT)
Protecting Young Users on Social Media: Evaluating the Effectiveness of Content Moderation and Legal Safeguards on Video Sharing Platforms [0.8] 我々は,TikTok,YouTube,Instagramの年齢層別ビデオモデレーションの有効性を評価した。
受動的スクロールでは、13歳グループに割り当てられたアカウントは、18歳グループに割り当てられたアカウントよりも、より頻繁に迅速に有害とされるビデオに遭遇した。
露光は、アルゴリズムフィルタリングシステムの弱点を示す、ユーザー主導の検索なしで発生した。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:06:42 GMT)
Path superposition as resource for perfect quantum teleportation with separable states [0.8] 量子過程のある種の重ね合わせにアクセスできる場合、量子テレポーテーションにおける絡み合いの要求を緩和できることが示される。
プロトコルにパスの重ね合わせが組み込まれると、完全量子テレポーテーションはゼロではない確率で可能になる。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:03:38 GMT)
Large-Scale Quantum Device Benchmarking via LXEB with Particle-Number-Conserving Random Quantum Circuits [0.8] ベンチマークに用いるランダム量子回路に粒子数保存と呼ばれる制約を導入する。
これにより、固定粒子数に対するヒルベルト空間のサイズが小さくなり、100量子ビットを超える回路の古典的なシミュレーションが可能になる。
本稿では,LXEBの修正版であるMLXEBを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:31:06 GMT)
The Stochastic Occupation Kernel (SOCK) Method for Learning Stochastic Differential Equations [0.8] 本稿では,多変量微分方程式(SDE)を学習するためのカーネルベースの新しい手法を提案する。
まず、ドリフト項関数を推定し、ドリフトが与えられた(行列値の)拡散関数を推定する。
本研究では,Fenchel双対性を用いて効率を向上しながら,予測精度を高い精度で維持する簡単な学習手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:38:50 GMT)
Visual Feedback of Pattern Separability Improves Myoelectric Decoding Performance of Upper Limb Prostheses [0.8] 最先端の上肢筋電義手は、しばしばパターン認識(PR)制御システムを使用する。
既存のトレーニングは、通常、スタティックデコーダ境界に対するトライアルとエラーのユーザ調整を含む。
本稿では,EMG信号を直接デコーダの分類空間に投影する3DビジュアルインタフェースであるReviewerを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:08:42 GMT)
Terminators: Terms of Service Parsing and Auditing Agents [0.7] Terminatorsは、ToS文書のパースと監査に大規模な言語モデルを活用するフレームワークである。
ターミネータはタスクを、項抽出、検証、説明責任計画という3つの解釈可能なステップに分解する。
不透明な用語を動作可能で検証可能なコンポーネントに翻訳することで、ターミネーターはWebコンテンツの倫理的利用を促進する。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:17:10 GMT)
An AI-Powered Research Assistant in the Lab: A Practical Guide for Text Analysis Through Iterative Collaboration with LLMs [0.7] 本稿では,LLMを用いた非構造化データの効率的な開発,テスト,適用のためのステップバイステップチュートリアルを提案する。
我々は,データセットをレビューし,生命ドメインの分類を作成,即時かつ直接的な修正を通じて分類を評価・洗練し,分類を検証し,インターコーダ契約を評価し,データセット全体を高いインターコーダ信頼性で分類する手法を実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:47:10 GMT)
Multilevel Circuit Optimization in Quantum Compilers: A Case Study [0.7] マルチレベル回路最適化(MLCO)について検討し、複数のゲートセットをデプロイし、ゲートセットからターゲット回路へのソース回路を段階的に低下させる。
我々は、ハミルトンシミュレーションのソース回路を用いて、偏微分方程式を解くことにより、その効果を実証する。
MLCOは高レベルの回路構造を可視化し、回路の単純化方法やゲートの分解方法についての洞察を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:39:43 GMT)
Ratio Attack on G+G Convoluted Gaussian Signature [0.7] 本稿では,G+Gの共起型ガウス符号に対する比攻撃を提案し,秘密鍵を復元し,改訂版印刷紙にコメントする。
修正されたシグネチャは、比率攻撃に対して安全であるが、有効なシグネチャを生成できないか、あるいは、与えられたパラメータに対して簡単にシグネチャを偽造できることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:49:58 GMT)
ChatISA: A Prompt-Engineered, In-House Multi-Modal Generative AI Chatbot for Information Systems Education [0.7] ChatISAは、インフォメーション・システムズ・アンド・アナリティクス部門の学生と教員を支援するために設計された、社内のマルチモデルAIボットである。
ChatISAは、Coding Companion、Project Coach、Exam Ally、Interview Mentorの4つの主要なモジュールで構成されている。
ChatISAのすべてのコードはGitHubで公開されており、他の機関は、カリキュラム内で同様のAI駆動の教育ツールをカスタマイズし、統合することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:53:58 GMT)
BioCube: A Multimodal Dataset for Biodiversity Research [0.7] 生態学および生物多様性研究のための微細なグローバルデータセットであるBioCubeを紹介する。
BioCubeは、画像、オーディオ記録、説明、環境DNA、植生指標、農業、森林、土地の指標、高解像度気候変数を通じて種を観察する。
すべての観測は、2000年から2020年の間、WGS84の測地システムの下で測地的に一致している。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:46:08 GMT)
EdgeWisePersona: A Dataset for On-Device User Profiling from Natural Language Interactions [0.7] 本稿では,エッジデバイス上に展開可能な小型言語モデルの評価と改善を目的とした,新しいデータセットを提案する。
データセットの中核は構造化されたユーザプロファイルであり、それぞれがルーチンのセットによって定義される。
大規模言語モデル(LLM)は、現実的で多様性があり、コンテキスト対応の対話をシミュレートする、対応する対話セッションを生成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:29:21 GMT)
Invariant Representations via Wasserstein Correlation Maximization [0.7] 本研究では、教師なし表現学習におけるワッサースタイン相関の活用について検討する。
入力と分布の相関を最大化するために訓練された(オート)エンコーダが代わりに圧縮機として機能することがわかった。
また、最適輸送に基づく依存度測定のための様々な理論的結果も確立する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:11:51 GMT)
Leveraging Graph Retrieval-Augmented Generation to Support Learners' Understanding of Knowledge Concepts in MOOCs [0.6] 大規模オープンオンラインコース(MOOC)は、学習者とインストラクターの直接的な相互作用を欠いている。
Retrieval-Augmented Generation (RAG) は、応答を生成する前に関連文書を取得することでこの問題に対処する。
これらの課題に対処するために,教育知識グラフ(EduKG)と個人知識グラフ(PKG)を活用したグラフRAGパイプラインを提案する。
評価の結果,グラフRAGが学習者にパーソナライズされた学習体験における新しい知識概念を理解する力を与える可能性が示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:33:49 GMT)
User-centric Music Recommendations [0.6] この作業はユーザ中心のレコメンデーションフレームワークを提示します。
4つの異なる、接続され、カスタマイズ可能なフェーズを持つパイプラインとして設計されている。
これらのフェーズは、説明可能性を改善し、ユーザのエンゲージメントを高めることを目的としています。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:56:40 GMT)
Generative Modeling: A Review [0.6] 生成的手法(Gen-AI)は、機械学習とベイズ推論におけるタスクの解決という特定の目標によってレビューされる。
生成モデルは、大規模なトレーニングデータセットをシミュレートし、深層ニューラルネットワークを使用して教師付き学習問題を解決する必要がある。
Gen-AI法の主な利点は、モデルフリーであることと、ディープニューラルネットワークを用いて条件密度や後部クインタイルを推定できることである。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:39:48 GMT)
Open Set Domain Adaptation with Vision-language models via Gradient-aware Separation [0.6] Open-Set Domain Adaptation (OSDA)は、既知のクラス分布をドメイン間で整合させるという2つの課題に直面している。
本稿では,これらの制約に対処するために,コントラスト言語-画像事前学習(CLIP)を活用することを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:31:17 GMT)
Benchmarking Anomaly Detection Algorithms: Deep Learning and Beyond [0.6] 本稿では機械学習(ML)に基づく異常検出アルゴリズムの多種多様な配列を評価する。
ディープラーニングが不足しているデータセットにおいて、ツリーベースのアプローチがシングルトン異常の検出に成功している。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:15:43 GMT)
Attention on the Sphere [0.5] 球面領域に対する一般化された注意機構を導入し,2次元球面上に定義されたデータを処理するトランスフォーマーアーキテクチャを実現する。
数値的な二次重みを注意機構に組み込むことで、幾何的に忠実な球面的注意力が得られる。
スケーラビリティとモデル性能の両面をさらに向上するため,球面上の近傍の注意をシミュレートする手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:59:30 GMT)
Efficient Online Computation of Business Process State From Trace Prefixes via N-Gram Indexing [0.5] プロセスモデルとプロセスの進行中ケースのトレースプレフィックスを含むイベントログが与えられたら、各ケースをモデル内の対応する状態にマップする。
この状態計算問題に対するアプローチは、モデルに対して各トレースプレフィックスのトークンベースのリプレイを実行することである。
本稿では,現在進行中の事例のトレースプレフィックスが与えられた場合,n-gramとして状態を表わす指標を用いて,その状態を一定時間に計算する手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:44:53 GMT)
Local consistency and axioms of functional dependence [0.5] 我々は、大域的不整合と局所的整合性の両方を可能にする設定において、論理的推論を研究するための一般的なアプローチを採用する。
本稿では,FD(FunctionalDependency)の問題について検討する。
単元FDの包含問題に対する完全公理化とPTIMEアルゴリズムを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:55:34 GMT)
Magnetic field orientation dependence of continuous-wave optically detected magnetic resonance with nitrogen-vacancy ensembles [0.5] ダイヤモンド中の窒素空孔(NV)スピンによる連続波光検出磁気共鳴(CW-ODMR)測定は、近傍のターゲットから直流磁場を検出するために用いられる。
この技術は、異なるNV配向クラスによる共鳴が互いに重なり合うとき、磁場成分の抽出の曖昧さに悩まされる。
ここでは、低バイアス磁場を呈するNVアンサンブルに対するそのような効果に関する詳細な実験および理論的研究を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:17:34 GMT)
IMPACT: A Generic Semantic Loss for Multimodal Medical Image Registration [0.5] IMPACT (Image Metric with Pretrained Model-Agnostic Comparison for Transmodality registration) は、マルチモーダル画像登録のための新しい類似度尺度である。
大規模事前訓練セグメンテーションモデルから抽出した深い特徴の比較に基づいて意味的類似度尺度を定義する。
胸椎CT/CBCTおよび骨盤MR/CTデータセットを含む5つの難易度3次元登録課題について検討した。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:02:19 GMT)
Blockchain with proof of quantum work [0.5] 我々は、マイニングが量子コンピュータを必要とするブロックチェーンアーキテクチャを提案する。
量子力学の確率論的性質を取り入れるために、ブロックチェーンフレームワークを洗練しました。
この研究は、既存の技術を用いた他の短期量子コンピューティングアプリケーションの可能性を強調している。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:49:59 GMT)
A Training Framework for Optimal and Stable Training of Polynomial Neural Networks [0.5] PNN(Polynomial Neural Networks)は、HEによるプライバシ保護暗号化などのアプリケーションにおいて重要な機能である。
低次はモデル表現性を制限することができるが、高次は数値不安定性や勾配爆発に悩まされることが多い。
本稿は,1)所定の安定範囲外において入力を指数関数的にペナルティ化する境界損失,2)本質的な正規化統計を保ちながら,勾配を効果的にテーパーする選択的な勾配クリッピング,の2つの革新を特徴とする,堅牢で汎用的なトレーニングフレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:00:02 GMT)
Side Channel Analysis in Homomorphic Encryption [0.5] ホモモルフィック暗号化は、プライバシーに配慮した処理の多くの機会を提供する。
既存の暗号手法は、過去にサイドチャネル攻撃の影響を受けやすいことが示されている。
本稿では, サイドチャネル解析に関連するFHE実装の弱点について概説する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:56:03 GMT)
msf-CNN: Patch-based Multi-Stage Fusion with Convolutional Neural Networks for TinyML [0.4] 我々は畳み込みニューラルネットワーク(CNN)のための最適な融合設定を効率的に見つける新しい手法であるmsf-CNNを紹介する。
我々はmsf-CNNが従来の技術に比べて50%少ないRAMで推論できることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:47:15 GMT)
Decomposing stimulus-specific sensory neural information via diffusion models [0.4] 有意義な刺激的分解が満足すべき公理, 付加性, 肯定性, 局所性を導入する。
我々の分解は拡散モデルを用いて効率的に推定することができ、複雑で構造的で自然主義的な刺激までスケールアップすることができる。
我々のアプローチは、生物学的および人工的なニューラルシステムの両方で表現を探索するためのスケーラブルで解釈可能なツールを提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:34:55 GMT)
Token Masking Improves Transformer-Based Text Classification [0.4] 本稿では,入力トークンを確率 p で特別な [MASK] トークンにランダムに置き換える,シンプルだが理論的に動機づけられたトークンマスキング正規化を提案する。
言語識別と感情分析の実験では、標準正規化技術よりも一貫した改善が見られた。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:06:11 GMT)
Controlling the Flow: Stability and Convergence for Stochastic Gradient Descent with Decaying Regularization [0.4] 我々は、余分な有界性仮定を伴わない元の問題の最小ノルム解に対して、reg-SGDの強い収束性を証明する。
分析の結果,Tikhonov正則化がSGDの流れを制御し,安定した学習力学が得られることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:53:49 GMT)
Lightweight LIF-only SNN accelerator using differential time encoding [0.4] スパイキングニューラルネットワーク(SNN)は、現代の機械学習(ML)アプリケーションにおいて、計算とエネルギーの要求を増大させる問題に対して、有望な解決策を提供する。
スパイクとスパイクトレインを使用する独自のデータ表現の選択のため、彼らは主に、最先端(SOTA)人工ニューラルネットワーク(ANN)に近づく結果を達成するために追加としきい値操作に依存している。
この研究は、LIFのみのSNNをフィードフォワードで計算できるハードウェアアクセラレーターアーキテクチャと、既存のデータをスパイクトレインに効率的にエンコードするための符号化手法を導入する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:42:39 GMT)
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges [0.4] この研究はAIエージェントとエージェントAIを区別し、構造化された概念分類、アプリケーションマッピング、課題分析を提供する。
ジェネレーティブAIは前駆体として位置づけられており、AIエージェントはツールの統合、エンジニアリングの促進、推論の強化を通じて前進している。
エージェントAIシステムは、マルチエージェントコラボレーション、動的タスク分解、永続メモリ、オーケストレーション自律性によって特徴付けられるパラダイムシフトを表している。
論文参考訳(メタデータ) (Fri, 16 May 2025 23:31:18 GMT)
Anomaly Detection for Non-stationary Time Series using Recurrent Wavelet Probabilistic Neural Network [0.4] 教師なしリカレントウェーブレット確率ニューラルネットワーク(RWPNN)を提案する。
非定常環境における異常を検出することを目的として,非密度推定ネットワークを用いて時間的特徴をモデル化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:43:00 GMT)
Distilled Circuits: A Mechanistic Study of Internal Restructuring in Knowledge Distillation [0.4] 教師と生徒の間で内部回路,表現,アクティベーションパターンがどう異なるかを分析する。
学生モデルは、教師コンポーネントを再編成、圧縮、破棄し、多くの場合、より少ない個々のコンポーネントに強く依存する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:37:40 GMT)
Multilingual Prompt Engineering in Large Language Models: A Survey Across NLP Tasks [0.4] 大規模言語モデル(LLM)は、広範囲の自然言語処理(NLP)タスクで素晴らしいパフォーマンスを示している。
しかし、複数の言語にまたがって有効性を確保することは、ユニークな課題である。
多様な言語環境においてLLMの能力を高めるための重要なアプローチとして、多言語プロンプトエンジニアリングが登場している。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:59:17 GMT)
STRIDE: Sparse Techniques for Regression in Deep Gaussian Processes [0.3] 大規模データを用いた深部GPトレーニングのための粒子ベース予測予測トレーニング手法を開発した。
標準ベンチマーク問題に対して,本手法を検証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:18:15 GMT)
The State of Factoring on Quantum Computers [0.3] 本稿では,デジタルおよびアナログ量子コンピュータにおけるファクタリング整数の現状について報告する。
ディジタル量子コンピュータでは、ショアの因数分解が失敗することを正式に証明できる誤りの影響について研究する。
アナログ量子コンピュータでは、3つの因数分解法を実験的に検証し、ランダムな推測よりも絶対的かつ指数的に優れたスケーリング性能を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:51:25 GMT)
Exploiting the Asymmetric Uncertainty Structure of Pre-trained VLMs on the Unit Hypersphere [0.3] 本稿では,単位超球面上で事前学習された視覚言語モデルから確率的埋め込みを構築することを提案し,不確実な定量化を実現する。
確立されたベンチマークに対する確率的埋め込みの有効性を検証し,テキストおよび視覚データの不確実性構造における非対称性の性質を示す包括的アブレーション研究を行った。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:24:29 GMT)
Vaiage: A Multi-Agent Solution to Personalized Travel Planning [0.3] プランニングトリップは、ユーザの好みの相反、動的な外部情報、多段階の時間空間最適化を含む認知的に集中的なタスクである。
我々のアプローチであるVayageは、目標条件付きレコメンデータとシーケンシャルプランナの両方として機能する、大規模言語モデル(LLM)を中心に構築されたグラフ構造化マルチエージェントフレームワークを通じて、これらの課題に対処します。
自然言語のインタラクション、構造化ツールの使用、マップベースのフィードバックループを通じて、Vaiageは、象徴的推論と会話的理解の両方に根ざした適応的、説明可能、エンドツーエンドの旅行計画を可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:54:52 GMT)
Assessing the Performance of Analog Training for Transfer Learning [0.3] アナログインメモリコンピューティングは、高速、並列、エネルギー効率の高いディープラーニングトレーニングと転送学習を約束する。
上記の課題の多くに対処するために、チョップ技術を活用する新しいアルゴリズムTTv2(c-TTv2)が導入された。
本稿では,CIFAR100データセットのサブセット上でSwin-ViTモデルを用いて,アナログTLのc-TTv2アルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:02:32 GMT)
METHOD: Modular Efficient Transformer for Health Outcome Discovery [0.3] 本稿では,電子カルテにおける臨床シーケンスモデリングの課題に対処するために,新しいトランスフォーマーアーキテクチャである Method を紹介する。
1)効率的なバッチ処理を可能にしながら情報漏洩を防止する患者対応アテンション機構,(2)マルチスケールの時間的依存関係をキャプチャする適応型スライディングウィンドウアテンションスキーム,(3)動的スキップ接続を備えたU-Netインスピレーションアーキテクチャ。
MIMIC-IVデータベースにおける評価は、手法が最先端のETHOSモデルより一貫して優れていることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:52:56 GMT)
Towards Cultural Bridge by Bahnaric-Vietnamese Translation Using Transfer Learning of Sequence-To-Sequence Pre-training Language Model [0.2] この研究は、ベトナムの2つの民族集団を文化的にブリッジするために、バーナール語・ベトナム語訳を達成するための旅を探求する。
最も顕著な課題は、オリジナルのBahnaricリソースソース言語が不足していることである。
シーケンス・ツー・シーケンス・プレトレーニング言語モデルを用いた転送学習手法を利用する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:33:36 GMT)
Provably Efficient Simulation of 1D Long-Range Interacting Systems at Any Temperature [0.2] 全温度にわたる長距離相互作用を持つ1次元量子系の効率的な計算を実現する方法を提案する。
我々のアルゴリズムは準多項式ランタイム内で動作し、逆温度が$beta=rm poly(ln(n))$まで上がる。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:27:42 GMT)
Talk to Your Slides: Efficient Slide Editing Agent with Large Language Models [0.2] COM通信を通じて,能動的PowerPointセッション内のスライドを直接編集するエージェントであるTalk-to-Your-Slidesを紹介する。
LLMエージェントが命令を解釈し、編集計画を定式化する高レベル処理と、PythonスクリプトがPowerPointオブジェクトを直接操作する低レベル実行という2段階のアプローチを採用している。
実験結果から,Talk-to-Your-Slidesは,実行成功率,命令忠実度,編集効率において,ベースライン手法を著しく上回ることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:12:26 GMT)
Comparing GHZ-Based Strategies for Multipartite Entanglement Distribution in 2D Repeater Networks [0.2] 我々は、$N$-qubit GHZ状態の距離範囲を拡張するのに必要な初期品質を決定するために比較研究を行う。
集中型量子スイッチを用いて初期GHZ状態を分散するための2つの戦略を解析する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:50:50 GMT)
HSRMamba: Efficient Wavelet Stripe State Space Model for Hyperspectral Image Super-Resolution [0.2] 単一ハイパースペクトル画像超解像は、低分解能ハイパースペクトル画像から高分解能画像を復元することを目的としている。
Visual Mambaモデルは、性能と計算効率の大幅なバランスを達成している。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:57:41 GMT)
Wavelet Analysis of Noninvasive EEG Signals Discriminates Complex and Natural Grasp Types [0.1] 本研究の目的は,脳波を用いた神経補綴器開発と脳-コンピュータ・インタフェース(BCI)の応用を目的とした脳波からの握手をデコードすることである。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:20:57 GMT)
Zero-Shot Visual Generalization in Robot Manipulation [0.1] 現在のアプローチは、しばしば点雲や深さのような不変表現に頼ることで問題を横取りする。
ディアングル型表現学習は、視覚的分布シフトに対して、視覚に基づく強化学習ポリシーを堅牢化できることを最近示した。
シミュレーションおよび実ハードウェア上での視覚摂動に対するゼロショット適応性を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:01:46 GMT)
GEOM-Drugs Revisited: Toward More Chemically Accurate Benchmarks for 3D Molecule Generation [0.1] 我々はGEOM-Drugsを再検討し、修正された評価フレームワークを提案する。
データ前処理の問題を特定し, 化学的に正確な原子価表を作成し, GFN2-xTBに基づく幾何とエネルギーのベンチマークを導入する。
本研究は,3次元分子生成における化学的に厳密な評価手法の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:27:25 GMT)
Finding One's Bearings in the Hyperparameter Landscape of a Wide-Kernel Convolutional Fault Detector [0.1] 最先端のアルゴリズムは、健全な機械軸受と損傷した機械軸受との振動を区別するのにほぼ完璧であると報告されている。
本稿では,故障検出のためのニューラルネットワークが誤パラメータ化によって故障することを確認する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:50:36 GMT)
Purcell enhanced and tunable single-photon emission at telecom wavelengths from InAs quantum dots in circular photonic crystal resonators [0.1] 荷電担体輸送を効率的に支援するホールグレーティングを取り入れたフォトニック構造の作製と特性評価を行った。
上位帯域およびフォノン補助励起下での通信Cバンドにおける明るい紫外光の放出を報告した。
本稿では、電気的に接触した共振器について、通信Oバンドにおける量子ドット遷移の広い範囲のチューニング性を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:03:54 GMT)
Fuck the Algorithm: Conceptual Issues in Algorithmic Bias [0.1] アルゴリズムバイアスは近年の論争の対象となっている。
この主張を明確にするためには、「アルゴリズムそのもの」がどんなものなのかを知る必要がある。
データバイアスは、雇用、警察、医療といった領域で特定されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:17:00 GMT)
chemtrain: Learning Deep Potential Models via Automatic Differentiation and Statistical Physics [0.0] ニューラルネットワーク(NN)は、分子動力学の精度を向上し、新しい応用分野を開拓する有効なモデルである。
本稿では、カスタマイズ可能なトレーニングルーチンと高度なトレーニングアルゴリズムを用いて、洗練されたNNポテンシャルモデルを学ぶためのフレームワークケミストレインを紹介する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:47:13 GMT)
What's Inside Your Diffusion Model? A Score-Based Riemannian Metric to Explore the Data Manifold [0.0] スコアに基づくリーマン計量を導入し、データ多様体の内在幾何学を特徴づける。
我々のアプローチは、測地学が自然に多様体の輪郭に従う幾何学を生成する。
我々のスコアに基づく測地学は、基礎となるデータ分布を尊重する有意義な垂直変換を捉えていることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:19:57 GMT)
WebXAII: an open-source web framework to study human-XAI interaction [0.0] WebXAIIは、eXplainable Artificial Intelligence (XAI)システムとのヒューマンインタラクションの研究を促進するために設計されたWebフレームワークである。
文献の最先端研究のプロトコルを再現することにより,WebXAIIは関連プロトコルを効果的に具現化できることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:12:53 GMT)
Walsh-Floquet Theory of Periodic Kick Drives [0.0] 我々は周期的二乗波関数のウォルシュ基底を用いて周期的キックドライブの物理を記述する。
強く蹴られた状態では、フーリエ基底よりも正確に単体・多体系のフロケダイナミクスを復元する。
我々の研究は、デジタル量子デバイスで自然に実装可能なWalsh-Floquet理論の基礎を定めている。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:05:31 GMT)
Using Distance Correlation for Efficient Bayesian Optimization [0.0] 距離相関と呼ばれる2つの確率変数の相関関係の統計的尺度とBOを統合したBOスキームBDCを提案する。
BDCの探索は自動的にバランスと利用のバランスを保ち、手動のハイパーパラメータチューニングを必要としない。
我々はBDCを様々なベンチマークテストで評価し、一般的なBO法と同等に動作することを観察する。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:23:27 GMT)
Unified Quantum Dynamics: The Emergence of the Born Rule [0.0] 我々は、ボルン則が「小信号切り込み」を含む修正シュリンガー方程式から自然に現れることを示す。
これは、量子デコヒーレンスが"Many-Worlds Interpretation"における多元宇宙の分岐を引き起こす方法と平行している。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:47:40 GMT)
Training NTK to Generalize with KARE [0.0] 我々は、明示的に訓練されたカーネルが従来のエンドツーエンドDNN最適化よりも優れていることを示す。
我々はNTKの明示的な訓練は過度にパラメータ化された特徴学習の一形態であると主張している。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:13:30 GMT)
Towards local and compositional measurements in quantum field theory [0.0] 本稿では, 肯定的形式主義, 公理的枠組みに基づく問題へのアプローチを提案する。
一方、このアプローチは量子場理論、特に経路積分とシュヴィンガー・ケルディシュ形式主義の標準ツールに基づいている。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:08:42 GMT)
Towards Better Evaluation for Generated Patent Claims [0.0] 我々は特許請求を評価するための最初の総合的なベンチマークであるPatent-CEを紹介する。
また,特許請求に特化して設計された多次元評価手法であるPatClaimEvalを提案する。
本研究は,自動特許クレーム生成システムのより正確な評価の基礎となる。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:27:16 GMT)
Towards Adaptive Deep Learning: Model Elasticity via Prune-and-Grow CNN Architectures [0.0] この論文では、利用可能なハードウェアリソースに基づいて、CNNが計算複雑性を動的に調整できる方法を探究する。
我々は,実行時にキャパシティを拡張可能な適応型CNNアーキテクチャを導入し,性能と資源利用の効率よくバランスをとる。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:06:55 GMT)
Toward Adaptive Categories: Dimensional Governance for Agentic AI [0.0] 次元ガバナンスは、意思決定の権威、プロセスの自律性、説明責任(3A)が人間とAIの関係を動的に分散する方法を追跡するフレームワークである。
このアプローチの重要な利点は、主要なガバナンスしきい値に対するシステムの動きを明示的に監視できることです。
我々は、重要な側面、重要な信頼しきい値、厳格な分類のフレームワークがどこで失敗するかを示す実践例を概説する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:43:12 GMT)
Theory: Multidimensional Space of Events [0.0] 本稿では,事象と仮説集合の間の相互影響を考慮に入れた多次元事象空間(MDSE)理論を開発する。
MDSEは、予測精度を15~20%改善した関係変数をうまくモデル化した。
このアプローチは、リスクアセスメント、リソース最適化、予測問題など、エンジニアリング上の課題における実践的な応用を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:54:12 GMT)
The measurement postulates of quantum mechanics are not redundant [0.0] Masanes, Galley and M'uller は、非相対論的量子力学の仮定は構造的仮定から導かれると主張している。
非量子測定と状態更新規則の明確な例を提示し、その結論を反論する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:57:17 GMT)
The heteronomy of algorithms: Traditional knowledge and computational knowledge [0.0] われわれは、デジタル・ビルドゥング(Digital Bildung)と呼ばれる新しい概念を通じて、連邦を批判する原則を教え始めなければならない、と私は主張する。
計算とそれに関連するソフトウォーカ化プロセスに関して、知的なトーンを高める必要があるだけでなく、計算から起こりうる課題に緊急に対応する必要がある。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:25:00 GMT)
The Way We Prompt: Conceptual Blending, Neural Dynamics, and Prompt-Induced Transitions in LLMs [0.0] 大きな言語モデル(LLM)は、しばしば個性と知性の感覚を引き起こす行動を示す。
本研究は,意味自体の深い構造を解明するための科学的手法として,素早い工学を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:37:21 GMT)
The Geometry of ReLU Networks through the ReLU Transition Graph [0.0] 我々は、ReLUトランジショングラフ(RTG)と呼ばれる物体のレンズを通して、ReLUニューラルネットワークを解析するための新しい理論的枠組みを開発する。
このグラフでは、各ノードはネットワークの活性化パターンによって誘導される線形領域に対応し、エッジは単一ニューロンのフリップによって異なる領域を接続する。
RTG幾何を表現性、一般化、ロバスト性に結びつける新しい理論結果の組を導出する。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:00:56 GMT)
The Gaussian-Multinoulli Restricted Boltzmann Machine: A Potts Model Extension of the GRBM [0.0] ガウス・ベルヌーリ制限ボルツマンマシン(GB-RBM)を拡張した生成エネルギーベースモデルを導入する。
この修正により、スケーラブルでリッチな潜在空間が可能になり、多値で解釈可能な潜在概念の学習をサポートする。
GM-RBMsは2進RBMよりも複雑なマルチモーダル分布を効果的にモデル化する。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:59:59 GMT)
The Dilemma Between Euphoria and Freedom in Recommendation Algorithms [0.0] 今日のAIレコメンデーションアルゴリズムは、ユーホリアと自由の間の人間のジレンマを生み出します。
人間の自由の概念は、既に存在するものを満たすのではなく、ユーザーにとって馴染みの無い利益を促進するものである。
その結果、人間の新しいアイデンティティが生まれました。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:19:47 GMT)
The Accountability Paradox: How Platform API Restrictions Undermine AI Transparency Mandates [0.0] 主要なソーシャルメディアプラットフォームに対するAPI制限は、アルゴリズムの透明性のためにデータアクセスを義務付けるEUデジタルサービス法[20]の遵守に異議を唱える。
規制要件とプラットフォーム実装の相違点の増大を評価するための構造化監査フレームワークを開発する。
我々は,国立標準技術研究所のAIリスクマネジメントフレームワークに沿った政策介入を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:30:20 GMT)
TensorMixedStates: a Julia library for simulating pure and mixed quantum states using matrix product states [0.0] MixedStatesは、ITensor上に構築されたJuliaライブラリである。
行列積状態(MPS)を用いた散逸の存在下での量子システムのシミュレーションを可能にする
論文参考訳(メタデータ) (Fri, 16 May 2025 15:41:05 GMT)
Tensor decomposition technique for qubit encoding of maximal-fidelity Lorentzian orbitals in real-space quantum chemistry [0.0] ガウス型解からMOを多ビット状態として符号化する効率的なスキームを提案する。
提案手法は様々な量子化学系のMOを符号化する強力なツールであることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:16:03 GMT)
Strategic Collusion of LLM Agents: Market Division in Multi-Commodity Competitions [0.0] 機械学習技術は、現実世界の市場シナリオへの展開が増えている。
マルチコモディティ市場において,大規模言語モデル(LLM)が自律エージェントとして展開する際の戦略行動について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:05:18 GMT)
Sonification of entanglement dynamics in many-qubit systems [0.0] データの聴覚表現である音化は、有望な補完的なアプローチを提供する。
本稿では,多ビット系における動的絡み合い発生に応用した音素化手法について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:04:49 GMT)
Social preferences with unstable interactive reasoning: Large language models in economic trust games [0.0] ChatGPT-4、Claude、Bardは、プレイヤーが自己利益と信頼と互恵のバランスをとる経済信頼ゲームに配置された。
本研究は, LLMが純粋な自己利益から逸脱し, 特定のペルソナの採用を促すことなく, 信頼と相互性を示すことを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:45:59 GMT)
Self-Supervised Learning for Robotic Leaf Manipulation: A Hybrid Geometric-Neural Approach [0.0] 本稿では,自律的な葉の把握のためのハイブリッドな幾何学的アプローチを提案する。
本手法は,従来のコンピュータビジョンとニューラルネットワークを自己教師付き学習により統合する。
制御された環境では88.0%、実際の温室環境では84.7%の成功率を達成した。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:23:01 GMT)
Scaling an ISO Compliance Practice: Strategic Insights from Building a \$1m+ Cybersecurity Certification Line [0.0] この記事では、Armanino LLPにおけるサイバーセキュリティ認証の実践の成功、実装、スケーリングについて説明する。
中間市場や高成長企業を支援するための実施を通じて、ステークホルダーから業界プラクティスを確立しました。
1年間で、このイニシアチブは100万ドル以上の新サービス収益をもたらし、顧客のポートフォリオを150%拡大しました。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:21:55 GMT)
SPIEDiff: robust learning of long-time macroscopic dynamics from short-time particle simulations with quantified epistemic uncertainty [0.0] SPIEDiffは、純粋に散逸するシステムのコンテキストにおける制限を克服するために設計された機械学習フレームワークである。
数分で定量化された不確実性を正確に予測し、計算要求を大幅に減らすことができる。
全体として、SPIEDiffは、データ駆動型熱力学モデルの発見において、堅牢で信頼できる経路を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:03:04 GMT)
SEEK: Self-adaptive Explainable Kernel For Nonstationary Gaussian Processes [0.0] ガウス過程を通じて複雑な非定常関数をモデル化するための学習可能なカーネルのクラスであるSEEKを紹介する。
人工ニューロンにインスパイアされたSEEKは、対称性と正の半定性を保証するための第一原理から導かれる。
我々は,本手法が設計選択の多くに対して堅牢であるだけでなく,予測精度と不確かさの両面で既存の定常・非定常カーネルよりも優れていることを示すため,包括的感度解析と比較研究を実施している。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:03:38 GMT)
SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models [0.0] SCAMは,これまでで最大かつ多種多様な実世界タイポグラフィー・アタック・イメージのデータセットである。
以上の結果から,現状のLVLM(Large Vision-Language Models)では,視覚エンコーダの選択によりタイポグラフィー攻撃が継続していることが判明した。
合成攻撃は実世界(手書き)攻撃によく似ており、研究における使用の有効性を実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:54:09 GMT)
QMProt: A Comprehensive Dataset of Quantum Properties for Proteins [0.0] Quantum Mechanics for Proteins (QMProt)は、タンパク質研究における量子コンピューティングアプリケーションをサポートするために開発されたデータセットである。
QMProtは正確な量子力学的および物理化学的データを含み、生体分子の正確なキャラクタリゼーションを可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:38:45 GMT)
QKD security proofs for decoy-state BB84: protocol variations, proof techniques, gaps and limitations [0.0] BB84プロトコルを用いた事実上のデコイ状態量子鍵分布のセキュリティ証明の現状を概観する。
我々は、弱いコヒーレントパルスとしきい値光検出器を用いた光学実装に焦点を当てる。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:52:23 GMT)
Probing Quantum Structure in Gravitational Radiation [0.0] 量子力学状態の特定のクラスが重力放射場を適切に記述しているという仮説を定量的に検証する。
本試験では, 重要な熱成分やスクイーズを含むフィールドを, 容易に識別する。
古典的(コヒーレントな状態)仮説が失敗しそうな具体的な状況を特定する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:16:44 GMT)
Privacy and Confidentiality Requirements Engineering for Process Data [0.0] 本研究は,プライバシと機密性工学手法(PCRE)に基づくプロセスデータの機密性に対処する。
2つの製造業におけるプロセスアナリストとの構造化インタビューに基づいてPCREを共同構築・評価する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:03:02 GMT)
Pipelining Kruskal's: A Neuromorphic Approach for Minimum Spanning Tree [0.0] 我々は,SNNに基づくユニオンソートルーチンと,KruskalのMSTアルゴリズムのパイプラインバージョンを提案する。
提案手法は,大規模グラフ上での最先端プリム法よりも優れた性能を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:00:15 GMT)
Photonic Networking of Quantum Memories in High-Dimensions [0.0] 我々は、個々の原子に格納された高次元(HD)量子メモリまたは「量子ビット」の量子ネットワークを実証する。
原子quditメモリから放出されるHD時間ビン符号化単一光子の干渉と検出は、原子quditレベルの対をまたいだ最大絡み合ったベル状態を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:21:33 GMT)
Phare: A Safety Probe for Large Language Models [0.0] 大規模言語モデル(LLM)の探索と評価を行うための診断フレームワークであるPhoreを紹介する。
本評価では, 筋力, 敏感性, ステレオタイプ再現など, あらゆる安全次元にまたがる系統的脆弱性のパターンを明らかにする。
Phareは研究者や実践者に、より堅牢で整合性があり、信頼できる言語システムを構築するための実用的な洞察を提供する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:31:08 GMT)
Pedestrian mobility citizen science complements expert mapping for enhancing inclusive neighborhood placemaking [0.0] 本研究では,スペイン・カタルーニャ州グラノラーズ(Granollers)のプライマー・ド・マイグ(Primer de Maig)地区における,専門家によるマッピングと市民科学の相互作用について検討した。
住民は19のグループに編成され、プロトタイズされた遊び心のある社会活動に従事しながら、歩行者の移動を記録した。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:28:51 GMT)
Path-Integral Approach to Quantum Acoustics [0.0] 格子振動に対する長めに無視されるが本質的な波動パラダイムを導入する。
コヒーレント状態図の中で、任意の系の正確な力学を捉える非マルコフ的マスター方程式を定式化する。
そこで本研究では,Fr"ohlichモデルに対応する手順を適用することで,提案したマスター方程式の能力を実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:23:24 GMT)
On the definition and importance of interpretability in scientific machine learning [0.0] 方程式発見と記号回帰の研究者は、スパーシティの概念を解釈可能性で説明する傾向があると論じる。
我々の解釈可能性の概念は、数学的疎性に関するメカニズムの理解を強調する。
論文参考訳(メタデータ) (Fri, 16 May 2025 20:16:14 GMT)
Observation of optical vortex generation via magnon-induced Brillouin light scattering [0.0] 回転対称性を持つ系では、軌道角運動量(OAM)が光と物質の間で交換できることが知られている。
このような現象の最も一般的な応用の1つは、光とネマティック液晶ベースの空間光変調器(SLM)とのOAM交換による光学OAMの操作である。
ここでは、位相特異性のないマグノンによるブリルアン光散乱を用いた光渦ビームの生成を実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:02:05 GMT)
Non-coherent evolution of closed weakly interacting system leads to equidistribution of probabilities of microstates [0.0] マクロ量子系の非コヒーレント進化の概念を導入する。
弱い相互作用を持つ系では、このような進化はマルコフ過程であることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:54:25 GMT)
Noisy atomic magnetometry with Kalman filtering and measurement-based feedback [0.0] 本稿では,測定,推定,制御戦略を統合する総合的なアプローチを提案する。
これは原子アンサンブルの連続的な光伝搬に基づく量子的非劣化測定を実装することを含む。
提案したフィードバックにより、測定データが破棄された場合でも原子は絡み合いを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:18:45 GMT)
Neural Networks as Universal Finite-State Machines: A Constructive Deterministic Finite Automaton Theory [0.0] 我々は、ユニバーサル有限状態マシン(N-FSM)としてフィードフォワードニューラルネットワークを確立する。
我々の結果は、有限深度ReLUとしきい値ネットワークが決定論的有限オートマトン(DFAs)を正確にシミュレートできることを証明している。
固定深度フィードフォワードネットワークは、メモリを必要とする非正規言語を認識できない。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:01:34 GMT)
Nash: Neural Adaptive Shrinkage for Structured High-Dimensional Regression [0.0] 我々は,ニューラル・アダプティブ・シリンカレーション(Nash)を導入した。ニューラル・アダプティブ・シリンカレーション(Nash)は,ニューラル・ネットワークによるスパース・レグレッション(sparse regression)に,共仕様のサイド情報を統合する統合フレームワークである。
ナッシュは品種ごとの罰則を適応的に調整し、クロスバリデーションなしで正規化を調整する。
実データに関する実験では、Nashが既存のメソッドよりも正確性と適応性を向上できることが示されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 11:43:01 GMT)
Multi-view dense image matching with similarity learning and geometry priors [0.0] MV-DeepSimNetsは、マルチビュー類似性学習用に設計されたディープニューラルネットワークのスイートである。
我々のアプローチは、ピクセル関係を特徴づける前に、オンライン幾何学を取り入れている。
幾何的プレコンディショニング法は,多視点再構成のためのエピポーラ的特徴を効果的に適用する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:55:40 GMT)
Low-Resource Language Processing: An OCR-Driven Summarization and Translation Pipeline [0.0] 本稿では,画像ベース文書からの多言語情報抽出と処理のためのエンドツーエンドスイートを提案する。
このシステムは、英語、ヒンディー語、タミル語などの言語でテキストを抽出するために光文字認識(Tesseract)を使用している。
現在の研究では、言語ギャップを埋め、異なる言語環境における画像メディアの情報へのアクセスを強化するために、ライブラリ、モデル、APIの現実的な応用が示されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:20:37 GMT)
Leveraging Real-Time Data Analysis and Multiple Kernel Learning for Manufacturing of Innovative Steels [0.0] 本稿では, 製鋼用溶射部品の塗装プロセスの更新について述べる。
データアグリゲータと品質予測器は、継続的プロセス監視によって設計される。
この組み合わせの性能を小型試験で検証した。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:21:14 GMT)
Learning transitions in classical Ising models and deformed toric codes [0.0] 条件確率分布は、ベイズ推定を通して未知の古典的状態を学ぶことの効果を記述している。
ここでは,条件付き相関関数の長距離挙動にシグネチャを持つ学習遷移の存在を示す。
我々の手法は古典状態と量子状態の両方における学習のより一般的な効果を研究するために拡張することができる。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:23:09 GMT)
Lattice models with subsystem/weak non-invertible symmetry-protected topological order [0.0] 我々は,非可逆対称性保護トポロジカル(SPT)次数を持つ格子モデル群を構築する。
また、翻訳対称性と非可逆対称性の組み合わせによって区別される2つの弱いSPT相に属する2+1d格子モデルを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:32:35 GMT)
Large Language Model Use Impact Locus of Control [0.0] 本稿では,AIとの共同筆記が人々のコントロールの軌跡に与える影響について考察する。
雇用状況は、利用者のAIへの依存とコントロールの軌跡を形作る上で重要な役割を担っていることがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:16:32 GMT)
LLM Content Moderation and User Satisfaction: Evidence from Response Refusals in Chatbot Arena [0.0] 倫理的拒絶は、技術的拒絶と標準的反応の両方よりもかなり低い利得が得られることを示す。
LLM設計では,安全性に配慮した動作がユーザの期待と矛盾する可能性がある。
論文参考訳(メタデータ) (Fri, 16 May 2025 01:23:54 GMT)
JaxSGMC: Modular stochastic gradient MCMC in JAX [0.0] JaxSGMCは、JAXにおけるマルコフ勾配連鎖モンテカルロ(SG-MCMC)のアプリケーションに依存しないライブラリである。
ディープラーニングにおける不確実性定量化(UQ)を促進するために、最先端のSG-MCMCサンプルをいくつか実装している。
JaxSGMCは、標準のSG-MCMCビルディングブロックからカスタムサンプルを作成できる。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:49:21 GMT)
Inferring the Most Similar Variable-length Subsequences between Multidimensional Time Series [0.0] 本稿では、時系列間の最も類似した多次元部分列を見つけるための正確な解を提供するアルゴリズムを提案する。
このアルゴリズムは理論上の正確性と効率の保証に基づいて構築される。
実世界のデータセットでは、最も類似したサブシーケンスをさらに高速に抽出した。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:39:46 GMT)
Improving Object Detection Performance through YOLOv8: A Comprehensive Training and Evaluation Study [0.0] 本研究は,顔画像中のしわの検出とセグメント化のためのYOLOv8に基づくセグメンテーションモデルの性能評価を行った。
その結果, YOLOv8をベースとしたセグメント化モデルは, 顔画像のしわの検出とセグメント化に有効なツールであることが示唆された。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:38:01 GMT)
Improvement of AMPs Identification with Generative Adversarial Network and Ensemble Classification [0.0] 本研究は,抗微生物ペプチドの予測分野における提案手法の改善によって改善されている。
本研究は, 抗微生物ペプチドの予測精度と効率において, 提案手法が有意な改善を示したものであることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:11:42 GMT)
Implementation of Shor Algorithm: Factoring a 4096-Bit Integer Under Specific Constraints [0.0] 本研究は、モジュラー計算効率の向上と特定の制約下での4096ビット整数の因数分解の実証を目的としたShorアルゴリズムの実装に焦点を当てた。
実験結果は、最先端のSOTA(State-of-the-art)法と比較すると、より長い整数の分解を可能にしながら、効率が大幅に向上したことを示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:26:37 GMT)
IISE PG&E Energy Analytics Challenge 2025: Hourly-Binned Regression Models Beat Transformers in Load Forecasting [0.0] 本研究では,古典的回帰手法から高度なディープラーニングアーキテクチャに至るまで,予測モデルを評価する。
このデータセットには、過去2年間の電力負荷データと、5つの場所にわたる温度およびグローバル水平照射(GHI)が含まれている。
その結果、TimeGPTを含むディープラーニングモデルは、より単純な統計的および機械学習アプローチを一貫して上回りません。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:55:34 GMT)
Hypothesis testing on invariant subspaces of non-symmetric matrices with applications to network statistics [0.0] mathbbRp × r$ の $nu が、mathbbRp × p$ の $M の不変部分空間の元であるかどうかをテストする。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:44:29 GMT)
Humans expect rationality and cooperation from LLM opponents in strategic games [0.0] 本研究は,人間の行動の差異に着目した最初の金銭的インセンティブを持つ実験室実験の結果である。
この環境下では,LLMと対戦する被験者は人間よりも有意に少ない数を選択する。
この変化は、主に戦略的推論能力の高い被験者によって引き起こされる。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:01:09 GMT)
How AI Generates Creativity from Inauthenticity [0.0] 生成人工知能は 純粋な不正行為として機能します
芸術におけるAIの真正な創造性は、人間の経験と私たちのアイデンティティの感覚にまで拡張できるのか、という疑問が提起されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:17:31 GMT)
High-Order Hermite Optimization: Fast and Exact Gradient Computation in Open-Loop Quantum Optimal Control using a Discrete Adjoint Approach [0.0] この研究は、量子最適制御のためのオープンループ離散随伴法であるHigh-Order Hermite Optimization (HOHO)法を紹介する。
本手法は, 連続パラメータ化制御パルスを用いた場合, 正確な(離散的な)勾配を効率的に計算する最初の方法である。
現実的なモデル問題に対しては、最大775倍のスピードアップを観測する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:59:57 GMT)
Heading towards an Algebraic Heisenberg Cut [0.0] Infinity の前には, マクロな行動の早期の兆候が現れる。
このことは、IPP形式主義の量子物理学への包含を正当化する根拠となる。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:15:00 GMT)
Geofenced Unmanned Aerial Robotic Defender for Deer Detection and Deterrence (GUARD) [0.0] 野生生物による作物の被害は、特に鹿によるものであり、農業の生産性を脅かす。
伝統的な抑止方法は、様々な農地環境へのスケーラビリティ、応答性、適応性に欠けることが多い。
本稿では,自律型野生生物保護のために設計された無人航空機(UAV)システムについて述べる。
論文参考訳(メタデータ) (Fri, 16 May 2025 00:59:31 GMT)
General recipe for immediate entanglement death-birth transitions via Bell states: environmental Heisenberg exchange as an example [0.0] 環境は、絶滅と絡み合いの両面で二重の役割を果たすことが知られており、絡み合い突然死(ESD)と絡み合い突然死(ESB)につながる。
本研究では,2つの量子ビットの初期状態のレシピを提案し,その間にESD,ESB,あるいは有限持続時間(TFD)の遷移を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:44:29 GMT)
General Hamiltonian description of nonreciprocal interactions [0.0] 膨大な数の系において、相互作用はポテンシャルに起因せず、一般には非相互性である。
ここでは、補助的な自由度を含むハミルトニアンを構成することによって、これらの制限を克服する。
拘束ハミルトニアンに基づくグラウバー力学は、元のランゲヴィン力学の定常状態を再現することを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:18:14 GMT)
Gender and Positional Biases in LLM-Based Hiring Decisions: Evidence from Comparative CV/Résumé Evaluations [0.0] 本研究は,言語モデル (LLM) の履歴やCVに基づく職業的候補の評価における行動について検討する。
すべてのLLMは、70の異なる職業にまたがる女性の名前の候補者を一貫して好んだ。
CVに性フィールド(男性/女性)を追加することで、女性応募者の嗜好がさらに高まった。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:19:35 GMT)
From Intent Discovery to Recognition with Topic Modeling and Synthetic Data [0.0] 顧客の発話は、頻繁な単語の共起と、長期間の変動によって特徴付けられる。
トピックモデリングと合成クエリ生成のためのエージェントLLMフレームワークを提案する。
LLMの生成した意図記述やキーワードは、効果的に人為的なバージョンに代用できることを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:20:31 GMT)
From Hand-Crafted Metrics to Evolved Training-Free Performance Predictors for Neural Architecture Search via Genetic Programming [0.0] ゼロコスト(ZC)メトリクスを用いたネットワーク性能の推定は、ニューラルネットワーク探索(NAS)における効率性と有効性の両方を証明している。
本研究では,ZCメトリクスの設計を自動化するために,遺伝的プログラミングを用いたシンボリック回帰に基づくフレームワークを提案する。
我々のフレームワークは高いだけでなく、真のネットワーク性能と強い正のランク相関を持つZCメトリックを迅速に生成できる。
論文参考訳(メタデータ) (Fri, 16 May 2025 07:12:42 GMT)
Forgetting in short and heterogeneous sequences of belief revisions [0.0] 特定の信念修正エピソードを忘れることは、他のリビジョンが同じ情報を提供したり、追加したりするため、情報を消去することができない。
任意の2つのレキソグラフィーリビジョンまたは任意に長いレキソグラフィーリビジョンのシーケンスに対して、coNPハードであることが証明された。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:04:13 GMT)
Finetune-RAG: Fine-Tuning Language Models to Resist Hallucination in Retrieval-Augmented Generation [0.0] Finetune-RAGは、現実世界の欠陥を模倣するために構築されたトレーニングデータセットである。
ファインチューンRAGは、ベースモデルよりも21.2%精度が向上する。
Bench-RAGは、現実的な不完全な検索シナリオの下でモデルをテストする。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:06:06 GMT)
Extracting Explainable Dates From Medical Images By Reverse-Engineering UNIX Timestamps [0.0] 正規表現は正規表現合成によって生成され、テキストの書き起こしにおいて複雑な日付と日付範囲を識別できることを示す。
そこで本研究では,複数の多点写像を逆エンジニアリングし,それらを正規表現合成器に入力することで決定論的論理を学習する手法を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:07:14 GMT)
Exponential quantum speedups in quantum chemistry with linear depth [0.0] 我々は、フェルミオン魔法状態入力でマッチゲート回路を保持する粒子数との接続を証明した。
この結果を,短期ハードウェア用に設計された量子マルチ参照手法に適用する。
本稿では,短期ハードウェア上での量子化学における指数的量子優位性の実現について論じる。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:28:22 GMT)
Explainable Machine Learning for Oxygen Diffusion in Perovskites and Pyrochlores [0.0] 我々は,実験活性化エネルギーのデータベースを構築し,材料特性にグループ化アルゴリズムを適用した。
アンサンブルの合意により、活性化エネルギーを予測する最も重要な特徴はA部位結合のイオン性である。
本研究で同定した簡易な測定機能は, 高速酸化物イオン拡散率を有する新規材料の迅速スクリーニングを可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:06:19 GMT)
Exactly solvable many-body dynamics from space-time duality [0.0] 近年、量子多体力学の理解において、理論的にも実験的にも大きな進歩が見られた。
ここでは、量子多体ダイナミクスの正確な結果につながる特別な設定として、二重単位回路をレビューする。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:52:54 GMT)
Exactly solvable dissipative dynamics and one-form strong-to-weak spontaneous symmetry breaking in interacting two-dimensional spin systems [0.0] マルコフ環境に結合した相互作用する「ガンマ行列」スピンモデルの散逸ダイナミクスについて検討する。
定常状態と緩和ダイナミクスは、基礎となるグラフの選択から定性的に独立であることを示す。
我々の研究は、物質の非平衡量子相を探索する分析的に抽出可能な枠組みを確立する。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:59:59 GMT)
Emergent Thermalization Thresholds in Unitary Dynamics of Inhomogeneously Disordered Systems [0.0] 非均一性障害は閉量子系における創発的熱化閾値を誘導できることを示す。
その結果、不均一性障害が閉量子系における創発的熱化閾値をいかに引き起こすかが明らかになった。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:46:40 GMT)
Eliminating Hallucination-Induced Errors in LLM Code Generation with Functional Clustering [0.0] 機能的クラスタリング(Functional Clustering, ブラックボックスラッパー)は, 覚醒によるほとんどすべてのエラーを排除し, 調整可能な信頼スコアを提供する。
我々の検証は、解決可能なタスクのベースラインパス@1を保存するが、返却された回答のエラー率を65%から2%に下げる。
このメソッドはサンプリングとサンドボックスの実行のみを必要とするため、クローズドソースAPIや将来のモデルには適用されない。
論文参考訳(メタデータ) (Fri, 16 May 2025 18:19:38 GMT)
Efficient Shallow Ritz Method For 1D Diffusion-Reaction Problems [0.0] 本稿では,一次元拡散-反応問題の解法として浅部リッツ法について検討する。
近似のほぼ最適順序を達成するために、減衰ブロックニュートン法(dBN)を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:08:48 GMT)
EconoJax: A Fast & Scalable Economic Simulation in Jax [0.0] 本稿では,AI経済学に基づく高速シミュレーション経済であるEconoJaxを紹介する。
EconoJaxとそのトレーニングパイプラインは、完全にJAXで書かれています。
実世界の経済行動が15分以内のトレーニングによってどのように現れるかを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:46:52 GMT)
EXAdam: The Power of Adaptive Cross-Moments [0.0] 本稿では,広く使用されているAdamアルゴリズムに基づく新しい最適化アルゴリズムであるEXAdamを紹介する。
EXAdamは、(1)モーメント推定を改善するための新しいデバイアス項と(2)勾配に基づく加速度メカニズムの2つの重要な拡張を取り入れている。
実験的な評価は、ExAdamがAdamよりも優れており、収束が38.46%速く、1.96%、2.17%、そして1.17%のトレーニング、検証、テストの精度が向上したことを示している。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:00:28 GMT)
Driving Mechanisms and Forecasting of China's Pet Population-An ARIMA-RF-HW Hybrid Approach [0.0] ペット人口の主な要因は、都市所得(猫19.48%、犬17.15%)、消費(17.99%、猫13.33%、犬14.02%)である。
予想では、猫の成長と犬数の変動は、猫の都市環境への適応性を反映している。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:03:18 GMT)
Discrete time quasi-crystal in Rydberg atomic chain [0.0] 本稿では,2つの離散時間結晶を結合して,離散時間準結晶挙動を生成する手法を提案する。
顕著なことに、周期的応答の出現は、リドベルク封鎖効果によるシステム間の相互作用によって引き起こされる。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:52:10 GMT)
Decentralization: A Qualitative Survey of Node Operators [0.0] ブロックチェーンノードオペレータから‘分散化’と‘分散化劇場’の定義を求めます。
ほとんどのオペレータは、技術的な軸とガバナンス軸に広く存在するものとして、分散化を考えている。
私たちの重要な発見は、分散化だけでは台帳の不変性やシステム的堅牢性に影響を与えないということです。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:56:06 GMT)
CoolWalks for active mobility in urban street networks [0.0] 建物からのシェードは、歩行者の冷却と保護を提供することができるが、この潜在的な利益の程度は不明である。
我々は、合成都市と実際の都市の両方から、建物の足跡とストリートネットワークを用いて、日陰歩行の可能性を探究する。
我々の研究は、冷涼で活発な旅行における日陰の限界と可能性を特定し、都市における持続可能な移動のための日陰供給の厳密な理解に向けた第一歩である。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:53:39 GMT)
Computing excited states of molecules using normalizing flows [0.0] 変動原理を満たす最適振動座標を学習する新しい手法を提案する。
このアプローチは、手前の振動問題に合わせて座標を生成する。
最適化された座標は、基底セットの切り離しの異なるレベルにわたって転送可能であることを実証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:16:52 GMT)
Compendium Manager: a tool for coordination of workflow management instances for bulk data processing in Python [0.0] Compendium ManagerはPythonで書かれたコマンドラインツールで、バイオインフォマティクスパイプラインのプロビジョニング、起動、評価を自動化する。
プロジェクトのリストを通じて進捗を計測し、結果を共有データベースにロードし、後の評価と評価のための詳細な処理メトリクスを記録する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:49:40 GMT)
Comparing Lexical and Semantic Vector Search Methods When Classifying Medical Documents [0.0] 我々の仕事は、その内容に応じて厳格に構造化された医療文書を分類することであった。
その結果,市販のセマンティックベクターサーチでは,語彙ベクトルサーチモデルの作成よりも予測精度が若干悪いことがわかった。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:06:35 GMT)
Compactifying linear optical unitaries using multiport beamsplitters [0.0] 任意の$N$次元ユニタリ行列は、同一のマルチポートビームスプリッターの有限列を用いて実現できることを示す。
応用として、2つの非直交量子ビット状態の曖昧な識別に現れる3次元ユニタリを実装可能なリコンフィギャラブル線形光回路を提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:34:37 GMT)
Classical simulability of constant-depth linear-optical circuits with noise [0.0] ノイズは、量子計算の優位性を達成する量子デバイスを実現する上での大きな障害の1つである。
本研究では,光子損失と偏微分性の影響下での浅い深度線形光回路の複雑さについて検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:05:42 GMT)
Can AI Freelancers Compete? Benchmarking Earnings, Reliability, and Task Success at Scale [0.0] 我々は、Kaggleの投稿から生成される合成タスクを用いて、ベンチマークを構築する。
各タスクには、構造化された入力テストケースと推定価格が伴う。
本ベンチマークでは,現代LLM (3.5 Claude Haiku, GPT-4o-mini, Qwen 2.5, Mistral) の評価を行った。
論文参考訳(メタデータ) (Fri, 16 May 2025 22:42:04 GMT)
CMOS-Compatible, Wafer-Scale Processed Superconducting Qubits Exceeding Energy Relaxation Times of 200us [0.0] 本稿では,200mmウエハ上での超伝導量子ビットの産業レベルの製造結果について述べる。
99.7%(ショートとオープン)のジョセフソン接合の収率を10000以上の接合で示し、キュービット周波数予測精度は1.6%である。
これは、業界グレードのウェハレベルの減量プロセスで作製された超伝導量子ビットにとって、これまで報告された中で最高の性能を示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:53:50 GMT)
CAMEO: Collection of Multilingual Emotional Speech Corpora [0.0] 本稿では、感情認識やその他の音声関連タスクの研究を容易にするために設計された多言語感情音声データセットの集合について述べる。
主な目的は、データへの容易なアクセスを確保すること、結果の正規化を可能にすること、および音声感情認識システムを評価するための標準化されたベンチマークを提供することであった。
このコレクションとメタデータ、およびリーダーボードは、Hugging Faceプラットフォームを通じて公開されている。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:52:00 GMT)
Binned Spectral Power Loss for Improved Prediction of Chaotic Systems [0.0] 本稿では,BSP(Binned Spectral Power)ロス(BSP)と呼ばれるスペクトルバイアスを緩和する新しい手法を提案する。
ポイントワイドなミスフィットに焦点を当てた従来の損失とは異なり、BSPの損失は、異なるスケールにわたるエネルギー分布の偏差を明示的に罰する。
以上の結果から,BSP損失は神経予測モデルの安定性とスペクトル精度を著しく向上させることが示された。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:56:13 GMT)
Beyond Accidents and Misuse: Decoding the Structural Risk Dynamics of Artificial Intelligence [0.0] 本稿では,複雑なシステム研究を基盤としたフレームワークを導入することにより,構造リスクの概念を推し進める。
構造リスクを、先行する構造的原因、先行するAIシステム原因、有害なフィードバックループの3つのカテゴリに分類する。
本稿では,これらのダイナミクスを予測し,支配するために,シナリオマッピング,シミュレーション,探索的展望を取り入れた方法論的アジェンダを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 02:23:18 GMT)
BanglaFake: Constructing and Evaluating a Specialized Bengali Deepfake Audio Dataset [0.0] このデータセットは、12,260の実際の発話と13,260のディープフェイク発話を備えたBengali Deepfake Audioデータセットである。
合成音声は、SOTA Text-to-Speech(TTS)モデルを用いて生成され、高い自然性と品質が保証される。
30の母語話者の平均オピニオンスコア(MOS)は、3.40(自然性)と4.01(知性)のロバストMOSを示している
論文参考訳(メタデータ) (Fri, 16 May 2025 05:42:25 GMT)
BINGO: A Novel Pruning Mechanism to Reduce the Size of Neural Networks [0.0] 反復等級プルーニング(英語版)のようなモデルのプルークに使用される現在の手法は、非常に正確であるが、信じられないほど計算的かつ環境的に課税される反復的な訓練シーケンスを必要とする。
BINGOは、現在の方法よりも計算集約性が低い精度保存プルーニング技術を提供しており、AIの成長がモデルの成長を意味する必要がない世界も実現している。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:16:52 GMT)
Authoritarian Recursions: How Fiction, History, and AI Reinforce Control in Education, Warfare, and Discourse [0.0] この記事では、人工知能システムが教育、戦争、デジタル言論の制御をますます仲介する方法について述べる。
ケーススタディには、教室の監視における生成AIモデル、軍事AIシステムの自律的ターゲティング、プラットフォームガバナンスにおけるコンテンツキュレーションロジックが含まれる。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:39:00 GMT)
Area and volume from entangled qubits [0.0] 2Dパラレルグラムの面積は、絡み合った4ビット状態から得られる。
3Dパラレルグラムのベクトル領域は、絡み合った6ビット状態から導出される。
3D並列入力の体積は、絡み合った9ビット状態から推定される。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:50:28 GMT)
Apparent teleportation of indistinguishable particles [0.0] 量子テレポーテーション(quantum teleportation)と近年の量子粒子テレポーテーション(quantum particle teleportation)という2つの現象が量子力学によって予測された。
本稿では,第3のテレポーテーション現象について紹介する。
これは標準模型の識別不能な素粒子と反粒子の自然な結果であると考えられる。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:11:48 GMT)
Analysis and Resilience of the U.S. Flight Network [0.0] 本稿では,米国フライトネットワークのトポロジがその効率性と脆弱性にどのように貢献するかを考察する。
様々なパーコレーションテストにより、USFNは標的となる攻撃に対して脆弱であり、主要なハブの1つが失敗した場合、カスケード障害を完遂する恐れがあることが判明した。
論文参考訳(メタデータ) (Fri, 16 May 2025 03:13:54 GMT)
An agentic system with reinforcement-learned subsystem improvements for parsing form-like documents [0.0] 本稿では,Large Language Model (LLM)エージェントと強化学習ドライバエージェントを利用して,一貫性のある自己改善抽出を自動化するエージェントAIシステムを提案する。
我々の研究は、モノリシックなLCMベースの抽出の限界を強調し、タスク固有のプロンプトを備えたモジュール化されたマルチエージェントフレームワークを導入しました。
この自己修正適応システムは、人間の介入なしに正確な情報抽出を自動化することを目的として、多様な文書、ファイル形式、レイアウト、LLMを処理する。
論文参考訳(メタデータ) (Fri, 16 May 2025 09:46:10 GMT)
An Enhanced YOLOv8 Model for Real-Time and Accurate Pothole Detection and Measurement [0.0] 既存の検出方法は、通常2次元RGB画像のみに基づいており、ポットホールの物理的特性を正確に分析することはできない。
本稿では, RGB-D画像のデータセット(PothRGBD)を作成し, ポットホール検出とポットホール物理特徴解析の両方に改良されたYOLOv8モデルを提案する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:12:38 GMT)
Addition is almost all you need: Compressing neural networks with double binary factorization [0.0] 二重二元因子化(DBF)は、密度重み行列を2つの二元行列の積に分解する新しい方法である。
DBFは2値表現の効率性を保ちつつ、最先端の手法と競合する圧縮率を達成する。
重量あたりの2ビットでは、DBFはQuIP#やQTIPのような最高の量子化手法と競合する。
論文参考訳(メタデータ) (Fri, 16 May 2025 10:07:36 GMT)
Adaptive and Robust Image Processing on CubeSats [0.0] CubeSatsは、特に地球観測のための低コストなプラットフォームを提供する。
本稿では,DIPPとDIHという2つの新しいシステムを紹介し,これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 16 May 2025 16:03:04 GMT)
Adaptive Linear Embedding for Nonstationary High-Dimensional Optimization [0.0] Self-Adaptive embedding REMBO (SA-REMBO) はランダムEMBdding Bayesian Optimization (REMBO) を一般化して複数のランダムガウス埋め込みをサポートする新しいフレームワークである。
インデックス変数は埋め込み選択を制御し、サロゲート内の製品カーネルを介して潜伏潜伏子と共同でモデル化される。
従来のREMBO法や他の低ランクBO法が失敗する合成および実世界の高次元ベンチマークにおいて,本手法の利点を実証的に示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 14:18:19 GMT)
Accelerating Natural Gradient Descent for PINNs with Randomized Numerical Linear Algebra [0.0] Natural Gradient Descent (NGD)は、ニューラルネットワークに基づく偏微分方程式(PDE)の学習のための有望な最適化アルゴリズムとして登場した。
我々は,行列フリーNGDを従来考えられていたよりも幅広い問題のクラスに拡張し,内部CGソルバの収束を加速するためにランダム化Nystr"omプレコンディショニング(Randomized Nystr)の利用を提案する。
このアルゴリズムは、ニューラルネットワークを用いて識別された様々なPDE問題に対して、既存のNGDベースの手法よりも大幅に性能が向上したことを示す。
論文参考訳(メタデータ) (Fri, 16 May 2025 19:00:40 GMT)
Absence of censoring inequalities in random quantum circuits [0.0] 我々は、あるゲートが削除されたときに、およそ2ドルの設計深度が減少するようなアーキテクチャのファミリを構築する。
また、この構成に関する直観を述べるとともに、この結果が1Dブリックワークのおよそ$t$-designの深さとの関係について論じる。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:48:18 GMT)
ACSE-Eval: Can LLMs threat model real-world cloud infrastructure? [0.0] 本稿では,大規模言語モデルを評価するための新しいデータセットであるAWS Cloud Security Engineering Evalを紹介する。
ACSE-Evalには、100のプロダクショングレードのAWSデプロイメントシナリオが含まれており、それぞれが詳細なアーキテクチャ仕様を備えている。
本データセットは,LLMのセキュリティリスクを特定し,攻撃ベクトルを分析し,緩和戦略を提案するためのシステム評価を可能にする。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:40:09 GMT)
A-I-RAVEN and I-RAVEN-Mesh: Two New Benchmarks for Abstract Visual Reasoning [0.0] 抽象的な視覚的推論領域におけるディープニューラルネットワークの一般化と知識再利用能力について検討する。
本稿では,Attributeless-I-RAVEN (A-I-RAVEN) について紹介する。
I-RAVEN-Meshはラインベースパターンからなる新しいコンポーネント構造でRPMを強化したデータセットである。
論文参考訳(メタデータ) (Fri, 16 May 2025 12:01:46 GMT)
A finite-sample bound for identifying partially observed linear switched systems from a single trajectory [0.0] 線形切替系に対するシステム同定アルゴリズムのパラメータ推定誤差に基づいて有限サンプル確率境界を導出する。
我々の境界は、真の系が二次安定性を示すという仮定の下で統計的整合性を保証する。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:30:41 GMT)
A computational system to handle the orthographic layer of tajwid in contemporary Quranic Orthography [0.0] 我々は、カイロ・クルランで遭遇するタジウィドの規則の体系性を探る。
そこで我々は,CQO のQuranic テキストから Tajwid の正書層を除去または付加できる python モジュールを開発した。
論文参考訳(メタデータ) (Fri, 16 May 2025 15:41:51 GMT)
A comprehensive exploration of interaction networks reveals a connection between entanglement and network structure [0.0] 相互作用ネットワークの構造と量子イジングモデルの固有状態絡み合いの関係について検討する。
その結果、量子イジングモデルの最小固有状態絡み合いは、相互作用ネットワークの特定の構造によって制御されることを示した。
論文参考訳(メタデータ) (Fri, 16 May 2025 17:21:46 GMT)
A Superlinearly Convergent Evolution Strategy [0.0] 本稿では,進化戦略と準ニュートン法とのハイブリッドアルゴリズムを提案する。
提案手法は、非エリート進化戦略でよく見られるグローバルな組換えステップを準ニュートンステップで置き換える。
数値計算の結果、超線形収束が示され、特に滑らかな凸問題における性能が向上した。
論文参考訳(メタデータ) (Fri, 16 May 2025 08:33:30 GMT)
A Step towards Interpretable Multimodal AI Models with MultiFIX [0.0] MultiFIXは、解釈可能性駆動型マルチモーダルデータ融合パイプラインである。
明確に異なるモダリティから特徴を区別し、それらを組み合わせて最終的な予測を行う。
特徴抽出と予測モデリングのための複数のトレーニング戦略を用いて,MultiFIXの使用について検討する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:54:29 GMT)
A Set-Sequence Model for Time Series [0.0] 多くの金融予測問題において、個々の単位の振舞いは観測可能な単位レベル因子とマクロ経済変数の影響を受けている。
ハンドクラフト機能を必要としないセットシーケンスモデルを提案する。
提案手法は断面の集合の性質を利用し, 単位数に対して線形時間で集合和を生成する。
論文参考訳(メタデータ) (Fri, 16 May 2025 13:36:07 GMT)
A Physics-Informed Convolutional Long Short Term Memory Statistical Model for Fluid Thermodynamics Simulations [0.0] 流体熱力学の直接数値シミュレーションは計算的に禁止されている。
本稿では、対流の標準例であるRBCの物理インフォームドアーキテクチャを提案する。
推論は、解釈可能性を確保するために、支配的偏微分方程式に対して罰せられる。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:47:00 GMT)
A Convolution-Based Gait Asymmetry Metric for Inter-Limb Synergistic Coordination [0.0] 本研究では歩行中の様々な身体部位の速度パターンに着目し,歩行対称性を評価する方法を提案する。
従来の運動解析研究は、筋電図(EMG)信号の差や左右の加速度に基づいて歩行対称性を評価してきた。
論文参考訳(メタデータ) (Fri, 16 May 2025 05:19:55 GMT)
A Computational Theory for Efficient Mini Agent Evaluation with Causal Guarantees [0.0] 無限エージェントに対する与えられた評価モデルの一般化誤差と一般化因果効果誤差の上限を証明した。
また, 提案手法の効率性, 推定因果効果の整合性, 評価指標の推算による評価を行う。
論文参考訳(メタデータ) (Fri, 16 May 2025 06:20:15 GMT)
$whittlehurst$: A Python package implementing Whittle's likelihood estimation of the Hurst exponent [0.0] $whittlehurst$は、分数的なブラウン運動(fBm)においてハースト指数を推定するWhittleの可能性メソッドを実装するPythonパッケージである。
我々は,この手法を,合成および実世界のデータに対する他のHurst指数推定手法と比較した。
論文参考訳(メタデータ) (Fri, 16 May 2025 21:24:43 GMT)