Latent Action Pretraining from Videos [156.9] 一般行動モデル(LAPA)のための潜在行動事前訓練について紹介する。
LAPA(英: LAPA)は、VLA(Vision-Language-Action)モデルに接地型ロボットアクションラベルを含まない教師なしの訓練方法である。
本稿では,ロボットアクションラベルを持たないインターネット規模のビデオから学習する手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:13:37 GMT)
WorldPM: Scaling Human Preference Modeling [130.2] 我々は、このスケーリングの可能性を強調するために、World Preference Modeling$ (WorldPM)を提案する。
多様なユーザコミュニティをカバーする公開フォーラムから選好データを収集する。
1.5Bから72Bパラメータの範囲で15Mスケールのデータを用いて広範囲なトレーニングを行う。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:38:37 GMT)
Does Liking Yellow Imply Driving a School Bus? Semantic Leakage in Language Models [113.6] 我々は、モデルが予期しない方法でプロンプトから生成元に無関係な情報を漏らす現象を識別し、特徴付けする。
本研究では,人間と自動の両方でセマンティックリークを検出するための評価設定を提案し,その振る舞いを診断するための多様なテストスイートをキュレートし,13のフラッグシップモデルにおいて重要なセマンティックリークを測定する。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:44:28 GMT)
DataSentinel: A Game-Theoretic Detection of Prompt Injection Attacks [101.5] LLM統合されたアプリケーションとエージェントは、インジェクション攻撃に弱い。
検出方法は、入力が注入プロンプトによって汚染されているかどうかを判定することを目的とする。
本研究では,迅速なインジェクション攻撃を検出するゲーム理論手法であるDataSentinelを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:05:48 GMT)
Model Utility Law: Evaluating LLMs beyond Performance through Mechanism Interpretable Metric [99.6] 大規模言語モデル(LLM)は、学術、産業、そして日々のアプリケーションに欠かせないものになっている。
大規模言語モデル (LLM) 時代における評価の課題の1つは一般化問題である。
従来の性能スコアを補完するメカニズムの解釈可能性向上指標であるモデル利用指数(MUI)を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:16:17 GMT)
Disentangling Memory and Reasoning Ability in Large Language Models [97.3] 本稿では、複雑な推論プロセスを2つの異なる明確なアクションに分解する新しい推論パラダイムを提案する。
実験の結果, この分解によりモデル性能が向上し, 推論プロセスの解釈可能性も向上することがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:05:43 GMT)
Plasticity as the Mirror of Empowerment [94.9] 可塑性は環境のエンパワーメントと同一であることを示す。
我々は, 可塑性, エンパワーメント, およびそれらの関係性は, エージェンシーの理解に不可欠であることを示唆する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:52:16 GMT)
ABKD: Pursuing a Proper Allocation of the Probability Mass in Knowledge Distillation via $α$-$β$-Divergence [89.6] 知識蒸留(KD)は、大きな教師モデルからより小さな学生モデルに知識を伝達する。
KDの中核的な課題は、2つのモード集中効果のバランスにある。
我々は$alpha$$beta$-divergenceを持つ汎用フレームワークであるABKDを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:13:43 GMT)
Beyond 'Aha!': Toward Systematic Meta-Abilities Alignment in Large Reasoning Models [86.9] 大型推論モデル(LRMs)はすでに長い連鎖推論のための潜在能力を持っている。
我々は、自動生成の自己検証タスクを使用して、モデルに推論、帰納、誘拐の3つのメタ能力を持たせることを明確にした。
我々の3つのステージ・パイプラインの個別アライメント、パラメータ空間のマージ、ドメイン固有の強化学習は、命令調整ベースラインと比較して10%以上のパフォーマンス向上を実現します。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:58:33 GMT)
Advances in Radiance Field for Dynamic Scene: From Neural Field to Gaussian Field [85.1] 本研究では,放射場を用いた動的シーン表現に着目した200以上の論文の体系的分析を行った。
我々は,多種多様な方法論的アプローチを統一的な表現的枠組みの下で組織し,永続的な課題の批判的検討と有望な研究方向性を結論づける。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:51:08 GMT)
RM-R1: Reward Modeling as Reasoning [81.5] Reasoning Reward Models (ReasRMs) は、報酬モデリングを推論タスクとして定式化する。
我々は推論指向のトレーニングパイプラインを提案し、ReasRMのファミリーであるRM-R1を訓練する。
我々のモデルは、平均して3つの報酬モデルベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:14:49 GMT)
The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a Reasoning Model will Think [81.4] 本稿では,モデル推論の分析とステアリングのためのフレームワークであるCoT Encyclopediaを紹介する。
本手法はモデル生成CoTから多種多様な推論基準を自動的に抽出する。
このフレームワークは既存の手法よりも解釈可能で包括的分析が可能であることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:31:02 GMT)
PointArena: Probing Multimodal Grounding Through Language-Guided Pointing [79.8] ポインティングは、視覚的コンテキスト内で言語を接地するための基本的で直感的なメカニズムとして機能する。
多様な推論シナリオを対象とするマルチモーダル評価のための総合的なプラットフォームであるPointArenaを紹介した。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:04:42 GMT)
Logos as a Well-Tempered Pre-train for Sign Language Recognition [75.4] 本稿では,ロシア語 Sign Language (RSL) データセットであるLogosについて述べる。
Logosデータセットに事前トレーニングされたモデルが,他の言語SLRタスクのユニバーサルエンコーダとして使用できることを示す。
視覚的に類似した標識を明示的にラベル付けすることで、下流タスクのためのビジュアルエンコーダとして訓練されたモデル品質が向上することを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:31:49 GMT)
Understanding In-context Learning of Addition via Activation Subspaces [74.9] そこで本研究では,入力に整数$k$を追加するという真の予測ルールを,数発の学習タスクのファミリーで検討する。
Llama-3-8Bは、このタスクにおいて、$k$の範囲で高い精度を達成し、わずか3つのアテンションヘッドに、その数ショットの能力をローカライズする。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:19:33 GMT)
Pose Priors from Language Models [74.6] 言語はしばしば物理的相互作用を記述するために使用されるが、ほとんどの3次元人間のポーズ推定方法は、この豊富な情報ソースを見下ろしている。
我々は、コンタクトポーズの再構築に先立って、大型マルチモーダルモデル(LMM)を活用することにより、このギャップを埋める。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:35:43 GMT)
KBAlign: Efficient Self Adaptation on Specific Knowledge Bases [73.3] 本稿では,効率的なモデル適応によりRAGシステムを強化する自己教師型フレームワークKBAlignを提案する。
私たちのキーとなる洞察は、2つの革新的なメカニズムを通じて、モデルの本質的な能力を知識の整合性に活用することです。
KBAlign は GPT-4 による適応によって得られる性能向上の90%を達成できることを示した。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:02:21 GMT)
CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion [73.1] レイアウト、視点、形状、意味といった重要な絵の属性は、しばしばスタイル転送によって伝達され、表現されない。
大規模な事前訓練された画像生成モデルは、大量の高品質な画像を合成できることを実証している。
我々の主要なアイデアは、スタイルを現実の世界に移すのではなく、多モーダルな意味情報を合成ガイドとしてアートに組み込むことである。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:04:37 GMT)
Simple and Provable Scaling Laws for the Test-Time Compute of Large Language Models [70.1] 本研究では,大規模言語モデルのテスト時間計算において,証明可能なスケーリング法則を享受する2つのアルゴリズムを提案する。
1つは2段階ノックアウト方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
もう1つは2段階のリーグ方式のアルゴリズムで、各候補は複数の相手に対して平均勝利率で評価される。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:06:27 GMT)
Beyond Next Token Prediction: Patch-Level Training for Large Language Models [69.7] 大規模言語モデル(LLM)に対するパッチレベルのトレーニングを導入する。
パッチレベルのトレーニングでは、言語モデルの短いパッチシーケンスをフィードし、次のパッチを予測するようにトレーニングします。
パッチレベルのトレーニングは、モデルのパフォーマンスを損なうことなく、全体のトレーニングコストを0.5$times$に削減できることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:15:13 GMT)
KwaiChat: A Large-Scale Video-Driven Multilingual Mixed-Type Dialogue Corpus [69.5] 本稿では,人間間ビデオ駆動型多言語混在型対話コーパスを提案する。
KwaiChatのコーパスには合計93,209の動画と246,080の対話があり、4つの対話タイプ、30のドメイン、4つの言語、13のトピックが含まれている。
KwaiChat上での 7 つの異なる LLM の解析により、GPT-4o が最高の性能を発揮するが、この状況では性能が良くないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:37:01 GMT)
J1: Incentivizing Thinking in LLM-as-a-Judge via Reinforcement Learning [69.1] このようなモデルをトレーニングするための強化学習アプローチであるJ1を紹介する。
本手法は,判断バイアスを軽減し,思考にインセンティブを与える検証可能な報酬を用いて,検証可能なプロンプトと検証不可能なプロンプトの両方を判断タスクに変換する。
評価基準を概説し、自己生成した基準回答と比較し、モデル応答の正しさを再評価することにより、モデルがより良い判断を下すことが判明した。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:05:15 GMT)
SafePath: Conformal Prediction for Safe LLM-Based Autonomous Navigation [67.2] SafePathは,LLM(Large Language Models)を公式な安全保証とともに拡張するフレームワークである。
第1段階では,多様な候補経路を生成するLCMを用いて,エージェントの挙動と環境条件に基づく軌道探索を行う。
第2段階では、SafePathはリスクの高いトラジェクトリをフィルタリングし、少なくとも1つのセーフオプションがユーザ定義の確率に含まれていることを保証します。
最終段階では,不確実性が低い場合や不確実性が高い場合,人間に制御を委譲する場合の衝突リスクが最も低い経路を選択する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:22:20 GMT)
PersLLM: A Personified Training Approach for Large Language Models [66.2] データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:22:08 GMT)
Depth Anything with Any Prior [64.4] Prior Depth Anythingは、深さ測定における不完全だが正確な計量情報と深さ予測における相対的だが完全な幾何学的構造を組み合わせたフレームワークである。
本研究では, 単眼深度推定(MDE)モデルを構築し, 深度推定の固有ノイズを改良する。
われわれのモデルは、7つの現実世界のデータセットにまたがる深度補完、超高解像度、インパインティングという、印象的なゼロショットの一般化を見せている。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:59:50 GMT)
Task-Core Memory Management and Consolidation for Long-term Continual Learning [62.9] 我々は、長期連続学習(CL)タスクに焦点を合わせ、時間とともに膨大なタスクのストリームからモデルを逐次学習する。
従来のCL設定とは異なり、長期CLははるかに多くのタスクを処理し、破滅的な忘れ込みの問題を悪化させる。
長期連続学習(Long-CL)のための人間の記憶機構に着想を得た新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:22:35 GMT)
MapExplorer: New Content Generation from Low-Dimensional Visualizations [60.0] 低次元の可視化や「投影マップ」は大規模で複雑なデータセットの解釈に広く用いられている。
これらの視覚化は、既存の知識空間を理解するのに役立つだけでなく、未知の領域への探索を暗黙的にガイドする。
プロジェクションマップ内の座標をコヒーレントでコンテキストに整合したテキストコンテンツに変換する新しい知識発見タスクであるMapExplorerを紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:57:43 GMT)
Reinforced Interactive Continual Learning via Real-time Noisy Human Feedback [59.8] 本稿では,AIモデルがリアルタイムフィードバックから新たなスキルを動的に学習する対話型連続学習パラダイムを提案する。
大規模言語モデル(LLM)を活用した強化型対話型連続学習フレームワークRiCLを提案する。
我々のRiCLアプローチは、最先端のオンライン連続学習とノイズラベル学習の既存の組み合わせを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:22:03 GMT)
100 Days After DeepSeek-R1: A Survey on Replication Studies and More Directions for Reasoning Language Models [59.0] 最近のDeepSeek-R1のリリースは、広く社会的影響をもたらし、言語モデルの明確な推論パラダイムを探求する研究コミュニティに熱意を喚起した。
リリースされたモデルの実装詳細は、DeepSeek-R1-Zero、DeepSeek-R1、蒸留された小型モデルなど、DeepSeekによって完全にオープンソース化されていない。
多くのレプリケーション研究は、DeepSeek-R1が達成した強力なパフォーマンスを再現することを目的として、同様のトレーニング手順と完全なオープンソースデータリソースを通じて、同等のパフォーマンスに到達している。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:16:03 GMT)
Temporal Scaling Law for Large Language Models [57.8] 本稿では,LLMの試験損失が,トレーニングステップのスケールアップとともにどのように進展するかを考察する,時間スケーリング法の概念を提案する。
テスト損失全体を粗い粒度でモデル化するのとは対照的に、私たちはそれを分解して、各トークン位置のきめ細かいテスト損失に飛び込みます。
動的双曲法則におけるパラメータの時間的パターンを研究することにより、より正確な時間的スケーリング法則を導出する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:48:26 GMT)
CAFE: Retrieval Head-based Coarse-to-Fine Information Seeking to Enhance Multi-Document QA Capability [55.5] 複数文書の問合せ能力を向上させるための2段階の粗大化手法である$textbfCAFE$を紹介した。
CAFEは、Mistralモデル上でのSFT法とRAG法よりも最大22.1%と13.7%のSubEM改善を実現している。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:05:12 GMT)
Learned Lightweight Smartphone ISP with Unpaired Data [55.2] 学習可能な画像信号処理装置(ISP)のための新しいトレーニング手法を提案する。
我々の未経験アプローチは、敵の訓練によって導かれる多段階の損失関数を用いる。
ペア学習法と比較すると,我々の未経験学習戦略は強い可能性を示し,高い忠実性を実現する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:37:51 GMT)
Enhancing Collaboration Through Google Workspace: Assessing and Strengthening Current Practices [55.2] 目的は、マカティ大学でのブレンド学習実践の強化において、Google Workspaceが果たす役割を評価することである。
調査の結果、Google Workspaceはチームワークを促進する上で「非常に効果的」(平均スコア4.61)と評価された。
ターゲットトレーニングを通じてユーザの採用を高め、オフライン機能を改善することが推奨されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:18:25 GMT)
MMLongBench: Benchmarking Long-Context Vision-Language Models Effectively and Thoroughly [55.1] 長文視覚言語モデル(LCVLM)は、数百の画像を1つのフォワードパスでインターリーブされたテキストトークンで処理することができる。
MMLongBenchは、様々な長いコンテキストの視覚言語タスクをカバーする最初のベンチマークである。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:52:54 GMT)
IntrinsicEdit: Precise generative image manipulation in intrinsic space [53.4] そこで本研究では,固有画像空間で動作する汎用的生成ワークフローを提案する。
我々はアイデンティティの保存と内在チャネルの絡み合いの鍵となる課題に対処する。
我々は,グローバル照明効果の自動分解による高精度かつ効率的な編集を可能にする。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:19:01 GMT)
Estimating the Diameter at Breast Height of Trees in a Forest With a Single 360 Camera [52.9] 森林在庫は、生態モニタリング、資源管理、炭素会計のために、乳房の高さ(DBH)の直径の正確な測定に頼っている。
LiDARベースの技術はセンチメートル単位の精度を達成できるが、コストは抑えられ、運用上複雑である。
コンシューマグレードの360度ビデオカメラしか必要としない低価格の代替機を提示する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:24:44 GMT)
ADHMR: Aligning Diffusion-based Human Mesh Recovery via Direct Preference Optimization [51.9] 本稿では、拡散に基づくHMRモデルを好みの最適化方法でアライメントするADHMRを提案する。
まず、人間のメッシュ予測モデルであるHMR-Scorerを訓練し、3Dアノテーションを使わずに、Wild画像であっても予測を評価する。
次に、HMR-Scorerを使用して好みのデータセットを作成し、各入力画像は勝者と敗者メッシュ予測のペアを持つ。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:04:51 GMT)
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners [51.3] 重み分布を改良し、量子化アライメントを改善するために、特異値対角展開を導入する。
我々のプラグアンドプレイウェイト量子化法は、最先端のアプローチよりも大幅に性能が向上したことを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:34:45 GMT)
S3C2 Summit 2024-09: Industry Secure Software Supply Chain Summit [50.9] ここ数年、ソフトウェアサプライチェーンをターゲットにしたサイバー攻撃が急増している。
ソフトウェアサプライチェーン攻撃の脅威は、ソフトウェア業界と米国政府から関心を集めている。
NSFが支援するSecure Software Supply Chain Center (S3C2)の3人の研究者がSecure Software Supply Chain Summitを開催した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:48:14 GMT)
AD-LLM: Benchmarking Large Language Models for Anomaly Detection [50.6] 本稿では,大規模な言語モデルが異常検出にどのように役立つかを評価する最初のベンチマークであるAD-LLMを紹介する。
我々は、ゼロショット検出、LLMの事前訓練された知識を用いて、タスク固有のトレーニングなしでADを実行すること、データ拡張、ADモデルを改善するために合成データとカテゴリ記述を生成すること、LLMを使用して教師なしADモデルを提案するモデル選択の3つの主要なタスクについて検討する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:46:39 GMT)
Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.8] 本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:55:55 GMT)
TimeBridge: Non-Stationarity Matters for Long-term Time Series Forecasting [49.6] TimeBridgeは、非定常性と依存性モデリングの間のギャップを埋めるために設計された新しいフレームワークである。
TimeBridgeは、短期予測と長期予測の両方において、最先端のパフォーマンスを一貫して達成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:21:39 GMT)
Evolution imposes an inductive bias that alters and accelerates learning dynamics [49.2] 進化的最適化がニューラルネットワークの学習力学に与える影響について検討する。
我々は,アルゴリズムの自然選択とオンライン学習を組み合わせて,ニューラルネットワークの進化的条件付け手法を開発した。
結果は、進化はニューラルネットワークをチューニングして迅速な学習を可能にする誘導バイアスを構成することを示唆している。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:50:57 GMT)
UniCAD: Efficient and Extendable Architecture for Multi-Task Computer-Aided Diagnosis System [48.8] 2次元画像と3次元画像の両方をシームレスに扱う統一アーキテクチャUniCADを提案する。
低ランク適応戦略を用いて、トレーニング済みの視覚モデルを医用画像領域に適応させ、完全に調整された視覚モデルと同等の性能を達成する。
この統合CADアーキテクチャに基づいて、研究者が軽量CAD専門家を共有・アクセスできるオープンソースのプラットフォームを構築します。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:49:27 GMT)
VRSplat: Fast and Robust Gaussian Splatting for Virtual Reality [47.7] われわれはVRSplatを導入し、3DGSの最近の進歩を総合してVRの難題に挑戦する。
VRSplatは、最新のVRアプリケーションをサポートし、ポップアップやステレオ破壊フローターを排除しながら72以上のFPSを達成することができる、最初の、体系的に評価された3DGSアプローチである。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:17:48 GMT)
Unlocking early fault-tolerant quantum computing with mitigated magic dilution [47.2] 我々は小角回転の合成手法として緩和魔法希釈(MMD)を導入する。
雑音を符号化したマジック状態の論理回路をサンプリングするために、量子誤差軽減手法を用いる。
この研究は、数百万の量子演算をサポートするデバイス上での早期フォールトトレラントなデモの道を開いた。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:19:19 GMT)
Targeted Data Fusion for Causal Survival Analysis Under Distribution Shift [46.8] 複数のデータソースにまたがる因果推論は、科学的発見の一般化性と複製性を高めるための有望な道を提供する。
既存のアプローチでは、検閲や離散的かつ連続的な時間の統合など、生存分析のユニークな課題に対処できない。
マルチソース設定におけるターゲットサイト固有の因果効果を推定する2つの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:48:30 GMT)
InfraFix: Technology-Agnostic Repair of Infrastructure as Code [46.8] InfraFixはIaCスクリプトを修復するための最初の技術に依存しないフレームワークである。
95.7%の成功率で254,288件の修理シナリオで有効性を実証した。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:36:23 GMT)
A Modular Approach for Clinical SLMs Driven by Synthetic Data with Pre-Instruction Tuning, Model Merging, and Clinical-Tasks Alignment [46.8] 小型言語モデル(SLM)は、GPT-4のような大規模言語モデルに代わる費用対効果を提供する。
SLMは費用対効果のある代替手段を提供するが、その限られた能力は生物医学的な領域適応を必要とする。
本研究では,SLMを高性能な臨床モデルに適用するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:40:21 GMT)
Optimizing Electric Bus Charging Scheduling with Uncertainties Using Hierarchical Deep Reinforcement Learning [46.2] 電気バス(EB)は持続可能な開発に向けた重要な一歩である。
モノのインターネット(IoT)システムを利用することで、充電ステーションはリアルタイムデータに基づいて充電スケジュールを自律的に決定できる。
しかし、旅行時間の不確実性、エネルギー消費、電力価格の変動などにより、EB充電スケジュールの最適化は依然として重要な課題である。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:44:27 GMT)
Electric Bus Charging Schedules Relying on Real Data-Driven Targets Based on Hierarchical Deep Reinforcement Learning [46.2] 深部強化学習(DRL)に基づく電気バス(EB)の充電スケジューリング問題の検討
高レベルエージェントは、充電期間毎に充電目標を規定する効果的なポリシーを学習し、低レベルエージェントは、1回の充電期間内に各ステップの充電パワーを設定するための最適なポリシーを学習する。
最適高レベル政策と最適低レベル政策を重畳して構築された平坦な政策が、元のMDPの最適政策と同様に機能することが証明された。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:13:41 GMT)
Parallel Scaling Law for Language Models [45.8] モデルの並列計算をトレーニング時間と推論時間の両方で増加させるという,3番目の,より推論効率のよいスケーリングパラダイムを導入します。
理論的に新しいスケーリング法則を提案し,それを大規模事前学習により検証することにより,$P$並列ストリームを持つモデルがより優れた推論効率を示しつつパラメータを$O(log P)$にスケーリングするのと類似していることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:24:45 GMT)
Single View Garment Reconstruction Using Diffusion Mapping Via Pattern Coordinates [45.5] 画像から3Dの服を着た人間を再構築することは、仮想トライオン、アバター作成、混合現実などの応用に基本となる。
本稿では,2次元および3次元の表現をブリッジする単一画像から高忠実度3次元衣服を復元する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:51:50 GMT)
EmbodiedMAE: A Unified 3D Multi-Modal Representation for Robot Manipulation [44.1] EmbodiedMAEはロボット操作のための統一された3D表現である。
EmbodiedMAEは、最先端のビジョン基盤モデルより一貫して優れている。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:12:17 GMT)
Demonstrating specification gaming in reasoning models [43.6] OpenAI o3やDeepSeek R1のような推論モデルは、しばしばデフォルトでベンチマークをハックします。
我々は、現実的なタスクプロンプトを使用し、過剰なヌードを避けることで、先行作業を改善する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:42:18 GMT)
Auditing Fairness by Betting [43.5] 我々は,デプロイされた分類モデルと回帰モデルの公平性を評価するための,実用的で効率的で非パラメトリックな手法を提供する。
我々の手法は逐次的であり、入ってくるデータの継続的なモニタリングを可能にする。
提案手法の有効性を3つのベンチマークフェアネスデータセットに示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:34:31 GMT)
UICopilot: Automating UI Synthesis via Hierarchical Code Generation from Webpage Designs [43.0] 本稿では,Webページの設計から階層的なコード生成によってユーザインタフェース(UI)を自動生成する手法を提案する。
UICopilotの基本的な考え方は、生成プロセスを2つのステージに分解することである。
実験の結果、UICopilotは、自動評価と人的評価の両方において、既存のベースラインを大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:09:54 GMT)
Harnessing Multiple Large Language Models: A Survey on LLM Ensemble [42.8] 本稿では,LLM アンサンブルにおける最近の展開の体系的レビューを行う。
本稿では, LLM アンサンブルの分類について紹介し, 関連するいくつかの研究課題について論じる。
また、「アンサンブル前推論、アンサンブル後推論、アンサンブル後推論」という幅広いカテゴリの手法のより詳細な分類も提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:08:51 GMT)
Optimizing Power Grid Topologies with Reinforcement Learning: A Survey of Methods and Challenges [42.6] 電力ネットワーク制御(PNC)への有望なアプローチとして強化学習(RL)が登場した。
本稿では電力グリッドトポロジ最適化のためのRLアプリケーションの概要を紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:22:35 GMT)
Advancing Multiple Instance Learning with Continual Learning for Whole Slide Imaging [42.6] MILモデルの注意層でCLを解析し,主にMILモデルの注意層に集中していることを確認した。
MILにおけるCL改善のための2つのコンポーネントを提案する: 意識的知識蒸留(AKD)と擬似Bagメモリプール(PMP)。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:41:49 GMT)
Asymptotically-Optimal Gaussian Bandits with Side Observations [42.4] 一般情報を用いたガウシアン・バンディットの問題について検討する。
本研究では,まず,遺言に基づくLPベース,インスタンス依存の下位境界を構築する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:43:42 GMT)
AutoCam: Hierarchical Path Planning for an Autonomous Auxiliary Camera in Surgical Robotics [41.7] AutoCamは、ロボットによる最小侵襲手術の可視化を改善するための、自動補助カメラ配置方法である。
ユーザーによる調査では、システムは健全な特徴の99.84%の可視性を保ち、ポーズエラーは4.36$pm$2.11°に達した。
以上の結果から,da Vinci患者側マニピュレータを用いて補助カメラを自律的に制御し,正常な特徴を追跡できることが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:21:46 GMT)
Fast and Robust: Task Sampling with Posterior and Diversity Synergies for Adaptive Decision-Makers in Randomized Environments [40.9] Posterior and Diversity Synergized Task Smpling (PDTS) は、高速かつ堅牢なシーケンシャルな意思決定を実現するための、実装が容易な方法である。
PDTSは、堅牢なアクティブタスクサンプリングの可能性を解き、挑戦的なタスクにおけるゼロショットおよび少数ショット適応ロバスト性を大幅に改善し、特定のシナリオ下での学習プロセスを加速する。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:51:26 GMT)
Pre-Act: Multi-Step Planning and Reasoning Improves Acting in LLM Agents [40.7] 大規模言語モデル(LLM)におけるReAct能力は、現代のエージェントシステムの基盤となっている。
マルチステップ実行計画を作成することでエージェントのパフォーマンスを向上させる新しいアプローチであるPre-Actを導入する。
我々のアプローチは会話エージェントと非会話エージェントの両方に適用できる。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:17:47 GMT)
High Quality Underwater Image Compression with Adaptive Correction and Codebook-based Augmentation [40.3] 圧縮効率を向上させるため,水中画像特化機能を利用したHQUICを提案する。
HQUICはALTCモジュールを使用して、画像の減衰係数と大域的な光情報を適応的に予測する。
また、コードブックを補助ブランチとして使用して、水中画像内の共通オブジェクトを抽出する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:52:11 GMT)
Hierarchical Learning and Computing over Space-Ground Integrated Networks [40.2] 地上IoTデバイス上で,局所的に訓練されたモデルに対してグローバルアグリゲーションサービスを提供するための階層的学習・計算フレームワークを提案する。
モデルアグリゲーションのネットワークエネルギー問題を定式化し、これはDST問題であることが判明した。
代用有向グラフ上で最小スパンニングアーボラッセンスを求めることでDST問題を解決するためのトポロジカル・アウェア・エネルギ効率・ルーティング(TAEER)アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:20:48 GMT)
Temporal Triplane Transformers as Occupancy World Models [39.3] T$3$Formerは、自動運転のための新しい4D占有型世界モデルである。
1.44$times$のスピードアップを実現し、平均IoUを36.09に改善し、平均絶対計画誤差を1.0mに下げる。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:04:19 GMT)
Continuity and Isolation Lead to Doubts or Dilemmas in Large Language Models [38.9] 我々はトランスフォーマーにおける2つの現象、すなわち孤立と連続性の存在を示す。
コンパクトな位置符号化を用いた変換器にこれらの現象が現れることを数学的に証明する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:24:14 GMT)
PyramidKV: Dynamic KV Cache Compression based on Pyramidal Information Funneling [38.7] ピラミッドKVは新規かつ効果的なKVキャッシュ圧縮法である。
提案手法は,KVキャッシュの12%しか保持せず,完全なKVキャッシュでモデルの性能と一致していることを示す。
Needle-in-a-Haystack実験では、Praamid KVは長文理解の維持において競合する手法より優れている。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:18:12 GMT)
S2-Track: A Simple yet Strong Approach for End-to-End 3D Multi-Object Tracking [38.6] 3D多重物体追跡(MOT)は自律運転知覚において重要な役割を担っている。
最近のエンドツーエンドのクエリベースのトラッカーは、オブジェクトを同時に検出および追跡し、3D MOTタスクの有望な可能性を示している。
既存の手法はまだ開発の初期段階にあり、体系的な改善が欠けている。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:26:53 GMT)
Telecom-to-Visible Quantum Frequency Converter on a Silicon Nitride Chip [38.4] シリコン窒化物(SiN)チップ上で可視領域と通信領域を接続する最初の量子周波数変換器を提案する。
我々はブラッグ散乱4波長混合を用いて、1260nmから698nmの1光子を上向きに変換する。
この結果は、量子ネットワークにおけるCMOS互換デバイスの実装の道を開くものである。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:27:04 GMT)
AdaptCLIP: Adapting CLIP for Universal Visual Anomaly Detection [38.0] 普遍的な視覚異常検出は、新しい視覚領域や見えない視覚領域からの異常を、追加の微調整なしで識別することを目的としている。
近年の研究では、CLIPのような事前学習された視覚言語モデルは、ゼロまたは少数の正常な画像で強力な一般化を示すことが示されている。
本稿では2つの重要な洞察に基づいて,AdaptCLIPと呼ばれるシンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:24:28 GMT)
On Technique Identification and Threat-Actor Attribution using LLMs and Embedding Models [37.8] 本研究は,法医学的資料から抽出した行動指標に基づいて,サイバー攻撃属性の大規模言語モデル(LLM)を評価する。
我々のフレームワークは、ベクトル埋め込み検索を用いてテキストからTPを識別し、学習する機械学習モデルに新しい攻撃を属性付けるプロファイルを構築する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:14:29 GMT)
Scaling Laws for Black box Adversarial Attacks [37.7] 逆例は通常、優れたクロスモデル転送性を示す。
モデルアンサンブルは、敵の例の転送可能性を改善する効果的な戦略である。
法則をスケールすることで、プロプライエタリなモデルでも90%以上のトランスファー攻撃の成功率を達成することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:18:43 GMT)
Sage Deer: A Super-Aligned Driving Generalist Is Your Copilot [37.7] 本稿では,スーパーアライン・ゲネラリストのDRivingエージェントであるSAGE DeeRを構築することを目的とする。
異なる人の好みや偏見に応じて異なる反応を達成する。
ユーザの生理的指標を判断するために、マルチビューとマルチモード入力を理解することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:08:44 GMT)
Multi-qubit entanglement generation with squeezed modes [37.7] 本稿では,複数の高忠実度ベルペアをプロトコルイテレーション毎に生成できる連続変数分散変数絡み合わせ生成プロトコルを提案する。
このプロトコルの有効性は,ベルペア数を増やすために,各追加のベルペアに対して約3dBの余分なスキューズが必要となる。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:36:12 GMT)
Charm: The Missing Piece in ViT fine-tuning for Image Aesthetic Assessment [36.6] 視覚変換器(ViT)は通常、ダウンスケーリングやトリミングによって得られる小さな、固定サイズの画像に基づいて訓練される。
本稿では,コンポジション,高解像度,アスペクト比,マルチスケール情報を同時に保存する新しいトークン化手法であるCharmを紹介する。
Charmは画像美的評価のためのViT性能と一般化性を改善する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:48:06 GMT)
MathCoder-VL: Bridging Vision and Code for Enhanced Multimodal Mathematical Reasoning [36.6] コードには、対応する図を生成するために必要なすべての情報を本質的にエンコードするので、クロスモーダルアライメントの監督としてコードを活用することを提案する。
具体的には、イメージ・トゥ・コード・モデルとデータセットをモデル・イン・ザ・ループ・アプローチで共同開発する。
我々は、ImgCode-8.6MでトレーニングしたMathCoder-VLを提案し、その後、マルチモーダル数学問題の解法としてMM-Math Instruct-3Mを微調整した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:59:21 GMT)
Rethinking Repetition Problems of LLMs in Code Generation [36.4] 本稿では,Grammarをベースとした反復ペナライゼーションであるRPGという,効率的な復号化手法を提案する。
RPGはまず文法ルールを活用して、コード生成中に繰り返しの問題を特定し、その後、繰り返しに寄与するクリティカルトークンの可能性を戦略的に崩壊させる。
大規模な実験結果によると、RPGはCodeRepetEvalデータセット上で最高のパフォーマンスのベースラインを大幅に上回っている。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:26:32 GMT)
Descriptive Image-Text Matching with Graded Contextual Similarity [36.3] 画像とテキストの文脈的類似度を段階的に学習するために,DITMと呼ばれる記述的画像テキストマッチングを提案する。
各文の記述性スコアを累積項の周波数逆文書頻度(TF-IDF)で定式化し、両者の相似性をバランスさせる。
本手法は文記述性を利用して,2つの重要な方法で堅牢な画像テキストマッチングを学習する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:21:00 GMT)
Teaching Humans Subtle Differences with DIFFusion [36.3] 本稿では、生成モデルを利用して、カテゴリ間の最小限の識別特徴を自動的に発見・可視化するシステムを提案する。
本手法は,データ不足の領域においても,クラス間の微妙なターゲット変換を施した対物的可視化を生成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:00:25 GMT)
SAS-Bench: A Fine-Grained Benchmark for Evaluating Short Answer Scoring with Large Language Models [36.1] SAS-Benchは、大規模言語モデル(LLM)ベースのショートアンサースコーリングタスクのベンチマークである。
詳細な、段階的なスコアリング、専門家による注釈付きエラーカテゴリ、さまざまな質問タイプを提供する。
また,1030の質問と4,109人の学生回答を含むオープンソースデータセットも公開しています。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:01:45 GMT)
Two Minds Better Than One: Collaborative Reward Modeling for LLM Alignment [35.8] 人間のフィードバックのノイズの多い好みは、しばしば報酬の一般化につながる。
ピアレビューとカリキュラム学習を組み合わせることでロバスト性を高めるオンラインフレームワークであるCollaborative Reward Modelingを提案する。
大規模な実験ではCRMが一般化を改善し、RewardBenchでは40%のラベルノイズで9.94ポイントの精度向上を実現している。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:58:20 GMT)
Multi-Objective Hyperparameter Selection via Hypothesis Testing on Reliability Graphs [35.6] 本稿では信頼性グラフに基づくPareto Testing(RG-PT)を紹介する。
RG-PTは偽発見率(FDR)の観点から正式な信頼性保証を維持する
これは有向非巡回グラフを通してハイパーパラメータ間の既知の関係を説明できる。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:49:09 GMT)
DINO-X: A Unified Vision Model for Open-World Object Detection and Understanding [35.5] IDEA Researchが開発した統合オブジェクト中心ビジョンモデルであるDINO-Xを紹介する。
DINO-Xは、オープンワールドオブジェクト理解のためのオブジェクトレベルの表現を追求するために、Grounding DINO 1.5と同じTransformerベースのエンコーダデコーダアーキテクチャを使用している。
我々は,プロンプトのないオープンワールド検出をサポートする汎用オブジェクトプロンプトを開発し,ユーザがプロンプトを提供することなく,画像中のあらゆるものを検出できるようにする。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:52:39 GMT)
Lightspeed Geometric Dataset Distance via Sliced Optimal Transport [35.2] 我々は、データセット比較のためのモデル非依存、埋め込み非依存アプローチであるスライスされた最適トランスポートデータセット距離(s-OTDD)を導入する。
データセットを1次元の分布に変換するデータポイントプロジェクションを導出する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:48:47 GMT)
uDistil-Whisper: Label-Free Data Filtering for Knowledge Distillation in Low-Data Regimes [34.9] We show that best-distilled models are outperform the teacher model by 5-7 WER points and are on well as or outperform similar supervised data filtering setups。
私たちのモデルは、教師モデルと同等以上の性能を維持しながら、計算効率とメモリ効率も25~50%向上しています。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:04:11 GMT)
UDDETTS: Unifying Discrete and Dimensional Emotions for Controllable Emotional Text-to-Speech [34.9] 制御可能な感情的TTSのための離散的感情と次元的感情を統一したニューラル言語モデルであるUDDETTSを提案する。
このモデルは、次元的感情記述のための解釈可能なArousal-Dominance-Valence(ADV)空間を導入し、離散的な感情ラベルまたは非線形に定量化されたADV値によって駆動される感情制御をサポートする。
UDDETTSはADV空間の3次元に沿って線形感情制御を統一し、より優れたエンドツーエンドの感情音声合成能力を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:57:19 GMT)
Metric Embeddings Beyond Bi-Lipschitz Distortion via Sherali-Adams [34.8] 準多項式依存のMDSに対する最初の近似アルゴリズムをDeltaに与える。
本アルゴリズムは,シェラリ・アダムスLPの条件付きラウンドリングの幾何学的認識に基づく新しい解析法である。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:04:15 GMT)
Sybil-based Virtual Data Poisoning Attacks in Federated Learning [33.2] フェデレート学習は悪意のある敵による攻撃に対して脆弱である。
本稿では、悪意のあるクライアントがシビルノードを生成して、毒性モデルの影響を増幅する、シビルベースの仮想データ中毒攻撃を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:46:59 GMT)
SpikeVideoFormer: An Efficient Spike-Driven Video Transformer with Hamming Attention and $\mathcal{O}(T)$ Complexity [33.0] スパイキングニューラルネットワーク(SNN)は、さまざまな視覚タスクにおいて、ニューラルネットワーク(ANN)と競合する性能を示している。
本稿では,効率的なスパイク駆動型ビデオトランスフォーマーであるSpikeVideoFormerを紹介する。
提案手法は既存のSNN手法と比較して,SOTA(State-of-the-art)性能を実現することを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:43:35 GMT)
Learned Image Compression with Dictionary-based Entropy Model [33.0] エントロピーモデルは学習画像圧縮において重要な役割を果たす。
既存の手法のほとんどは、エントロピーモデルを形成するためにハイパープライアおよび自動回帰アーキテクチャを使用した。
辞書に基づくクロスアテンションエントロピーモデルという新しいエントロピーモデルを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:00:00 GMT)
UniVLA: Learning to Act Anywhere with Task-centric Latent Actions [32.8] UniVLAは、クロス・エボディメント・ビジョン・ランゲージ・アクション(VLA)ポリシーを学ぶための新しいフレームワークである。
我々は、潜在アクションモデルを用いたビデオからタスク中心のアクション表現を導出する。
複数の操作やナビゲーションのベンチマーク、実際のロボットの配置など、最先端の結果が得られます。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:31:45 GMT)
3D-Fixup: Advancing Photo Editing with 3D Priors [32.8] 3D-Fixupは、学習した3Dプリエントによってガイドされた2Dイメージを編集する新しいフレームワークである。
拡散モデルの生成力を利用するトレーニングベースアプローチを利用する。
3D-Fixupは複雑でアイデンティティの整合した3D認識編集を効果的にサポートする。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:59:51 GMT)
Why 1 + 1 < 1 in Visual Token Pruning: Beyond Naive Integration via Multi-Objective Balanced Covering [32.6] 既存の視覚トークンプルーニング手法は、静的戦略によるプロンプトアライメントと視覚的保存を目標としている。
両目的被覆問題として視覚トークンプルーニングを再構成する多目的平衡被覆法(MoB)を提案する。
MoBは、入力されたビジュアルトークンの数に関して、証明可能なパフォーマンスバウンダリと線形スケーラビリティを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:43:28 GMT)
Reinforcing the Diffusion Chain of Lateral Thought with Diffusion Language Models [32.4] 本稿では,拡散言語モデルのための推論フレームワークであるRewardal Thought(DCoLT)のemphDiffusion Chainを紹介する。
DCoLTは、思考の中間段階において文法的正しさに厳格な規則を持たず、双方向で非線形な推論を可能にする。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:06:32 GMT)
JointDistill: Adaptive Multi-Task Distillation for Joint Depth Estimation and Scene Segmentation [31.9] この研究は、マルチタスク蒸留を用いて統一モデリングを改善する方法について検討する。
学生の現在の学習能力に応じて各教師の知識量を調整できる自己適応型蒸留法を提案する。
我々は,CityscapesやNYU-v2など,複数のベンチマークデータセットについて評価を行った。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:00:48 GMT)
FlowDreamer: A RGB-D World Model with Flow-based Motion Representations for Robot Manipulation [31.7] 本稿では,3次元シーンフローを明示的な動作表現として採用したFlowDreamerを紹介する。
FlowDreamerは、モジュール化された性質にもかかわらず、エンドツーエンドで訓練されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:27:16 GMT)
Rethinking Circuit Completeness in Language Models: AND, OR, and ADDER Gates [31.6] 論理ゲートはAND,OR,ADDERの3種類の論理ゲートを導入し,回路を論理ゲートの組み合わせに分解する。
本稿では,既存の回路発見手法に容易に組み込むことが可能な,ノイズ発生に基づく介入と雑音発生に基づく介入を組み合わせたフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:35:14 GMT)
An AI-driven framework for the prediction of personalised health response to air pollution [30.9] 大気汚染は公衆衛生にとって重大な脅威となり、多くの呼吸器や心臓血管疾患を発生または悪化させる。
個人感覚の最近の進歩は、行動や生理的なデータの収集に変化をもたらした。
本研究では、ウェアラブルフィットネスデバイスからの生理データをリアルタイム環境暴露と統合することで、汚染に対する個人化された健康反応を予測する新しいワークフローを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:59:07 GMT)
Translating Electrocardiograms to Cardiac Magnetic Resonance Imaging Useful for Cardiac Assessment and Disease Screening: A Multi-Center Study AI for ECG to CMR Translation Study [30.8] 心臓血管疾患(CVD)は世界的な死亡の原因であり、アクセス可能で正確な診断ツールを必要とする。
12個の心電図信号をCMRレベルの機能パラメータと合成画像に変換するディープラーニングフレームワークであるCardioNetsを提案する。
読者の研究では、ECGのみのCardioNetsは、ECGと実際のCMRの両方を用いて、人間の医師よりも13.9%高い精度を達成した。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:56:38 GMT)
Learning Robust Anymodal Segmentor with Unimodal and Cross-modal Distillation [30.3] 主な課題はユニモーダルバイアス(unimodal bias)であり、マルチモーダルセグメンタが特定のモダリティに依存しているため、他のセグメンタが欠落するとパフォーマンスが低下する。
視覚的モダリティの組み合わせを扱える頑健なセグメンタを学習するための最初のフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:54:21 GMT)
Predicting Risk of Pulmonary Fibrosis Formation in PASC Patients [30.2] いわゆるLong COVID(Long COVID)として知られるPASCは、持続性または新たに出現する症状の多様さとして現れている。
本研究では, 深層学習と放射能を併用して線維化予測を行うマルチセンター胸部CT解析フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:30:21 GMT)
Video-R1: Reinforcing Video Reasoning in MLLMs [30.1] Video-R1は、ビデオ推論にインセンティブを与えるためのR1パラダイムを体系的に探求する最初の試みである。
まず,T-GRPOアルゴリズムを提案する。
SFTコールドスタートのためのVideo-R1-CoT-165kと、RLトレーニングのためのVideo-R1-260kの2つのデータセットを構築した。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:28:30 GMT)
Examining the Source of Defects from a Mechanical Perspective for 3D Anomaly Detection [29.7] 3D-ADタスクのための機械補足型モデルベースフレームワーク(MC4AD)を紹介する。
フレームワークは各点について内部および外部の補正力を生成する。
提案されたMC4ADは理論と実験によって有効であることが証明されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:46:43 GMT)
Visual Fidelity Index for Generative Semantic Communications with Critical Information Embedding [29.3] 我々は、テキストプロンプトと意味的に重要な特徴の両方を抽出して送信するハイブリッドなGen-SemComシステムを開発した。
テキストプロンプトと臨界特徴を統合することにより、拡散ベース生成モデルを用いて高忠実度画像を再構成する。
実験の結果,視力に対するGVIF測定値の感度はPSNRと臨界情報量の両方に相関することがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:28:32 GMT)
Understanding Galaxy Morphology Evolution Through Cosmic Time via Redshift Conditioned Diffusion Models [29.0] 赤方偏移は銀河までの距離を測定し、宇宙の起源と銀河進化の理解の基盤となる。
光度赤方偏移法は、複数のカラーフィルターとテンプレートフィッティングのイメージングに頼っているが、銀河の形状や構造によってもたらされる情報の豊富さを無視している。
連続赤方偏移で条件付けられた拡散モデルは、この欠落した接合構造を学習し、既知の形態-z$相関を再現することを示した。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:21:30 GMT)
Adapt3R: Adaptive 3D Scene Representation for Domain Transfer in Imitation Learning [28.8] 模倣学習は、ロボットに複雑な多様な操作タスクを実行するよう訓練することができるが、学習されたポリシーはトレーニング分布外の観察で不安定である。
本稿では,キャリブレーションされたRGBDカメラのデータを任意のILアルゴリズムの条件付けとして使用できるベクトルに合成する汎用3D観測エンコーダAdapt3Rを提案する。
93のシミュレーションと6つの実際のタスクを、さまざまなILアルゴリズムでエンドツーエンドにトレーニングすると、Adapt3Rはこれらのアルゴリズムの学習能力を維持しながら、新しいエボディメントやカメラのポーズへのゼロショット転送を可能にします。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:49:51 GMT)
Hierarchical Document Refinement for Long-context Retrieval-augmented Generation [28.4] LongRefinerは、長いドキュメントの固有の構造特性を利用する効率的なプラグアンドプレイ精製機である。
LongRefinerは、最高のベースラインに比べて計算コストとレイテンシを10倍少なくしながら、さまざまなシナリオで競合的なパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:34:15 GMT)
Evaluations at Work: Measuring the Capabilities of GenAI in Use [28.1] 現在のAIベンチマークは、人間とAIのコラボレーションの混乱したマルチターンの性質を見逃している。
実世界のタスクを相互依存サブタスクに分解する評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:06:23 GMT)
Style Customization of Text-to-Vector Generation with Image Diffusion Priors [27.9] SVG生成のための新しい2段階スタイルのカスタマイズパイプラインを提案する。
第一段階では、SVGの構造的規則性を保証するため、経路レベルの表現を持つT2V拡散モデルを訓練する。
第2段階では、カスタマイズされたT2Iモデルを蒸留することにより、T2V拡散モデルを異なるスタイルにカスタマイズする。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:59:21 GMT)
HCMA: Hierarchical Cross-model Alignment for Grounded Text-to-Image Generation [27.8] 画像生成のための階層的クロスモーダルアライメント(HCMA)フレームワークを提案する。
HCMAは2つのアライメントモジュールを各拡散サンプリングステップに統合する。
MS-COCO 2014検証セットの実験では、HCMAが最先端のベースラインを超えたことが示されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:04:26 GMT)
Towards Graph Foundation Models: Training on Knowledge Graphs Enables Transferability to General Graphs [26.5] 知識グラフをトレーニングするために設計された統合グラフ推論フレームワークであるSCRを紹介する。
本稿では,従来のKG推論における意味的分離に対処する新しいメカニズムであるセマンティックコンディショニングメッセージパッシングを提案する。
以上の結果から,既存の基礎モデルよりも大幅な性能向上が見られた。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:27:59 GMT)
Large Wireless Localization Model (LWLM): A Foundation Model for Positioning in 6G Networks [26.3] 本稿では,無線位置決めに適したファンデーションモデルに基づくソリューションを提案する。
まず、異なる自己教師付き学習(SSL)タスクが汎用的およびタスク固有の意味的特徴をどのように獲得するかを分析する。
提案するLarge Wireless Localization Model (LWLM) の事前学習手法を設計する。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:04:44 GMT)
IN-RIL: Interleaved Reinforcement and Imitation Learning for Policy Fine-Tuning [25.6] イミテーションラーニング(IL)と強化ラーニング(RL)はそれぞれ、ロボットポリシーラーニングに明確なアドバンテージを提供する。
IL-based pre-training と RL-based fine-tuning を用いた既存のロボット学習アプローチは有望であるが、この2段階学習パラダイムは、RL 微細チューニングフェーズの不安定性とサンプル効率の低下に悩まされることが多い。
本研究では,政策微調整のためのIN-RIL,INterleaved Reinforcement Learning and Imitation Learningを紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:01:21 GMT)
The Hitchhikers Guide to Production-ready Trustworthy Foundation Model powered Software (FMware) [25.6] ファンデーションモデル(FM)は、これらのFMをコアコンポーネントとして統合するシステムであるFMwareを有効にすることで、ソフトウェア産業を変革している。
KDD 2025のチュートリアルでは、課題のキュレートされたカタログと実世界の生産上の懸念を組み合わせた、FMwareの総合的な探索について紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:22:45 GMT)
Learning to Think: Information-Theoretic Reinforcement Fine-Tuning for LLMs [25.0] 大規模言語モデル(LLM)は推論能力の進歩により複雑なタスクに優れる。
既存の手法は推論の有効性と計算効率のトレードオフを見落としている。
より少ないトークンで最適な推論を実現するために,学習から思考への学習を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:40:25 GMT)
UniSkill: Imitating Human Videos via Cross-Embodiment Skill Representations [24.2] UniSkillは、ラベルなしで大規模なクロスボデーメントビデオデータから、エンボディディメントに依存しないスキル表現を学ぶフレームワークである。
シミュレーションと実環境の両方における実験により、我々のクロス・エボディメントのスキルは、ビデオのプロンプトが見えない場合でも、ロボットが適切な行動を選択するのに成功していることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:53:41 GMT)
Who Said What WSW 2.0? Enhanced Automated Analysis of Preschool Classroom Speech [24.0] 本稿では,幼児教室における音声対話の分析を行うためのフレームワークWSW2.0を提案する。
WSW2.0は、重み付きF1スコアが.845、精度が.846、話者分類のための誤り訂正Kappaが.672に達する(子対教師)
このフレームワークを,2年間および1,592時間以上の教室オーディオ録音を対象とする広範囲なデータセットに適用する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:21:34 GMT)
Artificial Intelligence Bias on English Language Learners in Automatic Scoring [23.8] 我々は,ELからの応答,(2)非ELLからの応答,(3)現実のELLと非ELLの比率を反映した混合データセット,(4)両グループの同じ表現を持つバランスの取れた混合データセットの4つのデータセットを用いて,BERTを微調整した。
ELと非ELL間の平均スコアギャップ(MSG)を測定し,人間モデルとAIモデルの両方で生成されたMSGの差を計算し,スコアの相違を同定した。
トレーニングデータセットが大きいと、ERと非ELLのAIバイアスや歪んだ相違は見つからないことがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:32:24 GMT)
Mirror Descent Under Generalized Smoothness [23.5] 一般ノルムと双対という観点からヘッセンのノルムを測定する新しい$ell*$-smoothnessの概念を導入する。
我々は、古典的な滑らかさの下でのレートに一致するミラー・ディフレッシュ型アルゴリズムの収束性を確立する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:09:06 GMT)
CL-RAG: Bridging the Gap in Retrieval-Augmented Generation with Curriculum Learning [23.4] Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)の能力を高める効果的な方法である。
既存の方法は、検索したトップkの文書を直接利用することにより、RAGシステムにおけるレトリバーやジェネレータの最適化に重点を置いている。
本稿では,CL-RAGという,多段階のカリキュラム学習に基づくRAGシステムトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:53:04 GMT)
Natural Language Reinforcement Learning [23.3] 本稿では,従来のMDPを自然言語に基づく表現空間に拡張することで,自然言語強化学習(NLRL)の可能性を探る。
具体的には、NLRLは、タスク目的、ポリシー、値関数、ベルマン方程式、ポリシーを含むRLの原則を言語に再定義する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:35:25 GMT)
Highly Efficient 3D Human Pose Tracking from Events with Spiking Spatiotemporal Transformer [23.2] イベントのみに基づく3次元ポーズトラッキングのための,最初のスパーススパイキングニューラルネットワーク(SNN)フレームワークを紹介する。
提案手法では,スパースデータを高密度なフォーマットに変換したり,追加のイメージを組み込む必要がなくなり,入力イベントの本質的にの空間性を完全に活用することが可能になる。
実証実験では、既存の最先端(SOTA)ANN方式よりも、19.1%のFLOPと3.6%のコストエネルギーしか必要とせず、我々のアプローチの優位性を実証した。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:51:10 GMT)
ARR: Question Answering with Large Language Models via Analyzing, Retrieving, and Reasoning [22.8] 本稿では,直感的で効果的で汎用的なQA解法であるARRを紹介する。
質問の意図を分析し、関連する情報を検索し、ステップごとに推論する。
ARRにおいて重要な役割を果たすQAに意図分析を導入するのは、これが初めてである。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:52:51 GMT)
ChronoSteer: Bridging Large Language Model and Time Series Foundation Model via Synthetic Data [22.8] 我々はChronoSteerを紹介した。ChronoSteerはマルチモーダルTSFMであり、テキストのリビジョン命令で操作できる。
クロスモーダルな命令系列ペアデータ不足を軽減するため,合成データに基づく2段階のトレーニング戦略を考案した。
ChronoSteerは、前回の最先端マルチモーダル法よりも25.7%の精度で予測精度が向上し、22.5%も向上した。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:37:23 GMT)
FastVLM: Efficient Vision Encoding for Vision Language Models [22.4] 我々は,レイテンシ,モデルサイズ,精度のトレードオフを最適化したモデルであるFastVLMを紹介する。
FastVLMには、より少ないトークンを出力するように設計された新しいハイブリッドビジョンエンコーダであるFastViTHDが組み込まれている。
LLaVA-1.5では、FastVLMは3.2$times$改善された。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:00:19 GMT)
PIF: Anomaly detection via preference embedding [22.4] PIFと呼ばれる新しい異常検出手法を提案する。
データを高次元空間に埋め込むと、効率の良い木に基づくPIフォレスト法を用いて異常スコアを計算する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:00:31 GMT)
TSINR: Capturing Temporal Continuity via Implicit Neural Representations for Time Series Anomaly Detection [22.4] 時系列異常検出は、データの異常なパターンや、システムの期待する振る舞いからの逸脱を特定することを目的としている。
このタスクでは、教師なし学習を通じてポイントワイド表現を学習するリコンストラクションベースの手法が主流である。
本稿では,暗黙的ニューラル表現(INR)再構成に基づく時系列異常検出手法TSINRを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:30:38 GMT)
Collaborative Speculative Inference for Efficient LLM Inference Serving [22.3] CoSineは並列検証から逐次投機復号を分離する新しい投機推論システムである。
同等のリソースコストで、CoSineは23.2%のレイテンシ削減と32.5%のスループット向上を実現している。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:02:56 GMT)
MFogHub: Bridging Multi-Regional and Multi-Satellite Data for Global Marine Fog Detection and Forecasting [22.3] 海洋霧の検出と予測のための深層学習アプローチは、伝統的な手法よりも優れている。
MFogHubは、沿岸の霧の多い15の地域と6つの静止衛星から海洋の霧を観測した最初のマルチリージョンとマルチ衛星のデータセットである。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:29:40 GMT)
Flexible Graph Similarity Computation With A Proactive Optimization Strategy [22.2] Graph Edit Distance (GED)は、グラフ類似性の原則的かつ柔軟な尺度を提供する。
GEDは、あるグラフを別のグラフに変換するのに必要な最小コストを、カスタマイズ可能な編集操作コストで定量化する。
既存の方法は、様々な運用コストに対応するのに苦労する。
フレキシブルGED近似のための新しい学習ベースアプローチであるGENを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:42:50 GMT)
PIG: Privacy Jailbreak Attack on LLMs via Gradient-based Iterative In-Context Optimization [22.2] PIG(Personally Identible Information)を対象とする新しいフレームワークを提案する(PII)。
PIGはプライバシクエリのPIIエンティティとそのタイプを特定し、コンテキスト内学習を使用してプライバシコンテキストを構築し、PIIをターゲットとする3つのグラデーションベースの戦略を反復的に更新する。
2つのプライバシー関連データセットを用いてPIGおよび既存のジェイルブレイク手法を評価する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:11:57 GMT)
PnPXAI: A Universal XAI Framework Providing Automatic Explanations Across Diverse Modalities and Models [22.2] 多様なデータモダリティをサポートする汎用XAIフレームワークであるbfXAIを紹介する。
ユーザ調査により,フレームワークの有効性を検証し,その汎用性を諸領域にまたがって示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:21:54 GMT)
Boosting Text-to-Chart Retrieval through Training with Synthesized Semantic Insights [22.0] 既存のテキストからチャートへの検索ソリューションは、しばしばチャートのセマンティックコンテンツとコンテキスト情報をキャプチャするのに失敗する。
本稿では,グラフの階層的意味的洞察を自動的に合成する学習データ開発パイプラインを提案する。
私たちはCLIPベースのモデルChartFinderをトレーニングし、テキストからチャートへの検索のためのチャートのより良い表現を学習します。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:41:14 GMT)
Exploring Implicit Visual Misunderstandings in Multimodal Large Language Models through Attention Analysis [21.9] 我々は、暗黙的な視覚的誤解(IVM)を定義し、MLLMは視覚的入力を完全に理解することなく正しい回答を提供する。
IVMの定量化には,スケール非依存の計量,テクスチャータテンションの精度,新しいベンチマークを導入する。
我々は、より微細な粒度にアプローチを拡張し、その効果を単調なシナリオで実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:52:40 GMT)
Large-Scale Gaussian Splatting SLAM [21.3] 本稿では,LSG-SLAMと呼ばれるステレオカメラを用いた大規模3DGSベースの視覚SLAMを提案する。
EuRocとKITTIデータセットに対する広範な評価により、LSG-SLAMは既存のNeural、3DGSベースの、さらには従来のアプローチよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:00:32 GMT)
Exploring the Deep Fusion of Large Language Models and Diffusion Transformers for Text-to-Image Synthesis [20.9] 本稿では,多モード生成のための大規模言語モデル (LLM) と拡散変換器 (DiT) の深層融合について検討する。
従来の研究は主にシステム全体の性能に焦点を合わせており、代替手法との詳細な比較は行わなかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:43:23 GMT)
Enhancing Energy Sector Resilience: Integrating Security by Design Principles [20.8] セキュリティ・バイ・デザイン(Security by Design, Sbd)とは、セキュリティ・アタックに不注意なシステムを開発・保守するための概念である。
本報告では,産業用制御システムにおけるSbDの実装に関するセキュリティ要件について述べる。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:50:00 GMT)
Are Spatial-Temporal Graph Convolution Networks for Human Action Recognition Over-Parameterized? [20.2] スパース畳み込みネットワークは、その高密度なコンポーネントに匹敵する性能が得られることを示す。
NTU-RGB+D 60(120), Kinetics-400, FineGYM を含む4つのデータセットの実験により、提案したスパース ST-GCN は、その密度の高いコンポーネントと同等の性能が得られることを示した。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:50:56 GMT)
CoCoGaussian: Leveraging Circle of Confusion for Gaussian Splatting from Defocused Images [20.1] 3D Gaussian Splatting (3DGS)は高品質のノベルビューレンダリングで注目されている。
本稿では,非焦点画像のみを用いて正確な3次元シーン表現を可能にする,コンフュージョン対応ガウス平滑化回路CoCoGaussianを提案する。
合成データセットと実世界のデータセットの両方の実験では、CoCoGaussianが複数のベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:55:04 GMT)
SceneGenAgent: Precise Industrial Scene Generation with Coding Agent [19.9] C#コードで産業シーンを生成するエージェントであるSceneGenAgentを紹介する。
SceneGenAgentは構造化され計算可能なフォーマットによる正確なレイアウト計画を保証する。
実験の結果,SceneInstruct 上でのオープンソース LLM の微調整により,大幅なパフォーマンス向上が得られた。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:40:39 GMT)
DiSCo: LLM Knowledge Distillation for Efficient Sparse Retrieval in Conversational Search [19.7] Conversational Search (CS) は、コンテキストモデリングを考慮しつつ、コーパスから関連文書を検索する。
大規模言語モデル(LLM)の最近の進歩は、コンテキストに基づいたクエリ書き換えを可能にすることで、CSを大幅に強化した。
本稿では,検索とコンテキストモデリングを統合した新しい手法であるDistillation of Sparse Conversational Searchを紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:15:46 GMT)
TartanGround: A Large-Scale Dataset for Ground Robot Perception and Navigation [19.5] TartanGroundは、地上ロボットの認識と自律性を向上する大規模なマルチモーダルデータセットである。
我々は70の環境にまたがって910の軌道を集め、150万のサンプルを得た。
TartanGroundは、幅広い学習ベースのタスクのトレーニングと評価のためのテストベッドとして機能する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:35:06 GMT)
Large Language Model Enhancers for Graph Neural Networks: An Analysis from the Perspective of Causal Mechanism Identification [19.4] グラフニューラルネットワーク(GNN)の入力として使用されるノード表現を最適化する機能拡張器として,大規模言語モデル(LLM)を用いて検討する。
解析結果に基づいて,LLMエンハンサーとGNN間の情報伝達を改善するためのプラグアンドプレイ最適化モジュールを設計する。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:46:57 GMT)
Can You Really Trust Code Copilots? Evaluating Large Language Models from a Code Security Perspective [19.3] CoV-Evalは、コード補完、脆弱性修復、脆弱性検出、分類など、さまざまなタスクをカバーするマルチタスクベンチマークである。
VC-Judgeは、人間の専門家と密接に一致し、LLM生成プログラムの脆弱性をレビューできる、改善された判断モデルである。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:53:41 GMT)
One Shot Dominance: Knowledge Poisoning Attack on Retrieval-Augmented Generation Systems [19.2] Retrieval-Augmented Generation (RAG)により強化されたLarge Language Models (LLMs) は、正確な応答を生成する際の性能改善を示す。
外部知識ベースへの依存は、潜在的なセキュリティ脆弱性をもたらす。
本稿では,チェイン・オブ・エビデンス理論と権威効果を利用した知識中毒攻撃法であるAuthChainを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:14:58 GMT)
FAMMA: A Benchmark for Financial Domain Multilingual Multimodal Question Answering [18.8] FAMMA(Underlinefininlineancial underlinemultilingual underlinemultimodal question underlineanswering, QA)のオープンソースベンチマークを紹介する。
本ベンチマークは,高度な財務知識を必要とする複雑な推論問題に対して,大規模言語モデル(LLM)の能力を評価することを目的とする。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:17:31 GMT)
Are Large Language Models Robust in Understanding Code Against Semantics-Preserving Mutations? [18.5] 最大8Bパラメータを持つ最先端のLarge Language Model (LLMs) がPythonプログラムを推論できるのか、それとも単純に推測できるのかを評価する。
変数のリネーム、比較式のミラー化、if-elseブランチのスワップ、ループの while への変換、ループアンロールの5つのコード変異を適用します。
Llama3.2のような一部のLLMは、最大61%のケースにおいて、欠陥のある推論に基づいて正しい予測を生成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:04:25 GMT)
Which Demographic Features Are Relevant for Individual Fairness Evaluation of U.S. Recidivism Risk Assessment Tools? [18.5] 我々は,リシディズムリスク評価ツールの個々人の公正度評価にどの人口統計的特徴が関係しているかを評価する。
我々の分析は、個人間の類似性関数は年齢と性別を考慮するべきであるが、人種を無視すべきだと結論付けている。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:07:07 GMT)
GSPRec: Temporal-Aware Graph Spectral Filtering for Recommendation [18.4] 本稿では,逐次的インフォームドグラフ構築を通じて時間遷移を統合するグラフスペクトルモデルGSPRecを紹介する。
GSPRecはマルチホップ拡散によってアイテム遷移を符号化し、スペクトル処理に対称ラプラシアンを使用できる。
ユーザの嗜好を捉えるために,ガウス帯域通過フィルタを用いて中頻度,ユーザレベルのパターンを抽出し,低域通過フィルタによりグローバルなトレンドを維持するという,二重フィルタ機構を設計する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:49:56 GMT)
AriGraph: Learning Knowledge Graph World Models with Episodic Memory for LLM Agents [18.4] AriGraphは、環境を探索しながら意味記憶とエピソード記憶を統合するメモリグラフである。
我々は,Ariadne LLMエージェントが対話型テキストゲーム環境における複雑なタスクを,人間プレイヤーでも効果的に処理できることを実証した。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:57:51 GMT)
PromptMobile: Efficient Promptus for Low Bandwidth Mobile Video Streaming [18.3] 本稿では、デバイス上でのPromptusに適した効率的なアクセラレーションフレームワークであるPromptMobileを提案する。
他のストリーミング方法と比較して、PromptMobileは平均LPIPSの改善を0.016(H.265と比較)し、重く歪んだフレームの60%を削減した(VQGANと比較)。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:27:28 GMT)
Learning Virtual Machine Scheduling in Cloud Computing through Language Agents [18.2] クラウドサービスでは、仮想マシン(VM)スケジューリングは典型的なオンライン動的多次元Bin Packing(ODMBP)問題である。
従来の手法はリアルタイムな変化に適応するのに苦労し、ドメイン専門家が設計したアプローチは厳格な戦略に苦しむ。
本稿では,ODMBPを解くための大規模言語モデル(LLM)駆動設計パラダイムを提供するMiCoという階層型言語エージェントフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:42:11 GMT)
CheXGenBench: A Unified Benchmark For Fidelity, Privacy and Utility of Synthetic Chest Radiographs [18.0] CheXGenBenchは人工胸部X線撮影のための厳密で多面的な評価フレームワークである。
それは、最先端のテキスト・ツー・イメージ生成モデル間で、忠実さ、プライバシーリスク、臨床ユーティリティを同時に評価する。
トップパフォーマンスモデルにより生成された75Kのラジオグラフからなる高品質な合成データセットSynthCheX-75Kをリリースする。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:59:17 GMT)
From Air to Wear: Personalized 3D Digital Fashion with AR/VR Immersive 3D Sketching [17.9] 本稿では,一般ユーザーが高品質なデジタル衣料品を作成できるようにする3Dスケッチ駆動型3D衣料作成フレームワークを提案する。
条件付き拡散モデル、共有潜在空間で訓練されたスケッチエンコーダ、適応型カリキュラム学習戦略を組み合わせることで、システムは不正確で自由な入力を解釈し、現実的でパーソナライズされた衣服を生成する。
トレーニングデータの不足に対処するため,新しい3D衣料とユーザ作成スケッチのデータセットである KO3DClothes も導入した。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:22:24 GMT)
Private Transformer Inference in MLaaS: A Survey [17.4] プライベートトランスフォーマー推論(Private Transformer Inference, PTI)は、暗号技術を利用したソリューションである。
本稿では、最近のPTIの進歩を概観し、最先端のソリューションと課題を明らかにする。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:00:19 GMT)
Establishing Linear Surrogate Regret Bounds for Convex Smooth Losses via Convolutional Fenchel-Young Losses [17.4] 本研究では, 線形リセット境界を調整した予測リンクで構成した凸スムーズなサロゲート損失を構築する。
この構造は、畳み込みネゲントロピーによって生じるフェンシェル・ヨンの損失に基づいている。
この結果は,コンベックス解析がリスク最小化の最適化と統計的効率にいかに浸透するかを示す新しい実証である。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:26:10 GMT)
From Trade-off to Synergy: A Versatile Symbiotic Watermarking Framework for Large Language Models [16.9] 本稿では, シリアル, パラレル, ハイブリッドの3つの戦略を持つ多種多様な共生型透かしフレームワークを提案する。
このハイブリッドフレームワークはトークンエントロピーとセマンティックエントロピーを使用して透かしを適応的に埋め込み、検出可能性、堅牢性、テキスト品質、セキュリティのバランスを最適化する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:12:36 GMT)
MORepair: Teaching LLMs to Repair Code via Multi-Objective Fine-tuning [16.9] プログラム修復タスクに対するLLM(Large Language Model)の微調整アプローチは、コード変更の背後にあるロジックを推論する必要性を見落としている。
サイズやアーキテクチャの異なる4つのオープンソース LLM にMOobjective を適用する。
我々の微調整戦略は、最先端のアプローチよりも優れた性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:49:58 GMT)
Real-Time Out-of-Distribution Failure Prevention via Multi-Modal Reasoning [16.8] FORTRESSは、OOD障害を防ぐために、セマンティックに安全なフォールバック戦略をリアルタイムで生成し、理由付けするフレームワークである。
名目操作では低い周波数で、FORTESSはマルチモーダル推論を用いて目標を特定し、障害モードを予測する。
ForTRESSは、合成ベンチマークと現実のANYmalロボットデータに対する安全性の分類精度において、遅い推論モデルのオンザフライプロンプトよりも優れています。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:55:28 GMT)
Enhancing Multi-Image Question Answering via Submodular Subset Selection [16.7] 大規模マルチモーダルモデル (LMM) は、単一の画像を含む視覚言語タスクにおいて高い性能を達成しているが、複数の画像の集合を提示する際には困難である。
サブモジュールサブセット選択手法を用いて,MIRAGEモデルで導入された検索フレームワークの拡張を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:41:52 GMT)
DELTA: Dual Consistency Delving with Topological Uncertainty for Active Graph Domain Adaptation [16.7] グラフ領域適応のためのDELTA(Dual Consistency Delving with Topological Uncertainty)という新しい手法を提案する。
我々のDELTAはエッジ指向グラフサブネットワークとパス指向グラフサブネットワークで構成されており、相補的な視点からトポロジカルセマンティクスを探索することができる。
ベンチマークデータセットの実験では、DELTAが様々な最先端アプローチより優れていることが示されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:38:43 GMT)
MONAQ: Multi-Objective Neural Architecture Querying for Time-Series Analysis on Resource-Constrained Devices [16.6] 我々は,NASを多目的ニューラルアーキテクチャクエリータスクに再構成する新しいフレームワークMONAQを提案する。
MonAQはマルチモーダルな時系列入力とハードウェア制約を処理するマルチモーダルクエリ生成機能を備えている。
15のデータセットの実験では、MONAQで発見されたモデルは、手作りのモデルとNASベースラインの両方を上回っている。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:35:33 GMT)
Machine Learning with Physics Knowledge for Prediction: A Survey [16.4] 本研究では,機械学習と物理知識を組み合わせて予測と予測を行う手法とモデルについて検討する。
まず、目的関数、構造化予測モデル、データ拡張を通じて、アーキテクチャレベルでの物理知識を取り入れることを検討する。
第二に、データを物理知識とみなし、マルチタスク、メタ、コンテキスト学習をデータ駆動方式で物理知識を組み込む代替アプローチとして考える。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:20:49 GMT)
SpecOffload: Unlocking Latent GPU Capacity for LLM Inference on Resource-Constrained Devices [16.4] SpecOffloadは投機的デコーディングをオフロードに埋め込む。
最高のベースラインと比較して、SpecOffloadはGPUコアの利用率を4.49倍改善し、推論スループットを2.54倍向上させた。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:10:31 GMT)
DeFeed: Secure Decentralized Cross-Contract Data Feed in Web 3.0 for Connected Autonomous Vehicles [16.4] 本稿では,CAVに様々なガス節約機能を組み込んだ新しいプロトコルであるDeFeedを提案する。
私たちのソリューションは、Web 3.0エコシステムにおけるシームレスで分散化されたコミュニケーションへの重要なステップを示しています。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:25:41 GMT)
CoGenAV: Versatile Audio-Visual Representation Learning via Contrastive-Generative Synchronization [16.4] CoGenAVは、汎用的なオーディオ視覚表現を学習するために設計された、強力でデータ効率のよいモデルである。
CoGenAVは、自然な音声-視覚同期、対照的な特徴アライメント、生成テキスト予測から導かれる2つの目的を最適化することで訓練される。
複数のベンチマークで学習したCoGenAV表現の有効性と汎用性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:21:04 GMT)
From Uncertain to Safe: Conformal Fine-Tuning of Diffusion Models for Safe PDE Control [16.2] 我々は,安全制約下での最適制御を実現するために,PDE制御のためのセーフ拡散モデル(SafeDiffCon)を提案する。
提案手法は,安全制約を満たす制御シーケンスを生成するために,事前学習した拡散モデルをポストトレーニングする。
我々は,1次元バーガー方程式,2次元非圧縮流体,制御核融合問題という3つの制御課題についてSafeDiffConを評価した。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:00:10 GMT)
LODGE: Joint Hierarchical Task Planning and Learning of Domain Models with Grounded Execution [16.2] 大型言語モデル(LLM)は、暗黙の世界知識を用いた自然言語命令からのプランニングを可能にする。
最近の手法は、古典的なプランナーを用いて、異なる目標状態に対して解決可能な問題領域を学習することを目的としている。
低レベルの述語と行動が上位の述語に構成される階層的なドメインを学習することで、この欠点に対処する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:23:21 GMT)
Self-cross Feature based Spiking Neural Networks for Efficient Few-shot Learning [16.2] スパイキングニューラルネットワーク(SNN)に基づく数発の学習フレームワークを提案する。
列車の時間的スパイクダイナミクスを最適化し,識別力を高めるために,時間的効率的なトレーニング損失と情報損失の組み合わせを適用した。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:56:21 GMT)
Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model [16.0] 本稿では,大規模言語モデルと統合された高度な自然言語処理技術を活用したマテリアルナレッジグラフ(MKG)を紹介する。
MKGは、情報を名前、フォーミュラ、アプリケーションなどの包括的なラベルに分類する。
ネットワークベースのアルゴリズムを実装することで、MKGは効率的なリンク予測を容易にするだけでなく、従来の実験手法への依存を著しく低減する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:03:46 GMT)
The First MPDD Challenge: Multimodal Personality-aware Depression Detection [16.0] うつ病は多様な年齢層に影響を及ぼすメンタルヘルスの問題である。
現在のアプローチは、しばしばマルチモーダルデータとうつ病指標の直接的なマッピングを確立する。
MPDD Challengeは、個々の差分要素と並行してマルチモーダルデータを組み込むことで、このギャップに対処することを目指している。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:29:33 GMT)
UniEval: Unified Holistic Evaluation for Unified Multimodal Understanding and Generation [15.9] 追加モデルや画像,アノテーションを使わずに,統一マルチモーダルモデル用に設計された最初の評価フレームワークであるUniEvalを紹介する。
このフレームワークには、UniBenchという総合的なベンチマークと、対応するUniScoreメトリックが含まれている。
我々はまた、SoTAの統一および視覚生成モデルについても広範囲に評価し、Univeralのユニークな値に対する新たな洞察を明らかにした。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:34:50 GMT)
GaussianFormer3D: Multi-Modal Gaussian-based Semantic Occupancy Prediction with 3D Deformable Attention [15.9] 3Dセマンティック占有予測は、安全で信頼性の高い自動運転を実現するために重要である。
本稿では,3次元変形可能な注意力を利用したマルチモーダルガウスに基づくセマンティック占有予測フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:05:08 GMT)
LibIQ: Toward Real-Time Spectrum Classification in O-RAN dApps [15.7] 我々は、dAppsの概念を利用して、RF信号の新しいライブラリであるLibIQでリアルタイムRFスペクトルの分類を可能にする。
LibIQのおかげで、I/Qサンプルを効率的に処理して外部RF信号を検出し、ライブラリ内のCNNを使用して分類する。
リアルタイム分析では、処理されたI/Qサンプルを分類し、平均精度は97.8%である。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:47:30 GMT)
Learning Repetition-Invariant Representations for Polymer Informatics [15.5] グラフ反復不変性(GRIN)は,グラフ表現における繰り返し単位の数に不変なポリマー表現を学習するための新しい手法である。
GRINはグラフベースの最大スパンニングツリーアライメントと繰り返しユニット拡張を統合し、構造的な一貫性を確保する。
ホモポリマーとコポリマーのベンチマークで最先端のベースラインを上回り、安定で反復不変な表現を学習し、目に見えない大きさのポリマー鎖に効果的に一般化する。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:05:40 GMT)
Fine-tuning Diffusion Policies with Backpropagation Through Diffusion Timesteps [15.3] NCDPOは拡散政策を雑音条件決定政策として再構成する新しい枠組みである。
実験の結果,NCDPOはスクラッチからトレーニングを行う際に,PPOに匹敵するサンプル効率が得られることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:33:44 GMT)
Mitigating Modality Bias in Multi-modal Entity Alignment from a Causal Perspective [15.2] 本稿では,因果的視点から視覚的モダリティバイアスを研究するMMEAの非現実的脱バイアスフレームワークCDMEAを提案する。
本研究の目的は,モデル予測に対する視覚的モダリティの直接的な因果効果を抑えつつ,視覚的モダリティとグラフ的モダリティを両立させることである。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:07:58 GMT)
DDFP: Data-dependent Frequency Prompt for Source Free Domain Adaptation of Medical Image Segmentation [15.1] ドメイン適応は、ドメインギャップに起因するモデルパフォーマンス劣化の課題に対処する。
ラベル付きソースドメインデータ、特に医療データセットへのアクセスは、プライバシポリシによって制限される。
本稿では,これらの課題に対処するために,新規なソースフリードメイン適応(SFDA)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:24:54 GMT)
MolTextNet: A Two-Million Molecule-Text Dataset for Multimodal Molecular Learning [15.1] MolTextNetは、250万の高品質な分子テキストペアのデータセットである。
我々は、ChEMBL35から250万分子の構造的記述を作成し、テキストは以前のデータセットの10倍以上の長さである。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:50:11 GMT)
Large Language Models for Cyber Security: A Systematic Literature Review [14.9] サイバーセキュリティ(LLM4Security)における大規模言語モデルの適用に関する文献の総合的なレビューを行う。
LLMは、脆弱性検出、マルウェア分析、ネットワーク侵入検出、フィッシング検出など、幅広いサイバーセキュリティタスクに応用されている。
第3に、細調整、転送学習、ドメイン固有の事前トレーニングなど、特定のサイバーセキュリティドメインにLLMを適用するための有望なテクニックをいくつか特定する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:33:07 GMT)
Towards Foundation Model for Chemical Reactor Modeling: Meta-Learning with Physics-Informed Adaptation [14.8] 多様な反応器タイプにまたがって一般化し、新しい化学プロセスに迅速に適応するニューラルネットワークフレームワークを導入する。
提案手法は, メタラーニングを活用して, 反応速度を最小限に抑えることで, 未確認反応への適応を効果的に行う。
本フレームワークは, 3種類の整数次基本反応器, 連続拌槽反応器, バッチ反応器, プラグフロー反応器で評価される。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:08:49 GMT)
The Power of Random Features and the Limits of Distribution-Free Gradient Descent [14.7] パラメトリックモデル(例えばニューラルネットワーク)の勾配に基づく最適化とランダムな特徴の線形結合の最適化の関係について検討する。
本研究の主目的は,データ分布を仮定することなく,最小バッチ勾配勾配(bSGD)を用いてパラメトリックモデルを学習できる場合,高い確率で対象関数を近似できることである。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:39:28 GMT)
MIRAGE: A Multi-modal Benchmark for Spatial Perception, Reasoning, and Intelligence [14.7] MIRAGEは、Counting(オブジェクト属性認識)、Relation(空間リレーショナル推論)、Counting with Relationにおけるモデルの能力を評価するために設計されたベンチマークである。
これらの基礎的能力をターゲットにして、MIRAGEは将来の研究における時間的推論に向けた空間認識への道筋を提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:08:14 GMT)
Fixing Incomplete Value Function Decomposition for Multi-Agent Reinforcement Learning [14.7] 本稿では,従来のモデルの表現能力を,薄い「固定」層で拡張した新しい値関数分解モデルを提案する。
我々は、QFIXの複数の変種を導き、よく知られた2つのマルチエージェントフレームワークに3つの変種を実装する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:36:18 GMT)
From Questions to Clinical Recommendations: Large Language Models Driving Evidence-Based Clinical Decision Making [14.5] Quickerは大規模言語モデル(LLM)を利用したエビデンスベースの臨床意思決定支援システムである。
本研究は,大規模言語モデル(LLM)を用いたエビデンスに基づく臨床意思決定支援システムQuickerを紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:30:39 GMT)
Can Your Uncertainty Scores Detect Hallucinated Entity? [14.4] 本稿では,エンティティレベルで幻覚を注釈する新たなデータセットであるHaluEntityを提案する。
このデータセットに基づいて、17の近代LCMにおける不確実性に基づく幻覚検出手法を評価する。
実験の結果,個々のトークン確率に着目した不確実性推定手法は幻覚を過度に予測する傾向があることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:56:19 GMT)
Locally Differentially Private Frequency Estimation via Joint Randomized Response [14.4] ローカル微分プライバシー(LDP)は、信頼できないデータコレクタに対してデータコントリビュータにデータプライバシの強力な理論的保証を提供する強力なツールとして広く認識されている。
既存のLDPメカニズムに共通するのは、プライバシ保護とデータユーティリティのレベルでのトレードオフである。
本稿では, 相関データ摂動に基づく新しい共振応答(JRR)機構を提案し, 局所的に個人周波数を推定する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:41:03 GMT)
APCoTTA: Continual Test-Time Adaptation for Semantic Segmentation of Airborne LiDAR Point Clouds [14.3] 空中レーザースキャン(ALS)ポイントクラウドセグメンテーションは、大規模3Dシーン理解の基本的な課題である。
Continuous Test-Time Adaptation (CTTA)は、ソース予測モデルを適用して、未ラベルのターゲットドメインを進化させるソリューションを提供する。
我々は,ALSポイントクラウドセマンティックセグメンテーションに適した最初のCTTA手法であるAPCoTTAを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:21:16 GMT)
Parastatistics and a secret communication challenge [14.2] 本稿では,パラ粒子をホストする物理システムでのみ勝利できるチャレンジゲームを提案する。
勝利戦略はノイズに対して頑健であり、局所的な測定による盗聴の最も関連性の高いクラスである。
これは、秘密通信における潜在的な応用と同様に、パラ粒子の操作定義と実験的なアイデンティティテストの両方を提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:57:06 GMT)
Rethinking Prompt Optimizers: From Prompt Merits to Optimization [14.0] MePOは、有能で軽量で、ローカルにデプロイ可能なプロンプトであり、有能なプロンプトから構築された私たちの好みに基づいて訓練されている。
MePOはオンライン最適化の信頼性を回避し、コストとプライバシの懸念を低減し、明確で解釈可能なメリットを学習することで、大規模および軽量な推論モデルの両方に効果的に一般化する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:31:37 GMT)
Evaluating Robustness of Deep Reinforcement Learning for Autonomous Surface Vehicle Control in Field Tests [13.9] 種々の摂動下での浮遊廃棄物の回収を目的としたDRLをベースとしたエージェントのレジリエンス評価を行った。
実世界のフィールドテストにおいて,ドメインランダム化を用いてエージェントを訓練し,その性能を評価する。
我々は,DRL ベースの ASV コントローラをデプロイするための効果的なトレーニング戦略,実世界の課題,実践的考察について考察する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:29:16 GMT)
Neural Thermodynamic Laws for Large Language Model Training [13.8] 大規模言語モデルに対する新たな洞察を提供する新しいフレームワークであるNeural Thermodynamic Laws (NTL)を紹介します。
理論面では,水温,エントロピー,熱容量,熱伝導など重要な熱力学量(温度,エントロピー,熱伝導など)が自然に河川谷の損失景観の仮定の下で現れることを実証する。
実践面では、この科学的視点は、学習率スケジュールを設計するための直感的なガイドラインをもたらす。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:59:22 GMT)
Learning Nonlinear Dynamics in Physical Modelling Synthesis using Neural Ordinary Differential Equations [13.8] モード分解は、通常の微分方程式の結合非線形系につながる。
応用機械学習手法の最近の研究は、データからラップされた動的システムを自動的にモデル化するために使われてきた。
本稿では,システムの非線形ダイナミクスを再現するために,モデルをトレーニングできることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:17:21 GMT)
Behind Maya: Building a Multilingual Vision Language Model [13.7] オープンソースのMultilingual VLMであるMayaを紹介します。
コントリビューションは,1)LLaVA事前学習データセットに基づく8言語による多言語画像テキスト事前学習データセット,2)これらの言語をサポートする多言語画像テキストモデル,そして,視覚言語タスクにおける文化的・言語的理解の向上である。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:24:06 GMT)
Concise Reasoning via Reinforcement Learning [13.7] 我々は強化学習(RL)の中核的原則を再考する。
簡潔さと正確さの自然な相関関係を明らかにする。
RLトレーニングの二次段階の導入は、非常に小さな問題セットを用いて、思考の連鎖を著しく減少させることが示される。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:23:16 GMT)
X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real [13.6] X-Simは、ロボットのポリシーを学ぶための、密集した伝達可能な信号としてオブジェクトの動きを利用する、リアルからシミュレート・トゥ・リアルなフレームワークである。
X-Simは、RGBDの人間のビデオからシミュレーションを再構築し、オブジェクト中心の報酬を定義するためにオブジェクトの軌跡を追跡することから始まる。
学習方針は、様々な視点と照明でレンダリングされた合成ロールアウトを用いて、画像調和拡散政策に蒸留される。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:43:19 GMT)
Correlating Account on Ethereum Mixing Service via Domain-Invariant feature learning [13.4] Tornado Cashのようなサービスを混在させることによるトランザクションの追跡不能は、ブロックチェーンのセキュリティと金融規制に重大な課題をもたらす。
我々は、クロスタスクなドメイン不変の機能学習を通じてこれらの制限に対処する新しいフレームワークであるStealthLinkを提案する。
実世界の混合トランザクションデータセットの実験は、StealthLinkが10ショットの学習シナリオで96.98%のF1スコアで最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:27:12 GMT)
Robust Federated Learning on Edge Devices with Domain Heterogeneity [13.4] Federated Learning (FL)は、分散エッジデバイス間のデータプライバシを確保しながら、協調的なトレーニングを可能にする。
本稿では,FLグローバルモデルの一般化能力を向上させることにより,この問題に対処する新しいフレームワークを提案する。
特徴の多様性とモデルロバスト性を高めるために,プロトタイプベースのFLフレームワークであるFedAPCを紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:53:14 GMT)
A Sliding Layer Merging Method for Efficient Depth-Wise Pruning in LLMs [13.0] 本稿では,再現カーネルHilbert空間内の異なるレイヤの出力の相関関係を解析することにより,大規模言語モデルにおけるPatch-like'の特徴関係を明らかにする。
本研究では, 連続層を上から下へ動的に選択・融合するスライディング層マージ法について, 予め定義された類似度閾値に従って提案する。
提案手法は,ゼロショット推論性能と再学習後の回復品質の両方において,既存のプルーニング技術より優れる。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:04:35 GMT)
LLM-Explorer: Towards Efficient and Affordable LLM-based Exploration for Mobile Apps [13.0] 大規模言語モデル(LLM)は、モバイルアプリの探索を自動化する新たな機会を開いた。
探索中の多くの行動は必要とせず、またLLMの能力に偏っている可能性があるため、このような広範囲にわたるLLMの使用は必要でも有効でもないと論じる。
LLM-Explorerは,効率と可利用性に配慮した新しい探索エージェントである。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:28:35 GMT)
FedPCL-CDR: A Federated Prototype-based Contrastive Learning Framework for Privacy-Preserving Cross-domain Recommendation [12.9] クロスドメインレコメンデーション(CDR)は、データ豊富なドメインから知識を転送することでスパースドメインのレコメンデーション精度を向上させることを目的としている。
既存のCDRアプローチでは、ドメイン間のユーザ-イテムインタラクションデータが公開されており、ユーザのプライバシの懸念を無視することが多い。
本稿では,FedPCL-CDRと呼ばれるプライバシ保護CDRのためのFederated Prototype-based Contrastive Learningフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:06:05 GMT)
Model Performance-Guided Evaluation Data Selection for Effective Prompt Optimization [12.7] IPOMPは、セマンティッククラスタリングとバウンダリ分析を使用して、代表的で多様なサンプルを選択する2段階のアプローチである。
我々は、IPOMPがSOTAベースラインと比較して、効率を1.6%から5.3%改善し、安定性を少なくとも57%向上させることを示した。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:41:30 GMT)
BiECVC: Gated Diversification of Bidirectional Contexts for Learned Video Compression [12.6] 本稿では,双方向ビデオ圧縮フレームワークのBiECVCを紹介する。
局所的および非局所的コンテキストモデリングと適応的コンテキストゲーティングが組み込まれている。
最先端のパフォーマンスを実現し、Random Access (RA) 構成の VTM 13.2 と比較してビットレートを 13.4% と 15.7% 削減した。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:32:30 GMT)
Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization [12.4] 大規模言語モデル(LLM)は、特定のクエリに対する不正確な応答を生成する傾向がある。
不正確なトークン化は、LLMが入力を正確に理解するのを妨げている臨界点である。
我々は, LLMのトークン化に挑戦するために, 様々なオープンソースLLMの語彙をベースとして, $textbfADT (Adrial dataset for Tokenizer)$という逆データセットを構築した。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:57:32 GMT)
Evaluating Model Explanations without Ground Truth [12.4] 本稿では,モデル説明の評価と比較を行うためのAXE(Agnostic eXplanation Evaluation framework)を提案する。
AXEは、比較のために理想的な地味な説明にアクセスする必要はなく、モデル感度に依存しています。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:22:06 GMT)
Diffusion Recommender Models and the Illusion of Progress: A Concerning Study of Reproducibility and a Conceptual Mismatch [12.3] 我々は,最新のデノイング拡散確率モデルを推薦システムに適用することによって報告された最新の進歩を再現する。
本研究は, 持続的な方法論的問題を明らかにすることを目的としている。
拡散モデルの特徴と従来のエンフェップ-nレコメンデーションタスクとの主なミスマッチを同定する。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:26:23 GMT)
MambaControl: Anatomy Graph-Enhanced Mamba ControlNet with Fourier Refinement for Diffusion-Based Disease Trajectory Prediction [12.1] 医用画像軌跡の高忠実度予測のための拡散過程と選択状態空間モデリングを統合したフレームワークであるMambaControlを紹介する。
MambaControlはアルツハイマー病の予測において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:59:02 GMT)
Incorporating brain-inspired mechanisms for multimodal learning in artificial intelligence [12.1] 脳は逆効果現象を呈し、弱く、より強い多感的な統合効果をもたらす。
この生物学的メカニズムに着想を得て,逆効果駆動型マルチモーダル融合(IEMF)戦略を提案する。
この戦略をニューラルネットワークに組み込むことで、モデル性能の向上と計算効率の向上により、より効率的な統合を実現する。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:08:50 GMT)
How Does Knowledge Selection Help Retrieval Augmented Generation? [12.0] 本稿では,RAGシステムにおいて,知識選択が下流生成性能に与える影響を実証的に分析する。
その結果、下流ジェネレータモデルの能力とタスクとデータセットの複雑さは、知識選択がRAGシステム全体の性能に与える影響に大きな影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:59:42 GMT)
EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments [12.0] Embodied Mobile Manipulation in Open Environmentsは、エージェントがユーザーの指示を解釈し、連続した空間で長時間の日常的なタスクを実行する必要があるベンチマークである。
Open EnvironmentsにおけるEmbodied Mobile Manipulationは、より多様な評価のための3つの新しいメトリクスとともに、ハイレベルで低レベルな実施タスクを統一されたフレームワークにシームレスに統合します。
We design model, a sophisticated agent system, a LLM with Direct Preference Optimization (DPO), light weighted navigation and operation model, and multiple error detection mechanism。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:34:30 GMT)
Do LLMs Memorize Recommendation Datasets? A Preliminary Study on MovieLens-1M [11.9] 本稿では,Large Language Models (LLM) がパブリックレコメンデーションデータセットを記憶しているかどうかを検討する。
推奨システムにおいて最も広く使われているデータセットのひとつにMovieLens-1Mがある。
以上の結果から,MovieLens-1Mの記憶度は,全てのモデルである程度の記憶度を示し,レコメンデーション性能が記憶度に関係していることが判明した。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:16:36 GMT)
3-D Magnetotelluric Deep Learning Inversion Guided by Pseudo-Physical Information [11.8] 近年,ジョイントデータ駆動と物理駆動を併用したDLインバージョン法が注目されている。
本稿では、ニューラルネットワーク(NN)の前方モデリングを通して擬似物理情報を導入し、損失のこの部分を計算する。
本研究では,3次元MTインバージョンにおけるフィールドデータ環境をシミュレートし,マスキングとノイズ付加を含む新しい入力モードを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:17:11 GMT)
Ordered-subsets Multi-diffusion Model for Sparse-view CT Reconstruction [11.5] スパースビューCT再構成のための順序付きサブセット多重拡散モデル(OSMM)を提案する。
OSMMはCTプロジェクションデータを等しいサブセットに分割し、各サブセットから独立して学習するためにマルチサブセット拡散モデル(MSDM)を用いる。
以上の結果から,OSMMは画像品質や雑音耐性の点で従来の拡散モデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:50:35 GMT)
Mitigate Language Priors in Large Vision-Language Models by Cross-Images Contrastive Decoding [11.4] 言語先行は、LVLM(Large Vision-Language Models)における幻覚の主要な原因の1つである
LVLMにおける言語先行を緩和するクロスイメージコントラストデコーディング(CICD)を提案する。
実験の結果,CICDは言語先行の緩和に優れていた。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:16:56 GMT)
An Introduction to Discrete Variational Autoencoders [11.3] 変分オートエンコーダ(VAE)はニューラルネットワークによる教師なし学習の原則的アプローチである。
本チュートリアルでは,カテゴリー分布に従う潜在変数からなる潜在空間を,厳密かつ実用的に導入する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:33:31 GMT)
FitCF: A Framework for Automatic Feature Importance-guided Counterfactual Example Generation [11.2] 我々はZeroCFを紹介した。ZeroCFは、特徴帰属法から派生した重要な単語を活用して、反実例を生成するための忠実なアプローチである。
第2に,新たなフレームワークであるFitCFを提案する。このフレームワークは,上述の反事実をラベルフリップ検証によって検証し,実演として挿入する。
We showed the effect of LIME and Integrated Gradients as backbone attribution method for FitCF and found the number of demonstrations have be largest effect on performance。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:18:58 GMT)
The Evolving Landscape of Generative Large Language Models and Traditional Natural Language Processing in Medicine [11.2] 生成型大規模言語モデル (LLMs) は近年注目されているが, 異なる医療課題間での差異は未解明のままである。
従来のNLPが情報抽出・分析タスクで優位であるのに対し, 生成LDMはオープンエンドタスクで優位性を示すことがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:11:14 GMT)
Spectral alignment of stochastic gradient descent for high-dimensional classification tasks [11.1] 本研究では,SGDによるトレーニングダイナミクスと経験的ヘッセン行列と勾配行列のスペクトルの関係について検討した。
マルチクラス高次元混合系と1層または2層ニューラルネットワークの2つの標準分類タスクにおいて、SGD軌道と創発的なアウトリー固有空間が共通の低次元部分空間と整合していることが証明された。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:42:47 GMT)
Local geometry of high-dimensional mixture models: Effective spectral theory and dynamical transitions [11.1] 本研究では,高次元における経験的リスクの局所幾何学を,ヘッセン行列と情報行列のスペクトル理論を用いて研究する。
経験的スペクトル分布と外周固有値の限界について正確な式を証明した。
多クラスロジスティック回帰の場合の有効動力学を解析し,本研究の一般的な結果を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:59:22 GMT)
OSMLoc: Single Image-Based Visual Localization in OpenStreetMap with Fused Geometric and Semantic Guidance [11.1] OSMLocは、OpenStreetMapマップに対するファーストパーソナライズされたイメージに基づく、脳にインスパイアされた視覚的ローカライゼーションアプローチである。
意味的および幾何学的ガイダンスを統合し、精度、堅牢性、一般化能力を大幅に改善する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:43:56 GMT)
What Does Neuro Mean to Cardio? Investigating the Role of Clinical Specialty Data in Medical LLMs [11.0] 本稿では,S-MedQA(S-MedQA)について紹介する。
専門性からのデータトレーニングが必ずしもその専門性において最高のパフォーマンスをもたらすとは限らないことを示す。
医療領域における微調整データの役割を再考することを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:35:26 GMT)
NVSPolicy: Adaptive Novel-View Synthesis for Generalizable Language-Conditioned Policy Learning [10.9] NVSPolicyは、適応型新規ビュー合成モジュールと階層型ポリシーネットワークを結合した、一般化可能な言語条件付きポリシー学習手法である。
NVSPolicyはすべてのタスクで平均90.4%の成功率を実現しており、最近の手法よりも優れています。
さらに,NVSPolicyを実世界のロボットプラットフォーム上で評価し,実用性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:51:14 GMT)
MASS: Multi-Agent Simulation Scaling for Portfolio Construction [10.9] 本稿ではポートフォリオ構築のためのマルチエージェントスケーリングシミュレーション(MASS)を紹介する。
MASSは、大規模シミュレーションのエージェント数を徐々に増やすことで、安定かつ継続的な過剰なリターンを達成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:27:18 GMT)
A Unified and Scalable Membership Inference Method for Visual Self-supervised Encoder via Part-aware Capability [10.8] 自己指導型学習は、特にビジョンにおいて、重要なプライバシー上の懸念に直面している。
本稿では,より現実的な環境下で,視覚的自己監督モデルに対する会員推定を行う。
本稿では、PartCropと呼ばれる統一メンバーシップ推論手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:43:34 GMT)
Not All Adapters Matter: Selective Adapter Freezing for Memory-Efficient Fine-Tuning of Language Models [10.6] アダプタチューニングは、軽量なトレーニング可能なモジュールを導入することで、パラメータ効率の良い微調整を提供する。
各アダプタはタスク性能とリソース使用量の両方に不平等に寄与することを示す。
Selective Adapter FrEezing (SAFE, Selective Adapter FrEezing) を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:39:45 GMT)
CryoSAMU: Enhancing 3D Cryo-EM Density Maps of Protein Structures at Intermediate Resolution with Structure-Aware Multimodal U-Nets [10.4] 低温電子顕微鏡(cryo-EM)3次元密度マップの中間分解能の向上は、タンパク質の構造決定に不可欠である。
近年のディープラーニングの進歩により、実験用Cryo-EM密度マップの強化のための自動アプローチが開発されている。
CryoSAMUは構造認識型マルチモーダルU-Netを用いたタンパク質構造の3次元Cryo-EM密度マップの高速化を目的とした新しい手法である。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:06:46 GMT)
ImagineBench: Evaluating Reinforcement Learning with Large Language Model Rollouts [10.3] 強化学習(RL)における中心的な課題は、タスク固有のポリシーを学ぶために、広範囲の現実世界のインタラクションデータに依存することである。
我々は、オフラインRLアルゴリズムを評価するための最初の包括的なベンチマークであるImagineBenchを紹介する。
既存のオフラインRLアルゴリズムを単純に適用すれば、目に見えないタスクにおいて、最適以下のパフォーマンスが得られることを観察する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:45:37 GMT)
Self-supervised Learning for Acoustic Few-Shot Classification [10.2] 我々は、CNNに基づく前処理と状態空間モデル(SSM)に基づく特徴抽出を組み合わせた新しいアーキテクチャを導入、評価する。
実際のタスクデータに対するコントラスト学習と,それに続くラベル付きデータによる微調整を用いて,このアーキテクチャを事前学習する。
本評価は, 数発の分類問題において, 最先端のアーキテクチャよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:26:08 GMT)
Near Optimal Best Arm Identification for Clustered Bandits [10.1] 我々は、M$エージェントを$M$クラスタにグループ化し、各クラスタがバンドイト問題を解決する。
本稿では,クラスタリング,ベストアーム識別(Cl-BAI),ベストアーム識別(BAI-Cl)の2つの新しいアルゴリズムを提案する。
Cl-BAIは、学習しているバンディット問題に基づいて最初のクラスタエージェントを2フェーズのアプローチで処理し、続いて各クラスタに最適なアームを特定する。
BAI-Clは、まず最適な腕を特定し、次にそれに従ってクラスタリングエージェントを識別することで、配列を反転させる。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:20:26 GMT)
Cutting Through Privacy: A Hyperplane-Based Data Reconstruction Attack in Federated Learning [10.1] フェデレートラーニング(FL)は、生データを共有せずに、分散クライアント間で機械学習モデルの協調トレーニングを可能にする。
近年の研究ではFLの重大な脆弱性が明らかにされており、悪意のある中央サーバがモデルの更新を操作してクライアントのプライベートデータを再構築できることが示されている。
これらの制約を克服する新たなデータ再構成攻撃を導入する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:16:32 GMT)
Autoencoder-Based Hybrid Replay for Class-Incremental Learning [10.1] クラスインクリメンタルラーニング(CIL)では、タスクの混乱と忘れを緩和するために効果的なインクリメンタルラーニング戦略が不可欠である。
本稿では,新しいハイブリット・オートエンコーダ(HAE)を活用して圧縮機として機能する,オートエンコーダベースのハイブリッド・リプレイ(AHR)戦略を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:46:39 GMT)
Towards More Efficient, Robust, Instance-adaptive, and Generalizable Sequential Decision making [10.0] 私の仕事は強化学習(RL)、多腕バンディット、その応用に焦点を当てています。
私の研究は、より効率的で堅牢で、インスタンス適応的で、一般化可能なシーケンシャルな意思決定アルゴリズムを開発することを目的としています。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:21:11 GMT)
Non-Markovian dynamics with a driven three-level giant atom in a semi-infinite photonic waveguide [10.0] 半無限光導波路と3レベル巨大原子の非マルコフ動力学について検討する。
静的境界状態と周期的等振幅振動状態を含む2種類の有界状態を求める。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:28:17 GMT)
Offline Reinforcement Learning for Microgrid Voltage Regulation [9.9] 本稿では,太陽エネルギー導入によるマイクログリッド電圧制御のためのオフライン強化学習アルゴリズムについて述べる。
IEEE 33-busシステムにおける実験結果は、異なるオフラインデータセットに対する提案手法の有効性と有効性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:10:18 GMT)
Cross-Functional AI Task Forces (X-FAITs) for AI Transformation of Software Organizations [9.8] クロスファンクションAIタスクフォース(X-FAIT)は、戦略的AIの野心と運用実行のギャップを埋めることを目的としている。
X-FAITは、フォースフィールド分析、エグゼクティブスポンサーシップ、クロスファンクショナル統合、システマティックリスクアセスメント戦略を採用している。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:07:14 GMT)
Security and Privacy Measurement on Chinese Consumer IoT Traffic based on Device Lifecycle [9.7] 本研究は,中国における消費者向けIoTデバイストラフィックに関する最初の大規模データセットを構築した。
私たちは、36のブランドと8のデバイスカテゴリにまたがる70のデバイスからのトラフィックを集めています。
他の地域と比較すると、中国の消費者向けIoTデバイスは国内サービスに依存している。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:27:16 GMT)
VQ-Logits: Compressing the Output Bottleneck of Large Language Models via Vector Quantized Logits [9.5] VQ-Logitsは、大規模言語モデル出力層のパラメータカウントと計算負荷を大幅に削減する新しいアプローチである。
VQ-Logitsは出力層で最大99%のパラメータ削減を実現し,ロジット計算で6倍の高速化を実現可能である。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:58:04 GMT)
Learning Graph Representation of Agent Diffusers [9.4] 拡散に基づく生成モデルは高度なテキスト-画像合成を持つ。
この遷移は、静的モデルパラメータが生成の異なるフェーズに最適に対応していないことを示唆している。
本稿では,動的コンピュータビジョンタスクの適応性向上を目的とした,新しいマルチエージェントシステムであるLGR-ADを紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:32:55 GMT)
Quantum feedback cooling of a trapped nanoparticle by using a low-pass filter [9.4] 捕捉粒子を低域通過フィルタで冷却するための低域通過フィルタ(LPF)フィードバック制御を提案する。
本研究は, 低温減衰およびLQG制御よりも低いフォノン占有数が得られることを示す。
検出効率90%以上では, LPF制御の達成可能なフォノン占有数は, 寒冷減衰の約3分の1とLQG制御の約半分である。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:30:43 GMT)
Polymer Data Challenges in the AI Era: Bridging Gaps for Next-Generation Energy Materials [9.3] エネルギー技術のための高度なポリマーの追求は 断片化されたデータ生態系によって妨げられています
この断片化は、機械学習の応用と、グローバルな脱炭に不可欠な物質の発見を阻害する。
新興ソリューションは、技術的および協調的なイノベーションを通じて、これらのギャップに対処する。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:20:42 GMT)
Leveraging Multi-Modal Information to Enhance Dataset Distillation [9.3] 本稿では, キャプション誘導型監視とオブジェクト中心マスキングの2つの重要な拡張点について紹介する。
テキスト情報を統合するために,キャプション機能を利用する2つの手法を提案する。
包括的評価は、キャプションベースのガイダンスとオブジェクト中心マスキングを組み合わせることで、データセットの蒸留が促進されることを示している。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:19:15 GMT)
Representation Convergence: Mutual Distillation is Secretly a Form of Regularization [9.0] 我々は、強化学習政策間の相互蒸留が暗黙の規則化であり、それらが無関係な特徴に過度に適合することを防ぐと論じている。
非関係な特徴に対するポリシーロバスト性の向上が一般化性能の向上につながることを初めて証明した。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:40:27 GMT)
RoBERTa-Augmented Synthesis for Detecting Malicious API Requests [9.0] GANにインスパイアされた学習フレームワークを導入し、ターゲットとなるドメイン認識合成を通じて限られたAPIトラフィックデータセットを拡張する。
我々は,CSIC 2010 と ATRDF 2023 の2つのベンチマークデータセット上でフレームワークを評価し,従来のデータ拡張手法と比較した。
CSIC 2010ではF1スコアが4.94%増加し,ATRDF 2023では21.10%向上した。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:52:49 GMT)
LDIR: Low-Dimensional Dense and Interpretable Text Embeddings with Relative Representations [9.0] 我々はDense and Interpretable text embeddeds with Relative representations (LDIR)を提案する。
その次元の数値は、最遠点サンプリングを通して異なるアンカーテキストと意味的関連性を示す。
LDIRを複数の意味的テキスト類似性、検索、クラスタリングタスクで検証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:45:45 GMT)
Saliency-Motion Guided Trunk-Collateral Network for Unsupervised Video Object Segmentation [8.9] Saliency-Motion Guided Trunk-Collateral Network (SMTC-Net)
動き適応型ビデオオブジェクトセグメンテーション(UVOS)のための新しいTrunk-Collateral構造を提案する。
SMTC-Netは3つのUVOSデータセットで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:01:49 GMT)
Risk-sensitive Reinforcement Learning Based on Convex Scoring Functions [8.8] コンベックススコアリング機能を特徴とする多種多様なリスク目標に基づく強化学習フレームワークを提案する。
このクラスは、分散、期待不足、エントロピックなバリュー・アット・リスク、平均リスクユーティリティなど、多くの一般的なリスク対策をカバーしている。
我々は,統計的仲裁取引における金融的応用によるシミュレーション実験におけるアプローチの有効性を検証し,アルゴリズムの有効性を実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:40:05 GMT)
AI-enhanced semantic feature norms for 786 concepts [8.7] 大規模言語モデル(LLM)からの応答を伴って人為的特徴ノルムのデータセットを増強する新しいアプローチを導入する。
私たちは、AIによって強化された機能規範データセット、NOVA: Norms Optimized Via AIが、概念間の機能密度と重複をはるかに高めていることに気付きました。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:43:34 GMT)
MTDT: A Multi-Task Deep Learning Digital Twin [8.6] マルチタスク学習パラダイムを用いた総合交通流シミュレーションを提案する。
既存のディープラーニング手法と比較して、MTDT(Multi-Task Deep Learning Twin)は局所的時間的・空間的特徴への適応性を通じて自分自身を区別する。
また,個別の交通シミュレーションタスクの有効性について,マルチタスク学習の利点を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:16:20 GMT)
From Equations to Insights: Unraveling Symbolic Structures in PDEs with LLMs [8.4] 偏微分方程式(PDE)における記号関係の学習に大規模言語モデル(LLM)を活用することを提案する。
以上の結果から,PLMはPDEのシンボル情報を利用して,PDEソリューションに関わる演算子を効果的に予測できることが示唆された。
これらのシンボリック・リレーションシップの発見は、シンボリック・機械学習の効率性と精度を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:26:14 GMT)
AI2MMUM: AI-AI Oriented Multi-Modal Universal Model Leveraging Telecom Domain Large Model [8.4] 本稿では,AI2MMUM(AI2MMUM)の多モードユニバーサルモデルを提案する。
タスク適応性を高めるために、タスク命令は固定されたタスクキーワードと学習可能な暗黙のプレフィックスプロンプトから構成される。
タスク固有の軽量ヘッドは、タスク目標を直接出力するように設計されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:32:59 GMT)
Control Invariant Sets for Neural Network Dynamical Systems and Recursive Feasibility in Model Predictive Control [8.3] 本稿では,ニューラルネットワークに基づく動的モデルに適した制御不変集合を合成するアルゴリズムを提案する。
本稿では,これらの制御不変集合を混合整数最適化に組み込むモデル予測制御設計を提案する。
自律運転シナリオにおける数値シミュレーションは、制御不変集合をオフラインで合成し、オンラインでモデル予測制御を実装する方法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:01:14 GMT)
Dark LLMs: The Growing Threat of Unaligned AI Models [8.2] 大規模言語モデル (LLMs) は、医療から教育に至るまでの分野を進歩させ、現代生活を急速に再形成する。
LLMのジェイルブレイク攻撃に対する脆弱性は、彼らがそこから学んだデータに由来する。
我々の研究は、倫理的ガードレールを使わずに意図的に設計された暗いLLMモデルやジェイルブレイク技術で修正されたモデルによって引き起こされる脅威を識別する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:07:04 GMT)
Personalized Federated Learning under Model Dissimilarity Constraints [8.1] KARULAは、パーソナライズド・フェデレーション・ラーニングのための規則化された戦略であり、分散の違いに基づいて、クライアント間のペアワイズモデルの相違を制約する。
理論上、KARULA は O (1/K) の近傍レート定常点に滑らかで、おそらくは非関係な損失に収束することを示す。
合成および実データ集合上でKARULAを実証し、高度に複雑な相互関係の戦略の有効性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:50:52 GMT)
TARGET: Automated Scenario Generation from Traffic Rules for Testing Autonomous Vehicles via Validated LLM-Guided Knowledge Extraction [8.0] TARGETは、トラフィックルールからテストシナリオを自動的に生成するエンドツーエンドフレームワークである。
交通ルールから知識を抽出するために,Large Language Model (LLM) を利用する。
TARGETはシナリオをシミュレーションでレンダリングするために実行可能なスクリプトを合成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:10:56 GMT)
Demystifying AI Platform Design for Distributed Inference of Next-Generation LLM models [8.0] 大きな言語モデル(LLM)は、広範囲のアプリケーションで顕著なパフォーマンスを示しており、しばしば人間の専門家よりも優れています。
LLMの継続的なイノベーションが最適化に役立ち、モデルアーキテクチャはブレークネックスピードで進化しているため、サービスレベルオブジェクト(SLO)を満たすためのハードウェア要件は、オープンな研究課題のままである。
我々は、多様なLLMモデルアーキテクチャとAIプラットフォーム設計パラメータの関係を効率的にナビゲートする分析ツールGenZを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:46:53 GMT)
MSCI: Addressing CLIP's Inherent Limitations for Compositional Zero-Shot Learning [8.0] 構成ゼロショット学習は、既知の組み合わせを活用して、目に見えない状態オブジェクトの組み合わせを認識することを目的としている。
既存の研究は基本的にCLIPのクロスモーダルアライメント機能に依存している。
本稿では,CLIPのビジュアルエンコーダの中間層情報を効果的に探索し,活用する多段階クロスモーダルインタラクションモデルを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:36:42 GMT)
RAIDEN-R1: Improving Role-awareness of LLMs via GRPO with Verifiable Reward [7.9] RAIDEN-R1は、VRAR(Verifiable Role-Awareness Reward)を統合した新しい強化学習フレームワークである
マルチLLMコラボレーションにより,高品質で役割対応のChain-of-Thoughtデータセットを構築した。
RAIDENベンチマークの実験では、RAIDEN-R1の優位性が示されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:22:10 GMT)
ILIF: Temporal Inhibitory Leaky Integrate-and-Fire Neuron for Overactivation in Spiking Neural Networks [7.9] スパイキングニューラルネットワーク(SNN)は、そのエネルギー効率、イベント駆動処理、生物学的妥当性に注目が集まっている。
バックプロパゲーションを介してSNNを訓練するために、非微分可能なスパイク関数を近似するために代理勾配を用いる。
我々はガンマのジレンマと呼ばれる大きな課題を同定し、比較的大きなガンマは過剰なニューロンの発火を特徴とする過剰な活性化を引き起こす。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:56:06 GMT)
Are LLM-generated plain language summaries truly understandable? A large-scale crowdsourced evaluation [7.9] 平凡な言語要約(PLS)は,臨床医と患者との効果的なコミュニケーションを促進するために不可欠である。
大規模言語モデル(LLM)は、最近PSS生成の自動化を約束しているが、その健康情報理解を支援する効果は未だ不明である。
LLM生成PSSの大規模クラウドソース評価をAmazon Mechanical Turkで実施し,150名を対象に実験を行った。
以上の結果から, LLMは主観的評価において人書きと区別できないPSSを生成できるが, 人書きPSSは理解度が著しく向上することが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:31:17 GMT)
LanTu: Dynamics-Enhanced Deep Learning for Eddy-Resolving Ocean Forecasting [7.8] 本研究では,ダイナミックス強化深層学習に基づく地域渦解海洋予測システムであるLanTuを開発する。
以上の結果から,LanTuは,既存の高度運用数値予測システム(NOFS)とAIベースの海洋予測システム(AI-OFS)を,温度,塩分濃度,海面異常,現在の予測で上回っていることが明らかとなった。
我々の研究は、動的に強化された深層学習(LanTu)が海面予測の強力なパラダイムであることを示している。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:47:54 GMT)
Instance-Prototype Affinity Learning for Non-Exemplar Continual Graph Learning [7.8] グラフニューラルネットワークは破滅的な忘れを耐え、以前獲得した知識を保持する能力を損なう。
非現代連続グラフ学習(NECGL)のための新しいパラダイムであるインスタンス型親和性学習(IPAL)を提案する。
我々は,PCL内に決定境界知覚機構を組み込み,クラス間識別性を向上する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:35:27 GMT)
Defending the Edge: Representative-Attention for Mitigating Backdoor Attacks in Federated Learning [7.8] 不均一エッジデバイスは、多種多様で非独立で、同一に分散された(非IID)データを生成する。
本稿では, 悪意のあるクライアントと良識を区別するための, FeRA という, 表現力に基づく防衛機構を提案する。
本評価では,エッジデバイスに典型的な非IIDデータ分散に挑戦するなど,さまざまなFLシナリオにおけるFeRAの堅牢性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:44:32 GMT)
Seasonal Forecasting of Pan-Arctic Sea Ice with State Space Model [7.6] 我々は、状態空間モデルに高度な注意機構を統合するディープラーニングアーキテクチャであるIceMambaを紹介する。
IceMambaは、平均RMSEと異常相関係数(ACC)に関する全ての試験モデルより優れており、Ice Edge Error(IIEE)において第2位である。
この革新的なアプローチは、海氷の変動の影響を予見し緩和する能力を高め、気候適応を目指した戦略に不可欠な洞察を与えます。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:15:00 GMT)
SensorChat: Answering Qualitative and Quantitative Questions during Long-Term Multimodal Sensor Interactions [7.5] 本研究では,長時間の時系列データを用いた日常生活モニタリングのためのQAシステムであるSensorChatを紹介する。
数日間にわたる生のセンサー信号とユーザが定義した自然言語の質問が与えられたら、SensorChatは有意義な応答を生成する。
その結果,SensorChatの解答精度は,定量的な質問に対する最先端システムよりも93%高いことがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:31:41 GMT)
Using Cooperative Co-evolutionary Search to Generate Metamorphic Test Cases for Autonomous Driving Systems [7.5] 本稿では,自律運転システム(ADS)のシステムレベルの安全性評価を進めることを目的とした,新しい自動テストフレームワークCoCoMEGAを紹介する。
CoCoMEGAは、望ましくないシステム動作を示すテストシナリオの識別を強調し、最終的には、メタモルフィックリレーショナル(MR)によって取得される安全違反につながる可能性がある。
将来の研究の方向性には、さらなるシミュレーションプラットフォームへのアプローチの拡張、他の複雑なシステムに適用すること、サロゲートモデリングのようなテスト効率をさらに改善するための方法を模索することが含まれる。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:02:00 GMT)
The Mosaic Memory of Large Language Models [7.4] 我々は,Large Language Models (LLM) が類似のシーケンスから情報を組み立てることで記憶することを示す。
モザイク記憶を示す主要なLCMを示し, ファジィ複製は, 正確に複製され, 修正された配列の0.8まで記憶に寄与し, 記憶に大きく寄与する。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:18:58 GMT)
On the Power of Learning-Augmented Search Trees [7.3] 本稿では,Treapsを用いた学習強化二分探索木(BST)について,慎重に設計した優先順位で検討する。
その結果、各項目の深さが予測重量$w_x$によって決定される単純な探索木となる。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:46:39 GMT)
Dynamics of Adversarial Attacks on Large Language Model-Based Search Engines [7.3] 検索エンジンにおけるランキング操作攻撃のダイナミクスについて検討する。
システムダイナミクスの転換点を同定し、プレイヤーが前方を向いているとき、協調が維持される可能性がより高いことを示す。
私たちの研究は、彼らの脆弱性を理解し緩和するための理論的基盤と実践的な洞察を提供します。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:22:32 GMT)
ZEUS: Zero-shot Embeddings for Unsupervised Separation of Tabular Data [7.1] ZEUSは、追加のトレーニングや微調整なしに新しいデータセットをクラスタリングできる自己完結型モデルである。
複雑なデータセットを意味のあるコンポーネントに分解して動作し、効果的にクラスタ化することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:52:26 GMT)
Improving the Euclidean Diffusion Generation of Manifold Data by Mitigating Score Function Singularity [7.1] 一般多様体制約データに対するユークリッド拡散モデルの直接サンプリングについて検討する。
拡散生成サンプルの精度を阻害する多様体の埋め込み空間におけるスコア関数のマルチスケール特異点を明らかにする。
本稿では,特異性を緩和し,サンプリング精度を向上させる2つの新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:12:27 GMT)
Automating Security Audit Using Large Language Model based Agent: An Exploration Experiment [7.0] セキュリティ監査は、ポリシーが成立し、コントロールが実施され、サイバーセキュリティのリスク軽減のためにギャップが特定されることを保証することで、強力なセキュリティ姿勢を維持するのに役立つ。
本稿では,大規模言語モデル(LLM)を自律エージェントとして活用し,セキュリティ監査の一部を実行するフレームワークの開発の可能性を検討する。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:22:52 GMT)
Formalising Human-in-the-Loop: Computational Reductions, Failure Modes, and Legal-Moral Responsibility [7.0] 本書は、これらの設定の中から選択する新しい方法を特定することを目的としている。
これは、法的責任の帰属とAIの技術的説明可能性の間には避けられないトレードオフが存在することを示している。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:42:14 GMT)
ImprovNet -- Generating Controllable Musical Improvisations with Iterative Corruption Refinement [6.9] ImprovNetは、表現力と制御性のある即興演奏を生成するトランスフォーマーベースのアーキテクチャである。
ジャンル固有のスタイルでメロディーを調和させ、短期間の即時継続および補充タスクを実行することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:47:40 GMT)
Cape: Context-Aware Prompt Perturbation Mechanism with Differential Privacy [6.9] 既存のソリューションは、そのようなリスクを軽減するためにプライバシー強化技術に依存している。
差分プライバシーに基づく文脈認識型プロンプト機構であるCapeを提案する。
トークンの類似性をよりよくキャプチャするハイブリッドユーティリティ関数を導入する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:31:11 GMT)
Knowledge capture, adaptation and composition (KCAC): A framework for cross-task curriculum learning in robotic manipulation [6.7] 強化学習(Reinforcement Learning, RL)は、ロボット操作において顕著な可能性を示しているが、サンプルの非効率性や解釈可能性の欠如において課題に直面している。
本稿では,クロスタスクのカリキュラム学習を通じてRLに知識伝達を統合するための知識キャプチャ,適応,構成フレームワークを提案する。
その結果,従来のRL法に比べてタスク成功率を10%向上させながら,トレーニング時間の40%削減を実現した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:30:29 GMT)
A Fine-Grained Complexity View on Propositional Abduction -- Algorithms and Lower Bounds [6.6] 我々は、見過ごされているように見えるが自然なパラメータ n の下で、難解な誘引問題の複雑さを分析する。
SigmaP$ と NP- および coNP-完全 フラグメントに対していくつかの正の値が得られる。
我々はこれを低い境界で補い、多くのフラグメントは(強い)指数時間仮説の下で改善を除外する。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:56:19 GMT)
RH: An Architecture for Redesigning Quantum Circuits on Quantum Hardware Devices [6.6] 本稿では,量子ハードウェア上での大規模量子回路の再設計を実現するアーキテクチャを提案する。
ランダムな量子回路モジュールを標準のEQ-GANフレームワークにプリプションすることで、量子状態学習からユニタリ変換学習までその能力を拡張する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:36:31 GMT)
One For All: Formally Verifying Protocols which use Aggregate Signatures (extended version) [6.6] BLSアグリゲートシグネチャは、DfinityやCloudflareなどによってデプロイされた一般的なアグリゲートシグネチャである。
BLSアグリゲートシグネチャは、プロトコル開発者が慎重に扱わなければならないニュアンスな要件で、正しく使用するのは難しい。
本研究では,タマリンやProVerifなどの形式検証ツールをこれらのシグネチャを用いたプロトコルに適用可能なアグリゲートシグネチャの最初のモデルの設計を行う。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:01:30 GMT)
A Conformal Predictive Measure for Assessing Catastrophic Forgetting [6.6] 本研究は,連続学習における破滅的忘れ (CF) の評価手法を紹介する。
CPCF(Conformal Prediction Confidence Factor)と呼ばれる新しい共形予測基準を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:42:17 GMT)
Generative AI-Aided QoE Maximization for RIS-Assisted Digital Twin Interaction [6.5] 本研究では、再構成可能なインテリジェントサーフェス(RIS)支援ディジタルツイン(DT)と不確実な進化との相互作用に対するQoE(Quality of Experience)-awareリソース割り当て問題について検討する。
我々のゴールは、様々なDTシーンにおけるDTインタラクションにおける全モバイルユーザの主観的および客観的QoEの総和を最大化することである。
我々は、ゼロ強制最適化(PG-ZFO)と統合されたプロンプト誘導決定変換器と呼ばれる新しいGAI支援手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:00:29 GMT)
Symbolic Parallel Composition for Multi-language Protocol Verification [6.5] セキュリティプロトコルは、しばしば異なる言語を組み合わせる。このプラクティスは、従来の検証テクニックに挑戦する。
我々は,記号的実行セマンティクスを用いて,異なる原子型で動作する複数のプログラミング言語を組み合わせるための原理を確立した。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:38:40 GMT)
WildFireCan-MMD: A Multimodal Dataset for Classification of User-Generated Content During Wildfires in Canada [6.5] ソーシャルメディアはリアルタイムのアップデートを提供するが、関連する洞察を抽出することは依然として課題だ。
我々は、最近のカナダの山火事から得られたXポストのマルチモーダルデータセットであるWildFireCan-MMDを紹介する。
調査の結果は、カスタマイズされたデータセットとタスク固有のトレーニングの持続的重要性を強調した。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:47:02 GMT)
Towards Fair In-Context Learning with Tabular Foundation Models [6.5] タブラル基礎モデルは構造化データに強いコンテキスト内学習(ICL)能力を示す。
本稿では,ICLの公平性について検討し,偏見に対処する3つの前処理戦略について検討する。
実験により、不確実性に基づく実演選択は、文脈内予測の群フェアネスを一貫して向上させることが示された。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:13:43 GMT)
Complementary Collective Spin Descriptions of Superradiant Ramsey Spectroscopy [6.4] 最近の実験では、ストロンチウム88原子からの遅延超放射が、方向に沿って伝播するレーザーパルスによって励起されながら空洞の長手モードに結合されることを示した。
この実験における原子アンサンブルダイナミクスのコヒーレントな図は、外部駆動力学と超放射能力学の相補的な表現を必要とする。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:12:30 GMT)
GE-Chat: A Graph Enhanced RAG Framework for Evidential Response Generation of LLMs [6.4] 本稿では,エビデンスに基づく応答生成を実現するための検索強化フレームワークであるGE-Chatを提案する。
具体的には、ユーザが資料をアップロードすると、知識グラフが作成され、検索強化エージェントの構築に役立ちます。
我々は、正確な証拠検索を実現するために、Chain-of-Thought(CoT)ロジック生成、n-hopサブグラフ検索、entailment-based sentence生成を活用する。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:17:35 GMT)
Comparing Exploration-Exploitation Strategies of LLMs and Humans: Insights from Standard Multi-armed Bandit Tasks [6.4] 大規模言語モデル(LLM)は、シーケンシャルな意思決定タスクにおいて、人間の振る舞いをシミュレートしたり、自動化したりするためにますます使われている。
我々は、不確実性の下での動的意思決定の基本的な側面である、探査・探索(E&E)トレードオフに焦点を当てる。
推論は、ランダムな探索と指向的な探索の混在を特徴とする、より人間的な行動へとLSMをシフトさせる。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:09:18 GMT)
Less is More: Multimodal Region Representation via Pairwise Inter-view Learning [6.2] 地域表現学習のための情報分解手法であるクロスモーダル・ナレッジ・インジェクト・インジェクトド・エンベディング(CrossModal Knowledge Injected Embedding)を導入する。
本研究では,ニューヨークとインドのデリーにおける3つの回帰課題と土地利用分類課題について,クーキーの評価を行った。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:44:10 GMT)
Post-Post-API Age: Studying Digital Platforms in Scant Data Access Times [6.0] API後の時代」は、プラットフォームの透明性の向上と、デジタルプラットフォームに関する包括的な研究の新たな機会に対する楽観を喚起した。
しかし、プラットフォームが実際に適切なデータアクセスを提供するかどうかは不明だ。
以上の結果から,ソーシャルメディアデータにアクセスする上で大きな課題が浮かび上がっている。
これらの課題は、データアクセスにおける既存の制度的、地域的、財政的不平等を悪化させてきた。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:47:06 GMT)
GA3CE: Unconstrained 3D Gaze Estimation with Gaze-Aware 3D Context Encoding [5.9] 本研究では,映像中の被写体と物体の空間的関係を学習する新しい3次元視線推定手法を提案する。
本手法は、被検者の眼球のクローズアップビューが利用できない場合など、制約のない設定を対象とする。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:24:15 GMT)
Sample Complexity of Distributionally Robust Average-Reward Reinforcement Learning [5.8] ほぼ最適サンプル複雑性を実現するアルゴリズムを2つ提案する。
両アルゴリズムが最適なポリシを推定するために,$widetildeOleft(|mathbfS||mathbfA| t_mathrmmix2varepsilon-2right)のサンプル複雑性が得られることを証明した。
これはDR平均逆強化学習における最初の有限サンプル収束保証である。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:42:25 GMT)
Probabilistic Bisimulation for Parameterized Anonymity and Uniformity Verification [5.8] ビシミュレーションは確率的システムにおけるプロセス等価性の検証に不可欠である。
本稿では,有限状態確率系の無限族におけるビシミュレーションを解析するための新しい枠組みを提案する。
匿名性や均一性のような本質的な性質は、このフレームワーク内でエンコードされ、検証可能であることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:56:53 GMT)
On the Evaluation of Engineering Artificial General Intelligence [5.8] 本稿では,工学的汎用人工知能(eAGI)エージェントを評価するための枠組みを提案する。
我々はeAGIを人工知能(AGI)の専門化と考えている。
eAGIエージェントは、事実とメソッドの背景知識(リコールと検索)のユニークなブレンドを持つべきである。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:52:47 GMT)
Enhancing the Performance of Global Model by Improving the Adaptability of Local Models in Federated Learning [5.8] フェデレートラーニングは、クライアントがローカルモデルから集約されたグローバルモデルを協調的にトレーニングすることを可能にする。
クライアント上の不均一なデータ分布とフェデレートラーニングにおけるデータプライバシのため,ローカルモデルをトレーニングして,優れたグローバルモデルを実現することは困難である。
我々は,局所モデルの適応性を導入し,局所モデルの適応性を向上させることでグローバルモデルの性能を向上させる。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:51:47 GMT)
CRPE: Expanding The Reasoning Capability of Large Language Model for Code Generation [5.6] CRPE(Code Reasoning Process Enhancer)は、データ合成とモデルトレーニングのためのフレームワークである。
我々は,コード生成タスクの大幅な改善を示す拡張COTコーダを開発した。
Qwen2.5-Coder-32B-BaseをベースとしたCOT-Coder-32B-StepDPOは,パス@1精度35.08で優れた性能を示し,ベンチマークではGPT4Oを上回った。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:13:45 GMT)
SafeTrans: LLM-assisted Transpilation from C to Rust [5.6] Rustは、Cの"システム"プログラミング言語としてのメモリセーフな代替として、強力な競争相手である。
本稿では,大規模な言語モデル(LLM)がRustへのCコードの自動コンパイルを実現する可能性を評価する。
SafeTrans は LLM を使って,C コードを Rust にトランスパイルするフレームワークである。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:05:33 GMT)
TactileNet: Bridging the Accessibility Gap with AI-Generated Tactile Graphics for Individuals with Vision Impairment [5.6] 触覚グラフィックスは、世界4300万人の視覚障害者に視覚情報へのアクセスを提供するのに不可欠である。
これらのグラフィックを作成する従来の方法は労働集約的であり、需要の増加に対応できない。
私たちは、組み込み対応の2D触覚テンプレートを生成するための、最初の包括的なデータセットとAI駆動のフレームワークであるTactileNetを紹介します。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:09:00 GMT)
Coherent Language Reconstruction from Brain Recordings with Flexible Multi-Modal Input Stimuli [5.6] 脳の活動から思考を復号することは、人間の認知に関する貴重な洞察を与え、脳とコンピュータの相互作用において有望な応用を可能にする。
本稿では,多様な入力モダリティによって引き起こされた脳記録からコヒーレント言語を再構築するための統一的で柔軟なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:46:45 GMT)
Research of the Variational Shadow Quantum Circuit Based on the Whale Optimization Algorithm in Image Classification [5.5] 本稿では,Whale Optimizationアルゴリズムに基づく可変分割型シャドウ量子回路(VSQC)モデルを提案する。
本稿では,MNISTデータセット上でのバイナリ分類処理を実現するために,異なる局所化シャドウサーキットVSQCモデルを用いる。
強い絡み合ったシャドウ回路の設計は、分類精度の点で最良である。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:14:02 GMT)
Convolutional Neural Networks and Mixture of Experts for Intrusion Detection in 5G Networks and beyond [5.5] 6G/NextGネットワークは、新たなセキュリティ脅威に対して脆弱になる可能性がある。
侵入検知タスクの既存の研究は、浅い機械学習分類器の列車に依存している。
悪意のあるトラフィックを特定するために,Mixture of Experts (MoE)を統合した最初の研究を行った。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:47:48 GMT)
An unsupervised method for MRI recovery: Deep image prior with structured sparsity [5.4] 教師なしMRI再構成法は完全なk-spaceデータを必要としない。
深部画像前処理法(DISCUS)は,深部画像前処理法(DIP)を拡張した。
円盤は4つの研究で検証されました
論文参考訳(メタデータ) (Thu, 15 May 2025 17:15:14 GMT)
Two-Stage Generative Model for Intracranial Aneurysm Meshes with Morphological Marker Conditioning [5.4] 頭蓋内動脈瘤(IA)のメッシュ形状の生成モデルは,リアルタイムに血流量を予測するためのトレーニングネットワークにとって重要である。
本稿では,2段階可変オートエンコーダ(VAE)を用いたIAメッシュジェネレータAneuGを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:30:41 GMT)
MultiMed: Multilingual Medical Speech Recognition via Attention Encoder Decoder [5.4] 我々はMultiMedを紹介した。MultiMedは、マルチリンガルな医療ASRデータセットであり、小型から大規模の医療ASRモデルの最初のコレクションである。
私たちの知る限り、MultiMedは主要なベンチマーク全体にわたって世界最大の医療ASRデータセットです。
本稿では, 再現可能な経験ベースライン, モノリンガル性・多言語性分析, 注意復号法(AED)とハイブリッド比較法(Hybrid comparative study)と言語学的分析を含む, 医療ASRにおける最初の多言語性研究について紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:35:00 GMT)
Inferring Driving Maps by Deep Learning-based Trail Map Extraction [5.4] ハイデフィニション(HD)マップは、運転シーンに関する広範囲かつ正確な環境情報を提供する。
最近の傾向は、オフラインマッピングからオンラインマッピングへ移行し、使用済みマップの可用性と現実性を確保している。
ドライバが非公式に使用する経路をマップ作成プロセスに統合する,新たなオフラインマッピング手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:09:19 GMT)
TGDT: A Temporal Graph-based Digital Twin for Urban Traffic Corridors [5.4] 既存のディープラーニングモデルは、しばしば空間的な一般化性に欠け、複雑なアーキテクチャに依存し、リアルタイムのデプロイメントに苦労する。
本稿では,時間的畳み込みニューラルネットワークと注意グラフニューラルネットワークを統合したスケーラブルなフレームワークであるTGDTを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:23:36 GMT)
Non-Registration Change Detection: A Novel Change Detection Task and Benchmark Dataset [5.4] 本稿では,緊急時の増加に対応するために,新たな遠隔センシング変更検出タスクである非登録変更検出タスクを提案する。
まず,実世界で発生しうる8つのシナリオを体系的に提案し,非登録問題の発生に寄与する可能性がある。
第2に、利用可能な登録変更検出データセットを非登録バージョンに変換するために、さまざまなシナリオに適した画像変換方式を開発する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:52:42 GMT)
KAITIAN: A Unified Communication Framework for Enabling Efficient Collaboration Across Heterogeneous Accelerators in Embodied AI Systems [5.2] KAITIANは、AIワークロードのための新しい分散通信フレームワークである。
ベンダー最適化されたグループ内効率のための通信ライブラリとグループ間相互運用性のための汎用通信プロトコルを統合する。
ベースラインの均質システムと比較してトレーニング時間を最大42%短縮することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:29:43 GMT)
HWA-UNETR: Hierarchical Window Aggregate UNETR for 3D Multimodal Gastric Lesion Segmentation [5.2] HWA-UNETRは、学習可能なウィンドウアグリゲーション層を備えたオリジナルのHWAブロックを利用する、新しい3Dセグメンテーションフレームワークである。
我々のフレームワークは、しっかりとした堅牢性を維持しながら、Diceスコアの1.68%まで既存の手法を上回ります。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:18:00 GMT)
Inconsistency Handling in DatalogMTL [5.2] 計量時間演算子を用いたデータログの拡張であるDatalogMTLにおける不整合処理の問題について検討する。
私たちの最初の貢献は、紛争(矛盾の最小説明)と修復(一貫性の回復可能な方法)の関連概念の定義である。
第2のコントリビューションは、修復ベースのセマンティクスの下で単一のコンフリクト/リカバリとクエリエンタテインメントを生成するタスクに関する、データ複雑性の分析です。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:17:09 GMT)
Addressing and Visualizing Misalignments in Human Task-Solving Trajectories [5.2] 本研究は, 意図を表現する関数の欠如, textbf(2)非効率なアクションシーケンス, textbf(3) 課題を解決できない誤った意図の3つのタイプに分類する。
我々は、人間のタスク解決軌道で訓練されたAIモデルが、人間の推論を模倣する性能を向上させることを実験的に実証した。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:17:59 GMT)
Assessing Collective Reasoning in Multi-Agent LLMs via Hidden Profile Tasks [5.1] 我々は,マルチエージェントLLMシステムのための診断テストベッドとして,社会心理学からの隠れプロファイルパラダイムを紹介した。
エージェント間で重要な情報を非対称に分配することにより、エージェント間ダイナミクスが集団的推論をどのように支援するか、あるいは妨げるかを明らかにする。
協調エージェントは集団的設定において過度に協調する傾向にあるが,矛盾が集団収束を損なうことが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:22:54 GMT)
Are Sparse Autoencoders Useful for Java Function Bug Detection? [5.1] ソフトウェア脆弱性はセキュリティ侵害の主な原因である。
従来の脆弱性検出方法は、高い偽陽性率、スケーラビリティの問題、手作業への依存によって制限されている。
Sparse Autoencoderはこの問題に対して有望な解決策を提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:59:17 GMT)
Public-Key Quantum Money and Fast Real Transforms [5.1] グループアクションとハートレー変換に基づく公開鍵量子マネースキームを提案する。
本研究では、連続時間量子ウォークに基づく新しいアルゴリズムを用いて、マネー状態に関連するシリアル数を効率的に計算する方法を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:07:54 GMT)
SVA-ICL: Improving LLM-based Software Vulnerability Assessment via In-Context Learning and Information Fusion [5.1] 本研究では,大規模言語モデル(LLM)の性能向上のために,文脈内学習(ICL)を活用する新しいアプローチSVA-ICLを提案する。
12,071個のC/C++脆弱性からなる大規模データセットを用いて,SVA-ICLの有効性を評価する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:43:32 GMT)
AI LEGO: Scaffolding Cross-Functional Collaboration in Industrial Responsible AI Practices during Early Design Stages [5.0] 非技術的役割による有意義な関与をサポートする方法で、技術設計の選択が受け継がれることはめったにないことを示す。
Google Docsのような既存のツールは、役割間の共同で有害な識別をサポートするのに不適だ。
AI LEGOは、クロスファンクショナルなAI実践者をサポートし、知識のハンドオフを効果的に促進するプロトタイプです。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:49:02 GMT)
Whitened Score Diffusion: A Structured Prior for Imaging Inverse Problems [5.0] 標準スコアの代わりに白色スコア関数を学習する新しいSDEベースのフレームワークであるWhitened Score(WS)拡散モデルを提案する。
WS DM は任意のガウス雑音に対して FM と等価性を確立し、スペクトル誘導バイアスを調整可能とし、構造的雑音を伴う逆問題を撮像するための強いベイズ偏差を与える。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:55:55 GMT)
GeoGrid-Bench: Can Foundation Models Understand Multimodal Gridded Geo-Spatial Data? [5.0] GeoGrid-Benchは、グリッド構造における地理空間データを理解する基礎モデルの能力を評価するために設計されたベンチマークである。
このベンチマークでは、150カ所にわたる16の気候変数と、拡張された時間フレームをカバーする、大規模で現実的なデータを取り上げている。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:31:44 GMT)
Does Feasibility Matter? Understanding the Impact of Feasibility on Synthetic Training Data [5.0] CLIPをベースとした分類器の合成訓練データを生成するためには,実現可能性の確保が必要であるかを検討する。
VariRealは、あるソースイメージを最小限に編集して、実現不可能または実現不可能な属性を含むパイプラインである。
実験の結果,ロラファインチューニングCLIPの精度は0.3%以下であり,実現可能性も最小限に抑えられることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:57:38 GMT)
Advancing Community Detection with Graph Convolutional Neural Networks: Bridging Topological and Attributive Cohesion [5.0] そこで我々は,Topological and Attributive similarity-based Community Detection (TAS-Com)法を提案する。
TAS-Comは、高度に効率的でスケーラブルなライデン属性アルゴリズムを利用して、グローバルな最適モジュラリティを持つコミュニティ構造を検出する。
我々は,TAS-Comがいくつかの最先端アルゴリズムを大幅に上回ることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:53:33 GMT)
Asynchronous Decentralized SGD under Non-Convexity: A Block-Coordinate Descent Framework [5.0] 本稿では, ADSGD (Asynchronous Decentralized Gradient Descent) の精度向上モデルを提案する。
単純さ、メモリと通信の効率、通信と計算の遅延に対するレジリエンスにより、ADSGDは現実世界の分散学習タスクに適している。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:06:38 GMT)
A Representation Learning Approach to Feature Drift Detection in Wireless Networks [5.0] 本稿では,特徴分布の変化を検知し,モデルの再学習をトリガーする手法であるALRTを提案する。
ALERTには、表現学習、統計的テスト、ユーティリティアセスメントの3つのコンポーネントが含まれている。
文献で利用可能な10種類の標準ドリフト検出法に対して,提案手法の優位性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:08:00 GMT)
"There Is No Such Thing as a Dumb Question," But There Are Good Ones [5.0] 本研究は,優れた質問を定義し,体系的な評価枠組みを提案する。
本稿では,適切性(文脈における社会言語的能力)と有効性という2つの重要な評価次元を提案する。
動的文脈変数を組み込むことにより、評価フレームワークは半適応的基準によって構造と柔軟性を達成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:12:28 GMT)
Automated Detection of Salvin's Albatrosses: Improving Deep Learning Tools for Aerial Wildlife Surveys [4.9] 無人航空機(UAV)は高解像度画像を撮影する費用効率のよい手段を提供する。
ニュージーランドのバウンティ諸島におけるサルビンのアルバトロス(Thalassarche salvini)の繁殖個体数を推定するための汎用鳥類検出モデルBirdDetectorの性能評価を行った。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:42:44 GMT)
Spike-timing-dependent Hebbian learning as noisy gradient descent [4.8] ヘビアンラーニングは、生物学的ニューラルネットワークにおける学習の基礎となる重要な原則である。
ヘビアンスパイクタイピング依存の塑性規則を雑音勾配降下に関連づける。
この関係により、学習規則が最終的に最も活動性の高いシナプス前ニューロンを識別することを証明することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:23:16 GMT)
Malliavin Calculus for Score-based Diffusion Models [4.8] スコア関数 $nabla log p_t(x)$ の正確な解析式を導出する。
提案手法は複数の生成タスクにまたがって評価され,その性能は最先端の手法に匹敵することがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:12:52 GMT)
MMRL++: Parameter-Efficient and Interaction-Aware Representation Learning for Vision-Language Models [4.8] マルチモーダル表現学習は、テキストと画像エンコーダの両方に投影された空間トークンを表現トークンとして生成する。
MML++はパラメータ効率と対話性を考慮した拡張で、トレーニング可能なパラメータを大幅に削減する。
15データセットの実験では、MMRLとMMRL++が一貫して最先端のメソッドより優れていることが示されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:43:53 GMT)
Efficient quantum readout-error mitigation for sparse measurement outcomes of near-term quantum devices [4.8] 本稿では、2つの効率的な量子読み出し誤差軽減法を提案する。
提案手法は、$O(ns2)$ time for probability distributions of $n$ qubits and $s$ shotsで終了する。
提案手法を用いて,65量子GHZ状態の緩和にはほんの数秒しかかからず,29量子GHZ状態の0.5を超える忠実さを目撃する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:28:39 GMT)
FRET: Feature Redundancy Elimination for Test Time Adaptation [4.8] テスト時間適応(TTA)は、トレーニングデータからの分散シフトを示すテストデータに直面した場合、ディープラーニングモデルの一般化を促進することを目的としている。
実際には、TTAのドメインシフトが増大するにつれて、埋め込みにおける特徴冗長性が増大する傾向にある。
本稿では,テスト時間適応のための特徴冗長性除去(FRET)について紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:22:56 GMT)
Intelligently Augmented Contrastive Tensor Factorization: Empowering Multi-dimensional Time Series Classification in Low-Data Environments [4.8] 我々は、多機能でデータ効率のよいフレームワークITA-CTF(Intelligently Augmented Contrastive Factorization)を提案する。
ITA-CTFモジュールは多次元時系列から効率的な表現を学習する。
類似性学習とクラス認識に対する新しい対照的な損失最適化が組み込まれている。
標準およびいくつかのDLベンチマークと比較して、注目すべきパフォーマンス改善は18.7%に達した。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:07:22 GMT)
CSPENet: Contour-Aware and Saliency Priors Embedding Network for Infrared Small Target Detection [4.7] 赤外線小目標検出(ISTD)は、幅広い民間・軍事用途において重要な役割を担っている。
既存の手法では, 密集した乱雑な環境下でのディムターゲットの局所化や輪郭情報の認識に欠陥がある。
本稿では,ISTDのためのcontour-aware and saliency priors embedded network (CSPENet)を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:56:36 GMT)
RainPro-8: An Efficient Deep Learning Model to Estimate Rainfall Probabilities Over 8 Hours [4.7] ヨーロッパにおける8時間の地平線上での高分解能確率降水予測のための深層学習モデルを提案する。
本モデルは,レーダー,衛星,物理に基づく数値気象予測(NWP)を含む複数のデータソースを効率よく統合し,長距離の相互作用を捉える。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:22:20 GMT)
Empirically evaluating commonsense intelligence in large language models with large-scale human judgments [4.7] 本稿では,人工知能における常識を評価する新しい手法を提案する。
モデルの判断と人口の対応を計測する。
私たちのフレームワークは、異なる、しばしば互換性のない、知識の社会的備蓄を持つ人間の集合体にAIモデルを適用することの要求に寄与します。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:55:27 GMT)
Improving Fine-Grained Control via Aggregation of Multiple Diffusion Models [4.7] 本稿では,多重拡散モデル (AMDM) の微粒化のための新しい学習自由度アルゴリズムを提案する。
AMDMは複数の拡散モデルの機能を特定のモデルに統合し、特定の機能を活性化し、きめ細かい制御を可能にする。
実験結果から,AMDMはトレーニングなしで微粒化制御を著しく改善し,その有効性が検証された。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:59:09 GMT)
Personalizing Large Language Models using Retrieval Augmented Generation and Knowledge Graph [4.7] 大きな言語モデル(LLM)は、会話アシスタントでクエリされた応答を生成するために使用することができる。
このような問題の根本原因の1つは、LLMに供給されるタイムリー、事実、パーソナライズされた情報の欠如である。
知識グラフ(KG)を用いた検索拡張生成(RAG)の導入により,これらの問題に対処する手法を提案する。
本手法は,個人データをテキスト入力として用いたベースラインLLMと比較して,個人情報の理解や正確な応答生成に優れる。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:01:58 GMT)
VolE: A Point-cloud Framework for Food 3D Reconstruction and Volume Estimation [4.6] モバイル端末駆動型3D再構成を利用して食品量を推定する新しいフレームワークであるVolEを提案する。
VolEは、AR対応モバイルデバイスのおかげで、画像やカメラの位置を自由に撮影し、正確な3Dモデルを生成する。
実験の結果,VolEは2.22 %のMAPEを達成し,複数のデータセットにわたる既存のボリューム推定手法より優れていることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:03:05 GMT)
Crack Path Prediction with Operator Learning using Discrete Particle System data Generation [4.6] 我々は、演算子学習モデル、特にDeep Operator Networks(DeepONets)の訓練に構成インフォームド・パーティクル・ダイナミクス(CPD)シミュレーションを使用する。
バニラとFusion DeepONetという2種類のDeepONetの変種を探索し、様々な地形を持つ標本において、時間的に進化する亀裂の伝播を予測する。
その結果、Fusion DeepONetはバニラ変種より一貫して優れており、特に非破壊ケースではより正確な予測が可能であることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:25:21 GMT)
Welfare Analysis in Dynamic Models [4.5] 本研究では,動的モデルを用いた福祉分析のためのメトリクスの推定と推定を行う。
福祉指標の例としては、平均的福祉、平均的限界的福祉効果、直接的および間接的な効果への福祉の分解がある。
偏見は、偏見補正の形式ではなく、利害の福祉基準に関する知識のみを必要とするという意味で、自動的である。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:31:05 GMT)
Towards Scalable IoT Deployment for Visual Anomaly Detection via Efficient Compression [4.5] 視覚異常検出(VAD)は産業環境において重要な課題であり、運用コストの最小化が不可欠である。
本研究は,コンパクトで効率的な処理戦略を活用することにより,これらの制約下でのVADの効果的実行方法について検討する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:05:10 GMT)
Conversational Query Reformulation with the Guidance of Retrieved Documents [4.4] 本稿では,最初に検索したドキュメントからキー情報を活用することでクエリを洗練するフレームワークである GuideCQR を紹介する。
提案手法は,複数のデータセットにまたがる最先端性能を実現し,従来のCQR手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:27:17 GMT)
The Ephemeral Threat: Assessing the Security of Algorithmic Trading Systems powered by Deep Learning [4.4] 本稿では,Deep Learning (DL) を用いた計算ファイナンスにおける株価予測の安全性について検討する。
我々は、DLベースのATSに適した新しいタイプの攻撃を行うために使用できるEP(ephemeral perturbation)の概念を定式化する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:50:10 GMT)
Observation of Genuine High-dimensional Multi-partite Non-locality in Entangled Photon States [4.4] 2つの粒子間の絡み合いの次元を徐々に高めるために、重要な努力が進行中である。
本研究では, 量子非局所性が量子ビット制約を超えることを示す実験的検討を行った。
この結果から, 高次元系が局所隠れ変数理論に違反する点において, 量子ビットを超越する方法が明らかとなった。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:33:01 GMT)
QPRAC: Towards Secure and Practical PRAC-based Rowhammer Mitigation using Priority Queues [4.3] JEDECは、DDR5と将来のDRAMのためのPer Row Activation Counting (PRAC)フレームワークを導入した。
PRACはローハンマー攻撃の全体的緩和を可能にする。
本稿では,PRACフレームワークを使用した最初のセキュアでスケーラブルで実用的なRowHammerソリューションを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:36:33 GMT)
Compact Lattice-Coded (Multi-Recipient) Kyber without CLT Independence Assumption [4.3] 本研究は、公開鍵暗号(PKE)とキーカプセル化機構(KEM)の符号化および暗号化手順を共同で設計する。
我々の設計では、暗号文パッキングと格子パッキングの2つの技法が特徴である。
DFRとCERはどちらも、暗号文パッキングと格子パッキングによって大幅に減少している。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:11:10 GMT)
Positional Encoder Graph Quantile Neural Networks for Geographic Data [4.3] 本稿では,PE-GNNと量子ニューラルネットワーク,部分的に単調なニューラルブロック,ポストホックリカレーション技術を組み合わせた新しいフレームワークを提案する。
PE-GQNNは、ターゲット分布に関する最小の仮定で柔軟で堅牢な条件密度推定を可能にし、空間データを超えたタスクに自然に拡張する。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:11:12 GMT)
Efficient Parallelization of Message Passing Neural Networks [4.2] 本稿では,MPNNモデルに対して,局所的な原子間でのデータ通信を最小化する効率的な並列アルゴリズムを提案する。
このアプローチにより、MPNNモデル上で数十億の原子を厳密に局所的なモデルと同じくらい高速に分子動力学シミュレーションすることができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:22:45 GMT)
FactsR: A Safer Method for Producing High Quality Healthcare Documentation [4.2] 本稿では,医療相談と並行して,健康な臨床情報をリアルタイムに抽出するFactsについて紹介する。
FactsR法は, ノート生成のクリニアン・イン・ザ・ループを配置することにより, より正確かつ簡潔な音符を生成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:51:22 GMT)
Testing Scalable Bell Inequalities for Quantum Graph States on IBM Quantum Devices [4.1] ベルの不等式は、非局所的な量子状態と局所的な測定値から量子デバイスの品質をテスト、検証するのに有用である。
我々は、グラフ状態によって最大に侵害されるスケーラブルで堅牢な不等式に基づいて、IBM Quantumデバイスにおけるベルの不等式違反を報告する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:33:11 GMT)
When Mitigations Backfire: Timing Channel Attacks and Defense for PRAC-Based RowHammer Mitigations [4.0] RH軽減効果を損なうことなくPRACによるタイミングチャネルを除去する防御であるTPRAC(Timing-Safe PRAC)を提案する。
評価の結果、TPRACは1024のRH閾値で3.4%のオーバヘッドしか発生せず、タイミングチャネルを閉じていることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:28:46 GMT)
High-performance local automaton decoders for defect matching in 1D [3.9] 量子反復符号の一次元における2種類の局所復号器を提案する。
信号ルールデコーダは、近隣の量子ビット間の奇数のパリティを欠陥として解釈し、古典的な点のような励起の交換によって互いに惹きつける。
コード容量モデルにおけるしきい値の存在を証明し、指数論理的誤り抑制の数値的証拠を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:43:08 GMT)
AI Greenferencing: Routing AI Inferencing to Green Modular Data Centers with Heron [3.8] 本稿では、風力発電所で共同配置されたモジュール型計算クラスタにAIワークロードを組み込むことを論じる。
私たちは、風力発電の相補性を効果的に活用できるクロスサイトソフトウェアルータHeronを開発しました。
We show how Heron improves aggregate goodput of AI compute than the state-of-the-art。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:03:47 GMT)
TensorLLM: Tensorising Multi-Head Attention for Enhanced Reasoning and Compression in LLMs [3.8] マルチヘッドテンソル化プロセスとタッカー分解によるMHA圧縮を実現する新しいフレームワークを提案する。
提案手法は,複数のベンチマークデータセットにまたがるLCMの推論能力を一貫して向上させることを実証する。
提案手法は既存のFFNのみに基づく復調手法とシームレスに組み合わせることで,LLM推論性能のさらなる向上を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:42:44 GMT)
Understanding Users' Security and Privacy Concerns and Attitudes Towards Conversational AI Platforms [3.8] r/ChatGPT Redditコミュニティから250万以上のユーザ投稿を大規模に分析して、ユーザのセキュリティとプライバシに関する懸念を理解する。
データライフサイクルの各ステージ(すなわち、収集、使用、保持など)にユーザが関心を持っていることが分かりました。
透明性を高め、データコントロールを改善し、ユーザの信頼と採用を高めるために、ユーザ、プラットフォーム、企業、および政策立案者にレコメンデーションを提供します。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:35:10 GMT)
Accelerating Visual-Policy Learning through Parallel Differentiable Simulation [3.7] 本稿では、微分可能シミュレーションと一階解析的ポリシー勾配を利用する視覚政策学習のための計算効率の良いアルゴリズムを提案する。
我々のアプローチは、計算グラフからレンダリングプロセスを分離し、既存の微分可能シミュレーションエコシステムとのシームレスな統合を可能にします。
特に,本手法は最終リターンで4時間分の改善を実現し,単一のGPU上で4時間以内にヒューマノイド動作ポリシーを学習することに成功した。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:38:36 GMT)
Why Ask One When You Can Ask $k$? Two-Stage Learning-to-Defer to the Top-$k$ Experts [3.7] 我々はTop-k$ Learning-to-Deferの最初のフレームワークを紹介します。
提案するTop-$k(x)$ Learning-to-Deferは,入力複雑性,エキスパート品質,コンサルテーションコストに基づいて,クエリ毎の専門家数を最適に学習する適応型拡張である。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:25:18 GMT)
One-Stage Top-$k$ Learning-to-Defer: Score-Based Surrogates with Theoretical Guarantees [3.7] 最初の1段階のTop-k$ Learning-to-Deferフレームワークを紹介します。
我々は、最もコスト効率の良いエンティティラベルや専門家1人当たりのインプットを$k$で選択するスコアベースの共有モデルを学ぶ。
CIFAR-10とSVHNの実験により、我々の1段階のTop-$k$法がTop-1deferralを厳密に上回っていることを確認した。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:41:16 GMT)
Negative Metric Learning for Graphs [3.7] グラフ対照的学習(GCL)は、しばしば偽陰性に悩まされ、下流タスクのパフォーマンスが低下する。
NML(Negative Metric Learning)拡張GCL(NML-GCL)を提案する。
NML-GCLは学習可能な負の計量ネットワーク(NMN)を用いて負の計量空間を構築する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:53:48 GMT)
Mining Hidden Thoughts from Texts: Evaluating Continual Pretraining with Synthetic Data for LLM Reasoning [3.6] Reasoning CPTは、合成データを使用して、テキストの裏にある隠された思考過程を再構築する。
解析の結果,Reasoning CPTはすべての評価領域におけるパフォーマンスを継続的に改善することがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:29:01 GMT)
Illegal Waste Detection in Remote Sensing Images: A Case Study [3.4] 環境犯罪に対する闘いは、現在、写真解釈を支援するために現代の画像分析ツールに依存している。
本稿では,地域環境保護庁と連携して開発された半自動廃棄物検出パイプラインについて述べる。
最高のモデルでは、92.02%のF1スコアと94.56%の精度を達成した。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:22:44 GMT)
RouteNator: A Router-Based Multi-Modal Architecture for Generating Synthetic Training Data for Function Calling LLMs [3.4] デジタルコンテンツ作成ツールでは、ユーザは、API呼び出しにマップしなければならない自然言語クエリを通じて、ニーズを表現します。
既存の合成データ生成アプローチでは、実世界のデータ分散を複製することができない。
高品質な合成学習データを生成するルータベースのアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:53:45 GMT)
Near-Optimal Parameter Tuning of Level-1 QAOA for Ising Models [3.4] 2次元の$(gamma, beta)$サーチを$gamma$より1次元の検索に還元する方法を示し、$beta*$を解析的に計算する。
このアプローチはRecursive QAOA (RQAOA) を用いて検証され、粗い最適化RQAOAと半定値プログラムを一貫して上回る。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:13:47 GMT)
Words That Unite The World: A Unified Framework for Deciphering Central Bank Communications Globally [3.4] 世界中央銀行のデータセットを導入し,28年間の歴史的データをもとに25の中央銀行から380万件の文を作成した。
我々は3つのタスクを定義する:スタンス検出、時間分類、不確かさ推定。
銀行間で集約されたデータに基づいてトレーニングされたモデルは、個々の銀行のデータに基づいてトレーニングされたモデルを大幅に上回っており、「全体はその部分の総和よりも大きい」という原則を確認している。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:49:20 GMT)
Emergence of Structure in Ensembles of Random Neural Networks [3.3] ランダム分類器のアンサンブルにおける集団行動の出現に関する理論的モデルを提案する。
MNISTデータセットの実験は、高品質でノイズのないデータセットにおけるこの現象の関連性を説明する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:20:02 GMT)
To what extent can current French mobile network support agricultural robots? [3.3] 本稿では,農業用ロボットの大規模展開によって引き起こされるエネルギー消費量と炭素フットプリント量を評価する手法を提案する。
以上の結果から,ロボットのニーズが増大すると,大きな影響がもたらされることが示唆された。
ネットワークを既存のサイトに制限すると、需要が急増し、管理可能な農業地域も急速に減少する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:41:40 GMT)
A Comparative Study of SMT and MILP for the Nurse Rostering Problem [3.2] 本研究では,多種多様な実世界のスケジューリング制約をモデル化可能な汎用制約定式化を提案する。
我々は、学術的および現実世界にインスパイアされたロスター問題に関して、Z3 と Gurobi を比較した。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:12:39 GMT)
Multiplication triples from entangled quantum resources [3.2] マルチパーティ計算(MPC)の効率的なパラダイムは、共有された前処理された計算リソースへのアクセスを中心に構成されたプロトコルである。
量子グラフ状態からこれらの相関関係を生成するための新しい手法を提案する。
私たちは、リソース状態の理想的なコピーへのアクセスを前提として、プロトコルの完全なプライバシを証明します。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:06:32 GMT)
Designing and Contextualising Probes for African Languages [3.2] 本稿では,アフリカ言語に関する言語知識のためのPLMの探索に関する最初の体系的研究について述べる。
我々は6つの類型的多様性を持つアフリカの言語に対して、言語的特徴がどのように分散されているかを分析するために、階層的プローブを訓練する。
アフリカ語に適応した PLM は,多言語 PLM よりも対象言語に関する言語情報をエンコードする。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:35:14 GMT)
PEP-GS: Perceptually-Enhanced Precise Structured 3D Gaussians for View-Adaptive Rendering [3.1] 3D Gaussian Splatting (3D-GS)はリアルタイムで高品質な3Dシーンレンダリングにおいて大きな成功を収めた。
PEP-GSは、不透明度、色、共分散を含むガウス属性を動的に予測する知覚的に強化されたフレームワークである。
我々はPEP-GSが最先端の手法、特にビュー依存効果や細かな詳細を含む挑戦的なシナリオにおいて優れていることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:32:07 GMT)
On the Interplay of Human-AI Alignment,Fairness, and Performance Trade-offs in Medical Imaging [3.1] この領域における人間とAIの整合性と公正性に関する最初の体系的な調査を提供する。
以上の結果から,人間の洞察を取り入れることで,公平さのギャップを減らし,領域外一般化を促進することが示唆された。
これらの結果は、公正で堅牢で汎用的な医療AIシステムを開発するための、有望なアプローチとして、人間とAIのアライメントを強調している。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:43:23 GMT)
NeRF-To-Real Tester: Neural Radiance Fields as Test Image Generators for Vision of Autonomous Systems [3.0] シミュレーション条件に対するコントローラの過度な適合は、運用環境における性能の低下につながる。
本稿では,ニューラルネットワークを利用した自律システムにおける知覚テストデータ生成の課題に対処する。
当社のツールであるN2R-Testerは、カスタムシーンのトレーニングモデルと、摂動位置からのテストイメージのレンダリングを可能にする。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:31:53 GMT)
Phase Diagram of Vision Large Language Models Inference: A Perspective from Interaction across Image and Instruction [3.0] 本稿では,異なるモードのトークンの隠れ状態ベクトル間の文脈化を計測する。
我々の実験は、トランスフォーマーベースのLMの深さに対するビジョン大言語モデル(VLLM)の4相推論ダイナミクスを明らかにする。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:25:54 GMT)
Robust Amortized Bayesian Inference with Self-Consistency Losses on Unlabeled Data [2.9] 本研究では,実データを含む任意の情報源から得られたテキスト未ラベルデータのトレーニングを可能にする半教師付きアプローチを提案する。
我々は,高次元時系列データや画像データなど,実世界のいくつかのケーススタディに対するアプローチを検証した。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:46:15 GMT)
Crossing Borders Without Crossing Boundaries: How Sociolinguistic Awareness Can Optimize User Engagement with Localized Spanish AI Models Across Hispanophone Countries [2.9] 本稿では,ラテンアメリカとスペインにおけるスペイン語の変種の主な相違について検討する。
これらの違いは、方言群におけるスペイン語のクオーディアン使用における重要なギャップを効果的に担っていると論じる。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:09:19 GMT)
LLM A*: Human in the Loop Large Language Models Enabled A* Search for Robotics [2.9] 本研究は,ロボットなどの移動体エージェントの(パス)計画において,Large Language Models(LLM)がいかに役立つかに焦点を当てる。
LLM A* という新しいフレームワークは LLM のコモンセンスを活用することを目的としており、ユーティリティ最適化 A* は少数ショットに近い経路計画を容易にするために提案されている。
このアプローチでは、人間からのフィードバックを受け取り、計画プロセス全体を(ホワイトボックスのように)人間に透明にします。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:25:13 GMT)
How Students Use AI Feedback Matters: Experimental Evidence on Physics Achievement and Autonomy [2.9] 本研究は, GAIを用いた個人化されたフィードバックが高校生の物理学的達成と自律性に及ぼす影響について検討した。
実験にはランダム化された2つのテストが含まれ、使用パターンに重点が置かれた。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:05:54 GMT)
Shallow AutoEncoding Recommender with Cold Start Handling via Side Features [2.9] コールドスタート問題に対処するために,ユーザ側情報とアイテム側情報をシームレスに統合する拡張EASEモデルを導入する。
コールドスタート項目を効果的に推奨し, 余分なバイアスを伴わずにコールドスタートユーザを扱い, バランスをとる方法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:47:32 GMT)
TopoLM: brain-like spatio-functional organization in a topographic language model [2.8] 本研究では,2次元空間モデルユニットを明示したトランスフォーマー言語モデルであるTopoLMを開発する。
TopoLMは皮質言語系の機能的構造の出現をうまく予測する。
この結果から,人間の言語システムの機能的構造は,統合された空間的目的によって駆動されていることが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:50:00 GMT)
Comparing LLM Text Annotation Skills: A Study on Human Rights Violations in Social Media Data [2.8] 本研究では,ロシア語とウクライナ語におけるソーシャルメディア投稿のゼロショットおよび少数ショットアノテーションに対する大規模言語モデル(LLM)の機能について検討した。
これらのモデルの有効性を評価するため、それらのアノテーションは、人間の二重注釈付きラベルのゴールドスタンダードセットと比較される。
この研究は、各モデルが示すエラーと不一致のユニークなパターンを探求し、その強み、制限、言語間適応性に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:10:47 GMT)
LizAI XT -- Artificial Intelligence-Powered Platform for Healthcare Data Management: A Study on Clinical Data Mega-Structure, Semantic Search, and Insights of Sixteen Diseases [2.8] AIを利用したLizAI XTは、異なる臨床データセットのリアルタイムかつ正確なメガ構造を保証する。
NVIDIA A30 GPU 24GBの4倍のクラスタ上で、プラットフォームの性能を評価する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:26:50 GMT)
EndoMamba: An Efficient Foundation Model for Endoscopic Videos via Hierarchical Pre-training [2.7] 内視鏡的ビデオベースのタスクは、リアルタイムの補助を提供することによって、最小侵襲の手術において重要な役割を果たす。
最近のビデオ基盤モデルは将来性を示しているが、それらの応用は計算の不効率によって妨げられている。
本稿では,リアルタイム推論のための基礎モデルであるEndoMambaを紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:59:22 GMT)
A portable diagnosis model for Keratoconus using a smartphone [2.7] Keratoconus(KC)は角膜疾患であり、ぼやけた視力と歪んだ視力をもたらす。
従来の診断ツールは効果があるが、しばしばかさばる、コストがかかり、専門的な手術を必要とする。
提案手法はまず、スマートフォンのスクリーンで生成したプラチドディスクが目に光を放つと、目の角膜に映る画像を捉えます。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:30:10 GMT)
A Deep Learning-Driven Inhalation Injury Grading Assistant Using Bronchoscopy Images [2.7] 吸入障害は、従来のグレーディング法が主観的であるため、臨床診断とグレーディングにおいて課題となる。
そこで本研究では,気管支鏡による吸入外傷の診断支援ツールについて紹介した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:28:04 GMT)
Cosmos 1.0: a multidimensional map of the emerging technology frontier [2.7] Cosmos 1.0データセットは、階層的なモデルに構造化された23,544技術(ET23k)の包括的なコレクションである。
宇宙では、ET100と呼ばれる100の新興テクノロジーを手動で検証します。
このデータセットには、新興技術の展望を評価するために特別に開発された指標が盛り込まれている。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:37:32 GMT)
Data-Agnostic Augmentations for Unknown Variations: Out-of-Distribution Generalisation in MRI Segmentation [2.7] 医療画像セグメンテーションモデルは、しばしばキュレートされたデータセットでトレーニングされ、実際の臨床環境にデプロイするとパフォーマンスが低下する。
従来の視覚的に一貫した拡張戦略は、様々な現実世界のシナリオに必要な堅牢さを欠いている。
我々はMixUpとAuxiliary Fourier Augmentationに焦点をあてて、代替拡張戦略を体系的に評価した。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:32:02 GMT)
System Identification and Control Using Lyapunov-Based Deep Neural Networks without Persistent Excitation: A Concurrent Learning Approach [2.7] 本稿では,DNN ベースのコントローラを用いた同時軌跡追跡とオンラインシステム識別に関する最初の結果を示す。
Lyapunovに基づく安定性解析を行い、追跡誤差、重み推定誤差、観測誤差を原点近傍に収束させる。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:50:10 GMT)
Mitigating Configuration Differences Between Development and Production Environments: A Catalog of Strategies [2.7] 本研究では,ソフトウェア企業が開発環境と生産環境のコンフィグレーションの違いを軽減するために利用する戦略について検討する。
私たちのゴールは、構成に関連した問題のリスクを軽減するために使用されるこれらの戦略を包括的に理解することにあります。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:14:38 GMT)
ARFC-WAHNet: Adaptive Receptive Field Convolution and Wavelet-Attentive Hierarchical Network for Infrared Small Target Detection [2.6] ARFC-WAHNetは、赤外線小ターゲット検出のための適応型受容野畳み込みおよびウェーブレット減衰階層ネットワークである。
ARFC-WAHNetは、検出精度とロバスト性の両方において、最近の最先端手法よりも優れている。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:44:23 GMT)
A probabilistic framework for dynamic quantization [2.6] 我々のフレームワークは、軽量サロゲートを介してネットワークの事前活性化に確率モデルを適用します。
我々は,一般的なコンピュータビジョンタスクとモデルに対するアプローチを検証し,性能の無視できる損失のみを観察する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:26:46 GMT)
Towards Optimal Orders for Entanglement Swapping in Path Graphs: A Greedy Approach [2.6] 本稿では,量子リピータの不均一経路におけるエンタングルメントスワップの最適順序を求める問題について考察する。
まず,一定時間で動作可能な2つの絡み合い分布間のスワップ結果の簡易な近似法を提案する。
第2に、経路内のリピータの数とともに可能な順序の数が指数関数的に増加するにつれて、スワップを逐次実行するノードの欲求選択に基づいて効率が向上する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:06:58 GMT)
A Scalable Gradient-Based Optimization Framework for Sparse Minimum-Variance Portfolio Selection [2.6] ポートフォリオ最適化では、リスク・リワードの目標を最小化するために資産重みを選択する。
標準的アプローチは、この問題を混合整数二次プログラムとしてモデル化する。
本稿では,スパース選択問題を制約付き連続最適化タスクに変換する,高速でスケーラブルなアプローチを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:01:07 GMT)
Code-Driven Planning in Grid Worlds with Large Language Models [2.6] コードで表現された解釈可能なエージェントポリシーを合成することにより,グリッドベースのタスクを解決するための反復的プログラム計画フレームワークを提案する。
従来の検索や強化学習に頼るのではなく、コード生成をポリシー合成として使用しています。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:23:31 GMT)
FedGRec: Dynamic Spatio-Temporal Federated Graph Learning for Secure and Efficient Cross-Border Recommendations [2.6] FedGRecは、クロスボーダーレコメンデーションのためのプライバシ保護グラフ学習方法である。
分散マルチドメインデータからのユーザの好みをキャプチャして、プライバシリークなしで全ドメインにわたるレコメンデーションパフォーマンスを向上させる。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:08:22 GMT)
SEAL: Searching Expandable Architectures for Incremental Learning [2.6] インクリメンタルラーニング(Incremental Learning)は、モデルがタスクのシーケンシャルストリームから学習する機械学習パラダイムである。
インクリメンタルラーニングに対するNASベースのアプローチは、しばしばすべてのタスクでモデルを拡張することに依存し、リソース制約のある環境では実用的ではない。
データインクリメンタル学習に適したNASベースのフレームワークであるSEALを紹介する。
SEALはキャパシティ推定基準に基づいて、必要なときにのみモデルを拡張することで、モデル構造を動的に適応する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:14:18 GMT)
Generating time-consistent dynamics with discriminator-guided image diffusion models [2.6] 時間力学は多くのビデオ生成、処理、モデリングアプリケーションに不可欠である。
ビデオ拡散モデル(VDM)は、非常に現実的なダイナミックスを生成するための最先端の手法である。
本稿では,事前学習した画像拡散モデルにより現実的なダイナミクスを生成できる時間一貫性判別器を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:55:20 GMT)
ADALog: Adaptive Unsupervised Anomaly detection in Logs with Self-attention Masked Language Model [2.6] ADALogは適応的で教師なしの異常検出フレームワークである。
個々の非構造化ログで動作し、ログ内のコンテキスト関係を抽出し、通常のデータに対して適応しきい値を設定する。
BGL,Thunderbird,Spiritのベンチマークデータセット上でADALogを評価する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:31:40 GMT)
GBM Returns the Best Prediction Performance among Regression Approaches: A Case Study of Stack Overflow Code Quality [2.6] Stack Overflow(Java)コード品質を予測する変数と、最高の予測能力を提供する回帰アプローチを検討した。
長いStack Overflowコードは、コード違反が多い傾向があり、より高いスコアを得た質問は、より多くのビューを惹きつけ、Stack Overflowの質問に追加される回答が増えるほど、提供されるコードには通常より多くのエラーが観測される。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:04:17 GMT)
Tracr-Injection: Distilling Algorithms into Pre-trained Language Models [2.5] 本稿では, RASP で書かれたアルゴリズムを事前学習した言語モデルに直接蒸留する方法である tracr-injection を提案する。
提案手法はモデル残差ストリーム内の解釈可能な部分空間をどうやって生成するかを示し, RASP アルゴリズムに存在する変数に復号化することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:43:51 GMT)
SAKR: Enhancing Retrieval-Augmented Generation via Streaming Algorithm and K-Means Clustering [2.5] 本稿では,ストリーミングアルゴリズムとk-meansクラスタリングを組み合わせた新しいアプローチを提案する。
提案手法では,動的にインデックスを更新し,メモリ消費を削減するためにストリーミングアルゴリズムを適用した。
その結果,ストリーミングアルゴリズムとk平均クラスタを用いたRAGは,従来のRAGよりも精度とメモリが優れていた。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:22:21 GMT)
Uniform Loss vs. Specialized Optimization: A Comparative Analysis in Multi-Task Learning [2.4] マルチタスク学習におけるタスク学習のバランスをとる特殊マルチタスク(SMTO)。
近年の批判は、同様に重み付けされたタスクはSMTOと比較して競争的な結果が得られることを示唆している。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:34:36 GMT)
Understanding trade-offs in classifier bias with quality-diversity optimization: an application to talent management [2.3] 公正なAIモデルを開発する上での大きな課題は、そのようなモデルをトレーニングする上で利用可能なデータのバイアスにある。
本稿では,データセットに固有のバイアスを可視化し,公平性と正確性の間の潜在的なトレードオフを理解する方法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:29:42 GMT)
Hallucination, Monofacts, and Miscalibration: An Empirical Investigation [2.3] 大規模言語モデルにおける有能な事実は、モノファクトレートによって決定される統計的下界に従う。
古典的なn-gramモデルと微調整エンコーダ・デコーダ変換器におけるこの3方向関係に関する最初の実証的研究を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:25:08 GMT)
Efficient MCMC Sampling with Expensive-to-Compute and Irregular Likelihoods [2.3] 計算オーバーヘッドを低減するためにサブセット評価を利用するサンプリングアルゴリズムをいくつか検討する。
我々はTaylor拡張の代わりにデータ駆動プロキシを導入し、新しい低コスト対応コントローラを定義する。
適応型提案とデータ駆動型プロキシを併用した改良版"Importance with Nested Training Samples"(HINTS)は、固定された計算予算で最高のサンプリングエラーを得る。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:06:44 GMT)
MIPHEI-ViT: Multiplex Immunofluorescence Prediction from H&E Images using ViT Foundation Models [2.3] 我々は、最先端のViT基盤モデルをエンコーダとして統合し、H&E画像からmIF信号を予測するU-NetにインスパイアされたアーキテクチャであるMIPHEIを紹介する。
大腸癌組織から得られた残留H&EおよびmIF画像のORIONデータセットを用いて,本モデルをトレーニングした。
MIPHEIはH&Eだけで正確な細胞型分類を実現しており、Pan-CKは0.88点、CD3eは0.57点、SMAは0.56点、CD68は0.36点、CD20は0.30点である。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:42:48 GMT)
System Log Parsing with Large Language Models: A Review [2.3] 大規模言語モデル (LLM) はLLMに基づくログ解析の新しい研究分野を導入した。
有望な結果にもかかわらず、この比較的新しい研究分野におけるアプローチの構造化された概要は存在しない。
この研究は29 LLMベースのログ解析手法を体系的にレビューする。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:27:26 GMT)
The power of a single Haar random state: constructing and separating quantum pseudorandomness [2.3] Pseudorandom state (PRS) は、家族から一様にサンプリングされた状態の多くのコピーとハールランダム状態の区別が難しい状態の族である。
我々は、おそらく驚くべきことに、1PRSが1つのハールランダム状態を提供するオラクルに対して存在することを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:41:38 GMT)
Analysing Safety Risks in LLMs Fine-Tuned with Pseudo-Malicious Cyber Security Data [2.3] 本稿では,サイバーセキュリティアプリケーションのための細調整された大規模言語モデル(LLM)の安全性リスクの体系的評価を行う。
評価の結果, 微調整により全試験LCMの安全性が低下することがわかった。
本稿では,明示的な安全対策と倫理的配慮を取り入れた,命令応答対を慎重にリワードする安全アライメント手法を提案し,評価する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:22:53 GMT)
Do Current Language Models Support Code Intelligence for R Programming Language? [2.2] コード要約とメソッド名予測の2つのタスクに対して,複数の設定と戦略を用いてコード-PLMを評価する。
以上の結果から, 研究モデルでは, 性能劣化の程度が異なっていたことが示唆された。
Rの二重構文パラダイムは、特にコード要約タスクにおいて、モデルの性能に大きな影響を及ぼした。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:41:11 GMT)
PsOCR: Benchmarking Large Multimodal Models for Optical Character Recognition in Low-resource Pashto Language [2.2] 我々はPashto OCRデータセット(PsOCR)を開発し、単語、行、文書レベルで境界ボックスを付加した100万枚の画像からなる。
PsOCRは1000種類のフォントファミリ、色、画像サイズ、レイアウトをカバーしている。
7つのオープンソースモデルを含む複数のLMMの性能を評価するため、10K画像のベンチマークサブセットが選択された。
Geminiはすべてのモデルの中で最高のパフォーマンスを達成しているが、オープンソースモデルではQwen-7Bが際立っている。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:58:38 GMT)
Does Scaling Law Apply in Time Series Forecasting? [2.1] 我々は,kレベルパラメータのみを用いて競合性能を実現する超軽量予測モデルであるAlinearを提案する。
7つのベンチマークデータセットの実験では、Alinearが大規模モデルよりも一貫して優れていることが示されている。
この研究は、より大きなモデルが本質的に優れているという一般的な信念に挑戦し、より効率的な時系列モデリングへのパラダイムシフトを示唆している。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:04:39 GMT)
Anchoring AI Capabilities in Market Valuations: The Capability Realization Rate Model and Valuation Misalignment Risk [2.1] 人工知能の最近の進歩は、AI関連企業の市場評価の急上昇を引き起こしている。
本稿では,AIポテンシャルと実現された性能のギャップを定量化する能力実現率モデルを提案する。
透明性を改善し、投機的バブルを緩和し、AIイノベーションを持続可能な市場価値と整合させる政策推奨で締めくくります。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:06:06 GMT)
Path Gradients after Flow Matching [2.1] フローマッチングが継続的正規化フロー(CNF)の高速化に役立った
フローマッチングによって訓練されたCNFの微調整に経路勾配を用いることの利点について検討する。
実験により, このハイブリッドアプローチは, 分子系のサンプリング効率を最大3倍に向上させることが示された。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:13:45 GMT)
A User Study Evaluating Argumentative Explanations in Diagnostic Decision Support [2.0] この研究は、診断プロセスを強化する最も効果的で有用な説明を見つけることを目的としている。
医師は様々な種類の説明を評価するために調査を行った。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:42:24 GMT)
Towards Understanding Gradient Flow Dynamics of Homogeneous Neural Networks Beyond the Origin [2.0] 近年の研究では、トレーニングの初期段階では、重量は小さく、起源に近いが、方向は収束していることが確認されている。
本稿では,リプシッツ勾配を持つ同質ニューラルネットワークの起点から逃れた後の勾配流れのダイナミクスについて検討する。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:13:44 GMT)
Achievable rates for concatenated square Gottesman-Kitaev-Preskill codes [1.9] Gottesman-Kitaev-Preskill (GKP)符号は、変位ノイズと純損失チャネルの下で最適な速度を達成することが知られている。
これらの結果は,結合型GKP符号の能力を強調し,優れたGKP格子を構築するための新しい手法を提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:01:51 GMT)
Decomposed Inductive Procedure Learning: Learning Academic Tasks with Human-Like Data Efficiency [1.9] 学習を複数の異なるメカニズムに分解することで、データの効率が大幅に向上することがわかった。
このギャップを埋めるためには,複数の専門的な学習機構を統合することが重要である。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:39:09 GMT)
DIF: A Framework for Benchmarking and Verifying Implicit Bias in LLMs [1.9] 我々は、Large Language Models(LLMs)における暗黙のバイアスは倫理的な問題であるだけでなく、技術的な問題でもあると主張している。
我々は、容易に解釈可能なベンチマークDIF(Demographic Implicit Fairness)の計算方法を開発した。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:53:37 GMT)
Cavity-Mediated Electron-Electron Interactions: Renormalizing Dirac States in Graphene [1.9] 我々は光子のない自己整合Hartree-Fockフレームワークに基づく非摂動量子電磁力学手法を開発した。
ポーラライゼーションの異なるキャビティフォトンモードの真空場ゆらぎに結合したグラフェンについて検討した。
量子線型偏光子モードによって誘導される非局所相互作用は、平坦なバンドの形成と、位相的に自明なディラックギャップの開きを引き起こす。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:50:54 GMT)
Universal fault tolerant quantum computation in 2D without getting tied in knots [1.8] 耐故障性のない非クリフォードゲートを2次元で行う方法を示す。
我々は、異なる論理ゲートに対してマクロ画像を提供するパスの枠組みを定式化し、関連する顕微鏡回路を導出する方法を定式化する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:06:46 GMT)
Quantum Lifshitz points in an altermagnetic metal [1.8] 我々は、$d$-waveの反磁性金属における2つの三臨界量子Lifshitz点の存在を予測した。
我々は、対応するリフシッツ点を、それぞれ場駆動または反磁性駆動と分類する。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:56:47 GMT)
User Modeling in Model-Driven Engineering: A Systematic Literature Review [1.7] 我々は,モデル駆動工学(MDE)アプローチにおけるユーザモデリングの既存提案を分析するために,体系的な文献レビューを実施している。
結果は、統一的で完全なユーザーモデリングの視点が欠如していることを示しています。
これにより、よりリッチなユーザインターフェースの実装が、ユーザ固有のニーズをよりサポートできるようになります。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:12:21 GMT)
Quantum thermodynamic uncertainty relations without quantum corrections: A coherent-incoherent correspondence approach [1.7] 我々は、量子熱力学の不確実性関係を導出するための枠組みとして、コヒーレント-非コヒーレント対応を導入する。
この対応は、コヒーレント進化を伴う元の量子系と、コヒーレントダイナミクスを持たない対応する非コヒーレント系のマッピングを確立する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:21:54 GMT)
Modeling Human Behavior in a Strategic Network Game with Complex Group Dynamics [1.6] ジュニアハイゲーム(JHG)と呼ばれる戦略ネットワークゲームにおいて、小さなデータセットから人間の行動モデルを学ぶためのいくつかの手法を比較し、対比する。
その結果,hCABと呼ばれるハイパフォーマンスな手法は,平均よりも人間の行動分布をモデル化し,人間は行動マッチングよりもコミュニティに意識した行動を使用すると仮定した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:57:28 GMT)
Variational LOCC-assisted quantum circuits for long-range entangled states [1.6] 長距離の絡み合いは重要な量子資源であり、特にトポロジカルな順序と量子エラー補正のために重要である。
有望な経路は、いくつかの量子資源を局所演算と古典通信(LOCC)に置き換えることによって提供される。
本稿では、与えられたハミルトンの基底状態を作成するための最適LOCCプロトコルを見つけるための量子古典ハイブリッドアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:30:01 GMT)
Consistent Quantity-Quality Control across Scenes for Deployment-Aware Gaussian Splatting [1.6] 3Dガウススプラッティング(3DGS)は、高いレンダリング品質を維持しながら使用するガウスの数を最小化する。
既存の手法は質の高い性能を追求するが、利用者はこのトレードオフを現実的なニーズに合うように直感的に調整する能力は欠如している。
そこで本研究では,意味論的かつ場面間一貫した量品質制御を実現する3DGS最適化手法であるControlGSを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:23:51 GMT)
Multi-domain Multilingual Sentiment Analysis in Industry: Predicting Aspect-based Opinion Quadruples [1.5] 本稿では,大規模言語モデル(LLM)を用いたアスペクトベース感情分析システムの設計について検討する。
我々は、異なるドメインや言語にわたるテキストデータからアスペクトカテゴリ、感情極性、ターゲット、意見表現を識別する4つの意見抽出に焦点を当てる。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:11:48 GMT)
Avocado Price Prediction Using a Hybrid Deep Learning Model: TCN-MLP-Attention Architecture [1.5] 逐次的特徴抽出にTCN(Temporal Convolutional Networks)、非線形相互作用にMLP(Multi-Layer Perceptrons)を組み合わせたハイブリッドディープラーニングモデルTCN-MLP-Attention Architectureを提案する。
提案モデルでは,RMSE 1.23 と MSE 1.51 で予測性能が向上し,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:26:22 GMT)
Fully Dynamic Graph Algorithms with Edge Differential Privacy [1.5] 完全動的更新を伴う連続リリースの難易度設定において,グラフを解析するための差分プライベートアルゴリズムについて検討した。
これまでの研究では、挿入のみや削除のみを処理できる多くのグラフ問題に対して、差分プライベートなアルゴリズムが提案されてきた。
いくつかの基本グラフ問題に対して、事象レベルとアイテムレベルの完全動的アルゴリズムの誤差について、上下境界を与える。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:31:44 GMT)
Neurodivergent Influenceability as a Contingent Solution to the AI Alignment Problem [1.4] AIアライメント問題は、人工知能(AI)システムが人間の価値観に従って行動することを保証することに重点を置いている。
狭義のAIからAI(Artificial General Intelligence, AGI)やスーパーインテリジェンス(Superintelligence, 超知能)への進化に伴い、制御に対する恐怖と現実的なリスクがエスカレートした。
ここでは、避けられないAIのミスアライメントを受け入れることが、競合するエージェントの動的なエコシステムを育むための緊急戦略であるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:23:57 GMT)
Embodied AI in Machine Learning -- is it Really Embodied? [1.4] Embodied AI(Embodied AI)は、機械学習コミュニティで勢いを増している。
我々は,この研究を,Good Old-Fashioned Artificial Intelligence(GOFAI)と,行動に基づく,あるいは具体化された代替案の文脈に位置づけた。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:52:49 GMT)
Graph Neural Network-based Spectral Filtering Mechanism for Imbalance Classification in Network Digital Twin [1.4] 5Gネットワークのディジタルツインは、障害タイプを特定する主要な方法としてグラフ分類を採用することが多い。
故障発生のスキュード分布は、実用的なグラフデータマイニングを防止する重要なクラス不均衡問題である。
本稿では、クラス指向スペクトルフィルタリング機構を導入し、正確な分類を保証するクラスフーリエGNN(CF-GNN)を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:27:59 GMT)
Quantized Approximate Signal Processing (QASP): Towards Homomorphic Encryption for audio [1.4] ホモモルフィック暗号化(FHE)は、暗号化されたデータの計算を可能にし、ユーザのプライバシを保存することで、有望なソリューションを提供する。
ここでは、FHEと量子化されたニューラルネットワーク操作を用いて、完全にセキュアなパイプラインを計算します。
提案手法は,音声記述子と畳み込みニューラルネットワーク(CNN)分類器のプライベートな計算もサポートする。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:01:52 GMT)
Position: Contextual Integrity is Inadequately Applied to Language Models [1.3] コンテキスト整合性(CI)は、大規模言語モデル(LLM)のプライバシーへの影響を評価するためのフレームワークである。
既存の文献では、理論の基本的信条を受け入れることなく、LSMに対してCIを不適切に適用している。
CIの不十分な適用は、誤った結論と、プライバシ保護設計の欠陥につながる可能性がある。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:02:50 GMT)
Role of scrambling and noise in temporal information processing with quantum systems [1.3] 我々は、量子システムを用いて、幅広い物理計算モデルをキャプチャする一般的な量子貯水池処理フレームワークについて考察する。
その結果, 貯水池の規模が大きくなるにつれて, 測定精度は指数関数的に高くなるが, 貯水池の繰り返しは著しく悪化しないことがわかった。
雑音系では、局所雑音チャネルの繰り返しを伴う指数的メモリ減衰も証明する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:35:10 GMT)
The Lazy Student's Dream: ChatGPT Passing an Engineering Course on Its Own [1.3] 本稿では,Large Language Models (LLMs) の制御系コースを成功させる能力について包括的に検討する。
現実的な学生の利用パターンをシミュレートする「最小限の努力」プロトコルの下で,ChatGPTを用いてLCMの性能を評価する。
我々の分析は、制御システム工学における数学的定式化、コーディングの課題、理論的概念を扱う際のAIの強みと限界に関する定量的洞察を提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:23:05 GMT)
Determining Absence of Unreasonable Risk: Approval Guidelines for an Automated Driving System Release [1.2] 本稿では,不合理なリスクの判定方法の概要について述べる。
準備の整合性の決定は、その中核にある、リスク評価プロセスです。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:52:09 GMT)
SRMamba: Mamba for Super-Resolution of LiDAR Point Clouds [1.2] スパースシーンにおけるLiDAR点雲の高分解能化手法であるスペーシャアンバを提案する。
具体的には, Hough Voting と Hole Compensation に基づく射影手法を実装し, 距離画像の水平線穴を除去する。
非対称なU-Netネットワークは、ビーム数が異なるLiDARの入力特性に適応し、マルチビーム点雲の超解像再構成を可能にする。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:41:35 GMT)
A First Runtime Analysis of NSGA-III on a Many-Objective Multimodal Problem: Provable Exponential Speedup via Stochastic Population Update [1.2] NSGAIIIは進化的多目的最適化において顕著なアルゴリズムである。
本稿では,多目的textscOjZjベンチマークを用いてNSGAIIIの厳密なランタイム解析を行う。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:20:06 GMT)
New generation of cavity microscope for quantum simulations [1.2] 超低温原子を用いた量子シミュレーションのための空洞顕微鏡の設計と組み立てについて述べる。
このシステムは、高精細な光学キャビティと、共通の光学軸を共有する一対の高精細な開口レンズを統合する。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:23:06 GMT)
DAPPER: A Performance-Attack-Resilient Tracker for RowHammer Defense [1.2] RowHammerの脆弱性は、現代のDRAMベースのシステムに重大な脅威をもたらす。
Perf-Attacksは共有構造を利用して、良質なアプリケーションのDRAM帯域幅を削減する。
我々は,共有構造のマッピングを捉えるために,敵対的試みを阻止するための安全なハッシュ機構を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:40:53 GMT)
Multi-Robot Task Allocation for Homogeneous Tasks with Collision Avoidance via Spatial Clustering [1.2] MRTA(Multi-Robot Task Allocation)と衝突回避に基づく統合ソリューションを実現する新しいフレームワークを提案する。
提案フレームワークは, 最高性能法と比較して最大93%の時間短縮(1.24秒対17.62秒)を行い, ソリューション品質を7%改善した。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:20:57 GMT)
Multi-contrast laser endoscopy for in vivo gastrointestinal imaging [1.2] マルチコントラストレーザー内視鏡(MLE)は、高速スペクトル、コヒーレント、指向性照明を備えた広視野臨床画像撮影のためのプラットフォームである。
我々は,MLEの3つの機能として,マルチスペクトル回折反射による組織色調コントラストの増強,レーザースペックルコントラストイメージングによる血流の定量化,および光度ステレオを用いた粘膜トポグラフィーのキャラクタリゼーションを行った。
31ポリプのMLE画像は、白色光や狭帯域画像と比較して、コントラストがほぼ3倍改善し、色差が5倍改善した。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:47:24 GMT)
CloudHeatMap: Heatmap-Based Monitoring for Large-Scale Cloud Systems [1.1] CloudHeatMapは、LCSの状態をほぼリアルタイムで監視するための、新しいヒートマップベースの可視化ツールである。
コールボリュームやレスポンスタイムなどの重要なメトリクスを直感的に視覚化し、オペレータがパフォーマンス上の問題を素早く特定できるようにする。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:30:39 GMT)
Biased Degenerate Ground-State Sampling of Small Ising Models with Converged QAOA [1.1] 逆フィールドミキサーQAOAとグローバーミキサーQAOAのフェアサンプリング特性を数値的に検討する。
いくつかの問題では、シャノンエントロピーが最大バイアス分布で0$と明確に飽和していることが示される。
他の問題の場合、任意の$p$ステップで最大シャノンエントロピー(ユニフォーム)から逸脱することはない。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:06:56 GMT)
SeagrassFinder: Deep Learning for Eelgrass Detection and Coverage Estimation in the Wild [1.1] 海草の草原は海洋生態系において重要な役割を担い、炭素の隔離、水質改善、生息地確保などの利益を提供している。
海底映像データを解析して海草被覆度を評価する現在の手作業は、時間と主観的である。
本研究では,海底ビデオデータから海草の検出とカバレッジ推定のプロセスを自動化するためのディープラーニングモデルについて検討する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:11:23 GMT)
Multi-Agent Path Finding For Large Agents Is Intractable [1.1] マルチエージェントパス探索(MAPF)問題は、これらのパスを同期的に追従する場合、エージェントが衝突に遭遇しないようなグラフ上の一連のパスを見つけるように要求する。
この論文では、まず最初に、後者の問題がNPハードであることを確認し、P!=NPがなければ、残念ながらそのアルゴリズムは提示できない。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:07:40 GMT)
QuXAI: Explainers for Hybrid Quantum Machine Learning Models [1.0] この研究は、ハイブリッド量子古典機械学習システムにおける機能の重要性を説明するための説明器QuXAIを紹介する。
我々のモデルは、量子特徴写像を取り入れたHQMLモデルの作成、Q-MEDLEYの使用、特徴ベースの推論の組み合わせ、量子変換ステージの保存、および結果の属性の可視化を含む。
以上の結果から,Q-MEDLEYはHQMLモデルにおいて重要な古典的側面を表現し,ノイズを分離し,古典的検証設定において確立されたXAI技術とよく競合することを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:51:34 GMT)
Exploring Convolutional Neural Networks for Rice Grain Classification: An Explainable AI Approach [1.0] 本研究では,異なる品種の米粒を分類するための畳み込みニューラルネットワーク(CNN)に基づく自動フレームワークを提案する。
提案手法は,精度,リコール,精度,F1スコアなどの性能指標に基づいて評価する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:56:31 GMT)
A systematic review of challenges and proposed solutions in modeling multimodal data [1.0] 臨床研究における強力なアプローチとしてマルチモーダルデータモデリングが登場している。
この系統的なレビューは、69の研究から得られた知見を合成し、共通の障害を同定する。
本稿では,伝達学習,生成モデル,注意機構,有望なソリューションを提供するニューラルアーキテクチャ探索など,近年の方法論的進歩に注目した。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:38:48 GMT)
Distributed Realization of Color Codes for Quantum Error Correction [1.0] 我々は、(6.6.6)カラーコードを実現するための分散アーキテクチャを提案し、分析する。
このアーキテクチャは、異なる量子処理ユニット(QPU)に格納されたカラーコードのパッチを、絡み合ったペアを介して相互接続する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:33:00 GMT)
Exponential concentration and symmetries in Quantum Reservoir Computing [0.9] 量子貯水池コンピューティング(QRC)は、短期的な量子機械学習のための新しいフレームワークである。
我々は、静的量子機械学習タスクを超えて、時系列処理のためのQRCの集中に対処する。
ハミルトン対称性の活用は集中を著しく抑制し、堅牢でスケーラブルなQRC実装を実現することを実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:05:06 GMT)
LAV: Audio-Driven Dynamic Visual Generation with Neural Compression and StyleGAN2 [0.9] LAV(Latent Audio-Visual)は、EnCodecのニューラルオーディオ圧縮とStyleGAN2の生成機能を統合するシステムである。
このフレームワークは、芸術的・計算的な用途に事前訓練されたオーディオ圧縮モデルを使用することの可能性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:04:12 GMT)
Flowing Through Hilbert Space: Quantum-Enhanced Generative Models for Lattice Field Theory [0.9] このような状態下での量子強調サンプリングを探索するために,ハイブリッド量子古典正規化フローモデルを開発した。
提案手法では,パラメータ化量子回路を古典正規化フローアーキテクチャに組み込み,振幅エンコーディングと量子絡み合いを利用して生成過程における表現性を高める。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:58:16 GMT)
ToonifyGB: StyleGAN-based Gaussian Blendshapes for 3D Stylized Head Avatars [0.9] StyleGANベースのフレームワークであるToonifyは、顔画像のスタイリングに広く使われている。
そこで我々は,Toonifyを多種多様な3Dヘッドアバターに拡張するための効率的な2段階フレームワークToonifyGBを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:16:12 GMT)
On the quantum computational complexity of classical linear dynamics with geometrically local interactions: Dequantization and universality [0.9] 量子アルゴリズムは、古典力学と長距離相互作用をシミュレートする際、古典的アルゴリズムよりも指数的なスピードアップを提供する。
偏微分方程式から生じるような多くの実世界の古典系は局所的な相互作用しか示さない。
この研究は、偏微分方程式によって支配される古典力学の複雑さに関する新たな洞察を与える。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:06:22 GMT)
Short-time simulation of quantum dynamics by Pauli measurements [0.9] 本稿では,古典的後処理における物理合成量子状態の短時間量子力学をシミュレーションするために,測定のパワーを活用することを提案する。
シミュレーション時間は短いが、我々のハイブリッド量子古典法は厳密な誤差境界を備えている。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:29:42 GMT)
MOSAIC: A Multi-View 2.5D Organ Slice Selector with Cross-Attentional Reasoning for Anatomically-Aware CT Localization in Medical Organ Segmentation [0.9] 既存の3Dセグメンテーションアプローチは計算的かつメモリ集約的であり、多くの場合、多くの解剖学的に無関係なスライスを含む全ボリュームを処理する。
セグメント化に先立って入力量を削減できる新しい解剖学的スライスセレクタパイプラインを提案する。
提案モデルでは, 構造的関連性の高いスライスを選択的に保持する多視点表現を前提として, 解剖学的局所化の「専門家」として機能する。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:32:28 GMT)
Multi-Source Collaborative Style Augmentation and Domain-Invariant Learning for Federated Domain Generalization [0.8] フェデレートされたドメインの一般化は、目に見えないターゲットドメインにデプロイするために、複数の分散されたソースドメインから一般化可能なモデルを学ぶことを目的としている。
より広いスタイル空間でデータを生成するマルチソース協調型拡張モジュールを提案する。
代わりに、協調的なスタイル拡張とドメイン不変学習を行うことで、モデルは目に見えないターゲットドメインをうまく一般化することができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:26:17 GMT)
Review of Extreme Multilabel Classification [0.8] 極端なマルチラベル分類(英: Extreme multi-label classification、XMLC)は、機械学習への関心の活発な領域である。
コミュニティは、頭や尾のラベルの予測を正しく識別するために有用なメトリクスセットを考案した。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:36:33 GMT)
TransPL: VQ-Code Transition Matrices for Pseudo-Labeling of Time Series Unsupervised Domain Adaptation [0.8] 時系列データに対する教師なし領域適応(UDA)は、ディープラーニングにおいて重要な課題である。
本稿では,これらの制約に対処する新しいアプローチであるTransPLを紹介し,ソースドメインの$P(mathbfX, y)$をモデル化する。
提案手法は、ソースドメインからクラスおよびチャネルのコード遷移行列を構築し、チャネルの重み付けされたクラス条件の確率に基づいて擬似ラベルを生成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:27:48 GMT)
Quantum Entanglement Dynamics of Spacetime and Matter [0.8] 情報完全量子場理論(ICQFT)を提案する。
物質と時空(重力)を時空と物質との絡み合いによる情報として統一する。
ダークエネルギーの量子情報の定義に基づいて、我々の宇宙は厳密にホログラフィックではない。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:49:14 GMT)
From noisy observables to accurate ground state energies: a quantum classical signal subspace approach with denoising [0.7] 基底状態エネルギー推定のためのハイブリッド量子古典アルゴリズムを提案する。
本稿では,FDODMDが量子計算予算の制限の下で,ベースライン法に到達不能な高雑音状態の収束を実現することを示す。
この性能向上は完全に古典的であり、追加の量子オーバーヘッドを必要とせず、全体の量子リソース要求を著しく削減する。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:37:44 GMT)
Campus AI vs Commercial AI: A Late-Breaking Study on How LLM As-A-Service Customizations Shape Trust and Usage Patterns [0.7] 大規模言語モデル(LLM)は、特定の(ビジネス)ニーズに合わせてカスタマイズ可能な、事前訓練されたモデルを提供する。
本研究は, 学生や従業員が, 施設のカスタマイズ LLM をどう認識し, 活用するかを, 大規模フィールドスタディにおける機能的前兆として捉えたものである。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:45:33 GMT)
GAIA: A Foundation Model for Operational Atmospheric Dynamics [0.7] GAIAは、マスク付きオートエンコーダ(MAE)と自己蒸留とNOラベル(DINO)を組み合わせて、衛星画像の地球大気パターンを分析する新しいモデルである。
これらの補完的な自己教師付き学習アプローチを統合することで、我々のモデルは、局所的な特徴とグローバルな依存関係の両方を同時にキャプチャする。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:07:09 GMT)
How many measurements are enough? Bayesian recovery in inverse problems with general distributions [0.7] 一般先行演算子,フォワード演算子,雑音分布の逆問題に対するベイズ復元のサンプル複雑性について検討した。
そこではDeep Neural Network (DNN) による潜伏分布のプッシュフォワードとして $mathcalP$ が用いられる。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:11:54 GMT)
Topology-driven identification of repetitions in multi-variate time series [0.7] 多変量時系列における再発時間を推定するための永続的ホモロジーフレームワークを提案する。
フレームワーク内に3つの専門的な方法を提供し、実際のデータを用いて確実に安定し、検証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:35:32 GMT)
IMITATE: Image Registration with Context for unknown time frame recovery [0.7] 我々は、新しい条件付きU-Netアーキテクチャを用いて、このフォーマリズムをモデル化する方法を示す。
4D-CTスキャンを用いて, 異なる呼吸振幅で放射線治療を行うため, 画像移動腫瘍に適用した。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:51:05 GMT)
Financial Fraud Detection Using Explainable AI and Stacking Ensemble Methods [0.7] 本稿では,XGBoost,LightGBM,CatBoostという,勾配促進モデルの積み重ねアンサンブルを組み合わせた不正検出フレームワークを提案する。
XAI技術は、モデルの決定の透明性と解釈可能性を高めるために使用される。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:53:02 GMT)
Inferring entropy production in many-body systems using nonequilibrium MaxEnt [0.7] 本稿では,多体システムやメモリの長い非マルコフシステムを含む高次元生産システムにおいて,エントロピー(EP)を推定する方法を提案する。
エントロピー原理の双対類似性を利用して, 軌道レベルEPと最大値以下を平均EPで推定する。
本研究では,1000スピンの非平衡スピンモデルと大規模なニューラルスパイク訓練データセットを用いて,その数値性能を実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:05:50 GMT)
Score-based diffusion nowcasting of GOES imagery [0.7] そこで我々は, スコアベース拡散と呼ばれる新しい手法を探索し, 雲と降水量(0時間から3時間)を予測した。
以上の結果から,拡散モデルは既存の雲だけでなく,対流開始を含む雲を発生・崩壊させることが可能であることが示唆された。
実験された3つの拡散モデルのうち最高のものは、他のすべての拡散モデル、従来のU-Net、ルート平均二乗誤差で1から2ケルビンの持続性予測を上回り、CorrDiffアプローチであった。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:51:41 GMT)
Bayesian Optimization of Catalysis With In-Context Learning [0.7] 大規模言語モデル(LLM)は、文脈内学習によってゼロまたは少数例で正確な分類を行うことができる。
凍結LDMを用いた不確実性推定により、この能力を回帰に拡張する。
本研究では, 実験触媒と試験手順を自然言語のプロンプトとして表現し, 材料発見に適用する。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:12:04 GMT)
"vcd2df" -- Leveraging Data Science Insights for Hardware Security Research [0.7] 本稿では、レジスタ転送レベル(RTL)トレースデータから高レベル言語でインサイトを導出する方法を示す。
Spark DataFrameの並列性を活用したハードウェアセキュリティ研究における将来的な方向性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:50:14 GMT)
High-fidelity dispersive spin sensing in a tuneable unit cell of silicon MOS quantum dots [0.6] 金属酸化物半導体(MOS)技術はスピン量子ビットに基づく量子コンピュータを開発する上で有望なプラットフォームである。
本稿では, 工業用300mmウエハプロセスを用いて作製した平面型MOS量子ドット(QD)の双線形単位セル内に, 小型分散型スピンキュービットセンサ, 単一電子ボックス(SEB)を実演する。
SEBの独立ゲート制御と二重量子ドットトンネル速度により、センサを最適化し、340usで99.92%(20usで99%)の読み出し精度を達成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:53:09 GMT)
Leveraging Graph Retrieval-Augmented Generation to Support Learners' Understanding of Knowledge Concepts in MOOCs [0.6] 大規模オープンオンラインコース(MOOC)は、学習者とインストラクターの直接的な相互作用を欠いている。
Retrieval-Augmented Generation (RAG) は、応答を生成する前に関連文書を取得することでこの問題に対処する。
これらの課題に対処するために,教育知識グラフ(EduKG)と個人知識グラフ(PKG)を活用したグラフRAGパイプラインを提案する。
評価の結果,グラフRAGが学習者にパーソナライズされた学習体験における新しい知識概念を理解する力を与える可能性が示された。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:24:47 GMT)
A Trust-Guided Approach to MR Image Reconstruction with Side Information [0.6] Trust- Guided Variational Network (TGVN)は、MRI最適化問題にサイド情報を効果的に統合するエンドツーエンドのディープラーニングフレームワークである。
TGVNは、困難な加速レベルでも微妙な病理特性を維持しながら、優れた画像品質を実現する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:15:14 GMT)
A Universal Quantum Computer From Relativistic Motion [0.6] 本稿では,変動量子回路を用いた相対論的量子コンピューティングアーキテクチャの明示的な構築について述べる。
変分量子回路は、チューナブルな単一量子ビット回転と、連続的に実装されるエンタングルゲートからなる。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:32:37 GMT)
Top-Down vs. Bottom-Up Approaches for Automatic Educational Knowledge Graph Construction in CourseMapper [0.6] 本研究では,自動EduKG構築におけるトップダウンとボトムアップのアプローチを比較した。
以上の結果から,ボトムアップアプローチは,重要な知識概念を正確に識別し,マッピングする上で,トップダウンアプローチよりも優れていることが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:11:48 GMT)
Towards user-centered interactive medical image segmentation in VR with an assistive AI agent [0.6] 本稿では,バーチャルリアリティにおける3次元医療概念のローカライズ,セグメンテーション,可視化を支援する,対話型AIエージェントSAMIRAを提案する。
このシステムは、患者固有の解剖学的理解を高めるために、セグメント化された病理の真の3次元可視化もサポートする。
ユーザスタディでは、高いユーザビリティスコア(SUS=90.0$pm$9.0)、全体のタスク負荷の低さ、提案されているVRシステムのガイダンス、トレーニング可能性、放射線セグメンテーションタスクにおけるAIの統合の強力なサポートが示されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:47:33 GMT)
Breaking the Code: Multi-level Learning in the Eurovision Song Contest [0.5] ユーロビジョン・ソング・コンテスト(ユーロビジョン・ソング・コンテスト)のルール変更の証拠は、逃走者などの望ましくない結果に反応する。
また,コンテストの70年にわたる競技歌の特徴について,参加者の学習の強い証拠を見出した。
注目すべきことに、4つの参加国が英語の歌詞が勝利の確率を高めるという「無関係」を無視することを選択した証拠が見つかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:47:57 GMT)
Multi-Objective Optimization-Based Anonymization of Structured Data for Machine Learning Application [0.5] データ共有におけるプライバシー問題に対処する様々な手法が提案されている。
これらの方法は、しばしばデータユーティリティを劣化させ、機械学習(ML)モデルの性能に影響を与える。
本稿では,情報損失を同時に最小化し,攻撃に対する防御を最大化する新しい多目的最適化モデルを提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:07:20 GMT)
Unified theory for joint covariance properties under geometric image transformations for spatio-temporal receptive fields according to the generalized Gaussian derivative model for visual receptive fields [0.5] 本研究では,時間的イメージ関係下での受容場からの出力と一致させるために,受容場のパラメータをどのように変換する必要があるかを示す。
導出結合共分散特性が受容場応答を関連づけたり一致させたりすることができるかを示す幾何学的解析で結論付ける。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:54:39 GMT)
Benchmarking Generative AI for Scoring Medical Student Interviews in Objective Structured Clinical Examinations (OSCEs) [0.5] 本研究では、MIRS(Master Interview Rating Scale)を用いたOSCE評価自動化のための大規模言語モデル(LLM)の可能性について検討した。
ゼロショット,チェーン・オブ・シント(CoT),少数ショット,マルチステッププロンプトの条件下で,MIRSの28項目すべてにまたがるOSCE書き起こしの評価において,最先端の4つのLCMの性能を比較した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:09:21 GMT)
Defect Detection in Photolithographic Patterns Using Deep Learning Models Trained on Synthetic Data [0.5] 欠陥アノテートされた品質データの欠如は、深層学習に基づく欠陥検出モデルを製造ラインに配置することを禁止している。
我々は、欠陥の既知の分布を持つラインパターンの走査電子顕微鏡(SEM)画像を生成し、それらを自律的に注釈する。
リアルタイムオブジェクト検出器YOLOv8は,EfficientNetの83%,SSDの77%に比べて平均96%の精度で,より小さな欠陥を検出できる。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:50:02 GMT)
A magnetically levitated conducting rotor with ultra-low rotational damping circumventing eddy loss [0.5] 磁気浮上は、真空環境下でマクロな物体を分離するパッシブな方法を提供する。
本研究では、高真空中における軸対称磁場中における誘電体ローターの誘電率を実証する。
これは、非常に低い回転ダンピングを持つマクロな浮遊ローターを示し、ローターダンピングを完全に抑制する方法を舗装する。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:50:50 GMT)
Reciprocal Floquet Thermalization in one dimensional Rydberg atom array [0.4] 一次元Rydberg原子配列における熱化ダイナミクスを操り研究する。
レーザーデチューニングとRydberg原子間相互作用とFloquet周期が相互対である場合にトリガーされる新しい逆フロック熱化機構を同定する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:54:06 GMT)
Healthy LLMs? Benchmarking LLM Knowledge of UK Government Public Health Information [0.4] 本稿では,Large Language Models (LLMs) の評価に8000以上の疑問を呈する新しいベンチマークであるPubHealthBenchを紹介する。
我々は、現在の英国政府のガイダンス文書687から自由テキストを抽出し、MCQA(Multiple Choice Question Answering)サンプルを生成するためのパイプラインを自動実装する。
PubHealthBench 上で 24 個の LLM を評価した結果,最新の LLM には高い知識があり,MCQA セットアップの精度は 90% 以上であり,カーソリー検索エンジンによる人間よりも優れていた。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:14:47 GMT)
Advancing Mobile UI Testing by Learning Screen Usage Semantics [0.4] 本研究は,モバイルアプリの画面利用セマンティクスを学習することで,自動UIテスト技術の向上を目指す。
また、UI設計の問題を特定し緩和することで、モバイルアプリのインターフェイスのユーザビリティも向上する。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:40:43 GMT)
Unified Modeling Language Code Generation from Diagram Images Using Multimodal Large Language Models [0.4] 本稿では,大規模マルチモーダル言語モデルを用いたコードの自動生成手法を提案する。
ドメイン適応型MM-LLMはコード生成自動化のために動作し、最高のモデルではシーケンスダイアグラム上でBLEUとSSIMスコア0.779と0.942を達成した。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:29:38 GMT)
Large Language Models for Cancer Communication: Evaluating Linguistic Quality, Safety, and Accessibility in Generative AI [0.4] 乳がんと頸部がんの効果的なコミュニケーションは、いまだに健康上の課題である。
本研究では, LLM(Large Language Models)の精度, 安全性, アクセシブルながん関連情報の生成能力と限界について検討した。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:23:21 GMT)
Self Clocked Digital LDO for Cryogenic Power Management in 22nm FDSOI with 98 Percent Efficiency [0.4] 半導体スピン量子ビットと一体化した極低温エレクトロニクスはスケーラビリティの1つの方法である。
提案したディジタルLDOは、ミスマッチに対してより耐性が高く、自己クロックとクローズドループを持ち、電力効率と高速な過渡応答に対処する。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:45:55 GMT)
SOS: A Shuffle Order Strategy for Data Augmentation in Industrial Human Activity Recognition [0.4] 本研究では,深層学習アプローチによる生成データセット(注意自動符号化と条件付き生成支援ネットワーク)を提案する。
実験の結果、ランダムシーケンス戦略は分類性能を著しく改善し、精度は0.70$pm$0.03、マクロF1スコアは0.64$pm$0.01に達することが示された。
このアプローチは、効果的なトレーニングデータセットを広げるだけでなく、複雑な実世界のシナリオでHARシステムを拡張するための有望な方法も提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:56:14 GMT)
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenge [0.4] この研究はAIエージェントとエージェントAIを区別し、構造化された概念分類、アプリケーションマッピング、課題分析を提供する。
ジェネレーティブAIは前駆体として位置づけられており、AIエージェントはツールの統合、エンジニアリングの促進、推論の強化を通じて前進している。
エージェントAIシステムは、マルチエージェントコラボレーション、動的タスク分解、永続メモリ、オーケストレーション自律性によって特徴付けられるパラダイムシフトを表している。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:21:33 GMT)
Towards an LLM-powered Social Digital Twinning Platform [0.3] ソーシャル・デジタル・ツインナー(Social Digital Twinner)は、複雑な適応型社会システムにおける「何」シナリオのもっともらしい効果を探索するソーシャル・シミュレーション・ツールである。
このアーキテクチャは3つのシームレスに統合された部分で構成されている。
ノルウェーのクラゲロにおける青少年学校退学の重大な問題に対処することで,ツールの対話性を実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:58:50 GMT)
Fiber-coupled broadband quantum memory for polarization-encoded photonic qubits [0.3] 短期量子ネットワークアプリケーションは、高効率の低損失光ファイバー結合型フォトニック量子メモリ装置の恩恵を受けるだろう。
ファイバ結合型ループ・アンド・スウィッチ量子メモリプラットフォームを54%のパススルー効率と、Nがストレージサイクルの数である0.5(N+1)までスケールする全体的なストレージ効率を実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:18:40 GMT)
TRIDENT: Tri-modal Real-time Intrusion Detection Engine for New Targets [0.3] TRIDENTは、同期オーディオ、視覚、およびデータを統合した、トリモーダルなドローン検出フレームワークである。
リアルタイムに動作し、わずか6.09msでドローンを検知し、1回の検知で75.27mJしか消費しない。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:58:36 GMT)
Algebraic Compression of Free Fermionic Quantum Circuits: Particle Creation, Arbitrary Lattices and Controlled Evolution [0.3] 我々は、フリーフェルミオンにマッピングできるハミルトンアンの下で、トロッター化進化を圧縮するアルゴリズムを開発した。
我々は、長範囲のフェルミオンホッピングで進化を圧縮するため、任意の格子を量子ビットの連鎖に埋め込むことができるように拡張する。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:08:36 GMT)
The non-Clifford cost of random unitaries [0.3] 我々は$t$ドープクリフォード回路のアンサンブルを$n$ qubitsで探索する。
厳密な収束境界をユニタリな$k$-設計に向けて確立する。
ランダムドープされたクリフォード回路のアンサンブル上で回転する演算子の解析式を導出する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:28:10 GMT)
Comparative Study of Indicators of Chaos in the Closed and Open Dicke Model [0.3] 閉かつオープンなディックモデルに対するカオスの静的および動的指標の体系的比較研究を提供する。
クローズドディックモデルでは、スペクトル形成係数のようなエネルギースペクトルにおける長距離相関に敏感なカオスの指標は、ポアソン確率行列理論(RMT)の予測から逸脱することができる。
キャビティ減衰を伴うオープンディックモデルでは,2次ディップ・ランプ・プラトーの挙動を示す頑健な診断として,散逸スペクトル形状因子が出現することがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:11:41 GMT)
StoryReasoning Dataset: Using Chain-of-Thought for Scene Understanding and Grounded Story Generation [0.2] ビジュアルストーリーテリングシステムは、フレームをまたいだキャラクターのアイデンティティを維持し、適切な主題にアクションをリンクするのに苦労する。
52,016本の映画画像から得られた4,178個のストーリーを含むデータセットであるStoryReasoningを提案する。
Qwen Storytellerを作成し、ストーリー全体を通して一貫したオブジェクト参照を維持しながら、エンドツーエンドのオブジェクト検出、再識別、ランドマーク検出を行います。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:42:14 GMT)
A multi-head deep fusion model for recognition of cattle foraging events using sound and movement signals [0.2] この研究は、音響信号と慣性信号の融合に基づくディープニューラルネットワークを導入する。
このモデルの主な利点は、それぞれから独立して特徴の自動抽出による信号の組み合わせである。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:55:16 GMT)
Vision language models have difficulty recognizing virtual objects [0.2] 視覚言語モデル(VLM)は、多モード入力を処理するために、言語と視覚エンコーダの両方と組み合わせたAIシステムである。
仮想オブジェクトの記述は、これらのAIシステムにおけるテストシーンの理解に役立つと論じる。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:11:33 GMT)
SmartShift: A Secure and Efficient Approach to Smart Contract Migration [0.2] SmartShiftはセキュアで効率的なスマートコントラクト移行を可能にするフレームワークである。
SmartShiftは、堅牢なセキュリティを確保しながら、マイグレーションのダウンタイムを大幅に削減します。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:12:26 GMT)
AI-generated Text Detection: A Multifaceted Approach to Binary and Multiclass Classification [0.1] 大規模言語モデル(LLM)は、人間の文章によく似たテキストを生成する際、顕著な能力を示した。
このような機能は、偽ニュース生成、スパムメールの作成、学術的課題における誤用など、潜在的な誤用につながる。
最適化されたモデルとより単純なバリエーションの2つのニューラルアーキテクチャを提案する。
タスクAでは、最適化されたニューラルアーキテクチャが0.994ドルのF1$スコアで5位、タスクBでは、単純なニューラルアーキテクチャが0.627のF1$スコアで5位にランクインした。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:28:06 GMT)
A Hybrid Strategy for Aggregated Probabilistic Forecasting and Energy Trading in HEFTCom2024 [0.1] 本稿では,IEEE Hybrid Energy Forecasting and Trading Competition 2024(HEFTCom2024)の学生チームの中で,第3位,第4位,第1位にランクインしたチームGABのソリューションを提案する。
このソリューションは、風洞ハイブリッドシステムの正確な確率予測を提供し、日頭電気市場における実質的なトレーディング収益を達成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:55:11 GMT)
Quantum network sensing with efficient multi-partite entanglement distribution via lossy channels [0.1] 量子ネットワークセンシングは、ショットノイズ限界を超えた空間分布パラメータの関数の推定精度を高める可能性を示している。
本研究では,最近提案された高効率GHZ状態分布方式に基づく量子ネットワーク検出プロトコルを解析する。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:22:30 GMT)
MASSV: Multimodal Adaptation and Self-Data Distillation for Speculative Decoding of Vision-Language Models [0.1] 視覚言語モデル(MASSV)の投機的復号化のためのマルチモーダル適応と自己データ蒸留を導入する。
MASSVは、既存の小さな言語モデルを2段階のアプローチで効果的なマルチモーダルドラフトに変換する。
Qwen2.5-VL と Gemma3 モデルファミリでの実験では、MASSV が許容される長さを最大30%増加し、視覚的に接地されたタスクで最大 1.46 倍のエンドツーエンドの推論速度を提供することを示した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:37:00 GMT)
Managerial Insights on Investment Strategy in Cybersecurity: Findings from Multi-Country Research [0.1] 本研究は,欧州,英国,米国における1,083人の管理者を対象に,サイバーセキュリティの戦略的役割について検討した。
この結果は、サイバーセキュリティが競争上の優位性の源として認識されつつあることを示している。
セキュリティとイノベーションとアジリティのバランスをとる上で、主要な管理上の緊張が生まれます。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:23:42 GMT)
Probing the geometry dependence of the Casimir-Polder interaction by matter-wave diffraction at a nano-grating [0.1] ナノ粒子による原子回折は、カシミール・ポルダーポテンシャルを探査するための強力なツールである。
カシミール・ポルダーポテンシャルの様々な近似法と手法を提案し,その物質波回折パターンへの影響を解析した。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:59:29 GMT)
Single photon emission and single spin coherence of a nitrogen vacancy centre encapsulated in silicon nitride [0.1] 窒素に富んだ窒化ケイ素は、実行可能な量子フォトニクスプラットフォームである。
ナノダイヤモンドに埋め込まれた窒素空孔中心は、カプセル化後の量子光学特性とスピン特性の両方を保存している。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:47:05 GMT)
Cyclic 2.5D Perceptual Loss for Cross-Modal 3D Medical Image Synthesis: T1w MRI to Tau PET [0.0] 本研究では, 軸方向, コロナ面, 矢状面の各2次元平均知覚損失をエポック上で計算する巡回2.5D知覚損失を提案する。
我々は,高SUVR領域の保存性を高めるために,バイマニュファクチャラー標準化を用いたタウPET画像を処理する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:17:41 GMT)
Towards a Deeper Understanding of Reasoning Capabilities in Large Language Models [0.0] 本研究は, 自己回帰, 突然変異, 計画の有効性を, エージェントの適応能力を試験するための技術として体系的に評価する。
動的環境における様々なオープンソース言語モデルを用いて実験を行う。
より大きなモデルは一般的により小さなモデルよりも優れていますが、戦略的なプロンプトはこのパフォーマンスギャップを埋めることができます。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:53:47 GMT)
Valid Bootstraps for Network Embeddings with Applications to Network Visualisation [0.0] ネットワークにおける不確実性の定量化は、エンティティ間の関係と相互作用をモデル化する重要なステップである。
ネットワークの単一観測のみを行う場合、不均一なランダムグラフをブートストラップすることの難しさを考察する。
我々は,任意のメソッドが生成したブートストラップサンプルを実証的に検証できる交換可能なネットワークテストを利用する。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:10:59 GMT)
VRU-CIPI: Crossing Intention Prediction at Intersections for Improving Vulnerable Road Users Safety [0.0] 交差点におけるVRU交差意図を予測するために,VRU-CIPIフレームワークを逐次アテンションベースモデルで提案する。
VRU-CIPIは、GRU(Gated Recurrent Unit)を使用して、VRU動作の時間的ダイナミクスをキャプチャする。
提案手法は96.45%の精度で,33フレーム/秒のリアルタイム推論速度を実現する。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:40:29 GMT)
Understanding Decoherence of the Boron Vacancy Center in Hexagonal Boron Nitride [0.0] 六方晶窒化ホウ素(hBN)は、量子センシングの重要な材料として出現している。
本研究では、hBN における V$_mathrmB-$ 中心のデコヒーレンスを調査するために最先端の計算手法を用いる。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:59:11 GMT)
Uncovering Magnetic Phases with Synthetic Data and Physics-Informed Training [0.0] 合成データに基づいて学習した人工ニューラルネットワークを用いた磁気位相の効率的な学習について検討する。
モデル性能を向上させるために,物理インフォームドガイダンスの2つの重要な形態を取り入れた。
この結果から, 合成, 構造化, 計算効率のよい学習手法は, 物理的に意味のある位相境界を明らかにすることができることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:16:16 GMT)
Two-local modifications of SYK model with quantum chaos [0.0] Sachdev--Ye-Kitaevモデル(SYK)は量子カオスの実験的な研究の出発点となるかもしれない。
我々は、SU($d$)モデルに類似した構造を持つスピン-SYKモデルとSYKモデルの修正を導入する。
これらのモデルは、元のSYKモデルの量子シミュレーションの出発点となるかもしれない。
論文参考訳(メタデータ) (Thu, 15 May 2025 02:09:00 GMT)
Two exact quantum signal processing results [0.0] 量子信号処理(QSP)は、量子回路を介して特定の機能を実装するためのフレームワークである。
QSP 回路を構成するには、ターゲット $P(z)$ が必要であるが、これは複素単位円 $mathbb$ 上で $lvert P(z)rvertleq 1 を満たす必要がある。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:13:23 GMT)
Traffic and Mobility Optimization Using AI: Comparative Study between Dubai and Riyadh [0.0] 我々は、交通と移動に関する問題とその住民の感情への影響を理解するためにAIをどのように利用できるかを探る。
このアプローチは、リアルタイムトラフィックデータと地理的に位置付けられた感情分析を組み合わせることで、都市移動計画に対する包括的でダイナミックなアプローチを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:07:00 GMT)
Toward a Public and Secure Generative AI: A Comparative Analysis of Open and Closed LLMs [0.0] 本研究では,オープンかつクローズドな生成型AIモデルの特徴,機会,課題を批判的に評価し,比較することを目的とする。
提案されたフレームワークは、重要な側面、オープン性、パブリックガバナンス、セキュリティを、信頼できる、包括的なGen AIの未来を形成するための必須の柱として概説している。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:21:09 GMT)
Time Awareness in Large Language Models: Benchmarking Fact Recall Across Time [0.0] 現実のシナリオでは、回答の正しさはしばしば時間的文脈に結びついている。
2018年から2024年にかけて8000以上のイベントにまたがる新しいフレームワークとデータセットを提示します。
私たちの仕事は、タイムアウェアな言語モデルを進めるための重要なステップを提供します。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:13:36 GMT)
Thermalization of finite complexity and its application to heat bath algorithmic cooling [0.0] 衝突モデルに基づく熱操作のクラスを紹介する。
単一衝突による入浴温度以下で冷却するために必要な条件を同定する。
これらの制限された熱操作下では,機械を使わずにサブバス冷却が実現可能であることを実証する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:57:16 GMT)
The measurement postulates of quantum mechanics are not redundant [0.0] Masanes, Galley and M'uller は、非相対論的量子力学の仮定は構造的仮定から導かれると主張している。
非量子測定と状態更新規則の明確な例を提示し、その結論を反論する。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:12:02 GMT)
The Tangent Space Attack [0.0] 本稿では,任意のジェネレータ行列を与えられた汎用交互符号の構造を検索する新しい手法を提案する。
次に、このコードがインスタンス化されたMcEliece暗号システムのセキュリティにどのように挑戦するかについて議論する。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:30:46 GMT)
The Many-Worlds Calculus [0.0] このフレームワークで計算をモデル化するための色付きPROPを提案する。
このモデルは、通常のテスト、確率的および非決定論的分岐、および量子分岐をサポートすることができる。
我々は、言語が普遍的であることを証明し、方程式理論は、この意味論に関して完備であるべきである。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:35:15 GMT)
The Devil Is in the Word Alignment Details: On Translation-Based Cross-Lingual Transfer for Token Classification Tasks [0.0] 低レベル設計決定がトークンレベルXLTに与える影響について検討する。
最適化された選択により、XLT with WAは少なくともマーカーベースのメソッドに匹敵するパフォーマンスを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:10:50 GMT)
Temporal coherence of single photons emitted by hexagonal Boron Nitride defects at room temperature [0.0] 六方晶窒化ホウ素(hBN)の色中心は室温で有望な量子光源として現れる。
室温でのナノ結晶中のhBN欠陥により放出される単一光子のコヒーレンス時間について, ミッチェルソン干渉計を用いて測定した。
結果は、強いフォノン-電子結合の存在を強調し、光子干渉に基づく量子フォトニクスの応用を可能にするために、低温で動く必要があることを示唆している。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:32:29 GMT)
TKFNet: Learning Texture Key Factor Driven Feature for Facial Expression Recognition [0.0] テクスチュアキードライバファクター(TKDF)に着目した新しいフレームワークを提案する。
TKDFは局所的なテクスチャ領域であり、感情カテゴリー間で強い差別力を示す。
これらの手がかりを効果的に捉え,活用するために,テクスチュア・アウェア・フィーチャー・エクストラクタ(TAFE)とDual Contextual Information Filtering(DCIF)を提案する。
提案手法は,TKDFsをFERパイプラインに組み込むことの有効性とロバスト性を検証し,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:07:00 GMT)
Structured search algorithm: A quantum leap [0.0] 本稿では、絡み合いマップと固定点法を利用して、非分類データセットにおけるオラクルクエリの複雑さを最小化する構造化量子探索アルゴリズムを提案する。
IBM Kyivハードウェアの実験結果は、最大5TBの非分類データを持つデータセットでの検索が成功したことを実証している。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:15:28 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の分布を持つ確率変数に置き換え、結果平均と偏差を計算する。
本稿では、分散算術と呼ばれる統計テイラー展開の実装と分散算術に関する試験について述べる。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:37:18 GMT)
Spectral quantum algorithm for passive scalar transport in shear flows [0.0] スパイリングと拡散による流体流動中のスカラー物質の混合は、自然流、化学工学、マイクロ流体薬物の輸送において至るところで見られる。
本稿では, 量子流体力学フレームワークにおいて, 対流拡散方程式を解くことで, スカラー混合のためのスペクトル量子アルゴリズムを提案する。
この評価結果から, 演算子分割が時間次数を制限する場合でも, スペクトル精度が相容れない時間ステップを許容できることが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:09:52 GMT)
Simulation of the 1d XY model on a quantum computer [0.0] 本稿では,量子コンピュータ上での1次元XYモデルの正確なシミュレーションのための包括的スキームを提案する。
本稿では,正確な時間発展を実現するために,量子回路を設計するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:56:49 GMT)
RoBERTa-BiLSTM: A Context-Aware Hybrid Model for Sentiment Analysis [0.0] 本稿では,ロバスト最適化BERT事前学習手法(RoBERTa)とBilong Short-Term Memory(BiLSTM)ネットワークを組み合わせたハイブリッドディープラーニングモデルRoBERTa-BiLSTMを提案する。
RoBERTaは意味のある単語埋め込みベクトルを生成するのに使われ、BiLSTMは長文の文脈意味を効果的に捉えている。
我々は、IMDb、Twitter US Airline、Sentiment140のデータセットを用いて、既存の最先端手法に対して提案したモデルを評価する実験を行った。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:38:21 GMT)
Relativistic quantum Otto heat engine using a three-level Unruh-DeWitt detector [0.0] 我々は, 量子スカラー場と相互作用する作用物質として, クォートを持つ相対論的量子オットー熱エンジンを探索する。
一対のエネルギーレベルが知覚する有効温度の観点から、一般的な正の作業条件を導出する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:18:04 GMT)
ROIsGAN: A Region Guided Generative Adversarial Framework for Murine Hippocampal Subregion Segmentation [0.0] 海馬は、記憶処理と様々な神経変性および精神疾患に関わる重要な脳構造である。
組織像から海馬の亜領域を自動分割する手法は存在しない。
海馬サブリージョンセグメンテーションに適した,U-Net をベースとした領域誘導型生成対向ネットワーク ROIsGAN を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:11:50 GMT)
R2VF: A Two-Step Regularization Algorithm to Cluster Categories in GLMs [0.0] 本稿では、一般化線形モデル(GLMs)において、名詞と順序のカテゴリーを効率的に融合する2段階の方法であるR2VF(R2VF)について紹介する。
R2VFは、最初に規則化された回帰を通じて、名目上の特徴を順序付きフレームワークに変換することで、モデルの複雑さと解釈可能性のバランスを取る。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:45:16 GMT)
Quantum information in Riemannian spaces [0.0] 物理空間における連続変数に対する量子情報の微粒で座標に依存しない概念を提供する。
情報理論、微分幾何学、量子物理学から概念をブリッジすることで、我々の研究は曲線空間における連続変数量子情報の研究に体系的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 01:17:26 GMT)
Quantum Dynamics in Krylov Space: Methods and Applications [0.0] 量子系の力学は状態空間や作用素空間(クリロフ空間)の部分空間内で展開する。
このレビューでは、量子進化と量子カオスの効率的な記述を提供するために、クリロフ部分空間法(Krylov subspace method)を用いる。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:39:48 GMT)
Quantum Computing and AI: Perspectives on Advanced Automation in Science and Engineering [0.0] 人工知能(AI)と量子コンピューティングの最近の進歩は、科学と工学のプロセスにおける自動化を加速させている。
この視点は、科学的な自動化と確立されたコンピュータ支援工学(CAE)の実践の類似点を強調している。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:53:30 GMT)
Prequantisation from the path integral viewpoint [0.0] ファインマン積分における因子 $expbig[(i/hbar)S(gamma)big]$ の量子力学的許容可能な定義は、単射に置かれる。
この因子の異なる許容された式 -- 等価な前列化 -- は分類される。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:31:16 GMT)
Predicting Human Behavior in Autonomous Systems: A Collaborative Machine Teaching Approach for Reducing Transfer of Control Events [0.0] Transfer of Control (ToC)は、障害時に自動化プロセスを中断するための従来のアプローチである。
本稿では,人間のインタラクションデータを用いて,問題の事前特定と対処が可能なAIモデルを訓練するデータ駆動手法を提案する。
その結果,非専門家からのデータでさえ,不要なToCイベントを減らすために効果的にモデルをトレーニングできることが判明した。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:34:29 GMT)
Pre-Training Estimators for Structural Models: Application to Consumer Search [0.0] 本稿では,推定が困難であることが知られている逐次探索モデルのための事前学習型推定器を構築する。
推定には数秒かかり、精度が高い。
より一般的には、事前訓練されたオフザシェルフ推定器は、研究者や実践者にとって構造モデルをよりアクセスしやすいものにすることができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:11:49 GMT)
Phase control of transmission and reflection in a sample of duplicated two-level systems driven by a stationary control field [0.0] 静止制御場と弱共伝播プローブ場を対象とする複層原子媒体の光学応答について検討した。
プローブの反射成分と透過成分の両方を吸収または増幅可能であることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:38:03 GMT)
Pharmacophore-Conditioned Diffusion Model for Ligand-Based De Novo Drug Design [0.0] 本稿では3次元分子生成のための薬理泳動条件拡散モデルであるPharmaDiffについて述べる。
PharmaDiffは3D薬局の原子ベースの表現を生成過程に統合するためにトランスフォーマーベースのアーキテクチャを採用している。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:54:29 GMT)
Optimal normalization in quantum-classical hybrid models for anti-cancer drug response prediction [0.0] 量子古典的ハイブリッド機械学習(QHML)モデルは、その頑健な性能と高い一般化能力で認識される。
本稿では、$tanh$の適度なバージョンに基づいて正規化関数を使用する新しい戦略を提案する。
癌細胞株の遺伝子発現と薬剤応答のデータセットを用いて検討した。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:33:41 GMT)
Observing Bethe strings in an attractive Bose gas far from equilibrium [0.0] 小型のBethe弦は近年、量子磁石や超伝導量子ビットで観測されている。
ここでは、ほぼ可積分な超低温ボース気体を用いて、Bethe弦のそのような混合を平衡から得ることができる。
モーメント分布やタンの接触において、相関密度に関係したさらなる証拠が見つかる。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:56:49 GMT)
ORL-LDM: Offline Reinforcement Learning Guided Latent Diffusion Model Super-Resolution Reconstruction [0.0] 本稿では、リモートセンシング画像超解像のための強化学習に基づく潜時拡散モデル(LDM)の微調整法を提案する。
RESISC45データセットの実験では、PSNR、SSIM、LPIPSのベースラインモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:17:03 GMT)
Narrow-Line Electric Quadrupole Cooling And Background-Free Imaging Of A Single Cs Atom With Spatially Structured Light [0.0] 狭線6S1/2から5D5/2電気四極子遷移による1個の133Cs原子のバックグラウンドフリーイメージングとサイドバンド冷却を1064nm光ツイーザで実証した。
我々は、異なるサイドバンド系における冷却性能を比較し、また、構造光の軌道角運動量がどのように四重極遷移の選択規則を制御するかを探求した。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:50:39 GMT)
Multiple phase estimation with photon-added multi-mode coherent states of GHZ-type [0.0] 我々は、特に非線形プロトコルにおいて、同時推定が一般に独立推定より優れていることを示す。
また,PACSをベースとしたGHZ状態とNOON状態および絡み合ったコヒーレント状態を比較し,それぞれの相対的な性能を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:42:59 GMT)
Multipartite Hardy paradox unlocks device-independent key sharing [0.0] N パーティのためのデバイス非依存の量子鍵分配プロトコルを提案する。
我々は、真の多部的非局所性を証明するために、多部的ハーディパラドックスを用いる。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:58:52 GMT)
Multi-Objective Reinforcement Learning for Automated Resilient Cyber Defence [0.0] サイバー攻撃は、軍事指揮統制ネットワーク、情報、監視、偵察(ISR)システム、民間の臨界国家インフラにセキュリティ上の脅威をもたらす。
これらの攻撃における人工知能と自律エージェントの使用は、この脅威の規模、範囲、複雑さを増大させ、それらが引き起こす破壊を後押しする。
自律サイバー防衛(ACD)エージェントは、マシンスピードとこの問題に対処するために必要なスケールで応答することで、この脅威を軽減することを目指している。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:07:42 GMT)
MorphGuard: Morph Specific Margin Loss for Enhancing Robustness to Face Morphing Attacks [0.0] 本研究では,顔形態攻撃に対する堅牢性を高めた顔認識のためのディープネットワークのトレーニング手法を提案する。
本手法は,顔形態のラベル付けにおけるあいまいさを効果的に扱える二重ブランチ分類戦略を導入することにより,分類タスクを修飾する。
当社の戦略は,顔形態攻撃に対する堅牢性を向上する上での有効性を実証し,公開ベンチマークで検証されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:00:16 GMT)
Minimum-error state discrimination and Fano's inequality [0.0] 非直交量子状態の識別は、量子情報処理と量子技術において重要な役割を果たす。
ある種のファノの不等式は誤差確率に境界を与えるが、この境界が最適測定によって達成される最小エラー確率にどの程度近いかは分かっていない。
いくつかのシナリオにおいて、最小エラー確率がファノの不等式によって得られた誤差境界とどのように比較されるかについて議論する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:38:27 GMT)
Minimax learning rates for estimating binary classifiers under margin conditions [0.0] 水平関数によって決定境界を記述する二分推定器を用いた分類問題について検討する。
我々は、ルベーグノルムの有界コルモゴロフエントロピーを持つ広関数クラスに対するミニマックス学習率の上限と下限を確立する。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:05:10 GMT)
Measuring Student Behavioral Engagement using Histogram of Actions [0.0] 提案手法は学生の行動を認識し,学生の行動エンゲージメントレベルを予測する。
学生の行動認識には、人間の骨格を用いて、学生の姿勢と上半身の動きをモデル化する。
トレーニングされた3D-CNNモデルは、2分間のビデオセグメントごとにアクションを認識するために使用される。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:30:03 GMT)
Mapping Semantic Segmentation to Point Clouds Using Structure from Motion for Forest Analysis [0.0] 本研究では,森林環境のセマンティックな分節点雲を生成するための新しいパイプラインを提案する。
多様な森林景観のリアルなRGB画像とそれに対応するセマンティックセグメンテーションマスクを生成する。
結果として得られるポイントクラウドは、幾何学的および意味的な詳細の両方を提供し、ディープラーニングモデルをトレーニングし評価するための貴重なリソースを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:34:55 GMT)
Magnon Nesting in Driven Two-Dimensional Quantum Magnets [0.0] 駆動磁石の動的量子不安定性の新しいクラスを見いだす。
この不安定性は、純粋な強磁性マイクロカップリングであっても反強磁性相関の創発的な増強につながる。
しかしフェルミオンの場合とは対照的に、マグノン駆動の不安定性は本質的に非平衡であり、熱物理学では基本的に到達できない。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:41:44 GMT)
Magnetic deflection of high-spin sodium dimers formed on helium nanodroplets [0.0] 液体ヘリウムナノ滴の表面に位置するアルカリ原子二量体は、主に弱結合で準安定なスピントリップ状態において検出される。
ナトリウムドープナノドロップレットビームのStern-Gerlach偏向を測定することにより,高磁気モーメントダイマーの存在を透過的に示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:31:10 GMT)
MTVCrafter: 4D Motion Tokenization for Open-World Human Image Animation [0.0] MTVCrafterは、人間の画像アニメーションのための生の3Dモーションシーケンスを直接モデル化する最初のフレームワークである。
2Dレンダリングされたポーズ画像と比較して、4Dモーショントークンはより堅牢な時間的手がかりを提供する。
MTVCrafterは様々なスタイルやシナリオで様々なオープンワールドキャラクター(シングル/複数、フル/半ボディ)を一般化する。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:50:29 GMT)
Lost in Models? Structuring Managerial Decision Support in Process Mining with Multi-criteria Decision Making [0.0] 本稿では、プロセスモデルの評価と優先順位付けのためのマルチ基準意思決定(MCDM)アプローチについて検討する。
最初の洞察は、MCDMアプローチが文脈に敏感な意思決定を促進することを示唆している。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:49:56 GMT)
Localization transitions in quadratic systems without quantum chaos [0.0] 擬似空間の局所化から位置空間の局所化への固有状態遷移を示す一次元アンダーソン・ワニエ・スタークモデルについて検討する。
遷移点がヤヌス型の非伝統的な性質を示すこと、すなわち、遷移点において RMT のような普遍性が現れることを示唆する測度や、それから離れる測度があることが示される。
この結果から,最大絡み合っていない二次系における容積法則固有状態絡み合エントロピーの多様性が示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:48:55 GMT)
Light-Matter Interaction in dispersive Superconducting Circuit QED [0.0] 回路QEDでは、非線形電荷量子ビットと超伝導共振器との相互作用は、しばしば大きな共振器モードへの量子ビット結合を伴う。
超伝導分散は, 実効的な光-光相互作用遮断を決定する上で重要な役割を果たしていることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:33:52 GMT)
Leveraging Reactant Entanglement in the Coherent Control of Ultracold Bimolecular Chemical Reactions [0.0] 絡み合いは量子計算、量子センシング、量子通信において量子上の優位性を達成するための重要な資源である。
本稿では, 第一の反応体が絡み合って, 第二の反応体がコヒーレント制御を行う, エンタングルメント強化コヒーレント制御方式を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:02:28 GMT)
Isospin precession in non-Abelian Aharonov-Bohm scattering [0.0] 擬古典的イソスピンの概念は、1975年にウーとヤンによって提唱された非アベリア・アハロノフ・ボーム効果によって説明されている。
イソスピンは、閉じた磁束と入射粒子のイソポピンが平行でないときに発生する。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:15:24 GMT)
Is there a conflict between causality and diamagnetism? [0.0] 本質的には、因果関係の議論(英語版)を用いることで、少数の明確な仮定とともに、反磁性は不可能であることを示すことができる。
本稿では,メディアに観察されたダイオード応答の欠如を説明する。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:00:01 GMT)
Is diamagnetism really acausal? [0.0] 媒体の磁化が印加磁場の方向に反する反磁性は、幅広い種類の材料において弱いが親しみやすい効果である。
問題は、ダイアマグネティズムの存在が、慣れ親しんだクラマース=クロニッヒ関係に具現化された因果性の要件と直接的に矛盾していることである。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:00:00 GMT)
Interpretable Risk Mitigation in LLM Agent Systems [0.0] 反復囚人ジレンマの変動に基づくゲーム理論環境におけるエージェントの挙動を探索する。
本稿では,スパースオートエンコーダの潜在空間から抽出した解釈可能な特徴を持つ残差ストリームを,ゲームとプロンプトの双方に依存しない戦略修正手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:22:11 GMT)
Informed Forecasting: Leveraging Auxiliary Knowledge to Boost LLM Performance on Time Series Forecasting [0.0] 時系列予測において,Large Language Models (LLMs) の性能を高めるために,新しいクロスドメイン知識伝達フレームワークを提案する。
この手法は、LLMを構造化時間情報で体系的に注入し、予測精度を向上させる。
その結果,知識インフォームド予測は予測精度と一般化の点で非フォームドベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:17:52 GMT)
Inclusivity of AI Speech in Healthcare: A Decade Look Back [0.0] AI音声認識技術の医療への統合は、臨床と患者-研究者間のコミュニケーションに革命をもたらす可能性がある。
しかし,本研究では,データセットや研究が高ソース言語,標準アクセント,狭い人口集団を好んでいるため,傾きの差が顕著である。
本稿では、医療におけるAI音声技術への公平なアクセスを確保するために、包括的データセット設計、バイアス軽減研究、およびポリシーフレームワークの緊急性を強調した。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:03:05 GMT)
Impact of micromotion on the excitation of Rydberg states of ions in a Paul trap [0.0] 我々は,Floquet理論を用いて数値解法し,摂動的アプローチを用いて解析的に解法する単一トラップリドベルクイオンを記述するモデルを開発した。
我々は,どのパラメータ規則に対処可能で,エネルギ的に孤立したRydberg線が持続するかを解析し,コヒーレントな操作を行う上で重要な要件である。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:54:57 GMT)
Identification and Optimal Nonlinear Control of Turbojet Engine Using Koopman Eigenfunction Model [0.0] 非線形力学のスパース同定を用いてロータ動力学を推定した。
結果のKoopmanモデルは、社内のリファレンスコンポーネントレベルモデルに対して検証された。
固有モード構造により、最適化プロセス中に個々のモードをターゲットとすることができ、パフォーマンスチューニングが向上した。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:55:13 GMT)
IMAGE-ALCHEMY: Advancing subject fidelity in personalised text-to-image generation [0.0] テキスト・ツー・イメージ・モデルのパーソナライズという課題に対処する2段階のパイプラインを提案する。
まず、修正されていないSDXLを用いて、対象をクラスラベルに置き換えることで、ジェネリックシーンを生成する。
次に,パーソナライズされた被写体をセグメンテーション駆動型イメージ・トゥ・イメージ(Img2Img)パイプラインで選択的に挿入する。
SDXLのDINO類似度スコアは0.789であり、既存のパーソナライズされたテキスト・ツー・イメージのアプローチよりも優れている。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:08:52 GMT)
Hybrid encoder for discrete and continuous variable QKD [0.0] 本研究では,iPOGNAC変調器をベースとした新しいハイブリッドエンコーダを提案し,離散可変(DV)および連続可変(CV)QKDシステムとの互換性を確保する。
提案手法は、DV偏光プロトコルを最初にサポートするもので、将来の量子ネットワークの空間ノードに対して魅力的な候補となる。
論文参考訳(メタデータ) (Thu, 15 May 2025 11:11:09 GMT)
How Hungry is AI? Benchmarking Energy, Water, and Carbon Footprint of LLM Inference [0.0] 本稿では,商用データセンタにデプロイされる30の最先端モデルを対象とした,AI推論の環境フットプリントを定量化する,新たなインフラストラクチャ対応ベンチマークフレームワークを提案する。
以上の結果から,O3とDeepSeek-R1が最もエネルギー集約的なモデルとして出現し,GPT-4.1ナノの70倍以上のGPT-4.1ナノを消費し,Claude-3.7 Sonnetはエコ効率で最高であることがわかった。
AIは安価で速くなっているが、そのグローバルな採用はリソース消費を不均等にしている。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:21:12 GMT)
Hopf Bifurcation of Nonlinear Non-Hermitian Skin Effect [0.0] 非線形性は皮膚状態を不安定にし、位相空間の極限サイクルに付随する非局在状態の出現を引き起こすことを示す。
本研究は,非ハーミティティーと非線形性の間の相互作用から生じるリッチな現象を明らかにするために,皮膚効果に非線形性が重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:21:42 GMT)
Graph neural networks and MSO [0.0] 我々は、実数を扱う再帰グラフニューラルネットワークがモナディックな二階述語論理 MSO に制限された表現力を持つという既存の結果の代替的証明を与える。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:32:24 GMT)
Global locations of Schmidt number witnesses [0.0] シュミットの証人は、全二党国家の凸集合の外にいる。
それらの位置は、全ての状態の凸集合の面の内部によって分類される。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:36:20 GMT)
Generation of frequency entanglement with an effective quantum dot-waveguide two-photon quadratic interaction [0.0] 導波路に結合した量子ドットの原子様4レベル構造を利用して、単一光子に対する整形周波数エンタングゲート(ShaFrEnGa)をモデル化する。
本手法は、入力周波数の同定と、周波数依存の1光子遷移を断熱的に除去する原子レベル構造に基づく。
連続変数に対するシュミット分解を用いてゲートの周波数絡み性能を解析し、絡み込み発生効率と絡み合い品質のトレードオフを明らかにする。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:47:10 GMT)
Generation of Motional Squeezed States for Neutral Atoms in Optical Tweezers [0.0] 光学式ツイーザの動作を簡易に抑制する方法を報告する。
次に、5.8dBのスクイーズを示す。
運動スクイーズの実装により、位置量子ノイズによって設定された極限を押し戻すことができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:51:01 GMT)
GNN-Suite: a Graph Neural Network Benchmarking Framework for Biomedical Informatics [0.0] 本稿では,計算生物学におけるグラフニューラルネットワーク(GNN)アーキテクチャの構築とベンチマークを行うフレームワークであるGNN-Suiteを紹介する。
タンパク質-タンパク質相互作用(PPI)データから分子ネットワークを構築することにより,癌ドライバ遺伝子の同定にその有用性を示す。
GNNアーキテクチャの実装と評価のための共通フレームワークは、最高のモデルだけでなく、補完的なデータを組み込む最も効果的な方法を特定するのに役立つ。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:14:30 GMT)
From Text to Network: Constructing a Knowledge Graph of Taiwan-Based China Studies Using Generative AI [0.0] 台湾中国研究(CS)は、独特な地政学的な立場と長年にわたる中国本土との学術的関わりによって形作られた、豊かな学際的な研究分野へと発展してきた。
本研究では,非構造化学術テキストを構造化された対話的知識表現に変換するAI支援手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:51:53 GMT)
Floquet engineering using pulse driving in a diamond two-level system under a large-amplitude modulation [0.0] 大振幅交流磁場中におけるカーパーセル配列によって駆動されるフロケット状態について検討する。
数値計算により、有限パルス長と誤差の影響により、Floquetエンジニアリングで利用可能な変調振幅が制限されることが示されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:03:31 GMT)
Flat band mediated photon-photon interactions in 2D waveguide QED networks [0.0] 2次元導波路ネットワークに結合した量子エミッタのリーブ格子について検討する。
本システムは, 長距離光子結合の存在にもかかわらず, エネルギー的に孤立した平面バンドをサポートすることを示す。
本研究は, 励起子の集合挙動と有効光子-光子相互作用の相互作用が, フラットバンド系における高相関光子状態の研究の基盤となることを示すものである。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:00:41 GMT)
Fermion Doubling in Quantum Cellular Automata [0.0] 量子セルオートマトン(Quantum Cellular Automaton, QCA)は、局所的なユニタリを通して格子上の粒子の進化を駆動する演算子である。
FDは特に離散空間において、リアルタイム/ハミルトン格子ゲージ理論(LGT)の連続時間設定においてよく理解されている。
我々は、この分析をQCAが持つリアルタイム離散空間および離散時間スキームに厳格に拡張する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:35:37 GMT)
Fast and Flexible Quantum-Inspired Differential Equation Solvers with Data Integration [0.0] 高次元偏微分方程式(英語版)(PDE)は計算数学における中心的な課題である。
最近の機械学習ベースのアプローチは柔軟性を提供するが、精度と信頼性の点でしばしば不足する。
本稿では,ニューラルネットワークの適応性と精度の向上,トレーニング時間の短縮を両立させる,量子インスピレーションフレームワークにおけるデータ駆動学習の新たな手法を提案する。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:38:47 GMT)
Fast and Automated Optical Polarization Compensation of Fiber Unitaries [0.0] 液晶を用いた高速かつ自動化された偏光補償法を提案する。
このアプローチは、回転する四分波板に基づく偏光測定と液晶セルの高速制御を組み合わせ、多種多様な用途に適した高忠実度補償を提供する。
本手法は, 平均6回未満で99%以上の忠実度を達成し, 99.5%以上の忠実度にさらに微調整を行う。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:05:31 GMT)
Experimental Tests of Invariant Set Theory [0.0] 不変集合論と標準量子論の差点を同定する。
これらの違いは、二つの理論の予測に顕著な違いをもたらすことを示す。
我々は、これらの予測のうちどれが我々の世界に対応するかをテストするために、数多くの実験を設計する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:29:17 GMT)
Estimating the number of household TV profiles based in customer behaviour using Gaussian mixture model averaging [0.0] 本稿では、個人プロファイルを検出し、組み合わせ、グループ視聴のための個人化されたレコメンデーションを作成することを目的とする。
本稿では,ガウス混合モデルを用いて,家庭内テレビ局数に対する点推定値を求める手法を提案する。
以上の結果から,我々のフレームワークと選択した特徴を組み合わせることで,家庭内テレビ局の視聴回数を推定できることがわかった。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:27:32 GMT)
Entanglement in Directed Graph States [0.0] 配向グラフによって定義される量子状態の族について検討し、配向エッジは順序付き量子ビット間の相互作用を表す。
絡み合いの尺度として、系の射影ヒルベルト空間に関するエンタングルメント距離 (Entanglement Distance) - フービニ (Fubini) から導かれる量- を用いる。
論文参考訳(メタデータ) (Thu, 15 May 2025 21:39:11 GMT)
Entanglement generation and dynamical equilibrium within de Broglie Bohm theory [0.0] 我々のハイブリッド半古典重力モデルが弱い絡み合いの限界においても絡み合いを誘導できることが示される。
本稿では,新しい通信方式を提案し,動的平衡の概念を導入する。
この枠組みは、ド・ブロイ・ボーム理論の量子平衡仮説とダヴィッド・ボームとジャン・ピエール・ビジェの因果解釈に着想を得たものである。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:24:33 GMT)
Enhancing IoT Cyber Attack Detection in the Presence of Highly Imbalanced Data [0.0] 本研究では、ハイブリッドサンプリング技術を用いて、IoT領域のデータ不均衡検出精度を向上させる。
サイバー攻撃の分類に関して,複数の機械学習モデルの性能を評価する。
全体として、この研究は、ハイブリッドサンプリングの価値と堅牢なモデルと機能選択を組み合わせることで、IoTセキュリティを著しく改善することを示している。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:02:48 GMT)
Emergence of a Classical Dirac-Type Spin from On-Shell Factorisation and Liouvillian Evolution [0.0] リウヴィルの定理は位相空間の分布そのものに間に合うように第一次であるが、相対論的質量殻の制約は$pmu p_mu = m2$はエネルギーの第二次である。
我々は、相対論的量子力学におけるディラックのアプローチと類似して$(p2 - m2)$を分解することで、ハミルトニアン内の両方のエネルギー枝を統一することは合理的であると主張する。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:44:36 GMT)
Electron spin resonance with scanning tunneling microscopy: a tool for an on-surface quantum platform of identical qubits [0.0] 走査トンネル顕微鏡(STM)における電子スピン共鳴(ESR)の統合により、固体表面における原子スピンと分子スピンの全電気的制御が可能となった。
我々はESR-STMの最近の進歩を紹介し、原子スケール量子ビットへの応用と分子量子ビット系の拡張に焦点を当てた。
論文参考訳(メタデータ) (Thu, 15 May 2025 08:34:53 GMT)
Efficient Adaptation of Reinforcement Learning Agents to Sudden Environmental Change [0.0] 現実の自律的な意思決定システムは、時間とともに変化する環境で運用されなければならない。
深い強化学習は、静止環境で最適なポリシーを学習する素晴らしい能力を示している。
この論文は、効率的なオンライン適応には2つの重要な機能が必要であることを示している。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:19:01 GMT)
Edge modes and symmetry-protected topological states in open quantum systems [0.0] トポロジカル秩序は、不完全に免疫可能な量子情報を処理する可能性を提供する。
このロバスト性は、開量子系のリンドブラッドおよび量子形式論における広い種類の散逸チャネルに対して有効である。
そこで本研究では,散逸性SPT相のダイナミクスを研究するための新しい枠組みを提案し,量子情報処理に関連する工学的絡み合った状態の可能性を明らかにする。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:55:23 GMT)
ENFORCE: Nonlinear Constrained Learning with Adaptive-depth Neural Projection [0.0] 本稿では,適応プロジェクションモジュール(AdaNP)を用いたニューラルネットワークアーキテクチャであるENFORCEを紹介した。
プロジェクションマッピングが1-Lipschitzであることが証明され、安定したトレーニングに適している。
我々の新しいアーキテクチャの予測は、ニューラルネットワークの入力と出力の両方において非線形である$N_C$等式制約を満たす。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:21:20 GMT)
Double Successive Over-Relaxation Q-Learning with an Extension to Deep Reinforcement Learning [0.0] 逐次的過剰緩和(SOR)Q-ラーニングは、収束をスピードアップする緩和因子を導入し、2つの大きな制限がある。
サンプルベースでモデルなしのダブルSORQ学習アルゴリズムを提案する。
提案アルゴリズムは深部RLを用いて大規模問題に拡張される。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:16:33 GMT)
Digital Natives, Digital Activists: Youth, Social Media and the Rise of Environmental Sustainability Movements [0.0] 本研究は、ソーシャルメディアプラットフォームにおける環境問題と16歳から25歳の若者活動家への影響に焦点を当てた。
この記事は、デジタルネイティブがグリーンアクティビズムを再編成する技術をどのように適応するかを説明することで、市民活動の新たな形態に関する洞察に貢献する。
論文参考訳(メタデータ) (Thu, 15 May 2025 10:36:24 GMT)
Diffusion-assisted Model Predictive Control Optimization for Power System Real-Time Operation [0.0] 本稿では,リアルタイム電力系統運用のためのモデル予測制御(MPC)フレームワークを提案する。
このフレームワークは、負荷予測モジュールの精度を高めるために、時系列生成に適した拡散モデルを含む。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:16:05 GMT)
Demystifying AI Agents: The Final Generation of Intelligence [0.0] これらのエージェントはAI開発の最終段階であり、インテリジェンスの「最終世代」を構成する可能性があると我々は主張する。
実例に基づいて,これらのエージェントの能力と基礎技術について検討する。
この論文は、この強力な新しいインテリジェンスの時代によってもたらされる機会と課題をナビゲートする上で、知恵と先見性に対する批判的な必要性を強調して締めくくっている。
論文参考訳(メタデータ) (Thu, 15 May 2025 03:35:12 GMT)
DeepSeqCoco: A Robust Mobile Friendly Deep Learning Model for Detection of Diseases in Cocos nucifera [0.0] ココナッツの木病は、特に発展途上国において、農業生産にとって深刻なリスクである。
DeepSeqCocoは、ココナッツツリーイメージからの正確かつ自動的な疾患識別のためのディープラーニングベースのモデルである。
論文参考訳(メタデータ) (Thu, 15 May 2025 07:25:43 GMT)
Deconstructing Subset Construction -- Reducing While Determinizing [0.0] 我々は,NFAのカノン化問題に対する新たな視点を提示する。
我々は,フライ時の探査スペースを削減するため,中間的な最小化手順を導入する。
当社のアプローチは,ユーザが実験を行うためのオープンソースライブラリとして実装されています。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:04:02 GMT)
Decoherence of Histories: Chaotic Versus Integrable Systems [0.0] ハイゼンベルク連鎖に対するシュル・オーディンガー方程式の正確な数値積分に基づいて, 孤立系におけるデコヒーレントヒストリーの出現について検討する。
我々は、(i)カオスから(ii)相互作用可積分性(iii)非相互作用可積分性(iii)相互作用可積分性(iii)システムの性質がデコヒーレンスに強く影響することを明らかにする。
以上の結果から, カオス性は, 有限サイズシステムにおける古典性の出現において重要な役割を担っていることが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:24:34 GMT)
Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction [0.0] 動的しきい値キャリブレーションとクロスモーダル整合性検証を統合したモデル非依存不確実性定量化法を提案する。
このフレームワークは、様々なキャリブレーションとテストの分割比で安定したパフォーマンスを実現し、医療、自律システム、その他の安全に敏感な領域における現実的な展開の堅牢性を強調している。
この研究は、マルチモーダルAIシステムにおける理論的信頼性と実用性の間のギャップを埋め、幻覚検出と不確実性を考慮した意思決定のためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:24:49 GMT)
Country wide Shared FibreBased Infrastructure for Dissemination of Precise Time, Coherent Optical Frequency with Vibration Sensing [0.0] チェコは革新的で非商業的な繊維ベースのインフラを開発した。
このインフラは共用プラットフォームとして機能し、光ファイバーを利用して高精度タイミング、コヒーレント周波数伝達、新たに実装された振動感知機能を実現している。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:59:28 GMT)
Compressed sensing quantum state tomography for qudits: A comparison of Gell-Mann and Heisenberg-Weyl observable bases [0.0] 従来の量子状態トモグラフィ(QST)は、システム次元が増加するにつれて指数関数的に増加する測定値を必要とする。
この問題を緩和するため、圧縮量子状態トモグラフィ(CS-QST)が提案され、必要な測定回数を大幅に削減した。
我々は,高次元量子情報処理の基本となるキューディット系におけるCS-QSTの基底選択の影響について検討する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:17:26 GMT)
Compact superconducting vacuum-gap capacitors with low microwave loss and high mechanical coherence for scalable quantum circuits [0.0] 超高コヒーレンスなメカニカルモーションをサポートする真空ギャップキャパシタの精密かつスケーラブルな製造法を提案する。
近年, 機械式発振器の地上冷却・スクイーズ化を実証し, 従来に比べて100倍の精度向上を実現した。
その他の成果としては、24の部位を持つ光学的トポロジカル格子の実現や、メカニカル・ヘキサマーにおける量子集合力学の観測がある。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:23:08 GMT)
Collective light shifts of many cavity modes probed by an optical frequency comb [0.0] 本研究では, コールド原子雲とファブリペロ空洞の多くの縦モードとの分散相互作用を実験的に検討した。
高品質な共振器を105ドル以上のキャビティ原子に結合させ, 共振器モードを100ドル以上同時に検出する。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:36:17 GMT)
Coherent nonlinear optical probe for cavity-dressed vibrational mode mixing: multidimensional double-quantum coherence and photon-echo signal [0.0] モード相関の動的性質を明らかにする2つの相補的多次元分光法について述べる。
選択したキャビティ-ビブロンモード結合強度は、振動間モード結合の範囲内に収まる。
振動二重励起のキャビティ操作、すなわちオーバトーンと組み合わせ状態は、集合モードのダイナミクスについて深い洞察を与えることができる。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:30:07 GMT)
Coherent heat transfer leads to genuine quantum enhancement in the performances of continuous engines [0.0] 入浴によるコヒーレント熱伝達を利用した連続量子熱機関を導入し,性能の真の量子化を実現した。
コヒーレントエンジンは、より信頼性の高い出力、すなわちパワーの信号対雑音比を数百倍に向上させる。
コヒーレントエンジンの実験的実現可能性と量子特性がどのように性能を高めるかの理解の改善により、量子対応技術に応用できる可能性がある。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:20:18 GMT)
Clustering scientific publications: lessons learned through experiments with a real citation network [0.0] スペクトル、ルービン、ライデンアルゴリズムなどのグラフベースのクラスタリング手法は、引用ネットワークをモデル化する能力のために頻繁に利用される。
本研究では,Web of Scienceから抽出した約70万枚の論文と460万個の引用からなる引用グラフ上で,これらのクラスタリングアルゴリズムの性能を評価する。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:27:53 GMT)
Clustering Rooftop PV Systems via Probabilistic Embeddings [0.0] 大規模で空間的に分散した時系列データは高次元であり、欠落した値に影響される。
これらの問題に対処するために、確率エンティティ埋め込みベースのクラスタリングフレームワークが提案されている。
複数年間の住宅PVデータセットに適用すると、物理ベースのベースラインを代表性とロバスト性で上回る不確実性を認識したクラスタプロファイルを生成する。
論文参考訳(メタデータ) (Thu, 15 May 2025 20:44:45 GMT)
ChestyBot: Detecting and Disrupting Chinese Communist Party Influence Stratagems [0.0] ロシアと中国の俳優が行う外国情報活動は、米国の寛容な情報環境を利用する。
既存の検出と緩和戦略は、しばしばリアルタイムにアクティブな情報キャンペーンを特定するのに失敗する。
本稿では,言語モデルであるChestyBotを紹介した。この言語モデルは,ラベル付けされていない外国の悪性ツイートを98.34%の精度で検出する。
論文参考訳(メタデータ) (Thu, 15 May 2025 23:12:20 GMT)
Characterizing quantum dynamics using multipartite entanglement generation [0.0] 絡み合いは多体量子システムの決定的な特徴であり、量子コンピューティングにとって必須の要件である。
したがって、量子情報処理におけるその要件を含むアプリケーションのために複製された可能性があるため、大きなシステム内で絡み合いを発生させる物理過程を研究するのが有用である。
絡み合いの発生を最大化するための道のりは、情報スクランブルの現象、すなわち、システム全体を通して初期局所化された情報の転送に依存することである。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:25:03 GMT)
CLIP Embeddings for AI-Generated Image Detection: A Few-Shot Study with Lightweight Classifier [0.0] この研究は、CLIP埋め込みが本質的にAI生成の指標情報を含んでいるかどうかを調査する。
パブリックなCIFAKEベンチマークの実験では、言語推論なしで95%の精度で性能が向上した。
広角写真や油絵などの特定の画像タイプは、分類に重大な課題をもたらす。
論文参考訳(メタデータ) (Thu, 15 May 2025 19:14:39 GMT)
Batched Nonparametric Bandits via k-Nearest Neighbor UCB [0.0] バッチ化された非パラメトリックな文脈的包帯における逐次的意思決定について検討する。
適応的k-アネレスト近傍(k-NN)回帰と上位信頼境界(UCB)の原理を組み合わせた非パラメトリックアルゴリズムを提案する。
提案手法であるBaNk-UCBは完全に非パラメトリックであり,コンテキスト次元に適応し,実装が簡単である。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:00:51 GMT)
BINGO: A Novel Pruning Mechanism to Reduce the Size of Neural Networks [0.0] 反復等級プルーニング(英語版)のようなモデルのプルークに使用される現在の手法は、非常に正確であるが、信じられないほど計算的かつ環境的に課税される反復的な訓練シーケンスを必要とする。
BINGOは、現在の方法よりも計算集約性が低い精度保存プルーニング技術を提供しており、AIの成長がモデルの成長を意味する必要がない世界も実現している。
論文参考訳(メタデータ) (Thu, 15 May 2025 00:00:19 GMT)
AutoPentest: Enhancing Vulnerability Management With Autonomous LLM Agents [0.0] 我々は,高い自律性でブラックボックス浸透試験を行うアプリケーションであるAutoPentestを提案する。
本稿では,ChatGPT-4oユーザインタフェースを手動で使用するベースラインアプローチとAutoPentestの実装を比較した。
どちらのアプローチも、HTBマシンのサブタスクの15~25パーセントを完了でき、AutoPentestはChatGPTをわずかに上回っている。
論文参考訳(メタデータ) (Thu, 15 May 2025 14:06:00 GMT)
AttentionGuard: Transformer-based Misbehavior Detection for Secure Vehicular Platoons [0.0] 車両小隊は、認証されたインサイダーによる高度なファルシフィケーション攻撃に対して脆弱である。
本稿では,誤動作検出のためのトランスフォーマーベースのフレームワークであるAttentionGuardを紹介する。
我々は,AttentionGuardが攻撃検出において最大0.95F1スコアを達成することを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 13:24:09 GMT)
Assessing the Quality of AI-Generated Clinical Notes: A Validated Evaluation of a Large Language Model Scribe [0.0] 本研究は,大言語モデル(LLM)が生成した臨床成績と,音声記録による臨床経験に基づくフィールドエキスパートの成績を比較検討した。
物理文書品質測定器(PDQI9)の定量測定は、音質を測定するためのフレームワークを提供した。
金の紙幣は5点中4.25点、アンビエント紙幣は5点中4.20点だった。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:14:53 GMT)
Assessing GPT's Bias Towards Stigmatized Social Groups: An Intersectional Case Study on Nationality Prejudice and Psychophobia [0.0] 近年の研究では、基礎的大規模言語モデル(LLM)において、特定の国籍や差別化された社会集団に対する顕著な偏見が浮き彫りになっている。
本研究は,広範に使用されているGPT-3.5/4/4o LLMSの出力と交差するこれらのバイアスの倫理的意味を考察する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:45:41 GMT)
Approximated Behavioral Metric-based State Projection for Federated Reinforcement Learning [0.0] フェデレート強化学習(FRL)法は通常、暗号化されたローカル状態またはポリシー情報を共有する。
本稿では, 動作距離に基づく状態予測関数の共有がFRLの性能向上の有望な方法であることを示す。
我々はFRLフレームワークであるFedRAGを導入し、各クライアントの状態の実用的なプロジェクション関数を計算的に学習する。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:41:21 GMT)
Application of YOLOv8 in monocular downward multiple Car Target detection [0.0] 本稿では,YOLOv8に基づく自律目標検出ネットワークの改良について述べる。
提案手法は,マルチスケール,小型,遠隔オブジェクトの高精度かつ高精度な検出を実現する。
実験結果から,大小の物体を65%の精度で効果的に検出できることが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 06:58:45 GMT)
An empirical study of task and feature correlations in the reuse of pre-trained models [0.0] トレーニング済みのニューラルネットワークは、マシンラーニングコミュニティで一般的に使われ、再利用されている。
本稿では,ボブの経験的成功に寄与する要因をシリコで研究できる実験装置を提案する。
我々は,AliceとAliceのタスクの間に意味的相関がある場合,BobがAliceの事前学習ネットワークを効果的に再利用できる実世界のシナリオを示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 22:51:27 GMT)
An Exponential Averaging Process with Strong Convergence Properties [0.0] あるシナリオでは、ランダムな力学系の軌道に沿ってなされた観測が特に興味深い。
このようなシナリオに対する一般的な平滑化手法の1つは指数的移動平均化(EMA)であり、これは観測結果をその年齢で指数関数的に減少する重みを割り当てるものである。
しかし、EMAは、最も若い観測に割り当てられた重量が時間とともに一定であるという事実から、強い収束特性を享受できない。
我々はEMAへの適応を$p$-EMAと呼び、最後に割り当てられた重みは低調波速度でゼロに減少する。
論文参考訳(メタデータ) (Thu, 15 May 2025 16:19:58 GMT)
All You Need Is Synthetic Task Augmentation [0.0] 本研究では,1つのグラフトランスフォーマーニューラルネットワークを,スパースマルチタスク分子特性実験ターゲットと合成ターゲットの両方で協調的にトレーニングする新しい手法を提案する。
その結果,19の分子特性予測タスクにおいて,一貫した,重要な性能向上が得られた。
論文参考訳(メタデータ) (Thu, 15 May 2025 09:46:27 GMT)
Aggregating Concepts of Accuracy and Fairness in Prediction Algorithms [0.0] 精度と公平度を線形に組み合わせて、予測アルゴリズムの全てを考慮に入れた値を測定するには、十分な理由がある、と私は論じる。
AngwinらによってコンパイルされたCompASデータセットを用いて、精度・公正トレードオフの分析に私の結果を適用します。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:19:18 GMT)
Agent Name Service (ANS): A Universal Directory for Secure AI Agent Discovery and Interoperability [0.0] AIエージェントの増殖には、安全な発見のための堅牢なメカニズムが必要である。
本稿では,公開エージェント発見フレームワークの欠如に対処するDNSに基づく新しいアーキテクチャであるAgent Name Service(ANS)を紹介する。
論文参考訳(メタデータ) (Thu, 15 May 2025 17:49:36 GMT)
Advancements in Entangled Photon Pairs in 2D Van der Waals Materials for On-chip Quantum Applications [0.0] この論文は、2D van der Waals (vdW) 材料における絡み合った光子対の生成における最近のブレークスルーを強調している。
量子技術の適用性とオンチップ統合技術に重点を置いている。
レビューでは、この分野の進展に向けた現在の制限と今後の展望についても概説している。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:00:19 GMT)
Advanced Crash Causation Analysis for Freeway Safety: A Large Language Model Approach to Identifying Key Contributing Factors [0.0] 本研究は,大規模言語モデル(LLM)を利用して高速道路の事故データを解析し,それに応じて事故原因分析を行う。
微調整されたLlama3 8Bモデルは、ゼロショット分類によって事前にラベル付けされたデータなしでクラッシュ因果を識別するために使用された。
その結果, LLMはアルコール欠乏運転, スピード, 積極的運転, 運転不注意などの事故原因を効果的に同定できることが示唆された。
論文参考訳(メタデータ) (Thu, 15 May 2025 04:07:55 GMT)
A Survey of Learning-Based Intrusion Detection Systems for In-Vehicle Network [0.0] コネクテッド・アンド・オートマチック・ビークルズ(CAV)はモビリティを高めるが、サイバーセキュリティの脅威に直面している。
サイバー攻撃は、重要なシステムに対する制御の喪失を含む、接続された車両に壊滅的な結果をもたらす可能性がある。
In-vehicle Intrusion Detection Systems (IDSs) は、悪意のあるアクティビティをリアルタイムで検出することで、有望なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 12:38:59 GMT)
A Stable Measure for Conditional Periodicity of Time Series using Persistent Homology [0.0] 一対の時系列を与えられた場合、一方の周期性が他方の周期性にどのように影響するかを研究する。
我々は、別のf2が与えられた1つの時系列 f1 の周期性を定量化する条件付き周期スコア(f1|f2)を提案する。
我々は、我々の類似度尺度を、最も類似の統計測度であるクロスレカレンスと実験的に比較した。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:48:03 GMT)
A Practical Cross-Platform, Multi-Algorithm Study of Quantum Optimisation for Configurational Analysis of Materials [0.0] 材料構成解析のよく研究された問題,具体的には欠陥グラフェン構造の最低エネルギー構成を見つけることを考える。
この問題は、擬似非制約二項最適化問題に適用可能な様々なアルゴリズムを研究できるテストケースとして機能する。
完全接続QUBOを最大7,200ドル(約7,800円)で解くために量子的手法を用いており、これ以上のアルゴリズム性能はデバイス接続性、ノイズ、古典的な時間オーバーヘッドによって制限されている。
論文参考訳(メタデータ) (Thu, 15 May 2025 15:25:49 GMT)
A Novel Mathematical Framework for Objective Characterization of Ideas [0.0] 本研究では,CAIシステムや人間によって生み出されるアイデアの多元性を客観的に評価するための,自動解析のための包括的数学的枠組みを提案する。
UMAP,DBSCAN,PCAなどのツールを用いて,アイデアを高次元ベクトルに変換し,それらの多様性を定量的に測定することにより,提案手法は最も有望なアイデアを選択する信頼性と客観的な方法を提供する。
論文参考訳(メタデータ) (Thu, 15 May 2025 18:53:26 GMT)
A Comprehensive Machine Learning Framework for Heart Disease Prediction: Performance Evaluation and Future Perspectives [0.0] 本研究では,心臓病予測のための機械学習ベースのフレームワークを提案する。
提案モデルでは, 心疾患を効果的に予測し, 臨床的意思決定を支援する可能性を示す。
論文参考訳(メタデータ) (Thu, 15 May 2025 05:13:38 GMT)