Fugu-MT: arxivの論文翻訳(概要)

PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild [167.7]
本報告では,CVPR 2025と共同で開催されている第4回PVUWチャレンジについて概観する。課題は、複雑なシーンビデオオブジェクトセグメンテーションに焦点を当てたMOSEと、モーションガイドによる言語ベースのビデオセグメンテーションをターゲットとするMeViSの2つのトラックである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:02:47 GMT)
Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models [164.5]
ネモトロン-Hは8Bと56B/47Bハイブリッド・マンバ・トランスフォーマーのファミリーである。私たちは共通のTransformerモデルアーキテクチャにおけるほとんどの自己注意レイヤをMambaレイヤに置き換えます。 Nemotron-Hモデルは、他の同様のサイズのオープンソーストランスフォーマーモデルと比較して、精度が良いか低いかのどちらかを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:36:01 GMT)
InternVL3: Exploring Advanced Training and Test-Time Recipes for Open-Source Multimodal Models [137.7]
InternVL3は、ネイティブなマルチモーダル事前学習パラダイムを備えたInternVLシリーズの重要な進歩である。特に、InternVL3-78B は MMMU ベンチマークで72.2 のスコアを獲得し、オープンソースの MLLM に新しい最先端技術を設定する。オープンサイエンスの原則を追求するため、我々は、次世代MLLMのさらなる研究・開発を促進するために、トレーニングデータとモデルウェイトの両方を公開します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:50:27 GMT)
SimpleAR: Pushing the Frontier of Autoregressive Visual Generation through Pretraining, SFT, and RL [112.9]
この作業は、複雑な古風な修正を伴わない、バニラ自動回帰視覚生成フレームワークであるSimpleARを提示する。我々は,高忠実度1024×1024解像度画像を生成し,テキスト・ツー・イメージ・ベンチマークで競合する結果が得られることを示した。これらの発見を共有し、コードをオープンソース化することによって、自己回帰的な視覚生成の可能性を明らかにしたいと考えています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:59:46 GMT)
PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm [111.2]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。 PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:03:46 GMT)
DataSentinel: A Game-Theoretic Detection of Prompt Injection Attacks [101.5]
LLM統合されたアプリケーションとエージェントは、インジェクション攻撃に弱い。検出方法は、入力が注入プロンプトによって汚染されているかどうかを判定することを目的とする。本研究では,迅速なインジェクション攻撃を検出するゲーム理論手法であるDataSentinelを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:26:21 GMT)
A Dual-Space Framework for General Knowledge Distillation of Large Language Models [98.7]
知識蒸留(KD)は、より小さなモデルに知識を移すことによって、大きな言語モデル(LLM)を圧縮する有望なソリューションである。現在のWhite-box KDフレームワークには2つの制限がある。我々は,教師の予測ヘッドとKDの学生モデルを統合する,二空間知識蒸留(DSKD)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:38:47 GMT)
R-TPT: Improving Adversarial Robustness of Vision-Language Models through Test-Time Prompt Tuning [97.5]
視覚言語モデル(VLM)のためのロバストテスト時プロンプトチューニング(R-TPT)を提案する。 R-TPTは、推論段階における敵攻撃の影響を緩和する。プラグアンドプレイの信頼性に基づく重み付きアンサンブル戦略を導入し,防御強化を図る。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:49:31 GMT)
DeepMath-103K: A Large-Scale, Challenging, Decontaminated, and Verifiable Mathematical Dataset for Advancing Reasoning [95.3]
DeepMath-103Kは、約103Kの数学的問題からなる新しい大規模データセットである。各問題は、ルールベースのRLを可能にする検証可能な最終回答を含む。我々は、DeepMath-103Kでトレーニングされたモデルが、挑戦的な数学的ベンチマークにおいて大幅に改善されることを実証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:59:51 GMT)
LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation [94.8]
LangTrajは、トラフィックシナリオにおけるすべてのエージェントの共同動作をシミュレートする、言語条件のシーン拡散モデルである。自然言語入力を条件付けすることで、LangTrajはインタラクティブな振る舞いを柔軟かつ直感的に制御できる。 LangTraj氏は、リアリズム、言語制御性、言語条件の安全クリティカルなシミュレーションにおいて、強力なパフォーマンスを示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:14:06 GMT)
Kimi-VL Technical Report [88.8]
Kimi-VLは視覚言語モデル(VLM)であり、高度なマルチモーダル推論、長いコンテキスト理解、強力なエージェント能力を提供する。汎用 VLM として、Kimi-VL はマルチターンエージェントタスク(OSWorld など)に優れ、旗艦モデルと一致する。 Kimi-VLをベースとして、Kim-VL-Thinkingという先進的なロングシンキングモデルを導入する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:14:37 GMT)
CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.8]
本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:30:26 GMT)
LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving [84.3]
この作業では、複雑な自律運転シナリオの意思決定コンポーネントとして、Large Language Models(LLM)を採用している。大規模実験により,提案手法は単車載タスクのベースラインアプローチを一貫して超えるだけでなく,複数車載コーディネートにおいても複雑な運転動作の処理にも有効であることが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:45:30 GMT)
Retro-Search: Exploring Untaken Paths for Deeper and Efficient Reasoning [84.3]
MCTSにインスパイアされた検索アルゴリズムであるRetro-Searchを導入し,大規模モデルから高品質な推論経路を抽出する。 Retro-Searchは、より良い、しかし短いトレースを見つけるための推論パスをふりかえりに修正する。当社のアプローチでは,モデルが独自のRetro-Search-edトレースに基づいて微調整される自己改善と,弱いから強い改善の2つのユースケースを実現しています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:07:31 GMT)
Deep Learning in Concealed Dense Prediction [83.9]
本稿では,農業,産業等において大きな価値を持つ,複雑な課題のファミリーであるCDP(Concealed Dense Prediction)を紹介し,レビューする。 CDPの本質的な特徴は、ターゲットが周囲に隠されているため、それらを完全に知覚するには、きめ細かい表現、事前の知識、補助的推論などが必要であることである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:44:42 GMT)
ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation [83.6]
本稿では,長期ビデオ生成のための自己回帰モデルを用いた拡散変換器を高速化するフレームワークARLONを提案する。潜在ベクトル量子変分オートコーダ(VQ-VAE)は、DiTモデルの入力潜時空間をコンパクトなビジュアルトークンに圧縮する。適応ノルムベースのセマンティックインジェクションモジュールは、ARモデルから粗い離散視覚ユニットをDiTモデルに統合する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:06:28 GMT)
3DAffordSplat: Efficient Affordance Reasoning with 3D Gaussians [82.7]
人間の指示を3Dオブジェクトの機能領域に関連付けるためには,3D割当推論が不可欠である。 3DAffordSplatは3DGSベースの価格推論に適した,最初の大規模マルチモーダルデータセットである。 AffordSplatNetは,3DGS表現を用いた割当推論に特化して設計された新しいモデルである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:21:47 GMT)
X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents [80.7]
X-Teamingは、一見無害な相互作用が有害な結果へとエスカレートし、対応する攻撃シナリオを生成するフレームワークである。 X-Teamingは最新のClaude 3.7 Sonnetモデルに対して96.2%の攻撃成功率を達成した。 XGuard-Trainは、オープンソースのマルチターン安全トレーニングデータセットで、前回のベストリソースの20倍大きい。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:11:28 GMT)
Do "New Snow Tablets" Contain Snow? Large Language Models Over-Rely on Names to Identify Ingredients of Chinese Drugs [79.0]
伝統的な中国医学(TCM)は医療に採用され、臨床応用をサポートするために、LLM(Large Language Models)が出現している。これらのモデルの基本的な要件は、TCM薬物成分の正確な同定である。我々の系統的分析では、一貫した障害パターンが明らかである: モデルでは、しばしば文字通り、薬物名を理解し、関連性に関係なく共通のハーブを過剰に使用し、不慣れな定式化に直面した時に不規則な振る舞いを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:51:02 GMT)
PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.0]
領域一般化(DG)は、最近、点雲分類の一般化性を改善するために研究されている。本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:31:03 GMT)
SpoofCeleb: Speech Deepfake Detection and SASV In The Wild [76.7]
SpoofCelebは、音声ディープフェイク検出(SDD)とスポフィングロバスト自動話者検証(SASV)のために設計されたデータセットである。 SpoofCelebは、1,251人のユニークな話者による250万以上の発話で構成され、自然界の状況下で収集されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:53:00 GMT)
Looking beyond the next token [75.0]
トレーニングデータシーケンスの再構成と処理により、モデルが真のデータ生成プロセスをより正確に模倣できるようになる、と我々は主張する。本手法は, 長期的目標を追加費用なしで自然に生成することを可能にした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:09:06 GMT)
LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews [74.9]
この研究は、微粒な遅延思考カテゴリで注釈付けされたピアレビュー文のデータセットであるLazyReviewを紹介している。大規模言語モデル(LLM)は、ゼロショット設定でこれらのインスタンスを検出するのに苦労する。命令ベースのデータセットの微調整により、パフォーマンスが10～20ポイント向上する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:07:33 GMT)
TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization With Estimated Weights [73.9]
本稿では,TIS-DPO と呼ばれるトークン単位の重要度サンプリング DPO の目的について,その報酬に基づいて各トークンに重要度を割り当てる手法を提案する。 TIS-DPOは、無害性、有用性アライメントおよび要約タスクにおいて、様々なベースライン手法を著しく上回っている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:59:54 GMT)
An Efficient and Mixed Heterogeneous Model for Image Restoration [71.9]
現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:19:12 GMT)
70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float [71.4]
大規模言語モデル(LLM)は急速に規模を拡大し、リソース制約のあるハードウェアに効率的なデプロイを行う上での課題を生み出している。圧縮フレームワークであるDynamic-Length Float (DFloat11)を導入し、LLMのサイズを30%削減し、元のモデルと同じビット対ビットの出力を保存する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:38:38 GMT)
Zero-Shot Whole-Body Humanoid Control via Behavioral Foundation Models [71.3]
教師なし強化学習(RL)は、複雑な環境下で幅広い下流タスクを解くことができる事前学習エージェントを目標としている。本稿では,ラベルのない行動データセットからトラジェクトリを模倣するための,教師なしRLの正規化アルゴリズムを提案する。我々は,この手法の有効性を,挑戦的なヒューマノイド制御問題において実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:41:11 GMT)
PARTFIELD: Learning 3D Feature Fields for Part Segmentation and Beyond [71.0]
PartFieldは、パートベースの3D機能を学ぶためのフィードフォワードアプローチである。 PartFieldは、他のクラスに依存しない部分分割方法よりも最大20%正確で、多くの場合、桁違いに高速です。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:58:16 GMT)
Can Learned Optimization Make Reinforcement Learning Less Difficult? [70.5]
学習の最適化が強化学習の難しさを克服するのに役立つかどうかを検討する。本稿では, 塑性, 探索および非定常性のための学習最適化手法(OPEN)を用いて, 入力特性と出力構造がこれらの困難に対して予め提案された情報によって通知される更新規則をメタラーニングする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:07:30 GMT)
Elucidating the Design Space of Multimodal Protein Language Models [69.5]
マルチモーダルタンパク質言語モデル(PLM)は、シーケンスとトークンに基づく構造情報を統合する。本稿では,マルチモーダルPLMの設計空間を体系的に解明し,その限界を克服する。我々の進歩はよりきめ細かな監督にアプローチし、トークンベースのマルチモーダルPLMが堅牢な構造モデリングを実現することを実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:59:43 GMT)
Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.3]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:15:08 GMT)
Yes, Q-learning Helps Offline In-Context RL [69.3]
RL目標の最適化は,広く確立されたアルゴリズム蒸留(AD)ベースラインと比較して,平均で約40%向上することを示す。また、オフラインのRLベースの手法は、オフラインのシナリオに特化して設計されていないオンラインアプローチよりも優れていることも明らかにした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:18:00 GMT)
Automated Proof Generation for Rust Code via Self-Evolution [69.3]
私たちは、Rustコードの自動証明生成を可能にする、人書きスニペットの欠如を克服するフレームワークであるSAFEを紹介します。 SAFEは、細調整されたモデルの自己老化能力を訓練するために、多数の合成不正確な証明を再利用する。我々は、人間の専門家によるベンチマークで52.52%の精度で達成し、GPT-4oのパフォーマンス14.39%を大きく上回った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:39:09 GMT)
A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce [69.0]
我々はGRPOを強化的なアルゴリズムの観点から再検討し、そのコアコンポーネントを分析する。単純な拒絶サンプリングベースラインであるRAFTは,GRPOやPPOよりも競争性能が高いことがわかった。この知見に触発されて、完全に正しくないサンプルと完全に正しいサンプルの両方をフィルタリングするポリシー勾配の最小限の拡張であるReinforce-Rejを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:15:02 GMT)
Everybody Prune Now: Structured Pruning of LLMs with only Forward Passes [68.9]
バックプロパゲーションの不要な勾配のない構造化プルーニング手法であるBonsaiを紹介する。ボンサイは少ないリソースでより良い圧縮を実現するが、セミ構造化プルーニングによって生成されるモデルよりも2倍高速なモデルも生成する。この結果から,バックプロップを必要条件として取り除くことで,最先端の効率性と性能が向上する可能性が示唆された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:24:22 GMT)
System-1.x: Learning to Balance Fast and Slow Planning with Language Models [68.8]
言語モデルは、2つの異なるモードで長期計画問題の解決に使用できる。高速な 'System-1' モード、明示的な検索やバックトラックなしで直接計画を生成する、遅い 'System-2' モード、ステップバイステップの計画。 LLMを用いた制御可能な計画フレームワークであるSystem-1.x Plannerを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:41:17 GMT)
Omni$^2$: Unifying Omnidirectional Image Generation and Editing in an Omni Model [68.2]
約360ドルで全方位画像(ODI)が注目されており、様々なバーチャルリアリティ(VR)や拡張現実(AR)アプリケーションで広く利用されている。我々は,テキストバウンサーラインOmniの方向性画像生成と編集のためのテキストバウンサーラインOmniモデルを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:53:11 GMT)
DataDecide: How to Predict Best Pretraining Data with Small Experiments [68.0]
私たちはDataDecideのモデル、データ、評価を公開しています。最大100Bトークン,最大1Bパラメータのモデルサイズ,および3つのランダムシードを用いて,25コーパスにわたる事前学習実験を行った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:02:15 GMT)
Reinforcing Compositional Retrieval: Retrieving Step-by-Step for Composing Informative Contexts [67.7]
大規模言語モデル(LLM)は、多くのタスクにまたがる顕著な機能を示してきたが、複雑なタスクを扱うために外部のコンテキストに依存していることが多い。我々は、このプロセスをマルコフ決定プロセス(MDP)としてモデル化するトリエンコーダシーケンシャルレトリバーを提案する。提案手法は,サンプル間の依存関係を明示的にモデル化することの重要性を強調し,ベースラインを一貫して大幅に上回ることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:35:56 GMT)
Bipartite Ranking From Multiple Labels: On Loss Versus Label Aggregation [66.3]
両部ランク付けは基本的な教師付き学習問題であり、ROC曲線(英語版)(AUC)の下で最大領域を持つインスタンスのランク付けを1つのバイナリターゲットラベルに対して学習することを目的としている。このようなラベルを1つのコヒーレントなランキングにどうやって合成できるのか? 本研究では,ベイズ最適解を特徴付けることにより,損失集約とラベル集約という2つの手法を解析する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:25:27 GMT)
LLM$\times$MapReduce-V2: Entropy-Driven Convolutional Test-Time Scaling for Generating Long-Form Articles from Extremely Long Resources [65.4]
ロングフォーム生成は、幅広い実用用途に欠かせない。短期から長期の世代は注目されているが、極端に長い資源から長いテキストを生成することは、比較的過小評価されている。 LLM$times$MapReduce-V2は,大規模言語モデルによる極めて長い入力処理能力の向上を目的とした,新しいテスト時間スケーリング戦略である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:28:58 GMT)
When is Task Vector Provably Effective for Model Editing? A Generalization Analysis of Nonlinear Transformers [64.2]
タスク算術は、タスクベクトルの重み付き和を追加することで、事前訓練されたモデルを編集することを指す。本稿では,非関連タスクと非関連タスクのセットを同時に学習する上で,タスク追加の有効性を理論的に証明する。ドメイン外タスクの否定を実現するために,タスク演算の適切な選択を証明した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:04:39 GMT)
Adversarial Prompt Distillation for Vision-Language Models [63.2]
Adversarial Prompt Tuning (APT) は、迅速なチューニングの過程において、相手のトレーニングを適用する。 APDは、マルチモーダルな知識伝達と統合してAPTを強化するバイモーダルな知識蒸留フレームワークである。複数のベンチマークデータセットに対する大規模な実験は、現在最先端のAPT法よりもAPD法の方が優れていることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:57:20 GMT)
NEMOTRON-CROSSTHINK: Scaling Self-Learning beyond Math Reasoning [62.9]
大規模言語モデル(LLM)は、特に強化学習(RL)を通じて強化された場合、強力な推論能力を示している。 NEMOTRON-CROSSTHINKは、多領域コーパスを体系的に組み込んだフレームワークであり、合成および実世界の問合せ対を含む。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:37:13 GMT)
Seedream 3.0 Technical Report [62.9]
Seedream 3.0は、高性能な中国語と英語のバイリンガル画像生成基盤モデルである。 Seedream 2.0の既存の課題に対処するために、いくつかの技術的改善を開発しています。 Seedream 3.0はネイティブな高解像度の出力(最大2K)を提供し、高画質の画像を生成する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:19:07 GMT)
DeepMLF: Multimodal language model with learnable tokens for deep fusion in sentiment analysis [62.3]
DeepMLFは、深層融合に適した学習可能なトークンを持つ新しいマルチモーダル言語モデルである。以上の結果から,より深層核融合により,既存のアプローチよりも優れた核融合深度 (5-7) が得られることが確認された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:28:02 GMT)
FEAT: Free energy Estimators with Adaptive Transport [61.9]
自由エネルギー推定のための新しいフレームワークである適応輸送を用いた自由エネルギー推定器(FEAT)を提案する。 FEATは、インターポーラントを介して実装された学習された輸送を、自由エネルギー差の変分上と下の境界とともに活用する。おもちゃの例、分子シミュレーション、量子場理論に関する実験的検証は、既存の学習法よりも改善されていることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:16:18 GMT)
Understanding LLMs' Cross-Lingual Context Retrieval: How Good It Is And Where It Comes From [61.6]
12言語にわたる40以上の大言語モデル(LLM)の言語間コンテキスト検索能力を評価する。いくつかの小さな訓練後のオープンLLMは、強い言語間コンテキスト検索能力を示している。また, 大規模プレトレーニングでは, xMRCの性能が向上することが示唆された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:35:27 GMT)
ViMo: A Generative Visual GUI World Model for App Agent [60.3]
ViMoは、将来のApp観測をイメージとして生成するために設計されたビジュアルワールドモデルである。本稿では,シンボルプレースホルダーによるテキストコンテンツをオーバーレイする新しいデータ表現であるシンボリックテキスト表現を提案する。この設計では、将来のGUIのグラフィックスを予測するSTR Predictorと、対応するテキストを生成するGUI-text Predictorが使用されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:03:10 GMT)
VideoPanda: Video Panoramic Diffusion with Multi-view Attention [57.9]
高解像度パノラマビデオコンテンツはバーチャルリアリティーにおける没入的な体験にとって最重要であるが、特殊な機器や複雑なカメラのセットアップを必要とするため、収集は容易ではない。 VideoPandaはテキストのみとシングルビューのビデオという2つの条件を使って共同で訓練されている。実世界のビデオデータセットと合成ビデオデータセットの両方に対する大規模な評価は、VideoPandaがより現実的で一貫性のある360$circ$ panoramasを生成することを示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:58:15 GMT)
MM-Eureka: Exploring the Frontiers of Multimodal Reasoning with Rule-based Reinforcement Learning [55.8]
MMK12データセットとMM-EUREKAを7B,32Bパラメータで導入する。前者は、人間の検証された答えと解法を含む多様な知識領域を特徴とする高品質なマルチモーダル数学推論データセットである。後者は,オンラインフィルタリングを利用したルールベース強化学習と,トレーニング安定性を高めるための2段階トレーニング戦略を用いたマルチモーダルモデルである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:22:45 GMT)
S$^2$Teacher: Step-by-step Teacher for Sparsely Annotated Oriented Object Detection [55.3]
部分的なインスタンスのみをラベル付けするSAOOD(sparsely annotated object detection)という新しい設定を導入する。具体的には,(1)前景表現に過度に適合するスパースラベリング,(2)未ラベルオブジェクト(偽陰性)が特徴学習を混乱させる,という2つの課題に焦点をあてる。そこで本稿では,S$2$Teacherを提案する。S$2$Teacherは,非ラベルオブジェクトの擬似ラベルを,手軽から硬まで段階的にマイニングし,前景表現を強化する手法である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:57:00 GMT)
Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute [55.3]
本稿では,テスト時間計算のスケールアップによるLCM性能向上のための,シンプルで効果的で費用効率のよい手法を提案する。当社の戦略は,複数のモデルを組み込んで,補完的な強みを活用するという,新たなツイストによって,繰り返しサンプリングされる投票フレームワークを基盤としています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:58:14 GMT)
AI threats to national security can be countered through an incident regime [55.2]
我々は、AIシステムからの潜在的な国家安全保障脅威に対抗することを目的とした、法的に義務付けられたポストデプロイAIインシデントシステムを提案する。提案したAIインシデント体制は,3段階に分けられる。第1フェーズは,‘AIインシデント’とみなすような,新たな運用方法を中心に展開される。第2フェーズと第3フェーズでは、AIプロバイダが政府機関にインシデントを通知し、政府機関がAIプロバイダのセキュリティおよび安全手順の修正に関与するべきだ、と説明されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:13:33 GMT)
Efficient Hybrid Language Model Compression through Group-Aware SSM Pruning [54.6]
注意と状態空間モデル(SSM)を組み合わせたハイブリッドアーキテクチャは、最先端の精度と実行時のパフォーマンスを達成する。近年の研究では、アテンションのみのモデルに圧縮と蒸留を適用することで、トレーニングコストのごく一部でより小さく、より正確なモデルが得られることが示されている。本稿では,SSMブロックの構造的整合性とそのシーケンスモデリング機能を維持するグループ対応プルーニング戦略を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:26:29 GMT)
Know Where You're Uncertain When Planning with Multimodal Foundation Models: A Formal Framework [54.4]
認識と計画生成の不確実性を解消し、定量化し、緩和する包括的枠組みを提案する。本稿では,知覚と意思決定の独特な性質に合わせた手法を提案する。この不確実性分散フレームワークは, 変動率を最大40%削減し, タスク成功率をベースラインに比べて5%向上させることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:37:07 GMT)
Relative Representations: Topological and Geometric Perspectives [53.9]
相対表現はゼロショットモデルの縫合に対する確立されたアプローチである。相対変換において正規化手順を導入し、非等方的再スケーリングや置換に不変となる。第二に、クラス内のクラスタリングを促進するトポロジカル正規化損失である、微調整された相対表現におけるトポロジカルデシフィケーションの展開を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:37:37 GMT)
Efficient Reasoning Models: A Survey [53.0]
本調査は,近年の効率的な推論の進歩を包括的に概観することを目的としている。 1)短い圧縮CoTを簡潔で効果的な推論チェーンに、(2)より小さい - 強力な推論能力を持つコンパクトな言語モデルを開発する、(3)より高速に、という3つの重要な方向性に分類する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:28:00 GMT)
IlluSign: Illustrating Sign Language Videos by Leveraging the Attention Mechanism [52.6]
本研究は,手話映像を静的なイラストレーションに変換することを目的としている。本稿では,画像の意味的側面と幾何学的側面の両方を理解するための生成モデルの能力を活用することで,手話映像を描写する手法を提案する。我々のアプローチは,手話の映像にイラストのようなスケッチを移すことに重点を置いており,サインの開始フレームと終了フレームを1つのイラストに組み合わせている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:53:32 GMT)
Cross-Frequency Implicit Neural Representation with Self-Evolving Parameters [52.6]
Inlicit Neural representation (INR) は視覚データ表現の強力なパラダイムとして登場した。本研究では,データを4つの周波数成分に分離し,ウェーブレット空間でINRを用いるHaar Wavelet変換(CF-INR)を用いた自己進化型クロス周波数INRを提案する。 CF-INRは画像の回帰, 塗装, 装飾, 雲の除去など, 様々な視覚的データ表現および回復タスクで評価される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:14:35 GMT)
Leveraging Submodule Linearity Enhances Task Arithmetic Performance in LLMs [51.1]
近年の研究では、線形性を示すモデルがタスク演算の性能を向上させることが示されている。我々は、この線型性はモデルの部分加群の中にすでに存在すると論じる。我々はこれらのサブモジュールを独立にマージする革新的なモデルマージ戦略を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:23:24 GMT)
RankAlign: A Ranking View of the Generator-Validator Gap in Large Language Models [51.1]
我々は,モデルが生成した解答と,その解答の検証,ジェネレータとバリケータのギャップとの相違について考察する。この測定結果から,質問応答,語彙意味論タスク,次の単語予測など,さまざまな設定に大きなギャップがあることが分かる。次にランキングベースのトレーニング手法である RankAlign を提案し、そのギャップを平均で 31.8% に拡大し、すべてのベースライン手法を上回ります。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:53:31 GMT)
PaMi-VDPO: Mitigating Video Hallucinations by Prompt-Aware Multi-Instance Video Preference Learning [50.8]
ビデオマルチモーダル大言語モデル(VLLM)における幻覚の低減を支援する直接選好最適化(DPO) 本稿では、嗜好アノテーションの不要なオンライン嗜好学習フレームワークであるVDPO(Video Direct Preference Optimization)を提案する。本稿では,Prompt-aware Multi-instance Learning VDPOを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:20:46 GMT)
PuzzleBench: A Fully Dynamic Evaluation Framework for Large Multimodal Models on Puzzle Solving [50.5]
我々は、OVPG(Open-ended Visual Puzzle Generation)という、完全に動的なマルチモーダル評価フレームワークを提案する。 OVPGは、パズル解決タスクにおいて、新しく、多様性があり、検証可能な評価データを自動的に生成することを目的としている。 OVPG上に構築されたPuzzleBenchは11,840のVQAサンプルからなる動的でスケーラブルなベンチマークである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:29:31 GMT)
Crane: Context-Guided Prompt Learning and Attention Refinement for Zero-Shot Anomaly Detections [50.3]
異常検出(AD)は、通常のデータ分布から逸脱を識別する。本稿では,視覚エンコーダから抽出した画像コンテキストに基づいて,テキストエンコーダのプロンプトを条件付ける手法を提案する。提案手法は,14のデータセットにおいて,各メトリクスに対して2%から29%の性能向上を実現している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:42:25 GMT)
Real-world Image Dehazing with Coherence-based Pseudo Labeling and Cooperative Unfolding Network [50.3]
実世界のイメージデハジングは、実世界の設定におけるヘイズによる劣化を軽減することを目的としている。本研究では,大気散乱と画像シーンを協調的にモデル化する,協調的展開ネットワークを提案する。また,コヒーレンスに基づくラベルジェネレータと呼ばれるRID指向の反復型平均教師フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:18:18 GMT)
Work Statistics and Quantum Trajectories: No-Click Limit and non-Hermitian Hamiltonians [50.2]
本稿では,連続監視量子システムにおける量子作業統計の枠組みについて述べる。我々のアプローチは自然に量子ジャンププロセスから生じる非エルミート力学を取り入れている。局所スピンモニタリング下での一次元横フィールドイジングモデルを解析することにより,我々の理論的枠組みを説明する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:21:58 GMT)
Contextual AD Narration with Interleaved Multimodal Sequence [50.2]
このタスクは、視覚障害者が映画のような長めのビデオコンテンツにアクセスするのを助けるために、視覚障害者のための視覚要素の記述を作成することを目的としている。ビデオ機能、テキスト、文字バンク、コンテキスト情報を入力として、生成されたADは名前で文字に対応することができる。我々は、ADを生成するためのシンプルで統一されたフレームワークを通じて、事前訓練された基礎モデルを活用することを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:30:02 GMT)
Recognition of Geometrical Shapes by Dictionary Learning [49.3]
形状認識のための辞書学習を初めて行う方法を提案する。基礎となる最適化手法の選択は、認識品質に大きな影響を及ぼす。実験結果から,辞書学習は形状認識タスクの興味深い方法である可能性が確認された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:05:16 GMT)
Global restrictions under local state discrimination [49.2]
局所的な識別性は、二粒子状態のグローバルな性質を制限することができる。グローバルな行動を制限する強力なツールとなり得ることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:20:10 GMT)
Dynamical Casimir effect in superconducting cavities: from photon generation to universal quantum gates [49.2]
第1章は、動的カシミール効果(DCE)の様々な側面と、回路量子電磁力学(cQED)の文脈におけるその意味を探求する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:28:00 GMT)
OmniVDiff: Omni Controllable Video Diffusion for Generation and Understanding [48.4]
単一拡散モデルを用いて複数の映像コンテンツを合成し,理解することを目的とした,制御可能なビデオ拡散のための新しいフレームワークOmniVDiffを提案する。我々のモデルは,テキスト条件付きビデオ生成,ビデオ理解,X条件付きビデオ生成という3つの重要な機能をサポートしている。これらの多様なタスクを統合ビデオ拡散フレームワークに統合することにより、OmniVDiffは制御可能なビデオ拡散の柔軟性とスケーラビリティを向上させる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:05:46 GMT)
Gaussian Differentially Private Human Faces Under a Face Radial Curve Representation [48.3]
本稿では,ガウシアン・ディファレンシャル・プライベート(GDP)の人間の顔を3Dで表すという課題について考察する。関数の集合として3次元顔の新たな表現である顔放射曲線を提案する。提案手法は, 平均面形状を保存し, 従来のプライバシ予算よりも少ないノイズを注入する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:26:49 GMT)
Taming Consistency Distillation for Accelerated Human Image Animation [47.6]
DanceLCMは、たった2-4ステップで、最先端のビデオ拡散モデルに匹敵する結果を得る。コードとモデルは公開されます。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:44:53 GMT)
GarmentTracking: Category-Level Garment Pose Tracking [47.2]
カテゴリーレベルのポーズトラッキングタスクに対処するための完全なパッケージを提示する。仮想衣料モデルをVRインターフェースを通じてシミュレーションで操作できる、記録システムVR-Garment。大規模なデータセットであるVR-Foldingは、フラット化や折りたたみのような操作で複雑な服装が設定される。エンドツーエンドのオンライントラッキングフレームワークであるGarmentTrackingは、標準的な空間と、ポイントクラウドシーケンスが与えられたタスク空間の両方で、完全な衣服のポーズを予測する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:30:02 GMT)
InterAnimate: Taming Region-aware Diffusion Model for Realistic Human Interaction Animation [47.1]
本稿では,現実的な顔のインタラクションをアニメーションするための新しい動作パラダイムを提案する。本手法は, 解剖学的・時間的接触力学と生体力学的に妥当な変形効果を同時に学習する。結果は、InterAnimateが非常にリアルなアニメーションを生成し、新しいベンチマークを設定していることを示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:32:45 GMT)
From Gaze to Insight: Bridging Human Visual Attention and Vision Language Model Explanation for Weakly-Supervised Medical Image Segmentation [47.0]
視覚言語モデル(VLM)は、テキスト記述を通して意味的コンテキストを提供するが、説明精度は欠如している。本稿では,その補完的強みを活かし,視線と言語指導を統合した教師教育フレームワークを提案する。本手法は,8.78%,80.53%,84.22%のDiceスコアをそれぞれ達成し,アノテーション負担を増大させることなく視線ベースラインよりも3.5%向上した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:32:15 GMT)
Position Paper: Rethinking Privacy in RL for Sequential Decision-making in the Age of LLMs [46.8]
マルチスケール保護,行動パターン保護,協調プライバシ保護,コンテキスト認識適応という,4つの基本原則に基づいて構築された新たなプライバシパラダイムについて論じる。これらの原則は、医療、自動運転車、およびLSMによる意思決定支援システムのような高度な領域において、RLシステムがより広く普及するにつれて、プライバシー、実用性、解釈可能性の間に固有の緊張関係を浮き彫りにする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:45:55 GMT)
ARise: Towards Knowledge-Augmented Reasoning via Risk-Adaptive Search [46.8]
動的検索強化生成(RAG)と中間的推論状態のリスクアセスメントを統合する新しいフレームワークであるARiseを紹介する。 ARiseは最先端のKAR手法を最大23.10%、最新のRAG搭載の大きな推論モデルを最大25.37%上回っている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:06:50 GMT)
Are We Solving a Well-Defined Problem? A Task-Centric Perspective on Recommendation Tasks [46.7]
我々はRecSysタスクの定式化を解析し、入力出力構造、時間力学、候補項目選択といった重要なコンポーネントを強調した。本稿では,タスク特異性とモデル一般化可能性のバランスについて考察し,タスク定式化がロバストな評価と効率的なソリューション開発の基礎となることを明らかにする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:19:42 GMT)
Single-Input Multi-Output Model Merging: Leveraging Foundation Models for Dense Multi-Task Learning [46.5]
モデルマージは、シングルタスクのチェックポイントをマルチタスクモデルにマージするための、柔軟で計算的に抽出可能なアプローチである。本研究は,タスク固有デコーダの存在により,文献で研究されている単一入出力・複数出力モデルのマージ設定と定性的に異なることを示す。 SIMO設定に対する2つの単純かつ効率的な修正を提案し,統合後の特徴表現を再調整する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:10:46 GMT)
Measuring Computational Universality of Fully Homomorphic Encryption [45.8]
ホモモルフィック暗号化(FHE)は、暗号化データ上で直接計算を行うための強力なアプローチとして登場した。我々は,既存のFHE手法が計算的普遍性を達成できるかどうかを体系的に評価し,評価する。以上の結果から,現在のFHEソリューションでは大きなオーバーヘッドがみられた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:35:08 GMT)
UniAnimate-DiT: Human Image Animation with Large-Scale Video Diffusion Transformer [45.5]
UniAnimate-DiTは、オープンソースのWan2.1モデルの最先端かつ強力な機能を、一貫性のある人間のイメージアニメーションに活用する高度なプロジェクトである。最小限のパラメータセットを微調整するローランド適応(LoRA)技術を実装し、トレーニングメモリのオーバーヘッドを大幅に削減する。実験結果から,本手法は視覚的に出現し,時間的に一貫した高忠実度アニメーションを実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:29:11 GMT)
VisualPuzzles: Decoupling Multimodal Reasoning Evaluation from Domain Knowledge [45.2]
私たちはビジュアル推論をターゲットとしたベンチマークであるVisualPuzzlesを紹介します。 VisualPuzzlesは5つのカテゴリにまたがる多様な質問で構成されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:34:53 GMT)
Transformer-Based Model for Cold Start Mitigation in FaaS Architecture [45.0]
アイドルF関数が呼び出されるとコールドスタートが発生し、フルタイムのプロセスが必要になるため、レイテンシが増加し、ユーザエクスペリエンスが低下する。コールドスタート緩和のための既存のソリューションは、呼び出しパターンの一般化と実装の複雑さの点で制限されている。本稿では,Fアーキテクチャにおけるコールドスタートの影響を軽減するためにTransformerモデルを活用する革新的なアプローチを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:12:07 GMT)
ReadMe.LLM: A Framework to Help LLMs Understand Your Library [45.0]
大規模言語モデル(LLM)は、ニッチなソフトウェアライブラリを含むコード生成タスクにしばしば苦労する。既存のコード生成テクニックは、人間指向のドキュメントだけで失敗する可能性がある。ソフトウェアライブラリのための LLM 指向のドキュメントである ReadMe$.$LLM を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:40:48 GMT)
Trade-offs in Privacy-Preserving Eye Tracking through Iris Obfuscation: A Benchmarking Study [44.4]
ユーザアイデンティティを難読化するために,ボーリング,ノイズアップ,ダウンサンプリング,ゴムシートモデル,アイリススタイルの転送をベンチマークした。実験の結果,曖昧化やノイズ化といった標準的な画像処理手法が,ディープラーニングに基づくタスクに限界的影響を与えることがわかった。ダウンサンプリング,ゴムシートモデル,アイリススタイル転送は,ユーザ識別子の隠蔽に有効であるが,アイリススタイル転送は高い計算コストで,両ユーティリティタスクにおいて他よりも優れている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:43:41 GMT)
UniForm: A Unified Multi-Task Diffusion Transformer for Audio-Video Generation [44.2]
UniFormはマルチタスク拡散変換器であり、共有潜在空間における音声と視覚のモダリティを共同で生成する。単一の拡散プロセスは、音声とビデオの両方をモデル化し、音と視覚の固有の相関をキャプチャする。大規模言語モデルと大規模テキスト・オーディオ・ビデオ複合データセットを活用することで、UniFormは以前のアプローチよりも優れた生成多様性を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:53:12 GMT)
Respiratory Inhaler Sound Event Classification Using Self-Supervised Learning [43.8]
喘息は世界中の何百万人もの人に影響を及ぼす慢性呼吸器疾患である。我々は,このモデルを吸入音の事前学習と微調整により,吸入音分類のためのwav2vec 2.0自己教師学習モデルを適用した。提案モデルでは、ドライパウダー吸入器とスマートウォッチデバイスを用いて収集したデータセットに対して、バランスの取れた精度が98%であることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:44:47 GMT)
Lightning IR: Straightforward Fine-tuning and Inference of Transformer-based Language Models for Information Retrieval [43.4]
検索シナリオにトランスフォーマーベースの言語モデルを適用するための,使い易いフレームワークであるLightning IRを紹介する。 Lightning IRは、細調整やインデックス付けから検索と再ランク付けまで、検索パイプラインのすべてのステージをサポートするモジュラーとアーキテクチャを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:46:44 GMT)
LPViT: Low-Power Semi-structured Pruning for Vision Transformers [43.1]
画像解析タスクのための畳み込みニューラルネットワークに代わる有望な代替手段として、ビジョントランスフォーマーが登場した。 ViTの重大な欠点の1つは、リソース集約性であり、メモリフットプリント、複雑性、消費電力が増加することである。我々は,ViTの資源集約的な問題に対処するため,新しいブロック構造プルーニングを導入し,精度とハードウェアアクセラレーションのバランスのとれたトレードオフを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:54:24 GMT)
Flyweight FLIM Networks for Salient Object Detection in Biomedical Images [42.8]
本研究では,FLIMネットワークのバックプロパゲーションを伴わない拡張分離型畳み込みカーネルと多層拡散層を学習する手法を提案する。また,カーネル冗長性とエンコーダサイズを低減するため,新しいネットワーク単純化手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:57:40 GMT)
Opinion: Revisiting synthetic data classifications from a privacy perspective [42.1]
合成データは、AI開発の増大するデータ要求を満たすための費用対効果のソリューションとして浮上している。従来の合成データ型の分類は、合成データを生成するための絶え間なく増加する手法を反映していない。我々は、プライバシーの観点をよりよく反映した、合成データ型をグループ化する、別のアプローチを例に挙げる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:00:22 GMT)
FlowUnits: Extending Dataflow for the Edge-to-Cloud Computing Continuum [41.9]
FlowUnitsは、処理オペレータを、さまざまなリージョンで透過的に複製可能な、結合的で独立した管理可能なコンポーネントに整理する。当社のアプローチでは,エッジとクラウドリソースを統合データ処理パイプラインにシームレスに統合しながら,データフローの単純さを維持しています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:14:08 GMT)
Video Summarization with Large Language Models [41.5]
本稿では,近年のLarge Language Models (LLM) の機能を活用したビデオ要約フレームワークを提案する。 LLM-based Video Summarization (LLMVS) と呼ばれる我々の手法は、ビデオフレームをMulti-Modal Large Language Model (MLLM) を用いて一連のキャプションに変換する。実験の結果,提案手法は標準ベンチマークにおける既存手法よりも優れていることが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:56:14 GMT)
Multi-level Cellular Automata for FLIM networks [40.8]
本稿では,深層学習のための新たなアプローチを提案する。現代技術と古典技術を組み合わせて、競争力を維持する。我々は,本手法が深部SOD文学において確立されたモデルと競合することを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:22:24 GMT)
Ai2 Scholar QA: Organized Literature Synthesis with Attribution [40.8]
Ai2 Scholar QAは無料のオンライン科学質問応答アプリケーションである。カスタマイズ可能なオープンソースPythonパッケージとして、インタラクティブなWebアプリとして、パイプライン全体を公開しています。最近の科学的QAベンチマークでは、Ai2 Scholar QAが競合するシステムより優れていることが判明した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:48:18 GMT)
Big Brother is Watching: Proactive Deepfake Detection via Learnable Hidden Face [40.4]
シークレットテンプレートイメージは、悪意のあるイメージ偽造の指標監視として、ホストイメージに認識不能に埋め込まれる。ステガノグラフィ画像が悪質に改ざんされているか、良質に処理されているかを正確に識別するために、ロバスト検出器が構築される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:50:54 GMT)
ZeroGrasp: Zero-Shot Shape Reconstruction Enabled Robotic Grasping [40.3]
リアルタイムに3次元再構成とポーズ予測を同時に行うZeroGraspを紹介した。我々はGraspNet-1BベンチマークでZeroGraspを実世界のロボット実験で評価した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:37:39 GMT)
Measurement of the g factor of ground-state 87Sr at the parts-per-million level using co-trapped ultracold atoms [39.6]
我々は、光学的に閉じ込められた基底状態の超低温87Sr原子の核磁気共鳴を実証する。近くで超低温87Rbの雲が共存するスキームを用いて、2桁以上の原子87Srの核g因子gIの測定を改善する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:43:03 GMT)
Unsupervised Model Tree Heritage Recovery [39.1]
ニューラルネットワーク収集のための教師なしモデルツリー遺産復元の課題について紹介する。我々の仮説では、モデルウェイトがこの情報を符号化し、ウェイトを考慮すれば、基盤となるツリー構造をデコードすることが課題である。実験により,本手法が複雑なモデルツリーの再構成に成功していることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:53:58 GMT)
Dynamic Compressing Prompts for Efficient Inference of Large Language Models [38.6]
大規模言語モデル(LLM)は、高度なプロンプト技術のために、様々なタスクで優れたパフォーマンスを示している。プロンプト圧縮は簡単な解決策だが、既存の手法では、重要な情報を保持し、状況の変化に適応し、異なるタスクにまたがって効果的を維持するという課題に直面している。本手法は,性能を最大限に保ちつつ,プロンプトトークンの数を削減する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:20:45 GMT)
Kimina-Prover Preview: Towards Large Formal Reasoning Models with Reinforcement Learning [38.4]
Kimina-Proverは、形式的定理証明のための新しい推論駆動探索パラダイムを開拓した大きな言語モデルである。 Qwen2.5-72Bから大規模な強化学習パイプラインでトレーニングされたKimina-Proverは、Lean 4の証明生成において、強力なパフォーマンスを示している。 Kimina-Prover は miniF2F ベンチマークに新しい最先端をセットし、pass@8192 で 80.7% に達した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:23:44 GMT)
The Sword of Damocles in ViTs: Computational Redundancy Amplifies Adversarial Transferability [38.3]
視覚変換器(ViT)における計算冗長性の役割と,その逆変換性への影響について検討する。データレベルとモデルレベルを含む2種類の冗長性を同定し、攻撃効果を増幅する。この知見に基づいて,注目空間の操作,アテンションヘッドの置換,クリーントークンの正規化,ゴーストモエの多様化,テスト時間逆行訓練など,一連のテクニックを設計する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:59:47 GMT)
Seeing like a Cephalopod: Colour Vision with a Monochrome Event Camera [37.9]
セファロポッドは1種類の光受容体を持つにもかかわらず、独特の色の識別能力を示す。我々は、この生物学的メカニズムから着想を得て、ボールレンズとイベントベースのカメラを組み合わせたスペクトルイメージングシステムを設計する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:47:11 GMT)
WaterFlow: Learning Fast & Robust Watermarks using Stable Diffusion [37.6]
WaterFlowは、学習した潜伏依存の透かしに基づいて、高忠実度視覚透かしのための高速かつ極めて堅牢なアプローチである。 WaterFlowは、一般的な堅牢性に対して最先端のパフォーマンスを示し、難しい組み合わせ攻撃に対して効果的に防御できる最初の方法である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:27:52 GMT)
PraNet-V2: Dual-Supervised Reverse Attention for Medical Image Segmentation [37.5]
PraNet-V2は、医療画像のポリプセグメンテーションを強化するフレームワークである。 PraNet-V2には、明示的なバックグラウンド監視、独立したバックグラウンドモデリング、セマンティックに強化されたアテンション融合が含まれている。本フレームワークは,4つのpolypセグメンテーションデータセットに対して高い性能を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:49:29 GMT)
Towards Efficient Partially Relevant Video Retrieval with Active Moment Discovering [36.9]
能動モーメント探索(AMDNet)を用いた簡易かつ効果的な手法を提案する。私たちは、彼らのクエリとセマンティックに一致したビデオモーメントを見つけることを約束しています。 2つの大規模なビデオデータセットの実験は、AMDNetの優位性と効率性を示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:00:18 GMT)
GraphicBench: A Planning Benchmark for Graphic Design with Language Agents [36.9]
GraphicBenchは、グラフィックデザインのための新しい計画ベンチマークで、4つのタイプにわたる1,079のユーザクエリと入力イメージをカバーする。 3つの設計専門家と46のアクション(ツール)を備えたLLMエージェントフレームワークであるGraphicTownを紹介します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:26:59 GMT)
AFlow: Automating Agentic Workflow Generation [36.6]
大規模言語モデル(LLM)は、様々な領域にわたる複雑なタスクを解く上で、顕著な可能性を示している。我々は、Monte Carlo Tree Searchを使って、この空間を効率的に探索する自動化フレームワークであるAFlowを紹介します。 6つのベンチマークデータセットに対する実証的な評価は、AFlowの有効性を示し、最先端のベースラインよりも平均5.7%向上している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:44:55 GMT)
A PyTorch-Compatible Spike Encoding Framework for Energy-Efficient Neuromorphic Applications [36.5]
スパイキングニューラルネットワーク(SNN)は、特にスパーススパイク列車の処理において、有望なエネルギー効率の利点を提供する。本稿ではスパイクエンコーディングのための新しいオープンソースのPythonフレームワークPyTorchを紹介する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:50:03 GMT)
Causal Graphical Models for Vision-Language Compositional Understanding [36.2]
提案手法は, 最先端の合成手法を大きなマージンで大幅に上回っていることを示す。さらに、はるかに大きなデータセットを使用してトレーニングされたメソッドよりも改善されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:14:34 GMT)
Shape Your Ground: Refining Road Surfaces Beyond Planar Representations [35.6]
航空画像からの道路表面の再構築は、自律走行、都市計画、仮想シミュレーションに不可欠である。既存の再建手法は、しばしば使用性を制限する人工物や不整合を生み出す。我々は,非均一な合理的B-スプライン(NURBS)表面をフォトグラム再構成やジオデータ提供者から得られる3次元道路点に組み込むことにより,道路表面の平滑化に対処する最初のフレームワークであるFlexRoadを紹介した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:20:44 GMT)
GaussianHead: High-fidelity Head Avatars with Learnable Gaussian Derivation [35.4]
本稿では, 異方性3次元ガウスモデルを用いて, 動作する人間の頭部をモデル化する枠組みを提案する。実験では,高忠実度レンダリング,再現における最先端のアプローチ,クロスアイデンティティの再現,新しいビュー合成タスクを実現できる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:15:34 GMT)
Error Broadcast and Decorrelation as a Potential Artificial and Natural Learning Mechanism [34.8]
本稿では,ニューラルネットワークの信頼割当問題に対処する新しい学習フレームワークであるError Broadcast and Decorrelation(EBD)アルゴリズムを紹介する。 EBDは、層活性化と出力エラーの相関関係をペナルティ化する層ワイド損失関数を定義し、重量輸送を必要とせずにエラーのブロードキャストに原則化されたアプローチを提供する。数値実験により、EBDはベンチマークデータセット上の既知のエラーブロードキャスト手法に匹敵する性能を達成することが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:00:53 GMT)
AppAgentX: Evolving GUI Agents as Proficient Smartphone Users [34.7]
本稿では,インテリジェンスと柔軟性を維持しつつ,操作効率を向上させるGUIエージェントの進化的フレームワークを提案する。本手法は,エージェントのタスク実行履歴を記録するメモリ機構を組み込んだものである。複数のベンチマークタスクに対する実験結果から,本手法は既存の手法よりも効率と精度が優れていることが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:32:21 GMT)
Prototypical Calibrating Ambiguous Samples for Micro-Action Recognition [34.4]
MAR(Micro-Action Recognition)は、社会的相互作用における非言語コミュニケーションの一形態として重要な役割を担っているため、注目を集めている。現在のアプローチは、広範囲のカテゴリ範囲と微妙な視覚的差異から生じる、マイクロアクションの固有のあいまいさをしばしば見落としている。我々は,MARのあいまいさを解消し緩和するための,新しいプロトタイプキャリブレーション・アンビグラス・ネットワーク(PCAN)を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:11:11 GMT)
Teaching Transformers Causal Reasoning through Axiomatic Training [33.8]
本研究では,因果的公理の象徴的証明から因果的推論をどの程度学べるかを考察する。重要な疑問は、システムが公理実証からより複雑なシナリオへの一般化を学ぶかどうかである。多様なテキスト入力を扱うために、同じ手法がファインチューン言語モデルに拡張される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:43:28 GMT)
Aligning Generative Denoising with Discriminative Objectives Unleashes Diffusion for Visual Perception [33.5]
我々は、生成的拡散過程と知覚タスクのアライメントを分析し、強化する。初期のデノベーションステップは、知覚品質に不相応に寄与している。生成プロセスは、修正プロンプトに適応可能な制御可能なユーザインタフェースとして機能し、一意に相互作用を可能にする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:59:54 GMT)
The Pitfalls of Imitation Learning when Actions are Continuous [33.4]
本研究では,連続的な状態・動作制御システムにおいて,専門家のデモレータを模倣する問題について検討する。指数的安定性と呼ばれる制御理論的性質を満たす力学であっても、任意の滑らかな決定論的模倣ポリシーは必ず誤りを被ることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:25:03 GMT)
Learning to Be A Doctor: Searching for Effective Medical Agent Architectures [32.8]
本稿では,医療エージェントアーキテクチャの自動設計のための新しいフレームワークを紹介する。自動機械学習(AutoML)の成功に触発され、階層的で表現力のあるエージェント検索空間を定義する。本フレームワークは,多様な機能ノード型からなるグラフベースのアーキテクチャとして医療エージェントを概念化する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:44:21 GMT)
Rethinking Fine-Tuning when Scaling Test-Time Compute: Limiting Confidence Improves Mathematical Reasoning [32.5]
クロスエントロピー損失のあるトレーニングは、パス@Nのパス@Nの精度$itは、長いトレーニングで$$を下げることを示す。モデル信頼性を制限し、pass@Nテストのパフォーマンスを回復することにより、pass@Nに整合した、原則化された修正されたトレーニング損失を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:44:15 GMT)
Reducing leakage of single-qubit gates for superconducting quantum processors using analytical control pulse envelopes [32.4]
高速論理ゲートは、トランスモンのような非調和性の低い量子ビットに基づく超伝導量子プロセッサのリークエラーを増大させる。リークエラーを低減するための2つの新しい解析手法を提案し,実験的に実証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:09:03 GMT)
Cocoa: Co-Planning and Co-Execution with AI Agents [31.7]
我々は、AIエージェントとのコラボレーションのための新しいデザインパターン(インタラクティブプラン)を導入するシステムであるCocoaを紹介する。 Cocoaは、計算ノートやドキュメントエディタからのインタラクション設計に基づいて、フレキシブルなエージェンシーデリゲートをサポートする。サンプルドメインとして科学的研究を用いて、我々の研究室と現場での展開調査により、Cocoaは使いやすさを犠牲にすることなく、エージェントのステアビリティを改善した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:47:42 GMT)
Bridging the Visual Gap: Fine-Tuning Multimodal Models with Knowledge-Adapted Captions [31.6]
我々は、モデルの既存の知識と視覚的理解でトレーニングデータを自動的に適応するデータ中心のアプローチである、知識適応(KnowAda)ファインチューニングを導入する。 KnowAdaは、高い記述性を維持しながら幻覚を最小限にする。以上の結果から,KnowAdaは自動測定と人的評価の両方において,様々なベースラインを上回ります。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:59:54 GMT)
MIMIR: Masked Image Modeling for Mutual Information-based Adversarial Robustness [31.6]
視覚変換器(ViT)は基本的なアーキテクチャとして登場し、現代の視覚言語モデルのバックボーンとして機能している。本稿では,ViTの対向ロバスト性に関する体系的な研究を行い,その自己教師型事前学習における理論的相互情報(MI)解析について述べる。自動エンコーダを用いたマスク画像モデリングにより,MIペナルティを利用した自己教師型AT法MIMIRを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:50:18 GMT)
Two-media laser threshold magnetometry: A magnetic-field-dependent laser threshold [31.1]
ダイヤモンド中の窒素空孔(NV)中心は、高精度磁気計測のための有望なプラットフォームである。レーザーしきい値磁力計(LTM)は、光学キャビティ内にNVドープダイヤモンドを配置することで、NV中心の励起放出を利用する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:23:31 GMT)
A Clean Slate for Offline Reinforcement Learning [30.9]
オフライン強化学習(RL)は曖昧な問題定義と絡み合ったアルゴリズム設計によって妨げられている。我々は、厳格な分類法と、オンラインチューニング予算を明確に定量化する透明な評価プロトコルを導入する。我々は,TD3-AWR(モデルフリー)とMoBRAC(モデルベース)という,確立されたベースラインを大幅に上回る2つの新しいアルゴリズムを開発した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:59:05 GMT)
Disambiguation for Video Frame Interpolation [30.5]
ビデオフレームのタイム・ツー・ロケーションマッピングに対する新しいアプローチを提案する。この複雑なタイム・ツー・ロケーションのマッピングを暗黙的に学習するようにネットワークに強制するのではなく、オブジェクトの移動距離に関する明確なヒントをネットワークに提供する。この方法は、モデルに対するより明確な学習目標を提供し、オブジェクトの速度に関連する不確実性を低減します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:18:31 GMT)
What Is a Good Caption? A Comprehensive Visual Caption Benchmark for Evaluating Both Correctness and Thoroughness [30.4]
CAPabilityは、6つの重要なビューにまたがる12次元にわたる視覚的キャプションを評価するための総合的なベンチマークである。我々は、生成したキャプションを評価するために、視覚要素アノテーションで1万1千近い人注画像や動画をキュレートした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:58:38 GMT)
Knowledge Graph Reasoning with Self-supervised Reinforcement Learning [30.4]
本稿では,RLトレーニング前の政策ネットワークを温めるための自己指導型事前学習手法を提案する。教師付き学習段階において、エージェントはポリシーネットワークに基づいて行動を選択し、生成されたラベルから学習する。我々のSSRLモデルは、すべてのHits@kおよび平均相互ランク(MRR)メトリクスにおいて、現在の最先端結果と一致または超えていることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:48:58 GMT)
Consensus Entropy: Harnessing Multi-VLM Agreement for Self-Verifying and Self-Improving OCR [30.2]
我々は,OCRの不確かさを定量化するトレーニング不要なポスト推論手法であるConsensus Entropy (CE)を紹介した。問題のあるサンプルを効果的に識別し、最良の出力を選択し、モデル強度を組み合わせる軽量なマルチモデルフレームワークを開発する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:51:18 GMT)
AgentPolyp: Accurate Polyp Segmentation via Image Enhancement Agent [29.9]
AgentPolypはCLIPベースのセマンティックガイダンスと動的画像拡張をセグメンテーションのための軽量ニューラルネットワークに統合する新しいフレームワークである。このフレームワークは、様々な拡張アルゴリズムとセグメンテーションネットワークのためのプラグインとプレイの拡張をサポートし、内視鏡デバイスのデプロイメント要件を満たしている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:39:35 GMT)
DeepSelective: Feature Gating and Representation Matching for Interpretable Clinical Prediction [29.8]
EHRデータを用いた患者予後予測のための新しいエンドツーエンドディープラーニングフレームワークであるDeepSelectiveを提案する。 DeepSelectiveは、データ圧縮技術と革新的な機能選択アプローチを組み合わせて、カスタム設計モジュールを統合する。実験の結果,DeepSelectiveは予測精度を向上するだけでなく,解釈可能性も向上し,臨床診断に有用なツールであることがわかった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:04:39 GMT)
Efficient Medical Image Restoration via Reliability Guided Learning in Frequency Domain [29.8]
医用画像復元タスクは、劣化した観察から高品質な画像を回復することを目的としており、多くの臨床シナリオにおいて創発的な欲求を示す。既存のディープラーニングに基づく復元手法は、計算効率の良い再構成結果のレンダリングに苦慮している。本稿では、周波数領域における信頼性誘導学習による軽量トランスフォーマーを用いたLRformerを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:26:28 GMT)
SCA: Highly Efficient Semantic-Consistent Unrestricted Adversarial Attack [29.7]
我々はセマンティック・コンスタント・アンリミスタント・アンリミテッド・アタック(SCA)と呼ばれる新しいフレームワークを提案する。 SCAは、編集しやすいノイズマップを抽出するために反転法を採用し、意味的なガイダンスを提供するためにMLLM(Multimodal Large Language Model)を使用している。我々のフレームワークは、最小限の識別可能な意味変化を示す敵例の効率的な生成を可能にする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:28:00 GMT)
Reimagining Urban Science: Scaling Causal Inference with Large Language Models [29.7]
本研究は,構造的ギャップを識別するための研究トピック,データソース,方法論的アプローチを分類する分析によって,現在の都市因果研究を考察する。本稿では,仮説生成,データエンジニアリング,実験設計と実行,政策勧告による結果解釈の4つの異なるモジュールエージェントからなるAutoUrbanCI概念フレームワークを提案する。本稿では,厳密性と透明性の評価基準を提案し,人間とAIのコラボレーション,エクイティ,説明責任に対する影響を考察する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:58:11 GMT)
Nondeterministic Polynomial-time Problem Challenge: An Ever-Scaling Reasoning Benchmark for LLMs [29.4]
非決定論的多項式時間問題(Nondeterministic Polynomial-time Problem Challenge, NPPC)は、大規模言語モデル (LLM) の非決定論的推論ベンチマークである。 NPPCは、難解で、ハック不能で、自動検証可能で、一般的なものである。 NPPCは、LLMが人工知能(AGI)に向かわせるための、調査不可能でハック不能なテストベッドとして機能する、最初のスケール可能な推論ベンチマークである、と我々は信じている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:40:29 GMT)
QAVA: Query-Agnostic Visual Attack to Large Vision-Language Models [29.2]
特定の画像や質問を対象とする敵攻撃は、大きな視覚言語モデル(LVLM)を導き、誤った回答を与える。問合せ非依存型視覚攻撃(QAVA)を導入し,不明確で未知の質問に対する誤った応答を生成する頑健な敵の例を作成することを目的とした。本研究は,LVLMに対する視覚的敵対攻撃の範囲を広げ,これまで見過ごされていた脆弱性を明らかにする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:00:01 GMT)
FaceSpeak: Expressive and High-Quality Speech Synthesis from Human Portraits of Different Styles [29.2]
視覚駆動型テキスト音声(TTS)学者は、実際の顔について調査を行った。そこで我々は,多様なイメージスタイルから有能なアイデンティティ特性と感情表現を抽出する,新しいFaceSpeakアプローチを提案する。余分な情報を緩和し、結果として文字のペルソナと密接に一致した音声が合成される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:16:19 GMT)
Streamlining Biomedical Research with Specialized LLMs [29.1]
本稿では,最先端のドメイン特化言語モデルと高度な情報検索技術を統合した新しいシステムを提案する。本稿では,頑健な質問応答モデルを活用することで,応答精度を向上させるシステムの能力を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:05:56 GMT)
Bridging Distribution Gaps in Time Series Foundation Model Pretraining with Prototype-Guided Normalization [29.1]
本稿では,Transformerアーキテクチャ内でのドメイン対応適応正規化戦略を提案する。従来のLayerNormをプロトタイプ誘導動的正規化機構(ProtoNorm)に置き換える。本手法は,従来の事前学習手法よりも,分類タスクと予測タスクの両方において優れていた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:23:00 GMT)
CARE: Aligning Language Models for Regional Cultural Awareness [28.7]
既存の言語モデル(LM)はしばしば西洋中心のバイアスを示し、多様な文化的知識を表現するのに苦労する。これに対処する以前の試みは、合成データに頼り、文化的な知識を英語でのみ表現するものだった。まず、中国文化とアラブ文化に関する2,580の質問に対して、人選好による24.1k応答の多言語リソースであるCAREを紹介した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:34:48 GMT)
Unmasking Deceptive Visuals: Benchmarking Multimodal Large Language Models on Misleading Chart Question Answering [28.5]
誤解を招くチャートの視覚化は、知覚を歪め、誤った結論につながる可能性がある。大規模言語モデル(MLLM)の最近の進歩は、強力なチャート理解能力を示している。本稿では,ミスリーディングチャート質問回答ベンチマーク(Misleading Chart Question Answering (Misleading ChartQA)ベンチマーク)を紹介する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:48:57 GMT)
DMPT: Decoupled Modality-aware Prompt Tuning for Multi-modal Object Re-identification [28.4]
マルチモーダルオブジェクト再識別に適した効率的なプロンプトチューニングフレームワークを提案する。我々のフレームワークはメインのバックボーンを凍結し、新たに追加された複数のモダリティ対応パラメータのみを最適化する。我々は,既存の最先端手法に対して,バックボーンパラメータの微調整を6.5%しか必要とせず,競争的な結果が得られることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:48:41 GMT)
Cognitive Disentanglement for Referring Multi-Object Tracking [28.3]
本稿では,CDRMT(Cognitive Disentanglement for Referring Multi-Object Tracking)フレームワークを提案する。 CDRMTは人間の視覚処理システムからRMOTタスクへの"What"と"where"の経路を適応させる。異なるベンチマークデータセットの実験では、CDRMTが最先端のメソッドよりも大幅に改善されていることが示されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:35:24 GMT)
Automated Python Translation [27.8]
我々は、Pythonの自然なモダリティを他の人間の言語に自動的に翻訳するタスクを紹介します。これはこれらの形式の短縮性を考えると、ユニークな挑戦である。我々は、Pythonを他のヒューマン言語に翻訳する自動パイプラインを作成します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:30:22 GMT)
AtlasD: Automatic Local Symmetry Discovery [27.8]
本稿では、局所対称性の概念をアトラス同値として定式化する。提案するパイプライン,自動局所対称性探索(AtlasD)は,局所予測ネットワークを訓練することにより関数の局所対称性を回復する。検出された局所対称性は、気候セグメンテーションや視覚タスクにおける下流タスクのパフォーマンスを向上させる有用な帰納バイアスであることが示されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:41:55 GMT)
Diverse Score Distillation [27.8]
ランダムな初期シードによって定義された生成経路に従うよう最適化するスコアの定式化を提案する。本稿では,2次元最適化,テキストベースの3D推論,単一ビュー再構成などのタスクにまたがるDSD(Diverse Score Distillation)の応用について紹介する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:06:54 GMT)
Transformer-Driven Neural Beamforming with Imperfect CSI in Urban Macro Wireless Channels [27.4]
本研究では,不完全なチャネル状態情報下でのビーム形成重みを生成するために,深層的に分離可能な畳み込みと変圧器を統合した新しい教師なしディープラーニングフレームワークを提案する。主な目標は、信頼性の高い通信を確保しながら、総和レートを最大化することでスループットを向上させることである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:41:24 GMT)
ReTool: Reinforcement Learning for Strategic Tool Use in LLMs [27.1]
ReToolは、ツール統合学習によるロングフォーム推論を強化する。モデルは400のトレーニングステップで67%の精度を達成する。注目すべきは、ReTool-32Bが72.5%の精度で設定できることだ。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:10:22 GMT)
AwesomeMeta+: A Mixed-Prototyping Meta-Learning System Supporting AI Application Design Anywhere [26.8]
AwesomeMeta+は、メタ学習の重要なコンポーネントを標準化するために設計されたプロトタイピングと学習システムである。設計からデプロイメントまで、メタ学習システムエンジニアリングのライフサイクル全体をサポートするために開発されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:14:54 GMT)
Air Quality Prediction with Physics-Guided Dual Neural ODEs in Open Systems [26.7]
大気汚染は人間の健康と生態系を著しく脅かし、公共政策を知らせるために効果的な大気質予測を必要とする。伝統的なアプローチは一般に物理学に基づくモデルとデータ駆動モデルに分類される。本稿では,ニューラルネットワークの2つの枝を統合した物理誘導型アプローチであるAirDualODEを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:41:17 GMT)
BenchQC -- Scalable and modular benchmarking of industrial quantum computing applications [26.6]
BenchQCは、現実世界の量子アプリケーションをベンチマークするためのアプリケーション中心の視点を促進する。我々は、有意義なトレンドを明らかにし、量子ユーティリティに関する体系的なガイダンスを提供し、有望な研究方向を実現不可能なアプローチと区別することを目的としている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:05:11 GMT)
An AI-driven multimodal smart home platform for continuous monitoring and intelligent assistance in post-stroke patients [26.4]
術後患者の在宅リハビリテーションを継続するためのスマートホームプラットフォームを提案する。足底圧インソールは、最大94%の精度で運動回復段階に分類し、歩行パターンの定量的な追跡を可能にする。ヘッドマウント型視線追跡モジュールは、認知評価と家庭用機器のハンズフリー制御をサポートする。組込み大言語モデル(LLM)エージェントであるAuto-Careは、リアルタイムの介入を提供するために、マルチモーダルデータを継続的に解釈する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:35:16 GMT)
Measures of Variability for Risk-averse Policy Gradient [26.3]
リスク逆強化学習(RARL)における9つの共通変数尺度について検討する。このうち、4つの指標は以前RARLで研究されなかった。我々の実証研究は、分散ベースのメトリクスが不安定なポリシー更新につながることを明らかにしている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:28:15 GMT)
Possibility for Proactive Anomaly Detection [26.2]
時系列異常検出の目的は、潜在的な損傷や損失を減らすことである。既存の異常検出モデルは、モデル出力と基底真理(観測された)値の誤差によって異常を検出する。本稿では,異常検出に特化した時系列予測モデルとデータ駆動異常検出モデルに基づく時系列異常検出のためのイテマプロアクティブアプローチを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:25:02 GMT)
Adaptive Multi-Scale Decomposition Framework for Time Series Forecasting [26.1]
本稿では,時系列予測のための新しい適応型マルチスケール分解(AMD)フレームワークを提案する。我々のフレームワークは時系列を複数のスケールで異なる時間パターンに分解し、MDM(Multi-Scale Decomposable Mixing)ブロックを活用する。提案手法は,時間依存性とチャネル依存性の両方を効果的にモデル化し,マルチスケールデータ統合を改良するために自己相関を利用する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:28:27 GMT)
Slice+Slice Baby: Generating Last-Level Cache Eviction Sets in the Blink of an Eye [25.7]
我々はIntelプロセッサ上のエビクションセットを見つける技術に3つの主要な貢献をしている。まず、メモリアクセス時間を比較し、アドレスマップのキャッシュスライスを特定する。次に、既知のハッシュ関数を用いて、スライス識別法におけるエラー率を減らし、テストされていないメモリアドレスへのスライスマッピングを外挿することで作業を削減する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:11:38 GMT)
Enhancing Autonomous Driving Systems with On-Board Deployed Large Language Models [25.4]
本研究では,低レベルモデル予測制御器(MPC)と局所展開型大規模言語モデル(LLM)を組み合わせたハイブリッドアーキテクチャを提案する。 DecisionxLLMモジュールは、ロボットの状態情報を自然言語命令に対して評価し、所望の運転行動への順守を保証する。本稿では、検索型拡張生成(RAG)、低ランク適応(LoRA)、微調整、量子化を利用するアプローチを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:49:17 GMT)
No Need to Talk: Asynchronous Mixture of Language Models [25.4]
Smalltalk LMは、ほぼ非同期な方法で言語モデルの混合を訓練するための革新的な方法である。推測では、短いプレフィックスによると、軽量ルータが与えられたシーケンスを単一の専門家に指示する。言語モデリング実験により、SMALLTALK LMは高密度モデルベースラインよりも非常に低いパープレキシティを実現することが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:26:58 GMT)
Graph Linearization Methods for Reasoning on Graphs with Large Language Models [25.4]
グラフは、ローカル依存やグローバルアライメントなど、自然言語テキストの特定の特性を反映するように線形化されるべきである。グラフ集中度と退化度に基づくグラフ線形化法を開発した。本研究は,LLMに適した新しいグラフ表現を導入し,マルチモーダル処理のトレンドとグラフ機械学習の潜在的な統合に寄与する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:38:16 GMT)
Reward-free World Models for Online Imitation Learning [25.3]
本研究では,報酬のない世界モデルを活用したオンライン模倣学習手法を提案する。提案手法は, 復元を伴わない潜在空間における環境力学を学習し, 効率的かつ高精度なモデリングを可能にする。 DMControl,myoSuite, ManiSkill2 など,様々なベンチマークを用いて本手法の評価を行い,既存手法と比較して優れた実証性能を示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:02:50 GMT)
NodeRAG: Structuring Graph-based RAG with Heterogeneous Nodes [25.2]
Retrieval-augmented Generation (RAG)は、大規模な言語モデルに対して、外部およびプライベートコーパスへのアクセスを許可する。現在のグラフベースのRAGアプローチは、グラフ構造の設計をほとんど優先順位付けしない。不適切な設計のグラフは、多様なグラフアルゴリズムのシームレスな統合を妨げるだけでなく、ワークフローの不整合をもたらす。異種グラフ構造を導入したグラフ中心のフレームワークであるNodeRAGを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:24:00 GMT)
Breaking the Data Barrier -- Building GUI Agents Through Task Generalization [25.1]
本研究では,データ豊かで推論集約的なタスクにおける視覚言語モデル(VLM)のトレーニングを提案する。本稿では,GUI認識,マルチモーダル推論,テキスト推論など,手軽に利用できるインストラクションチューニングデータを用いて,さまざまなタスクを探索する。われわれの研究はGUIエージェントのドメイン間知識伝達に関する貴重な知見を提供し、データの不足に対処するための実践的なアプローチを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:13:46 GMT)
OctGPT: Octree-based Multiscale Autoregressive Models for 3D Shape Generation [25.0]
OctGPTは3次元形状生成のための新しいマルチスケール自己回帰モデルである。従来の3D自動回帰手法の効率と性能を劇的に向上させる。高品質でスケーラブルな3Dコンテンツ作成のための新しいパラダイムを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:40:13 GMT)
HypoBench: Towards Systematic and Principled Benchmarking for Hypothesis Generation [24.7]
仮説生成手法を複数の側面にわたって評価するための新しいベンチマークである hypoBench を紹介する。既存の6つの仮説生成手法と組み合わせた4つの最先端LCMの評価を行った。結果は、現在の仮説生成手法がすべての関連するパターンや意味のあるパターンを完全には明らかにしていないため、改善の余地がまだ大きいことを示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:00:00 GMT)
Vivid4D: Improving 4D Reconstruction from Monocular Video by Video Inpainting [24.4]
そこで我々は,視線を増大させることにより4次元モノクロ映像合成を向上させる新しいアプローチであるVivid4Dを紹介した。これは、観察されたビューを新たな視点に歪曲するビデオインペインティングタスクとして、ビュー増強を再構成する。実験により,本手法はモノラルな4次元シーンの再現と完了を効果的に改善することが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:38:14 GMT)
Rethinking Theory of Mind Benchmarks for LLMs: Towards A User-Centered Perspective [24.3]
Theory-of-Mind (ToM) タスクは、人間がLMのToM能力をベンチマークするために設計されている。このアプローチにはいくつかの制限があります。ヒューマン・コンピュータ・インタラクション(HCI)の観点から、これらの制限はToMベンチマークにおけるToMの定義と基準を再考するきっかけとなる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:44:43 GMT)
Improving Instruct Models for Free: A Study on Partial Adaptation [24.1]
そこで本研究では,ベースモデルとインストラクションモデルのパフォーマンストラジェクトリについて,インストラクションチューニングの強度をスケールダウンさせることにより検討する。複数のモデルファミリとモデルサイズにまたがって、命令調整結果の強度を低下させることで、数ショットのインコンテキスト学習ベンチマークにおいて物質的改善が達成されることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:35:09 GMT)
AskQE: Question Answering as Automatic Evaluation for Machine Translation [24.1]
本稿では,重要なMTエラーを検出し,実用的なフィードバックを提供するための質問生成および回答フレームワークであるAskQEを紹介する。そこでAskQEはKendallのTau相関と判定精度を、他のQE指標と比較して高く評価する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:57:42 GMT)
Transforming Future Data Center Operations and Management via Physical AI [24.1]
ミッションクリティカルなインフラとしてのデータセンターは、人工知能(AI)とデジタル経済の成長を支えている。 Internet DCからAI DCへの進化は、ビジネスレジリエンスの向上とオーナシップの総コスト削減のために、データセンタの運用と管理に関する新たな課題を導入している。我々は,DCの運用と管理を進めるための新しい物理AI(PhyAI)フレームワークを提案し,開発する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:06:12 GMT)
TAMP: Token-Adaptive Layerwise Pruning in Multimodal Large Language Models [23.9]
MLLM(Multimodal Large Language Models)は多様なマルチモーダルデータやタスクを理解する上で,優れた汎用性を示している。本稿では,MLLMに適した簡易かつ効果的な刈取フレームワークであるTAMPを提案する。我々は、視覚言語タスク用に設計されたLLaVA-NeXTと、音声、視覚、言語モーダルを処理可能なVideoLLaMA2の2つの最先端MLLMに対して、本手法の有効性を検証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:52:43 GMT)
Advanced Architectures Integrated with Agentic AI for Next-Generation Wireless Networks [23.9]
本稿では,ネットワーク運用の簡素化,運用費の削減(OpEx),新サービスモデルの展開を目的とした最先端技術について検討する。 i) 長期6Gネットワークの進化に対処しながら、サービスのシームレスな拡張を可能にするコントロールプレーンとユーザプレーンを備えた、新しい、より効率的な6Gアーキテクチャの提供に重点を置いている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:24:26 GMT)
Exploring Persona-dependent LLM Alignment for the Moral Machine Experiment [23.7]
本研究では,道徳機械実験の様々な文脈における社会主導型意思決定と人的判断の整合性について検討した。 LLMのモラル決定は人格によって大きく異なり、人間よりも重要なタスクに対するモラル決定のシフトが大きいことが判明した。道徳的決定を伴うアプリケーションにこれらのモデルを配置する際の倫理的意味とリスクについて論じる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:29:51 GMT)
Mamba as a Bridge: Where Vision Foundation Models Meet Vision Language Models for Domain-Generalized Semantic Segmentation [23.7]
Vision Foundation Models(VFM)とVision-Language Models(VLM)はドメイン一般化セマンティック(DGSS)で注目を集めている。本稿では, VFM と VLM の強度を効率よく組み合わせた, マンバをベースとした新しい融合フレームワーク MFuser を提案する。提案手法は,高い計算オーバーヘッドを伴わずに,高精度な特徴局所性と強いテキストアライメントを実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:14:58 GMT)
LLaVA-ReID: Selective Multi-image Questioner for Interactive Person Re-Identification [23.6]
対話型人物再識別(Inter-ReID)という新しいタスクを導入する。 Inter-ReIDは対話に基づく検索タスクであり、目撃者との対話を通じて初期記述を反復的に洗練する。 LLaVA-ReIDは,視覚的およびテキスト的コンテキストに基づいて,対象とする質問を生成する質問モデルである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:41:21 GMT)
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach [23.5]
本研究では,物理ロボットを用いた実環境におけるヌンペプソデスのナビゲーションエピソードに関する大規模実験を行った。エンドツーエンドのトレーニングから生じる推論のタイプを分析します。本稿では,エージェントが学習した値関数が長期計画に関連があることをポストホック分析で示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:24:40 GMT)
Teaching Large Language Models to Reason through Learning and Forgetting [23.4]
大規模言語モデルにおける推論時間探索の活用は、複雑な数学的および推論問題を解くための訓練されたモデルの能力をさらに強化するために有効であることが証明されている。このアプローチは計算コストと推論時間を大幅に向上させる。本稿では,検索機能を直接モデルに組み込むための効果的な手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:30:02 GMT)
FairACE: Achieving Degree Fairness in Graph Neural Networks via Contrastive and Adversarial Group-Balanced Training [23.4]
本稿では,Fairness-Aware Asymmetric Contrastive Ensemble (FairACE)と呼ばれる新しいGNNフレームワークを提案する。また、異なる次数ベースのノード群間での等価性能を定量的に評価し、保証する新しい公正度尺度である、精度分布ギャップ(ADG)を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:22:16 GMT)
The Value of Information in Human-AI Decision-making [23.4]
情報の価値を特徴付けるための決定論的枠組みを提供する。本稿では,モデル選択,人間-AI性能の実証評価,説明設計におけるフレームワークの利用について紹介する。本稿では,意思決定における情報価値を説明するために,サリエンシに基づく説明手法であるSHAPを適用した新しい情報ベース説明手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:26:06 GMT)
BlockGaussian: Efficient Large-Scale Scene Novel View Synthesis via Adaptive Block-Based Gaussian Splatting [23.2]
BlockGaussianは、コンテンツ対応シーン分割戦略と可視性対応ブロック最適化を取り入れた、新しいフレームワークである。提案手法は,複数ベンチマークで5倍の高速化とPSNR平均1.21dBの改善を実現し,再現効率とレンダリング品質の両面において最先端の性能を実現する。特に、BlockGaussianは計算要求を大幅に削減し、24GBのVRAMデバイスで大規模なシーン再構成を可能にする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:25:21 GMT)
MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision [23.1]
モノクラーオープンドメイン画像から3次元形状を復元する強力なモデルであるMoGeを提案する。一つの画像が与えられた場合、アフィン不変表現でキャプチャされたシーンの3Dポイントマップを直接予測する。本稿では,高品質な幾何学を学習する上で,モデルに有効性を与える新しいグローバルおよびローカルな幾何学監督手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:33:45 GMT)
A Piecewise Lyapunov Analysis of Sub-quadratic SGD: Applications to Robust and Quantile Regression [22.9]
一階微分しか持たない関数を$f$で扱える新しいLyapunov関数を導入する。一般の減少段数と定数段数の下で有限時間モーメント境界を導出する。我々の結果は、特にオンライン統計手法に広く応用されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:35:43 GMT)
Visual Re-Ranking with Non-Visual Side Information [21.8]
本稿では,他の種類のサイド情報を活用可能なグラフニューラルネットワークを用いたリグレード手法を提案する。実験では、画像検索の指標だけでなく、下流の視覚的ローカライゼーションタスクにも大きな改善が見られた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:37:16 GMT)
Diversity-Driven Learning: Tackling Spurious Correlations and Data Heterogeneity in Federated Models [21.7]
フェデレートラーニング(FL)は、分散データに基づく機械学習モデルの分散トレーニングを可能にする。現実世界のFL設定では、クライアントデータは不特定に分散され、不均衡になることが多い。 FLにおける新しいクライアント選択アルゴリズムであるFedDiverseを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:20:42 GMT)
TSAL: Few-shot Text Segmentation Based on Attribute Learning [21.4]
本稿では,CLIPの事前知識を利用してテキスト属性のセグメンテーションを学習するTSALを提案する。データ依存性を低減し、テキスト検出精度を向上させるため、適応的なプロンプト誘導分岐は効果的な適応的なプロンプトテンプレートを使用する。実験により, 複数テキストセグメンテーションデータセット上でのSOTA性能について, 数ショット設定で検証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:12:42 GMT)
GaSLight: Gaussian Splats for Spatially-Varying Lighting in HDR [21.4]
GaSLightは、通常の画像から空間的に変化する光を生成する方法である。ガウススプレートを用いて3次元照明をモデル化し,空間変動照明を実現する。提案手法は,HDR推定の最先端結果と仮想オブジェクトやシーンの照明への応用をもたらす。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:08:42 GMT)
The Obvious Invisible Threat: LLM-Powered GUI Agents' Vulnerability to Fine-Print Injections [21.3]
LLM(Large Language Model)ベースのGUIエージェントは、高レベルな命令に従ってユーザの代用タスクを実行する専門的な自律システムである。フォームや予約サービスなどの現実世界のタスクを完了させるには、GUIエージェントは機密性の高いユーザーデータを処理する必要がある。これらの攻撃は、エージェントと人間のユーザに対する視覚的満足度の違いを悪用することが多い。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:21:09 GMT)
Bridging Technology and Humanities: Evaluating the Impact of Large Language Models on Social Sciences Research with DeepSeek-R1 [21.1]
本稿では, 大規模言語モデルであるDeepSeek-R1を, 低リソース言語翻訳, 教育質問応答, 高等教育における生徒の書き方の改善, 論理的推論, 教育計測と心理測定, 公衆衛生政策分析, 美術教育の7つの側面から分析する。 DeepSeek-R1は人文科学や社会科学でよく働き、ほとんどの質問に正しく論理的に答え、適切な分析プロセスと説明を与える。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:09:24 GMT)
Document Quality Scoring for Web Crawling [21.1]
本研究では,静的インデックスプルーニングにおけるセマンティッククオリティのニューラルネットワークを用いて,クローリング優先タスクにおけるWebページの意味的クオリティを評価する。私たちのソフトウェアコントリビューションは、特定のWebページの効果的な品質スコアを計算するDockerコンテナで構成されています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:32:57 GMT)
Preference-based Learning with Retrieval Augmented Generation for Conversational Question Answering [21.0]
PRAISEは、ConvQAのパイプラインベースのアプローチで、3つのサブタスクごとにアダプタをトレーニングする。 PRAISEはサブタスク毎の改善を示し、人気の高いConvQAベンチマークで新しい最先端性能を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:10:39 GMT)
CFIS-YOLO: A Lightweight Multi-Scale Fusion Network for Edge-Deployable Wood Defect Detection [20.9]
木材の欠陥検出は木材加工業界における品質管理の確保に不可欠である。本研究では,エッジデバイスに最適化された軽量物体検出モデルCFIS-YOLOを提案する。このモデルでは、強化されたC2f構造、動的特徴組換えモジュール、および補助的有界ボックスと角度制約を組み込んだ新しい損失関数を導入している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:45:59 GMT)
EchoMask: Speech-Queried Attention-based Mask Modeling for Holistic Co-Speech Motion Generation [20.8]
共同音声動画像生成のための音声クエリアテンションに基づくマスキングフレームワークを提案する。我々の重要な洞察は、動きに沿った音声機能を活用して、マスクされた動きモデリングプロセスを導くことである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:41:20 GMT)
Token-Level Constraint Boundary Search for Jailbreaking Text-to-Image Models [20.7]
テキスト・ツー・イメージ(T2I)生成は、不適切または有害なコンテンツの生成に関連するリスクを引き起こす。我々は,テキストと画像チェッカーによって定義された決定境界付近のトークンを検索する,クエリベースのブラックボックスジェイルブレイク攻撃であるTBC-Attackを提案する。提案手法は,T2Iモデルにまたがる最先端のジェイルブレイク攻撃を継続的に上回ります。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:53:40 GMT)
SAT-HMR: Real-Time Multi-Person 3D Mesh Estimation via Scale-Adaptive Tokens [20.7]
一つのRGB画像からリアルタイムなマルチパーソン3次元メッシュ推定を行うための一段階フレームワークを提案する。画像中の個々の相対スケールに基づいて動的に調整されるスケール適応トークンを導入する。実験の結果,提案手法は計算コストを大幅に削減しつつ,高分解能処理の精度を保っていることがわかった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:11:00 GMT)
DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments [20.5]
我々は、LLMベースのディープリサーチエージェントのエンドツーエンドトレーニングのための、初の総合的なフレームワークであるDeepResearcherを紹介する。固定コーパス内にすべての必要な情報が存在すると仮定するRAGベースのアプローチとは異なり、我々の手法はオープンウェブのノイズ、非構造化、動的性質をナビゲートするエージェントを訓練する。オープンドメインの研究タスクに関する大規模な実験は、DeepResearcherがエンジニアリングベースの素早いベースラインよりも最大28.9ポイントの大幅な改善を達成していることを示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:57:20 GMT)
Uplink Assisted Joint Channel Estimation and CSI Feedback: An Approach Based on Deep Joint Source-Channel Coding [20.4]
ダウンリンクCSI獲得のための深層学習によるアップリンク支援共同CEとCSIフィードバックアプローチを提案する。提案するネットワークは,従来の分離されたソースチャネル符号化において発生する崖効果を軽減するために,ディープジョイント・ソースチャネル符号化アーキテクチャを採用している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:29:24 GMT)
Bridging Stepwise Lab-Informed Pretraining and Knowledge-Guided Learning for Diagnostic Reasoning [20.4]
本稿では,2つの相補的な情報ソースを結合した2元検定フレームワークを提案する。外部知識のために,大規模モデルによって強化された階層的言語と意味的関係をエンコードする診断知識グラフ(KG)を構築した。そこで本研究では,臨床検査信号に基づく段階的推論プロセスに従ってモデルを誘導する,ラボインフォームド・プロキシータスクを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:36:25 GMT)
How Relevance Emerges: Interpreting LoRA Fine-Tuning in Reranking LLMs [20.4]
我々は,大規模言語モデルによる関連信号の学習と展開方法を理解するため,LoRAファインチューニングLLMの動作探索を行う。われわれは,LoRA変換のどの層と突起が精度を高める上で最も重要であるかを明らかにする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:59:02 GMT)
Constraint-Aware Zero-Shot Vision-Language Navigation in Continuous Environments [20.3]
ゼロショット環境下でのビジョンランゲージナビゲーション(VLN-CE)の課題に対処する。本稿では,ゼロショットVLN-CEを逐次的かつ制約対応なサブインストラクション完了プロセスとして再構成するConstraint-Aware Navigator (CA-Nav)を提案する。 CA-Navは2つのコアモジュールを使用して、サブインストラクションをナビゲーションプランに継続的に変換する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:20:35 GMT)
Weight Ensembling Improves Reasoning in Language Models [20.2]
本研究では,世代間の多様性が崩壊し始める推論モデルのトレーニング中に発生する障害モードについて検討する。最新のSFTチェックポイントの重みをWiSE-FTと呼ばれる早期チェックポイントで補間する簡単な介入は、Pass@kをほぼ完全に回復し、Pass@1も改善する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:46:59 GMT)
a-DCF: an architecture agnostic metric with application to spoofing-robust speaker verification [20.2]
アーキテクチャに依存しない検出コスト関数(a-DCF)を提案する。 A-DCFは、明確に定義されたクラス事前と検出コストモデルにより、ベイズリスクセンスにおける決定のコストを反映する。アーキテクチャ上不均一なスプーフィング・ロバスト ASV ソリューションのベンチマーク評価により,a-DCF の利点を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:00:05 GMT)
RAID: An In-Training Defense against Attribute Inference Attacks in Recommender Systems [20.2]
RAIDは、レコメンデーションシステムにおける属性推論攻撃に対する訓練中の防御手法である。推奨目的に加えて,保護属性の分布がクラスラベルから独立することを保証するための防衛目的を定義する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:24:37 GMT)
GPS: Distilling Compact Memories via Grid-based Patch Sampling for Efficient Online Class-Incremental Learning [20.1]
我々は,訓練可能なモデルに頼ることなく,情報的メモリサンプルを蒸留するための軽量な戦略であるGrid-based Patch Smpling (GPS)を紹介した。 GPSは、元の画像から画素のサブセットをサンプリングして情報的サンプルを生成し、コンパクトな低解像度表現を生成する。 GPSは既存のリプレイフレームワークにシームレスに統合できるため、メモリ制限された設定下での平均終了精度が3%-4%向上する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:20:18 GMT)
AI Mismatches: Identifying Potential Algorithmic Harms Before AI Development [19.9]
システムの実際のパフォーマンスは、安全性と共同創造性を確保するために必要なものよりも低い、重要な“AIミスマッチ”を観察します。本稿では,リスクを早期に予測・緩和するためのAI Mismatchアプローチを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:15:40 GMT)
FHBench: Towards Efficient and Personalized Federated Learning for Multimodal Healthcare [19.6]
フェデレートラーニング(FL)は,患者データを共有することなく,多施設連携のための効果的なソリューションとして登場した。 FHBench(Federated Healthcare Benchmark)は、現実の医療アプリケーションから派生したデータセットから特別に設計されたベンチマークである。 FHBenchをベースとして、パーソナライズされたFLフレームワークであるAdaptive LoRA(EPFL)による効率的なパーソナライズされたフェデレーションラーニングを導入した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:38:00 GMT)
UniRGB-IR: A Unified Framework for Visible-Infrared Semantic Tasks via Adapter Tuning [19.5]
我々は、RGB-IRセマンティックタスクのためのスケーラブルで効率的なフレームワークUniRGB-IRを提案する。本フレームワークは,視覚変換器(ViT)基礎モデル,マルチモーダル特徴プール(SFI)モジュール,補助特徴プール(SFI)モジュールの3つの主要コンポーネントから構成される。各種RGB-IRセマンティックタスクの実験結果から,本手法が最先端の性能を実現することを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:17:46 GMT)
Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution [19.2]
畳み込みニューラルネットワーク(CNN)は画像の高解像度化に広く利用されている。本稿では,DSCLoRA(Distillation-Supervised Convolutional Low-Rank Adaptation)を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:12:57 GMT)
Towards Hierarchical Multi-Agent Workflows for Zero-Shot Prompt Optimization [19.2]
大規模言語モデル(LLM)は、ユーザの質問に答える上で大きな進歩を見せている。 LLMの出力の品質はプロンプト設計に大きく依存しており、優れたプロンプトによってLLMが非常に難しい問題に正しく答えられる可能性がある。 LLMの階層構造を提案し、まず、正確な指示と正確な単語を階層的に生成し、次に、このプロンプトを用いてユーザクエリの最終回答を生成する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:19:06 GMT)
PT-Mark: Invisible Watermarking for Text-to-image Diffusion Models via Semantic-aware Pivotal Tuning [19.2]
本稿ではセマンティック・アウェアなPivotal Tuning Watermarks(PT-Mark)を紹介する。 PT-Markは拡散画像の意味と透かしのトレーサビリティの両方を保存している。最先端の透かし法に比べてセマンティックな保存性能が10%向上した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:25:57 GMT)
Concept Enhancement Engineering: A Lightweight and Efficient Robust Defense Against Jailbreak Attacks in Embodied AI [19.1]
エンボディード・インテリジェンス (Embodied Intelligence, EI) システムは大規模言語モデル (LLM) と統合されており、重大なセキュリティリスクに直面している。入力フィルタリングや出力監視といった従来の防衛戦略は、しばしば高い計算オーバーヘッドをもたらす。本研究では, 内部アクティベーションを動的に操り, 組込みLDMの安全性を高めるための概念拡張工学(CEE)を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:50:04 GMT)
PATFinger: Prompt-Adapted Transferable Fingerprinting against Unauthorized Multimodal Dataset Usage [19.0]
マルチモーダルデータセットは、クロスモーダルセマンティクスを提供することで、事前訓練されたビジョン適応モデルに活用することができる。本稿では,PATFingerと呼ばれる新しいプロンプト言語変換可能なフィンガープリント手法を提案する。提案手法では,モデルにトリガを学習させる代わりに,固有データセット属性を指紋として利用する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:53:02 GMT)
Linear-MoE: Linear Sequence Modeling Meets Mixture-of-Experts [18.9]
我々は,LSMとMoEを統合する大規模モデルのモデリングとトレーニングを行う,生産レベルのシステムであるLinear-MoEを紹介する。 1)LSMのすべてのインスタンスをサポートする統一されたフレームワークを提供するモデリングサブシステムと,2)様々な高度な並列処理技術を組み込んだ効率的なトレーニングを支援するトレーニングサブシステムとから構成される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:51:10 GMT)
Belief-State Query Policies for User-Aligned POMDPs [18.8]
本稿では,エージェントの動作に対するユーザの制約や嗜好を部分的に観察可能な環境で表現するための新しい枠組みを提案する。このような制約を初めて公式に解析し、パラメータ化されたBSQポリシーの期待されるコスト関数w.r.tはそのパラメータが凸ではないことを証明した。この理論的な結果から, gPOMDPエージェントの動作を保証されたユーザアライメントで最適化するアルゴリズムが誕生した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:47:28 GMT)
Fundamental Limits of Deep Learning-Based Binary Classifiers Trained with Hinge Loss [18.6]
ディープラーニング(DL)は多くの分野においていくつかのブレークスルーをもたらしている。パターン分類問題を解くために用いたDLベースのアルゴリズムの試験性能を定量化する研究は行われていない。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:09:21 GMT)
Towards A Universal Graph Structural Encoder [18.6]
GFSEは、様々な領域にわたる転送可能な構造パターンをキャプチャするために設計された普遍的なグラフ構造エンコーダである。グラフ変換器上に構築されたGFSEは、グラフ誘導バイアスによって誘導される注意機構を導入し、多層および微細なトポロジ的特徴をエンコードする。 GFSEは81.6%の評価ケースで最先端のパフォーマンスを達成し、多様なグラフモデルとデータセットにまたがる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:57:26 GMT)
BEACON: A Benchmark for Efficient and Accurate Counting of Subgraphs [18.3]
本稿では,アルゴリズム(AL)と機械学習(ML)の両方のサブグラフカウント手法を厳格に評価するベンチマークであるBEACONを紹介する。 BEACONは、検証済みの真実、統合評価環境、公開リーダボードを備えた標準化されたデータセットを提供する。実験の結果,AL法は,非常に大きなグラフ上の部分グラフを効率的に数えるのに優れるが,複雑なパターンに悩まされることがわかった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:53:47 GMT)
Autoregressive Distillation of Diffusion Transformers [18.2]
本稿では,ODEの歴史的軌道を利用して将来のステップを予測する新しい手法であるAutoRegressive Distillation (ARD)を提案する。 ARDには2つの大きな利点がある: 1) 蓄積されたエラーに弱い予測された履歴軌跡を利用することにより露出バイアスを緩和し、2) ODE軌跡の過去の履歴をより効果的な粗い情報源として活用する。このモデルでは,ImageNet-256でFLOPを1.1%追加するだけで,ベースライン法に比べてFID劣化の5倍の低減を実現している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:33:49 GMT)
Improving LLM Interpretability and Performance via Guided Embedding Refinement for Sequential Recommendation [18.1]
本稿では,ベースレコメンデーションシステムに付随する埋め込みを強化するための,ガイド付き埋め込み改良法を提案する。我々は、解釈可能な属性のドメイン関連セマンティック情報をキャプチャするガイド付き埋め込みを生成する。改良された埋め込みは平均相反ランク(MRR)、リコールレート、正規化された非カウント累積ゲイン(NDCG)の約10%から50%のゲインを達成する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:03:53 GMT)
RORem: Training a Robust Object Remover with Human-in-the-Loop [18.0]
高品質なペアリング学習データを作成するために,Human-in-the-loopを用いた半教師付き学習戦略を提案する。まず、オープンソースのデータセットから60Kのトレーニングペアを収集し、初期オブジェクト除去モデルをトレーニングします。次に、人間のフィードバックを利用して高品質なオブジェクト除去ペアを選択し、識別器を訓練して次のトレーニングデータ生成プロセスを自動化する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:16:15 GMT)
InstanceGaussian: Appearance-Semantic Joint Gaussian Representation for 3D Instance-Level Perception [17.5]
3Dシーンの理解は、自動運転、ロボティクス、拡張現実の応用において重要な研究領域となっている。本稿では,インスタンスを適応的に集約しながら外観や意味的特徴を共同学習する InstanceGaussian を提案する。提案手法は,カテゴリーに依存しないオープンボキャブラリ3次元点分割における最先端性能を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:50:52 GMT)
Masculine Defaults via Gendered Discourse in Podcasts and Large Language Models [17.5]
男性的デフォルトは、(i)文化的文脈、(ii)男性的特徴または行動、(iii)男性的特徴または行動に対する報酬、または単に受け入れることの3つの重要な部分を含む。我々は、ソーシャルメディアの人気の成長形態であるポッドキャストに焦点を合わせ、15,117のポッドキャストエピソードを分析した。本研究では、これらのジェンダー化された言論語がドメイン固有の文脈で流行していることを調査し、ジェンダー化された言論ベースの男性デフォルトが、ビジネス、技術、政治、ビデオゲームの領域に存在することを確認する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:41:54 GMT)
LL-Gaussian: Low-Light Scene Reconstruction and Enhancement via Gaussian Splatting for Novel View Synthesis [17.5]
低照度シーンにおける新しいビュー合成(NVS)は、劣化した入力のために重要な課題である。低照度sRGB画像からの3次元再構成と拡張のための新しいフレームワークであるLL-Gaussianを提案する。最先端のNeRFベースの手法と比較して、LL-Gaussianは最大2000倍高速な推論を実現し、トレーニング時間を2%に短縮する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:06:33 GMT)
Self-Supervised Enhancement of Forward-Looking Sonar Images: Bridging Cross-Modal Degradation Gaps through Feature Space Transformation and Multi-Frame Fusion [17.4]
前向きのソナー画像の強調は、正確な水中目標検出に不可欠である。本稿では,画素領域からソナー画像をロバストな特徴領域にマッピングする特徴空間変換を提案する。提案手法は既存の手法よりも優れ,ノイズを効果的に抑制し,詳細なエッジを保ち,明るさを大幅に改善する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:34:56 GMT)
MultiLoKo: a multilingual local knowledge benchmark for LLMs spanning 31 languages [17.2]
我々は、31言語をカバーするLLMの多言語性を評価するための新しいベンチマークであるMultiLoKoを提案する。我々はMultiLoKoのスコアを11のベースで計算し、マルチリンガルなチャットモデルを市場に出し、平均的なパフォーマンスについて研究する。局所的データと英訳データを使用することで,最高の演奏モデルに対して20点以上の差が生じることが判明した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:02:53 GMT)
Second-Order Min-Max Optimization with Lazy Hessians [17.2]
本稿では,凸凹型最小値最適化のための2次法について検討する。計算コストは反復的にヘッセンによって削減できることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:51:15 GMT)
GaussVideoDreamer: 3D Scene Generation with Video Diffusion and Inconsistency-Aware Gaussian Splatting [17.2]
GaussVideoDreamerは、画像、ビデオ、および3D生成のギャップを埋めることで、生成的マルチメディアアプローチを前進させる。提案手法は,LLaVA-IQAスコアの32%,既存の手法に比べて少なくとも2倍の高速化を実現している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:01:45 GMT)
ADT: Tuning Diffusion Models with Adversarial Supervision [17.0]
拡散モデルは、真のデータ分布を近似するために前方ノイズ発生過程を反転させることで、優れた画像生成を実現している。本稿では、最適化中の推論プロセスを刺激し、最終的な出力をトレーニングデータと整合させるために、Adrial Diffusion Tuning (ADT)を提案する。 ADTは、固定されたトレーニング済みのバックボーンと軽量なトレーニング可能なパラメータを備えたシアム-ネットワーク識別器を備えている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:37:50 GMT)
REWARD CONSISTENCY: Improving Multi-Objective Alignment from a Data-Centric Perspective [16.8]
言語モデルにおける多目的的選好アライメントは、しばしば困難なトレードオフに遭遇する。我々は、これらの衝突を効果的に軽減できるデータのタイプを明らかにするために、新しいデータ駆動アプローチを探求する。生成したデータは、無害率と無害率の両方で平均13.37%向上し、無害度と無害度を最適化する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:09:19 GMT)
Sub-optimality of the Separation Principle for Quadratic Control from Bilinear Observations [16.7]
最小2次コストで双線形観測から数値力学系を制御することの問題点を考察する。この問題と標準線型二次ガウスフィルタ(LQG)との類似性にもかかわらず、どちらも二線型分離原理モデルではないことを示す。複数の合成条件で実験を行った結果について述べる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:53:51 GMT)
Randomization Can Reduce Both Bias and Variance: A Case Study in Random Forests [16.6]
我々は、しばしば見落とされがちな現象について研究し、最初はカテブレイマン2001randomで指摘され、ランダムな森林は、バッグングに比べて偏見を減らしているように見える。我々の観察は、様々なSNRにおけるランダム林の現実的な成功についての洞察を与え、ランダム林とバッグアンサンブルの違いの理解を深める。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:39:47 GMT)
Performant Automatic BLAS Offloading on Unified Memory Architecture with OpenMP First-Touch Style Data Movement [16.5]
本稿では,自動BLASオフロードのための新しいツールであるSCILIB-Accelを紹介する。このツールはCPUバイナリから直接BLASシンボルをインターセプトし、コード修正や再コンパイルは不要である。 SCILIB-Accelは、最大数百のGPUノード上の複数の量子物理学符号を用いて評価され、有望なスピードアップをもたらす。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:40:25 GMT)
Cancer-Myth: Evaluating AI Chatbot on Patient Questions with False Presuppositions [16.2]
実際の患者から得られた癌関連質問に対して,大言語モデル(LLMs)を評価した。 LLMは、しばしば質問における偽の前提を認識または対処するのに失敗する。以上の結果から,LSMの臨床的信頼性に重大なギャップがあることが示唆された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:37:32 GMT)
Safe Text-to-Image Generation: Simply Sanitize the Prompt Embedding [16.2]
本研究では,不適切な概念を迅速に埋め込むことで,テキスト・ツー・イメージモデルの安全性を高めるEmbeded Sanitizer (ES)を提案する。 ESは、その潜在的な有害性を示すプロンプトにおいて各トークンにスコアを割り当てる最初の解釈可能な安全な生成フレームワークである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:26:05 GMT)
SEA-LION: Southeast Asian Languages in One Network [16.1]
本稿では,Llama-SEA-LION-v3-8B-ITとGemma-SEA-LION-v3-9B-ITを紹介する。 LLMのSEA-LIONファミリーは、英語、中国語、インドネシア語、ベトナム語、マレー語、タイ語、ビルマ語、ラオス語、フィリピン語、タミル語、クメール語を含む11のSEA言語をサポートしている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:51:05 GMT)
Influence Maximization in Temporal Social Networks with a Cold-Start Problem: A Supervised Approach [16.0]
時間グラフにおける影響最大化(IM)は、ネットワーク拡大の最大化に欠かせない影響のある「種子」を特定することに焦点を当てる。インフェクトプロパゲーションパス(IPP)によるこれらの種の定義を提唱する。我々の焦点はIPPを効率的にラベル付けし、これらの種を正確に予測することにある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:44:30 GMT)
Block Majorization Minimization with Extrapolation and Application to $β$-NMF [16.0]
マルチ最適化問題のクラスを解くために,外挿法 (BMMe) を用いたブロック行列化最小化法を提案する。本稿では,Bregman分散を適応的に更新することにより,BMMeのブロック偏極パラメータをブロックミラー法として再構成可能であることを示す。広範囲な実験を通じて,$beta$NMF に対する有意な加速 BM を実証的に説明する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:15:01 GMT)
Cross-cultural Deployment of Autonomous Vehicles Using Data-light Inverse Reinforcement Learning [15.8]
文化の多様化は、現在、様々な地域における自動運転車の展開における最大の課題の1つとなっている。本稿では,データ光逆強化学習(Data-light inverse reinforcement learning)と呼ばれる,AVの異文化間展開方式を提案する。まず,ドイツ,中国,米国という3カ国の高速道路における自然主義的運転データセットの総合的な比較分析を通じて,運転文化の多様化を報告した。そして,これらの3つの国にまたがる急激な異文化間展開を,累積試験距離56084km以上で検証し,その有効性を実証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:22:35 GMT)
MSCRS: Multi-modal Semantic Graph Prompt Learning Framework for Conversational Recommender Systems [15.8]
Conversational Recommender Systems (CRS)は、会話を通じてユーザと対話することでパーソナライズされたレコメンデーションを提供することを目的としている。我々はMSCRSと呼ばれるCRSのためのマルチモーダルなセマンティックグラフプロンプト学習フレームワークを提案する。提案手法は項目推薦における精度を大幅に向上し,応答生成においてより自然で文脈的に関連のあるコンテンツを生成する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:05:22 GMT)
Traffic Adaptive Moving-window Service Patrolling for Real-time Incident Management during High-impact Events [15.8]
本稿では,スポーツトーナメントやコンサートなどのイベントにおけるリアルタイムインシデント管理を改善するために,交通適応型移動ウィンドウパロリングアルゴリズム(TAMPA)を提案する。動的プログラミングを用いて、短い計画ウィンドウ内のパトロール戦略を継続的に調整し、即時応答と効率的なルーティングを効果的にバランスさせる。都市交通ネットワークによるシミュレーションの結果は、TAMPAの優れた性能を示し、定常的手法で約87.5%、ランダム戦略で114.2%の改善を示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:25:50 GMT)
UI-E2I-Synth: Advancing GUI Grounding with Large-Scale Instruction Synthesis [15.4]
様々な複雑な命令データセットを生成するために,大規模なデータ合成パイプライン UI-E2I- Synth を導入する。既存のベンチマークの限界に対処する新しいGUI命令基底ベンチマークであるUI-I2E-Benchを提案する。合成データに基づいて学習した本モデルは,GUI命令のグラウンドリングにおいて優れた性能を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:56:21 GMT)
MMKB-RAG: A Multi-Modal Knowledge-Based Retrieval-Augmented Generation Framework [15.4]
MMKB-RAG(Multi-Modal Knowledge-based Retrieval-Augmented Generation)を提案する。このフレームワークは、モデル固有の知識境界を利用して、検索プロセスのセマンティックタグを動的に生成する。知識に基づく視覚的質問応答タスクに関する大規模な実験は、我々のアプローチの有効性を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:19:00 GMT)
eARCO: Efficient Automated Root Cause Analysis with Prompt Optimization [15.3]
大規模クラウドシステムにおけるインシデントに対するルート原因分析(RCA)は、複雑で知識集約的なタスクである。近年のLLM(Large-Language Models)の進歩は,インシデント管理ライフサイクルの異なる段階の解決に有効であることが証明されている。我々は、最先端のプロンプト最適化技術であるPromptWizardを利用して、最適化されたプロンプト命令を自動的に識別する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:10:32 GMT)
Reference-Based 3D-Aware Image Editing with Triplanes [15.2]
本研究は,先進的な参照ベース編集における三面体空間の有効性を探求し,実証する。提案手法は, 符号化, 自動位置決め, 三面体特徴の空間的ゆがみ, 融合学習を統合して, 所望の編集を実現する。われわれは、人間の顔、360度頭部、動物の顔、漫画の顔のような部分的にスタイリングされた編集、フルボディの衣服の編集、クラスに依存しないサンプルの編集など、さまざまな領域にまたがるアプローチを実証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:56:35 GMT)
Integer-Valued Training and Spike-Driven Inference Spiking Neural Network for High-performance and Energy-efficient Object Detection [15.2]
スパイキングニューラルネットワーク(SNN)は、ニューラルネットワーク(ANN)に対するバイオプラウと低消費電力のアドバンテージを持つ本研究では,オブジェクト検出におけるANNとSNNのパフォーマンスギャップを埋めることに焦点を当てる。我々は,バニラYOLOを単純化し,メタSNNブロックを組み込むことで,この問題を解決するためにSpikeYOLOアーキテクチャを設計する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:34:30 GMT)
Exploring Backdoor Attack and Defense for LLM-empowered Recommendations [15.1]
本稿では,RecSys(BadRec)に対するバックドアインジェクション・ポジショニング(Backdoor Injection Poisoning)と呼ばれる新たな攻撃フレームワークを提案する。 BadRecはアイテムのタイトルをトリガーで混乱させ、いくつかの偽のユーザーを使ってこれらのアイテムと対話し、トレーニングセットを効果的に毒化し、RecSysにバックドアを注入する。我々は,このようなセキュリティの脅威を軽減するため,ポゾン・スキャンナー(P-Scanner)と呼ばれるユニバーサル・ディフェンス戦略を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:37:38 GMT)
Interpretable Hybrid-Rule Temporal Point Processes [14.9]
時間的ポイントプロセス(TPP)は、様々な医療領域におけるイベントシーケンスのモデル化に広く用いられている。近年、解釈可能なTPPを導入しているが、これらの手法は数値的特徴を取り入れていない。本稿では,時間論理ルールと数値的特徴を統合する新しいフレームワークであるHybrid-Rule Temporal Point Processes (HRTPP)を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:15:16 GMT)
Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion [14.9]
本稿では,LiDARシーン完了のための拡散蒸留フレームワークであるDistillation-DPOを提案する。本手法は, 蒸留における嗜好学習を最善に活用し, 選好整合蒸留に関する知見を提供するための最初の試みである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:57:13 GMT)
MERGE$^3$: Efficient Evolutionary Merging on Consumer-grade GPUs [14.8]
MERGE$3$は、単一のGPU上での進化的マージを可能にする効率的なフレームワークである。 MerGE$3$は、評価のためのデータセットの削減、アイテム応答理論(IRT)を用いたモデル能力の推定、IRTベースのパフォーマンス推定器による最適なマージの進化によってこれを達成します。提案手法は,言語間の知識を変換し,計算オーバーヘッドを大幅に低減した,最先端の多言語・多言語統合を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:37:10 GMT)
ICODE: Modeling Dynamical Systems with Extrinsic Input Information [14.5]
本稿では,モデルの学習過程に,正確なリアルタイム入力情報を組み込んだEmphInput Concomitant Neural ODE(ICODE)を紹介する。いくつかの代表的実動力学の実験を通して本手法を検証する。この研究は、明示的な外部入力情報で物理的システムを理解するための貴重なニューラルネットワークODEモデルのクラスを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:42:55 GMT)
TrafficLLM: Enhancing Large Language Models for Network Traffic Analysis with Generic Traffic Representation [14.5]
大規模言語モデル(LLM)は様々な領域で有望な性能を示している。 TrafficLLMは、生のトラフィックデータから一般的なトラフィック表現を学ぶための2段階の微調整フレームワークを導入している。 F1スコアは0.9875と0.9483で、既存の検出および生成方法よりも最大80.12%、33.92%性能が向上している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:30:04 GMT)
Optimizing LLM Inference: Fluid-Guided Online Scheduling with Memory Constraints [14.3]
大規模言語モデル(LLM)は、今日のアプリケーションでは必須であるが、推論手順は重要な計算資源を必要とする。本稿では,多段階オンラインスケジューリング問題としてLLM推論最適化を定式化する。我々は,アルゴリズム設計をガイドするトラクタブルなベンチマークを提供するために,流体力学近似を開発した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:00:21 GMT)
IterIS: Iterative Inference-Solving Alignment for LoRA Merging [14.3]
低ランク適応(LoRA)は、特定の下流タスクのために様々な領域にまたがる大きなモデルを微調整するために広く使われている。 LoRAマージは、データのプライバシを維持しながら複数のLoRAを統一アダプタに結合することで、効果的なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:42:54 GMT)
Automatic Input Rewriting Improves Translation with Large Language Models [14.1]
機械翻訳(MT)ユーザーは、既製のMTシステムを使用すると、よく書かれたテキストが翻訳しやすいという直感に頼っている。テキストの単純化はMTに依存しない最も効果的な書き直し戦略であることを示す。人間による評価では、単純化された書き直しとそのMT出力が、ソースとMTの本来の意味を主に保持していることが確認されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:11:11 GMT)
Longitudinal Analysis of Privacy Labels in the Apple App Store [14.1]
2020年12月、Appleはアプリデベロッパーに対して、アプリのプライバシーラベルアノテーションを自己報告するよう要求し始めた。プライバシーラベルの公開から2年近く経った今、アプリの70.1%がプライバシーラベルを持っている。ラベルを持つアプリのうち、18.1%はユーザーを追跡するために使用されるデータを集め、38.1%はユーザーIDにリンクされたデータを収集し、42.0%はリンクされていないデータを収集している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:31:05 GMT)
VEXP: A Low-Cost RISC-V ISA Extension for Accelerated Softmax Computation in Transformers [14.0]
ソフトマックスの加速は、非ポイント、非線形の性質のために困難であり、指数が最も要求されるステップである。シュラウドルフ法に基づく新しい近似アルゴリズムを用いて, Bfloat16指数の算術ブロックを設計する。我々は162.7$times$低レイテンシと74.3$times$低エネルギーでSoftmaxを実行する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:28:48 GMT)
TransST: Transfer Learning Embedded Spatial Factor Modeling of Spatial Transcriptomics Data [13.7]
本稿では,細胞ラベル情報を外部ソースから適応的に活用するトランスファー学習フレームワーク(TransST)を提案する。本研究は,TransSTが細胞サブクラスタの同定と,空間転写学データにおける対応する生体マーカーの検出に有効かつ堅牢であることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:03:38 GMT)
Large language models could be rote learners [13.6]
大規模言語モデル(LLM)の評価には,MCQ(Multiple-choice Question)ベンチマークが広く使用されている。本研究では,汚染を学習の本質的な側面として再編成し,表層記憶からの真の能力獲得を抑えることを目的とする。本稿では,MCQを新たなトリニティ形式に再構成し,知識評価を維持しつつ記憶を減らし,新たな評価フレームワークであるTrinEvalを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:02:35 GMT)
Toward Intelligent and Secure Cloud: Large Language Model Empowered Proactive Defense [13.6]
大規模言語モデル(LLM)は、セキュリティインテリジェンスに対する有望なソリューションを提供する。 LLM-PDは、様々な脅威を積極的に打ち負かす新しい防御アーキテクチャである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:05:56 GMT)
Deep Learning Approaches for Medical Imaging Under Varying Degrees of Label Availability: A Comprehensive Survey [13.5]
この調査は、これらの領域における進化する研究を分類し、レビューし、2018年以降に約600の著名な貢献を分析している。画像分類、セグメンテーション、および脳、胸部、心臓イメージングに限らず、様々な医療応用領域における検出などのタスクをカバーしている。異なる学習パラダイムの形式的定義を提供し、様々な学習メカニズムと戦略の包括的要約と解釈を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:06:43 GMT)
TADACap: Time-series Adaptive Domain-Aware Captioning [13.5]
時系列画像のドメイン認識キャプションを生成するための検索ベースのフレームワークであるTADACapを紹介する。提案手法は,TADCap上に構築され,対象ドメインデータベースから多様な画像キャプチャペアを検索する新しい検索手法を提案する。 TADACap-diverseは、アノテーションの労力を大幅に削減しながら、同等のセマンティックな精度を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:54:59 GMT)
Non-Reversible Langevin Algorithms for Constrained Sampling [13.5]
本研究では,制約領域上の対象分布から標本化することを目的とする制約サンプリング問題を考察する。 SRNLD(skew-reflected non-reversible Langevin dynamics)を提案する。我々は,SRNLDの非漸近収束速度を,全変量と1-ワッサーシュタイン距離の両方の目標分布に求める。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:04:02 GMT)
TMCIR: Token Merge Benefits Composed Image Retrieval [13.5]
Composed Image Retrieval (CIR)は、参照イメージと所望の修正を記述したテキストを組み合わせたマルチモーダルクエリを使用して、ターゲットイメージを検索する。現在のCIRのクロスモーダルな特徴融合アプローチは、意図的解釈に固有のバイアスを示す。本稿では、2つの重要な革新を通じて合成画像の検索を促進する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:14:04 GMT)
Adaptive Decision Boundary for Few-Shot Class-Incremental Learning [13.5]
FSCIL(Few-Shot Class-Incremental Learning)は、学習済みの授業の知識を忘れずに、限られたトレーニングサンプルから新しいクラスを継続的に学習することを目的としている。本稿では、ほとんどのFSCILメソッドと互換性のあるADBS(Adaptive Decision Boundary Strategy)を提案する。具体的には、各クラスに特定の決定境界を割り当て、トレーニング中にこれらの境界を適応的に調整し、各セッションのクラスに対する決定空間を最適に洗練する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:37:24 GMT)
Room-Temperature Hybrid 2D-3D Quantum Spin System for Enhanced Magnetic Sensing and Many-Body Dynamics [13.4]
光学的にアクセス可能なスピン欠陥を持つ2次元(2D)材料は、統合量子スピンシステムを構築するための有望なプラットフォームとして登場した。 2次元六方晶窒化ホウ素フレーク中のホウ素空孔 (VB) スピンと, 3次元単結晶ダイヤモンド中の窒素空孔 (NV) 中心とを結合し, 環境条件下で動作させるハイブリッドスピンシステムを提案する。この複合システムは完全な制御性を実現し、ダイナミックレンジの改善を含むナノスケール磁気センサの性能を向上させる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:30:07 GMT)
Evaluation Under Imperfect Benchmarks and Ratings: A Case Study in Text Simplification [13.4]
様々なサイズのモデルによって生成される単純化された文を特徴付けるテキスト単純化のための合成ベンチマークを提案する。評価の結果,評価基準はアノテータ間の高い一致を示し,予想される傾向を反映していることがわかった。第2に, LLM審査員(LLMs-as-a-jury)による自動評価は, テキスト簡易化評価において一貫した評価を得るのに十分であることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:18:26 GMT)
TextArena [13.3]
TextArenaは、大規模言語モデル(LLM)におけるエージェント動作のトレーニングと評価のための競合するテキストベースのゲームのオープンソースコレクションである。 57以上のユニークな環境(シングルプレイヤ、ツープレイヤ、マルチプレイヤなど)にまたがっており、オンラインプレイシステムによるモデル機能の評価が容易である。 TextArenaは、新しいゲームの追加、フレームワークの適応、モデルのテスト、モデルとの対戦、トレーニングモデルの容易さを強調している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:55:20 GMT)
What is the Role of Small Models in the LLM Era: A Survey [13.2]
大規模言語モデル(LLM)は人工知能(AGI)の進歩に大きな進歩をもたらし、GPT-4やLLaMA-405Bのような大規模モデルの開発に繋がった。モデルのサイズを拡大すると、計算コストとエネルギー消費が指数関数的に増加し、これらのモデルは限られたリソースを持つ学術研究者やビジネスにとって実用的ではない。同時に、Small Models (SM) は実際的な設定で頻繁に使用されるが、その重要性は過小評価されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:38:08 GMT)
Model-free Estimation of Latent Structure via Multiscale Nonparametric Maximum Likelihood [13.2]
そこで我々は,そのような潜在構造がいつでも存在すると仮定することなく,その存在を推定するためのモデルフリーな手法を提案する。アプリケーションとして,提案手法に基づくクラスタリングアルゴリズムを設計し,広範囲の潜伏構造を捕捉する手法の有効性を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:39:57 GMT)
Realizing Scalable Conditional Operations through Auxiliary Energy Levels [12.9]
遷移経路工学に基づく遷移複合ゲート方式を提案する。制御単位系(CU)とその応用を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:48:49 GMT)
Early Impacts of M365 Copilot [12.7]
我々は、AIがいかにして知識労働者の仕事の仕方を変えつつあるかについて、最も初期の証拠をいくつか提示する。さまざまな産業や職業において、共通コアタスクの大幅な削減が期待できる。技術が新しくなったにもかかわらず、ツールにアクセスできる労働者の40%近くが、6ヶ月にわたる研究で定期的に利用している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:55:32 GMT)
Using Time Structure to Estimate Causal Effects [12.7]
時系列設定における直接(およびライトの経路規則全体を通して)因果効果を推定するための新しいアプローチを提案する。このアプローチは、基礎となる時系列が構造ベクトル自己回帰過程であると仮定する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:21:37 GMT)
FairPy: A Toolkit for Evaluation of Prediction Biases and their Mitigation in Large Language Models [12.6]
近年,BERT や GPT-2 のような大規模事前学習言語モデル (LLM) がトークン予測のバイアスを示すことが実証されている。本稿では, BERT や GPT-2 など, 広く使用されている LLM に適した技術について概説する。また、Fairpyは、これらの数学的ツールを統合するためのプラグアンドプレイインターフェースを提供するモジュラーおよびツールキットである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:08:13 GMT)
LayoutCoT: Unleashing the Deep Reasoning Potential of Large Language Models for Layout Generation [12.6]
条件付きレイアウト生成は、ユーザが定義した制約から視覚的に魅力的でセマンティックに一貫性のあるレイアウトを自動的に生成することを目的としている。本稿では,Large Language Models (LLMs) の推論能力を活用する新しい手法として,検索型拡張生成(RAG) とChain-of-Thought (CoT) 技術の組み合わせを提案する。我々は3つの条件付きレイアウト生成タスクにまたがる5つの公開データセットについて広範な実験を行った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:12:01 GMT)
MuSeD: A Multimodal Spanish Dataset for Sexism Detection in Social Media Videos [12.6]
我々は、TikTokとBitChuteから抽出された11時間分のビデオを$approx$で提供する、性差別検出のための新しいマルチモーダルスペイン語データセットであるMuSeDを紹介した。視覚情報は、人間とモデルの両方に性差別的コンテンツをラベル付けする上で重要な役割を担っている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:16:46 GMT)
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs [12.3]
大きな言語モデル (LLMs) は英語のテキストに基づいて事前訓練されており、驚くべき多言語機能を示している。識別タスクのインスタンスレベルでのアライメントを定量化するために、言語間アライメントメトリクスを導入します。言語間アライメントの指標は言語レベルでのタスク精度と強く相関するが,サンプルレベルのアライメントは誤予測と正しく区別できないことが多い。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:49:34 GMT)
GOAT-TTS: LLM-based Text-To-Speech Generation Optimized via A Dual-Branch Architecture [12.3]
新たな2分岐ArchiTecture(GOAT-TTS)を用いた音声合成手法を提案する。 GOAT-TTSは音声エンコーダとプロジェクタを組み合わせて連続的な音響埋め込みをキャプチャし、パラ言語的特徴(言語、音色、感情)と意味的テキスト表現の双方向の相関を可能にする。実験の結果,GOAT-TTSは最先端のTSモデルに匹敵する性能を示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:44:56 GMT)
Efficient Lung Ultrasound Severity Scoring Using Dedicated Feature Extractor [12.3]
MeDiVLADは多レベル肺超音波検査のための新しいパイプラインである。我々は、自己知識蒸留を利用して、ラベルや集合フレームレベルの特徴を伴わずに視覚変換器(ViT)を事前訓練する。最小限の微調整により、MeDiVLADはフレームレベルおよびビデオレベルのスコアリングにおいて従来の完全教師付き手法よりも優れることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:09:20 GMT)
Efficient Distributed Retrieval-Augmented Generation for Enhancing Language Model Performance [12.3]
小言語モデル(SLM)はリソース制約のあるエッジデバイスへの効率的なデプロイをサポートするが、その限られた能力は推論性能を損なう。 Retrieval-augmented Generation(RAG)は、デバイス上でのモデル再トレーニングを必要とせずに、外部データベースを統合することによってモデルパフォーマンスを向上させるための有望なソリューションである。文書のプライバシーを漏洩させることなく、一般知識と個人知識の両方を通じてデバイス上のSLMを強化する分散RAGフレームワークであるDRAGONを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:53:08 GMT)
GUM-SAGE: A Novel Dataset and Approach for Graded Entity Salience Prediction [12.2]
格付けされたエンティティサリエンス(英語版)は、テキストにおける相対的な重要性を反映したエンティティスコアを割り当てる。両アプローチの強みを組み合わせた,格付けされたエンティティ・サリエンスのための新しいアプローチを提案する。提案手法は,人間の要約やアライメントに基づくスコアとの相関が強く,既存の手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:26:14 GMT)
3D Wavelet Convolutions with Extended Receptive Fields for Hyperspectral Image Classification [12.2]
ディープニューラルネットワークは、ハイパースペクトル画像分類において多くの課題に直面している。本稿ではウェーブレット変換と統合された改良型3D-DenseNetモデルWCNetを提案する。実験結果から,IN,UP,KSCデータセットにおいて優れた性能を示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:39:42 GMT)
Are Generative AI Agents Effective Personalized Financial Advisors? [12.1]
本稿では,金融分野における大規模言語モデルに基づくエージェントの有効性について検討する。本研究は,(1)ユーザ自身のニーズが不確実である場合のユーザ嗜好の付与,(2)多様な投資嗜好に対するパーソナライズされたガイダンスの提供,(3)アドバイザ・パーソナリティの活用による関係構築と信頼の育成,という3つの課題に焦点をあてる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:14:43 GMT)
LightFormer: A lightweight and efficient decoder for remote sensing image segmentation [12.0]
構造化されていないターゲットを含む時間クリティカルなタスクのための軽量デコーダであるLightFormerを紹介します。 LightFormerは、チャネル処理上に構築された機能融合および改良モジュールと、学習可能なゲーティング機構を使用して、マルチスケール、マルチレンジ情報を効率的に集約する。 ISPRS Vaihingenベンチマークでは、LightFormerはGLFFNetのmIoUの99.9%を獲得し、FLOPの14.7%とパラメータの15.9%しか必要としていない。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:25:39 GMT)
AnimeDL-2M: Million-Scale AI-Generated Anime Image Detection and Localization in Diffusion Era [11.9]
手描きアートワークとしてのAI生成画像の誤表現は、アニメコミュニティや業界に深刻な脅威をもたらす。本稿では,アニメIMDLの包括的なアノテーションを用いた大規模ベンチマークであるAnimeDL-2Mを提案する。また,アニメ映像の視覚的特徴に合わせた新しいモデルAniXploreを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:41:08 GMT)
Evolving Hard Maximum Cut Instances for Quantum Approximate Optimization Algorithms [11.9]
Recursive Quantum Approximate Optimization Algorithm (RQAOA) などの変分量子アルゴリズムが普及している。本研究では、ユニークなフィットネス機能を備えた進化的アルゴリズムを用いる。このアプローチは、グラフオートエンコーダの潜在空間内のハード最大カットインスタンスをターゲットにしている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:58:25 GMT)
Acquisition of high-quality images for camera calibration in robotics applications via speech prompts [11.9]
クリップオンマイクで記録された音声コマンドによって制御される新しいキャリブレーション画像取得手法を提案する。我々は、単語ごとのタイムスタンプを正確に表現した最先端の音声テキスト書き起こしモデルを用いて、正確な時間的アライメントでトリガー語をキャプチャする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:54:43 GMT)
Enhancing Code LLM Training with Programmer Attention [11.6]
プログラマの注意グラフを拡大するための視線追跡経路拡張手法を提案する。我々はまた、生の修正を学習可能な注意モチーフに洗練するパターン抽象化のステップも導入する。コード要約のためのCodeXGlueベンチマークでは,CodeBLEUで+7.16が得られた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:53:50 GMT)
Collaborative Bayesian Optimization via Wasserstein Barycenters [11.4]
我々は,ブラックボックス最適化とデータプライバシ問題に対処する協調ベイズ最適化(BO)フレームワークを導入する。このフレームワークでは、エージェントはオラクルしかアクセスできない機能を最適化するために協力して働く。我々は,提案アルゴリズムが数値的に一貫したものであり,モンテカルロ法による実装が正確であることを証明した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:15:09 GMT)
GUI-R1 : A Generalist R1-Style Vision-Language Action Model For GUI Agents [11.4]
nameは、高レベルな現実世界のタスクシナリオにおけるLVLMの能力を高めるために設計された最初の強化学習フレームワークである。従来のOS-Atlasのような最先端のメソッドと比較して、データの0.02%しか使っていない。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:42:43 GMT)
CSPLADE: Learned Sparse Retrieval with Causal Language Models [11.3]
学習スパース検索(LSR)のための大規模言語モデル(LLM)の訓練における2つの課題を特定する。本研究では,(1)トレーニング不安定を解消するための軽量適応訓練フェーズ,(2)双方向情報を実現するための2つのモデル変種を提案する。これらの手法により,LSRモデルを8BスケールのLLMで学習し,インデックスサイズを縮小した競合検索性能を実現することができる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:31:34 GMT)
Automated Retrosynthesis Planning of Macromolecules Using Large Language Models and Knowledge Graphs [11.2]
大規模言語モデル(LLM)と知識グラフを統合するエージェントシステムを提案する。本システムは,関係する文献の検索,反応データの抽出,データベースクエリ,逆合成経路木の構築を完全自動化する。この研究は、LLMを動力とするマクロ分子に特化して、完全に自動化された再合成計画薬を開発する最初の試みである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:40:07 GMT)
Towards Interpretable Deep Generative Models via Causal Representation Learning [11.1]
ディープラーニングや生成モデリングといった機械学習技術は、幅広い領域にわたる最先端のパフォーマンスを実現する。ディープニューラルネットワークは、これらの表現を曖昧にするブラックボックスとして知られており、解釈や分析を困難にしている。因果表現学習の新たな分野は、柔軟で解釈可能で、伝達可能な生成可能なAIを構築するためのベクトルとして因果性を使用している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:46:42 GMT)
A Large-Language Model Framework for Relative Timeline Extraction from PubMed Case Reports [10.9]
本稿では,ケースレポートを時系列化されたテキストイベントとタイムスタンプのペアに変換するシステムを提案する。この研究は、時間分析にPMOAコーパスを活用するためのベンチマークとして機能する可能性がある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:54:19 GMT)
Towards the Terminator Economy: Assessing Job Exposure to AI through LLMs [10.8]
米国の雇用の3分の1はAIに強く依存しており、主に大学院または大学院の教育を必要とする高度な職業で行われている。高度な職業であっても、AIはタスク置換において高い多様性を示し、AIと人間は同じ職業の中で相互に補完することを示唆している。すべての結果、モデル、コードはオンラインで公開されており、コミュニティが結果を再現し、結果を比較し、私たちの仕事をベンチマークとして使用して、時間とともにAIの進捗を監視します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:51:16 GMT)
Towards Personalized Conversational Sales Agents : Contextual User Profiling for Strategic Action [10.6]
本稿では、嗜好の誘惑、推薦、説得を統一する新しいタスクである会話販売(CSales)を紹介する。 CSales の現実的な評価のために,実世界のデータから構築した LLM ベースのユーザシミュレータ CSUser を提案する。また、対話型行動計画のための対話を通して文脈プロファイルを積極的に推測する対話型販売エージェントCSIを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:21:39 GMT)
Embedding Radiomics into Vision Transformers for Multimodal Medical Image Classification [10.6]
ビジョントランスフォーマー(ViT)は、自己注意を通じて長距離依存をモデル化することで、畳み込みモデルの強力な代替手段を提供する。本稿では、放射能特徴とデータ駆動型視覚埋め込みをViTバックボーン内に組み込んだRE-ViT(Radiomics-Embedded Vision Transformer)を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:55:58 GMT)
Network Alignment [10.6]
ネットワークアライメント研究の最近の進歩を概観する。バイオインフォマティクス、計算言語学、プライバシー保護など、様々な分野におけるネットワークアライメントの特徴と進歩を分析することに焦点を当てている。様々なメソッドの実装原則、プロセス、パフォーマンスの違いを詳細に分析します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:32:09 GMT)
Proofs of Useful Work from Arbitrary Matrix Multiplication [10.6]
我々は,実世界の計算課題に基づいて,中本のPoWコンセンサスを実装するという,長年にわたるオープンな問題を再考する。所定の硬度と無視可能な計算オーバーヘッドを有するPoW証明書を生成する。我々のプロトコルは、悪意のある証明者が正直な証明者に対して大きな優位性を得ることができないという意味で、最適なセキュリティを持っていると推測する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:46:12 GMT)
LVLM_CSP: Accelerating Large Vision Language Models via Clustering, Scattering, and Pruning for Reasoning Segmentation [10.6]
大規模視覚言語モデル(LVLM)は、推論セグメンテーションタスクの実行において視覚基盤モデルを導くために広く採用されている。本研究では,LVLMに基づく推論セグメンテーションタスクに特化して設計された,新しい学習自由な視覚トークンプルーニング手法であるLVLM_CSPを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:27:15 GMT)
A Quantum Advantage in Localizing Transmission Loss Change in Optical Networks [10.6]
本稿では,突然の透過性低下に遭ったリンクを迅速に検出する手法を提案する。量子プローブはチャネルの損失の増加に伴い感度が低下するため、まずプローブ構築アルゴリズムを提案する。これにより、CUSUMアルゴリズムを実行し、損失のあるリンクを素早くローカライズすることができる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:24:51 GMT)
Can LLMs Leverage Observational Data? Towards Data-Driven Causal Discovery with LLMs [10.6]
因果発見は伝統的に観測データに適用された統計手法に依存している。大規模言語モデル(LLM)の最近の進歩は、因果発見の新しい可能性をもたらした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:32:35 GMT)
Protecting Copyright of Medical Pre-trained Language Models: Training-Free Backdoor Model Watermarking [10.5]
医療用事前学習言語モデル(Med-PLMs)のためのトレーニングフリーバックドアモデル透かしを提案する。提案手法は低周波単語をトリガーとして使用し,モデルの単語埋め込み層への埋め込みを特定の医療用語に置き換えることで透かしを埋め込む。医用下流業務における透かし手法の優れた効果を示す実験を行った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:07:58 GMT)
Buyer-Initiated Auction Mechanism for Data Redemption in Machine Unlearning [10.4]
人工知能(AI)の急速な成長はプライバシーの懸念を引き起こしている。カリフォルニア州消費者プライバシ法(CCPA)のような主要な規制データ償還のための買い手主導型オークション機構を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:43:59 GMT)
Enhancing Privacy in the Early Detection of Sexual Predators Through Federated Learning and Differential Privacy [10.4]
新型コロナウイルス(COVID-19)のパンデミックにより、オンライングルーミングのケースが大幅に急増した。産業とアカデミアにおけるグルーミングの検出には、私的会話へのアクセスと監視が関係している。性的捕食者の早期発見のためのプライバシ保護パイプラインを実装した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:43:35 GMT)
Feature Calibration enhanced Parameter Synthesis for CLIP-based Class-incremental Learning [10.3]
クラスインクリメンタルラーニング(Class-Incremental Learning, CIL)は、モデルが従来のクラスを維持しながら、新しいクラスの知識を継続的に学習することを可能にする。従来のCILメソッドは主に視覚的特徴に依存しており、複雑なマルチモーダルシナリオでの有効性を制限している。モデル固有の一般化能力を保ちながら破滅的な一般化を緩和する特徴強化合成(FCPS)フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:10:16 GMT)
Easy3D: A Simple Yet Effective Method for 3D Interactive Segmentation [10.2]
本稿では,ドメイン内およびドメイン外両方のデータセットにおいて,従来の最先端技術を上回る3次元インタラクティブセグメンテーション手法を提案する。我々の単純なアプローチは、Voxelベースのスパースエンコーダと、暗黙のクリック融合を実装した軽量なトランスフォーマーベースのデコーダを統合する。提案手法は,ScanNet,ScanNet++,S3DIS,KITTI-360など,ベンチマークデータセットの大幅な改善を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:49:51 GMT)
SC-NeRF: NeRF-based Point Cloud Reconstruction using a Stationary Camera for Agricultural Applications [10.2]
本稿では,ポイントクラウド(PCD)再構築のためのNeRFベースのフレームワークを提案する。物体が台座上で回転するときに、静止カメラで画像をキャプチャするNeRFベースのPCD再構成法を開発した。以上の結果から,静止カメラを用いて高品質なNeRFベースの3D再構成が可能であることが示唆された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:57:59 GMT)
Adaptive Error Correction for Entanglement Distillation [10.2]
量子リピータの線形連鎖における量子誤差補正に基づくエンタングルメント蒸留に着目した。本稿では,エンドツーエンドのメトリクスを向上する適応的誤り訂正手法を提案する。異なる方法でコードを組み合わせる4つの異なるプロトコルのパフォーマンスを比較します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:52:25 GMT)
Explicit and Implicit Representations in AI-based 3D Reconstruction for Radiology: A systematic literature review [10.1]
本稿では,最新のAIに基づく放射線画像の3D再構成アルゴリズムについて検討する。明示的手法は、点ベース、体積ベース、ガウス表現を含み、暗黙的手法は暗黙的な事前埋め込みやニューラルラディアンス場を包含する。この発展途上の分野における開発の現状と課題,今後の研究方向性について論じる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:21:47 GMT)
ICAFS: Inter-Client-Aware Feature Selection for Vertical Federated Learning [10.1]
垂直的フェデレーションラーニング(VFL)における特徴選択の役割本稿では,VFL における実効的な FS のマルチステージアンサンブル手法である ICAFS を紹介する。複数の実世界のデータセットの実験では、ICAFSが予測精度において現在の最先端の手法を超越していることが示されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:19:04 GMT)
Collaborative Perception for Connected and Autonomous Driving: Challenges, Possible Solutions and Opportunities [10.0]
コネクテッド・自動運転車(CAV)との協調的な認識は、これらの制限を克服するための有望な解決策である。本稿では、まず、データ共有の非同期性、データボリューム、エラーの対応など、協調的な知覚の課題を識別する。本稿では,チャネル認識型協調認識フレームワークである通信効率と遅延問題に対処する手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:19:48 GMT)
Visual Theory of Mind Enables the Invention of Proto-Writing [10.0]
エビデンスによれば、一部の書記システムの初期の形態は、元々は象徴的なピクトグラフで構成されていた。私たちのモデルは、原著の出現の背景にある認知的・文化的プロセスに光を当てています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:46:47 GMT)
Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models [10.0]
本研究は,人格状況判断テスト(PSJT)を中国語で自動生成する GPT-4 の可能性を探るものである。従来のSJT開発は労働集約的でバイアスが多いが、GPT-4はスケーラブルで効率的な代替手段を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:42:40 GMT)
ContourFormer: Real-Time Contour-Based End-to-End Instance Segmentation Transformer [9.8]
本稿では,リアルタイムなcontour-based instance segmentationアルゴリズムであるContourformerを提案する。この手法は完全にDETRパラダイムに基づいており、輪郭を最適化するための反復的およびプログレッシブなメカニズムを通じてエンドツーエンドの推論を実現する。我々は、既存の最先端手法と比較して総合的な評価を行い、精度と推論速度の両方において顕著に改善したことを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:28:50 GMT)
Leveraging Vertical Public-Private Split for Improved Synthetic Data Generation [9.8]
Differentially Private Synthetic Data Generationは、プライベートおよびセキュアなデータ共有を可能にする重要な手段である。最近の文献では、少量の公開データが合成データの質を高めるのに役立つシナリオを探求している。本稿では,水平的公共支援手法を垂直配置に適応させる新しい枠組みを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:59:03 GMT)
Dependency Structure Augmented Contextual Scoping Framework for Multimodal Aspect-Based Sentiment Analysis [9.6]
マルチモーダルアスペクトベース感性分析(MABSA)は,画像とテキストのペアから微細な情報を抽出する。 DASCOは、依存性解析ツリーを活用することでアスペクトレベルの感情推論を強化する、きめ細かいスコープ指向のフレームワークである。 2つのベンチマークデータセットの実験は、DASCOがMABSAで最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:05:09 GMT)
SonicSieve: Bringing Directional Speech Extraction to Smartphones Using Acoustic Microstructures [9.5]
SonicSieveはスマートフォン向け初のインテリジェント指向性音声抽出システムである。追加の電子回路を使わずに、方向の手がかりを入力音声に埋め込む。本稿では,モバイルデバイス上で生音声の混合処理を行うエンド・ツー・エンドニューラルネットワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:30:48 GMT)
Towards Spatially-Aware and Optimally Faithful Concept-Based Explanations [9.3]
ポストホックで教師なしの概念に基づく説明法(U-CBEM)は、ディープニューラルネットワークにおける意思決定プロセスの意味論的説明を生成するための有望なツールである。正確な評価を阻害する先行忠実度指標のいくつかの制限を同定する。本研究では、空間的に認識された代理と2つの新しい忠実度指標を導入する評価手法であるSurrogate Faithfulness (SF)を用いて、これらの制限に対処する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:24:13 GMT)
DMAGaze: Gaze Estimation Based on Feature Disentanglement and Multi-Scale Attention [9.1]
DMAGazeは、視線関連グローバル特徴、局所的な視線特徴、頭部ポーズ推定特徴の3つの側面で、顔画像からの情報を活用する新しい視線推定フレームワークである。我々の提案したDMAGazeは、2つの主要な公開データセットで広く検証され、最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:08:43 GMT)
F$^3$Set: Towards Analyzing Fast, Frequent, and Fine-grained Events from Videos [9.1]
F$3$Setは、正確なF$3$イベント検出のためのビデオデータセットで構成されるベンチマークである。我々は、F$3$Setで一般的な時間的行動理解手法を評価し、既存の手法の課題を明らかにした。本稿では,F$3$イベント検出のための新しい手法F$3$EDを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:08:41 GMT)
Meta-learning For Few-Shot Time Series Crop Type Classification: A Benchmark On The EuroCropsML Dataset [9.1]
本研究では,(第1次)モデル非依存メタラーニング((FO)-MAML),ニアノ・インナーループ(ANIL),タスクインフォームドメタラーニング(TIML)など,トランスファーラーニングとメタラーニングアルゴリズムのベンチマークを行う。エストニアやポルトガルのような地理的に異なる地域間の知識の移動は、すべての調査されたアルゴリズムに重大な課題をもたらすことが判明した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:47:57 GMT)
Tabular foundation model to detect empathy from visual cues [8.8]
ビデオデータセットは、プライバシーや倫理上の懸念から、生の映像ではなく抽出された機能としてリリースされることが多い。近年のテキスト基礎モデルの成功に触発され,共感検出における表層基盤モデルの利用について検討した。人-ロボット相互作用ベンチマーク実験では, 物体間共感検出精度が大幅に向上した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:06:05 GMT)
CMAT: A Multi-Agent Collaboration Tuning Framework for Enhancing Small Language Models [8.8]
厳密にキュレートされた高品質データセットに基づいてトレーニングされたTinyAgentモデルを紹介する。また,言語エージェントの能力向上を目的とした革新的システムであるCMAT(Collaborative Multi-Agent Tuning)フレームワークを提案する。本研究では,マルチエージェントシステムと環境フィードバック機構を統合した新しいコミュニケーションエージェントフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:28:28 GMT)
FLSSM: A Federated Learning Storage Security Model with Homomorphic Encryption [8.8]
本稿では,フェデレート学習モデルのプライバシを保護するために,同型暗号化(FLSSM)を用いたフェデレーション学習ストレージセキュリティモデルを提案する。複数の実世界のデータセットの実験により、我々のモデルは、効率とセキュリティの指標の両方でベースラインモデルよりも大幅に優れています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:33:14 GMT)
MalMixer: Few-Shot Malware Classification with Retrieval-Augmented Semi-Supervised Learning [8.7]
MalMixerは、スパーストレーニングデータを用いて精度の高い半教師付きマルウェアファミリー分類器である。そこで,MalMixerは,数ショットのマルウェアファミリー分類設定において,最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:56:42 GMT)
Hallucination-Aware Generative Pretrained Transformer for Cooperative Aerial Mobility Control [8.7]
本稿では、GPT(Generative Pretrained Transformer)と強化学習(RL)を統合したSafeGPTを提案する。提案した設計では,Global GPTモジュールがセクター割り当てなどのハイレベルなタスクを割り当て,On-Device GPTがリアルタイムなローカルルート計画を管理する。 RLベースの安全フィルタは、各GPT判定を監視し、バッテリの枯渇や重複する訪問につながる可能性のある安全でないアクションをオーバーライドし、幻覚を効果的に緩和する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:21:08 GMT)
Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning [8.7]
マルチモーダル大言語モデル(MLLM)のためのルールベース強化学習微調整(RFT)における思考過程について検討する。まず,MLLM の思考を促進するために,検証可能な報酬を用いて分類のための CLS-RL を提案する。実験の結果、CLS-RLはSFTを著しく上回り、"フリーランチ"の一般化効果が得られる(あるデータセットでトレーニングした後、目に見えないデータセットのパフォーマンスを改善する)。この明示的思考がRFTにとって常に必要であるかどうかを問う。明示的思考はRFTにとって不可欠である、という規則に従えば、単純な等式精度の報酬による思考の最小化を図りながら、No-Thinking-RLを導入する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:31:31 GMT)
Bias Beyond English: Evaluating Social Bias and Debiasing Methods in a Low-Resource Setting [8.5]
言語モデルにおける社会的偏見は、社会的不平等を悪化させる可能性がある。本研究では,ハイリソース言語コーパスを利用してバイアス評価を行い,低リソース言語におけるデバイアス手法の実験を行う。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:40:22 GMT)
Leveraging multimodal explanatory annotations for video interpretation with Modality Specific Dataset [8.4]
概念モダリティ特定データセット(CMSD)を紹介する。 CMSDは注釈付き概念のモダリティによって分類されたデータサブセットから構成される。 CMSDでトレーニングされたモデルは、アーリー・フュージョンとレイト・フュージョンの両方で伝統的なレガシ・トレーニングを使用したモデルよりも優れています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:33:25 GMT)
Verifying Properties of Binary Neural Networks Using Sparse Polynomial Optimization [8.3]
本稿では,バイナリニューラルネットワーク(BNN)の特性検証手法について検討する。フル精度のBNNと同様、入力の摂動にも敏感だ。スパース多項式最適化から導かれる半有限プログラミング緩和を用いた代替手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:07:22 GMT)
DPS: Design Pattern Summarisation Using Code Features [8.2]
Java と NLG ライブラリを使って,ソフトウェア設計パターンの要約を生成する。我々の要約は人間による要約と密接に一致している。フォローアップ調査では、DPSサマリーは人為的なサマリーよりもコンテキストを捉えていると評価された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:27:44 GMT)
Enhancing Out-of-Distribution Detection with Extended Logit Normalization [8.2]
機械学習モデルの安全なデプロイには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。近年,OOD検出のための分類損失の改善と表現学習戦略が検討されている。これらの方法は、しばしば特定のポストホック検出技術に合わせて調整され、一般化性を制限する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:51:35 GMT)
"Even explanations will not help in trusting [this] fundamentally biased system": A Predictive Policing Case-Study [8.2]
リスクの高いドメインにおけるAIシステムの使用は、ユーザを過度に信頼させるか、不適切な信頼または過度に信頼させる可能性がある。過去の研究によると、AIシステムが提供する説明は、いつシステムを信頼すべきか、信頼すべきでないかをユーザーの理解を高めることができる。本研究では,AIに基づく予測ポーリングの適切な信頼を確立する上で,さまざまな説明タイプとユーザ専門知識が与える影響について検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:43:48 GMT)
Entanglement scaling behaviors of free fermions on hyperbolic lattices [8.2]
双曲格子上のタイト結合モデルは、双曲的バンド理論と非アベリアブロッホ状態をもたらす。本稿では,物質のエキゾチック相への強力な量子情報プローブとして考えられてきたエンタングルメントエントロピー(EE)のスケーリングに焦点を当てる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:00:44 GMT)
QAMA: Quantum annealing multi-head attention operator with classical deep learning framework [8.2]
本研究では,量子アニーリングに基づくQAMA(Multi-head Attention)機構を提案する。コヒーレントIsing Machine(CIM)の光学コンピューティングの利点と統合され、ミリ秒レベルのリアルタイム応答性を維持している。 QBoson CPQC量子コンピュータの実験では、QAMAは古典演算子に匹敵する精度を達成している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:29:09 GMT)
ProtFlow: Fast Protein Sequence Design via Flow Matching on Compressed Protein Language Model Embeddings [8.1]
ProtFlowは高速なフローマッチングベースのタンパク質配列設計フレームワークである。潜在空間の圧縮と平滑化により、ProtFlowは限られた計算リソースをトレーニングしながらパフォーマンスを向上させる。一般ペプチドや長鎖タンパク質,抗菌ペプチド,抗体など,多種多様なタンパク質設計タスクにおけるProtFlowの評価を行った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:46:53 GMT)
Light-YOLOv8-Flame: A Lightweight High-Performance Flame Detection Algorithm [7.7]
本稿では,リアルタイム展開に特化した軽量火炎検出アルゴリズムLight-YOLOv8-Flameを紹介する。提案したモデルは、オリジナルのC2fモジュールをFasterNet Blockモジュールに置き換えることで、YOLOv8アーキテクチャを強化する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:44:57 GMT)
Normalizing Flow Regression for Bayesian Inference with Offline Likelihood Evaluations [7.7]
正規化フロー回帰(NFR)は、後部分布を近似する新しいオフライン推論法である。 NFRは、既存の対数密度評価の回帰を通じて、引き込み可能な後部近似を直接生成する。神経科学・生物学におけるNFRの総合的ベンチマークと実世界の応用を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:52:33 GMT)
PGU-SGP: A Pheno-Geno Unified Surrogate Genetic Programming For Real-life Container Terminal Truck Scheduling [7.7]
本稿では,代用サンプル選択と適合性予測を強化するために,表現ジェノリック・サロゲートGPアルゴリズムPGU-SGPを提案する。同じトレーニング時間で、PGU-SGPは従来のGPと最先端のアルゴリズムを多くのデータセットで大幅に上回っている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:19:42 GMT)
Boundary Time Crystals Induced by Local Dissipation and Long-Range Interactions [7.7]
駆動散逸多体系は平衡に存在しない非自明な量子位相をサポートする。このいわゆる境界時結晶(BTC)は、局所散逸の存在下で脆弱である。局所散逸により本態的に誘発される頑健なBTCを実証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:35:45 GMT)
AFiRe: Anatomy-Driven Self-Supervised Learning for Fine-Grained Representation in Radiographic Images [7.6]
放射線画像解析(AFiRe)における微細表現向上のための解剖学駆動型自己教師型フレームワークを提案する。 AFiReの中核となる考え方は、解剖学的一貫性とVision Transformerのユニークなトークン処理特性を整合させることである。実験結果から, AFiReは, 最先端のコントラスト学習法と比較して, より凝集性の高い特徴クラスタを実現することができることがわかった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:29:54 GMT)
Deep Learning-Based Longitudinal Prediction of Childhood Myopia Progression Using Fundus Image Sequences and Baseline Refraction Data [7.5]
小児の近視・近視リスクを定量的に予測する新しい高精度手法を提案する。深層学習をベースとして, AUCスコアは0.944, 0.995で, 平均誤差は0.311D, 平均誤差は0.944, 平均誤差は0.995であった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:41:09 GMT)
Using Cooperative Co-evolutionary Search to Generate Metamorphic Test Cases for Autonomous Driving Systems [7.5]
本稿では,自律運転システム(ADS)のシステムレベルの安全性評価を進めることを目的とした,新しい自動テストフレームワークCoCoMEGAを紹介する。 CoCoMEGAは、望ましくないシステム動作を示すテストシナリオの識別を強調し、最終的には、メタモルフィックリレーショナル(MR)によって取得される安全違反につながる可能性がある。将来の研究の方向性には、さらなるシミュレーションプラットフォームへのアプローチの拡張、他の複雑なシステムに適用すること、サロゲートモデリングのようなテスト効率をさらに改善するための方法を模索することが含まれる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:12:31 GMT)
LangGas: Introducing Language in Selective Zero-Shot Background Subtraction for Semi-Transparent Gas Leak Detection with a New Dataset [7.5]
ガス漏れは予防を必要とする重大な危険をもたらす。近年の研究では、この問題に機械学習技術を適用しているが、高品質でパブリックなデータセットが不足している。本稿では,背景の多様さ,前景オブジェクトの干渉,漏洩箇所の多様さ,正確なセグメンテーションの真理を特徴とする合成データセットSimGasを紹介する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:35:57 GMT)
Efficient and Stable Multi-Dimensional Kolmogorov-Smirnov Distance [7.3]
確率分布間のコルモゴロフ-スミルノフ距離を多次元設定に拡張する。分布と分布からのサンプルの距離は, 試料の大きさが大きくなるにつれて0に収束することを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:42:49 GMT)
Propaganda via AI? A Study on Semantic Backdoors in Large Language Models [7.3]
セマンティックバックドアは少量の毒コーパスで埋め込むことができる。本稿では,意味論的エントロピーとモデル間の整合性解析を組み合わせたブラックボックス検出フレームワークであるRAVENを紹介する。未検出セマンティックバックドアの実証評価
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:43:15 GMT)
MROSS: Multi-Round Region-based Optimization for Scene Sketching [7.3]
シーンのスケッチには、シーンのセマンティックな理解と、シーン内の異なる領域の考慮が必要である。我々はスケッチをブエジエ曲線のいくつかの集合として定義する。新たなCLIPベースのセマンティックロスとVGGベースの特徴損失を利用して,多ラウンド最適化を導出する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:44:00 GMT)
Exploring the Role of KG-Based RAG in Japanese Medical Question Answering with Small-Scale LLMs [7.2]
大規模言語モデル(LLM)は,医学的QAにおいて良好に機能するが,プライバシの制約により,日本語の文脈における有効性は制限される。近年の取り組みは, オープンソース LLM に重点を置いているが, 検索強化世代 (RAG) と組み合わせる可能性はまだ未定である。我々は,日本の医療用QA小規模オープンソースLLMのための知識グラフベースRAGフレームワークを初めて検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:46:39 GMT)
DAAF:Degradation-Aware Adaptive Fusion Framework for Robust Infrared and Visible Images Fusion [7.1]
既存の赤外線および可視画像融合(IVIF)アルゴリズムは、低光や雑音などの画像劣化を無視し、高品質な画像の優先順位付けを行う。本稿では,適応的劣化最適化と画像融合の統一モデリングを実現するために,DAAF(Degradation-Aware Adaptive Image Fusion)を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:02:49 GMT)
Property Inheritance for Subtensors in Tensor Train Decompositions [7.1]
本稿では,2つの鍵テンソル特性,すなわち非コヒーレンスと条件数の性質継承について理論的に検討する。また,ファイバーワイドサンプリングによりテンソルトレインのランクが維持されることを示す。その結果, ファイバワイドサンプリングにより生成したアテンソルに, 興味のある特性を十分に保存できることが示唆された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:10:38 GMT)
ClinicalGPT-R1: Pushing reasoning capability of generalist disease diagnosis with large language model [7.1]
臨床GPT-R1は疾患診断のための汎用的な大規模言語モデルである。クリニカルGPT-R1は、2万件の実際の臨床記録に基づいてトレーニングされ、様々なトレーニング戦略を活用して診断の推論を強化する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:52:40 GMT)
Next-Future: Sample-Efficient Policy Learning for Robotic-Arm Tasks [7.0]
我々は,単一ステップ遷移に対する報酬に焦点を当てた新しいリプレイ戦略「Next-Future」を紹介する。このアプローチは、マルチゴールマルコフ決定過程の学習におけるサンプル効率と精度を大幅に向上させる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:45:51 GMT)
Probe of Generic Quantum Contextuality and Nonlocality for qubits [7.0]
エントロピック不確実性関係(EUR)は、本質的に一般的な量子的文脈性と非局所的絡み合いを接続可能であることを示す。非局所的な視点から、一党の文脈性と二党の絡み合いは、EURと量子記憶との関連性を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:40:28 GMT)
How to Enhance Downstream Adversarial Robustness (almost) without Touching the Pre-Trained Foundation Model? [6.9]
本稿では,基礎モデルにデータを送る前に,データ前処理方式として頑健な自動エンコーダを提案する。提案手法は,ロバストなオートエンコーダのトレーニングにおいて,基礎モデルへのアクセスをゼロにする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:17:37 GMT)
CDUPatch: Color-Driven Universal Adversarial Patch Attack for Dual-Modal Visible-Infrared Detectors [6.8]
逆パッチは、現実世界のシナリオにおけるオブジェクト検出システムの堅牢性を評価するために広く利用されている。我々は,CDUPatchを提案する。CDUPatchは,スケール,ビュー,シナリオにまたがる可視赤外線オブジェクト検出器に対する汎用的なクロスモーダルパッチアタックである。対向パッチの最適色分布を学習することにより、その熱応答を操作でき、対向赤外線テクスチャを生成することができる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:46:00 GMT)
NormalCrafter: Learning Temporally Consistent Normals from Video Diffusion Priors [6.7]
ビデオ拡散モデルの本質的な時間的先行性を活用するために,NormalCrafterを提案する。シーケンス間の高忠実度正規推定を実現するために,セマンティック特徴正規化を提案する。また,長時間の時間的文脈を維持しながら空間的精度を維持するための2段階トレーニングプロトコルも導入した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:39:07 GMT)
Weakly Supervised Lymph Nodes Segmentation Based on Partial Instance Annotations with Pre-trained Dual-branch Network and Pseudo Label Learning [6.7]
そこで本研究では, 動的混合擬似ラベル(DBDMP)を用いたプレトレーニングDual-Branchネットワークを提案し, リンパ節セグメンテーションのための部分的インスタンスアノテーションから学習する。本手法は,Dice similarity Coefficient (DSC) を11.04%から54.10%に改善し,平均対称表面距離 (ASSD) を20.83 $mm$から8.72 $mm$に低減する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:26:51 GMT)
Understanding the theoretical properties of projected Bellman equation, linear Q-learning, and approximate value iteration [6.7]
我々は、この方程式を解くために、射影ベルマン方程式(PBE)と2つのアルゴリズムの理論的性質について研究する。 PBEの解が存在するための2つの十分な条件を考える。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:56:33 GMT)
Finite-Time Analysis of Temporal Difference Learning with Experience Replay [6.7]
時間差学習(TD)は、強化学習(RL)において最も一般的なアルゴリズムの1つである。本稿では,マルコフ雑音項の簡易分解を行い,経験的再生を伴うTD学習における有限時間誤差境界を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:59:42 GMT)
Deep Generative Model-Based Generation of Synthetic Individual-Specific Brain MRI Segmentations [6.7]
個人のための合成脳MRIセグメンテーションを生成できる最初のアプローチを提案する。提案手法では,新しい深層生成モデルCSeg Synthが特徴的であり,既存の顕著な生成モデルよりも優れている。個人固有の生成の有効性を評価する際には,より優れたボリューム予測を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:25:36 GMT)
Faster Configuration Performance Bug Testing with Neural Dual-level Prioritization [6.6]
設定パフォーマンスバグ(CPBugs)は、ソースコードに深く隠される可能性がある。既存のテストツールは、長いランタイムに悩まされているか、予算が制限されたときにCPBugを検出するのに効果がなかった。本稿では,設定オプションと値範囲レベルでのテストをニューラルネットワークで優先することで,CPBugテストの高速化を図る。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:25:34 GMT)
LDGNet: A Lightweight Difference Guiding Network for Remote Sensing Change Detection [6.6]
光リモートセンシングによる変化検出を誘導する軽量差分誘導ネットワーク(LDGNet)を提案する。まず、軽量バックボーンネットワークの特徴表現能力を高めるために、差分誘導モジュール(DGM)を提案する。次に,Visual State Space Model (VSSM) を用いたDADFモジュールを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:15:27 GMT)
Achieving Tighter Finite-Time Rates for Heterogeneous Federated Stochastic Approximation under Markovian Sampling [6.5]
我々は,M$エージェントを含む汎用的な近似問題について検討した。目標は、エージェントがサーバを介して断続的に通信し、エージェントのローカルオペレータの平均のルートを見つけることである。我々はtexttFedHSA という名の新しいアルゴリズムを開発し、正しい点への収束を保証することを証明した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:13:55 GMT)
Hashigo: A Next Generation Sketch Interactive System for Japanese Kanji [6.5]
橋郷(はしご)は、人間のインストラクターレベルの批判と視覚構造と筆記技術の両方に対するフィードバックを実現するスケッチ対話システムである。この種の自動的批判とフィードバックにより、学生はスケッチの特定の欠陥を標的にし、修正することができる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:37:28 GMT)
Subset-Contrastive Multi-Omics Network Embedding [6.4]
Subset-Contrastive Multi-Omics Network Embeddingでは、スケーラブルなサブグラフコントラストアプローチを通じて、大規模データセット上でのコントラスト学習技術を採用している。本手法は単一セルデータにおけるセル型クラスタリングのための相乗的オミクスの統合を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:01:39 GMT)
MediSee: Reasoning-based Pixel-level Perception in Medical Images [6.4]
MedSD(Medical Reasoning and Detection)を導入した新しい医療ビジョンタスクについて紹介する。 MedSDの目的は、医療画像に関する暗黙のクエリを理解し、対応するセグメンテーションマスクとターゲットオブジェクトのバウンディングボックスを生成することである。医学的推論のセグメンテーションと検出のために設計された効果的なベースラインモデルであるメディセーを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:28:53 GMT)
Prototype-Guided Diffusion for Digital Pathology: Achieving Foundation Model Performance with Minimal Clinical Data [6.3]
本研究では,高忠実度合成病理データを大規模に生成するプロトタイプ誘導拡散モデルを提案する。我々のアプローチは、生成したデータの生物学的、診断学的に有意義な変動を保証します。我々は、大規模な実世界のデータセットでトレーニングされたモデルよりも60倍-760倍少ないデータを使用しても、我々の合成データセットでトレーニングされた自己教師機能によって競争性能が向上することを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:17:39 GMT)
Analyzing 16,193 LLM Papers for Fun and Profits [6.3]
LLM(Large Language Models)は、コンピュータサイエンス研究のランドスケープを再構築している。本研究は,過去6年間の77の上位コンピュータサイエンス会議におけるLSM関連論文の出版動向を包括的に分析した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:06:21 GMT)
MARTSIA: A Tool for Confidential Data Exchange via Public Blockchain [6.3]
相互運用アプリケーション(MARTSIA)のためのトランザクションシステムに対するマルチオーソリティアプローチ MARTSIAは、ユーザ定義ポリシーと認証宣言属性を組み合わせることで、メッセージ部分レベルでの詳細な読み取りアクセス制御を提供する。このアーキテクチャは、パブリックブロックチェーン固有の透明性と、機密性の高いアプリケーションに必要なプライバシとを効果的にバランスさせる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:36:24 GMT)
Mamba-Based Ensemble learning for White Blood Cell Classification [6.1]
白血球分類(WBC)は、免疫の健全性を評価し、様々な疾患を診断するのに役立つ。近年のディープラーニングの進歩は、従来の手法よりも有望であることを示している。本稿では,マンバモデルとアンサンブル学習を統合し,WBC分類を改善する新しいフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:53:18 GMT)
Enhancing Features in Long-tailed Data Using Large Vision Mode [5.9]
我々は,LVM(Large Vision Model)やVFM(Victorial foundation Model)を用いて,言語情報のない長期データ機能の拡張を検討する。具体的には、LVMから特徴を抽出し、ベースラインネットワークのマップと潜在空間の機能を融合する。我々は、拡張機能の可能性をさらに活用するために、潜伏空間におけるプロトタイプベースの損失を設計する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:21:50 GMT)
Inferring Outcome Means of Exponential Family Distributions Estimated by Deep Neural Networks [5.9]
分類的または指数関数的な家族結果に対するディープニューラルネットワーク(DNN)の推論は、まだ過小評価されていない。一般化された非パラメトリック回帰モデル(GNRM)に基づくDNN推定器を提案し、厳密な推論フレームワークを開発する。さらに、この手法を電子集中治療ユニット(eICU)データセットに適用し、ICUのリスクを予測し、臨床意思決定に患者中心の洞察を与える。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:55:26 GMT)
Embodied World Models Emerge from Navigational Task in Open-Ended Environments [5.8]
本研究では、ニューラルネットワークが相互作用によって空間概念を自律的に内部化できるかどうかを検討する。エージェントは,方向,距離,障害物回避などの空間特性を符号化することができることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:35:13 GMT)
Change State Space Models for Remote Sensing Change Detection [5.8]
変化状態空間モデルは、バイテンポラル画像間の関連する変化に着目して、変化検出のために特別に設計されている。提案したモデルは3つのベンチマークデータセットを通じて評価され、計算複雑性のごく一部で、ConvNets、ViTs、Mambaベースのモデルを上回った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:25:10 GMT)
TD-Suite: All Batteries Included Framework for Technical Debt Classification [5.7]
TD-Suiteはシームレスなエンドツーエンドパイプラインを提供し、初期データ取り込みからモデルトレーニングに至るまで、あらゆるものを管理する。生成されたモデルが堅牢であることを保証するため、TD-Suiteは重要なトレーニング方法論を取り入れている。このフレームワークは、計算集約的なモデルトレーニングプロセスに関連する二酸化炭素排出量の追跡と報告を統合する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:31:17 GMT)
CataractBot: An LLM-Powered Expert-in-the-Loop Chatbot for Cataract Patients [5.6]
CataractBot は LLM を用いて即座に白内障手術に関連する質問に答え、知識ベースをクエリし、専門家が検証した応答を非同期に提供する。 CataractBotは、49人の患者とアテンダント、4人の医師、2人の患者コーディネーターによる初期展開調査で、任意のアクセシビリティを提供し、時間を節約し、さまざまなリテラシーレベルを調整し、患者と医師の間にプライバシー層を追加する可能性を示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:32:15 GMT)
A comprehensive review of remote sensing in wetland classification and mapping [5.6]
湿地は生物多様性と人間の幸福の両方を支える重要な生態系を構成している。 1970年代、研究者たちは湿地分類とマッピングにリモートセンシング技術を使い始めた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:59:36 GMT)
Differentially Private 2D Human Pose Estimation [5.6]
2D-HPE(differially Private Gradient Descent, DP-SGD)を応用し, 初めての個人用2次元ポーズ推定手法を提案する。当社のアプローチはマルチメディア解釈タスクにおいて特に有用であり,多様な視覚メディア間でのプライバシー保護分析と人間の動作の理解を可能にしている。この研究は、現実世界の機密性の高いアプリケーションにおいて、プライバシー保護のための人間のポーズ推定の基礎を築いた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:59:35 GMT)
Gravitational back-reaction is magical [5.6]
本研究では,非局所魔法は絡み合いスペクトルの非平坦性によって下界を低くし,システム内の絡み合いの量によって上界を覆っていることを示す。共形場の理論では、状態の近似が許されるとき、非局所魔法は絡み合いのエントロピーと線形にスケールするべきであると推測する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:33:09 GMT)
Evaluation Report on MCP Servers [5.5]
我々は,MPPサーバの有効性と効率を評価するため,MPPBenchと呼ばれる評価フレームワークを提案する。実験の結果,最も有効なMPPであるBing Web Searchの精度は64%であった。この研究は、最適化されたMPPの実装に関するさらなる調査の道を開くもので、最終的にはAI駆動のアプリケーションとデータ検索ソリューションの改善につながります。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:40:12 GMT)
Measuring training variability from stochastic optimization using robust nonparametric testing [5.5]
本稿では,モデル類似度を測定するために,ロバストな仮説テストフレームワークと,新たな要約統計量である$alpha$-trimmingレベルを提案する。仮説を$alpha$-trimmingレベルで直接適用することは、null仮説の下で分布を正確に記述できないため、難しい。モデル変数の測定に$alpha$-trimmingレベルを使用する方法を示し、パフォーマンス指標よりも表現力が高いことを実験的に実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:34:06 GMT)
A Metropolis-Adjusted Langevin Algorithm for Sampling Jeffreys Prior [5.5]
推測と推定は統計学、システム同定、機械学習の基本的な側面である。 Jeffreys氏は2つの重要な利点があるので、前もって魅力ある非形式的だ。本稿では,メトロポリス調整ランゲヴィンアルゴリズムを用いた一般的なサンプリング手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:25:02 GMT)
Frequency-Aware Attention-LSTM for PM$_{2.5}$ Time Series Forecasting [5.5]
FALNetは周波数対応LSTMネットワークであり、周波数領域の分解、時間的モデリング、注意に基づく改善を統合している。実世界の都市大気質データセットで実施された実験は、FALNetが従来のモデルより一貫して優れていることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:16:00 GMT)
SDFs from Unoriented Point Clouds using Neural Variational Heat Distances [5.4]
本研究では,無向点雲からニューラルサイン付き距離場を計算するための新しい変分法を提案する。一般的に用いられるアイコナー方程式を熱法に置き換え、ニューラルドメインに伝達する。提案手法は,現状の表面再構成と一貫したSDF勾配を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:13:54 GMT)
Iterative Linear Quadratic Regulator for Quantum Optimal Control [5.3]
量子システムのゲート最適化に適応させることにより、反復線形二次制御器と量子最適制御との接続を確立する。我々は,2レベルと3レベルを模擬した1ビットおよび2ビットの固定周波数トランスモン上で,Xおよびクロス共振ゲートの高忠実度シミュレーション結果を得た。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:36:32 GMT)
Multi-output Classification Framework and Frequency Layer Normalization for Compound Fault Diagnosis in Motor [5.2]
本研究は,故障診断における領域適応のための多出力分類(MOC)フレームワークを提案する。従来のマルチクラス分類 (MCC) 法とは異なり, 提案手法は個別に各断層の重大度を推定する。 PLデータを用いた6つの領域適応事例を対象とした評価の結果,MOCはマクロF1スコアにおいてベースラインモデルよりも優れていた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:40:16 GMT)
From Misleading Queries to Accurate Answers: A Three-Stage Fine-Tuning Method for LLMs [5.2]
大規模言語モデル(LLM)は自然言語処理(NLP)において優れた性能を示す既存の方法は出力の修正に重点を置いているが、LLMが入力自体の誤解を招くコンテンツを検出し修正する能力を改善する可能性を見落としていることが多い。入力中のミスリード情報を検出・修正するLLMの能力を向上する新しい3段階微調整法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:16:45 GMT)
SAR-to-RGB Translation with Latent Diffusion for Earth Observation [5.2]
本稿では,SAR入力から合成光学画像を生成するための拡散モデル(DM)に基づくSAR-to-RGB変換手法を提案する。本研究は,陸地被覆分類や雲の除去を含む下流作業において生成した画像を評価する。本研究は,RGB画像が欠落しているRSアプリケーションにおいて,SAR-to-RGB翻訳のためのDMの可能性を明らかにするものである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:58:30 GMT)
Never Start from Scratch: Expediting On-Device LLM Personalization via Explainable Model Selection [5.2]
大規模言語モデル(LLM)のパーソナライズは,異なるモバイルユーザのニーズを満たすために,実践的なアプリケーションにおいて重要である。提案するXPerTは,このようなパーソナライズされたLLMの適切な選択を,どのように微調整されているかの説明可能性に基づいて保証する手法である。実験の結果,XPerTはデバイス上でのLCMパーソナライズコストを83%削減し,データ効率を51%向上した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:38:06 GMT)
"A Good Bot Always Knows Its Limitations": Assessing Autonomous System Decision-making Competencies through Factorized Machine Self-confidence [5.2]
本稿では,アルゴリズムによる意思決定における能力向上に寄与するいくつかの要因について,一意に考察したFactized Machine Self-confidence(FaMSeC)フレームワークを提案する。 FaMSeCでは、自己自信指標はマルコフ決定過程の解法に埋め込まれた「確率問題解決統計」によって導出される。マルコフ決定プロセスエージェントの詳細な説明と例を含み、さまざまなタスクのコンテキストにおいて、結果評価と問題解決の質要因がどのように見つかるかを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:11:56 GMT)
Co-STAR: Collaborative Curriculum Self-Training with Adaptive Regularization for Source-Free Video Domain Adaptation [5.1]
Co-STARはカリキュラム学習と、ソース学習された教師と対照的な視覚言語モデル(CLIP)の協調的自己学習を統合しているカリキュラム学習アプローチでは,教師とCLIPの双方向予測アライメントを測定し,信頼性と不確実性の予測のバランスをとる信頼性に基づく重み関数を用いる。さらに適応性を向上させるために,適応型カリキュラム正規化を提案し,その信頼性スコアと予測安定性に基づいて,確率的,適応的な方法でサンプルの学習優先度を変更する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:47:35 GMT)
Making Acoustic Side-Channel Attacks on Noisy Keyboards Viable with LLM-Assisted Spectrograms' "Typo" Correction [5.1]
マイクロホンのデバイスへの大規模な統合はアコースティックサイドチャネルアタック(ASCA)の機会を増大させる ASCAの現在の状態-Of-The-Art(SOTA)モデルは、現実的な雑音条件下では限られた堅牢性を示す。本稿では,視覚変換器(VTs)と大言語モデル(LLMs)をASCAに組み込む一貫したアプローチを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:23:25 GMT)
Benchmarking Next-Generation Reasoning-Focused Large Language Models in Ophthalmology: A Head-to-Head Evaluation on 5,888 Items [5.1]
本研究は, 新たに開発した4つのLLMの精度と推論能力を総合的に評価し, 比較した。 O1 と DeepSeek-R1 は最高精度を達成し、O1 は Macro-F1 (0.900) もリードした。 o3-mini in ROUGE-L (0.151), o1 in METEOR (0.232), DeepSeek-R1 and o3-mini connected for BERTScore (0.673), DeepSeek-R1 (-4.105), Gemini 2.0 Flash-Thinking (-4.127) performed in BART
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:42:34 GMT)
Scalability and Maintainability Challenges and Solutions in Machine Learning: Systematic Literature Review [5.0]
本稿では,機械学習(ML)システムにおけるスケーラビリティと保守性に関する重要な課題と解決策について考察する。 MLアプリケーションがますます複雑になり、業界全体に広まっていくにつれ、システムのスケーラビリティと長期的な保守性とのバランスの必要性が大きな懸念事項となっている。我々は124の論文を分析し、41の保守性課題と13のスケーラビリティ課題とそれに対応するソリューションを特定し、分類した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:24:43 GMT)
Morphing-based Compression for Data-centric ML Pipelines [5.0]
データ中心の機械学習パイプラインは、データクリーニング、拡張、機能エンジニアリングのための外部ループによって、従来の機械学習(ML)パイプラインを拡張する。特徴変換とエンジニアリングを通じて圧縮を推し進め、構造変換に関する情報を活用するBWAREを紹介する。 BWAREは、エンドツーエンドのランタイムを大幅に改善し、データ中心のMLパイプラインを数日から数時間でトレーニングするための実行時間を短縮する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:02:34 GMT)
Q-Cluster: Quantum Error Mitigation Through Noise-Aware Unsupervised Learning [5.0]
QEM(Quantum error mitigation)は、量子コンピューティングにおけるノイズの影響を低減するために重要である。本稿では、教師なし学習(クラスタリング)を用いて測定ビットストリング分布を再構成する新しいQEM手法Q-Clusterを提案する。提案したQ-Cluster方式は,出力分布の最小値よりも平均1.46倍の忠実度を向上することを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:53:39 GMT)
VR-Splatting: Foveated Radiance Field Rendering via 3D Gaussian Splatting and Neural Points [5.0]
本稿では,パフォーマンススイートスポットに関する両点描画方向の長所を結合した,新しいハイブリッドアプローチを提案する。焦点のみの場合、我々は小さなピクセルフットプリントのために畳み込みニューラルネットワークでニューラルネットワークを使用し、鋭く詳細な出力を提供する。提案手法は,標準的なVR対応3DGS構成と比較して,シャープネスとディテールが向上することを確認した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:59:15 GMT)
Comparing Next-Day Wildfire Predictability of MODIS and VIIRS Satellite Data [4.9]
我々は,1日前に広がる山火事の予報にVIIRSとMODISのデータがどの程度有効かを評価する。 VIIRSを入力とし、VNP14をターゲットとしたモデルが最良の結果を得る。我々は、MOD14は翌日の火災予報には適さないと結論し、VNP14の方がずっと良い選択肢であると結論付けた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:45:59 GMT)
QualiTagger: Automating software quality detection in issue trackers [4.9]
この研究は、Transformerのような最先端のモデルを使って、テキストが通常、異なる品質特性に関連付けられているものを特定する。また,オープンアクセス可能なソフトウェアリポジトリからのイシュートラッカにおける品質分布についても検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:40:40 GMT)
SafeChat: A Framework for Building Trustworthy Collaborative Assistants and a Case Study of its Usefulness [4.9]
SafeChatは、安全で信頼性の高いチャットボットを構築するための一般的なアーキテクチャです。 SafeChatの主な特徴は、 (a) 応答が承認されたソース(保証)に対して基礎付けられてトレース可能なドメインに依存しない設計による安全性、 (b) ユーザビリティ、長いレスポンスの自動抽出によるソースへのトレーサビリティ、 (c) CSV駆動ワークフロー、自動テスト、各種デバイスとの統合を含む、高速でスケーラブルな開発である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:41:45 GMT)
Emergence of Goal-Directed Behaviors via Active Inference with Self-Prior [4.9]
幼児は、外部報酬基準が提供されていない場合でも、感覚刺激に手を伸ばすなど、目標指向の行動を示すことが多い。我々は「自己優先」と呼ばれるエージェント自身のマルチモーダル感覚経験のための新しい密度モデルを提案する。本研究は、エージェント自身の感覚経験によって形成される本態的に動機づけられた行動を実装し、初期発達における意図的行動の自然発生を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:16:27 GMT)
E2E Parking Dataset: An Open Benchmark for End-to-End Autonomous Parking [4.9]
エンドツーエンドの自律駐車のための高品質なデータセットを作成し、オープンソース化します。元のモデルを用いて、平均位置と向きの誤差が低い85.16%の総合的な成功率を達成する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:21:09 GMT)
Multi-scale DeepOnet (Mscale-DeepOnet) for Mitigating Spectral Bias in Learning High Frequency Operators of Oscillatory Functions [4.7]
Mscale-DeepOnetはDeepOnetのスペクトルバイアスを低減するために提案されている。マッピング自体とそのイメージの様々な高周波成分をキャプチャできることが示されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:19:54 GMT)
OpenTuringBench: An Open-Model-based Benchmark and Framework for Machine-Generated Text Detection and Attribution [4.7]
Open Large Language Models (OLLM) は、生成AIアプリケーションにますます活用されている。 OLLMをベースとした新しいベンチマークであるOpenTuringBenchを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:36:14 GMT)
Counterfactual Fairness Evaluation of Machine Learning Models on Educational Datasets [4.7]
グループフェアネスは教育において広く研究されているが、因果的文脈における個々のフェアネスに焦点を当てている。本稿では、機械学習モデルの対実的公正性分析を行うことにより、教育データに対する対実的公正性の概念を考察する。本研究は, 因果的属性の因果性および因果的個人的公平性について, 反事実的公正性が有意な洞察を与えることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:25:40 GMT)
Unveiling the Threat of Fraud Gangs to Graph Neural Networks: Multi-Target Graph Injection Attacks Against GNN-Based Fraud Detectors [4.7]
最近の発見は、詐欺がギャングや集団としてますます組織化されていることを示唆している。本研究では,詐欺集団が不正行為を虚偽化して不正なノードを良心と誤分類することを目的とした攻撃シナリオを設計する。これらのシナリオに基づいて,実世界の3件の詐欺事件における詐欺集団の攻撃をシミュレートすることにより,GNNベースの詐欺検知器に対する敵攻撃について検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:43:49 GMT)
Hessian stability and convergence rates for entropic and Sinkhorn potentials via semiconcavity [4.6]
これは、一般の非有界な環境でのこの2階の定量的安定性推定に対処する最初の研究である。我々はシンクホーンのアルゴリズムに沿ってシンクホーンの勾配とヘッセンの指数収束率を導出する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:34:09 GMT)
Uncertainty Estimation for Trust Attribution to Speed-of-Sound Reconstruction with Variational Networks [4.5]
音速(SoS)は組織の生体力学的特性であり、そのイメージングは診断に有望なバイオマーカーを提供することができる。本稿では,SoS再建における不確実性を利用して,各獲得フレームの属性を信頼することを提案する。良性線維腺腫と悪性癌とを鑑別し,乳腺癌鑑別のための自動フレーム選択法について検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:48:51 GMT)
Fine-Tuning Large Language Models on Quantum Optimization Problems for Circuit Generation [4.4]
大規模言語モデル(LLM)は複雑な問題に対処する上で大きな成果を上げている。本稿では,LLMを利用して量子回路を大規模に自動生成する方法を示す。我々は、量子最適化のランドスケープの大部分をカバーする14,000個の量子回路を準備した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:56:54 GMT)
Rainy: Unlocking Satellite Calibration for Deep Learning in Precipitation [4.4]
降水は地球の水循環において重要な役割を担い、生態系、農業、水資源管理に直接影響を与えている。近年、定量的リモートセンシング(QRS)において人工知能(AI)が注目を集めている。レーニーデータセットは,(1)衛星キャリブレーション,(2)降水イベント予測,(3)降水レベル予測,(4)時間予測,(5)降水ダウンスケーリングの5つの主要なタスクをサポートする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:30:46 GMT)
A quantum algorithm for estimating the determinant [4.4]
このアルゴリズムは、$n×n$正のスパース行列の行列式を精度$epsilon$ in time $cal O(log n/epsilon3)$と推定する。量子スペクトルサンプリングアルゴリズムは、$sum_j f(lambda_j)$とすると、$lambda_j$は行列固有値である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:32:36 GMT)
TradingAgents: Multi-Agents LLM Financial Trading Framework [4.3]
TradingAgentsは、トレーディング会社にインスパイアされた新しい株式トレーディングフレームワークを提案する。基本的なアナリスト、センチメントアナリスト、テクニカルアナリスト、さまざまなリスクプロファイルを持つトレーダーといった専門的な役割でLLMを動力とするエージェントが特徴である。動的で協調的なトレーディング環境をシミュレートすることで、このフレームワークはトレーディングのパフォーマンスを改善することを目指している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:23:27 GMT)
Recommending Clinical Trials for Online Patient Cases using Artificial Intelligence [4.3]
われわれはTrialGPTを用いて,50例のオンライン患者を臨床試験に適合させ,従来のキーワード検索と比較して評価した。以上の結果から,TrialGPTは従来の方法よりも46%優れており,各患者は平均で約7回の治験が可能であった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:56:36 GMT)
Fast-Powerformer: A Memory-Efficient Transformer for Accurate Mid-Term Wind Power Forecasting [4.3]
風力発電予測は、電力グリッドのセキュリティ、安定性、経済活動を強化する上で重要な役割を担っている。気象要因(風速など)の高度化と風力出力の大幅な変動により、中期風力予測は高い精度と計算効率を維持するという2つの課題に直面している。本稿では,Fast-Powerformerと呼ばれる,効率的かつ軽量な風力予測モデルを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:09:54 GMT)
IAA: Inner-Adaptor Architecture Empowers Frozen Large Language Model with Multimodal Capabilities [4.3]
マルチモーダル大言語モデル(MLLM)のための内適応アーキテクチャを導入する。このアーキテクチャは、大きな言語モデル内の様々な深さで複数のマルチモーダルアダプタを組み込んで、テキスト指向のトランスフォーマー層との直接の相互作用を容易にする。大規模な整列データを必要とする従来のフリーズ言語モデルとは異なり、提案アーキテクチャは小規模データセットにおいて優れた性能を実現することができる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:28:22 GMT)
MLPs and KANs for data-driven learning in physical problems: A performance comparison [4.3]
Kolmogorov-Layer Networks(KAN)は、MLP(Multi-Arnold Perceptrons)に代表される従来のニューラルネットワークの代替品である。将来を示す一方で、物理学に基づく問題における性能上の優位性はほとんど未解明のままである。これはkansが有望な選択であり、物理システムを含むアプリケーションにおける効率性と精度のバランスを提供することを示唆している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:13:42 GMT)
Why am I seeing this? Towards recognizing social media recommender systems with missing recommendations [4.2]
グラフニューラルネットワーク(GNN)を用いた自動レコメンダ認識手法を提案する。提案手法は,隠されたレコメンデータの正確な検出とユーザ行動への影響を可能にする。この研究は、レコメンダが行動をどのように形成し、偏光と誤情報を減らすための努力を支援するかについての洞察を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:16:17 GMT)
Bypassing Prompt Injection and Jailbreak Detection in LLM Guardrails [4.2]
大規模言語モデル(LLM)ガードレールシステムは、迅速な注入や脱獄攻撃を防ぐために設計されている。本稿では, 点検と脱獄検出の2つの方法を示す。両手法が対向ユーティリティを維持しながら検出を回避できることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:16:02 GMT)
WildLive: Near Real-time Visual Wildlife Tracking onboard UAVs [4.2]
WildLiveは、航空機(UAV)上で直接走る高解像度画像のための、ほぼリアルタイムの動物検出と追跡のためのフレームワークである。このシステムは、高高度飛行時の操作に適した4Kビデオストリーム上で、HDで17 fps+、HDで7 fps+でマルチアニマル検出を行う。このデータセットは、ケニアのOl Pejeta Conservancyで収集された4K UAVビデオから、19k以上のフレームにわたる200k以上の注釈付き動物インスタンスで構成されています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:06:09 GMT)
Fine-Grained Rib Fracture Diagnosis with Hyperbolic Embeddings: A Detailed Annotation Framework and Multi-Label Classification Model [4.2]
骨折分類に適した新しいリブ骨折アノテーションプロトコルを提案する。放射線画像と臨床像を橋渡しするクロスモーダル埋め込みを利用して骨折分類を強化した。本手法では, フラクチャーの階層的性質を捉え, 視覚的特徴やテクスチャ記述を共有非ユークリッド多様体にマッピングするために, 双曲的埋め込みを用いる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:47:09 GMT)
Reinforcement Learning Platform for Adversarial Black-box Attacks with Custom Distortion Filters [4.0]
敵のブラックボックスを標的とせず攻撃対象とするための強化学習プラットフォーム RLAB を提案する。このプラットフォームでは、Reinforcement Learningエージェントを使用して、入力画像に最小の歪みを加えると同時に、ターゲットモデルによる誤分類を発生させる。提案手法は, 誤分類の原因となるクエリ数の平均から, 最先端の手法よりも優れている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:15:08 GMT)
High-Efficiency, Low-Loss Floquet-mode Traveling Wave Parametric Amplifier [3.9]
第1Floquetモード走行波パラメトリック増幅器(Floquet TWPA)の実験的検討を行った。 Floquet TWPAは、ほぼ量子制限ノイズ性能、最小散逸、ブロードバンド動作を実現する。これらの汎用Floquet TWPAは、大規模量子システムにおける高速かつ高忠実な多重化読み出しに適している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:45:48 GMT)
Recurrence method in Non-Hermitian Systems [3.9]
開境界条件下での非エルミート系のエネルギースペクトルの新規かつ体系的な再帰法を提案する。我々の定式化は、数値対角化や非ブロックバンド理論よりも、マルチバンド非エルミート系の精度と性能を示す。我々の反復法は、開境界条件下での非エルミート系の興味深い物理学に、新しく好意的な定式化を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:00:15 GMT)
CLASH: Evaluating Language Models on Judging High-Stakes Dilemmas from Multiple Perspectives [3.8]
CLASH (Character perspective-based LLM Assessments in situations with High-Stakes) は、345のハイインパクトジレンマと3,795の個人視点からなるデータセットである。 GPT-4oやClaude-Sonnetのような最強のモデルでさえ、決定が曖昧であるべき状況を特定する上で、50%未満の精度を達成する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:54:16 GMT)
TerraMesh: A Planetary Mosaic of Multimodal Earth Observation Data [3.7]
TerraMeshは、光学、レーダー、標高、土地被覆のモダリティを単一のフォーマットで組み合わせた、グローバルに多様なマルチモーダルデータセットである。本研究では,TerraMeshで事前学習した際のモデル性能の向上を示す詳細なデータ処理手順,包括的統計,実証的証拠を提供する。データセットはパーミッシブライセンスで公開されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:20:35 GMT)
KubeFence: Security Hardening of the Kubernetes Attack Surface [3.7]
K8sは、金融、ヘルスケア、政府などの分野における重要なサービスを含む、コンテナ化されたアプリケーションのオーケストレーションに広く使用されている。広範かつ機能豊富なAPIインターフェースは、幅広い攻撃面を公開し、K8がソフトウェアの脆弱性や設定ミスの悪用に対して脆弱になる。本稿では,特定のクライアントワークロードに適した細粒度APIフィルタリングを実装した新しいソリューションであるKubeFenceを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:15:34 GMT)
Improving fingerprint presentation attack detection by an approach integrated into the personal verification stage [3.6]
プレゼンテーション攻撃検出(PAD)システムは通常、指紋認証システムとは独立して設計される。これは、PADがそのようなユーザのために特別に設計されるべきであるという意味ではない。本稿では,基本PADにCloseness Binary Code (CC)モジュールと呼ばれる革新的なアドオンモジュールを装備することを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:01:06 GMT)
Lateral Phishing With Large Language Models: A Large Organization Comparative Study [3.6]
大規模言語モデル(LLM)の出現は、高度にターゲットを絞った、パーソナライズされ、自動化された攻撃を発生させることで、フィッシングメールの脅威を増大させた。 LLMが生成する横型フィッシングメールの有効性を人間によるものであるものと比較する大規模な研究は乏しい。本研究は,教育機関におけるサイバーセキュリティ脅威の理解に寄与する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:38:22 GMT)
TerraMind: Large-Scale Generative Multimodality for Earth Observation [3.5]
TerraMindは、地球観測のための初の生成的マルチモーダル基礎モデルである。他のマルチモーダルモデルとは異なり、TerraMindはトークンレベルとピクセルレベルのデータを組み合わせたデュアルスケール表現で事前訓練されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:17:39 GMT)
TransitReID: Transit OD Data Collection with Occlusion-Resistant Dynamic Passenger Re-Identification [3.5]
Transit Origin-Destination (OD) データは、特に経路最適化と需要応答型パラトランジットシステムにおいて、トランジット計画に不可欠である。手動調査のような従来の手法はコストが高く非効率であるが、BluetoothとWiFiベースのアプローチでは、乗客は特定のデバイスを運ばなければならない。個人レベルのODデータ収集のための新しいフレームワークであるTransitReIDを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:09:02 GMT)
On relative universality, regression operator, and conditional independence [3.5]
相対普遍性の定義をko-measurabilityという概念を用いて修正する。この結果の意義は、十分な次元の減少という本来の文脈を超えている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:12:26 GMT)
Chypnosis: Stealthy Secret Extraction using Undervolting-based Static Side-channel Attacks [3.4]
我々は,チップの内部時計をフリーズできる,Chypnosisと呼ばれる,新たな静的サイドチャネル攻撃のクラスを導入する。我々は、チップの電圧を標準の基準値以下に素早く落とすことで、攻撃者はクロックと電圧センサーをバイパスし、いわゆるブラウンアウト状態にすることができることを示した。全てのクロック源が非活性化されているだけでなく、様々なクロックと電圧センサーがイベントを検出するのに失敗したことも示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:43:33 GMT)
Fault Tolerant Quantum Simulation via Symplectic Transvections [3.4]
本稿では,論理回路ブロック全体を一度に実行し,そのグローバルな構造を保存するためのフレームワークを提案する。この全ブロックアプローチは、任意の安定化器符号に論理トロッター回路を直接実装することができる。我々のアプローチの核心はシンプレクティック・トランスベクションとトロッター・サーキットの深い構造的対応にある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:56:07 GMT)
Quantum Conference Key Agreement with Classical Advantage Distillation [3.4]
古典的有利蒸留(CAD)プロトコルを付加した量子会議鍵契約(QCKA)プロトコルの安全性を実証する。我々は、セキュリティの証明を有限のキー設定で導き、一般的な、一貫性のある攻撃に対して安全なキーレートを拘束することができる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:41:07 GMT)
Probability Distribution Alignment and Low-Rank Weight Decomposition for Source-Free Domain Adaptive Brain Decoding [3.3]
脳の復号化は現在、個人差、モダリティアライメント、高次元埋め込みにおいて重大な課題に直面している。ソースフリーなドメイン適応型脳復号化フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:42:51 GMT)
Towards Symmetric Low-Rank Adapters [3.3]
より少ない重みを持つLoRAの最適化版であるSymmetric Low-Rank Adaptersを導入する。この方法は、下流タスクをより効率的に学習するために、低ランク対称重み行列を利用する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:46:20 GMT)
Balancing Forecast Accuracy and Switching Costs in Online Optimization of Energy Management Systems [3.3]
本研究では,エネルギー管理システムにおける予測と最適化の統合について検討する。我々は,予測精度と安定性がスイッチングコストとどのように相互作用するかを,理論的かつ実証的な枠組みで検証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:12:35 GMT)
DeepWheel: Generating a 3D Synthetic Wheel Dataset for Design and Performance Evaluation [3.3]
本研究では,生成AIを用いた合成設計・性能データセット生成フレームワークを提案する。このフレームワークは、まず安定拡散を用いて2次元描画画像を生成し、2.5次元深さ推定により3次元形状を再構成する。最終データセットはDeepWheelと呼ばれ、6000以上の写真リアル画像と900以上の構造解析された3Dモデルで構成されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:20:00 GMT)
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning [3.3]
人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデルの出力と人間の嗜好を整合させる重要な手法として登場した。既存のRLHFアルゴリズムの多くはBradley-Terryモデルを使用しており、これは人間の好みに関する仮定に依存しており、現実世界の判断の複雑さや変動性を反映していない。そこで我々は,そのような報酬モデルの不特定条件下での既存手法の性能向上のための頑健なアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:29:06 GMT)
InfoClus: Informative Clustering of High-dimensional Data Embeddings [3.2]
説明付きパーティショニングという新しい概念を導入する。この考え方は、表示されたデータをグループに分割し、それぞれにまばらな説明を与えるというものである。 InfoClus は次元還元に基づく散乱プロットの解析において,優れた出発点を自動生成できることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:34:03 GMT)
Cryo-em images are intrinsically low dimensional [3.2]
ヘマグルチニンのCryo SBI発現の基盤的構造に関する研究(シミュレーションおよび実験) 我々は、潜伏構造と鍵物理パラメータの直接的なリンクを確立する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:46:25 GMT)
MedMerge: Merging Models for Effective Transfer Learning to Medical Imaging Tasks [3.2]
異なるモデルの重みをマージする手法であるMedMergeを提案する。マージしたモデルでは,F1スコアが最大7%向上し,大幅なパフォーマンス向上が達成できることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:56:49 GMT)
Benchmarking Biopharmaceuticals Retrieval-Augmented Generation Evaluation [3.1]
大規模言語モデル (LLMs) を評価するために, バイオ医薬品検索生成評価 (BRAGE) を導入する。従来のQA(QA: Question-Answering)メトリクスは、オープンエンドの検索強化されたQAシナリオでは、正確さと正確なマッチが不足する。実験の結果, LLMの生薬QRUCには大きなギャップがあり, QRUCの改善が必要であることが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:25:40 GMT)
Entangled Subspaces through Algebraic Geometry [3.1]
本論文では,多部量子系のヒルベルト空間内での絡み合った部分空間を構成するための代数的アプローチを提案する。この手法を用いることで、最小次元の非直交的かつ拡張不可能な製品基底(nUPB)を構築する。マルチキューシステムでは、対称 GES の最大到達可能次元を決定し、この構成を通じてその実現を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:00:00 GMT)
Deep Learning-based Bathymetry Retrieval without In-situ Depths using Remote Sensing Imagery and SfM-MVS DSMs with Data Gaps [3.1]
本研究では,SfM-MVS法の高忠実度3次元再構成機能と最先端屈折補正技術を組み合わせた手法を提案する。この統合により、SfM-MVSから派生したデータギャップを持つDSMをトレーニングデータとして使用して完全なバスメトリックマップを生成する、シナジスティックなアプローチが可能になる。本稿では,U-Net と Swin Transformer の自己アテンション層と相互アテンション機構を組み合わせた Swin-BathyUNet を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:31:48 GMT)
Face processing emerges from object-trained convolutional neural networks [3.0]
ドメイン・ジェネラル・メカニズムは、顔に特別な事前トレーニングを加えることなく、顔処理がニューラルネットワークから現れることを実証している。私たちはCNNをオブジェクトのみにトレーニングし、顔の認識と表現能力と、顔のように見えるオブジェクトをテストしました。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:31:26 GMT)
Focal Split: Untethered Snapshot Depth from Differential Defocus [3.0]
Focal Splitは、DfDD(Deep-from-differential-defocus)に基づくフル搭載パワーとコンピューティングを備えたハンドヘルド・スナップショットデプスカメラである。その無彩色光学系は、同時にシーンの2つの差分非焦点画像を形成し、スナップショット内の2つの光センサーを用いて独立にキャプチャすることができる。我々は,Raspberry Pi 5に接続されたハンドヘルドカスタムカメラシステムを備えたFocal Splitのプロトタイプを実時間データ処理のためにデモした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:01:36 GMT)
Evaluating Trust in AI, Human, and Co-produced Feedback Among Undergraduate Students [2.9]
学生は一般的にAIを好んでおり、人間のフィードバックよりも有用性や客観性という観点でフィードバックを共同生成している。男性学生は、すべてのフィードバックタイプが女性や非バイナリーのタイプよりも価値が低いと一貫して評価した。これらの知見は、高等教育フィードバックシステムにAIを統合するためのエビデンスベースのガイドラインを示唆する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:06:36 GMT)
Limitations of Automatic Relevance Assessments with Large Language Models for Fair and Reliable Retrieval Evaluation [2.9]
大規模言語モデル(LLM)は,自動関連性評価ツールとして注目されている。近年の研究では、LLMに基づく評価が、人為的判断と高いシステムランキングの相関をもたらすことが示されている。我々は,LLMによる判断が,上位評価システム間の順位差をいかに保っているか,また,人間の判断として相互に重要な評価を保っているかを検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:11:18 GMT)
New Key Rate Bound for High-Dimensional BB84 with Multiple Basis Measurements [2.9]
我々は高次元BB84プロトコルの秘密鍵レートに新たなバウンダリを導出する。一般的なチャネルにおいても、より楽観的なキーレートが低信号数で実現可能であることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:55:24 GMT)
Tripartite Haar random state has no bipartite entanglement [2.8]
本研究では,EPR様二部晶の絡み合いを三部晶のハールランダム状態から蒸留することは不可能であることを示す。 EPRに類似したエンタングルメントを持つ状態のサンプリングの確率を、所定のEPR忠実度トレランスで上界に導出する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:09:57 GMT)
DRIFT open dataset: A drone-derived intelligence for traffic analysis in urban environmen [2.8]
DRone由来のインテリジェンス・フォー・トラヒック・アナリティクス(DRIFT)データセットは、高度約250mのドローンビデオから体系的に収集された大規模な都市交通データセットである。 DRIFTは、方向情報を含む高解像度の車両軌道を提供し、ビデオ同期とオルトマップアライメントによって処理される。このデータセットは,交通流解析やシミュレーション研究などの学術研究や実用化に大きく貢献することが期待されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:43:13 GMT)
REAL: Benchmarking Autonomous Agents on Deterministic Simulations of Real Websites [2.7]
実世界のWebサイトの決定論的シミュレーションにおけるマルチターンエージェント評価のためのベンチマークおよびフレームワークであるREALを紹介する。 REALは、Eコマース、旅行、コミュニケーション、プロフェッショナルネットワーキングといったドメインで広く使われている11のウェブサイトの高忠実で決定論的レプリカで構成されている。また、日々の複雑なユーザインタラクションを反映した112の実践的なタスクからなるベンチマークもリリースしています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:22:55 GMT)
SS4Rec: Continuous-Time Sequential Recommendation with State Space Models [2.7]
本稿では,連続的なレコメンデーションのためにSS4Recと呼ばれるハイブリッドSSMモデルを提案する。 SS4Recは、不規則な時間間隔を扱うための時間認識SSMと、コンテキスト依存をモデル化するための関係認識SSMを統合している。これにより、不規則な時間間隔から継続的依存関係をキャプチャし、時間固有のパーソナライズされたレコメンデーションを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:35:23 GMT)
Optical and spin properties of nitrogen vacancy centers formed along the tracks of high energy heavy ions [2.7]
色中心を含む欠陥は、多くの材料で遅延損傷トラックに沿って再結合または形成することができる。ダイヤモンド中の1GeV金およびウランイオンの遅延線に沿った色中心形成について報告する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:21:22 GMT)
Fully smooth one shot multipartite soft covering of quantum states without pairwise independence [2.7]
我々は,量子状態に対する一発多部被覆,いわゆる凸分割,型結果の完全なスムーズな証明を行う強力な機械を提供する。古典的量子状態に対してスムーズな多重粒子凸が分裂する重要なケースでは、これらの状態の特定の辺縁がペア独立性を満たさない場合でも、我々の機械は機能する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:34:51 GMT)
Algorithmic Advances Towards a Realizable Quantum Lattice Boltzmann Method [2.7]
量子格子ボルツマン法(quantum Lattice Boltzmann Method, QLBM)は、量子コンピューティングの可能性を実現する最も有望な手法の1つである。我々は、QLBMアルゴリズムを量子コンピュータ上で初めて実装できる、新しいアルゴリズムの進歩を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:02:41 GMT)
Learning-Based User Association for MmWave Vehicular Networks With Kernelized Contextual Bandits [2.6]
高速なmmWaveチャネルを頻繁に見積もるのはコストがかかる。提案した分散カーネル化アッパー信頼境界(DK-UCB)アルゴリズムは,現在の即時伝送速度を推定する。我々は,mmWave信号の伝搬特性を組み込んだRKHSにおける新しいカーネル関数を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:05:27 GMT)
Efficient and Robust Remote Sensing Image Denoising Using Randomized Approximation of Geodesics' Gramian on the Manifold Underlying the Patch Space [2.6]
トレーニングサンプルの追加を必要としない頑健なリモートセンシング画像復調手法を提案する。この手法は、各色チャネルに独自の強調を課し、3つの分極チャネルをマージして最終画像を生成する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:46:05 GMT)
Time-adaptive Video Frame Interpolation based on Residual Diffusion [2.5]
ビデオフレーム(VFI)の拡散に基づく新しい手法を提案する。本研究では,ビデオフレーム(VFI)の拡散に基づく新しい手法を提案する。我々は、最先端のモデルに対する広範な比較を行い、このモデルがアニメーションビデオでこれらのモデルより優れていることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:25:08 GMT)
Unlocking the Wisdom of Large Language Models: An Introduction to The Path to Artificial General Intelligence [2.5]
マルチLLMコラボレーティブ・インテリジェンス(英語版)の知恵を解き放つことは、The Path to Artificial General Intelligence(英語版)の全巻の紹介となる。 14のアフォリスムを通じて、マルチLLMエージェントコラボレーションインテリジェンス(英語版)のコア原則を抽出する。本書には、各章のタイトル、要約、紹介、および最初の2章の完全な内容が含まれている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:21:22 GMT)
SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models [2.5]
我々はSynLlamaを作成するために,MetaのLlama3 Large Language Modelsを微調整した新しいアプローチを提案する。 SynLlamaは、一般的にアクセス可能なビルディングブロックと堅牢な有機反応テンプレートからなる完全な合成経路を生成する。外部のビルディングブロックをトレーニングしなくても、SynLlamaが効果的に一般化され、見つからず、購入可能なビルディングブロックとなることが分かりました。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:08:03 GMT)
Transforming Resonance Fluorescence into Maximally Entangled Photon Pairs Using Minimal Resources [2.5]
絡み合いは量子力学の基本的な概念であり、古典的な限界を超える強い相関を示す2つ以上の量子系を記述する。ここでは、弱い結合した2レベルエミッタからの共鳴蛍光が、時間-ビンベースで最大に絡み合う光子の対の列に変換できることを実験的に実証する。本研究は,帯域幅に制限のある光子対を効率よく実現するための方法である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:33:14 GMT)
Stable and High-Precision 3D Positioning via Tunable Composite-Dimensional Hong-Ou-Mandel Interference [2.4]
香港-奥羽-マンデル干渉に基づく安定かつ高精度な3次元量子位置決め方式を提案する。本手法は,検出光子の数が限られている場合でも,高精度で信頼性の高い3次元位置決めを実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:01:22 GMT)
Text-Driven 3D Lidar Place Recognition for Autonomous Driving [2.3]
Des4Posは、新しい2段階のテキスト駆動型リモートセンシングローカライゼーションフレームワークである。トップ1の精度は40%、トップ10の精度は半径5mの閾値で77%に達する。 KITTI360Poseテストセットの実験では、テキスト・ツー・ポイント・クラウドの場所認識におけるDes4Posの最先端性能が実証された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:22:14 GMT)
Shifting Work Patterns with Generative AI [2.3]
本稿では,生産型AIが知識労働者の作業パターンをどのように変えるかを示す。 6000人の労働者の半数は、電子メール、文書作成、会議にすでに使用しているアプリケーションに統合された生成AIツールにアクセスした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:52:00 GMT)
DeNOTS: Stable Deep Neural ODEs for Time Series [2.3]
ニューラルODEは、複雑な時間スタンプデータの時間的進化を捉えるために設計されたメソッドの顕著な分岐である。適応的な負のフィードバック機構を導入することで、これらのモデルを確実に安定化する。 3つのオープンデータセットに対して,提案手法は下流品質を最大20%改善する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:49:17 GMT)
A DeepONet for inverting the Neumann-to-Dirichlet Operator in Electrical Impedance Tomography: An approximation theoretic perspective and numerical results [2.2]
本研究では,電気インピーダンストモグラフィーの非侵襲的医療画像モダリティについて考察する。問題は、電流-電圧マップから生じる一連のデータから媒体の伝導性を回復することである。演算子対関数写像を暗黙的に定義した演算子対関数写像の学習を目標とする演算子学習問題として,この逆問題を定式化する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:32:00 GMT)
Probing Quantum Anomalous Hall States in Twisted Bilayer WSe2 via Attractive Polaron Spectroscopy [2.2]
ツイストWSe2ホモバイ層(tWSe2)における量子異常ホール(QAH)状態の最初の光学的検出を報告した。以上の結果から,tWSe2は2次元景観におけるトポロジ的秩序と強い相関関係を調査するための,高度に汎用的で安定かつ光学的に対応可能なプラットフォームとして位置づけられた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:00:03 GMT)
Dynamical errors in machine learning forecasts [2.2]
本稿では,MAE や MSE などの標準予測誤差指標と基礎システムの動的特性との関係について検討する。以上の結果から,より高い$d$と高い$theta$の州では,予測誤差が大きくなる傾向が示唆された。予測値に対する$d$と$theta$の差を計測する動的指標に基づく誤差指標を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:16:13 GMT)
Evaluating DAO Sustainability and Longevity Through On-Chain Governance Metrics [2.1]
分散型自律組織(DAO)はスマートコントラクトを通じてガバナンスとリソース割り当てを自動化する。本稿では、金融評価における研究ギャップを特定し、キーパフォーマンス指標の枠組みを導入することにより、これらの課題に対処する。本フレームワークは,オンチェーンデータから構築された実世界のカスタム構築データセットに適用し,非パラメトリック手法を用いて分析する。その結果, 長期生存を損なう可能性のある低い参加率と高い提案者濃度を含む, 定期的なガバナンスパターンが明らかとなった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:13:20 GMT)
UKDM: Underwater keypoint detection and matching using underwater image enhancement techniques [2.1]
生成的敵ネットワークや畳み込みニューラルネットワークを含む高度なディープラーニングモデルを適用して、キーポイントの検出とマッチングを改善する。各種水中データセットにおけるこれらの手法の性能評価を行い,従来の手法に比べて有意な改善が認められた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:52:19 GMT)
Exploring Student Behaviors and Motivations using AI TAs with Optional Guardrails [2.1]
ガードレール(Guardrails)は、直接的なソリューションではなく、足場によるサポートを提供する機能である。 See Solution"機能はガードレールを無効にし、基盤となるモデルから冗長な応答を生成します。その結果、885人の学生の50%が少なくとも1つの問題に「See Solution」機能を使用し、14%が3つの問題に利用していることがわかった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:48:22 GMT)
Neural Control Barrier Functions from Physics Informed Neural Networks [2.1]
本稿では,物理に着想を得たニューラルネットワークフレームワークを活用した新しいニューラルネットワークCBFについて紹介する。 CBFをゼロにする代わりに相互にCBFを利用することで、フレキシブルでユーザ定義の安全な領域を指定できる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:13:30 GMT)
O-RAN xApps Conflict Management using Graph Convolutional Networks [2.1]
我々は Graph Convolutional Network (GCN) に基づく Graph-based Intelligent xApp Conflict Prediction and Analysis (GRAPHICA) と呼ばれる新しいデータ駆動手法を提案する。 GRAPHICAは3種類の競合(直接、間接、暗黙)を予測し、根本原因(xApp)をピンポイントする
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:49:44 GMT)
Safe-Construct: Redefining Construction Safety Violation Recognition as 3D Multi-View Engagement Task [2.1]
違反認識を3次元多視点エンゲージメントタスクとして再構成するフレームワークであるSafe-Constructを紹介する。 Safe-Constructは、4つの違反タイプにわたる最先端メソッドよりも7.6%改善されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:21:09 GMT)
A Real-time Anomaly Detection Method for Robots based on a Flexible and Sparse Latent Space [2.0]
ロボット工学におけるディープラーニングベースのモデルは、限られたトレーニングデータと非常にノイズの多い信号機能のために、課題に直面している。本稿では,これらの問題に対処するために,スパースマスク型自己回帰型フローベース適応型オートエンコーダモデルを提案する。我々のモデルは1ミリ秒以内の推論を行い、リアルタイムな異常検出を確実にする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:17:14 GMT)
DamageCAT: A Deep Learning Transformer Framework for Typology-Based Post-Disaster Building Damage Categorization [2.0]
本稿では,分類的分類的損傷記述を提供する新しいフレームワークであるDanceCATを紹介する。 TypoSATデータセットには、ハリケーン・アイダの衛星画像三つ子(災害前、災害後、被害マスク)が含まれている。階層的なU-Netベースのトランスフォーマーアーキテクチャは、災害前のイメージペアを効果的に処理し、建物の損傷を特定し分類する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:53:59 GMT)
Inferring Communities of Interest in Collaborative Learning-based Recommender Systems [1.9]
協調学習ベースのレコメンデーションシステムは、ユーザーが好みのアイテムの履歴をデバイスに保持しながらモデルをトレーニングすることを可能にする。最近の研究では、協調学習は様々なプライバシー攻撃に弱いことが示されている。本稿では,コミュニティ・推論・アタック(CIA)と呼ばれる新たな攻撃手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:24:14 GMT)
Enhanced Small Target Detection via Multi-Modal Fusion and Attention Mechanisms: A YOLOv5 Approach [1.9]
マルチモーダル画像融合とアテンション機構に基づく小さなターゲット検出手法を提案する。この方法はYOLOv5を活用し、赤外線および可視光データと畳み込みアテンションモジュールを統合して検出性能を向上させる。対UAVおよびVisdroneデータセットの実験結果は、我々のアプローチの有効性と実用性を示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:02:10 GMT)
Transfer Learning for Temporal Link Prediction [1.9]
時間的リンク予測(TLP)は、時間的に進化するグラフにおける将来のリンクを予測することを指す。メモリモジュールは、列車時に見られるノードに関する情報のみを格納する。メモリラデンモデルのための転送効率向上手法を開発した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:12:00 GMT)
Which Optimizer Works Best for Physics-Informed Neural Networks and Kolmogorov-Arnold Networks? [1.8]
我々は,バーガーズ,アレン・カシンスキー,ギンズバーグ・ランダウ方程式を含む,重要な挑戦的線形・剛性・多スケール非線形PDEについてPINNとPIKANを比較した。 PINN や PIKAN で一般的に用いられている他の機能拡張を使わずに改善点を明らかにした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:30:52 GMT)
Application of AI-based Models for Online Fraud Detection and Analysis [1.8]
オンライン不正検出のためのAIおよびNLP技術に関する体系的文献レビューを行う。各種オンライン詐欺カテゴリを解析するための最先端NLP技術について報告する。データ制限の問題、トレーニングバイアスレポート、モデルパフォーマンスレポートにおけるメトリクスの選択的な表示などを特定します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:05:24 GMT)
Robustness and sex differences in skin cancer detection: logistic regression vs CNNs [1.8]
この研究は、アルツハイマー病の研究の複製であり、患者性間のロジスティック回帰(LR)と畳み込みニューラルネットワーク(CNN)の堅牢性について研究した。性別構成の異なる複数のトレーニングデータセットにまたがって,これらのモデルを[28]と整合して評価し,ロバスト性を決定する。以上の結果より, LRとCNNはともに性分布に強く, また, CNNは男性患者よりも有意に精度が高く, 受信者操作特性 (AUROC) も有意に高かった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:31:46 GMT)
Data driven approach towards more efficient Newton-Raphson power flow calculation for distribution grids [1.6]
電力フロー(PF)計算は、安定かつ信頼性の高いグリッド動作を保証するために、電力系統解析の基礎となる。 The Newton-Raphson (NR) method is common used for PF analysis because its rapid convergence when appropriate。この研究は、NRを改善するための戦略を提案し、イテレーションを最小化し、ばらつきを避ける。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:37:55 GMT)
Timing Analysis Agent: Autonomous Multi-Corner Multi-Mode (MCMM) Timing Debugging with Timing Debug Relation Graph [1.6]
小さな金属ピッチとデバイス数の増加は、経験豊富な人間デザイナーがタイミング問題をデバッグするのに長いターンアラウンドタイムをもたらしている。大きな言語モデル(LLM)は、言語理解と対話的な意思決定において、様々なタスクにおいて大きな可能性を示しています。我々は、レポートと経験豊富なタイミングエンジニアのデバッグトレースの関係を結びつけるTDRG(Timing Relation Graph)を構築します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:14:36 GMT)
Byzantine Resilient Federated Multi-Task Representation Learning [1.6]
欠陥や悪意のあるエージェントを扱うビザンチン耐性のマルチタスク表現学習フレームワークBR-MTRLを提案する。このアプローチでは、クライアント固有の最終層を除いて、すべてのクライアントが固定層を共有する、共有ニューラルネットワークモデルによる表現学習を活用しています。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:53:58 GMT)
MULTI-LF: A Unified Continuous Learning Framework for Real-Time DDoS Detection in Multi-Environment Networks [1.6]
既存のAIベースの検出システムは、新たな攻撃戦略に適応し、リアルタイムの攻撃検出機能を欠いている。本研究では,M-EnネットワークにおけるDDoS検出のためのオンライン連続学習手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:44:53 GMT)
Fine-tuning Whisper on Low-Resource Languages for Real-World Applications [1.6]
非文レベルのデータは、長文音声のパフォーマンスを向上する可能性があるが、著作権法により取得が困難であり、しばしば制限される。我々の手法は、よりアクセスしやすい文レベルのデータを、長文音声を扱うモデルの能力を保持するフォーマットに変換することで、このギャップを埋める。我々のモデルは、未調整のWhisperと、これまでの最先端のスイスのドイツのSTTモデルと比較し、そこでは、我々の新しいモデルはより高いBLEUスコアを達成します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:55:13 GMT)
Strain effect on optical properties and quantum weight of 2D magnetic topological insulators MnBi$_2$X$_4$ (X = Te, Se, S) [1.5]
2次元トポロジカル絶縁体MnBi$X$_4$(X = Te, Se, S)の磁気及び光学特性に及ぼすひずみの影響について検討する。その結果,二軸ひずみはMn磁気モーメントを高める一方,一軸ひずみはMn磁気モーメントを減少させることがわかった。種々のひずみ方向の化学結合を解析することにより,MnBi$$X$_4$の内在性延性破壊挙動が製造プロトコルや構造安定性に与える影響を解明する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:18:21 GMT)
Weather-Aware Object Detection Transformer for Domain Adaptation [1.5]
RT-DETRは様々なコンピュータビジョンタスクで強い性能を示してきたが、霧のような困難な気象条件下では劣化することが知られている。本研究では,霧環境におけるRT-DETRロバスト性を高める3つの新しい手法について検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:11:18 GMT)
Differentially Private Geodesic and Linear Regression [1.5]
統計応用では、多様体のような非線型空間上に存在するデータ構造に遭遇することがますます一般的になっている。我々はK-Norm Gradient (KNG) 機構を介して測地回帰の微分プライベート(DP)パラメーターをリリースすることを検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:45:48 GMT)
Learned enclosure method for experimental EIT data [1.5]
本稿では,池畑が提案する囲い込み法とニューラルネットワークを組み合わせることで,境界測定から包含物の凸包を推定する方法を提案する。最小二乗の整合性を持つ古典的閉包法と比較して, 学習された凸船体は, シミュレーションデータと実験データの両方において優れた性能を発揮する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:18:26 GMT)
Kozax: Flexible and Scalable Genetic Programming in JAX [1.4]
Kozaxは任意の問題に対するシンボリック表現を進化させる遺伝的プログラミングフレームワークである。高性能でスケーラブルな機械学習のためのフレームワークであるJAXを使ってKozaxを実装します。我々は、自然法則の方程式を発見し、隠れた動的変数の方程式を復元し、制御ポリシーを進化させ、目的関数を最適化するために、Kozaxを成功させたことを実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:55:56 GMT)
Enhancing Commentary Strategies for Imperfect Information Card Games: A Study of Large Language Models in Guandan Commentary [1.4]
強化学習(RL)と大規模言語モデル(LLM)を組み合わせた新しい注釈手法を提案する。本システムでは,RLを利用して複雑なカード再生シナリオを生成し,LLMを用いて対応する注釈文を生成する。オープンソース LLM に適用した場合,提案する注釈フレームワークによって達成される性能の大幅な向上を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:28:20 GMT)
Enhancing LLMs for Power System Simulations: A Feedback-driven Multi-agent Framework [1.4]
本稿では,電力系統のシミュレーションを管理するためのフィードバック駆動型マルチエージェントフレームワークを提案する。改良された検索拡張生成モジュール(RAG)、改良された推論モジュール、エラーフィードバック機構を備えた動的環境作用モジュールの3つのモジュールが提案されている。 ChatGPT 4o、o1-preview、微調整されたGPT-4oは、いずれも複雑なタスクで30%未満の成功率を達成した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:33:50 GMT)
Deep-seeded Clustering for Emotion Recognition from Wearable Physiological Sensors [1.4]
本稿では,生理的信号から特徴を最小限に抽出し,分類するディープシードクラスタリングアルゴリズムを提案する。本モデルは,感情コンピューティング研究で頻繁に使用される3つのデータセットに対して,良好な性能が得られることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:05:54 GMT)
Trajectory Encoding Temporal Graph Networks [1.4]
時間グラフネットワーク(TGN)はリンク予測やノード分類といった動的グラフタスクにおいて大きな成功を収めている。既存のTGNの設計は、これらの二重シナリオの下でジレンマに直面している。時間的および構造的な情報のみに依存する匿名のTGNは、強い帰納的一般化を提供するが、既知のノードの識別に苦労する。対照的に、匿名でないTGNはノード機能を活用して、トランスダクティブなタスクを最適化するが、新しいノードに適応できない。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:57:09 GMT)
Enhancing multimodal analogical reasoning with Logic Augmented Generation [1.4]
本稿では,意味知識グラフを通じてテキストの明示的表現を利用する論理拡張生成(LAG)フレームワークを適用する。本手法では,暗黙的な意味を表す拡張知識グラフを3つ生成し,ドメインに関わらず,ラベルのないマルチモーダルデータを推論する。その結果、この統合されたアプローチは現在のベースラインを超え、視覚的メタファーを理解する上で人間よりも優れた性能を示し、より説明可能な推論プロセスを可能にした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:47:55 GMT)
Graph-Theoretic Measures for Interpretable Multicriteria Decision Making in Emergency Department Layout Optimization [1.4]
救急部門(ED)の過密は、人口増加、パンデミックの出現、死亡率と死亡率の増加によって悪化する永続的な問題である。本稿では,多目的メタヒューリスティック最適化フレームワークによるEDレイアウトの評価とランク付けのためのグラフ理論手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:16:06 GMT)
Early Detection of Cognitive Impairment in Elderly using a Passive FPVS-EEG BCI and Machine Learning -- Extended Version [1.3]
初期の認知症診断には、構造的および機能的脳の変化の両方に敏感なバイオマーカーが必要である。現在の認知評価は、しばしば行動反応に依存しており、努力、実践効果、教育的背景といった要因に影響を受けやすい。この研究は、脳波(EEG)データから直接認知障害レベルを推測するために、軽量畳み込みニューラルネットワーク(CNN)を活用する、新しいアプローチを導入している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:34:13 GMT)
Sparse Deformable Mamba for Hyperspectral Image Classification [1.3]
Mambaモデルは、ハイパースペクトル画像(HSI)分類を大幅に改善する。重要な課題の1つは、マンバトークンのシーケンスを効率的に構築することの難しさである。本稿では,HSI分類の強化を目的としたスパース変形型マンバ (SDMamba) 手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:17:09 GMT)
Compressing Hamiltonians with ab initio downfolding for simulating strongly-correlated materials on quantum computers [1.3]
Ab initio のダウンフォールディングは、圧縮された多体ハミルトニアンを導出する方法として登場した。我々は、量子アルゴリズムを用いて、下向きのハミルトンの物性を得ることができ、確実に高忠実性解が得られることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:24:08 GMT)
Audio and Multiscale Visual Cues Driven Cross-modal Transformer for Idling Vehicle Detection [1.3]
アイドリング車両検出(IVD)は、過度のアイドリング行動を抑制するために動的メッセージングドライバによって汚染や排出を減らすリアルタイムシステムをサポートする。コンピュータービジョンにおいて、IVDは、監視カメラとリモートマイクからのオーディオのビデオを利用して、各フレーム内の車両を移動、アイドリング、エンジンオフとしてローカライズし、分類する新しいタスクとなっている。本稿では,トランスフォーマに基づくエンドツーエンド検出ネットワークであるAVIVDNetv2を提案する。グローバルパッチレベルの学習,マルチスケール視覚特徴融合モジュール,デカップリングされた検出ヘッドを備えたクロスモーダルトランスフォーマを備える。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:10:17 GMT)
DrivAer Transformer: A high-precision and fast prediction method for vehicle aerodynamic drag coefficient based on the DrivAerNet++ dataset [1.2]
本研究では、DrivAer Transformerと呼ばれるポイントクラウド学習フレームワークを提案する。 DAT構造はDrivAerNet++データセットを使用しており、産業標準の3D車両形状の高忠実なCFDデータを含んでいる。この枠組みは車両設計プロセスの加速と開発効率の向上が期待されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:45:49 GMT)
Improved impedance inversion by the iterated graph Laplacian [1.2]
本稿では,古典的あるいは深層学習に基づくアプローチと反復グラフラプラシアン正規化を統合したデータ適応型逆変換手法を提案する。本手法は,従来のインバージョン手法とニューラルネットワークに基づく手法のいずれかを用いて導出したインピーダンス推定から開始する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:53:04 GMT)
PIP-Loco: A Proprioceptive Infinite Horizon Planning Framework for Quadrupedal Robot Locomotion [1.1]
四足歩行におけるモデル予測制御(MPC)の強みは、制約を強制する能力である。自己受容型計画と強化学習(RL)を統合した枠組みを提案する。デプロイ中、Dreamerモジュールは無限水平MPC問題を解決する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:55:47 GMT)
FACT: Foundation Model for Assessing Cancer Tissue Margins with Mass Spectrometry [1.0]
FACTは、もともと3重項損失に基づく教師付きコントラストアプローチを用いて事前訓練されたテキスト音声アソシエーションのための基礎モデルの適応である。結果: 提案モデルでは, AUROC が 82.4% pm 0.8$ で, 最先端性能を実現し, 分類性能を著しく向上させる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:36:03 GMT)
Improved approximation ratios for the Quantum Max-Cut problem on general, triangle-free and bipartite graphs [0.9]
QMC(Quantum Max-Cut)問題は、特定の2n倍の2n$行列の最大の固有値を決定することである。現在知られている一般グラフのQMC近似アルゴリズムについて,より精密な解析を行う。三角形自由グラフと二部グラフ上のQMC問題に対する2つの新しい近似アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:08:07 GMT)
Reconstructing Fine-Grained Network Data using Autoencoder Architectures with Domain Knowledge Penalties [0.9]
生のネットワークトラフィックの大規模な収集と保存は、特に稀なサイバー攻撃サンプルの収集に困難をもたらす。ネットワークデータをエンコードし再構成するための形式的手法によって導かれる機械学習手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:51:44 GMT)
TerrAInav Sim: An Open-Source Simulation of UAV Aerial Imaging from Satellite Data [0.9]
TerrAInav Simは、UAVをシミュレートして、鳥眼ビューマップベースの画像をゼロヨーでキャプチャすることで、魅力的な代替手段を提供する。ドローンを物理的に飛ばす必要がなければ、仮想UAVはどんな地図でも検索して画像をキャプチャする。 TerrAInav Simの能力は、基本的なアプリケーションのためにいくつかの低高度画像をキャプチャすることから、ディープラーニングのような複雑なタスクのために、都市全体の広範なデータセットを生成することまで様々である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:50:26 GMT)
Accurate Machine Learning Interatomic Potentials for Polyacene Molecular Crystals: Application to Single Molecule Host-Guest Systems [0.8]
新しい機械学習原子間ポテンシャル(MLIP)は、大規模な正確な物質シミュレーションに有望なソリューションを提供する。我々は,グラフニューラルネットワークに基づくMACEアーキテクチャとアクティブラーニング戦略を活用することで,汎用MLIPを開発する。これらのポテンシャルは正確であり、非調和振動特性、振動寿命、振動結合の研究を可能にする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:27:21 GMT)
Cramming Contextual Bandits for On-policy Statistical Evaluation [0.8]
我々は,文脈的帯域幅アルゴリズムから最終学習方針を評価するための一般的な統計フレームワークとして,cram法を紹介した。クラミングは、単一のデータパスを通じてバンドレート全体のシーケンスを利用するため、統計学的および計算学的に効率的な評価がもたらされる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:43:54 GMT)
OPMOS: Ordered Parallel Algorithm for Multi-Objective Shortest-Paths [0.8]
本稿では,MOS(Multi-Objective Shortest-Path)問題を解決するための並列アルゴリズムを提案する。提案した並列アルゴリズム(OPMOS)は、順序付き並列処理をアンロックし、MOS内の複数のパスの同時実行を効率的に活用する。 NVIDIA GH200 Superchipの72コアArmベースのCPUを用いた実験的評価は、OPMOSの性能スケーリングの可能性を示している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:51:24 GMT)
CyclePose -- Leveraging Cycle-Consistency for Annotation-Free Nuclei Segmentation in Fluorescence Microscopy [0.8]
合成データ生成とセグメンテーションのトレーニングを統合したハイブリッドフレームワークであるCyclePoseを提案する。 CyclePoseは、顕微鏡画像とセグメンテーションマスクの間の未ペア翻訳を可能にするCycleGANアーキテクチャ上に構築されている。セグメンテーションモデルをCycleGANに組み込み、自己超越のためにサイクル整合損失を利用する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:54:10 GMT)
SE Arena: An Interactive Platform for Evaluating Foundation Models in Software Engineering [0.8]
ソフトウェアエンジニアリング活動の基盤モデル(FM)を評価するために設計されたインタラクティブなプラットフォームであるSE Arenaを紹介する。 SE Arenaは透明でオープンソースのリーダーボードを提供し、複数ラウンドの会話スコアをサポートし、エンドツーエンドのモデル比較を可能にする。本稿では,SE Arenaの設計と機能について概説し,ソフトウェア工学におけるFMの評価と実用化を前進させる可能性を強調した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:34:27 GMT)
ResiLogic: Leveraging Composability and Diversity to Design Fault and Intrusion Resilient Chips [0.7]
本稿では, レジリエンスに対する3つの関連する攻撃(分布, 粒子, 複合攻撃)を考慮に入れた脅威モデルについて述べる。 textitDiversity by Composability を利用した textttResiLogic フレームワークを導入する。異なる粒度レベルでのこのアプローチを用いることで,thisttResiLogicにおける回路設計のレジリエンスを5倍に向上させる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:45:43 GMT)
GATE3D: Generalized Attention-based Task-synergized Estimation in 3D* [0.7]
GATE3Dは、弱い監督による一般化されたモノクル3Dオブジェクト検出のための新しいフレームワークである。以上の結果から,GATE3Dは限られたアノテートデータからの学習を著しく加速することが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:37:54 GMT)
Characterizing High Schmidt Number Witnesses in Arbitrary Dimensions System [0.7]
我々は、任意の次元で二部量子状態の高シュミット数証人を特徴付ける効率的なツールを開発する。提案手法は理論上,高次元シュミット数目撃者を構築するための有効な数学的手法を提供する。我々は、シュミット数 4 と 5 の任意の次元の双分数量子系においてシュミット数証人を構成することによって、理論上の進歩と計算上の優位性を実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:15:16 GMT)
Surface Code Error Correction with Crosstalk Noise [0.7]
各種クロストークノイズについて検討し, 記憶実験と安定性実験によりその効果を定量化する。フラグキュービット設計と冗長な安定化器チェックによるQECのクロストークロバスト実装を提案する。解析的および数値的な結果とともに、ハードウェアのリアルなクロストークノイズに対して堅牢なQEC符号の設計に光を当てた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:17:40 GMT)
Hybrid Authentication Protocols for Advanced Quantum Networks [0.7]
本稿では,ハードウェアの仮定,特にPhysical Unclonable Function (PUF) と,局所的不特定性などの非局所状態の量子特性を組み合わせて,絡み合いベースのプロトコルにおける証明可能なセキュリティを実現する新しい認証手法を提案する。これらのプロトコルは、様々なプラットフォーム、特にフォトニクスベースの実装に適合し、量子通信ネットワークにおける長年にわたる認証の課題に対して、実用的で柔軟なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:51:22 GMT)
Reward Distance Comparisons Under Transition Sparsity [0.7]
多様なサンプル分布に対応するように設計されたSparsity Resilient Reward Distance (SRRD) 擬似測定器。本稿では,高遷移カバレッジの必要をなくすために,Sparsity Resilient Reward Distance (SRRD) を擬似的に導入する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:27:53 GMT)
The path towards measuring the gravitational field of proton bunches at accelerators [0.7]
LHC貯蔵環の強い超相対論的な陽子ビームは、一般相対性理論をテストする可能性がある。本項では、この方向の理論研究の現状について概説する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:45:35 GMT)
OmniXAS: A Universal Deep-Learning Framework for Materials X-ray Absorption Spectra [0.6]
X線吸収分光法(XAS)は、吸収する原子の局所的な化学的環境を調べるための強力な特徴付け技術である。我々は、XAS予測のための一連の伝達学習アプローチを含むフレームワークを提案し、それぞれが精度と効率の向上に寄与する。提案手法は,XASモデリングのスループットを第1原理シミュレーションに比べて桁違いに向上させ,より広い範囲の要素に対するXAS予測に拡張可能である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:22:42 GMT)
C-SHAP for time series: An approach to high-level temporal explanations [0.6]
説明可能なAI(XAI)は、モデル推論を説明することによって、AIソリューションの信頼性を高めることを目的としている。時系列では、多くのXAIメソッドがポイントまたはシーケンスベースの属性マップを提供する。本稿では,これらの高レベルなパターンから説明を提供する概念に基づく手法を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:06:32 GMT)
Interpretable Water Level Forecaster with Spatiotemporal Causal Attention Mechanisms [0.6]
本研究では,水位予測に着目し,解釈可能性の定量化を目的とした深層学習モデルを提案する。我々は,2016年から2021年にかけて,韓国ソウルから得られた漢川データセットの比較分析を行った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:32:05 GMT)
QOS: A Quantum Operating System [0.6]
量子リソースを管理するクラウドオペレーティングシステムQOSを紹介する。 QOSは、透過的な量子ジョブ実行のためのハードウェアに依存しないAPIを公開する。我々は,QOSが2.6～456.5$times$高忠実度を実現し,資源利用率を最大9.6$times$に向上し,待ち時間を最大5$times$に削減し,平均1～3%の忠実度を犠牲にすることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:28:55 GMT)
Leveraging LLMs and attention-mechanism for automatic annotation of historical maps [0.6]
機械学習の最近の進歩は、歴史地図における特徴や対象の認識と分類を自動化する新しい道を開いた。本研究では, 大規模言語モデル (LLM) とアテンション機構を利用して, 歴史地図の自動アノテーションを実現する新しい蒸留法を提案する。 LLMは低解像度の歴史的イメージパッチの粗い分類ラベルを生成するために使用され、アテンション機構はこれらのラベルを高解像度に洗練するために使用される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:34:23 GMT)
A Winner-Takes-All Mechanism for Event Generation [0.5]
本稿では,ニューロンの内在的リバウンド励起性と入出力計算を併用した,中央パターン生成設計のための新しいフレームワークを提案する。我々のアプローチは、シンプルだが強力なネットワークアーキテクチャにおいて、意思決定とリズミカルパターンの生成を統一する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:40:37 GMT)
ATLASv2: LLM-Guided Adaptive Landmark Acquisition and Navigation on the Edge [0.5]
ATLASv2は、細調整されたTinyLLM、リアルタイムオブジェクト検出、効率的な経路計画を統合する新しいシステムである。我々はATLASv2を実環境において評価し、様々な物やランドマークで構築された手作りの住宅やオフィス環境について検討した。結果は,ATLASv2が自然言語命令を効果的に解釈し,それらを低レベルなアクションに分解し,高い成功率でタスクを実行することを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:55:57 GMT)
Stabilizer Tensor Networks with Magic State Injection [0.5]
本稿では,多数の非クリフォード演算で回路をシミュレートする機構を改良した新しいフレームワークについて報告する。具体的には、ランダムな$T$-doped $N$-qubit Clifford 回路は、$t lesssim N$$T$-gatesを持つ場合、$mathcalO(textpoly(N))$としてマジック状態注入スケールで作成された回路の計算コストを$mathcalO(textpoly(N))$とする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:48:04 GMT)
Code Reborn AI-Driven Legacy Systems Modernization from COBOL to Java [0.5]
Legacy 2024 Corpusの活用 -- パブリックおよびエンタープライズソースから5万ファイル -- Javaはコードを解析し、AIはアップグレードを提案し、Reactは向上を視覚化する。このアプローチは、銀行や保険といった業界にとって不可欠な、システムを回復するためのスケーラブルなパスを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:07:54 GMT)
Real-time Object and Event Detection Service through Computer Vision and Edge Computing [0.5]
都市部における致命的な道路事故は、Vulnerable Road Users (VRU) である。本稿では,コンピュータビジョン(CV)とエッジコンピューティングに基づく,スマートシティの道路監視と安全のためのシステムの構築手法を提案する。このアルゴリズムは、車、歩行者、自転車を正確に検知し追跡し、道路の状態、移動物体間の距離を予測し、衝突をほぼリアルタイムで防止するために衝突イベントを推定する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:11:42 GMT)
A Critical Analysis of Deployed Use Cases for Quantum Key Distribution and Comparison with Post-Quantum Cryptography [0.4]
量子鍵分散(QKD)は、量子コンピュータが従来の公開鍵暗号システムに侵入する未来の通信を保護する技術として議論されている。我々は,学術文献や産業報告から得られた実世界のユースケースに着目し,QKDベースのソリューションの総合的なセキュリティ評価を行う。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:12:09 GMT)
Moving Beyond Next-Token Prediction: Transformers are Context-Sensitive Language Generators [0.4]
トランスフォーマーを利用した大規模言語モデル(LLM)は、人間のような知能を実証している。本稿では,LLMを確率的左文脈依存言語(CSL)ジェネレータとして解釈するための新しい枠組みを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:06:27 GMT)
Graph-Driven Multimodal Feature Learning Framework for Apparent Personality Assessment [0.4]
人格特性の自動予測は、コンピュータビジョンにおいて難しい問題となっている。本稿では,ショートビデオクリップにおけるパーソナリティ分析のための革新的なマルチモーダル特徴学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:26:12 GMT)
The Use of Generative Artificial Intelligence for Upper Secondary Mathematics Education Through the Lens of Technology Acceptance [0.4]
本研究では,生成人工知能(GenAI)を用いた数学教育における学生の認識について検討した。その結果,GenAIの使用意図に対する知覚的有用性の影響が強く示された。互換性の付与により、モデルの説明力、特に知覚された有用性を予測する能力が改善された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:20:07 GMT)
Mathematical Capabilities of Large Language Models in Finnish Matriculation Examination [0.4]
大規模言語モデル (LLM) は、教育環境においてますます有望であることが示されている。本研究は,フィンランドの成熟度試験を用いて,様々なLSMの数学的能力を評価する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:31:54 GMT)
Towards a Universal Vibration Analysis Dataset: A Framework for Transfer Learning in Predictive Maintenance and Structural Health Monitoring [0.4]
この研究には、様々な種類の機械からの幅広い振動信号が含まれる。ビジュアルコンピューティングにおけるImageNetの成功を反映して、このデータセットは産業アプリケーションにおけるインテリジェントシステムの開発を改善する可能性がある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:57:26 GMT)
YOLO-RS: Remote Sensing Enhanced Crop Detection Methods [0.3]
既存のターゲット検出手法は、リモートセンシング画像において、小さなターゲットを扱う際の性能が劣っている。 YOLO-RSは、小さなターゲットの検出を大幅に強化した最新のYolov11に基づいている。リモートセンシング画像における小目標検出作業におけるYOLO-RSの有効性と適用可能性を検証する実験を行った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:13:22 GMT)
Quantum Meets SAR: A Novel Range-Doppler Algorithm for Next-Gen Earth Observation [0.3]
本稿では、従来のFFTと比較して処理を高速化する量子レンジドップラーアルゴリズム(QRDA)を提案する。 RDAパイプラインにおける重要なステップであるフーリエ領域におけるレンジセルマイグレーション補正(RCMC)の量子実装を導入している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:06:02 GMT)
Simulation-based inference for stochastic nonlinear mixed-effects models with applications in systems biology [0.3]
階層型混合効果モデルにおける拡張ベイズ推定のための新しい手法を提案する。我々のフレームワークはまず、確率と後部分布の補正近似を構築し、各データセットに対して高速に精製する。統計的精度の点で,我々のアプローチは迅速かつ競争的であった。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:18:58 GMT)
Entanglement scaling in matrix product state representation of smooth functions and their shallow quantum circuit approximations [0.3]
マトリックス積状態(MPS)法は、浅い量子回路を構築する上で最も有望な手法として現れた。入力関数の滑らかさに依存するMPS表現における結合間の絡み合いの崩壊に対する厳密な展開を導出する。我々は、量子回路を浅く正確に符号化する改良されたMPSベースのアルゴリズムを構築した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:12:34 GMT)
A Decade of Wheat Mapping for Lebanon [0.3]
冬季のコムギ分割のための改良パイプラインを導入することにより,衛星画像から小麦畑を正確にマッピングする問題に対処する。本手法は,コムギのセグメンテーションを精密なフィールド境界抽出と組み合わせることで,幾何的コヒーレントでセマンティックにリッチな地図を生成する。この研究は、作物のモニタリングや収量推定など、様々な重要な研究と今後の進歩の基礎を築いた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:31:54 GMT)
Towards Automated Safety Requirements Derivation Using Agent-based RAG [0.3]
自律走行車における安全要件の自動導出について検討し, LLMとエージェントベース検索拡張生成を併用して検討した。既存のRAGアプローチはこの問題に対処するが、複雑なクエリを扱う場合のパフォーマンスは低下する。本稿では,エージェントベースRAGを用いて安全性要件を導出し,検索した情報がクエリに関連があることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:43:19 GMT)
Short note on the mapping of heritage sites impacted by the 2024 floods in Valencia, Spain [0.2]
公開データを用いて,遺産座標を用いた洪水地図をオーバーレイすることで,潜在的被害の程度を評価する。地域遺産の3.3%は、教会や神社(81件)、屋外の宗教図像(78件)、歴史的庭園(45件)などの影響を受けている可能性がある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:47:08 GMT)
Large Language Model-Informed Feature Discovery Improves Prediction and Interpretation of Credibility Perceptions of Visual Content [0.2]
本稿では,Large Language Model (LLM) を用いた特徴発見フレームワークを導入する。対象のプロンプトを用いて解釈可能な特徴を抽出・定量化し、それらを機械学習モデルに統合して信頼性予測を改善する。提案手法は,R2においてゼロショットGPTに基づく予測を13%向上させ,情報具体性や画像フォーマットなどの重要な特徴を明らかにした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:11:40 GMT)
Defending Against Frequency-Based Attacks with Diffusion Models [0.2]
拡散モデルは、画素単位の逆方向の摂動に対処するだけでなく、非逆方向のデータシフトに対処する上でも非常に有効であることが証明されている。本研究は,低周波領域から高周波領域への多彩な歪みパターンの取り扱いの有効性を明らかにする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:57:17 GMT)
Revealing Covert Attention by Analyzing Human and Reinforcement Learning Agent Gameplay [0.2]
本研究では,ゲームプレイデータのみを用いて,人間の隠れ注意パターンを明らかにする手法を提案する。本研究では,アタリ環境における人間とRLエージェントのゲームプレイからアテンションマップを生成するCTRアテンションネットワークを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:07:14 GMT)
Power-scaled Bayesian Inference with Score-based Generative mModels [0.2]
本稿では,ベイズ推定フレームワーク内でのパワースケールの先行値と可能性から,スコアに基づく生成アルゴリズムを提案する。具体的には, 画像を用いた地震波速度モデルに焦点をあてる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:06:04 GMT)
ProtoECGNet: Case-Based Interpretable Deep Learning for Multi-Label ECG Classification with Contrastive Learning [0.2]
ProtoECGNetは、解釈可能な多ラベルECG分類のためのプロトタイプディープラーニングモデルである。 PTB-XLデータセットから71の診断ラベルについてProtoECGNetを評価する。 ProtoECGNetは、プロトタイプ学習を複雑で多ラベルの時系列分類に効果的にスケールできることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:08:45 GMT)
Mutual Understanding between People and Systems via Neurosymbolic AI and Knowledge Graphs [0.2]
本稿では,知識の共有,知識の交換,知識の統制という,相互理解を特徴付ける3つの重要な側面を紹介する。我々は、人間、人工、ロボットエージェント間の意味のある交換を支援するため、NeSy AIとKnowledge Graphsの応用を実証するいくつかのユースケースシナリオを提示する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:57:09 GMT)
FlexiContracts: A Novel and Efficient Scheme for Upgrading Smart Contracts in Ethereum Blockchain [0.2]
FlexiContractsは、過去のデータを失うことなく、セキュアでインプレースなアップグレードを可能にすることによって、スマートコントラクトの進化を想像する。その合理化された設計は、スマートコントラクト開発をシンプルにすることで、現在のデザインパターンの限界を超越している。この進歩は、継続的な改善と新しい要求への適応の環境を育みます。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:20:42 GMT)
SuperARC: An Agnostic Test for Narrow, General, and Super Intelligence Based On the Principles of Recursive Compression and Algorithmic Probability [0.1]
アルゴリズムの確率を基礎としたオープンエンドテストを導入する。これはフロンティアモデルの定量的評価においてベンチマーク汚染を避けることができる。圧縮はシステムの予測力と等価であり、直接的に比例することを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:36:24 GMT)
ConvShareViT: Enhancing Vision Transformers with Convolutional Attention Mechanisms for Free-Space Optical Accelerators [0.1]
本稿では、4f自由空間光システムにビジョントランスフォーマー(ViT)を適応させる新しいディープラーニングアーキテクチャであるConvShareViTを紹介する。 ConvShareViTは、MHSA(Multi-head self-attention)とMLP(Multilayer Perceptrons)の線形層を、入力チャネル間の共有重みを持つ奥行き畳み込み層に置き換える。結果は、ConvShareViTがGPUベースのシステムよりも最大3.04倍高速な推論を理論的に達成できることを実証している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:32:23 GMT)
Adaptively Pruned Spiking Neural Networks for Energy-Efficient Intracortical Neural Decoding [0.1]
ニューロモルフィックハードウェア上でのニューラルネットワーク(SNN)のスパイキングは、ニューラルデコーディングにおいて顕著な効率性を示している。本稿では,脳皮質内神経復号をターゲットとした,高アクティベーション領域を有するSNNを対象とした適応型プルーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:16:34 GMT)
Establishing a Foundation for Tetun Ad-Hoc Text Retrieval: Stemming, Indexing, Retrieval, and Ranking [0.0]
本研究では,アドホック検索タスクに着目したテトゥーンのテキスト検索について検討する。最初は、ストップワードのリスト、ストローマー、テストコレクションなど、重要な言語リソースの開発から始まります。次に、文書タイトルとコンテンツの両方を用いて、検索の有効性を評価する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:58:52 GMT)
Xpose: Bi-directional Engineering for Hidden Query Extraction [0.0]
Hidden Query extract (HQE)は、クエリリカバリ、データベースセキュリティ、ベンダーマイグレーションなど、さまざまな産業ユースケースを持つ。 HQEのために開発されたリバースエンジニアリング(RE)ツールは、データベースの突然変異と生成技術に基づいており、キーベースの等結合と共役演算フィルタの述語でしかフラットクエリを抽出できない。本稿では,TPCHベンチマークなどの現実的な複雑なクエリに対して,抽出範囲を拡大するHQEソリューションであるXposeを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:17:58 GMT)
WildlifeReID-10k: Wildlife re-identification dataset with 10k individual animals [0.0]
本稿では,140k以上の画像にわたる約33種の動物の身元が10k以上の大規模再同定ベンチマークであるWildlifeReID-10kを紹介する。 WildlifeReID-10kは多様な動物種をカバーし、SoTA法に大きな課題を提起している。データセットとベンチマークは、クローズドセットとオープンセットの両方評価のための強力なベースラインとともに、Kaggleで公開されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:21:22 GMT)
Why Is Anything Conscious? [0.0]
生物系が階層的に階層的に知覚情報を解釈するためにどのように自己組織化するかを記述するフォーマリズムを提供する。我々の提案は、ゾンビフィクションよりも人間の事実に近い、意識の正式な科学の基礎を築いた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:05:34 GMT)
When big data actually are low-rank, or entrywise approximation of certain function-generated matrices [0.0]
この記事は、2$m$次元変数の滑らかな関数をサンプリングすることによって生成される行列の低ランク近似に関するものである。特定の解析関数のクラスに対して、そのような$n times n$行列は、$m$とは独立で$log(n)$として成長するランクの正確なエントリーワイド近似を認めるという主張を取り巻くいくつかの誤解を特定する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:00:37 GMT)
Wasserstein Distributionally Regret Optimization [0.0]
We provide a systematic analysis of Wasserstein DRRO, paralleling known results for Wasserstein DRO。滑らかさと規則性条件下では、ワッサーシュタインDRROは経験的リスク最小化(Empirical Risk Minimization:ERM)と1次項に一致することを示す。 2つの1次元凹関数を最大化することにより、後悔を計算できることが示される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:47:11 GMT)
Visual Language Models show widespread visual deficits on neuropsychological tests [0.0]
神経心理学のツールキットを用いて3つの最先端ビジュアル言語モデル(VLM)の能力を評価する。臨床的に有意と思われる低位・中位の視覚能力に広範な欠陥がみられた。これらの選択的欠陥は、検証されたテストバッテリーを通してプロファイルされ、人間には明示的な訓練を必要としない基礎的な視覚概念を発達させることなく、人工知能が複雑な物体認識を達成できることを示唆している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:04:56 GMT)
Using LLMs as prompt modifier to avoid biases in AI image generators [0.0]
LLM(Large Language Models)は、ユーザプロンプトを変更することで、テキストから画像生成システムにおけるバイアスを低減する。安定拡散XL, 3.5, Fluxを用いた実験により, LLMを修飾したプロンプトは, 画像生成装置自体を変更することなく, 画像の多様性を著しく向上し, バイアスを低減できることが示された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:52:20 GMT)
Unchecked and Overlooked: Addressing the Checkbox Blind Spot in Large Language Models with CheckboxQA [0.0]
CheckboxQAは、チェックボックス関連タスクのモデルパフォーマンスの評価と改善を目的としたデータセットである。現行のモデルの限界を明らかにし、文書理解システムを前進させる貴重なツールとして機能する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:41:36 GMT)
Towards Predictive Communication with Brain-Computer Interfaces integrating Large Language Models [0.0]
近年の研究では、予測言語モデルとBCIの組み合わせが人間とコンピュータの相互作用を大幅に改善する可能性が示唆されている。特に、GPTのような事前訓練された自己回帰変換器モデルは、通信のためのBCIを大幅に改善することを約束する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:38:13 GMT)
Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction [0.0]
抗がんペプチド予測のためのトポロジー強化機械学習モデル(Top-ML)を提案する。本研究は,抗がんペプチドの同定を促進するために,新規なトポロジを基盤とした創製の可能性を強調した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:15:39 GMT)
Time-Resolved Stokes Analysis of Single Photon Emitters in Hexagonal Boron Nitride [0.0]
六方晶窒化ホウ素(hBN)における量子エミッタの偏光状態の包括的特徴付けには回転四面体プレート(RQWP)法を用いる。以上の結果から,hBNエミッタの複雑な偏光ダイナミクスが発見され,これまでアクセス不能であった知見が得られた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:49:14 GMT)
The thread embodiment of holographic quantum entanglement [0.0]
ホログラフィック双対性の絡み合い構造を特徴付ける量子スレッド画像を開発する。テンソルネットワークモデルと初期のビットスレッドの概念に着想を得て,ホログラムバルクにおける量子スレッドの軌跡を規定する規則を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:53:30 GMT)
The role of non-Markovian dissipation in quantum phase transitions: tricriticality, spin squeezing, and directional symmetry breaking [0.0]
量子システムにおける相転移の制御方法を理解することは、新しい量子材料や技術の開発研究の最前線にある。本稿では, 量子系と非マルコフ環境, すなわち, 周波数依存性のスペクトル密度がメモリ効果を誘導する環境との結合が, 相転移の生成と再形成にどのように利用されるかを検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:58:15 GMT)
The Lifetime of the Covid Memorial Wall: Modelling with Collections Demography, Social Media Data and Citizen Science [0.0]
ロンドンのナショナル・コビッド・メモリアル・ウォールには、手描きの赤いハートが2万枚以上ある。本研究は, 高品質塗料の変遷と, 壁面の長期保存に与える影響について検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:51:14 GMT)
The Forward-Forward Algorithm: Characterizing Training Behavior [0.0]
フォワード・フォワードアルゴリズムは、フォワードパスとバックプロパゲーションによって使用されるバックパスではなく、2つのフォワードパスからなる代替学習手法である。この研究は、フォワード・フォワードネットワークにおけるモデルとレイヤーの精度変化のダイナミクスを探求し、トレーニングが進むにつれて、内部挙動の機械的理解を追求する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:30:18 GMT)
The Art of Audience Engagement: LLM-Based Thin-Slicing of Scientific Talks [0.0]
簡単な抜粋(薄いスライス)が全体のプレゼンテーション品質を確実に予測できることを示します。我々は,100以上の実生活科学講演の新たなコーパスを用いて,Large Language Models (LLMs) を用いて,プレゼンテーションの完全な書き起こしを評価する。以上の結果から,LCMによる評価は人間の評価と密接に一致し,妥当性,信頼性,効率性が証明された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:08:13 GMT)
Strengthening Anomaly Awareness [0.0]
我々は、教師なし異常検出の強化を目的とした、異常認識フレームワークの洗練されたバージョンを提案する。本稿では,2段階のトレーニング戦略を通じて,変分オートエンコーダ(VAE)の最小限の監視を導入する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:52:22 GMT)
Statistical complexity as a probe of mass and phase structure in compact objects [0.0]
重力質量が複雑性の挙動を決定する上で重要な役割を担っていることを示す。恒星内部の強い相転移、例えばハイブリッド星で仮説化された恒星は、複雑性プロファイルの異なる特徴として現れることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:59:47 GMT)
Split-n-Chain: Privacy-Preserving Multi-Node Split Learning with Blockchain-Based Auditability [0.0]
Split-n-Chainは分割学習の一種で、ネットワークのレイヤを複数の分散ノードに分割する。 Split-n-Chainは、異なるフェーズを実行するのに要する時間の観点から効率が良いことを示し、トレーニング損失傾向はモノリシックな方法で実装された場合と同じニューラルネットワークの場合と似ていることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:22:26 GMT)
Single-site and multi-site solitons of bright matter-waves in optical lattices [0.0]
光学格子における魅力的な相互作用を持つ離散明るい物質波ソリトンを実験的に観察した。その結果,これらのソリトンの存在と特性が格子深度と間隔の幅にわたって明らかにされた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:17:12 GMT)
Simulating Bell inequalities with Qibo [0.0]
本稿では,ベルの不等式に関する教育資料を量子コンピューティングの文脈で提示する。我々は,その違反をシミュレートするソフトウェアツールと,教室での議論のガイドを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:59:49 GMT)
Simon's Period Finding on a Quantum Annealer [0.0]
シモンの周期フィニングアルゴリズムは、量子アルゴリズムの最も早く、最も脆弱なアルゴリズムの一つである。このアルゴリズムをD-Waveハードウェア上で実装し,最大298キュービットの問題を解く。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:17:13 GMT)
SCOOP: A Scalable Quantum-Computing Framework to Constrained Combinatorial Optimization [0.0]
本稿では,制約付き最適化問題を解くための新しいフレームワークSCOOPを提案する。 SCOOPは制約付き問題を制約なしのものに変換し、SCOOP問題ツインを形成する。本稿では,3つのNP-hard問題,最小支配集合,最小最大マッチング,最小集合被覆の枠組みを実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:17:23 GMT)
Robust Markov stability for community detection at a scale learned based on the structure [0.0]
本稿では、PyGenStabilityが生成する複数のパーティションから、1つのロバストなパーティションを適切なスケールで選択するための原則的手法を提案する。提案手法は,マルコフ安定性フレームワークと事前学習された機械学習モデルを組み合わせて,スケール選択を行う。 PyGenStabilityOne (PO) は他の25のアルゴリズムよりも統計的に有意なマージンで優れていることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:16:14 GMT)
Rethinking Technological Readiness in the Era of AI Uncertainty [0.0]
私たちは、現在の技術準備性評価は、重要なAI固有の要因を捉えることができないと論じています。軍事システムにおけるAIコンポーネントの成熟度と信頼性を評価するための新しいAI Readiness Frameworkを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:09:50 GMT)
Relativistic limits on the discretization and temporal resolution of a quantum clock [0.0]
量子時計における時間値の離散化と時間分解能の限界について論じる。我々の時計の特徴は、有界かつ離散的なハミルトニアンを補完する時間観測可能であることである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:53:02 GMT)
Relativistic Quantum Simulation of Hydrogen Sulfide for Hydrogen Energy via Hybrid Quantum-Classical Algorithms [0.0]
本稿では,水素エネルギー応用に関連する硫化水素(H2S)分解をモデル化するための相対論的量子シミュレーションフレームワークを提案する。このアプローチは、ディラック・クーロン相対論的量子化学と変分量子固有解法(VQE)を統合し、ハイブリッド量子古典アーキテクチャー上に実装する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:11:12 GMT)
Reinforcing Clinical Decision Support through Multi-Agent Systems and Ethical AI Governance [0.0]
実験結果, バイタルサイン, 臨床状況を分析するために, モジュラーエージェントを用いた新規エージェントシステムの設計を比較した。我々は,eICUデータベースを用いて,実験室分析,バイタルのみのインタプリタ,文脈推論エージェントなどのエージェントシステムを実装した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:26:26 GMT)
ReZero: Enhancing LLM search ability by trying one-more-time [0.0]
Retrieval-Augmented Generation (RAG) は、知識集約タスクにおけるLarge Language Model (LLM) の性能を改善するが、初期検索クエリの品質に大きく依存する。 ReZero(Retry-Zero)は,検索クエリをリトライする動作を直接報酬する新しいRLフレームワークである。 ReZeroは、25%のベースラインに比べて46.88%の精度で大幅に改善されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:18:21 GMT)
RISE-iEEG: Robust to Inter-Subject Electrodes Implantation Variability iEEG Classifier [0.0]
頭蓋内脳波(iEEG)は、臨床および脳-コンピュータインターフェースの応用にますます使われている。本稿では, 電極内注入変動に頑健な新しいデコーダモデルを提案する。我々はこのモデルをRISE-iEEGと呼び、このモデルはRobust to Inter-Subject Electrode implantation Variability iEEG の略である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:03:30 GMT)
Quantum walk on a square lattice with identical particles [0.0]
同一粒子の2次元量子ウォークにおける量子重ね合わせ効果について検討した。本研究では, 粒子間距離の拡散速度と2粒子の一致確率などの関節特性に着目した。個々の光子間の$N$-partiteの絡み合いを利用して、集積フォトニック回路を用いてこのモデルを実装する可能性について論じる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:33:08 GMT)
Quantum enhanced beam tracking surpassing the Heisenberg uncertainty limit [0.0]
量子絡み合いを利用して、ハイゼンベルクの不確実性限界を超えるビーム追跡精度を達成することができる。単一光子レベルでは、ほぼリアルタイムにビームトラッキング機能を実現することが可能である。この技術は、背景の影響に対して高い弾力性を示し、破壊的なビームを受ける場合でも追跡精度は無視できる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:17:54 GMT)
Quantum Geometry of the Light Cone: Fock representation and Spectrum of Radiated Power [0.0]
ボゾンおよびフェルミオン表現に対する量子論の結果について検討する。フェルミオン表現では、各ヌル線上の中心電荷は正であり、ボソンでは負である。モデルにおける重力波の放射パワーの束縛を得る。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:58:17 GMT)
Progressive Rock Music Classification [0.0]
本研究では,複雑な構成と多種多様な楽器を特徴とするジャンルである,プログレッシブ・ロック音楽の分類について検討する。我々は、スペクトログラム、Mel-Frequency Cepstral Coefficients (MFCC)、クロマグラム、歌のスニペットからのビート位置などの総合的なオーディオ特徴を抽出した。スニペットレベルの予測を最終曲分類に集約するために、すべての投票を勝者とする戦略が採用された。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:48:52 GMT)
Probing General Relativity-Induced Decoherence Using an on-chip Sagnac Interferometer [0.0]
最近の理論的提案は、相対論的固有時間が量子系におけるデコヒーレンスの原因となることを示唆している。本稿では,時計回りと時計回りの単光子方向の適切な時間差を生じさせるチップ集積型サニャック干渉計を提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:01:16 GMT)
Probabilistic causal graphs as categorical data synthesizers: Do they do better than Gaussian Copulas and Conditional Tabular GANs? [0.0]
本研究では,因果グラフモデルを用いて,調査データなどの高品質な合成分類データの生成について検討する。障害者サービスへのアクセシビリティ調査に基づくカテゴリーデータを用いた。我々は、因果関係を表現し、変数間の結合分布を捉えるために、SEMモデルとBNモデルの両方を作成しました。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:41:54 GMT)
Privacy-Preserving CNN Training with Transfer Learning: Multiclass Logistic Regression [0.0]
本稿では,ただのホモモルフィック暗号化(HE)技術に基づくプライバシー保護型CNNトレーニングを実現するための実践的ソリューションを提案する。私たちの知る限りでは、これはこのナットを突破する最初の試みであり、これまでこの目標を達成した作業はありませんでした。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:44:39 GMT)
Privacy-Preserving 3-Layer Neural Network Training [0.0]
ニューラルネットワークのプライバシ保護トレーニングの問題点を,ただの同型暗号設定で検討する。利用可能ないくつかの拡張テクニックを組み合わせて、いくつかの拡張を行い、最終的に回帰と分類の両問題に対する3層ニューラルネットワークのトレーニングを可能にします。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:34:10 GMT)
Predicting Wave Dynamics using Deep Learning with Multistep Integration Inspired Attention and Physics-Based Loss Decomposition [0.0]
本研究では,流体媒質中の波動伝搬をデータ駆動で予測するための物理に基づくディープラーニングフレームワークを提案する。提案手法は、遅延表現を減らし、注意に基づくリカレントニューラルネットワークとデノナイジングベースの畳み込みオートエンコーダを組み合わせたものである。 MI2A フレームワークは長期予測の精度と安定性を著しく向上することを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:47:20 GMT)
Posterior and variational inference for deep neural networks with heavy-tailed weights [0.0]
我々は、ネットワーク重みをランダムにサンプリングする事前分布を持つベイズフレームワークにおいて、ディープニューラルネットワークを考察する。後部分布は, ほぼ最適のミニマックス収縮速度を達成できることを示す。また, 実験結果の変分ベイズ版も提供し, 平均場変分近似は, ほぼ最適理論的支援の恩恵を受けていることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:29:02 GMT)
Post-Variational Ground State Estimation via QPE-Based Quantum Imaginary Time Evolution [0.0]
本稿では,QPEに基づくQPE-QITE(Quantum imaginary Time Evolution)アルゴリズムについて述べる。変分法とは異なり、QPE-QITEは量子レジスタを低エネルギー固有状態に投影するために追加のアンシラを用いる。低自己相関バイナリシーケンス(LABS)問題に適用することで,QPE-QITEの機能を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:44:14 GMT)
Phase-space quantum distorted stability pattern for Aubry-André-Harper dynamics [0.0]
Aubry-Andr'e-Harper (AAH) Hamiltonianによって駆動されるガウスアンサンブルのワイル・ウィグナー(WW)量子位相空間記述から、トポロジカル量子領域に付随する不安定性について検討した。双曲平衡と安定性パターンは、関連する(非線形)AAHハミルトンパラメータに従って識別され分類される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:58:20 GMT)
Phase diagram of the disordered Kitaev chain with long range pairing connected to external baths [0.0]
外部リンドブラッド浴で粒子を交換する2つの金属鉛に接続した場合, 長距離ペアリングを有する不規則キタエフ鎖の相図について検討した。本研究は, 長距離ペアリング北エフモデルにおいて, 大規模トポロジカル位相と短距離トポロジカル位相との間に障害による直接遷移が起こる可能性を示唆するものである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:39:01 GMT)
Periodic table for highly charged ions [0.0]
高電荷イオン(HCI)の電子的性質を記述するための新しい周期表を提案する。これは、相対論的軌道の連続した電子占有に基づいて純粋に構築される。このような表は、次世代の光原子時計の開発に適した、非常に禁止された遷移の大きなファミリーを予測する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:39:09 GMT)
Perceptions of Agentic AI in Organizations: Implications for Responsible AI and ROI [0.0]
本稿では,エージェントAIの出現する状況の中で,組織がこのようなフレームワークをどのように認識し,適応するかを検討する。エージェントAIシステムの本質的な複雑さと、その責任ある実装は、責任あるAI次元とテーマフレームワークの複雑な相互接続性に根ざし、組織的適応における重大な課題に寄与している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:15:06 GMT)
PatrolVision: Automated License Plate Recognition in the wild [0.0]
シンガポールのナンバープレートに対して,シングルラインとダブルラインの完全なALPRシステムを提案する。まず、RFB-Netを用いて全画像からライセンスプレートを検出し、複数の歪んだライセンスプレートを1つの画像で修正する。 16,000枚以上の画像をカバーする新しいデータセットを用いて,提案システムの性能評価を行った。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:10:43 GMT)
Particle-Hole Creation in Condensed Matter: A Conceptual Framework for Modeling Money-Debt Dynamics in Economics [0.0]
本稿では, 凝縮物質物理学における粒子ホール生成と直接類似して, 経済システムにおける金銭負債のダイナミクスをモデル化する場の理論的枠組みを提案する。この枠組みは、量的緩和(QE)と金に支えられた金融体制、そして量子のような統一的な定式化の下で、ミクロ経済の信用創造を含むマクロ経済現象をうまく捉えている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:37:15 GMT)
Optimal control of geometric phase in pairs of interacting atoms traveling along two-dimensional closed paths [0.0]
双極子双極子ポテンシャルを介して相互作用する原子対の対において、非自明なアハロノフ・アンダン幾何相を誘導するスキームを提案する。我々のプロトコルは、モバイル光トラップ技術に依存しており、クローズドループに沿って1つの原子を操る。ノイズや実験的欠陥の存在下での我々のスキームの安定性について論じる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:06:40 GMT)
Optically Switchable Fluorescence Enhancement at Critical Interparticle Distances [0.0]
プラズモニックナノ構造は、蛍光ベースの応用において効率向上ツールとして使用される局所的な磁場増強を提供する。そこで本研究では,CdSe/ZnSコア殻QDの発光効率を,銀ナノ粒子を光学的に励起することによって,光スイッチで実証する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:21:16 GMT)
On-Device Watermarking: A Socio-Technical Imperative For Authenticity In The Age of Generative AI [0.0]
私たちは間違ったアプローチを採用しており、暗号署名による透かしに注力すべきだと論じています。特に音声・視覚コンテンツについては、実際のコンテンツはすべて物理的世界に根ざし、ハードウェアセンサーを介してキャプチャされる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:36:52 GMT)
Nonequivalence between absolute separability and positive partial transposition in the symmetric subspace [0.0]
絶対分離状態と絶対正部分転位状態(PPT)の同値性は、一般に量子エンタングルメント理論において未解決の問題である。絡み合った5ビットSAPPT状態の族を構築する。より大きな奇数の量子ビットに対する同様の反例が同定される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:24:52 GMT)
Non-stabilizerness in open XXZ spin chains: Universal scaling and dynamics [0.0]
開放型XXZスピンチェーンの魔法を境界ゲインと損失、あるいはバルクデファスリングで調べる。我々は行列積状態の定式化の中で$M$を計算するための,新しい,高効率なアルゴリズムを開発した。これらの発見は、オープン量子系における普遍性と力学を探索するための強力な診断ツールとしてマジックを位置づけている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:41:52 GMT)
Non-Markovian spontaneous emission in a tunable cavity formed by atomic mirrors [0.0]
導波管型量子電磁力学装置に配置した2レベル試験原子の非マルコフ自然放出ダイナミクスを解析した。テスト原子の非マルコフ力学とフィールドの創発スペクトル密度を解析した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:03:33 GMT)
Neural Networks for on-chip Model Predictive Control: a Method to Build Optimized Training Datasets and its application to Type-1 Diabetes [0.0]
ニューラルネットワーク(NN)をトレーニングしてモデル予測制御(MPC)アルゴリズムとして動作させることは、制約された組み込みデバイスでそれらを実装するための効果的な方法である。我々は、最適サンプリングデータセット(OSD)の概念を理想的なトレーニングセットとして導入し、それらを生成するための効率的なアルゴリズムを提案する。本研究は, ヴァージニア大学のMPCアルゴリズムを再現して, Type-1糖尿病における自動インスリンデリバリーのためのNNのトレーニングによるOSDの有効性を実証するものである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:25:06 GMT)
Neural Network Emulation of the Classical Limit in Quantum Systems via Learned Observable Mappings [0.0]
ニューラルネットワークアーキテクチャを開発し,初期期待値とhbar$から位置期待値の時間進化へのマッピングを学習する。ネットワークの予測を異なるhbarのレジームで分析することにより、量子古典遷移の性質に関する計算的な洞察を提供することを目指している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:48:36 GMT)
Name of Thrones: Evaluating How LLMs Rank Student Names, Race, and Gender in Status Hierarchies [0.0]
我々は5つの民族にまたがる名前のバリエーションを大規模に分析し、AIがどのように名前バイアスを示すかを調べる。 AIが白人を好んでいるという一般的な仮定とは対照的に、東アジアや一部の文脈では、南アジアの名前が上位にランクされている。ジェンダーは偏見を緩やかにし、一部の人種集団では不公平な不公平に直面している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:47:39 GMT)
Multi-Agent Reinforcement Learning for Greenhouse Gas Offset Credit Markets [0.0]
政府は企業に対して排ガス制限を課し、その限界を超える排ガスを罰することができる。排ガス過剰は、二酸化炭素削減プロジェクトに投資する企業によっても相殺される可能性がある。オフセット信用市場における有限エージェントナッシュ均衡を特徴付ける。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:56:42 GMT)
Mildly-Interacting Fermionic Unitaries are Efficiently Learnable [0.0]
アルゴリズムはガウス近傍のガウス次元のフェルミオン単位系を時間内に少なくとも2n - O(t)$で学習できることを示す。また、ガウス近傍のフェルミオン性ユニタリに関する構造的な結果も証明する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:59:32 GMT)
Measuring coherent dynamics of a superconducting qubit in an open waveguide [0.0]
共振器不要条件下で超伝導トランスモン量子ビットの緩和と脱コヒーレンス率を測定した。周波数領域の測定から抽出したパラメータと対応する推定値との整合性を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:52:54 GMT)
Marginal-constrained entropy accumulation theorem [0.0]
チャネル条件エントロピーはその正規化バージョンに等しく、より一般的にはチャネルのテンソル積にまたがる加法性を示す。暗号の目的のために、我々の鎖則をチャネルの列に適用すると、R'enyiエントロピーの新たな変種が生成される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:19:57 GMT)
Making informed decisions in cutting tool maintenance in milling: A KNN-based model agnostic approach [0.0]
本研究では、機械学習を利用して、さまざまな工具摩耗条件下で実験から収集した実時間力信号を分析する。このモデルは、ツールの摩耗を検出するだけでなく、各決定の背後にある理由に関する洞察を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:04:00 GMT)
Long-distance quantum communication using concatenated ring graph codes [0.0]
本稿では,リンググラフ符号と線形光ベル状態測定に基づく一方向量子リピータアーキテクチャを提案する。これにより、単一量子ビット誤り率が存在する場合でも、kHZレートでの長距離量子通信が可能となる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:45:47 GMT)
Limits of Discrete Energy of Families of Increasing Sets [0.0]
集合のハウスドルフ次元はリースエネルギーを用いて検出できる。 x_n$ という点列が集合 $E の部分集合 mathbbRd$ を適切な意味で埋める状況を考える。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:45:14 GMT)
Leveraging Point Transformers for Detecting Anatomical Landmarks in Digital Dentistry [0.0]
我々はMICCAI 2024の3DTeethLand Grand Challengeで行った実験について紹介する。我々は、ポイントトランスフォーマーv3インスパイアされたモジュールを設計し、ポイント間距離を予測するために軽量デコーダによって処理される有意義な幾何学的特徴と解剖学的特徴を捉えた。有望な結果を報告し、学習した特徴解釈可能性に関する洞察について考察する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:34:56 GMT)
Lecture notes on quantum computing [0.0]
このコースの目的は、量子コンピューティングの理論的概要を提供することである。これらのトピックに関する講義は12の章にまとめられ、そのほとんどは最後に提案されたエクササイズを含んでいる。チャルマーズでは、授業は7週間で行われ、週に3回の2時間の講義やチュートリアルが行われる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:24:41 GMT)
Learning to sample fibers for goodness-of-fit testing [0.0]
離散指数族モデルに対する完全適合性テストを構築することの問題点を考察する。この問題をマルコフ決定プロセスに変換し、サンプリングのための「よい動きを学ぶための強化学習アプローチ」を示す。提案アルゴリズムは,評価可能な収束性を持つアクタ・クリティカル・サンプリング方式に基づいている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:35:15 GMT)
Laplacian quantum walks on blow-up graphs [0.0]
我々は,強いコスペクトル性,周期性,完全状態伝達(LPST)と,爆発グラフ上での良好な状態伝達(LPGST)を特徴付ける。また,樹木のクラスを爆破する際のLPSTとLPGSTについても検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:02:59 GMT)
LOKA Protocol: A Decentralized Framework for Trustworthy and Ethical AI Agent Ecosystems [0.0]
我々は倫理的に統制された相互運用可能なAIエージェントエコシステムを構築するための統一されたシステムレベルのアーキテクチャであるLoka Protocol(Layered Orchestration for Knowledgeful Agents)を提示する。アイデンティティ、信頼、倫理をプロトコル層自体に組み込むことで、Lokaは責任、透明性、自律的なAIエコシステムの新しい時代の基礎を確立します。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 06:51:35 GMT)
Knowledge-dependent optimal Gaussian strategies for phase estimation [0.0]
推定位相パラメータの知識に基づいて、最適純単モードガウスプローブ状態を特定する。先行不確実性が大きい場合、最適プローブ状態はコヒーレント状態に近いことが分かる。驚くべきことに、最適なプローブ状態が急激な真空状態に変化するクリアジャンプがある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:15:06 GMT)
K-means Enhanced Density Gradient Analysis for Urban and Transport Metrics Using Multi-Modal Satellite Imagery [0.0]
本研究では,都市部を区分し,都市中心を同定し,密度勾配を定量化する手法を開発した。提案手法は,密度勾配係数(alpha$)と,密度が目標閾値に達する最小有効距離(LD)の2つの重要な指標を計算する。都市構造を明らかにすることで,これらの指標が公共交通機関の分析に有効なスクリーニングツールであることを実証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:25:42 GMT)
Integration of a high-fidelity model of quantum sensors with a map-matching filter for quantum-enhanced navigation [0.0]
原子干渉計を用いた重力勾配計の高忠実度モデルの実現について報告する。量子重力勾配計を用いた地図マッチングによるナビゲーション支援により,安定した軌道が導かれることを示す。センサの傾きを3.3度以下に抑えるなど,これらの誤差を軽減するための要件を導出する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:07:21 GMT)
Improving Statistical Privacy by Subsampling [0.0]
プライバシメカニズムとしてよく使われるのは、クエリに応答するデータのサンプルを取得することだ。本論文は, 統計的条件下で, サンプリング方法の違いが, プライバシを増加させるかどうかを, 正確に検証する。 DP設定のトレードオフ関数は (epsilon,delta)-pairs よりもプライバシーの指標として提案されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:40:45 GMT)
Improved MST3 Encryption scheme based on small Ree groups [0.0]
本稿では,小Reeグループに基づく暗号方式を提案する。本稿では,暗号化方式のセキュリティパラメータの全体的な向上のために,小さなReeグループ構造を利用することを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:51:56 GMT)
Impact of the Sagnac Effect on Thermodynamic and Magnetocaloric Properties of a Rotating Two-Dimensional Electron Gas [0.0]
本研究では, 回転試料中の非接触2次元電子ガス(2DEG)の熱力学特性に及ぼすサニャック効果の影響を磁場の影響下で検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:23:22 GMT)
IgCraft: A versatile sequence generation framework for antibody discovery and engineering [0.0]
IgCraftは、Bayesian Flow Networks上に構築された、ペア化されたヒト抗体配列生成のための多目的モデルである。以前分離されたタスクを単一のスケーラブルな生成モデルに統合することで、IgCraftはヒトの抗体配列をサンプリングするための汎用的なプラットフォームを提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:24:18 GMT)
Identifying high performance spectrally-stable quantum defects in diamond [0.0]
半導体の量子欠陥は量子技術の中心になりつつある。ダイヤモンドの最も顕著な量子欠陥は窒素空孔(NV)中心である。我々は、中心対称性、可視範囲での放射、および好ましい電子構造と達成可能な電子構造を組み合わせた欠陥を同定する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:26:24 GMT)
Heating reduction as collective action: Impact on attitudes, behavior and energy consumption in a Polish field experiment [0.0]
暖房と温水利用は欧州連合における家庭のエネルギー消費の80%近くを占める。ポーランドの大学寮の学生を対象に,暖房と給湯を対象とする心理的・技術的介入の混合について検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:41:37 GMT)
Ground-State-Based Model Reduction with Unitary Circuits [0.0]
我々は基底状態のユニタリ変換に基づく低エネルギー有効モデルを得る。半充填時の1次元および2次元2次元2乗格子ハバードモデルを用いて,本手法を検証した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 00:23:13 GMT)
Greedy Restart Schedules: A Baseline for Dynamic Algorithm Selection on Numerical Black-box Optimization Problems [0.0]
本稿では,選択時の未解決学習問題の分布に最善を尽くすアルゴリズムを反復的に選択するスケジューリング手法を提案する。我々は,BBOBテストベッド上での数値ブラックボックス最適化からよく知られた手法を実演し,従来のポートフォリオから様々な評価プロトコルにまたがって,単一と仮想のベストソルバのギャップの多くを埋める方法を示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:54:21 GMT)
Generative AI for Brane Configurations and Coamoeba [0.0]
本研究では,複雑な構造変調を入力として選択し,対応するコアメーバを生成する条件変分オートエンコーダ(CVAE)を訓練する。これにより、同じトーリックカラビ・ヤウ 3次元多様体に対応する 4d N=1 理論の族に対する位相空間全体の高分解能表現が得られる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:26:43 GMT)
Generating three transparency windows, Fano-resononce and slow/fast light in magnomechanical system through an auxiliary microwave cavity [0.0]
ハイブリッドキャビティマグノメカニカルシステムにおいて,マグノメカニカル誘導透過(MMIT)現象,ファノ共鳴,低速光効果について検討した。ファノ共鳴現象の背後にあるメカニズムについて解説する。また, 原子-光子結合強度の調整により, 遅い光分布が減少することを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 18:09:37 GMT)
Generalized probabilistic canonical correlation analysis for multi-modal data integration with full or partial observations [0.0]
Generalized Probabilistic Canonical correlation Analysis (GPCCA) はマルチモーダルデータの統合と共同次元化のための教師なし手法である。 GPCCAは、モデル内の欠落値を扱うことで、マルチモーダルデータ分析における重要な課題に対処する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:49:31 GMT)
GC-GAT: Multimodal Vehicular Trajectory Prediction using Graph Goal Conditioning and Cross-context Attention [0.0]
レーングラフに基づく動き予測モデルを提案し、まずまずグラフに基づく目標提案を予測し、その後、複数のコンテキスト要素にまたがってそれらを融合する。我々はnuScenesの動作予測データセットについて評価し、最先端の結果を得た。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:53:07 GMT)
GAAPO: Genetic Algorithmic Applied to Prompt Optimization [0.0]
大規模言語モデル(LLM)は様々なタスクにまたがって顕著な能力を示しており、その性能は入力プロンプトの品質に大きく依存している。迅速なエンジニアリングは有効であると証明されているが、通常は手動による調整に依存しており、時間を要するため、潜在的に最適ではない。本稿では,代々のプロンプトを進化させるために遺伝的原理を活用するハイブリッド最適化フレームワークであるPrompt Optimizationに応用したジェネティックアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:56:03 GMT)
Frustration graph formalism for qudit observables [0.0]
非エルミートユニタリ作用素で表される素数 d を持つ d-アウトカム量子可観測体の群を考える。我々は、クディット安定化部分空間に対するエンタングルメントの一般化幾何測度を計算する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:03:34 GMT)
FourierNAT: A Fourier-Mixing-Based Non-Autoregressive Transformer for Parallel Sequence Generation [0.0]
本稿では、デコーダにフーリエを混合して並列に出力シーケンスを生成する非自己回帰変換器(NAT)アーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 21:21:55 GMT)
Fine-Tuning Florence2 for Enhanced Object Detection in Un-constructed Environments: Vision-Language Model Approach [0.0]
非構成の複雑な環境における物体検出タスクのためのFlorence2モデルを微調整した。最適化されたFlorence2モデルでは、オブジェクト検出精度が大幅に向上した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:19:42 GMT)
Figurative Archive: an open dataset and web-based application for the study of metaphor [0.0]
フィギュラティブ・アーカイブ(Figurative Archive)は、イタリア語で997のメタファーの公開データベースであり、格付けとコーパスに基づく尺度が豊富である。日常的なメタファーと文学的なメタファーの両方を含み、構造や意味の領域によって異なり、親しみと他の尺度の相関関係に基づいて検証される。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:10:50 GMT)
Field-effect detected magnetic resonance of NV centers in diamond based on all-carbon Schottky contacts [0.0]
窒素空孔(NV)中心はダイヤモンドの欠陥であり、スピン状態はフォトルミネッセンスや電気的に光発生率を利用して光学的に読み取ることができる。我々は、IIa型ダイヤモンド材料に対して、NV中心のアンサンブルによって生じる電子-ホール対が、照明時にp型物質にどのように導かれるかを示す。我々は、NVアンサンブルスピン共鳴のバイアス電圧と高周波誘起励起の関数として、照明に伴う逆電流がどう変化するかを分析する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:48:49 GMT)
Experimental Machine Learning with Classical and Quantum Data via NMR Quantum Kernels [0.0]
核磁気共鳴(NMR)プラットフォームで10ビットの星トポロジーレジスタ上に量子カーネルを実装した。我々は、データ依存ユニタリ変換を用いて、複数の量子コヒーレンス順序の進化における古典的なデータを実験的に符号化した。以上の結果から,このカーネルは未知のデータに対してよく一般化できることを示した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:51:53 GMT)
Ever-Improving Test Suite by Leveraging Large Language Models [0.0]
ソフトウェアシステムの実際の使用を反映したテストケースによるテストスイートの拡大は、長く続くソフトウェアシステムの品質を維持する上で非常に重要である。 E-Testは、本番環境で発生しまだテストされていない動作を実行するテストケースでテストスイートを漸進的に拡張するアプローチである。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:38:25 GMT)
Evaluating the Propensity of Generative AI for Producing Harmful Disinformation During an Election Cycle [0.0]
本研究は, 選挙期間中に有害な偽情報を生成するための, 現在の生成AIモデルの妥当性について検討する。コピロとジェミニは、予想される最低限の損害に気付き、全体的な安全性能に結びついていることが判明した。敵対的役割の特徴が発見され全てのモデルにより大きな害をもたらすことが判明しました
論文参考訳（メタデータ） (Tue, 15 Apr 2025 22:05:39 GMT)
Erzeugunsgrad, VC-Dimension and Neural Networks with rational activation function [0.0]
本稿では,Affine Intersection TheoryとVC-Theory of Computational Learning Theoryを結びつける上で,Erzeugungsgradが重要な要素であることを示す。特に、VC次元とクルル次元が断続理論に基づく対数係数に線形に関係していることを証明する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:16:38 GMT)
Emotional Strain and Frustration in LLM Interactions in Software Engineering [0.0]
大規模言語モデル(LLM)は、ソフトウェア工学における日々のタスクにますます統合されています。フラストレーションは、ストレスとバーンアウトにエスカレートした場合、エンジニアの生産性と幸福に悪影響を及ぼす可能性がある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:42:15 GMT)
Efficient and systematic calculation of arbitrary observables for the matrix product state excitation ansatz [0.0]
熱力学限界における単粒子キャラクタによる励起の期待値を計算するための一般的な方法は文献に欠けている。本稿では行列積演算子として表される任意の可観測値を計算する再帰アルゴリズムを提案する。本研究では,スピン-1ハイゼンベルク鎖と一次元ハバード模型の低層励起について検討し,本手法の汎用性を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:52:31 GMT)
ELTEX: A Framework for Domain-Driven Synthetic Data Generation [0.0]
LLMドメイン専門化の課題に対処するフレームワークであるELTEX(Efficient LLM Token extract)を紹介する。暗黙の知識伝達に依存するアプローチとは異なり、ELTEXは専門知識の完全性を維持するためにドメインシグナルを明示的に活用する。コントリビューションには,(1)ELTEXフレームワーク,(2)Google Sheetsアドオン実装,(3)ELTEXが小規模モデルと大規模モデル間のパフォーマンスギャップをいかに埋めるかを示す実証的検証,(4)ブロックチェーンサイバー攻撃検出のための11,448テキストの合成データセットなどが含まれている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 08:14:25 GMT)
Dynamical electronic correlation and chiral magnetism in van der Waals magnet Fe4GeTe2 [0.0]
Fe4GeTe2は、その室温強磁性挙動と複雑な熱水相図によって大きな衝撃を印加する。我々は,磁化方向の面内相互作用を解析し,基礎となる結晶対称性と簡単な軸方向の解析を行った。計算されたFe原子のL端の磁気円二色度とX線吸収スペクトルに対する動的相関の影響は、既存の実験結果とよく比較できる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 19:13:52 GMT)
Dueling Deep Reinforcement Learning for Financial Time Series [0.0]
強化学習は動的環境における意思決定問題を解決するための強力なパラダイムとして登場した。我々の焦点は、取引コストなどの現実的な制約を考慮しつつ、取引戦略を最適化できる訓練エージェントである。この研究は、手数料のないシナリオにおけるモデルパフォーマンスを評価し、報酬力学に対するコスト感受性環境の影響を強調した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:30:34 GMT)
Divergence of Empirical Neural Tangent Kernel in Classification Problems [0.0]
分類問題では、完全連結ニューラルネットワーク(FCN)と残留ニューラルネットワーク(ResNet)は、ニューラルタンジェントカーネル(NTK)に基づくカーネルロジスティック回帰によって近似できない。ネットワーク幅が大きくなるにつれて、NTKはトレーニングサンプル上で常にNTKに均一に収束しないことを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:30:21 GMT)
Deterministic Teleportation and Universal Computation Without Particle Exchange [0.0]
制御とターゲットの間に粒子を交換しない普遍的な制御相ゲートを提案する。これにより、私には交換不要な量子計算の完全なレパートリーが可能になる。このゲートとそれに基づくプロトコルは実験的に実現可能であることを示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:19:37 GMT)
Designing Child-Friendly AI Interfaces: Six Developmentally-Appropriate Design Insights from Analysing Disney Animation [0.0]
本稿では,子どもと子どものアニメーションの人工知能設計を橋渡しする。子ども中心のAIインタフェース設計に移行可能な設計思想を6つ提示する。今後の方向性としては、実証テスト、文化適応、参加型共同設計などがある。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:07:00 GMT)
Cybersecurity through Entropy Injection: A Paradigm Shift from Reactive Defense to Proactive Uncertainty [0.0]
エントロピー注入は、予測不可能性を高め、システムのセキュリティを高めるために、意図的にランダム性をセキュリティメカニズムに注入する。エントロピー注入は攻撃確率を著しく低下させる可能性を示し、一部の実装では90%以上削減され、性能への影響は最小限である。エントロピー注入は、反応防御から積極的な不確実性管理へのパラダイムシフトを表していると結論付けている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:08:57 GMT)
Control-driven critical fluctuations across quantum trajectories [0.0]
安定状態の量子コヒーレンスが制御遷移において相転移することを示す。観測対象のゆらぎの観点から制御遷移を解析する。本稿では, ポストセレクションを使わずに実験的に測定する方法について論じる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 01:59:09 GMT)
Context-Aware Palmprint Recognition via a Relative Similarity Metric [0.0]
我々は、相対的類似度尺度(RSM)を導入して、ヤシ指紋認識のためのマッチング機構の新しい手法を提案する。 RSMは、データセット全体のコンテキスト内でペアの類似性がどのように比較されるかをキャプチャする。提案手法は,Tongjiデータセット上で新たに0.000036%のEER(Equal Error Rate)を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 15:46:17 GMT)
Comparative Analysis of Quantum Support Vector Machines and Variational Quantum Classifiers for B-cell Epitope Prediction in Vaccine Design [0.0]
本研究では,B細胞予測における量子支援ベクトルマシン(QSVM)と変分量子(VQC)の2つの量子機械学習モデルについて検討した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:37:26 GMT)
Cavity cooling using ultrafast electrons [0.0]
電子を通すことでキャビティ内の熱フォトニック状態を冷却する方法を提案する。このような絡み合い相互作用の連続は空洞の冷却を達成することができる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 09:41:43 GMT)
Cartesian Merkle Tree [0.0]
カルテシアンメルクル木(Cartesian Merkle Tree)は、二分探索木、ヒープ、メルクル木の性質を組み合わせた決定論的データ構造である。これは$O(log n)$タイムで要素の挿入、更新、削除をサポートし、$n$スペースを必要とし、Merkleベースの認証パスを通じてメンバシップと非メンバシップの証明を可能にする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 07:47:10 GMT)
Can Vision-Language Models Understand and Interpret Dynamic Gestures from Pedestrians? Pilot Datasets and Exploration Towards Instructive Nonverbal Commands for Cooperative Autonomous Vehicles [0.0]
自動運転においては、交通ジェスチャー(TG)を正しく解釈することが不可欠である本研究では,ゼロショット解釈における最先端ビジョン言語モデル(VLM)の機能について検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:04:25 GMT)
Can Large Language Models Become Policy Refinement Partners? Evidence from China's Social Security Studies [0.0]
本研究では,中国の社会保障問題に対する政策レコメンデーション作成における大規模言語モデル(LLM)の機能境界と性能特性について検討した。 LLMは、複雑な社会的ダイナミクスへの対処、利害のバランス、社会保障領域内の財政リスクの制御において、重大な制限に直面している。 DeepSeek-R1は、ポリシーレコメンデーション生成におけるすべての評価次元において、GPT-4oよりも優れた性能を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 03:58:51 GMT)
Bures geodesics and quantum metrology [0.0]
ビューズ計量に対する混合量子状態の多様体上の測地学について検討する。これらの測地線は、アンシラと結合した系の物理的非マルコフ進化に対応することが示されている。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 20:47:55 GMT)
Bringing together invertible UNets with invertible attention modules for memory-efficient diffusion models [0.0]
高次元医用データセットの拡散モデルのための1つのGPUメモリ効率トレーニングのための新しいアーキテクチャを提案する。提案モデルは,非可逆アテンションモジュールを持つ非可逆UNetアーキテクチャを用いて構築される。この新モデルは、多数の画像生成タスクに適用できるが、3D BraTS 2020データセットにそのメモリ効率を示す。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 05:26:42 GMT)
Bridging Equilibrium and Kinetics Prediction with a Data-Weighted Neural Network Model of Methane Steam Reforming [0.0]
運動と平衡の両方を統一できる代理モデルを示す。運動と平衡の実験からの実験データを含む包括的なデータセットに基づいてトレーニングされた人工ニューラルネットワーク。ネットワークが予測の連続デリバティブを提供する能力は、特にプロセスモデリングと最適化に有用である。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:55:06 GMT)
Brickwall One-Loop Determinant: Spectral Statistics & Krylov Complexity [0.0]
ブロックウォールモデルは,様々なアンサンブルにまたがるランダム行列理論と整合性を示す。また、ディリクレ境界条件パラメータの極値における積分可能性のシグネチャも同定する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 10:52:13 GMT)
Benchmarking Vision Language Models on German Factual Data [0.0]
本稿では,ドイツ語と英語の事実知識に基づくオープンウェイトVLMの分析を行う。有名人や観光人にとって、VLMはドイツの画像コンテンツに対する視覚的認識が欠けているため、苦労している。動物や植物にとって、テストされたモデルは、しばしば画像の内容を正しく識別するが、ドイツのランゲージでは失敗する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:55:24 GMT)
Bell-Mermin-Klyshko Inequalities and One-way Information Deficit of Dirac Fields in Noninertial Frames [0.0]
非慣性フレームにおけるディラック場のベル・メルミン・クリシュコ不等式と一方方向情報不足について検討する。この研究は、相対論的量子情報におけるベル非局所性の存在と一方的情報不足の重要性を明らかにする。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 04:48:18 GMT)
Assessing how hyperparameters impact Large Language Models' sarcasm detection performance [0.0]
サルカズムの検出は人間と機械の両方にとって難しい。本研究は,OpenAIのGPTとMetaのLlama-2モデルにおいて,モデル特性が皮肉検出に与える影響について検討する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 23:10:49 GMT)
Assessing Tensor Network Quantum Emulators for Hamiltonian Simulation of Pharmaceutical Molecules: Challenges and Limitations in Drug Discovery Applications [0.0]
量子コンピューティングは、特に薬物発見において、計算化学シミュレーションの革命を約束する。現在の量子ハードウェアはノイズとスケールによって制限されており、ブリッジ技術を必要とする。本研究は、ハミルトンシミュレーションのためのテンソルネットワーク量子エミュレータの初期評価を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:14:01 GMT)
An Attempt to Devise a Pairwise Ising-Type Maximum Entropy Model Integrated Cost Function for Optimizing SNN Deployment [0.0]
スパイクニューラルネットワーク(SNN)は、生物学的ニューロンのスパイク動作をエミュレートし、通常、分散メモリニューロモルフィックハードウェアにデプロイされる。 We model SNN dynamics using a Ising-type pairwise interaction framework, bridging micro neuron interaction with macroscopic network behavior。我々は、sPyNNakerニューロモルフィックプラットフォーム上に配置された2つのSNNに対するアプローチを評価した。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:31:27 GMT)
An Adaptive Dropout Approach for High-Dimensional Bayesian Optimization [0.0]
本稿では,AdaDropoutを提案する。最先端の高次元ベイズ最適化手法と比較して優れた結果が得られる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:23:25 GMT)
Advancing the heralded photon-number-state characterization by understanding the interplay of experimental settings [0.0]
単モード双対ビームから生成される最大3個の光子を含む有理数状態の特性を理論的に探索する。以上の結果から,高画質光子数状態を生成するための最適パラメータ領域が同定され,量子技術での利用を推し進める上で有用な知見が得られた。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:47:19 GMT)
Accelerating Multiscale Modeling with Hybrid Solvers: Coupling FEM and Neural Operators with Domain Decomposition [0.0]
本研究は、物理インフォームドDeepONetとFEMをドメイン分解を通じて統合する新しいハイブリッドフレームワークを紹介する。提案するハイブリッドソルバは,サブドメインインターフェース間の解の連続性を維持し,メッシュの細かな要求を排除して計算コストを低減し,時間依存シミュレーションにおけるエラーの蓄積を軽減する。この研究は、数値的手法とAI駆動のサロゲートのギャップを埋め、工学と科学の応用における高忠実性シミュレーションのためのスケーラブルな経路を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 16:54:04 GMT)
AI-guided Antibiotic Discovery Pipeline from Target Selection to Compound Identification [0.0]
タンパク質構造予測と機械学習の最近の進歩は、薬物発見を加速する有望な機会を提供する。我々は3次元構造認識生成モデルのエンド・ツー・エンドでガイド付き実現を実現する。この研究は、初期の抗生物質開発に人工知能をデプロイするための比較ベンチマークと青写真を提供する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 11:36:27 GMT)
A simple algorithm to reflect through eigenspaces of unitaries [0.0]
実装可能なユニタリの固有空間を反映する作業を考える。同じサイズと深さのスケーリングを持つ単純なアルゴリズムを提案するが、すべての問題インスタンスに対して1つのアンシラ量子ビットしか必要としない。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:18:39 GMT)
A deep dive into the interplay of structured quantum peaked circuits and infinite temperature correlation functions [0.0]
本稿では,雑音量子デバイスに対する物理的に有意な観測機能として,無限温度相関関数 (ITCF) を提案する。我々はGroverベースの振幅増幅または浅い構造化回路を用いて、意図的にバイアスされた量子状態を構築する。本研究は,ランダム平均化による信号損失を軽減する,問題特異的な状態準備フレームワークについて述べる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:41:36 GMT)
A Unified Hardware Accelerator for Fast Fourier Transform and Number Theoretic Transform [0.0]
Number Theoretic Transform (NTT) は、ポスト量子格子ベースの暗号において効率的な乗算を計算するのに欠かせないツールである。 512点複素FFTと256点NTTの両方をサポートする統一ハードウェアアクセラレータを実証する。本実装は,FPGA上での最先端のML-KEM/ML-DSA NTTアクセラレータに匹敵する性能を実現する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:13:05 GMT)
A Rollout-Based Algorithm and Reward Function for Efficient Resource Allocation in Business Processes [0.0]
本稿では,ロールアウト型DRLアルゴリズムと報酬関数を提案し,その目的を直接最適化する。提案アルゴリズムは,動作の異なる実行軌跡を評価することにより,ポリシーを反復的に改善する。我々の報酬関数は平均サイクル時間を最小化する目的関数を直接分解する。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 14:46:58 GMT)
A Review of Design Concerns in Superconducting Quantum Circuits [0.0]
本稿では,量子情報応用のための超伝導回路デバイスの設計プロセスについて述べる。デバイス上で望ましい実効ハミルトニアンを実装するために考慮すべき要因について論じる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 17:11:10 GMT)
A Quantum-Inspired Algorithm for Wave Simulation Using Tensor Networks [0.0]
等方性波動方程式 (IWE) を1次元, 2次元, 3次元でシミュレーションするアルゴリズムを提案する。 Networksと組み合わせたユニタリ回路の対角化により、ラップトップ上の1013ドルグリッドポイントの分解能を持つ波動方程式のシミュレーションが可能になる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 13:36:08 GMT)
A Neural Network Alternative to Tree-based Models [0.0]
我々のモデルであるSparse TABular NET や sTAB-Net がツリーベースモデルよりも効果的であることを示す。 SHAPのようなポストホックメソッドよりも優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:28:35 GMT)
A Framework for the Private Governance of Frontier Artificial Intelligence [0.0]
本稿では,ハイブリッド・パブリック・プライベート・システムによるフロンティアAIシステムのガバナンスについて提案する。政府によって認可され、監督される民間機関は、オプトインベースでフロンティアAIシステムの開発者に認証を提供する。オプトインと引き換えに、フロンティアAI企業は、顧客のモデル誤用に対するトルト責任から保護を受ける。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 02:56:26 GMT)
$R$-matrix type parametrization of the Jost function for extracting the resonance parameters from scattering data [0.0]
非相対論的二分散乱データに適合し、量子共鳴のパラメータを抽出する新しい手法を提案する。この方法は、よく知られた$R$-matrixアプローチと、Jost関数の半解析的表現に基づく解析を組み合わせる。
論文参考訳（メタデータ） (Tue, 15 Apr 2025 12:29:57 GMT)