Phi-4-Mini Technical Report: Compact yet Powerful Multimodal Language Models via Mixture-of-LoRAs [195.2] 我々はPhi-4-MiniとPhi-4-Multimodalを導入し、コンパクトだが高機能な言語とマルチモーダルモデルを提案する。
Phi-4-Miniは、高品質なウェブおよび合成データに基づいて訓練された3.8ビリオンパラメータ言語モデルである。
Phi-4-Multimodalは、テキスト、ビジョン、音声、音声の入力モーダルを単一のモデルに統合するマルチモーダルモデルである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:05:58 GMT)
Energy-Based Diffusion Language Models for Text Generation [126.2] エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。
我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:28:45 GMT)
CorDA: Context-Oriented Decomposition Adaptation of Large Language Models for Task-Aware Parameter-Efficient Fine-tuning [101.8] 現在の微調整手法は、学習すべき下流タスクのコンテキストや、維持すべき重要な知識のコンテキストに広く適用できるアダプタを構築している。
学習可能なタスク対応アダプタを構築するコンテキスト指向の分解適応手法であるCorDAを提案する。
本手法は,知識保存型適応と指導レビュー型適応の2つの選択肢を実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:18:41 GMT)
QArtSR: Quantization via Reverse-Module and Timestep-Retraining in One-Step Diffusion based Image Super-Resolution [97.0] 1段階拡散ベース画像超解像モデル(OSDSR)は、近年ますます優れた性能を示している。
そこで我々は,QArtSR と呼ばれる OSDSR の逆加群による量子化と時間ステップの調整を効率的に行う方法を提案する。
我々の4ビットおよび2ビットの量子化実験結果から、QArtSRは最近の先行比較法に対して優れた効果が得られることが示唆された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:11:07 GMT)
Every FLOP Counts: Scaling a 300B Mixture-of-Experts LING LLM without Premium GPUs [96.7] 2つの異なる大きさのMoE大言語モデル(LLM)を提示する。
Ling-Liteは168億のパラメータと275億のアクティベートパラメータを持ち、Ling-Plusは2900億のパラメータと288億のアクティベートパラメータを持っている。
本稿では,(1)モデルアーキテクチャとトレーニングプロセスの最適化,(2)トレーニング異常処理の洗練,(3)モデル評価効率の向上のための革新的な手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:43:39 GMT)
Fundamental Limits of Hierarchical Secure Aggregation with Cyclic User Association [93.5] 階層的なセキュアな集約は、連合学習によって動機づけられる。
本稿では,各ユーザが連続する$B$のリレーに接続される循環型アソシエーションパターンを用いたHSAについて考察する。
本稿では、勾配符号化にインスパイアされた入力に対するメッセージ設計を含む効率的なアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:01:49 GMT)
Benchmarking Vision Language Model Unlearning via Fictitious Facial Identity Dataset [93.0] 我々は、未学習アルゴリズムの有効性を頑健に評価するために設計された新しいVLMアンラーニングベンチマークであるFacial Identity Unlearning Benchmark (FIUBench)を紹介する。
情報ソースとその露出レベルを正確に制御する2段階評価パイプラインを適用した。
FIUBench 内の 4 つのベースライン VLM アンラーニングアルゴリズムの評価により,すべての手法がアンラーニング性能に制限されていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:05:19 GMT)
Reverse Thinking Makes LLMs Stronger Reasoners [90.4] RevThinkは、データ拡張と学習目的からなるフレームワークである。
12のデータセットに対する実験では、学生モデルのゼロショットのパフォーマンスよりも平均13.53%改善されている。
RevThinkはまた、アウト・オブ・ディストリビューション・ホールドアウトデータセットへの強力な一般化を示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:33:35 GMT)
WritingBench: A Comprehensive Benchmark for Generative Writing [87.5] writeBenchは、6つのコア書き込みドメインと100の技術的記述を含む大規模言語モデル(LLM)を評価するために設計されたベンチマークである。
本稿では、LCMがインスタンス固有の評価基準を動的に生成することを可能にするクエリ依存評価フレームワークを提案する。
このフレームワークは、基準対応スコアリングのための微調整された批評家モデルによって補完され、スタイル、フォーマット、長さの評価を可能にする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:56:20 GMT)
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning [87.3] textbfR1-Searcherは、大規模言語モデルの検索能力を高めるために設計された、2段階の結果に基づく新しいRLアプローチである。
本フレームワークは, コールドスタート時に, プロセス報酬や蒸留を必要とせず, RLのみに依存している。
提案手法は, クローズドソースGPT-4o-miniと比較して, 従来の強力なRAG法よりも有意に優れていた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:14:44 GMT)
Jointly Understand Your Command and Intention:Reciprocal Co-Evolution between Scene-Aware 3D Human Motion Synthesis and Analysis [80.5] シーン認識型テキスト対人間合成は、同じテキスト記述から多様な屋内動作サンプルを生成する。
そこで本研究では,テキスト駆動型シーン特異的なヒューマンモーション生成を3段階に分解するケースドジェネレーション戦略を提案する。
我々は3次元シーンにおけるリアルな人間の動き合成と頑健な人間の動き解析を共同で改善する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:20:01 GMT)
FinTMMBench: Benchmarking Temporal-Aware Multi-Modal RAG in Finance [79.8] FinTMMBenchは、ファイナンスにおける時間対応マルチモーダル検索・拡張生成システムを評価するための、最初の包括的なベンチマークである。
NASDAQ 100社の異種データから構築されたFinTMMBenchには,3つの大きなメリットがある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:13:59 GMT)
Symbolic Mixture-of-Experts: Adaptive Skill-based Routing for Heterogeneous Reasoning [76.1] シンボリックなテキストベースでグラデーションのないMixture-of-ExpertsフレームワークであるSybolic-MoEを提案する。
我々は,Sybolic-MoEのインスタンスレベルのエキスパート選択により,大きなマージンで性能が向上することを示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:03:13 GMT)
SMILENet: Unleashing Extra-Large Capacity Image Steganography via a Synergistic Mosaic InvertibLE Hiding Network [71.1] 本稿では,3つの重要なイノベーションを通じて25個の画像隠蔽を実現する新しい相乗的枠組みを提案する。
ネットワークアーキテクチャは、可逆操作と非可逆操作をコーディネートし、シークレット画像とカバー画像の両方における情報冗長性を効率的に活用する。
相補的なモジュールをコーディネートして、視覚的品質の優れた既存のメソッドよりも3.0倍高いキャパシティを実現する統一的なトレーニング戦略。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:31:47 GMT)
R1-Zero's "Aha Moment" in Visual Reasoning on a 2B Non-SFT Model [70.8] 非SFT 2Bモデルのみを用いたマルチモーダル推論における創発的特性の再現に成功した最初の例を示す。
本モデルはCVBenchで59.47%の精度を達成し, ベースモデルを約30%, SFT設定を2%以上上回った。
さらに,RLとインストラクションモデルを用いてR1のような推論を行おうとする試みの失敗と知見を共有した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:21:47 GMT)
Validating LLM-as-a-Judge Systems in the Absence of Gold Labels [70.7] 本稿では,評価の異なる評価手法とアグリゲーション方式で,判定システム性能の異なる尺度間の接続を描画する理論的解析を行う。
既存の検証手法では,選択したシステムよりも最大34%の精度で,最適に判断可能なシステムを選択することが可能であることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:09:47 GMT)
Uncertainty-Aware Decoding with Minimum Bayes Risk [70.7] 予測されたリスクに応じてモデル生成を選択する最小ベイズリスク復号法を,原理化された不確実性認識復号法に一般化する方法を示す。
この修正された予測リスクは、出力の選択と生成をいつ中止するかの判断の両方に有用であり、オーバーヘッドを発生させることなく改善を提供できることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:55:12 GMT)
Data-Efficient Generalization for Zero-shot Composed Image Retrieval [67.5] ZS-CIRは、トレーニングのために配布する三つ子を必要とせず、参照画像とテキスト記述に基づいて対象画像を検索することを目的としている。
1つの一般的なアプローチは、マッピングネットワークを用いてテキスト埋め込み空間内の擬似ワードトークンに画像埋め込みを転送するビジョン言語事前学習パラダイムである。
テキスト・サプリメント(TS)モジュールとセマンティック・セット(S-Set)という2つの新しい設計を含む,データ効率の一般化(DeG)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:49:31 GMT)
Superintelligence Strategy: Expert Version [64.7] AI開発を不安定にすることで、大国間の対立の可能性が高まる可能性がある。
スーパーインテリジェンス — ほぼすべての認知タスクにおいて、AIが人間よりもはるかに優れている — が、AI研究者によって期待されている。
本稿では,相互保証型AI誤動作の概念を紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:53:24 GMT)
DeltaProduct: Increasing the Expressivity of DeltaNet Through Products of Householders [63.7] リニアリカレントニューラルネットワーク(線形RNN)は、シーケンスモデリングのためのトランスフォーマーの競合代替手段として登場した。
既存のアーキテクチャは、表現性と効率の基本的なトレードオフに直面しており、状態遷移行列の構造によって規定されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:31:55 GMT)
Personalized Text Generation with Contrastive Activation Steering [63.6] そこで本研究では,ベクタとしてパーソナライズされた書体スタイルを分離し,表現する学習自由フレームワークを提案する。
本フレームワークは,PEFT法よりも1700倍のストレージ要求を削減しつつ,パーソナライズ生成において,8%の相対的な改善を実現している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:07:15 GMT)
AlphaEdit: Null-Space Constrained Knowledge Editing for Language Models [63.2] 大型言語モデル(LLM)は、しばしば誤った知識や時代遅れの知識による幻覚を示す。
パラメータに適用する前に、保存された知識のnull空間に摂動を投影する新しいソリューションであるAlphaEditを紹介する。
我々は,この予測が保存知識を問うと,後編集後のLLMの出力が変化しないことを理論的に証明する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:06:04 GMT)
DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.6] DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:41:18 GMT)
Chart-HQA: A Benchmark for Hypothetical Question Answering in Charts [62.5] 本稿では,同じ質問に対して仮定を課し,グラフの内容に基づいた反実的推論を行うようモデルに強制する,新しいChart hypothetical Question Answering (HQA)タスクを提案する。
さらに,MLLMの効率的なテキスト編集機能と人間の知識を併用して,多種多様な高品質HQAデータを低コストで生成する,人間とAIの対話型データ合成手法であるHAIを導入する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:18:44 GMT)
Simple linear attention language models balance the recall-throughput tradeoff [60.1] 線形およびすべり窓の注意を結合したシンプルなアーキテクチャであるBASEDを提案する。
我々は、最大1.3bパラメータの言語モデルをトレーニングし、BASEDがパープレキシティにおいて最強のサブクワッドラティックモデルと一致し、実世界のリコール集約タスクにおいて6.22の精度ポイントでそれらのモデルを上回っていることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:57:52 GMT)
Sketch-of-Thought: Efficient LLM Reasoning with Adaptive Cognitive-Inspired Sketching [60.0] 我々は,新しいプロンプトフレームワークであるSketch-of-Thought(SoT)を紹介する。
認知に触発された推論パラダイムと言語制約を組み合わせることでトークンの使用を最小化する。
SoTは、無視できる精度の影響でトークンを76%削減する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:57:17 GMT)
RS-vHeat: Heat Conduction Guided Efficient Remote Sensing Foundation Model [59.4] 本稿では,効率的なマルチモーダルリモートセンシング基盤モデルであるRS-vHeatを紹介する。
具体的には、RS-vHeatは、O(N1.5)$の複雑さを持つ熱伝導演算子(HCO)と、大域的受容場を適用している。
注意に基づくリモートセンシング基礎モデルと比較して、メモリ使用量を84%削減し、FLOPを24%削減し、スループットを2.7倍改善する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:24:25 GMT)
Understanding the Limits of Lifelong Knowledge Editing in LLMs [59.1] 我々は、生涯にわたる知識編集の研究を現実の編集に事実上の規模で橋渡しする。
まず,実世界のウィキデータ編集の大規模ベンチマークであるWikiBigEditを紹介した。
最初の例では、知識編集のための500万以上の質問応答ペアが含まれている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:45:42 GMT)
VISION-XL: High Definition Video Inverse Problem Solver using Latent Image Diffusion Models [58.5] 本稿では,遅延画像拡散モデルを用いた高精細ビデオ逆問題の解法を提案する。
提案手法は,NVIDIA 4090 GPUの1フレームあたり6秒未満でHD解像度の再構成を実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:43:19 GMT)
Robust Conformal Prediction with a Single Binary Certificate [58.5] コンフォーマル予測(CP)は、任意のモデルの出力を、真のラベルを(調整可能な)高い確率でカバーすることを保証した予測セットに変換する。
我々は,MCサンプルが著しく低い場合でも,より小さな集合を生成する頑健な共形予測を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:41:53 GMT)
A Simple and Generalist Approach for Panoptic Segmentation [57.9] 本稿では,深部エンコーダ-浅部デコーダアーキテクチャに基づく簡易な一般化フレームワークを提案する。
これはトレーニング中の不均衡に起因することを示し、その削減のための新しい方法を提案する。
提案手法は,MS-COCOデータセット上で55.1のPQを実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:26:50 GMT)
Articulated Object Manipulation using Online Axis Estimation with SAM2-Based Tracking [57.9] アーティキュレートされたオブジェクト操作は、オブジェクトの軸を慎重に考慮する必要がある、正確なオブジェクトインタラクションを必要とする。
従来の研究では、対話的な知覚を用いて関節のある物体を操作するが、通常、オープンループのアプローチは相互作用のダイナミクスを見渡すことに悩まされる。
本稿では,対話的知覚と3次元点雲からのオンライン軸推定を統合したクローズドループパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:24:50 GMT)
Black Box Causal Inference: Effect Estimation via Meta Prediction [56.3] 因果推論はデータセットレベルの予測問題であり,アルゴリズム設計を学習プロセスにオフロードする。
我々は,ブラックボックス因果推論 (BBCI) と呼ばれる,サンプルデータセットと効果ペアの因果効果の予測を学習することにより,ブラックボックス方式で推定器を構築する。
我々は,いくつかの因果推論問題に対して,BBCIを用いた平均治療効果(ATE)と条件平均治療効果(CATE)を正確に推定した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:43:19 GMT)
NavRAG: Generating User Demand Instructions for Embodied Navigation through Retrieval-Augmented LLM [55.8] VLN(Vision-and-Language Navigation)は、エージェントを具現化するための重要なスキルであり、自然言語の指示に従って3D環境をナビゲートすることができる。
従来の方法では、トラジェクトリ動画をステップバイステップでデータ拡張の指示に変換するが、そのような指示はユーザの通信スタイルとうまく一致しない。
本稿では,VLNのユーザ要求命令を生成する検索拡張生成フレームワークであるNavRAGを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:06:29 GMT)
On the Vulnerability of LLM/VLM-Controlled Robotics [54.6] 大規模言語モデル(LLM)と視覚言語モデル(VLM)を統合するロボットシステムの脆弱性を,入力モダリティの感度によって強調する。
LLM/VLM制御型2つのロボットシステムにおいて,単純な入力摂動がタスク実行の成功率を22.2%,14.6%減少させることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:01:59 GMT)
On the $O(\frac{\sqrt{d}}{T^{1/4}})$ Convergence Rate of RMSProp and Its Momentum Extension Measured by $\ell_1$ Norm [54.3] 本稿では、RMSPropとその運動量拡張を考察し、$frac1Tsum_k=1Tの収束速度を確立する。
我々の収束率は、次元$d$を除くすべての係数に関して下界と一致する。
収束率は$frac1Tsum_k=1Tと類似していると考えられる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:23:30 GMT)
Language Models Enable Simple Systems for Generating Structured Views of Heterogeneous Data Lakes [54.1] EVAPORATEは大規模言語モデル(LLM)を利用したプロトタイプシステムである。
コード合成は安価だが、各文書をLSMで直接処理するよりもはるかに正確ではない。
直接抽出よりも優れた品質を実現する拡張コード実装EVAPORATE-CODE+を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:33:50 GMT)
Partially Supervised Unpaired Multi-Modal Learning for Label-Efficient Medical Image Segmentation [53.7] 我々は、新しい学習パラダイムを部分教師付き無ペア型マルチモーダルラーニング(PSUMML)と呼ぶ。
そこで我々は,DEST (Ensembled Self-Training) フレームワークを用いた新しい部分クラス適応法を提案する。
我々のフレームワークは、部分的にラベル付けされていないマルチモーダルデータを用いて学習するためのモダリティ特定正規化層を持つコンパクトなセグメンテーションネットワークで構成されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:22:42 GMT)
A Survey on Tabular Data Generation: Utility, Alignment, Fidelity, Privacy, and Beyond [53.6] 異なるユースケースは、実際に有用な異なる要件を満たすために合成データを要求する。
合成データの実用性、合成データのドメイン固有の知識との整合性、実際のデータ分布と比較しての合成データ分布の統計的忠実度、プライバシ保護能力の4つの要件をレビューする。
今後の分野の方向性と、現在の評価方法を改善する機会について論じる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:47:11 GMT)
Large Language Models are Strong Audio-Visual Speech Recognition Learners [53.1] マルチモーダル・大規模言語モデル(MLLM)は,近年,多モーダル理解能力の強化により,研究の焦点となっている。
本稿では,Llama-AVSRを提案する。
我々は,最大公的なAVSRベンチマークであるLSS3に対する提案手法を評価し,WERが0.79%,AVSRが0.77%であるASRとAVSRのタスクに対して,新しい最先端の結果が得られることを示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:30:16 GMT)
Learning-Order Autoregressive Models with Application to Molecular Graph Generation [52.4] 本稿では,データから逐次推定される確率的順序付けを用いて高次元データを生成するARMの変種を紹介する。
提案手法は,画像およびグラフ生成において有意義な自己回帰順序を学習できることを実験的に実証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:24:24 GMT)
An Empirical Study of Conformal Prediction in LLM with ASP Scaffolds for Robust Reasoning [52.3] 本稿では, Answer Set Programming (ASP) とともに, Conformal Language Modelling (CLM) の使用について検討する。
LLM から ASP プログラムの集合を生成するために CLM を適用し,出力の正確性に関する統計的保証を提供する。
実験の結果,標準サンプリング手法を用いたベースラインモデルではCLMが有意に優れていた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:10:10 GMT)
Escaping Plato's Cave: Towards the Alignment of 3D and Text Latent Spaces [52.2] 単モーダルテキストと3Dエンコーダの有意な訓練後特徴アライメントが,性能に限界をもたらすことを示す。
次に、対応する特徴空間の部分空間の抽出に焦点をあて、学習された表現を高次元の低次元部分空間に射影することにより、アライメントの質が著しく高くなることを発見する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:51:56 GMT)
A Survey on 3D Gaussian Splatting [52.0] 3D Gaussian splatting (GS) は、明示的な放射場とコンピュータグラフィックスの変換技術として登場した。
本稿では,3D GSの領域における最近の発展と重要な貢献について,初めて体系的に概説する。
前例のないレンダリング速度を実現することで、3D GSは、仮想現実からインタラクティブメディアなど、数多くのアプリケーションを開くことができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:06:56 GMT)
Toward Robust Non-Transferable Learning: A Survey and Benchmark [51.5] 非伝達学習(NTL)は、ディープラーニングモデルの一般化能力を再構築することを目的とした課題である。
NTLの性能とロバスト性を評価する最初のベンチマークであるNTLBenchを紹介する。
我々はNTLの実践的応用と今後の方向性と課題について論じる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:45:22 GMT)
START: Self-taught Reasoner with Tools [51.4] ツール統合長チェーン・オブ・シークレット(CoT)推論LSMであるSTART(Self-Taught Reasoner with Tools)を紹介する。
STARTは複雑な計算、自己チェック、多様な方法の探索、そして自己老化を行うことができる。
基礎となるQwQ-32Bを著しく上回り、最先端のオープンウェイトモデルR1-Distill-Qwen-32Bに匹敵する性能を達成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:13:22 GMT)
Open Role-Playing with Delta-Engines [50.9] 我々は,自己表現とロールプレイングを橋渡しする新たなゲームプレイスタイルを提案する。
私たちのビジョンは、現実の世界では、私たちは生まれてくると個々に似ていますが、その後に行う選択の結果として、ユニークなものへと成長します。
ORPGでは、プレイヤーに自然言語入力を通じて成長曲線を決定する自由を与え、最終的にはユニークなキャラクターとなる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:13:19 GMT)
IDEA Prune: An Integrated Enlarge-and-Prune Pipeline in Generative Language Model Pretraining [50.5] 本稿では,モデルトレーニング,プルーニング,リカバリを併用した拡張・プルンパイプラインを提案する。
我々は2.8Bモデルから1.3Bへのプレトレーニングにおいて最大2Tトークンによる圧縮実験を行った。
これは、拡大されたモデルの事前学習のトークン効率に関する洞察を提供するだけでなく、刈り取られたモデルの優れた性能を達成するための統合されたアプローチを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:35:31 GMT)
When Large Language Models Meet Evolutionary Algorithms: Potential Enhancements and Challenges [50.3] 事前訓練された大規模言語モデル(LLM)は、自然なテキストを生成する強力な能力を示す。
進化的アルゴリズム(EA)は、複雑な現実世界の問題に対する多様な解決策を発見できる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:29:18 GMT)
Nexus-O: An Omni-Perceptive And -Interactive Model for Language, Audio, And Vision [50.2] 業界レベルのtextbfomni-perceptive および-interactive モデルである textbfNexus-O を導入し,音声,画像,ビデオ,テキストデータを効率的に処理する。
まず、モデルを効率的に設計し、トレーニングして、複数のモダリティにわたるトリモーダルアライメント、理解、推論機能を実現するにはどうすればよいか?
第二に、現実のシナリオにおける信頼性の高いパフォーマンスと適用性を保証するために、トリモーダルモデルの堅牢性を評価するために、どのようなアプローチが実装できるのか?
第3に,高品質で現実的なシナリオをキュレートし,得るための戦略
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:21:40 GMT)
Gaussians-to-Life: Text-Driven Animation of 3D Gaussian Splatting Scenes [49.3] ガウススティング表現における高品質な3Dシーンの一部をアニメーションする手法を提案する。
従来の作業とは対照的に、複雑な既存の3Dシーンのリアルなアニメーションを可能にする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:37:47 GMT)
A Practical Memory Injection Attack against LLM Agents [49.0] MINJAは、クエリと出力観察を通してエージェントとのみ対話することで、悪意のあるレコードをメモリバンクに注入することができる。
MINJAは、任意のユーザがエージェントメモリに影響を与え、LLMエージェントの実践的なリスクを強調します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:49:03 GMT)
Enhancing Architecture Frameworks by Including Modern Stakeholders and their Views/Viewpoints [48.9] データサイエンスと機械学習に関連する関心事、例えばデータサイエンティストやデータエンジニアの利害関係者は、まだ既存のアーキテクチャフレームワークには含まれていない。
10か国25以上の組織から61名の被験者を対象に調査を行った。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:13:45 GMT)
MM-StoryAgent: Immersive Narrated Storybook Video Generation with a Multi-Agent Paradigm across Text, Image and Audio [48.8] MM-StoryAgentは、洗練されたプロット、ロール一貫性のあるイメージ、マルチチャンネルオーディオを備えた没入型ナレーションビデオストーリーブックを作成する。
このフレームワークは、多段階の書き込みパイプラインを通じてストーリーの魅力を高める。
MM-StoryAgentは、さらなる開発のための柔軟なオープンソースプラットフォームを提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:53:10 GMT)
FedMABench: Benchmarking Mobile Agents on Decentralized Heterogeneous User Data [48.7] FedMABenchは、モバイルエージェントのフェデレーショントレーニングと評価のための最初のベンチマークである。
FedMABenchには、30以上のサブセットを持つ6つのデータセット、8つのフェデレーションアルゴリズム、10以上のベースモデル、5つのカテゴリに800以上のアプリがある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:52:20 GMT)
Anti-Diffusion: Preventing Abuse of Modifications of Diffusion-Based Models [48.2] 拡散に基づく技術は、深刻なネガティブな社会的影響を引き起こす可能性がある。
拡散に基づく手法の悪用に対する防御を提供するために、いくつかの研究が提案されている。
本稿では,チューニングと編集の両方に適用可能なプライバシー保護システムであるアンチ拡散を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:23:52 GMT)
S2S-Arena, Evaluating Speech2Speech Protocols on Instruction Following with Paralinguistic Information [48.0] パラ言語情報を用いた命令追従機能の評価を行う,新しいアリーナスタイルのS2SベンチマークであるS2S-Arenaを紹介する。
GPT-4oの優れた性能に加えて、カスケードされたASR, LLM, TTSの音声モデルは、音声2音声プロトコルにおけるテキスト・音声アライメント後に共同訓練されたモデルよりも優れる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:07:00 GMT)
Motion by Queries: Identity-Motion Trade-offs in Text-to-Video Generation [47.6] 本研究では,テキスト・ビデオ・モデルにおける自己注意クエリ機能がどのように動作,構造,アイデンティティを制御するかを検討する。
分析の結果,Qがレイアウトに影響を及ぼすだけでなく,Qをデノナイズする際にも主観的同一性に強い影響を及ぼすことが明らかとなった。
本研究では,(1)既存の手法より20倍効率の良いゼロショットモーショントランスファー法,(2)一貫したマルチショットビデオ生成のためのトレーニングフリー手法の2つの応用例を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:46:34 GMT)
VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control [47.3] ビデオのインペイントは、腐敗したビデオコンテンツを復元することを目的としている。
マスク付きビデオを処理するための新しいデュアルストリームパラダイムVideoPainterを提案する。
また,任意の長さの映像を描ける新しいターゲット領域ID再サンプリング手法も導入する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:59:46 GMT)
Unsupervised detection of semantic correlations in big data [47.2] 本稿では,2進数として表される高次元データにおける意味的相関を検出する手法を提案する。
本研究では,データ記述に必要な独立座標の最小個数を定量化するデータセットの2値固有次元を推定する。
提案アルゴリズムは, いわゆる次元の呪いとは無関係であり, ビッグデータ解析に利用することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:21:42 GMT)
BSAC-CoEx: Coexistence of URLLC and Distributed Learning Services via Device Selection [46.6] 高優先度の超信頼性低レイテンシ通信(URLLC)と低優先度の分散学習サービスは、ネットワーク上で並列に実行される。
我々はこの問題をマルコフ決定プロセスとして定式化し、分岐ソフトアクター・クリティック(BSAC)アルゴリズムに基づくフレームワークであるBSAC-CoExを用いて対処する。
当社のソリューションは,必要なしきい値を超えるURLLCを保ちながら,分散学習サービスのトレーニング遅延を大幅に低減することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:52:17 GMT)
LIFT: Improving Long Context Understanding of Large Language Models through Long Input Fine-Tuning [45.3] Long Input Fine-Tuning (LIFT)は、ロングコンテキストモデリングのための新しいフレームワークである。
LIFTは長い入力に基づいてモデルパラメータを動的に適応する。
Gated Memoryは、長期入力記憶とICLを自動的にバランスをとる特別なアテンションアダプタである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:18:56 GMT)
SimpleDepthPose: Fast and Reliable Human Pose Estimation with RGBD-Images [45.1] 本稿では,深度情報を組み込んだ多視点多人数ポーズ推定アルゴリズムを提案する。
広範に評価した結果,提案アルゴリズムは未知のデータセットをうまく一般化するだけでなく,高速な実行性能を示すとともに,異なるキーポイントにも適応可能であることがわかった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:40:43 GMT)
DeFoG: Discrete Flow Matching for Graph Generation [45.0] DeFoGは、トレーニングからサンプリングをアンタングルするグラフ生成フレームワークである。
本稿では,性能を著しく向上し,必要な精錬工程数を削減できる新しいサンプリング手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:18:32 GMT)
SpatialVLA: Exploring Spatial Representations for Visual-Language-Action Model [45.0] 空間理解はロボット操作のキーポイントです
本研究では,ロボット基盤モデルのための効果的な空間表現を探索する空間VLAを提案する。
提案したAdaptive Action Gridsは,事前学習したSpatialVLAモデルを微調整し,新しいシミュレーションと実世界のセットアップを実現するための,新しい効果的な方法を提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:53:04 GMT)
De Novo Design of Protein-Binding Peptides by Quantum Computing [45.0] 我々は、原子的に解決された予測のために古典的および量子コンピューティングを統合するマルチスケールフレームワークを導入する。
D-Wave量子アニールは、実験とよく相関する一次構造と結合ポーズを持つ化学的に多様なバインダーの集合を急速に生成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:31:14 GMT)
AIM-Fair: Advancing Algorithmic Fairness via Selectively Fine-Tuning Biased Models with Contextual Synthetic Data [44.9] 既存の手法は、しばしば合成データの多様性と品質の限界に直面し、公正さと全体的なモデル精度を損なう。
本稿では,AIM-Fairを提案する。AIM-Fairは,これらの制限を克服し,アルゴリズムの公正性を促進するための最先端生成モデルの可能性を活用することを目的としている。
CelebAとUTKFaceデータセットの実験から、AIM-Fairは実用性を維持しながらモデルフェアネスを改善し、完全かつ部分的に調整されたモデルフェアネスのアプローチよりも優れています。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:26:48 GMT)
Analysis of the BraTS 2023 Intracranial Meningioma Segmentation Challenge [44.8] 我々はBraTS 2023の頭蓋内髄膜腫チャレンジの設計と結果について述べる。
BraTS髄膜腫チャレンジ(BraTS Meningioma Challenge)は、髄膜腫に焦点を当てた以前のBraTSグリオーマチャレンジとは異なる。
上層部は腫瘍,腫瘍コア,腫瘍全体の拡張のために0.976,0.976,0.964の病変中央値類似係数(DSC)を有していた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:25:18 GMT)
Semi-Supervised Learning for Dose Prediction in Targeted Radionuclide: A Synthetic Data Study [44.2] TRT(Targeted Radionuclide Therapy)は、がん細胞に特異的に強力な放射線照射を投与することを目的とした、放射線腫瘍学の現代的な戦略である。
深層学習はRTをパーソナライズすることを約束する。
現在の方法では大量のSPECT画像撮影が必要であるが、日常的な臨床実践では達成できない。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:21:09 GMT)
Chain of Strategy Optimization Makes Large Language Models Better Emotional Supporter [44.2] そこで我々は,各対話における戦略選択の選好を最適化する新しいアプローチであるChain-of-Strategy Optimization (CSO)を提案する。
まずモンテカルロ木探索を用いて,ターンレベルの戦略応答対を持つ高品質な選好データセットであるESC-Proを構築した。
CSOを用いたESC-Proのトレーニングは、戦略精度とバイアス軽減の両方を改善し、LLMがより共感的で文脈的に適切な応答を生成できるようにする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:07:59 GMT)
Towards Student Actions in Classroom Scenes: New Dataset and Baseline [43.3] 学生アクションビデオデータセットは、758の教室から、4,324の慎重にトリミングされたビデオクリップで構成されており、15の生徒アクションが注釈付けされている。
既存のアクション検出データセットと比較して、SAVデータセットは、幅広い実際の教室シナリオを提供することで際立っている。
本手法は, 平均精度67.9%, 平均精度27.4%, 平均精度27.4%, 平均精度67.9%, 平均精度27.4%で優れた性能を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:00:24 GMT)
Soft Policy Optimization: Online Off-Policy RL for Sequence Models [43.0] 言語モデルのポストトレーニングは、ほとんどPPOのようなオン・ポリティクス・メソッドを使って行われる。
SPOは、任意のオンラインおよびオフライン軌跡から学習可能なシーケンスモデルポリシーのための、シンプルでスケーラブルで原則化されたSoft RL手法である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:23:40 GMT)
LLM-based Discriminative Reasoning for Knowledge Graph Question Answering [42.3] 生成事前学習型トランスフォーマーに基づく大規模言語モデル(LLM)は,知識グラフ質問応答(KGQA)タスクにおいて顕著な性能を発揮している。
しかし、LLMは、生成パラダイムによって引き起こされる幻覚的行動のために、KGQAにおいて、根拠のない部分グラフ計画や推論の結果をしばしば生み出す。
本稿では,KGQA過程を識別サブタスクに再構成するREADSを提案し,各サブタスクの検索空間を単純化する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:14:33 GMT)
Tailoring transport in quantum spin chains via disorder and collisions [41.9] 異方性XXZスピン鎖の輸送ダイナミクスを形作る際, 障害と時空間異種衝突音の相互作用について検討した。
低速度で発生する空間同質衝突は、その後の高原の形で局在度が設定される領域の成型に有利である。
本研究は,移動および局在のシーケンスを調整可能なストロボスコーププロトコルの設計に応用できる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:04:33 GMT)
Mini-batch Coresets for Memory-efficient Language Model Training on Data Mixtures [41.6] 大規模言語モデル(LLM)における大規模ミニバッチの訓練の禁止化
我々は、コアセットによるLLM訓練(CoLM)を提案する。
CoLMは、微調整のメモリ要求を2倍に減らし、4倍大きなミニバッチでトレーニングを上回ります。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:12:27 GMT)
RecoveryChaining: Learning Local Recovery Policies for Robust Manipulation [41.4] 本稿では,階層的強化学習を用いて回復政策を学習することを提案する。
感覚観察に基づいて故障を検出すると、回復ポリシーが起動される。
我々はシミュレーションで学んだ回復ポリシーを物理ロボットに転送し、シム・トゥ・リアル・トランスファーの実現可能性を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:39:48 GMT)
A Survey on Sparse Autoencoders: Interpreting the Internal Mechanisms of Large Language Models [40.7] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、その内部メカニズムはほとんど不透明である。
機械的解釈性は、LLMの内部動作を理解する手段として、研究コミュニティから大きな注目を集めている。
スパースオートエンコーダ(SAE)は、LLM内の複雑な重畳された機能をより解釈可能なコンポーネントに分解する能力のために、将来性のある方法として登場した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:38:00 GMT)
Chip Placement with Diffusion Models [40.5] 我々は、強化学習の代わりにガイドサンプリングを用いて、新しい回路をゼロショットで配置できる拡散モデルを訓練する。
我々は、データセット生成アルゴリズムの設計決定を経験的に研究し、一般化を可能にするいくつかの重要な要因を同定する。
提案モデルでは,非表示でリアルな回路上に高品質な配置を生成し,最先端の手法と比較して,配置ベンチマーク上での競合性能を実現している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:47:20 GMT)
A Comparative Study of How People With and Without ADHD Recognise and Avoid Dark Patterns on Social Media [40.2] 我々は,ADHD患者がソーシャルネットワーク上で暗黒パターンを認識し,回避しているかどうかを検討する。
ADHDの個体は、より頻繁に特定の暗黒パターンを回避できた。
本研究は, 現実的な環境における暗黒パターンの理解と, 脆弱な個体群に対するその影響に関する洞察を提供することにより, これまでの研究を前進させるものである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:23:45 GMT)
From Style to Facts: Mapping the Boundaries of Knowledge Injection with Finetuning [40.1] Finetuningは、特定のタスクやレスポンススタイルのために言語モデルをカスタマイズするスケーラブルで費用対効果の高い手段を提供する。
対照的に、従来の知恵は、微調整によって知識を注入すると、不安定な性能と一般化が低下する。
我々は、フロンティアGemini v1.5モデルファミリーをデータセットのスペクトル上で微調整する大規模な実験を行った。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:35:31 GMT)
Quantifying the Robustness of Retrieval-Augmented Language Models Against Spurious Features in Grounding Data [39.8] 本研究では,RAGパラダイムにおける突発的特徴の存在を統計的に確認する。
我々は,突発的な特徴を包括的に分類し,その影響を制御実験により実証的に定量化する。
我々は,RAG分野において,突発的特徴は広範かつ困難な問題である,と結論づける。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:11:34 GMT)
RULSurv: A probabilistic survival-based method for early censoring-aware prediction of remaining useful life in ball bearings [39.6] 検閲データ(Censored data)とは、特定のイベントやプロセスに関する完全な情報が部分的にしか知られていない状況を指す。
Kullback-Leibler (KL) の発散とRUL推定を用いた早期故障検出のための新しいフレキシブルな手法を提案する。
我々は,XJTU-SYデータセットにおいて,3つの異なる操作条件にまたがる5倍のクロスバリデーションを用いたアプローチを実証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:31:27 GMT)
Vulnerabilities in AI-generated Image Detection: The Challenge of Adversarial Attacks [39.5] FPBAはブラックボックス攻撃を成功させることができるので、敵攻撃はAIGI検出器にとって真の脅威であることを示す。
我々はこの手法を周波数ベースのポストトレインベイズアタック (FPBA) と呼ぶ。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:28:34 GMT)
Novel Object 6D Pose Estimation with a Single Reference View [39.2] 単一参照に基づく新しいオブジェクト6D(SinRef-6D)のポーズ推定法を提案する。
我々のキーとなる考え方は、状態空間モデル(SSM)に基づいて、カメラ座標系におけるポイントワイドアライメントを反復的に確立することである。
SinRef-6Dは、合成データに基づいて事前訓練された後、単一の参照ビューのみを使用して、新しいオブジェクトの6Dポーズを推定できる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:00:41 GMT)
AutoLUT: LUT-Based Image Super-Resolution with Automatic Sampling and Adaptive Residual Learning [39.2] 我々は,Look-Up Table (LUT) ベースの超解像ネットワークにおいて,ピクセル情報を効果的にキャプチャし,活用するための2つのプラグイン・アンド・プレイ・モジュールを導入する。
本手法は,類似のストレージサイズを維持しつつ, MuLUT と SPF-LUT の双方で大幅な性能向上を実現している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:08:17 GMT)
DetectRL: Benchmarking LLM-Generated Text Detection in Real-World Scenarios [39.0] 我々は,最新技術(SOTA)検出技術でさえも,このタスクにおいてまだ性能が劣っていることを強調した新しいベンチマークであるTectorRLを提案する。
人気のある大規模言語モデル(LLM)を使用して、実世界のアプリケーションとの整合性を向上するデータを生成しました。
我々は,書式,モデルタイプ,攻撃方法,テキストの長さ,および実世界の人間の筆記因子が,さまざまな種類の検知器に与える影響について分析した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:06:03 GMT)
Closed-Loop Open-Vocabulary Mobile Manipulation with GPT-4V [38.6] 本稿では, GPT-4V視覚言語基盤モデルを用いた初のクローズドループロボットシステムであるCOME-robotについて述べる。
COME-robotは2つの重要なイノベーティブなモジュールを組み込んでいる: (i) マルチレベルなオープン語彙認識と位置推論モジュールで、3次元環境を効果的に探索し、コモンセンスの知識と位置情報を用いて対象物体の識別を可能にする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:09:28 GMT)
Knowledge Updating? No More Model Editing! Just Selective Contextual Reasoning [38.0] 信頼性,一般化,局所性,可搬性という4次元の10種類のモデル編集手法の評価を行った。
次に、知識更新のためのSCR(Selective Contextual Reasoning)という簡単な手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:04:25 GMT)
DepthCues: Evaluating Monocular Depth Perception in Large Vision Models [37.7] 本研究では,大規模な事前学習型視覚モデルにおいて,暗黙の深度監視を伴わない深度知覚がどのように起こるかを検討する。
深度キュー理解の評価を目的とした新しいベンチマークDepthCuesを導入する。
我々の分析は、より最近の大型モデルで人間のような深度が現れることを示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:21:06 GMT)
PRAM: Place Recognition Anywhere Model for Efficient Visual Localization [37.1] 位置認識モデル(PRAM)を提案する。
PRAMは、自己監督的な方法で3D空間で直接3Dランドマークを生成する。
グローバルディスクリプタ、繰り返しローカルディスクリプタ、冗長な3Dポイントを破棄し、メモリ効率を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:51:06 GMT)
Phase estimation with partially randomized time evolution [37.0] 量子位相推定とハミルトンシミュレーションを組み合わせることは、量子コンピュータ上で基底状態エネルギーを計算するための最も有望なアルゴリズムフレームワークである。
本稿では,ハミルトンシミュレーションの標準手法の一つである積公式の高速化にランダム化を用いる。
量子化学におけるベンチマークシステムに対する部分ランダム化積公式を用いて,単一アンシラ位相推定のための詳細な資源推定を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:09:32 GMT)
NeRF-Aug: Data Augmentation for Robotics with Neural Radiance Fields [36.5] NeRF-Augは、データセットに存在しないオブジェクトと対話するためのポリシーを教えることができる。
提案手法の有効性を,専門家による実証実験には存在しない9つの新しいオブジェクトを用いた5つのタスクで実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:20:38 GMT)
AI for Scaling Legal Reform: Mapping and Redacting Racial Covenants in Santa Clara County [35.9] 本稿では,サンタクララ郡事務官事務所との連携を通じて,このプレス問題に対処する新しいアプローチを提案する。
本システムでは,手作業の作業時間を86,500時間削減し,市販のクローズドモデルに匹敵するコストの2%以下と見積もっている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:21:34 GMT)
Entangled Relations: Leveraging NLI and Meta-analysis to Enhance Biomedical Relation Extraction [35.3] そこで我々は,NLIの原理を応用し,関係抽出を強化したMetaEntailREを提案する。
我々のアプローチは,従来の多クラス分類タスクをテキスト・エンテーメントの1つに整合させて,関係クラスをクラス指示仮説に言語化することで過去の研究に追随する。
従来の手法と比較して,BioREDで17.6点,ReTACREDで13.4点,驚くほど大きなF1ゲインを観察した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:48:54 GMT)
EuroBERT: Scaling Multilingual Encoders for European Languages [34.9] 汎用多言語ベクトル表現は、伝統的に双方向エンコーダモデルから得られる。
ヨーロッパおよび広く話されているグローバル言語をカバーする多言語エンコーダのファミリーであるEuroBERTを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:13:58 GMT)
ARIES: Stimulating Self-Refinement of Large Language Models by Iterative Preference Optimization [34.8] 真にインテリジェントなLarge Language Model (LLM) は、外部インタラクションを通じて応答のエラーを修正する能力を持つべきである。
ARIES: Adaptive Refinement and Iterative Enhancement Structure。
ARIESは、反復的に好みのトレーニングと自己修正に基づくデータ収集を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:35:00 GMT)
Revealing Hidden Mechanisms of Cross-Country Content Moderation with Natural Language Processing [34.7] 我々は,既存のTwitter Stream Grabのコーパスを用いて,各国のコンテンツモデレーション決定について検討した。
われわれの実験では、検閲された投稿に、国や時間とともに興味深いパターンが浮かび上がっている。
コンテンツモデレーションにおけるLLMの有効性を評価する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:49:31 GMT)
Fault-tolerant compiling of classically hard IQP circuits on hypercubes [34.2] 我々は,量子サンプリング回路を実現するためのハードウェア効率,フォールトトレラントアプローチを開発した。
本研究では,D$D$IQP回路の硬さ解析とランダムサンプリングの検証のための第2モーメント特性の理論を開発した。
この結果から,特定のエラー訂正コードと現実的なハードウェアを備えた共構成可能なアルゴリズムにおいて,フォールトトレラントコンパイルが強力なツールとして注目されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:01:11 GMT)
Diff-Reg v2: Diffusion-Based Matching Matrix Estimation for Image Matching and 3D Registration [33.8] 本稿では,行列空間における拡散モデルを利用して,ロバストマッチング行列推定を行う革新的パラダイムを提案する。
具体的には、3D-3Dおよび2D-3D登録タスクに対して2次元行列空間に拡散モデルを適用する。
3つの登録タスクすべてに対して、各タスクの特定の特性に合わせた適応的マッチング行列埋め込み実装を提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:39:57 GMT)
Depth Completion with Multiple Balanced Bases and Confidence for Dense Monocular SLAM [33.7] 本稿では,軽量深度補完網をスパースSLAMシステムに統合する新しい手法を提案する。
具体的には,BBC-Netと呼ばれる,高度に最適化されたマルチバス深度補完ネットワークを提案する。
BBC-Netは、オフザシェルキーポイントベースのSLAMシステムによって生成されたスパースポイントを持つ単眼画像から、複数のバランスの取れたベースと信頼マップを予測できる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:46:46 GMT)
TrajectoryCrafter: Redirecting Camera Trajectory for Monocular Videos via Diffusion Models [33.2] TrajectoryCrafterは、モノクロビデオのためのカメラトラジェクトリをリダイレクトする新しいアプローチである。
コンテンツ生成から決定論的視点変換を遠ざけることで,ユーザの特定したカメラトラジェクトリの正確な制御を実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:57:53 GMT)
ATRNet-STAR: A Large Dataset and Benchmark Towards Remote Sensing Object Recognition in the Wild [33.0] 本稿では,ATRNet-STARと呼ばれる大規模で新しいデータセットについて紹介する。
データセットのスケールと多様性が大幅に向上し、190,000以上の注釈付きサンプルが含まれており、これは前身の有名なMSTARの10倍である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:28:51 GMT)
Shifting Long-Context LLMs Research from Input to Output [32.2] 本稿は,NLP研究におけるパラダイムシフトの提唱である。
小説の執筆、長期計画、複雑な推論といったタスクは、広範囲のコンテキストを理解し、一貫性があり、文脈的にリッチで論理的に一貫した拡張テキストを生成するモデルを必要とする。
我々は、この未探索領域の重要性を強調し、高品質で長期のアウトプットを生み出すのに適した基礎的LLMの開発に焦点をあてる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:14:02 GMT)
Unified Reward Model for Multimodal Understanding and Generation [32.2] 本稿では,マルチモーダル理解と生成評価のための最初の統一報酬モデルUnifiedRewardを提案する。
まず、構築した大規模人間の嗜好データセットに基づいてUnifiedRewardを開発し、画像生成/映像生成/理解タスクを含む。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:36:05 GMT)
MagicInfinite: Generating Infinite Talking Videos with Your Words and Voice [32.1] MagicInfiniteは、多種多様な現実的な人間、フルボディの人物、スタイル化されたアニメキャラクターに高い忠実度をもたらす。
裏面のビューを含むさまざまな顔のポーズをサポートし、正確に話者を指定するための入力マスク付きの単文字または複数文字のアニメイトをサポートする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:21:11 GMT)
Frequency Autoregressive Image Generation with Continuous Tokens [31.8] 本稿では、周波数プログレッシブ自己回帰(textbfFAR)パラダイムを導入し、連続トークン化器を用いてFARをインスタンス化する。
我々は、ImageNetデータセットの総合的な実験を通して、FARの有効性を実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:34:04 GMT)
MicroMIL: Graph-based Contextual Multiple Instance Learning for Patient Diagnosis Using Microscopy Images [31.8] 癌診断はMIL(Multiple Case Learning)と全スライディング画像の統合から大きな恩恵を受けている
顕微鏡イメージングに特化して設計されたMILフレームワークであるMicroMILを紹介する。
実世界の大腸癌データセットとBreakHisデータセットの実験は、MicroMILが最先端のパフォーマンスを達成することを実証している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:44:36 GMT)
ECCOS: Efficient Capability and Cost Coordinated Scheduling for Multi-LLM Serving [31.6] 大規模言語モデル(LLM)は、システム内のサービスエンドポイントとしてますます多くデプロイされている。
既存のスケジューリングフレームワークは主にレイテンシの最適化をターゲットとしている。
本稿では,マルチLLMサービスのための機能コスト協調スケジューリングフレームワークECCOSを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:35:33 GMT)
Language Model Evolutionary Algorithms for Recommender Systems: Benchmarks and Algorithm Comparisons [31.4] 大規模言語モデル(LLM)は進化的アルゴリズム(EA)の機能を大幅に強化した
我々は,LSMベースのEAの性能を評価するために,RSBenchというベンチマーク問題セットを導入し,プロンプト最適化を提案する。
確立されたEAフレームワークに基づく3つのLCMベースのEAを開発し、RSBenchを用いてその性能を実験的に評価する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:25:19 GMT)
Efficient Evolutionary Search Over Chemical Space with Large Language Models [31.3] 最適化の目的は区別できない。
化学対応大規模言語モデル(LLM)を進化的アルゴリズムに導入する。
我々のアルゴリズムは最終解の質と収束速度の両方を改善する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:24:35 GMT)
HexPlane Representation for 3D Semantic Scene Understanding [31.0] 3次元セマンティックシーン理解のためのHexPlane表現
6つの平面の特徴は2Dエンコーダによって抽出され、ヘックスプランアソシエーションモジュールに送られる。
メソッドは既存のvoxelベース、ポイントベース、レンジベースアプローチにシームレスに統合できる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:18:55 GMT)
Robust Multimodal Learning for Ophthalmic Disease Grading via Disentangled Representation [30.7] 医療機器の欠如とデータのプライバシーに関する懸念により、マルチモーダルデータは現実世界のアプリケーションではまれである。
伝統的な深層学習法は一般に、潜在空間における表現の学習によってこれらの問題に対処する。
著者らはEssence-Point and Disentangle Representation Learning (EDRL)戦略を提案している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:58:38 GMT)
Generative Trajectory Stitching through Diffusion Composition [30.0] CompDiffuserは、これまで見てきたタスクから短い軌跡を合成的に縫い合わせることで、新しいタスクを解決できる新しい生成的アプローチである。
我々は,さまざまな環境サイズ,エージェント状態次元,軌道タイプ,データ品質のトレーニングなど,さまざまな課題のベンチマークタスクについて実験を行い,CompDiffuserが既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:22:52 GMT)
Grammar-Based Code Representation: Is It a Worthy Pursuit for LLMs? [29.7] グラマーはプログラミング言語とソフトウェア工学の基盤となっている。
既存の研究では、小規模モデルにおける文法に基づくコード表現の有効性を実証している。
コード生成プロセスに文法規則を組み込んだ,数十億規模のGrammarCoderモデルを開発した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:23:13 GMT)
Mastering Continual Reinforcement Learning through Fine-Grained Sparse Network Allocation and Dormant Neuron Exploration [28.8] 本稿では,細粒度配置戦略により塑性を向上させる新しい構造ベースアプローチであるSSDEを紹介する。
SSDEは、パラメータ空間をフォワードトランスファー(フリーズ)パラメータとタスク固有の(トレーニング可能な)パラメータに分解する。
CW10-v1 Continual Worldベンチマークの実験では、SSDEが最先端のパフォーマンスを達成し、95%の成功率に達した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:58:07 GMT)
RecipeGen: A Benchmark for Real-World Recipe Image Generation [28.7] RecipeGenは、レシピ生成のための最初の実世界のゴール-ステップ-イメージベンチマークである。
様々な食材、様々なレシピのステップ、料理のスタイル、幅広い食品カテゴリーが特徴である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:25:28 GMT)
Taming Video Diffusion Prior with Scene-Grounding Guidance for 3D Gaussian Splatting from Sparse Inputs [28.4] 本稿では,映像拡散モデルから学習した先行情報を生かした生成パイプラインによる再構成手法を提案する。
最適化された3DGSからのレンダリングシーケンスに基づく新しいシーングラウンドガイダンスを導入し,拡散モデルを用いて一貫したシーケンスを生成する。
提案手法はベースラインを大幅に改善し,挑戦的なベンチマークで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:59:05 GMT)
Nuanced Safety for Generative AI: How Demographics Shape Responsiveness to Severity [28.1] 本稿では,複数のデータセットの粒度評価を校正するための新しいデータ駆動手法を提案する。
安全違反の度合いの異なるレベルを評価する際に,レーダの一貫性を定量化する非パラメトリック応答性指標を蒸留する。
提案手法は,異なる人口集団間でのニュアンスな視点を捉えることにより,安全上の懸念を優先順位付けする能力の向上を図っている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:32:31 GMT)
TS-LIF: A Temporal Segment Spiking Neuron Network for Time Series Forecasting [27.9] Spiking Neural Networks(SNN)は、時系列予測のためのデータ処理に、有望で生物学的にインスパイアされたアプローチを提供する。
本稿では,デュアルコンパートメントアーキテクチャを特徴とするテンポラルリーキーセグメント統合とファイアモデルを提案する。
実験の結果,TS-LIFは時系列予測において従来のSNNよりも優れていた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:06:21 GMT)
opXRD: Open Experimental Powder X-ray Diffraction Database [27.7] 粉末X線回折(pXRD)実験は材料構造解析の基盤となる。
機械学習は、自動的に粉末回折分析を行うことで、このボトルネックを解決することを約束する。
我々は,ラベル付きおよびラベルなし実験粉体回折図の公開とアクセスが容易なデータセットを提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:59:18 GMT)
Self-Learning for Personalized Keyword Spotting on Ultra-Low-Power Audio Sensors [27.7] 本稿では,超低消費電力スマートオーディオセンサへの展開後,個人化キーワードスポッティング(KWS)モデルを段階的に学習する自己学習手法を提案する。
類似度スコアに基づいて,新たに録音した音声フレームに擬似ラベルを割り当てることにより,ラベル付きトレーニングデータがないという根本的な問題に対処する。
私たちの経験的結果は、極端に自己適応型のKWSセンサを配置する方法を舗装しています。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:46:22 GMT)
Towards Quantum-Native Communication Systems: State-of-the-Art, Trends, and Challenges [27.3] 調査では、量子ドメイン(QD)マルチインプット、QD非直交多重アクセス、量子セキュアダイレクト通信、QDリソース割り当て、QDルーティング、QD人工知能などの技術を調査した。
量子センシング、量子レーダ、量子タイミングの現在の状況は、将来の応用をサポートするために簡単にレビューされる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:55:33 GMT)
Benchmarking LLMs in Recommendation Tasks: A Comparative Evaluation with Conventional Recommenders [27.3] 本稿では、クリックスルーレート予測(CTR)とシーケンシャルレコメンデーション(SeqRec)という2つの主要なレコメンデーションタスクを評価するRecBenchを紹介する。
実験は最大17種類の大モデルを対象としており、ファッション、ニュース、ビデオ、書籍、音楽ドメインの5つの多様なデータセットで実施されている。
以上の結果から,LCMベースのレコメンデータは従来のレコメンデータよりも優れ,CTRシナリオでは最大5%のAUC改善,SeqRecシナリオでは最大170%のNDCG@10改善を実現した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:05:23 GMT)
Membership Inference Attacks Cannot Prove that a Model Was Trained On Your Data [27.2] ウェブスケールのデータに基づいてトレーニングされた基礎モデルに対する最近の訴訟では、データ証明のトレーニングが重要な役割を担っている。
多くの先行研究は、メンバシップ推論攻撃を用いたトレーニングデータ証明のインスタンス化を示唆している。
本研究では, 特殊なカナリアデータに対するデータ抽出攻撃と会員推定が, 音響訓練データ証明の作成に有効であることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:20:23 GMT)
Revisiting the Generalization Problem of Low-level Vision Models Through the Lens of Image Deraining [27.0] 一般化は低レベルの視覚モデルにとって重要な課題である。
画像のデライン化は、明確に定義され容易に分離された構造のため、ケーススタディとして選択される。
この結果から,劣化パターンではなく,基礎となる画像内容の学習に焦点を合わせることが,一般化の鍵であることが示唆された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:26:55 GMT)
A Survey of Large Language Model Empowered Agents for Recommendation and Search: Towards Next-Generation Information Retrieval [26.8] 大規模言語モデル(LLM)は、様々な言語関連タスクにおいて、人間のパフォーマンスを上回る能力を示している。
本稿では,検索・レコメンデーションシステムの強化における大規模言語モデルエージェントの変容の可能性について検討する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:20:30 GMT)
How Diversely Can Language Models Solve Problems? Exploring the Algorithmic Diversity of Model-Generated Code [26.3] 言語モデル(LM)は、自然言語の要求からコードを生成する素晴らしい能力を示している。
我々は、LMが生成するコードの多様性を、コード生成能力を評価するための重要な基準として強調する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:38:47 GMT)
Ticktack : Long Span Temporal Alignment of Large Language Models Leveraging Sexagenary Cycle Time Expression [25.7] 大規模言語モデル(LLM)は、特に長期にわたって時間的ミスアライメントの問題に悩まされる。
本稿では,LLMの長期的不整合に対処する手法として,Ticktack(ティックタック)を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:37:53 GMT)
Reinforcement Learning Within the Classical Robotics Stack: A Case Study in Robot Soccer [25.2] モデルフリー強化学習(RL)を古典的なロボットスタックに組み込んだ新しいアーキテクチャを開発する。
私たちのアーキテクチャは2024年のRoboCup SPL Challenge Shield Divisionで勝利しました。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:12:15 GMT)
Pi-GPS: Enhancing Geometry Problem Solving by Unleashing the Power of Diagrammatic Information [25.1] 本稿では,テキストのあいまいさを解決するために,図形情報のパワーを解放する新しいフレームワークであるPi-GPSを提案する。
我々はMLLMを用いて図式文脈に基づくテキストの曖昧さを解消する一方,検証器は幾何規則に対する正当性を保証する。
実証的な結果は、Pi-GPSが最先端のモデルを超え、従来のニューラルシンボリックアプローチよりも定理3Kを10%近く改善したことを示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:15:00 GMT)
Training and Inference Efficiency of Encoder-Decoder Speech Models [25.0] 我々は効率角に焦点を合わせ、これらの音声モデルを効率的に訓練しているかどうかを問う。
ミニバッチサンプリングにおける無視は、パディングに50%以上費やされていることを示す。
モデルアーキテクチャを調整してデコーダからエンコーダにモデルパラメータを転送すると、3倍の推論速度が得られます。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:57:43 GMT)
Toward an Evaluation Science for Generative AI Systems [24.9] 生成型AIシステムの評価科学の成熟を提唱する。
特に,評価指標を実世界のパフォーマンスに適用し,評価指標を反復的に洗練し,評価機関と基準を確立すること,の3つの重要な教訓を提示する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:23:48 GMT)
Adding Alignment Control to Language Models [24.8] 本稿では,CLMと呼ばれる単一モデルにアライメント制御を組み込む手法を提案する。
このアプローチでは、初期レイヤの前に1つのID層を追加し、このレイヤ上でのみ好みの学習を行い、不整合入力トークンの埋め込みを整合空間にマッピングする。
実験により, この効率的な微調整法は完全微調整に匹敵する性能を示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:13:32 GMT)
Statistical Deficiency for Task Inclusion Estimation [24.8] タスクは機械学習の中心であり、現在のモデルの能力を評価する最も自然なオブジェクトである。
本研究では,2つのタスク間のbfインクルージョンを統計的に欠如の観点から計算する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:00:28 GMT)
Personalized Hierarchical Split Federated Learning in Wireless Networks [24.7] 本稿では、パーソナライズ性能の向上を目的とした、パーソナライズされた階層分割型フェデレーション学習(PHSFL)アルゴリズムを提案する。
まず、モデル分割と階層モデル集約がグローバルモデルに与える影響を理解するために、広範囲な理論的解析を行う。
グローバルモデルがトレーニングされると、各クライアントを微調整してパーソナライズされたモデルを取得します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:25:46 GMT)
Strategy Coopetition Explains the Emergence and Transience of In-Context Learning [24.6] インコンテキスト学習(ICL)は、トランスフォーマーモデルに現れる強力な能力であり、重み更新なしでコンテキストから学習することができる。
最近の研究は、長時間のトレーニング後に消失することがある過渡現象として緊急ICLを確立している。
本稿では、これらの重要な力学と相互作用を再現する最小限の数学的モデルを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:54:05 GMT)
OSCAR: Object Status and Contextual Awareness for Recipes to Support Non-Visual Cooking [24.6] 調理中のレシピに従うことは、視覚障害者にとって重要な課題であるが難しい課題である。
我々は、レシピの進捗追跡とコンテキスト認識フィードバックを提供する新しいアプローチであるOSCARを開発した。
我々は、YouTubeの調理ビデオ173本と現実世界の非視覚的調理ビデオ12本を用いて、OSCARのレシピをフォローする機能を評価した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:03:21 GMT)
Feedback Favors the Generalization of Neural ODEs [24.3] 本稿では、フィードバックループがニューラル常微分方程式(ニューラルODE)の学習潜時ダイナミクスを柔軟に補正可能であることを示す。
フィードバックニューラルネットワークは、新しい2自由度ニューラルネットワークであり、前のタスクで精度が失われることなく、目に見えないシナリオで堅牢なパフォーマンスを持つ。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:53:18 GMT)
Correcting Annotator Bias in Training Data: Population-Aligned Instance Replication (PAIR) [24.3] Population-Aligned Instance Replication (PAIR)は、非表現型アノテータプールによるバイアスに対処する手法である。
ラベル付け傾向の異なるアノテータを2種類作成し、異なる比率のデータセットを生成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:32:57 GMT)
Leveraging Semantic Type Dependencies for Clinical Named Entity Recognition [24.2] ドメイン固有のセマンティックタイプ依存関係を利用することで、さらなるエビデンスを活用します。
ドメイン固有のセマンティック型依存関係を使用することで、NERの有効性が大幅に向上する場合もある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:29:21 GMT)
A Causal Inference Approach for Quantifying Research Impact [23.8] 引用数とインパクトファクターは、個々の研究への影響を測定するのに使うことができる。
ディープラーニングはコンピュータビジョンと自然言語処理に大きな影響を与える。
その結果,ディープラーニングの影響はMLモデルの解釈可能性の影響の3.1倍であった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:06:42 GMT)
MergeQuant: Accurate 4-bit Static Quantization of Large Language Models by Channel-wise Calibration [23.8] 本稿では,チャネルごとの静的量子化フレームワークであるMergeQuantを提案する。
MergeQuantは、量子化ステップマイグレーション(QSM)メソッドを通じて、チャネルごとの量子化ステップと対応するスケーリングと線形マッピングを統合する。
Llama-2-7Bモデルでは、MergeQuantはFP16ベースラインと比較してデコードで最大1.77倍、エンドツーエンドで最大2.06倍のスピードアップを達成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:52:28 GMT)
Are Your LLM-based Text-to-SQL Models Secure? Exploring SQL Injection via Backdoor Attacks [23.4] セキュリティ上の懸念はほとんど未解決であり、特にバックドア攻撃の脅威である。
Toxicは、新しいバックドア攻撃フレームワークである。
我々は、0.44%の有毒データを注入するだけで79.41%の攻撃成功率となり、データベースのセキュリティに重大なリスクが生じることを示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:16:48 GMT)
Meta Curvature-Aware Minimization for Domain Generalization [22.8] モデルが平らなミニマに収束することを奨励する改良されたモデルトレーニングプロセスを提案する。
そこで我々は,Meta Curvature-Aware Minimization (MeCAM) と呼ばれる新しいアルゴリズムを考案し,局所ミニマ周辺の曲率を最小化する。
本稿では,MeCAMの一般化誤差と収束率に関する理論的解析を行い,既存のDG法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:49:35 GMT)
DeFT: Decoding with Flash Tree-attention for Efficient Tree-structured LLM Inference [22.7] 大規模言語モデル(LLM)は、トークンの共有プレフィックスを持つツリー構造において、複数の世代呼び出しを処理する複雑なタスクにますます採用されている。
木に基づくアプリケーションの既存の推論システムは、注意計算中にクエリとKVキャッシュの不適切なパーティショニングのために非効率である。
我々は,プレフィックス認識と負荷分散KVキャッシュパーティションを用いたハードウェア効率の高いアテンションアルゴリズムであるDeFTを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:47:42 GMT)
Hints-In-Browser: Benchmarking Language Models for Programming Feedback Generation [22.5] 品質、コスト、時間、データのプライバシなど、いくつかのパフォーマンス基準で、プログラミングフィードバック生成のための言語モデルをベンチマークします。
我々は,GPT-4生成合成データに基づく微調整パイプラインを開発した。
WebLLMのブラウザ内推論エンジンを用いた微調整Llama3-8BとPhi3-3.8B 4ビット量子化モデルの有効性を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:46:14 GMT)
On the Completeness of Invariant Geometric Deep Learning Models [22.4] 不変モデルは、点雲における情報的幾何学的特徴を利用して有意義な幾何学的表現を生成する。
完全連結条件下での幅広い不変モデルの理論的表現性を特徴付ける。
我々の理論的結果は不変モデルの表現力のギャップを埋め、その能力の厳密で包括的な理解に寄与する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:55:55 GMT)
D2GV: Deformable 2D Gaussian Splatting for Video Representation in 400FPS [22.4] Implicit Representations (INR) はビデオ表現の強力なアプローチとして登場し、圧縮やインペイントといったタスクの多角性を提供する。
本稿では,D2GVと呼ばれる変形可能な2次元ガウススプラッティングに基づく新しい映像表現を提案する。
我々はD2GVの多目的性について,映像表現における有望なソリューションとしての可能性を強調し,映像,ペンキ,デノベーションなどのタスクで実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:26:27 GMT)
CLIP meets DINO for Tuning Zero-Shot Classifier using Unlabeled Image Collections [22.3] ラベル付き画像を用いたCLIPに基づく画像分類性能を向上させるためのラベルフリーなプロンプトチューニング手法を提案する。
当社のフレームワークであるNoLA(No Labels Attached)は,最先端のLaFTerよりも平均3.6%向上しています。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:08:18 GMT)
Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling [22.1] オープンな回答を持つテキスト生成のための幻覚検出はより困難である。
外部資源のない長いテキストにおける幻覚の検出に関する最近の研究は、一貫性の比較を行っている。
テキスト生成のためのグラフベースの文脈認識(GCA)幻覚検出を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:29:19 GMT)
On the State of NLP Approaches to Modeling Depression in Social Media: A Post-COVID-19 Outlook [22.0] うつ病は最も広く研究されている精神疾患である。
新型コロナウイルス(COVID-19)の世界的なパンデミックは、世界中のメンタルヘルスに大きな影響を与えた。
本稿では、ソーシャルメディアにおける抑うつをモデル化するための自然言語処理(NLP)アプローチについてレビューする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:09:42 GMT)
Offline Safe Reinforcement Learning Using Trajectory Classification [22.0] 我々は、望ましい軌跡を生成し、望ましくない軌跡を避ける政策を学ぶ。
オフライン安全なRLのためのDSRLベンチマークを用いて,本手法を広範囲に評価した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:20:12 GMT)
Learning from negative feedback, or positive feedback or both [22.0] ポジティブなフィードバックとネガティブなフィードバックから学習を分離する新しいアプローチを導入する。
重要な貢献は、ネガティブなフィードバックだけで安定した学習を示すことです。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:51:04 GMT)
DecoupledGaussian: Object-Scene Decoupling for Physics-Based Interaction [21.8] DecoupledGaussianは、接触した表面から静止物体を分離する新しいシステムだ。
DecoupledGaussianを総合的なユーザスタディと定量的ベンチマークで検証する。
このシステムは、現実世界の環境におけるオブジェクトやシーンとのデジタルインタラクションを強化し、VR、ロボティクス、自動運転といった産業に恩恵をもたらす。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:54:54 GMT)
LongEval: A Comprehensive Analysis of Long-Text Generation Through a Plan-based Paradigm [21.7] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な成功を収めた。
解析の結果,LLMは長文生成における長文要求や情報密度に悩まされていることが明らかとなった。
提案するLongEvalは,直接および計画に基づく生成パラダイムを用いて,長文生成を評価するベンチマークである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:05:01 GMT)
Speculative Decoding for Multi-Sample Inference [21.6] マルチサンプル推論シナリオに適した新しい投機的復号法を提案する。
提案手法は並列生成経路の本質的なコンセンサスを利用して高品質なドラフトトークンを合成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:15:36 GMT)
Towards Sub-millisecond Latency Real-Time Speech Enhancement Models on Hearables [21.5] 低レイテンシモデルは、補聴器や補聴器などのリアルタイム音声強調アプリケーションに不可欠である。
計算効率のよい最小位相FIRフィルタを用いて音声強調を行い、サンプル・バイ・サンプル処理により平均アルゴリズム遅延0.32msから1.25msを実現した。
この作業によってレイテンシの理解が向上し,可聴性の快適性とユーザビリティの向上が期待できます。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:59:55 GMT)
On Mitigating Affinity Bias through Bandits with Evolving Biased Feedback [21.3] アフィニティバイアス(Affinity bias)は、無意識の偏見の要素であり、私たちと同じような人を好むことにつながる。
今日の雇用者が明日の雇用委員会の一員になる世界では、アフィニティバイアスがこのフィードバックループにどのように影響するかを理解する(そして緩和する)ことに特に関心があります。
我々はこれらの2つの特徴を示す新しいバンディットの変種を導入し、アフィニティ・バンディットと呼ぶ。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:23:58 GMT)
Human Implicit Preference-Based Policy Fine-tuning for Multi-Agent Reinforcement Learning in USV Swarm [21.2] MARL(Multi-Agent Reinforcement Learning)は,エージェント間の協調や競争に関わる複雑な問題を解くことを約束している。
本稿では,エージェントレベルフィードバックシステムを用いて,MARLに対する強化学習(Reinforcement Learning with Human Feedback, RLHF)アプローチを提案する。
本手法は,マルチエージェントシステムにおいて,公平性と性能の整合性を保ちながら重要な課題に対処し,USV Swarmポリシーを効果的に改善する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:06:15 GMT)
Distributed Sign Momentum with Local Steps for Training Transformers [21.0] 事前学習型のTransformerモデルはリソース集約型である。
近年の研究では,手話モーメントが大規模ディープラーニングモデルの訓練に有効な手法であることが示されている。
本稿では,複数段の広帯域通信における新たな通信モーメントについて検討する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:35:00 GMT)
Semantic Shift Estimation via Dual-Projection and Classifier Reconstruction for Exemplar-Free Class-Incremental Learning [20.6] EFCIL (Exemplar-Free Class-Learning) のためのDPCR (Dual-Projection Shift Estimation and Incremental Reconstruction) アプローチを提案する。
DPCRは、行空間のプロジェクションを組み合わせてタスクワイドとカテゴリワイドの両方のシフトをキャプチャするデュアルプロジェクションを通じて、セマンティックシフトを効果的に推定する。
様々なデータセットにおいて、DPCRは古いタスクと新しいタスクのバランスを効果的に保ち、最先端のEFCIL法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:50:29 GMT)
Needle In A Video Haystack: A Scalable Synthetic Evaluator for Video MLLMs [20.2] ビデオ理解はマルチモーダル大言語モデル(LMLM)にとって重要な次のステップである
合成ビデオ生成によるベンチマーク構築フレームワークであるVideoNIAH(Video Needle In A Haystack)を提案する。
我々は、プロプライエタリモデルとオープンソースモデルの両方を包括的に評価し、ビデオ理解能力の重大な違いを明らかにする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:40:34 GMT)
On a Connection Between Imitation Learning and RLHF [20.1] 本研究は、模倣学習の観点から、大規模言語モデルの好みデータとのアライメントを研究する。
人間のフィードバックRLHFからの強化学習と模倣学習(IL)との密接な理論的関係を確立し、RLHFが優先データ分布に対して暗黙的に模倣学習を行うことを明らかにする。
模倣学習の目的を直接最適化する原則的フレームワークであるDILを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:51:24 GMT)
Spatial Distillation based Distribution Alignment (SDDA) for Cross-Headset EEG Classification [19.8] 非侵襲的脳-コンピュータインタフェース(BCI)は、ユーザと外部デバイス間の直接のインタラクションを可能にする。
異なるヘッドセット間で脳波信号を復号することは、電極の数と位置が異なるため、依然として大きな課題である。
ヘテロジニアス・クロスヘッド・トランスファーのための空間蒸留に基づく分布アライメント手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:44:49 GMT)
Completion as Enhancement: A Degradation-Aware Selective Image Guided Network for Depth Completion [19.5] 本稿では,新しい劣化認識フレームワークであるSigNetを紹介する。
SigNetは、ディープコンプリートを初めてディープエンハンスメントに変換する。
我々は、NYUv2、DIML、SUN RGBD、TOFDCデータセットに関する広範な実験を行い、SigNetの最先端(SOTA)性能を実証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:33:32 GMT)
NLI under the Microscope: What Atomic Hypothesis Decomposition Reveals [19.3] 従来のNLIと非実現可能なNLIという2つの自然言語推論タスクにおける仮説の原子分解を用いて、原子サブプロブレムを形成する。
これらの原子サブプロブレムは、NLIとデファシブル推論の両方の構造をより理解するためのツールとして機能する。
以上の結果から,LLMは原子性NLIと非実用性NLIサブプロブレムの論理的整合性に苦慮していることが示唆された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:17:43 GMT)
Multi-Grained Feature Pruning for Video-Based Human Pose Estimation [19.3] 人間のポーズ推定のための新しいマルチスケール・解像度・フレームワークを提案する。
我々は,重要な意味情報を提供するトークンを識別するために,密度クラスタリング手法を用いる。
提案手法は,ベースラインに比べて推論速度が93.8%向上した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:14:51 GMT)
CoMoGaussian: Continuous Motion-Aware Gaussian Splatting from Motion-Blurred Images [19.1] 重要な問題は、露出中の動きによるカメラの動きのぼかしであり、正確な3Dシーンの復元を妨げる。
動き赤画像から正確な3Dシーンを再構成する連続運動対応ガウス版CoMoGaussianを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:18:43 GMT)
Linear-MoE: Linear Sequence Modeling Meets Mixture-of-Experts [18.9] 我々は,LSMとMoEを統合する大規模モデルのモデリングとトレーニングを行う,生産レベルのシステムであるLinear-MoEを紹介する。
1)LSMのすべてのインスタンスをサポートする統一されたフレームワークを提供するモデリングサブシステムと,2)様々な高度な並列処理技術を組み込んだ効率的なトレーニングを支援するトレーニングサブシステムとから構成される。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:17:45 GMT)
Discrete Contrastive Learning for Diffusion Policies in Autonomous Driving [18.6] 本研究では,既存の運転データから,コントラスト学習を利用して運転スタイルの辞書を抽出する手法を提案する。
我々の経験的評価は、我々のアプローチが生み出す行動が、機械学習ベースのベースライン手法よりも安全かつ人間的であることを確認した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:26:04 GMT)
Dependency-aware Maximum Likelihood Estimation for Active Learning [18.5] Active Learningは、アノテータからラベルをクエリするためのサンプルを戦略的に選択することで、ラベル付きトレーニングセットを効率的に構築することを目的としている。
このシーケンシャルなプロセスでは、各サンプル取得がその後の選択に影響を与え、ラベル付き集合のサンプル間の依存関係を引き起こす。
そこで本研究では,本手法を応用したMLE (Dependency-aware MLE) を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:48:33 GMT)
SpecServe: Efficient and SLO-Aware Large Language Model Serving with Adaptive Speculative Decoding [18.5] 投機的復号化は、大規模言語モデル推論を加速するための説得力のある手法として登場した。
既存の投機的復号化ソリューションは、様々なワークロードやシステム環境に適応できないことが多い。
本稿では,リアルタイム要求負荷に応じて投機戦略を動的に調整する,効率的なLLM推論システムであるSpecServeを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:27:51 GMT)
DiVISe: Direct Visual-Input Speech Synthesis Preserving Speaker Characteristics And Intelligibility [18.4] DiVISeはビデオフレームから直接メルスペクトルを予測するエンドツーエンドのV2Sモデルである。
以上の結果から,DiVISeは既存のV2Sモデルよりも音響的信頼性が高いだけでなく,データやモデルパラメータの増大により,より効果的にスケールできることが示唆された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:21:48 GMT)
MPTSNet: Integrating Multiscale Periodic Local Patterns and Global Dependencies for Multivariate Time Series Classification [18.1] 我々は,MPTSNet(Multiscale Periodic Time Series Network)を提案する。
MPTSNetは、マルチスケールな局所パターンとグローバルな相関を統合し、時系列の固有情報をフル活用する。
UEAベンチマークデータセットの実験は、提案されたMPTSNetがMTSCタスクの21の高度なベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:07:51 GMT)
Generative Multi-Agent Q-Learning for Policy Optimization: Decentralized Wireless Networks [18.0] 協調分散型無線ネットワークのための新しいマルチエージェントMEMQ(M-MEMQ)を提案する。
非協調状態においては、TXは個々のコストを最小化し、局所的なQ-関数を更新するために独立に作用する。
M-MEMQは、平均ポリシーエラー(APE)が55%、収束が35%速く、ランタイムの複雑さが50%減少し、サンプルの複雑さが45%減少します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:48:35 GMT)
FloNa: Floor Plan Guided Embodied Visual Navigation [17.9] 人間は自然に不慣れな環境で移動するためのフロアプランに頼っている。
既存のビジュアルナビゲーション設定は、この貴重な事前知識を見落としている。
我々はフロアプランビジュアルナビゲーション(FloNa)を紹介し、フロアプランを具体化ビジュアルナビゲーションに組み込む最初の試みである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:11:27 GMT)
Ensemble Debiasing Across Class and Sample Levels for Fairer Prompting Accuracy [17.6] 言語モデルは、強力な数発の学習者であり、テキスト分類タスクにおいて、全体的な精度が良好である。
本稿では,クラス確率のフレキシブルな修正を実現するために,ポストホック非線形整数計画に基づくデバイアス法を提案する。
本手法は,バランスの取れたクラスアキュラシーを用いて,最先端の総合的精度向上を実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:34:31 GMT)
Rewarding Curse: Analyze and Mitigate Reward Modeling Issues for LLM Reasoning [17.6] CoT(Chain-of-Thought)プロンプトは、異なる推論タスクの下で様々なパフォーマンスを示す。
これまでの作業は、それを評価しようとするが、CoTに影響を与えるパターンの詳細な分析を提供するには不足している。
我々は,CoTの有効性が問題困難,情報ゲイン,情報フローなどのパフォーマンス改善に影響を及ぼす重要な要因を同定する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:20:24 GMT)
RoToR: Towards More Reliable Responses for Order-Invariant Inputs [17.5] 位置IDの変更を最小限に抑えた、真に順序不変な入力に対してゼロショット不変なLMを提案する。
Selective Routing を用いた RoToR は,ゼロショット方式で実用的なリストワイズ入力タスクを効果的に処理できることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:55:19 GMT)
An Analytical Model for Overparameterized Learning Under Class Imbalance [17.4] 我々は,いくつかの実践的学習手法のテスト誤差に対する厳密で閉じた形式近似を開発する。
我々の近似は、標準的なクロスエントロピー最小化の落とし穴をいかに、いつ克服するかを強調しながら、これらの手法を解析的にチューニングし比較することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:09:16 GMT)
Femur: A Flexible Framework for Fast and Secure Querying from Public Key-Value Store [17.4] 既存のPrivate Information Retrievalスキームは完全なセキュリティを提供するが、スケーラビリティに欠ける。
帯域制限環境に最適化された新しい可変レンジPIR方式を提案する。
実験によると、Femurはセキュリティレベルが同じであっても、最先端の設計よりも優れている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:39:07 GMT)
LEDiT: Your Length-Extrapolatable Diffusion Transformer without Positional Encoding [17.2] 拡散変換器(DiT)は、トレーニング解像度よりも高い解像度で画像を生成するのに苦労する。
本稿では,Longth-Extrapolatable Diffusion Transformer(LEDiT)を提案する。
LEDiTは明示的なPEを必要としないため、外挿を避ける。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:49:29 GMT)
GaussianCAD: Robust Self-Supervised CAD Reconstruction from Three Orthographic Views Using 3D Gaussian Splatting [17.2] 既存の3D再構成手法では、通常、自然な画像と対応するカメラのポーズが入力として必要とされる。
我々はCADスケッチを自然画像に似た表現に変換し、対応するマスクを抽出する。
整列した直観から高品質な再構成を実現するために,カスタマイズされたスパースビュー3D再構成手法を用いる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:55:50 GMT)
Unifying Large Language Model and Deep Reinforcement Learning for Human-in-Loop Interactive Socially-aware Navigation [16.8] ソーシャルロボットナビゲーションプランナーは、2つの大きな課題に直面している。
本稿では,対話型対話型ソーシャル・アウェア・ナビゲーションフレームワークであるSALMを紹介する。
メモリ機構は、時間データを連続的な改善のためにアーカイブし、多段階のグラフは推論に基づく大規模言語フィードバックモデルが両方の計画手法の強みを適応的に融合させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:03:06 GMT)
SoK: Membership Inference Attacks on LLMs are Rushing Nowhere (and How to Fix It) [16.7] LLMに対するメンバーシップ推論攻撃(MIA)を行うための10以上の新しい手法が提案されている。
固定だがランダム化されたレコードやモデルに依存する従来のMIAとは対照的に、これらの方法は主にトレーニングされ、ポストホックで収集されたデータセットでテストされる。
このランダム化の欠如は、メンバーと非メンバー間の分散シフトの懸念を引き起こす。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:30:07 GMT)
GoalFlow: Goal-Driven Flow Matching for Multimodal Trajectories Generation in End-to-End Autonomous Driving [16.6] GoalFlowは高品質なマルチモーダル軌道を生成するためのエンドツーエンドの自動運転手法である。
生成過程を制約し、高品質でマルチモーダルな軌道を生成する。
GoalFlowは最先端のパフォーマンスを実現し、自律運転のための堅牢なマルチモーダル軌道を提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:52:08 GMT)
AutoIOT: LLM-Driven Automated Natural Language Programming for AIoT Applications [16.5] 大規模言語モデル(LLM)は私たちの生活を大きく変え、AIとのインタラクションに革命をもたらし、AIの使用障壁を低くしています。
本稿では,AIoTアプリケーション用の自動プログラム生成装置であるAutoIOTを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:40:52 GMT)
Hybrid Implementation for Untrusted-node-based Quantum Key Distribution Network [16.2] 量子鍵分布(QKD)はセキュアな量子通信の基礎となる。
本稿では,TF-QKDとMDI-QKDをシームレスに統合するハイブリッドシステムを提案する。
実験では、繊維距離150~431kmの送受信QKDおよびMDI-QKDに対して、安全な有限サイズ鍵レートを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:27:41 GMT)
Refined Graph Encoder Embedding via Self-Training and Latent Community Recovery [16.2] 本稿では, 線形変換, 自己学習, 隠れたコミュニティリカバリを通じて, グラフエンコーダの埋め込みを改良し, グラフエンコーダの埋め込み方法を提案する。
本稿では,ブロックモデルに基づく有用な隠れコミュニティを効果的に同定する方法を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:14:56 GMT)
Stereo Any Video: Temporally Consistent Stereo Matching [15.9] 本稿では,ビデオステレオマッチングのための強力なフレームワークであるStereo Any Videoを紹介する。
カメラのポーズや光の流れといった補助的な情報に頼ることなく、空間的精度と時間的整合性を推定することができる。
主要なアーキテクチャ革新は、スムーズでロバストなコストボリュームを構成する全対対相関と、時間的コヒーレンスを改善する時間的凸アップサンプリングである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:20:36 GMT)
We Care Each Pixel: Calibrating on Medical Segmentation Model [15.8] pixel-wise expected Error (pECE) は、画素レベルでの誤校正を測定する新しい指標である。
また, キャリブレーション損失の計算に先立って, 地中トラスマスクに形態的操作を適用する形態的適応戦略を導入する。
本手法はセグメンテーション性能を向上するだけでなく,キャリブレーション品質も向上し,信頼性の高い推定値が得られる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:06:03 GMT)
Raccoon: Multi-stage Diffusion Training with Coarse-to-Fine Curating Videos [15.8] CFC-VIDS-1Mは、体系的な粗いキュレーションパイプラインによって構築された高品質のビデオデータセットである。
我々は、空間的時間的注意機構を分離したトランスフォーマーベースのアーキテクチャであるRACCOONを開発した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:46:50 GMT)
General Detection-based Text Line Recognition [15.8] 我々は、テキスト行認識に対する一般的な検出に基づくアプローチを、印刷(OCR)や手書き(HTR)として導入する。
我々の手法は、自己回帰復号に依存する最先端のHTR手法とは全く異なるパラダイムに基づいている。
我々は、CASIA v2データセット上での中国語スクリプト認識と、BorgおよびCopialeデータセット上での暗号認識の最先端性能を改善した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:47:28 GMT)
Double Backdoored: Converting Code Large Language Model Backdoors to Traditional Malware via Adversarial Instruction Tuning Attacks [15.5] 本研究では、バックドアをAI/MLドメインから従来のコンピュータマルウェアに移行するための新しいテクニックについて検討する。
命令チューニングされたコードLLMのサイバーセキュリティ脆弱性を評価するためのフレームワークであるMalInstructCoderを提案する。
我々は,3つの最先端の Code LLM を含むコード固有命令チューニングプロセスの活用性について,包括的調査を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:46:35 GMT)
DreamForge: Motion-Aware Autoregressive Video Generation for Multi-View Driving Scenes [15.5] 本研究では,DreamForgeを提案する。DreamForgeは3次元制御可能な長期生成に適した,高度な拡散型自己回帰ビデオ生成モデルである。
我々は、視点誘導を導入し、局所的な3D相関を組み込むためにオブジェクト指向位置符号化を統合する。
ショートシーケンスで訓練されたモデルを用いて,200コマ以上の長大映像を自動回帰的に生成し,16コマビデオ評価において,ベースラインよりも優れた品質を実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:09:18 GMT)
Surgical-LVLM: Learning to Adapt Large Vision-Language Model for Grounded Visual Question Answering in Robotic Surgery [15.5] 本稿では, 複雑な手術シナリオに適した, パーソナライズされた大規模視覚言語モデルであるオペレーショナル-LVLMを紹介する。
本研究では,EndoVis-17-VQLA,EndoVis-18-VQLA,新たに導入されたEndoVis Conversationsデータセットなど,いくつかのベンチマークにおける手術用LVLMの有効性を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:02:22 GMT)
VLMs Play StarCraft II: A Benchmark and Multimodal Decision Method [15.2] VLM-Attentionは、人工エージェントの知覚と人間のゲームプレイ体験を協調するマルチモーダル環境である。
基礎モデルを用いたVLMベースのエージェントは、明示的な訓練をすることなく複雑な戦術的操作を実行できることを示す。
この研究は、人間と協調したStarCraft IIエージェントを開発するための基盤を確立し、マルチモーダルゲームAIの幅広い研究課題を前進させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:54:25 GMT)
Automatic Teaching Platform on Vision Language Retrieval Augmented Generation [15.1] 本稿では,視覚言語検索のための拡張生成システム VL-RAG を提案する。
調整された回答と画像のデータベースを活用することで、VL-RAGシステムは特定の質問に沿った情報を動的に取得できる。
学生は視覚的・言語的に概念を探求し、より深い理解を促進し、常に人間の監視の必要性を減らすことができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:33:54 GMT)
This Is Your Doge, If It Please You: Exploring Deception and Robustness in Mixture of LLMs [14.8] 大規模言語モデル(LLM)エージェント(MoA)はAlpacaEval 2.0のような著名なベンチマークで最先端のパフォーマンスを達成する。
本研究は,LLM剤に対するMoAの堅牢性に関する初の包括的研究である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:46:39 GMT)
Learning Force Distribution Estimation for the GelSight Mini Optical Tactile Sensor Based on Finite Element Analysis [14.5] センサの原画像から直接力分布を予測するために,U-netアーキテクチャを用いた機械学習手法を提案する。
有限要素解析(FEA)から推定される力分布をトレーニングした本モデルは,市販のGelSight Miniセンサに対して,通常の力分布とせん断力分布を予測する上で有望な精度を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:05:23 GMT)
EvolvingGS: High-Fidelity Streamable Volumetric Video via Evolving 3D Gaussian Representation [14.4] EvolvingGSは、まずターゲットフレームに合わせるためにガウスモデルを変形させ、最小点加算/減算で洗練する2段階戦略である。
漸進的に進化する表現の柔軟性のため,本手法はフレーム単位と時間単位の品質指標の両方で既存手法より優れている。
我々の手法は、特に複雑な人間のパフォーマンスを持つ拡張シーケンスにおいて、動的シーン再構成の最先端性を著しく向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:01:07 GMT)
CACTUS: An Open Dataset and Framework for Automated Cardiac Assessment and Classification of Ultrasound Images Using Deep Transfer Learning [14.3] 本稿では,2つの主要コンポーネントからなるディープラーニング(DL)フレームワークを紹介する。
第1成分は、畳み込みニューラルネットワーク(CNN)を用いた心臓のUS画像の分類である。
第2のコンポーネントは、Transfer Learning(TL)を使用して、第1のコンポーネントから知識を微調整し、心臓画像のグレードと評価のためのモデルを作成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:29:04 GMT)
Tractable Representations for Convergent Approximation of Distributional HJB Equations [14.0] 強化学習(RL)では, 意思決定方針の長期的行動は, 平均回帰に基づいて評価される。
最近の研究は分布RL方程式を確立し、戻り分布を初めて特徴づけている。
分布RLアルゴリズムによって学習された統計量と対応する分布とのマッピングのトポロジカルな性質により、これらの統計量の近似はDHJB方程式の解の近似を近似することを示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:43:25 GMT)
Learning-Augmented Search Data Structures [14.0] 本研究では,効率的な検索クエリのために設計された従来のデータ構造を改善するために,機械学習アドバイスの統合について検討する。
スキップリストとKDツリーを構築し、2倍近い確率で最適な探索時間を提供する。
実際、我々の学習強化されたスキップリストとKDツリーは、たとえオラクルが一定要素内でのみ正確であっても、まだ一定要素まで最適である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:10:36 GMT)
TempoGPT: Enhancing Time Series Reasoning via Quantizing Embedding [14.0] 本稿では,マルチモーダル時系列データ構築手法とマルチモーダル時系列言語モデル(TLM, TempoGPT)を提案する。
ホワイトボックスシステム内の変数-システム関係を解析することにより,複雑な推論タスクのためのマルチモーダルデータを構築する。
広範な実験により、TempoGPTは時間的情報を正確に知覚し、結論を論理的に推論し、構築された複雑な時系列推論タスクにおける最先端の処理を達成することが示されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:43:30 GMT)
Similarity-Based Domain Adaptation with LLMs [13.7] 教師なしのドメイン適応は、様々なソースドメインからの豊富なラベル付きデータを活用し、ラベルなしのターゲットデータに一般化する。
本稿では,Large Language Models(LLM)の印象的な一般化機能をターゲットデータアノテーションに活用する,シンプルなフレームワークを提案する。
我々のフレームワークは,SOTA法と比較して2.44%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:51:07 GMT)
On the Feasibility of Fingerprinting Collaborative Robot Network Traffic [13.7] 本研究では,ロボットの協調作業におけるプライバシーリスクについて検討し,暗号化されたロボット通信における交通分析の可能性に着目した。
本稿では,信号処理技術を用いた交通分類手法を提案する。
本研究は,ロボットのプライバシとセキュリティにおける実用的防御の継続的な開発の必要性を強調した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:48:34 GMT)
RURANET++: An Unsupervised Learning Method for Diabetic Macular Edema Based on SCSE Attention Mechanisms and Dynamic Multi-Projection Head Clustering [13.4] RURANET++は、糖尿病黄斑浮腫(DME)の教師なし学習に基づく自動診断システムである
特徴処理中、トレーニング済みのGoogLeNetモデルは網膜画像から深い特徴を抽出し、PCAベースの次元を50次元に減らして計算効率を向上する。
実験の結果,複数の測定値に対して優れた性能を示し,最大精度(0.8411),精度(0.8593),リコール(0.8411),F1スコアを異常なクラスタリング品質で達成した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:17:31 GMT)
Mol-CADiff: Causality-Aware Autoregressive Diffusion for Molecule Generation [13.4] Mol-CADiffは、テキスト条件の分子生成に因果的注意機構を用いる、新しい拡散ベースのフレームワークである。
提案手法はテキストプロンプトと分子構造との因果関係を明示的にモデル化し,既存の手法の限界を克服する。
我々の実験は、モル-CADiffが多種多様で新規で化学的に有効な分子を生成する上で、最先端の手法より優れていることを実証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:10:37 GMT)
Interpersonal Memory Matters: A New Task for Proactive Dialogue Utilizing Conversational History [13.4] メモリ・アウェア・プロアクティブ・ダイアログ(MapDia)という新しいタスクを導入する。
そのタスクにより、自動データ構築法を提案し、中国初のメモリ対応プロアクティブデータセット(ChMapData)を作成する。
さらに、トピック要約、トピック検索、アクティブなトピックシフト検出と生成の3つのモジュールを特徴とする、検索用拡張生成(RAG)に基づくジョイントフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:19:17 GMT)
TIPS: Text-Image Pretraining with Spatial awareness [13.4] 自己教師付き画像のみの事前訓練は、多くの視覚的応用にとって依然としてゴートな方法である。
本稿では,高密度かつグローバルな視覚タスクのために,棚から効果的に利用可能な汎用画像テキストモデルを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:38:42 GMT)
QG-SMS: Enhancing Test Item Analysis via Student Modeling and Simulation [13.2] テスト項目分析(テスト項目解析)をQG評価に導入する。
トピックカバレッジ、アイテムの難易度、アイテムの識別、イントラクタ効率など、ディメンションによって品質が異なる質問のペアを構築します。
学生のモデリングとシミュレーションに大規模言語モデルを活用する新しいQG評価フレームワークQG-SMSを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:21:59 GMT)
InstaFace: Identity-Preserving Facial Editing with Single Image Inference [13.1] 本稿では,単一の画像のみを用いてアイデンティティを保存しながら,現実的な画像を生成するための,新しい拡散ベースのフレームワークInstaFaceを紹介する。
InstaFaceは、トレーニング可能なパラメータを追加することなく、複数の3DMMベースの条件を統合することで、3Dの視点を活用する。
本手法は, 身元保存, 光リアリズム, ポーズ, 表情, 照明の効果的な制御において, 最先端のアプローチよりも優れている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:06:40 GMT)
AI-driven Prediction of Insulin Resistance in Normal Populations: Comparing Models and Criteria [13.0] インスリン抵抗性(IR)は糖尿病の主要な前駆体であり、心血管疾患の重要な危険因子である。
我々は,非糖尿病集団において,血糖値の高速化だけでIRを予測できる簡単なAIモデルを開発した。
NHANES (1999-2020) とCHARLS研究のデータは、モデルトレーニングと検証に使用された。
CatBoost アルゴリズムは NHANES において 0.8596 (HOMA-IR) と 0.7777 (TyG index) の AUC を達成し、外部の AUC は 0.7442 である。
METS-IR予測では、AUCの0.9731(内部値)を達成した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:32:52 GMT)
OASIS Uncovers: High-Quality T2I Models, Same Old Stereotypes [12.9] テキスト・トゥ・イメージ(T2I)モデルによって生成された画像は、しばしば文化や職業といった概念の視覚的バイアスやステレオタイプを示す。
本稿では,その社会学的定義に沿ったステレオタイプを定量的に測定する。
OASISには、生成された画像データセットからステレオタイプを測定するための2つのスコアが含まれている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:31:49 GMT)
CoinRobot: Generalized End-to-end Robotic Learning for Physical Intelligence [12.6] 当社のフレームワークはクロスプラットフォーム適応性をサポートし,産業用ロボット,協調アーム,タスク固有の変更を伴わない新しい実施形態をシームレスに展開する。
我々は,7つの操作タスクに関する広範囲な実験を通じて,我々のフレームワークを検証する。特に,我々のフレームワークで訓練された拡散モデルは,LeRobotフレームワークと比較して優れた性能と一般化性を示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:50:58 GMT)
Transformers for molecular property prediction: Domain adaptation efficiently improves performance [12.6] 本研究の目的は,分子特性予測における変圧器モデルの限界について検討し,克服することである。
本稿では,事前学習データセットのサイズと多様性がトランスフォーマーモデルの性能に及ぼす影響について検討する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:55:13 GMT)
Riemann$^2$: Learning Riemannian Submanifolds from Riemannian Data [12.4] 潜在変数モデルは、高次元データから低次元多様体を学習するための強力なツールである。
本稿では,ロボットの動作合成や脳コネクトームの解析など,さまざまな領域における複雑なタスクの処理を可能にする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:08:53 GMT)
A Comprehensive LLM-powered Framework for Driving Intelligence Evaluation [12.3] 複雑な交通環境における行動インテリジェンスを駆動する評価フレームワークを提案する。
我々の研究は、よりインテリジェントで人間らしい自動運転エージェントの評価と設計に有用な洞察を提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:03:02 GMT)
Neighboring Slice Noise2Noise: Self-Supervised Medical Image Denoising from Single Noisy Image Volume [12.1] 近距離スライスノイズ2ノイズ(NS-N2N)の自己監督型医用画像復号法を提案する。
NS-N2Nは、画像ボリューム自体の高品質な denoising を実現するために、1つの医療画像から得られるノイズの多い画像ボリュームのみを必要とする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:02:33 GMT)
Post-Hoc Concept Disentanglement: From Correlated to Isolated Concept Representations [12.1] 概念活性化ベクトル(Concept Activation Vectors, CAV)は、人間の理解可能な概念をモデル化するために広く使われている。
それらは、概念サンプルの活性化から非概念サンプルの活性化までの方向を特定することによって訓練される。
この方法は、"beard"や"necktie"のような類似した概念に対して、類似した非直交方向を生成する。
この絡み合いは、分離された概念の解釈を複雑にし、CAVアプリケーションにおいて望ましくない効果をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:45:43 GMT)
CMMCoT: Enhancing Complex Multi-Image Comprehension via Multi-Modal Chain-of-Thought and Memory Augmentation [12.0] マルチイメージ理解のための「スロー思考」を模倣した多段階推論フレームワークを提案する。
重要な視覚領域トークンを利用したインターリーブマルチモーダル多段階推論チェーンの構築
推論中にモデル推論能力を拡張するテスト時メモリ拡張モジュールの導入。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:13:17 GMT)
AutoTestForge: A Multidimensional Automated Testing Framework for Natural Language Processing Models [12.0] NLPモデルの自動化および多次元テストフレームワークであるAutoTestForgeを紹介する。
AutoTestForge内では、テストテンプレートを自動的に生成してインスタンス化するLarge Language Models(LLM)の利用により、手作業による関与が大幅に削減される。
また、このフレームワークは、分類学、公正性、堅牢性の3つの側面にまたがってテストスイートを拡張し、NLPモデルの能力を総合的に評価する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:44:17 GMT)
A Real-time Multimodal Transformer Neural Network-powered Wildfire Forecasting System [12.0] 極度の山火事は人類文明にとって最も危険な自然災害の1つとなっている。
森林火災の発生を正確に予測することは、世界規模で最も緊急かつ厄介な環境課題の1つとなっている。
本研究では,リアルタイムのマルチモーダルトランスフォーマーニューラルネットワーク機械学習モデルを構築し,正確な位置での山火事発生をリアルタイムに予測する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:48:46 GMT)
GreenDFL: a Framework for Assessing the Sustainability of Decentralized Federated Learning Systems [11.7] Decentralized Federated Learning(DFL)は、集中的なデータやモデルアグリゲーションなしに協調的なモデルトレーニングを可能にする新興パラダイムである。
本研究の目的は、DFLシステムの持続可能性を評価するための総合的かつ運用的なフレームワークを開発することである。
提案したGreenDFLは、DFLシステムの持続可能性を評価するための包括的で実践的なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:04:54 GMT)
Safety-Critical Traffic Simulation with Adversarial Transfer of Driving Intentions [11.6] IntSimは、周囲の俳優の運転意図を運動計画から明確に切り離す戦略である。
IntSimは、現実的な安全クリティカルなシナリオをシミュレートして最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:59:27 GMT)
R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcing Learning [11.6] 本稿では,感情認識の文脈におけるOmni-multimodalな大規模言語モデルに対するReinforcement Learning with Verifiable Reward (RLVR)の最初の応用について述べる。
我々はRLVRを利用してOmniモデルを最適化し、推論能力、感情認識精度、一般化能力の3つの重要な側面でその性能を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:46:42 GMT)
Knowledge Augmentation in Federation: Rethinking What Collaborative Learning Can Bring Back to Decentralized Data [11.5] 連邦における知識強化(KAF)と呼ばれる知識中心のパラダイムを提案する。
提案するシステムアーキテクチャを提案し,プロトタイプ最適化の目的を定式化し,KAFに適した方法論を用いた新たな研究をレビューする。
コミュニティからもっと注目に値するいくつかの課題とオープンな質問を強調します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:57:44 GMT)
Partial Distribution Alignment via Adaptive Optimal Transport [11.2] 本稿では, 適応質量保存能力において, 古典的最適輸送とは異なる適応最適輸送を提案する。
機械学習アプリケーションにおける適応的最適輸送をインスタンス化し、ソースとターゲットの分布を部分的に適応的に調整する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:13:04 GMT)
ElementaryNet: A Non-Strategic Neural Network for Predicting Human Behavior in Normal-Form Games [11.1] GameNetは、データから非常に複雑なレベル0の仕様を学ぶニューラルネットワークである。
本稿では,GameNetのレベル0仕様は,戦略的推論が可能なため,あまりにも強力であることを示す。
これは新しいニューラルネットワークアーキテクチャ(ベースネットと呼ばれる)を導入し、非ストラテジックな振る舞いしかできないことを証明している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:47:16 GMT)
Policy Constraint by Only Support Constraint for Offline Reinforcement Learning [11.0] 本稿では,行動政策支援における学習政策の総確率の最大化から導かれる,唯一の支援制約(OSC)について述べる。
OSCは、分散シフトに伴う課題を緩和し、政策制約の保守性を緩和し、パフォーマンスを著しく向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:55:51 GMT)
CAT-3DGS: A Context-Adaptive Triplane Approach to Rate-Distortion-Optimized 3DGS Compression [10.9] 3D Gaussian Splatting (3DGS)は、最近、有望な3D表現として登場した。
リモート側への3DGS表現の圧縮と送信の必要性は見落としている。
この新しいアプリケーションは、レート歪みを最適化した3DGS圧縮を要求する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:20:13 GMT)
Preparing Tetra-Digit Long-Range Entangled States via Unified Sequential Quantum Circuit [10.8] この研究は、テトラ・ディジット(TD)量子スピンモデルの基底状態を作成するための枠組みを導入する。
TDモデルは、制約のあるモビリティと変形性を備えた空間的に拡張された励起をホストする。
量子シミュレータにおける合成次元による実験的な実現可能性により、このフレームワークは量子回路を介して様々なギャップを持つ長距離絡み合った状態に橋渡しする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:32:13 GMT)
Tell Me What to Track: Infusing Robust Language Guidance for Enhanced Referring Multi-Object Tracking [10.6] 参照マルチオブジェクト追跡(RMOT)は、任意の数のターゲットをローカライズすることを目的とした、新たなクロスモーダルタスクである。
我々は、不均衡の影響を軽減するために協調的マッチング戦略を実行し、新生児の標的を検出する能力を高める。
エンコーダでは,従来の作業のボトルネックを克服し,クロスモーダル・マルチスケール融合を統合し,強化する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:51:48 GMT)
Algorithmic Data Minimization for Machine Learning over Internet-of-Things Data Streams [10.6] 機械学習は、IoTデバイスが生成する膨大なデータを分析してパターンを特定し、予測し、リアルタイムな意思決定を可能にする。
IoTシステムは、しばしば家庭やオフィスなどの機密性の高い環境にデプロイされ、不注意に識別可能な情報を公開することができる。
本稿では,センサストリームの文脈におけるデータ最小化の技術的解釈を提供し,実践的な実装方法を探究し,課題に対処する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:35:11 GMT)
Removing Geometric Bias in One-Class Anomaly Detection with Adaptive Feature Perturbation [10.6] 1クラスの異常検出は、事前に定義された通常のクラスに属さないオブジェクトを検出することを目的としている。
我々は、事前訓練されたモデルによって与えられる凍結だがリッチな特徴空間を考察し、新しい適応線形特徴摂動技術を用いて擬似非正則特徴を作成する。
雑音分布を各サンプルに適用し, 線形摂動を特徴ベクトルに適用し, 対照的な学習目標を用いて分類過程を導出する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:42:51 GMT)
Enhanced Denoising and Convergent Regularisation Using Tweedie Scaling [10.4] この研究は、正規化の強度を明示的に統合し調整する新しいスケーリング手法を導入する。
スケーリングパラメータは、デノイザの学習プロセスの品質を反映することにより、解釈可能性を高める。
提案されたアプローチは、結果として得られる正則化の族が、確実に安定かつ収束することを保証している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:51:59 GMT)
Learning LLM Preference over Intra-Dialogue Pairs: A Framework for Utterance-level Understandings [9.8] 大規模言語モデル(LLM)は、ケース固有の微調整を必要とせずに複雑な対話タスクを処理できることが顕著に示されている。
本稿では,この課題に対処するための,シンプルながら効果的な枠組みを提案する。
本手法は、意図検出や対話状態追跡などのタスクを含む発話ごとの分類問題に特化して設計されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:46:13 GMT)
Reassessing the boundary between classical and nonclassicalfor individual quantum processes [9.7] この概念は、任意の型の個々の量子過程に対する古典的非古典的分割を定義するために利用できることを示す。
我々は、この提案に基づいて古典的・非古典的な分割がどこにあるかを特定するタスクを開始する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:09:45 GMT)
dARt Vinci: Egocentric Data Collection for Surgical Robot Learning at Scale [9.7] 本稿では,手術環境におけるロボット学習のためのスケーラブルなデータ収集プラットフォームであるdARt Vinciを紹介する。
このシステムは、Augmented Reality(AR)ハンドトラッキングと高忠実度物理エンジンを使って、原始的な外科手術の微妙な操作を捉えている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:07:54 GMT)
Optimal Transport for Probabilistic Circuits [9.6] 本稿では,関連する最適輸送問題の結合度を確率回路に制限するワッサーシュタイン型距離を提案する。
そこで本研究では,PC間の最適輸送計画が,小さな線形プログラムの解から容易に取り出せることを示す。
最後に、PCとデータセット間の実験的なワッサースタイン距離について検討し、PCパラメータを推定し、効率的な反復アルゴリズムによりこの距離を最小化できることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:03:13 GMT)
A Learned Generalized Geodesic Distance Function-Based Approach for Node Feature Augmentation on Graphs [9.5] 我々はLGGD(Learned Generalized Geodesic Distances)と呼ばれるアプローチを導入する。
この方法は、訓練パイプラインを通して一般化された測地距離関数を学習することによりノード特徴を生成する。
この手法の強みは、一般化された測地線距離からノイズや外れ値への強靭性にある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:47:19 GMT)
Is Your Video Language Model a Reliable Judge? [9.4] ビデオ言語モデル(VLM)は、様々なシナリオにおいてより多くのアプリケーションを得る。
堅牢でスケーラブルなパフォーマンス評価の必要性はますます重要になっています。
既存の手法はしばしば評価器として単一のVLMに依存している。
本研究は,裁判官のプールが信頼できないモデルと信頼できないモデルの両方を含む場合,そのようなアプローチの有効性について検討する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:17:59 GMT)
Capacity-Aware Inference: Mitigating the Straggler Effect in Mixture of Experts [9.4] Mixture of Experts (MoE)は、スパースエキスパートアクティベーションを活用することで、大規模な言語モデルをスケールするための効果的なアーキテクチャである。
MoEは不均衡なトークン・ツー・エキスパートの割り当てによって推論の非効率に悩まされ、一部の専門家はオーバーロードされ、他の専門家は未使用のままである。
我々は,(1)MoEの最大遅延を制御するために過負荷のトークンを廃棄するtextbftextitCapacity-Aware Token Drop,(2)過負荷のトークンを未利用の専門家に再配置するtextbftextitCapacity-Aware Token Rerouteの2つの主要な手法を含むキャパシティ・アウェア推論を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:11:39 GMT)
VidHal: Benchmarking Temporal Hallucinations in Vision LLMs [9.4] 大型幻覚言語モデル(VLLM)は幻覚の傾向が広く認められている。
時間力学における映像に基づく幻覚の評価に特化して設計されたベンチマークであるVidHalを紹介する。
ベンチマークの明確な特徴は、各ビデオに関連する様々なレベルの幻覚を表すキャプションを慎重に作成することにある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:00:43 GMT)
Is merging worth it? Securely evaluating the information gain for causal dataset acquisition [9.4] 我々は、マージの価値を定量化するための、最初の暗号的にセキュアな情報理論アプローチを導入する。
我々は、期待情報ゲイン(EIG)を評価し、生データを公開せずに安全に計算できることを保証するために、マルチパーティ計算を利用する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:23:27 GMT)
A fuzzy adaptive evolutionary-based feature selection and machine learning framework for single and multi-objective body fat prediction [9.3] 体脂肪の予測は、医療従事者や利用者に心臓疾患の予防および診断に不可欠な情報を提供する。
現在の機械学習メソッドは、ローカルオプティマで立ち往生する可能性がある。
ファジィ適応グローバルラーニング ローカル検索 普遍的多様性に基づく特徴選択は、この単目的特徴選択マシンラーニングフレームワークに適用される。
このモデルは、他のハイブリッドおよび最先端の機械学習モデルよりも正確で安定した体脂肪推定を実現した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:00:40 GMT)
Disentangling Task Interference within Neurons: Model Merging in Alignment with Neuronal Mechanisms [9.2] モデルマージにおける神経アライメントの影響について検討した。
神経サブスペース内のタスク干渉を軽減するために開発された新しい統合フレームワークであるNeuroMergingを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:00:24 GMT)
Object Packing and Scheduling for Sequential 3D Printing: a Linear Arithmetic Model and a CEGAR-inspired Optimal Solver [9.2] 逐次3次元印刷におけるオブジェクト配置とスケジューリングの問題に対処する。
シーケンシャルの場合、プリンタの可動部が以前の印刷物と衝突しないようにする必要がある。
本稿では,この問題を線形算術公式として表現し,満足度変調理論(SMT)の解法を用いて解くことを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:31:40 GMT)
M2Distill: Multi-Modal Distillation for Lifelong Imitation Learning [9.2] M2Distillは、生涯の模倣学習のためのマルチモーダル蒸留に基づく方法である。
我々は、前段階から現在の段階まで、様々なモダリティにわたる潜在表現のシフトを規制する。
学習したポリシーが、新しいスキルをシームレスに統合しながら、以前に学習したタスクを実行する能力を維持していることを保証します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:29:54 GMT)
Bias Unveiled: Investigating Social Bias in LLM-Generated Code [9.1] 大規模言語モデル(LLM)は、自動コード生成の分野を大幅に進歩させた。
本研究では,LLM生成コードの社会的バイアスの評価と緩和を目的とした,新しいフェアネスフレームワークであるSolarを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:59:21 GMT)
Step-by-step design guide of a cryogenic three-axis vector magnet [9.1] 低温に互換性のある3軸ベクトル磁石を設計・構築するための詳細なマニュアルを提供する。
コイルは3Aまでの直流電流で駆動され、2.5Tまでの磁場を発生させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:32:11 GMT)
PseudoTouch: Efficiently Imaging the Surface Feel of Objects for Robotic Manipulation [9.0] 低次元センサ信号に高次元構造情報をリンクするPseudoTouchを提案する。
低次元の視覚触覚埋め込みを学習し、そこから触覚信号を復号する深度パッチを符号化する。
学習したPseudoTouchモデルの有用性を、物体認識と把握安定性予測という2つの下流タスクで実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:18:19 GMT)
Extracting and Emulsifying Cultural Explanation to Improve Multilingual Capability of LLMs [9.0] 大規模言語モデル(LLM)は目覚ましい成功を収めているが、英語中心のトレーニングデータでは英語以外の言語のパフォーマンスが制限されている。
より正確かつ適切な応答に文化コンテキストを組み込むことで,LLMの多言語機能を改善する,シンプルかつ効果的なアプローチであるEMCEIを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:05:34 GMT)
Shifting Perspectives: Steering Vector Ensembles for Robust Bias Mitigation in LLMs [8.9] 本稿では,大規模言語モデル(LLM)において,前方通過におけるモデルアクティベーションの修正にステアリングベクトルを適用することにより,バイアス軽減手法を提案する。
ベイズ最適化を用いて、9つのバイアス軸にまたがる効果的な対照的なペアデータセットを体系的に同定する。
これらの有望な結果に基づいて、複数の個別に最適化されたステアリングベクトルを平均化する手法であるステアリングベクトルアンサンブル(SVE)を導入し、それぞれが年齢、人種、性別などの特定のバイアス軸をターゲットにしている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:25:29 GMT)
Reliable and scalable variable importance estimation via warm-start and early stopping [8.9] 我々は,反復的なカーネル更新方程式として表現できる任意のアルゴリズムに対して,変数の重要度を推定するスケーラブルな手法を開発した。
ニューラルネットワークのカーネルベースの手法を早期に停止する理論を用いて理論的保証を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:34:16 GMT)
Accelerated Patient-specific Non-Cartesian MRI Reconstruction using Implicit Neural Representations [8.8] 我々は,デ・ノボをアンサンプした非カルテシアンk空間再構築のための新しい生成的訓練型暗黙的ニューラル表現(k-GINR)を開発した。
k-GINRは、非常に高い加速で観測されるパフォーマンス上の優位性により、ベースラインを一貫して上回った。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:05:43 GMT)
Visual-Inertial SLAM for Unstructured Outdoor Environments: Benchmarking the Benefits and Computational Costs of Loop Closing [8.7] 本稿では,未構造化の屋外環境での性能を評価するために,オープンソースのVisual-Inertial SLAMシステムをいくつかベンチマークする。
ループ閉鎖が局所化精度と計算要求に与える影響に焦点をあてる。
計算資源を効率的に管理しながら、ローカライズ精度を向上させるためにループクローズの重要性を強調した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:40:36 GMT)
The interplay between domain specialization and model size [8.7] 計算制約シナリオ下での継続事前学習におけるドメインサイズとモデルサイズ間の相互作用について検討する。
我々の目標は、このシナリオに最適なトレーニング体制を特定し、異なるモデルサイズとドメインにまたがって一般化可能な、この相互作用のパターンを検出することです。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:48:14 GMT)
Zero-shot Medical Event Prediction Using a Generative Pre-trained Transformer on Electronic Health Records [8.6] EHRで訓練された基礎モデルはゼロショット方式で予測タスクを実行できることを示す。
広範囲なラベル付きデータを必要とする教師付きアプローチとは違って,本手法では,事前学習した知識から,次の医療イベントを純粋に予測することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:26:47 GMT)
CASP: Compression of Large Multimodal Models Based on Attention Sparsity [8.4] 大規模マルチモーダルモデル(LMM)のためのモデル圧縮手法であるCASPを紹介する。
提案手法では,クエリおよびキー重み行列上でデータ対応低ランク分解を行い,次いで最適なビット割り当てプロセスに基づいて全層にわたって量子化を行う。
任意の量子化技術と互換性があり、画像およびビデオ言語ベンチマークで平均21%の精度で最先端の2ビット量子化手法(AQLMとQuIP#)を強化する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:11:44 GMT)
MeanCache: User-Centric Semantic Caching for LLM Web Services [8.4] キャッシングは、繰り返しクエリの推論コストを削減するための自然なソリューションである。
本稿では,LLMベースのサービスのためのユーザ中心セマンティックキャッシュであるMeanCacheを紹介する。
MeanCacheは、セマンティックに類似したクエリを特定して、キャッシュヒットやミスを判定する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:49:07 GMT)
Bypassing orthogonalization in the quantum DPP sampler [8.3] 我々は、Kerenidisらの形式にインスパイアされた単純な回路が、2022年に我々がアプリケーションで遭遇したことのないタイプのDPPをサンプリングしたことを示す。
第2のコントリビューションは振幅増幅を用いて、回路深さの価格で受け入れ確率を$a$から$1-a$に上げることである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:57:39 GMT)
FastMap: Fast Queries Initialization Based Vectorized HD Map Reconstruction Framework [8.3] FastMapは、既存のアプローチにおけるデコーダの冗長性を減らすために設計された革新的なフレームワークである。
我々のフレームワークは、ランダムにクエリを初期化する従来の手法を排除し、代わりにヒートマップ誘導クエリ生成モジュールを組み込む。
FastMapはnuScenesとArgoverse2両方のデータセットで最先端のパフォーマンスを実現し、デコーダはベースラインよりも3.2高速で動作する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:01:55 GMT)
FastTrackTr:Towards Fast Multi-Object Tracking with Transformers [8.3] トランスフォーマーベースのマルチオブジェクト追跡(MOT)モデルは、しばしば構造や他の問題によって推論速度が遅くなる。
本稿では,高速かつ斬新なJDT型MOTフレームワークであるFastTrackTrを構築し,DETR上のフレーム間の情報伝達を効率的に行う手法を提案する。
この情報伝達手法の優位性により,本手法はトラッキング時に要求されるクエリ数を削減できるだけでなく,ネットワーク構造が過度に導入されるのを避けることができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:39:49 GMT)
NoT: Federated Unlearning via Weight Negation [8.2] フェデレーション・アンラーニング(FU)は、トレーニングされたフェデレーション・ラーニング(FL)モデルから参加者のデータコントリビューションを取り除き、プライバシと規制のコンプライアンスを確保することを目的としている。
従来のFUメソッドは、しばしばクライアントまたはサーバ側の補助ストレージに依存するか、削除対象のデータに直接アクセスする必要がある。
重みの否定(-1倍の乗算)に基づく新規かつ効率的なFUアルゴリズムであるNoTを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:19:19 GMT)
Demystifying Misconceptions in Social Bots Research [8.2] ソーシャルボットの研究は、知識の進歩と、最も議論を呼んだオンライン操作のソリューションの提供を目的としている。
しかし、ソーシャルボットの研究は、広範な偏見、誇張された結果、誤解に悩まされている。
本稿は、社会ボット研究の支持者と反対者の両方が用いている共通の誤った議論を特定し、否定することで、そのような取り組みを加速させるものである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:23:53 GMT)
EDM: Efficient Deep Feature Matching [8.1] 本稿では,効率的なDeep機能マッチングネットワーク,EDMを提案する。
まず、より少ない次元のより深いCNNを採用し、マルチレベルの特徴を抽出する。
次に,高レベルの深い特徴に対して特徴変換を行う相関注入モジュールを提案する。
改良段階において、軽量な双方向軸ベース回帰ヘッドは、潜在特徴からサブピクセルレベルの対応を直接予測するように設計されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:47:30 GMT)
Nearly Minimax Optimal Regret for Multinomial Logistic Bandit [8.1] 本研究では,学習エージェントが文脈情報に基づいて順にアソシエーションを選択する,文脈多項ロジット(MNL)バンディット問題について検討する。
左下肢と左上肢の間には有意な差がみられ,特に最大配置サイズは有意な差がみられた。
我々は,一様報酬の下で,$tildeO(dsqrtT/K)$と一致する上限を実現する定数時間アルゴリズム OFU-MNL+を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:23:19 GMT)
Improved Online Confidence Bounds for Multinomial Logistic Bandits [8.1] 本稿では,MNLモデルに対するオンライン信頼度の向上を提案する。
この結果をMNLブレイビットに適用し,変分依存性の最適後悔を実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:29:35 GMT)
Adversarial Policy Optimization for Offline Preference-based Reinforcement Learning [8.1] オフライン優先型強化学習(PbRL)のための効率的なアルゴリズムを提案する。
APPOは、明示的な信頼セットに頼ることなく、サンプルの複雑性境界を保証する。
我々の知る限り、APPOは統計的効率と実用性の両方を提供する最初のオフラインPbRLアルゴリズムである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:35:01 GMT)
GEMA-Score: Granular Explainable Multi-Agent Score for Radiology Report Evaluation [8.1] 本稿では,粒状説明可能マルチエージェントスコア(GEMA-Score)を提案する。
GEMA-Scoreは大規模言語モデルに基づくマルチエージェントワークフローを通じて客観的定量化と主観評価を行う。
実験により、GEMA-Scoreは、公開データセット上での人間の専門家評価と最も高い相関を達成できることが示された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:42:22 GMT)
Language-guided Medical Image Segmentation with Target-informed Multi-level Contrastive Alignments [8.0] ターゲット型マルチレベルコントラストアライメント(TMCA)を用いた言語誘導セグメンテーションネットワークを提案する。
TMCAは、言語誘導セグメンテーションにおけるパターンギャップを橋渡しするために、ターゲット・インフォームド・クロスモダリティアライメントときめ細かいテキストガイダンスを可能にする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:13:02 GMT)
Graph Alignment via Birkhoff Relaxation [7.8] 本稿では,バーコフ緩和,QAPの密接な凸緩和,およびその性能に関する理論的保証について分析する。
最適解である$Xstar$は、小さな$sigma$に対して$Pistar$の小さな摂動から、$sigma$として$Pistar$と十分に分離された状態への遷移が大きくなることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:01:35 GMT)
Electric polarization in Chern insulators: Unifying many-body and single-particle approaches [7.7] チャーン絶縁体は、ギャップのないエッジ状態と非局在化可能なワニエ軌道を持つにもかかわらず、固有の2次元電気分極を持つ。
本稿では、実空間の原点 $texto$ と運動量空間の点 $veck_0$ が互いに適切に選択されているとき、ベリー位相と多体分極の定義は等しいことを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:00:00 GMT)
TRADE: Transfer of Distributions between External Conditions with Normalizing Flows [7.5] 本稿では,境界値問題として学習過程を定式化することで限界を克服するTRADEを提案する。
ベイズ推定や分子シミュレーションから物理格子モデルまで幅広い応用において優れた結果が得られることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:08:45 GMT)
Joint 3D Point Cloud Segmentation using Real-Sim Loop: From Panels to Trees and Branches [7.3] P2TBタスク用に設計されたデータ生成のためのReal2Sim L-TreeGenとジョイントモデル(J-P2TB)を組み込んだ新しいアプローチを提案する。
生成したシミュレーションデータセットに基づいてトレーニングされたJ-P2TBモデルは、ゼロショット学習を通じて現実世界のパネルポイントクラウドのジョイントセグメンテーションに使用された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:54:02 GMT)
CNsum:Automatic Summarization for Chinese News Text [7.2] 本稿ではトランスフォーマー構造に基づく中国語ニューステキスト要約モデル(CNsum)を提案する。
実験の結果, CNsumはベースラインモデルよりもROUGEスコアがよいことがわかった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:56:45 GMT)
PhysicsGen: Can Generative Models Learn from Images to Predict Complex Physical Relations? [7.2] 本稿では,物理シミュレーションの文脈における生成モデルの可能性について検討する。
3種類の物理シミュレーションタスクに対して,300kイメージペアのデータセットとベースライン評価を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:19:13 GMT)
Learning Through AI-Clones: Enhancing Self-Perception and Presentation Performance [7.2] 44人の国際学生による混合設計実験は、オンライン英語プレゼンテーションの自己記録ビデオ(自己記録グループ)とAIクローンビデオ(AIクローングループ)を比較した。
その結果、AIクローンは、社会的比較を容易にするために肯定的な「ロールモデル」として機能していた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:50:41 GMT)
What's So Human about Human-AI Collaboration, Anyway? Generative AI and Human-Computer Interaction [6.9] 我々は、生成的AIの言語能力を考えると、人間と人間のコラボレーションの共通した特徴が人間とコンピュータの相互作用の研究にどのように適用できるかを特定する。
我々は、人間-AIコラボレーションシステムの構築に取り組んでいる業界関係者とのインタビューや、エンドユーザとのコラボレーションによるタスクサポートのためのマルチモーダルAIアシスタントの構築から得られた洞察を提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:48:18 GMT)
SynSUM -- Synthetic Benchmark with Structured and Unstructured Medical Records [6.9] 構造化背景変数に非構造化臨床ノートをリンクする合成データセットであるSynSUMベンチマークを提案する。
このデータセットは、呼吸器疾患の領域における架空の患者との遭遇を含む1万件の人工的な患者記録で構成されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:09:02 GMT)
A Map-free Deep Learning-based Framework for Gate-to-Gate Monocular Visual Navigation aboard Miniaturized Aerial Vehicles [6.9] パームサイズの自律型ナノドローン、すなわち重量50g未満は、最近ドローンレースのシナリオに参入し、障害物を回避し、ゲートを通ってできるだけ早く移動するよう義務付けられている。
この研究は、リアルタイムのディープラーニングゲート検出フロントエンドと、古典的でエレガントで効果的なビジュアルサーボ制御バックエンドを組み合わせた、地図のない視覚ベースの自律型ナノドローンを提示する。
現地での実験では、ナノドローンが4分で15個のゲートを通り抜けることに成功した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:07:07 GMT)
Planning Domain Model Acquisition from State Traces without Action Parameters [6.8] 本研究では,観測可能な状態変化のある状態トレースからアクションスキーマを学習する手法を提案する。
このタスクは、少なくともグラフ同型と同様に困難であることを示す。
最先端の学習ツールSAMとExtended SAMと比較して、新しいアルゴリズムは複数のドメインでより良い結果を提供することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:45:07 GMT)
Signal Processing Meets SGD: From Momentum to Filter [6.8] ディープラーニングでは、勾配降下(SGD)とその運動量に基づく変種が最適化に広く利用されている。
本稿では,信号処理レンズを用いて勾配挙動を解析し,更新に影響を与える重要な要因を分離する。
本稿では,ワイナーフィルタの原理に基づく新しいSGDF手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:16:23 GMT)
CODE-CL: Conceptor-Based Gradient Projection for Deep Continual Learning [6.7] 深層ニューラルネットワークは、タスクを逐次学習する際に破滅的な忘れに苦しむ。
最近のアプローチでは、勾配投影を用いた部分空間の更新が制限されている。
本稿では,Deep Continual Learning (CODE-CL) のための概念ベース勾配予測法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:46:12 GMT)
Task-oriented Uncertainty Collaborative Learning for Label-Efficient Brain Tumor Segmentation [6.7] マルチコントラストMRI(Multi-Contrast magnetic resonance imaging)は、脳腫瘍の分節化と診断において重要な役割を担っている。
既存の手法は、異なるコントラストをまたいだマルチレベル特異性知覚の課題に直面している。
マルチコントラストMRIセグメンテーションのためのタスク指向不確実性協調学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:44:53 GMT)
CleanAgent: Automating Data Standardization with LLM-based Agents [6.7] 異なる列型を標準化するための宣言的で統一されたAPIを備えたPythonライブラリを提案する。
Dataprep.Cleanは、特定のカラムタイプを1行のコードで標準化可能にすることで、コーディングの複雑さを大幅に削減する。
データ標準化プロセスを自動化するために、Dataprep.CleanとLLMベースのエージェントを統合するCleanAgentフレームワークを導入する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:01:29 GMT)
Look Before You Leap: Using Serialized State Machine for Language Conditioned Robotic Manipulation [6.6] 本稿では,有限状態機械をシリアライズして実演を生成するフレームワークを提案する。
実験の結果,既存手法による制御条件と比較して,これらの課題において最大98の達成率が得られることがわかった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:19:25 GMT)
Near-Polynomially Competitive Active Logistic Regression [6.6] 能動的学習は受動的学習と比較して指数関数的に少ないラベルクエリを必要とすることはよく知られている。
入力毎に最適なアルゴリズムと競合する最初のアルゴリズムを示す。
我々のアルゴリズムは効率的なサンプリングに基づいており、より一般的な関数のクラスを学習できるように拡張することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:31:58 GMT)
Noise-Robust Radio Frequency Fingerprint Identification Using Denoise Diffusion Model [6.6] RFFI(Radio Frequency Fingerprint Identification)は、無線デバイスを識別するための有望な認証技術である。
低信号対雑音比(SNR)シナリオでのRFFI性能は、微小なハードウェア特性がノイズで簡単に湿らせることができるため、著しく劣化する。
我々は拡散モデルを利用して低SNRシナリオ下でRFFを効果的に復元した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:30:55 GMT)
Gaussian Random Fields as an Abstract Representation of Patient Metadata for Multimodal Medical Image Segmentation [6.5] 慢性的な傷は、患者にとって壊滅的な結果をもたらす可能性がある。
このような傷の発見とモニタリングのための深層学習法は、患者と臨床医の両方への影響を減らす可能性がある。
本稿では、患者メタデータをトレーニングワークフローに導入できる新しいマルチモーダルセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:09:59 GMT)
Robustness of Generalized Median Computation for Consensus Learning in Arbitrary Spaces [6.5] 一般化中央値計算は、コンセンサス学習の特別な例であり、プロトタイプを見つけるための共通のアプローチである。
我々の知る限りでは、任意の空間に対して、一般の設定においてロバスト性の特性は存在しない。
重み付き一般化中央値計算と非距離関数のロバスト性について述べる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:10:45 GMT)
MGSR: 2D/3D Mutual-boosted Gaussian Splatting for High-fidelity Surface Reconstruction under Various Light Conditions [6.4] 新しいビュー合成(NVS)と表面再構成(SR)は3次元ガウススプラッティングにおける必須課題である(3D-GS)
表示品質と3次元再構成精度を両立させる表面再構成用2D/3D多孔型ガウススプラッティングであるMGSRを提案する。
我々はMGSRをオブジェクトレベルとシーンレベルの両方において、多種多様な合成および実世界のデータセットで評価し、レンダリングおよび表面再構成において高い性能を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:06:47 GMT)
New multimodal similarity measure for image registration via modeling local functional dependence with linear combination of learned basis functions [6.4] 登録画像の強度値間の機能的依存に基づく類似度指標について検討する。
このような措置が十分に小さな文脈で適用された場合、変形可能な登録において競合性能を示す。
我々は,この手法を使いやすいツールとしてリリースし,3つのデータセットで優れた性能を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:22:33 GMT)
Counterfactuals As a Means for Evaluating Faithfulness of Attribution Methods in Autoregressive Language Models [6.4] 本稿では,自己回帰型言語モデルに対する帰属手法の忠実度を評価するために,反事実生成を利用する手法を提案する。
提案手法は, 流動性, 分散性, 分散性, 分散性, 評価プロトコルの信頼性を向上する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:28:58 GMT)
A Confidence-based Acquisition Model for Self-supervised Active Learning and Label Correction [6.4] 逐次マルチアウトプット問題に適したプールベースのアクティブラーニングフレームワークであるCAMELを提案する。
専門家アノテータは選択されたシーケンスのごく一部だけをラベル付けする必要がある。
ラベル補正機構をデプロイすることで、CAMELをデータクリーニングにも利用することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:23:19 GMT)
Separability Membrane: 3D Active Contour for Point Cloud Surface Reconstruction [6.4] 本稿では,3次元点雲物体から表面を抽出する頑健な3次元アクティブな輪郭である分離性膜を提案する。
提案手法は,3次元物体の表面をフィッシャーの比に基づいて,その内外領域間の強度,色,局所密度などの点特徴の分離性を最大化する境界として定義する。
分離性膜は、クラス分離性を最大化し、局所的および大域的分離性に基づいてその特性を調整する適応的なB-スプライン面で3次元表面モデルの剛性を制御し、3次元物体の正確な表面を識別する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:15:02 GMT)
The Society of HiveMind: Multi-Agent Optimization of Foundation Model Swarms to Unlock the Potential of Collective Intelligence [6.3] 複数のAIファンデーションモデル間のインタラクションをオーケストレーションするフレームワークを開発する。
このフレームワークは、主に現実世界の知識を必要とするタスクに対して、無視可能なメリットを提供する。
一方、我々は、集中的な論理的推論を必要とするタスクの大幅な改善について言及する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:45:03 GMT)
Spectral-Spatial Extraction through Layered Tensor Decomposition for Hyperspectral Anomaly Detection [6.3] 低位テンソル表現(LRTR)法は高スペクトル異常検出(HAD)に非常に有用である
まず、非負行列分解(NMF)を用いてスペクトル次元の冗長性を緩和し、スペクトル異常を抽出する。
次に, LRTRを用いて空間冗長性を緩和しながら空間異常を抽出し, HADのための高効率なテンソル分解機構を得る。
Airport-Beach-Urban と MVTec のデータセットによる実験結果から,HAD タスクの最先端手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:08:14 GMT)
Generative Densification: Learning to Densify Gaussians for High-Fidelity Generalizable 3D Reconstruction [6.3] 本稿では,フィードフォワードモデルにより生成されたガウスを高効率で一般化可能な手法であるジェネレーティブ・デンシフィケーションを提案する。
提案手法は, モデルサイズが同等あるいは小さく, 最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:02:35 GMT)
HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning [6.3] Heuristic Behavior Tree Planning (HBTP) はBT生成のための信頼性と効率的なフレームワークである。
本稿では,BT拡張プロセスと最適計画と満足度計画のための2つの変種を紹介する。
実験では、HBTPの理論的限界を示し、4つのデータセットから得られた結果により、日々のサービスロボット応用における実用性が確認された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:27:32 GMT)
No Forgetting Learning: Memory-free Continual Learning [6.2] この作業では、メモリフリーの継続的学習フレームワークであるNo Forgetting Learning(NFL)を紹介します。
NFLは最先端の手法の約14.75倍のメモリを消費し、競争力を発揮する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:18:06 GMT)
AverageLinear: Enhance Long-Term Time series forecasting with simple averaging [6.1] 長期時系列分析は、過去と将来の変化を調べて長期的な傾向を予測することを目的としている。
トランスフォーマーアーキテクチャに基づくモデルでは、アテンション機構の適用により、顕著な性能上の利点が示されている。
本研究は,アテンション機構がパフォーマンス向上に寄与するコアコンポーネントではないことを明らかにした。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:13:27 GMT)
Tracing the Lifecycle of Architecture Technical Debt in Software Systems: A Dependency Approach [6.0] アーキテクチャ技術的負債(ATD)は、初期の開発を加速する一方で長期的な保守上の課題を生み出すソフトウェアアーキテクチャにおけるトレードオフを表す。
我々は、ATDの導入から返済への進化とそのソフトウェアアーキテクチャへの影響を理解することを目的としている。
我々の研究では、ATDの解決はソフトウェアの品質を短期的に向上させるが、依存関係の集中化によってアーキテクチャをより複雑にすることができることを示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:55:01 GMT)
Pretext Task Adversarial Learning for Unpaired Low-field to Ultra High-field MRI Synthesis [6.0] 低磁場MRIは、高磁場MRIと比較して、信号対雑音比(SNR)と空間分解能の低下に悩まされることが多い。
低磁場MRIデータからの高磁場MRI合成のためのPretext Task Adversarial (PTA) 学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:28:55 GMT)
Kaiwu: A Multimodal Manipulation Dataset and Framework for Robot Learning and Human-Robot Interaction [6.0] 本稿では,実世界の同期型マルチモーダルデータ問題に対処するために,カイウーマルチモーダルデータセットを提案する。
このデータセットはまず、人間、環境、ロボットのデータ収集フレームワークを20の被験者と30のインタラクションオブジェクトと統合する。
絶対タイムスタンプに基づく細粒度マルチレベルアノテーションとセマンティックセグメンテーションラベリングを行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:28:24 GMT)
GraphT5: Unified Molecular Graph-Language Modeling via Multi-Modal Cross-Token Attention [5.9] 分子言語モデリングのための1次元SMILESテキストと2次元グラフ表現を統合したフレームワークを提案する。
クロストークンの注意は、SMILESと分子のグラフの間の暗黙の情報を利用する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:57:16 GMT)
Direct Preference-Based Evolutionary Multi-Objective Optimization with Dueling Bandit [5.9] 本稿では,人間のフィードバックのみに頼って,適合度関数の計算を補助する手法を提案する。
提案手法では,アクティブ・デュエル・バンディット・アルゴリズムにより直接選好学習を行う。
本研究は,従来の手法の限界に対処するだけでなく,最適化問題に対する新たな可能性を明らかにする,インタラクティブな嗜好ベースのMOEAフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:39:06 GMT)
BigMac: A Communication-Efficient Mixture-of-Experts Model Structure for Fast Training and Inference [5.8] そこで我々はBigMacという新しいMoE構造を提案する。
BigMacは、同じ数のエキスパートと同じ数の合計パラメータを持つ細粒度のMoEよりも、同等またはそれ以上のモデル品質を達成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:28:39 GMT)
Causal bandits with backdoor adjustment on unknown Gaussian DAGs [5.8] グラフ構造が不明な場合の因果帯域問題について検討する。
連続的に生成された実験データと観測データを用いて各アームのバックドア調整セットを同定する。
最適介入を逐次決定するために,修正された上位信頼境界に基づく新しい帯域幅アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:21:29 GMT)
Explicit vs. Implicit: Investigating Social Bias in Large Language Models through Self-Reflection [5.8] 大規模言語モデル(LLM)は、生成されたコンテンツに様々なバイアスとステレオタイプを示すことが示されている。
本稿では, LLMにおける明示的, 暗黙的な偏見を解明するために, 社会心理学理論に基づく体系的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:16:34 GMT)
GBT-SAM: A Parameter-Efficient Depth-Aware Model for Generalizable Brain tumour Segmentation on mp-MRI [5.8] GBT-SAMは、Segment Anything Model(SAM)を脳腫瘍のセグメンテーションタスクに拡張する新しいフレームワークである。
これは、アダルト・グリオーマデータセット上で最先端のパフォーマンスを達成する。
メニンギオーマ、小児グリオーマ、サブサハラグリオーマのデータセットにまたがる堅牢な一般化を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:22:10 GMT)
Dynamic Knowledge Integration for Evidence-Driven Counter-Argument Generation with Large Language Models [5.7] 本稿では,Large Language Models (LLMs) を用いた対問題生成改善における動的外部知識統合の役割について検討する。
我々は,議論の複雑さと評価可能性のバランスをとるために,議論と反論のペアを手作業でキュレートした新しいデータセットを導入する。
実験の結果、Webから動的外部知識を統合することで、生成した逆問題の品質が大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:13:33 GMT)
Real-Time Incremental Explanations for Object Detectors in Autonomous Driving [5.6] 本稿では,オブジェクト検出のためのリアルタイムブラックボックス説明可能性のためのアルゴリズムとツールであるIncXを紹介する。
IncX は正則写像の線形変換に基づいており、十分説明できる。
我々は、自動運転の4つの広く使われているビデオデータセットの実装を評価した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:38:59 GMT)
BARK: A Fully Bayesian Tree Kernel for Black-box Optimization [5.5] ベイズ加法回帰木(BART)のガウス過程の観点からベイズ最適化を行う。
我々の BART Kernel (BARK) はツリーアグリーメントを用いて断片的整合関数の後方定義を行い、マルコフ連鎖モンテカルロアプローチを用いてツリーカーネルの空間を探索する。
本実験は,BARKの総合ベンチマークおよび応用ベンチマークにおける高い性能を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:56:09 GMT)
LLMorpheus: Mutation Testing using Large Language Models [5.4] 本稿では,プログラムのソースコード内の指定された場所でプレースホルダーを導入する変異検査手法を提案する。
我々はLLMorpheusがStrykerJSでは生成できない既存のバグに似た変異体を生産できると考えている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:48:47 GMT)
Beyond RMSE and MAE: Introducing EAUC to unmask hidden bias and unfairness in dyadic regression models [5.3] 非均一な観測値分布が、最先端のモデルに深刻なバイアスをもたらすことを示す。
我々は、すべての研究領域とモデルでそれを定量化できる新しい指標として、Eccentricity-Area Under the Curve (EAUC)を紹介した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:40:19 GMT)
Spatial regularisation for improved accuracy and interpretability in keypoint-based registration [5.3] 教師なしキーポイント検出に基づく最近のアプローチは、解釈可能性に非常に有望である。
本稿では,特徴量の空間分布を正規化するための3倍の損失を提案する。
我々の損失は特徴の解釈可能性を大幅に改善し、現在では正確で解剖学的に意味のあるランドマークに対応しています。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:51:19 GMT)
Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models [5.2] 強化学習(Reinforcement Learning, RL)は、エージェントが対話や報酬信号を通じて、複雑な振る舞いを自律的に最適化することを可能にする。
本研究では,自然言語タスク記述から直接報酬関数を生成するために,事前学習されたLLMであるGPT-4を利用した教師なしパイプラインを提案する。
報酬はシミュレーション環境でRLエージェントを訓練するために使用され、報酬生成プロセスは実現可能性を高めるために形式化される。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:06:29 GMT)
NeSyC: A Neuro-symbolic Continual Learner For Complex Embodied Tasks In Open Domains [5.2] エンボディエージェントの鍵となる課題は、様々な環境における知識の一般化である。
NeSyCは、仮説推論モデルをエミュレートする神経共生型連続学習機である。
NeSyCは、様々なオープンドメイン環境における複雑なエンボディされたタスクの解決に非常に効果的である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:28:26 GMT)
AILS-NTUA at SemEval-2025 Task 8: Language-to-Code prompting and Error Fixing for Tabular Question Answering [5.1] 本稿では,SemEval-2025 Task 8: Question Question Answering over Tabular Dataについて述べる。
このタスクは、DataBenchデータセットに基づいて評価され、構造化データに対する自然言語の質問に答えるLarge Language Modelsの機能を評価する。
自然言語クエリを実行可能なコードに変換するために,LLMを効果的に活用するシステムを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:33:10 GMT)
Sustainable transparency in Recommender Systems: Bayesian Ranking of Images for Explainability [5.1] 本稿では,ベイジアンペアワイドランキングを利用してトレーニングプロセスを強化する新しいモデルBRIEを提案する。
BRIEは6つの実世界のデータセットにおいて、最先端のモデルよりも一貫して優れています。
モデルサイズを最大64倍に削減し、CO2排出量を最大75%削減する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:31:27 GMT)
METDrive: Multi-modal End-to-end Autonomous Driving with Temporal Guidance [5.1] 我々は,ego状態の組込み時系列特徴から時間的ガイダンスを利用する,エンド・ツー・エンドのMETDriveを紹介する。
CARLAのリーダボードベンチマークでMETDriveを評価し,運転スコア70%,経路完了スコア94%,屈折スコア0.78を得た。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:31:10 GMT)
Quantum Turbulence Across Dimensions: Crossover from two- to three-dimension [4.9] 本研究では,量子乱流(QT)のポテンシャル場における動的遷移について検討する。
この遷移はケルビン波の励起と密接に関連している。
遷移領域では、崩壊速度と渦クラスター相関関数の連続的な変動を観測する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:54:11 GMT)
Multi-Knowledge-oriented Nighttime Haze Imaging Enhancer for Vision-driven Intelligent Systems [4.7] ヘイズなどの逆画像条件は、画質を著しく劣化させる。
マルチタスク指向型夜間ヘイズイメージングエンハンサー(MToIE)を提案する。
MToIEは、昼間の脱毛、低照度強化、夜間の脱毛という3つのタスクを取り入れている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:56:46 GMT)
Mining Q&A Platforms for Empirical Evidence on Quantum Software Programming [4.7] この研究は、Stack Exchangeプラットフォームからの6,935の量子ソフトウェアプログラミングに関する議論の投稿を分析した。
物理理論や数学的基礎など、20のトピックが特定された。
量子プログラミングをサポートする9つのフレームワークを特定し、Qiskitが最も広く採用されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:43:23 GMT)
Evaluating Local and Cloud-Based Large Language Models for Simulating Consumer Choices in Energy Stated Preference Surveys [4.7] 本研究では、エネルギー関連SPサーベイにおける消費者選択をシミュレートする大規模言語モデルの能力について検討する。
その結果, LLMの平均精度は48%まで向上するが, 実用化には不十分であることが示唆された。
従来のSP選択が最も効果的な入力因子であるのに対して、因子の異なる長いプロンプトは精度を低下させる可能性がある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:37:31 GMT)
Fairness-Aware Low-Rank Adaptation Under Demographic Privacy Constraints [4.6] 事前訓練された基礎モデルはローランド適応(LoRA)を用いて特定のタスクに適応することができる
既存のフェアネスを意識した微調整手法は、機密属性や予測器への直接アクセスに依存している。
分散方式でトレーニング可能なLoRAベースの微調整手法のセットを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:49:57 GMT)
Computable entanglement cost under positive partial transpose operations [4.6] 我々は、量子演算の下でノイズの多い量子状態を作成する際の絡み合いコストを計算する問題を考える。
我々の知る限り、閉形式の公式が得られていないにもかかわらず、絡み合いの測度が効率的に計算可能であることを示すのはこれが初めてである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:00:16 GMT)
AI, Meet Human: Learning Paradigms for Hybrid Decision Making Systems [4.6] 人間は現在、機械学習ベースのシステムと常に対話し、毎日モデルをトレーニングし、使用しています。
コンピュータサイエンス文学におけるいくつかの異なる技術は、人間の機械学習システムとの相互作用を説明するが、その分類は小さく、目的は様々である。
本調査では,現代コンピュータ科学文献が人間と機械の相互作用をどのようにモデル化しているかを理解するための概念的および技術的枠組みを提供するハイブリッド意思決定システムの分類法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:20:58 GMT)
Personalized Federated Learning via Learning Dynamic Graphs [4.6] グラフ注意ネットワークを用いた個人化フェデレーション学習(pFedGAT)を提案する。
pFedGATは、クライアント間の潜伏グラフ構造をキャプチャし、クライアントごとに他のクライアントの重要性を動的に決定し、集約プロセスのきめ細かい制御を可能にする。
pFedGATを複数のデータ分散シナリオで評価し、3つのデータセット上でのアートメソッドの12の状態と比較した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:47:03 GMT)
Bridging Text and Vision: A Multi-View Text-Vision Registration Approach for Cross-Modal Place Recognition [4.6] 位置認識タスクのためのテキストビジョン登録手法であるText4VPRを提案する。
Text4VPRは、画像のデータベースにマッチするテキスト記述のみを利用する。
私たちが作成したVPRデータセットをイメージする最初のテキストであるStreet360Locでは、Text4VPRが堅牢なベースラインを構築し、トップ1の精度が57%、トップ10の精度がテストセットの半径5m以内で92%に達した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:30:18 GMT)
Dialogue Ontology Relation Extraction via Constrained Chain-of-Thought Decoding [4.5] 本研究では,伝達学習における関係抽出に焦点をあてる。
我々は最近、推論問題のために開発されたChain-of-Thoughtデコーディングを生成的関係抽出に適用した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:12:17 GMT)
Multi Agent based Medical Assistant for Edge Devices [4.5] 大規模アクションモデル(LAM)はインテリジェントな自動化に革命をもたらしたが、プライバシの懸念やレイテンシ、インターネットアクセスへの依存といった問題に直面している。
このレポートでは、これらの制限を克服する、オンデバイスでマルチエージェントなヘルスケアアシスタントを紹介します。
提案システムは、予約予約、健康モニタリング、薬物リマインダー、および毎日の健康レポートといった機能を備えた、医療ニーズに対するワンストップソリューションとして機能する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:20:12 GMT)
Self-Modeling Robots by Photographing [4.5] 本稿では,ロボットの自己モデリングのための高品質,テクスチャ認識,リンクレベル手法を提案する。
我々は3Dガウスアンを用いて、ロボットの静的形態とテクスチャを表現し、3Dガウスアンをクラスタリングして神経楕円体骨を構築する。
関節角度でキネマティックニューラルネットワークを入力することにより,ロボットの形態,運動学,テクスチャをリンクレベルで記述することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:21:18 GMT)
TPU-Gen: LLM-Driven Custom Tensor Processing Unit Generator [4.5] 本稿では,TPU生成プロセスの正確かつ近似的な自動化を目的とした,LLM(Large Language Model)ベースのフレームワークであるTPU-Genを紹介する。
TPU-Genは、広範囲の空間配列設計と近似乗算および累積単位をカバーする、厳密にキュレートされ、包括的でオープンソースのデータセットでサポートされている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:41:42 GMT)
FMT:A Multimodal Pneumonia Detection Model Based on Stacking MOE Framework [4.4] 共同表現学習にResNet-50とBERTを用いたフレキシブルマルチモーダルトランス (FMT) を提案する。
マルチモーダル肺炎データセットを用いて評価した結果,94%の精度,95%のリコール,93%のF1スコアが得られた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:52:12 GMT)
Evaluating Human-AI Collaboration: A Review and Methodological Framework [4.4] 人間-AIコラボレーション(Human-AI Collaboration、HAIC)として知られる個人との作業環境における人工知能(AI)の利用が不可欠である。
HAICの有効性を評価することは、関連するコンポーネントの複雑な相互作用のため、依然として困難である。
本稿では,既存のHAIC評価手法を詳細に分析し,これらのシステムをより効果的に評価するための新しいパラダイムを開発する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:27:00 GMT)
Preempting Text Sanitization Utility in Resource-Constrained Privacy-Preserving LLM Interactions [4.4] 本稿では,大規模言語モデルに送信される前に,与えられた衛生的プロンプトの有用性を予測するアーキテクチャを提案する。
我々のアーキテクチャは、最大12%のプロンプトでそのようなリソースの無駄を防ぐのに役立ちます。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:39:05 GMT)
MVCTrack: Boosting 3D Point Cloud Tracking via Multimodal-Guided Virtual Cues [4.3] 3Dオブジェクトトラッキングは、自律走行とロボット工学において不可欠である。
既存の方法は、しばしばスパースと不完全なポイントクラウドのシナリオで苦労する。
疎点雲を豊かにする仮想キューを生成するマルチモーダル誘導仮想キュー投影方式を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:21:17 GMT)
ConSinger: Efficient High-Fidelity Singing Voice Generation with Minimal Steps [4.3] 最小ステップで高忠実度な歌声合成を実現するために,一貫性モデルであるConSingerに基づく歌声合成手法を提案する。
実験の結果,ConSingerは生成速度と品質の点で,ベースラインモデルと非常に競合していることがわかった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:13:07 GMT)
Self-Supervised Penalty-Based Learning for Robust Constrained Optimization [4.3] 本稿では,自己教師付きペナルティに基づく損失関数を用いた学習に基づいて,パラメータ化制約付きロバスト最適化のための新しい手法を提案する。
我々のアプローチは、従来の解法よりも推論時間がかなり小さいニューラルネットワーク近似を効果的に学習することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:42:17 GMT)
TomatoScanner: phenotyping tomato fruit based on only RGB image [4.2] トマトの温室では、表現型測定は、研究者や農家が作物の生育を監視する上で有意義である。
いくつかの研究では、手動表現の代替としてコンピュータビジョンに基づく手法が研究されている。
本稿では,RGB画像が入力に必要なすべてである非接触トマト果実表現法であるTomatoScannerを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:47:48 GMT)
On Forecast Stability [4.1] 垂直安定性と水平安定性と呼ばれる2種類の予測安定性について検討する。
本稿では,任意のベースモデルが提供する予測を垂直・水平に安定化するために,線形補間に基づく簡単な手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:58:06 GMT)
Narrating the Video: Boosting Text-Video Retrieval via Comprehensive Utilization of Frame-Level Captions [4.0] 本稿では,フレームレベルの字幕から得られる包括的情報を戦略的に活用するナレーション・ザ・ビデオ(NarVid)を提案する。
提案したNarVidは,ナレーションを複数の方法で活用する。1)ナレーションとビデオ間の相互モーダルな相互作用による機能強化,2)無関係あるいは不正な情報を抑制するためのクエリ対応適応フィルタリング,3)クエリ-動画類似度とクエリ-ナレーション類似度を付加したデュアルモーダルマッチングスコア。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:15:06 GMT)
Coreference as an indicator of context scope in multimodal narrative [3.9] 本研究は,多モーダル言語モデルが中心的表現の分布において人間と大きく異なることを示す。
本稿では,人文と機械文の両文中核パターンの特徴を定量化する指標について紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:23:22 GMT)
Compare Similarities Between DNA Sequences Using Permutation-Invariant Quantum Kernel [3.9] そこで本研究では,DNA比較に特化して設計された置換不変変分量子カーネル法を提案する。
量子カーネルモデルで使用される新しい符号化手法とパラメータ化層は、ペアワイズDNA配列比較タスクの対称特性を効果的に捉えることができることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:35:38 GMT)
BayesFLo: Bayesian fault localization of complex software systems [3.9] ソフトウェアテストの主要なステップは障害のローカライゼーションである。
既存のフォールトローカライゼーション手法には2つの重要な制限がある。
テストエンジニアのドメイン知識や構造知識は含まない。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:13:10 GMT)
Demystifying the Token Dynamics of Deep Selective State Space Models [3.8] SSM(Selective State Space Model)は、シーケンシャルなデータモデリングの有効性で有名になった。
その卓越した経験的性能にもかかわらず、深い選択性SSMに関する包括的な理論的理解はいまだ解明されていない。
本稿では,事前学習したマンバモデルにおけるトークンの動的特性について検討する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:54:48 GMT)
Decision-aware training of spatiotemporal forecasting models [3.8] 最高の到達率(BPR)と呼ばれるパフォーマンス指標は、モデルの推奨サイズのKサブセットを使用する影響を測定する。
本研究では,各地点における事象数を予測する確率モデルを用いて,各地点を数値的にランク付けする方法を示す。
我々は、オピオイドに関連する致命的な過剰摂取を公衆衛生のために軽減し、絶滅危惧種の野生生物を監視するという、2つの場所から場所へのアプローチを実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:49:55 GMT)
Mind the Gap: Detecting Black-box Adversarial Attacks in the Making through Query Update Analysis [3.8] アドリアックは機械学習(ML)モデルの整合性を損なう可能性がある。
本稿では,逆ノイズインスタンスが生成されているかどうかを検出するフレームワークを提案する。
適応攻撃を含む8つの最先端攻撃に対するアプローチを評価する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:47:08 GMT)
STGA: Selective-Training Gaussian Head Avatars [3.7] 動的ヘッドガウスの細部を強化するために,選択学習型ガウスヘッドアバター(STGA)を提案する。
それぞれのガウススプレートはFLAMEメッシュ内に埋め込まれ、ガウスモデルのメッシュベースのアニメーションを実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:37:34 GMT)
LLM-based Iterative Approach to Metamodeling in Automotive [3.7] 本稿では,Large Language Model (LLM) を利用したドメイン固有メタモデル構築の自動化手法を提案する。
プロトタイプはPythonプログラミング言語を使用してWebサービスとして実装され、OpenAIのGPT-4oは基盤となるLLMとして使用された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:19:17 GMT)
Wasserstein Adaptive Value Estimation for Actor-Critic Reinforcement Learning [3.7] We present Wasserstein Adaptive Value Estimation for Actor-Critic (WAVE)
WAVEは、適応的に重み付けされたワッサースタイン正規化項を批評家の損失関数に組み込むことにより、アクター批判アルゴリズムの固有の不安定性に対処する。
WAVEが平均二乗誤差に対して$mathcalOleft(frac1kright)$収束率を達成できることを証明し、ワッサーシュタインに基づく正則化による安定性の理論的保証を提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:35:41 GMT)
SplatPose: Geometry-Aware 6-DoF Pose Estimation from Single RGB Image via 3D Gaussian Splatting [3.7] SplatPoseは3次元ガウススティング(3DGS)を2分岐ニューラルアーキテクチャで合成し,高精度なポーズ推定を実現する新しいフレームワークである。
3つのベンチマークデータセットの実験では、SplatPoseが最先端の6-DoFを1つのRGB設定で推定精度で達成していることが示されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:40:06 GMT)
Revitalizing Saturated Benchmarks: A Weighted Metric Approach for Differentiating Large Language Model Performance [3.7] 既存のベンチマークは飽和しており、データ汚染などの要因によりモデルパフォーマンスの分離に苦慮している。
本稿では,モデル分離の強化によってベンチマークを活性化する新しい重み付き計量である拡張モデル微分メトリックを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:25:09 GMT)
Optimal sensor deception in stochastic environments with partial observability to mislead a robot to a decoy goal [3.6] そこで本研究では,ロボットをデコイ目標に向けて誤認することを目的とした偽装問題を提案する。
我々は,ロボットがデコイゴールに達する確率を最大化するセンサ修正を計算する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:57:27 GMT)
LRSAA: Large-scale Remote Sensing Image Target Recognition and Automatic Annotation [3.6] LRSAAと呼ばれる大面積リモートセンシング画像におけるオブジェクト認識と自動ラベリングの手法を提案する。
YOLOv11とMobileNetV3-SSDオブジェクト検出アルゴリズムをアンサンブル学習により統合し,モデル性能を向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:49:23 GMT)
Safe and Efficient Online Convex Optimization with Linear Budget Constraints and Partial Feedback [3.6] 本稿では,未知の線形予算制約を伴うオンライン凸最適化について検討する。
本稿では,安全かつ効率的なLyapunov-Optimizationアルゴリズム(SELO)を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:39:01 GMT)
MastermindEval: A Simple But Scalable Reasoning Benchmark [3.6] MastermindEvalは、ボードゲームMastermindにインスパイアされたシンプルでスケーラブルで解釈可能な推論ベンチマークである。
本ベンチマークでは,(1) エージェント評価,(2) モデルが自律的にプレイするエージェント評価,(2) モデルが1つの有効なコードしか推論できないプリプレイされたゲーム状態を与える演目推論評価という2つの評価パラダイムをサポートする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:24:59 GMT)
Speculative MoE: Communication Efficient Parallel MoE Inference with Speculative Token and Expert Pre-scheduling [3.5] MoE(Mixture of Experts)は、現代のトランスフォーマーベースのLLM(Large Language Models)を前例のない規模に拡張可能なニューラルネットワークとして普及している。
最先端のMoE推論フレームワークであるDeepSpeed-MoEは、EP(Expert Parallelism)、TP(Tensor Parallel)、DP(Data Parallelism)を含む3D並列パラダイムを採用している。
本研究の目的は,EPの通信オーバヘッドをSpeculative MoEという技術で戦略的に削減し,DeepSpeed-MoEを向上することである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:41:53 GMT)
Multi-Robot Collaboration through Reinforcement Learning and Abstract Simulation [3.5] マルチエージェント強化学習において,いわゆる抽象シミュレータが利用できる範囲について検討する。
抽象シミュレーターは、ロボットの目標タスクを高レベルの抽象化でモデル化し、最適な意思決定に影響を与える可能性のある世界の多くの詳細を破棄する。
ポリシーは抽象シミュレーターで訓練され、個別に保持された低レベル知覚とモーションコントロールモジュールを用いて物理ロボットに転送される。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:23:24 GMT)
Stabilizer Entanglement Distillation and Efficient Fault-Tolerant Encoders [3.5] 絡み合いは量子情報処理には不可欠であるが、ノイズによって制限される。
我々は,いくつかの進歩を伴う高収率エンタングルメント蒸留プロトコルを開発した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:38:38 GMT)
Generation of Frequency-Tunable Shaped Single Microwave Photons Using a Fixed-Frequency Superconducting Qubit [3.5] 超伝導量子コンピュータをスケールアップするには リモートチップ間の量子通信が必要です
高忠実性通信を実現するためには、マイクロ波光子の周波数と時間形状を制御することが不可欠である。
周波数可変回路素子を使わずに周波数可変形マイクロ波光子の発生を実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:03:33 GMT)
Test Case Generation for Dialogflow Task-Based Chatbots [3.5] Test Generator (CTG) はタスクベースのチャットボット向けに設計された自動テスト技術である。
我々はCTGと最先端のBOTiumおよびCHARMツールの比較実験を行った。
CTGは、堅牢性と有効性という点でライバルより優れていた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:39:27 GMT)
ColFigPhotoAttnNet: Reliable Finger Photo Presentation Attack Detection Leveraging Window-Attention on Color Spaces [3.5] 指紋提示攻撃検出(PAD)は、スマートフォンデバイスのセキュリティを大幅に強化することができる。
PADは、特定のキャプチャデバイスによって取得された画像を操作するように設計されており、一般化の貧弱と堅牢性の欠如につながっている。
本稿では,カラーチャネルのウィンドウアテンションに基づいて設計したColFigPhotoAttnNetアーキテクチャについて紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:00:14 GMT)
EdgeMoE: Empowering Sparse Large Language Models on Mobile Devices [3.4] EdgeMoEは、Mix-of-expert (MoE) LLM用のオンデバイス推論エンジンである。
非専門家の重みはデバイスメモリに保持されるが、専門家の重みは外部ストレージに保持され、アクティベート時にのみメモリにフェッチされる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:16:40 GMT)
Physics-based machine learning framework for predicting NOx emissions from compression ignition engines using on-board diagnostics data [3.4] 本研究は, 圧縮着火エンジン駆動車から排出される窒素(NOx)の酸化物を予測・解析する物理ベースの機械学習フレームワークを提案する。
エンジン燃焼室内のNOx生成は、データ収集速度よりもはるかに短い時間スケールで発生する複雑なプロセスによって制御されるため、オンボード診断データセットからの正確なNOx予測は困難である。
遺伝的アルゴリズムやニューラルネットワークのようなブラックボックスモデルはより正確だが、解釈性は低い。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:11:23 GMT)
Decadal analysis of sea surface temperature patterns, climatology, and anomalies in temperate coastal waters with Landsat-8 TIRS observations [3.4] 本研究は、TIRSセンサからのSST検索のための運用手法を開発する。
そこで本研究では,SSTの異常な事象を検出するベースラインとして機能する,日々のSST気候学を確立するための新しいアルゴリズムを提案する。
提案手法を南オーストラリアの沿岸海域に2014年から2023年までの10年間適用した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:50:30 GMT)
DIMSUM: Discourse in Mathematical Reasoning as a Supervision Module [3.3] より少ないデータや劣るトレーニング理由を持つモデルを支援するための新しい情報ソース、談話構造を導入する。
Llama2 13bのようなモデルでは,談話構造が最大160%向上することを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:19:07 GMT)
Deep Sequence Models for Predicting Average Shear Wave Velocity from Strong Motion Records [3.2] 本研究では,地下30mにおける時間平均せん断波速度の予測にディープラーニングを用いることを検討した。
畳み込みニューラルネットワーク(CNN)と長期記憶(LSTM)を組み合わせたハイブリッドディープラーニングモデルを用いる。
その結果, ハイブリッド手法は地震波信号の複雑な非線形関係を効果的に学習することが示唆された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:22:50 GMT)
No Free Labels: Limitations of LLM-as-a-Judge Without Human Grounding [3.2] 我々はLLM審査員が会話質問に対する応答が正しいかどうかを評価できるかどうかを評価する。
この分析のために作成された、既存のデータセットと、新しい挑戦的ベンチマーク(BFF-Bench)の組み合わせから、質問を引用する。
より高品質な基準を持つ弱い審査員を提供することは、より強い審査員よりも人間のアノテータとよりよく一致していることが示される。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:42:08 GMT)
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation [3.1] 本研究では, 固定翼無人航空機(UAV)の耐故障性制御のための変圧器を用いたアプローチを提案する。
提案手法は,変換器の学習機構と注意機構を用いて,外部ループ参照値を制御コマンドに直接マッピングする。
実験結果から, トランスフォーマーをベースとした制御器は, 業界標準SFSおよび最先端強化学習法(RL)よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:28:13 GMT)
Familiarity: Better Evaluation of Zero-Shot Named Entity Recognition by Quantifying Label Shifts in Synthetic Training Data [3.1] ゼロショットNERに対して報告されたF1スコアは、これらのアプローチの真の能力を過大評価している。
本稿では,学習と評価におけるエンティティタイプ間のセマンティックな類似性の両方をキャプチャする,ファミリアリティ(Familiarity)を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:54:22 GMT)
Roq: Robust Query Optimization Based on a Risk-aware Learned Cost Model [3.1] 本稿ではリスクを意識した学習アプローチに基づく総合的なフレームワークRoqを提案する。
Roqには、クエリ最適化の文脈におけるロバストネスの概念の新たな形式化が含まれている。
また、クエリ計画の評価と選択のための新しい戦略とアルゴリズムも含まれている。
我々は、Roqが、最先端技術と比較して、堅牢なクエリ最適化において大幅に改善されていることを実証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:02:21 GMT)
ZOGRASCOPE: A New Benchmark for Property Graphs [3.1] 本稿では,暗号クエリ言語用に設計されたベンチマークであるZOGRASCOPEを紹介する。
グラフのセマンティック解析は, LLM を単体で行うだけでは解けない, 難解なオープンな問題であることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:33:30 GMT)
Quantum decoherence of nitrogen-vacancy spin ensembles in a nitrogen spin bath in diamond under dynamical decoupling [3.1] ダイヤモンド中の負電荷窒素空孔(NV)中心は量子技術応用のための主要な量子ビットプラットフォームとして出現している。
NVベースの量子応用の鍵となる課題の1つは、そのデコヒーレンス特性とその量子的性質を予測するための正確なモデルを構築することである。
本研究では,窒素ドナー浴の存在下でのNV脱コヒーレンスダイナミクスを考察するために理論と実験を組み合わせる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:27:27 GMT)
Additive Model Boosting: New Insights and Path(ologie)s [3.0] 我々は,BAMの解経路について検討し,特定の問題に対する他のアプローチとの接続を確立する。
BAMの新たな収束結果が導出され,本手法の内部動作に関する重要な知見が得られた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:04:34 GMT)
Static Program Analysis Guided LLM Based Unit Test Generation [3.0] 大規模言語モデル(LLM)を用いたJavaメソッドの単体テスト生成を自動化する新しい手法について述べる。
そこで本研究では,プログラム解析で得られたエンハンス・アンハンス・コンテクスト情報を用いた拡張プロンプトにより,LLMによる単体テストコード生成の有効性が向上することを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:09:37 GMT)
Positive-Unlabelled Learning for identifying new candidate Dietary Restriction-related genes among Ageing-related genes [3.0] 食事制限(英: Dietary Restriction, DR)は、最も人気のある避妊薬の1つである。
近年、老化関連遺伝子中のDR関連遺伝子を同定するために機械学習が研究されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:25:03 GMT)
Attention Mechanism based Cognition-level Scene Understanding [3.0] Visual Commonsense Reasoning (VCR)モデルは、現実の世界からの推論能力を必要とする、対応する理論的根拠による回答を予測することができる。
VCRタスクを解くための従来のアプローチは、一般的に、長い依存性関係の符号化されたモデルによるメモリの事前トレーニングや利用に頼っている。
本稿では,視覚的テクスト情報を効率的に融合し,セマンティック情報を並列に符号化し,認知レベルの推論のためのリッチな情報を取得するための並列注意型認知VCRネットワークPAVCRを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:28:52 GMT)
SINdex: Semantic INconsistency Index for Hallucination Detection in LLMs [2.8] 大規模言語モデル(LLM)は、さまざまなドメインにまたがってデプロイされる傾向にあるが、事実的に誤った出力を生成する傾向にある。
自動幻覚検出のための新しい,スケーラブルな不確実性に基づくセマンティッククラスタリングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:25:19 GMT)
Jailbreaking is (Mostly) Simpler Than You Think [2.7] 我々は、AIの安全性メカニズムをバイパスする新しい最適化不要な手法であるContext Compliance Attack (CCA)を紹介する。
CCAは、多くのデプロイされたAIシステムに固有の基本的なアーキテクチャ上の脆弱性を利用する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:28:19 GMT)
A Hybrid SNN-ANN Network for Event-based Object Detection with Spatial and Temporal AttentionEfficient Event-Based Object Detection: A Hybrid Neural Network with Spatial and Temporal Attention [2.5] ニューロモルフィックハードウェア上でのスパイキングニューラルネットワーク(SNN)は、エネルギー効率と低レイテンシのイベントベースのデータ処理のためにしばしば考慮される。
本稿では、イベントベースオブジェクト検出のためのアテンションベースのHybrid SNN-ANNバックボーンを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:03:09 GMT)
AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models [2.5] AdEvalはデータ汚染が信頼性に与える影響を緩和することを目的とした動的データ評価手法である。
複数のデータセットに対する実験結果から、AdEvalはデータ汚染が評価結果に与える影響を効果的に低減することが示された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:02:42 GMT)
Exoplanet Transit Candidate Identification in TESS Full-Frame Images via a Transformer-Based Algorithm [2.4] 本稿では,位相折り畳みや周期性の仮定を必要とせず,太陽系外惑星のトランジット信号を同定する手法を提案する。
我々は、トランスフォーマーにインスパイアされた新しいニューラルネットワークを実装し、FFI(Full Frame Image)光曲線を直接処理し、外惑星のトランジットを検出する。
本モデルでは,122光度曲線,88光度,4光度を含む214個の新しい惑星系候補を同定した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:49:02 GMT)
Perceiving, Reasoning, Adapting: A Dual-Layer Framework for VLM-Guided Precision Robotic Manipulation [2.4] VLM(Vision-Language Models)は、ロボット操作において顕著な可能性を示す。
しかし、複雑な微調整タスクを高速かつ高精度で実行する際の課題は継続する。
本稿では,ロボットの高速かつ高精度かつ誤り訂正可能な微調整を可能にするプログレッシブVLM計画アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:55:42 GMT)
Long-Term Auto-Regressive Prediction using Lightweight AI Models: Adams-Bashforth Time Integration with Adaptive Multi-Step Rollout [2.4] 本研究では,科学的機械学習モデルにおける時間的自己回帰予測における誤り蓄積の課題に対処する。
本稿では,2段階のAdams-Bashforthスキームを適応させて,自己回帰モデルにおけるロバスト性を高めるための時間積分法を包括的に分析する。
我々は、トレーニング中に複数の将来のロールアウトタイムステップを組み込んだ多段階戦略により、時間的予測精度を向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:55:23 GMT)
Equivariant Neural Functional Networks for Transformers [2.4] 本稿では,トランスアーキテクチャのためのニューラルネットワーク(NFN)を体系的に検討する。
NFNは、ディープニューラルネットワーク(DNN)の重み、勾配、またはスパーシティパターンを入力データとして扱う特殊なニューラルネットワークである。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:32:12 GMT)
Exploring Robustness of Image Recognition Models on Hardware Accelerators [2.4] MutateNNは、画像認識モデルの堅牢性を調べるために、差分テストと突然変異テストの両方の要素を利用するツールである。
画像認識領域は、7つの確立されたDNNモデルに突然変異試験を適用し、6つの異なるカテゴリの21の突然変異を導入し、画像認識領域に焦点をあてる。
その結果, 層修飾, 算術型, 入力に関連する変異が全体のモデル性能(最大99.8%)に深刻な影響を及ぼすか, あるいはモデルクラッシュを引き起こした。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:28:28 GMT)
Benchmarking AI Models in Software Engineering: A Review, Search Tool, and Enhancement Protocol [2.4] 我々は173の研究をレビューし、204のAI4SEベンチマークを特定します。これらのベンチマークを分類し、それらの制限を分析し、プラクティスのギャップを明らかにする。
レビューに基づいて、関連するベンチマークを見つけるセマンティック検索ツールであるBenchScoutを開発した。
次に、HumanEval、HumanEvalPlus、HumanEvalNextの10つの最先端コード言語モデルを評価した。HumanEvalNextでは、HumanEvalとHumanEvalPlusと比較して、パス@1のスコアが31.22%、19.94%減少した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:44:32 GMT)
Rethinking Pre-Trained Feature Extractor Selection in Multiple Instance Learning for Whole Slide Image Classification [2.4] 複数インスタンス学習(MIL)は、パッチレベルのアノテーションを必要とせずに、ギガピクセル全体のスライド画像(WSI)分類に好まれる方法となっている。
本研究では,3次元のMIL特徴抽出器(事前学習データセット,バックボーンモデル,事前学習手法)を体系的に評価する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:46:48 GMT)
Attenuation artifact detection and severity classification in intracoronary OCT using mixed image representations [2.3] 本稿では, 減衰線(A線)を3つのクラスに分類する畳み込みニューラルネットワークを提案する。
本手法は, 軽度および重度の加工品に対して, OCTフレームのFスコア0.77, 0.94に達する減衰アーティファクトの存在を検知する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:01:00 GMT)
Exploring FMCW Radars and Feature Maps for Activity Recognition: A Benchmark Study [2.3] 本研究では、人間の活動認識のための周波数変調連続波レーダに基づくフレームワークを提案する。
特徴写像を画像として処理する従来の手法とは異なり、本研究では多次元特徴写像をデータベクトルとして与える。
ConvLSTMモデルは従来の機械学習およびディープラーニングモデルよりも優れ、精度は90.51%に達した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:53:29 GMT)
Towards Understanding the Use of MLLM-Enabled Applications for Visual Interpretation by Blind and Low Vision People [2.2] マルチモーダル大言語モデル (MLLM) は視覚解釈アプリケーションに統合されている。
20名のBlind and Low Vision (BLV) 者がMLLM対応視覚解釈アプリケーションを用いた2週間の日記調査を行った。
参加者はアプリケーションの視覚的解釈を信頼でき満足できるものとみなした。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:38:14 GMT)
Guaranteeing Out-Of-Distribution Detection in Deep RL via Transition Estimation [2.1] 訓練環境は実生活環境を反映しない。
訓練システムは、訓練されたシステムが認識できない状態や不確実性を示す状態に遭遇した場合に警告を発するアウト・オブ・ディストリビューション検出器を備えていることが多い。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:40:41 GMT)
Rethinking AI Cultural Alignment [1.8] 人間の文化的価値は、特定のAIシステムのコンテキスト内で理解されなければならないことを示す。
文化的アライメントは双方向のプロセスとして再編成されるべきである、と私たちは主張する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:15:07 GMT)
Grouped Sequential Optimization Strategy -- the Application of Hyperparameter Importance Assessment in Deep Learning [1.8] 我々は「逐次グループ」と呼ばれる新しいHPO戦略を実装している
実験は,6つの画像分類データセットで検証され,ハイパーパラメータ重要度評価(HIA)を組み込むことで,モデル性能を損なうことなくHPOを大幅に加速することを示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:01:00 GMT)
The Mathematical Construction of the BFV Scheme [1.7] BFVスキームは整数の同型加法および乗法のために設計されている。
BFVは正確な暗号化と復号化を保証する。
このチュートリアル記事は、BFVが数学的レベルからどのように機能するかを理解するのに役立つように設計されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:29:11 GMT)
Riemannian Metric Learning: Closer to You than You Imagine [1.7] レビューでは、重要なメソッド、アプリケーション、最近の進歩について、構造化され、アクセス可能な概要を提供している。
微分幾何学を利用して、基礎となるリーマン多様体に従ってデータをモデル化する強力な一般化を記述する。
このレビューは 研究者や実践者にとって 貴重な情報源になるべきだと論じています
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:00:29 GMT)
Direct Gradient Computation of Parameterized Quantum Circuits [1.7] ヴァレンプラトー現象は パラメタライズド量子回路が 消滅する場所です
ウィンガルテン式を用いて,バレン高原現象の解明を試みた。
我々の手法は、量子回路最適化を解析するためのより正確なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:06:04 GMT)
MOHPER: Multi-objective Hyperparameter Optimization Framework for E-commerce Retrieval System [1.6] MOHPERはeコマースサイトの多目的最適化フレームワークである。
クリックスルーレート(CTR)、クリックスルー変換レート(CTCVR)、関連する目的を共同で最適化する。
これは、ユーザの満足度と収益目標の両方に合わせたバランスの取れた最適化を達成する上で、その実用的効果を裏付けるものだ。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:25:08 GMT)
State-of-the-Art Stroke Lesion Segmentation at 1/1000th of Parameters [1.6] 本稿では,エンコーダ・デコーダ構造を持つ新しいマルチスケール拡張パターンを提案する。
われわれは、全脳MRI2563ドルで直接運用している。
結果は、MeshNetの効率と性能のバランスが強いことを検証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:58:36 GMT)
LoRACode: LoRA Adapters for Code Embeddings [1.6] コード検索のためのタスク固有アダプタを構築するために,ローランド適応(LoRA)に基づくパラメータ効率の微調整手法を提案する。
提案手法では,トレーニング可能なパラメータの数をベースモデルの2%未満に削減し,広範なコードコーパスを高速に微調整する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:50:45 GMT)
Exact discovery is polynomial for certain sparse causal Bayesian networks [1.5] 本稿では,ベイジアンネットワークの特性を用いて探索空間を熟成し,計算コストを下げる方法について述べる。
また、新しいパス検索と分断比較基準も含んでいます。
そして、我々のアプローチは低い密度で最先端の手法に勝る。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:52:03 GMT)
Fast Robust Kernel Regression through Sign Gradient Descent with Early Stopping [1.5] カーネルリッジ回帰(カーネルリッジ回帰、英: Kernel ridge regression、KRR)は、データにおいて非線形であるが、モデルパラメータでは線形である線形リッジ回帰の一般化である。
我々は、KRRの目的関数の等価性を導入し、リッジペナルティを$ell_infty$と$ell_1$ペナルティに置き換える。
提案手法は精度を損なうことなく, 桁違いに高速であることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:15:41 GMT)
A Survey on Web Testing: On the Rise of AI and Applications in Industry [1.5] 本稿では,2014年から2024年までのWebテスト方法論,ツール,トレンドに着目した系統的な文献調査を行う。
この結果から,Webテスト研究はICSTが中心となって活発に行われていることが示唆された。
セレニウムは最も広く使われている道具であるが、工業的採用や人的研究は比較的限られている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:39:59 GMT)
Quantum reinforcement learning in continuous action space [1.5] 本稿では,古典的および量子的順序決定問題の両方に効率よく対処する量子Deep Deterministic Policy Gradientアルゴリズムを提案する。
ワンタイム最適化は、任意の目標状態に固定初期状態を駆動するために必要な制御シーケンスを出力するモデルを生成する。
シミュレーションにより本手法の有効性を実証し,その量子制御への応用の可能性について論じる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:57:09 GMT)
Language modelling techniques for analysing the impact of human genetic variation [1.4] 本稿では,過去10年間の計算変量効果予測における言語モデルの利用について検討する。
自然言語の構造と遺伝的配列との本質的な類似性のため、自然言語処理技術は計算変量効果予測において大きな適用性を示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:34:17 GMT)
The Software Diversity Card: A Framework for Reporting Diversity in Software Projects [1.4] ソフトウェアプロジェクトの多様性に関連する側面を報告することは、ユーザの信頼を高め、規制当局が採用の可能性を評価するのに役立つ。
AI関連の最近の指令は、AI製品の開発において多様性情報を必要とし始めており、その中に公共規制機関の関心が高まっていることを示している。
この研究は、ソフトウェアプロジェクトの多様性に関連する側面を報告するための包括的なフレームワークであるSoftware Diversity Cardを紹介します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:43:06 GMT)
Universal Scalability in Declarative Program Analysis (with Choice-Based Combination Pruning) [1.4] 選択構成が述語の評価を柔軟に制限できる準ユニバーサル構成を示す。
我々はこの手法を、おそらく現存する最大の既存のデータログ分析フレームワークに適用する: Doop(Javaコード用)とGigahorseフレームワークからのメインクライアント分析。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:23:02 GMT)
NLP-enabled Trajectory Map-matching in Urban Road Networks using a Transformer-based Encoder-decoder [1.4] 本研究では,NLPにインスパイアされた機械翻訳としてタスクを定式化する,データ駆動型深層学習型マップマッチングフレームワークを提案する。
変圧器を用いたエンコーダ・デコーダモデルでは,ノイズの多いGPS点の文脈表現を学習し,軌道の挙動や道路構造をエンドツーエンドに推定する。
合成軌道実験により、この手法は文脈認識を統合することによって従来の手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:16:10 GMT)
SFO: Piloting VLM Feedback for Offline RL [1.4] VLM(Vision-Language Models)は、アクション条件のトレーニングデータがないため、制御タスクを解く能力に制限がある。
AIフィードバックからの強化学習における重要な課題は、VLM由来の信号を学習プロセスに統合する方法を決定することだ。
本稿では,人間のフィードバックに基づく手法から,より複雑な強化学習を達成し,よりシンプルで効果的なアプローチであるフィルタリングと重み付き行動クローニングを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:58:14 GMT)
Leveraging Approximate Caching for Faster Retrieval-Augmented Generation [1.3] Retrieval-augmented Generation (RAG)は、外部知識を統合することにより、大規模言語モデル(LLM)回答の信頼性を高める。
RAGは、大規模なベクトルデータベースから関連ドキュメントを探すのに計算コストがかかるため、エンドツーエンドの推論時間を増加させる。
本稿では,ユーザクエリの類似性を活用してRAGワークフローを最適化する,近似キー値キャッシュであるProximityを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:54:04 GMT)
ORANSight-2.0: Foundational LLMs for O-RAN [1.3] ORANSight-2.0 は Open Radio Access Networks (O-RAN) 用に設計された特別な基礎的 LLM の開発を目的とした先駆的イニシアチブである。
ORANSight-2.0のコアとなるRANSTRUCTは、RAG(Retrieval-Augmented Generation)ベースの命令チューニングフレームワークである。
評価の結果,ORANSight-2.0モデルはChatGPT-4oやGeminiなどの汎用およびクローズドソースモデルよりも,ORANBenchでは5.421%,srsRANBenchでは18.465%優れていた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:44:31 GMT)
Impoola: The Power of Average Pooling for Image-Based Deep Reinforcement Learning [1.3] 本論文では,Impala-CNNにおける出力特徴マップのフラット化をグローバル平均プールに置き換えることにより,顕著な性能向上が期待できることを示す。
ネットワークの翻訳感度の低下がこの改善の中心となるかもしれない。
この結果から,ネットワークのスケーリングはモデルサイズを増大させるだけでなく,ネットワーク設計の効率化も重要な要因であることが示唆された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:19:19 GMT)
LINGOLY-TOO: Disentangling Memorisation from Reasoning with Linguistic Templatisation and Orthographic Obfuscation [1.3] 本稿では,モデル性能推定における暗記の影響を低減する言語推論問題を生成するための枠組みを提案する。
このフレームワークを言語推論のための挑戦的なベンチマークであるlingOLY-TOOの開発に適用する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:31:42 GMT)
Cooperative squeezing of internal and collective spins in an atomic ensemble [1.2] スピンスクイージングは、異なる原子をアンサンブルに絡めるか、あるいは原子のマルチレベル内部スピン状態を制御することによって達成されている。
ここでは, 内部および集合的なスピンスクイーズを, $sim 1011$ rubidium 原子を用いた熱原子アンサンブルで実験的に実証した。
我々は6.21pm0.84$ dBのメロジカルなスピンスクイーズを達成しており、どちらの種類のスクイーズ単独で得られる結果よりも著しく優れている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:16:57 GMT)
CrystalGRW: Generative Modeling of Crystal Structures with Targeted Properties via Geodesic Random Walks [1.2] 本稿では,密度汎関数理論で検証された安定位相を予測できる拡散モデルであるCrystalGRWを紹介する。
CrystalGRWは、既存のモデルに匹敵する精度で基底状態に近い現実的な結晶構造を生成する能力を示す。
これらの特徴は、安定で対称性に富んだ結晶候補を実験的に検証することで、材料発見と逆設計を加速する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:55:40 GMT)
Improved Two-source Extractors against Quantum Side Information [1.2] ドディス等からの2ソース抽出器は,古典的領域と同様,量子側情報に対して等しく動作することを示す。
我々は、新しい量子XOR-Lemmaを導出し、一般的な還元を導出できると同時に、大規模な抽出器のクラスの改善も可能とした。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:49:55 GMT)
Is Long Context All You Need? Leveraging LLM's Extended Context for NL2SQL [1.2] 大きな言語モデル(LLM)は、さまざまな自然言語処理タスクにまたがる印象的な機能を示している。
この意味的曖昧な問題に対する一つのアプローチは、より十分な文脈情報を提供することである。
長いコンテキストLLMは堅牢であり、拡張されたコンテキスト情報では失われないことを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:17:42 GMT)
BuildingView: Constructing Urban Building Exteriors Databases with Street View Imagery and Multimodal Large Language Mode [1.1] ストリートビュー・イメージリーの進歩と、都市研究との統合によって、都市分析において、外部建設はますます重要になっている。
我々は,Googleストリートビューの高解像度視覚データをOpenStreetMapの空間情報とOverpass APIを介して統合する新しいアプローチであるBuildingViewを提案する。
本研究は,都市の建築外装データの精度を向上し,キーサステナビリティと設計指標を特定し,その抽出と分類のための枠組みを開発する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:06:50 GMT)
SAS: Segment Anything Small for Ultrasound -- A Non-Generative Data Augmentation Technique for Robust Deep Learning in Ultrasound Imaging [1.0] Segment Anything Small (SAS) は、シンプルだが効果的なスケールとテクスチャ対応のデータ拡張技術である。
SASは超音波画像中の小さな解剖構造をセグメント化するためのディープラーニングモデルの性能を向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:24:35 GMT)
SANDWiCH: Semantical Analysis of Neighbours for Disambiguating Words in Context ad Hoc [1.0] 我々は、多言語単語センス曖昧化(WSD)のための単純だが効率的なフレームワークを提案する。
提案手法は,グループ代数を用いてBabelNetから洗練されたセマンティックネットワーク上でのクラスタ識別解析としてWSDタスクを再構成する。
我々は複数のWSDベンチマークにまたがって方法論を検証し、言語やタスクの新たな状態を達成するとともに、音声による個々の評価を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:52:32 GMT)
Ontology Generation using Large Language Models [1.0] 本稿では, メモリレスCQbyCQとOntogeniaという, 自動オントロジー開発のための2つの新しいプロンプト技術を紹介し, 評価する。
OpenAI o1-preview with Ontogeniaはエンジニアの要求を満たすのに十分な品質を提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:03:28 GMT)
Less Quantum, More Advantage: An End-to-End Quantum Algorithm for the Jones Polynomial [1.0] 本稿では、雑音の多いディジタル量子コンピュータを用いて、理論上の有名な問題を解決するために、エンドツーエンドで再構成可能なアルゴリズムパイプラインを提案する。
ジョーンズ変量計算のための最先端のテンソルネットワークベースの古典的アルゴリズムを実装・ベンチマークする。
この研究で提供される実践的なツールは、正確な資源推定により、結び目理論における有意義な量子ネイティブ問題に対する短期的な量子優位性を特定できる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:50:48 GMT)
LiGT: Layout-infused Generative Transformer for Visual Question Answering on Vietnamese Receipts [1.0] 本稿ではベトナムにおける大規模な文書VQAデータセットであるReceiptVQA(textbfReceipt textbfVisual textbfQuestion textbfAnswering)について述べる。
データセットには textbf9,000+ のレシートイメージと textbf60,000+ の注釈付き質問応答ペアが含まれている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:11:10 GMT)
Massive Activations in Graph Neural Networks: Decoding Attention for Domain-Dependent Interpretability [0.9] エッジ機能グラフニューラルネットワーク(GNN)における注意層内のマスアクティブ(MA)の出現を示す。
本研究は,ZINC,TOX21,ProteINSなどのベンチマークデータセットを用いて,エッジ機能付き注目型GNNモデルの評価を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:17:02 GMT)
Efficient and Scalable Architectures for Multi-Level Superconducting Qubit Readout [0.9] 多くのプロセッサのモダリティは本質的にマルチレベルシステムであり、計算部分空間の外のエネルギーレベルに時々リークする。
本稿では,FPGAのリソース使用量をベースラインと比較して60ドル削減する,スケーラブルで高忠実な3レベルリードアウトを提案する。
我々の設計では、オフザシェルのFPGA上での効率的なリアルタイム実装をサポートし、ベースラインよりも6.6%の読み出し精度の向上を実現している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:25:33 GMT)
A Novel Hybrid Approach to Contraceptive Demand Forecasting: Integrating Point Predictions with Probabilistic Distributions [0.9] 我々は,ドメイン固有モデルからの点予測と統計的および機械学習アプローチからの確率分布を組み合わせたハイブリッドモデルを開発した。
このアプローチは需要の不確実性に対処し、特にリソース制限された設定で有用である。
我々の研究は、避妊需要予測のギャップを埋め、アルゴリズムと人間の専門知識を組み合わせた実践的な枠組みを提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:32:04 GMT)
Fake It To Make It: Virtual Multiviews to Enhance Monocular Indoor Semantic Scene Completion [0.9] Indoor Semantic Scene Completionは、屋内シーンの単一のRGB画像から3Dセマンティック占有マップを再構築することを目的としている。
我々は、新しいビュー合成とマルチビュー融合を活用する革新的なアプローチを導入する。
我々は、NYUv2データセット上の既存のSSCネットワークと統合した場合、Scene Completionの最大2.8%、Semantic Scene Completionの4.9%のIoUスコアの改善を実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:09:38 GMT)
Complete Characterization of Statistical Constraints in Local Realism and Quantum Mechanics via a Unified Geometric Framework [0.8] 本稿では,局所現実論と量子力学の両方において,統計的制約を特徴付ける統一的な枠組みを提案する。
我々は、与えられた相関制約を満たす量子状態の存在に必要な十分条件を確立する一般的な不等式を導出する。
この結果は、Tsirel'sonの不等式やTsirel'son--Landauの不等式のような、既知の制約を強化する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:45:56 GMT)
Extended Controllability Tests for Quantum Decoherence-Free Subspaces [0.8] オープン量子系のデコヒーレンスフリー部分空間に埋め込まれたサブシステムの制御性に関する2つの公理的テストを開発した。
テストはリンドブラディアンモデルのクラスをターゲットにしており、システムハミルトニアンやノイズ作用素において特定の構造、規則性、対称性を必要としない。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:28:36 GMT)
Conformal Prediction for Image Segmentation Using Morphological Prediction Sets [0.8] 本稿では,二項分割に着目し,共形予測を用いてこれらの課題に対処する。
我々のアプローチは、トレーニング中に使われていないキャリブレーションデータに基づいて、予測残差の型である非整合性スコアを計算することである。
医療画像の応用について検討する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:42:30 GMT)
Deep Muscle EMG construction using A Physics-Integrated Deep Learning approach [0.7] 物理インフォームドとデータ駆動型ディープラーニングを統合したハイブリッドディープラーニングアルゴリズム,すなわちニューラル筋骨格モデル(NMM)を提案する。
データ駆動モデリングは、欠落したEMG信号を予測するのに使用されるが、物理に基づくモデリングは、対象固有の情報を予測にエングレーブする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:46:26 GMT)
DETQUS: Decomposition-Enhanced Transformers for QUery-focused Summarization [0.7] 要約精度の向上を目的としたDETQUS(Decomposition-Enhanced Transformer for QUery- Focus Summarization)を導入する。
テーブルサイズを削減し、重要な情報を保持しながら、クエリ関連列のみを保持するために、大きな言語モデルを使用します。
提案手法はテーブルベースQAモデルOmnitabを用いて,ROUGE-Lスコア0.4437を達成し,従来の最先端REFACTORモデル(ROUGE-L: 0.422)を上回った。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:11:35 GMT)
The Unified Control Framework: Establishing a Common Foundation for Enterprise AI Governance, Risk Management and Regulatory Compliance [0.7] リスク管理と規制コンプライアンスを統合した総合的なガバナンスアプローチを,統一されたコントロールセットを通じて提案する。
UCFは、包括的リスク分類、構造化されたポリシー要件、42の統括的なコントロールからなる3つの重要なコンポーネントで構成されている。
UCFをコロラドAI法にマッピングすることで検証し、我々のアプローチがいかに効率的で適応可能なガバナンスを可能にするかを実証します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:14:49 GMT)
Statistical Scenario Modelling and Lookalike Distributions for Multi-Variate AI Risk [0.7] シナリオモデリングがAIリスクを全体論的にモデル化する方法について説明する。
直接観測可能なデータがない場合にAIの影響を推定するために、AIに類似した現象からの見た目上の分布がどのように使用できるかを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:55:05 GMT)
Bridging the Semantic Gap in Virtual Machine Introspection and Forensic Memory Analysis [0.6] セマンティックギャップ(Semantic Gap)とは、特定のツールや専門知識を使わずに生のメモリデータを解釈することの難しさである。
先進的な知識,メタデータ,エンジニアリング機能がVMIやFMAにどのように役立つかを検討する。
提案手法は,F1スコアを80%以上獲得することで,メタデータの充実によってパフォーマンスが向上することを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:51:32 GMT)
RowDetr: End-to-End Row Detection Using Polynomials [0.6] 堅牢で効率的な行検出のために、新しいエンドツーエンドニューラルネットワークアーキテクチャであるRowDetrが導入されている。
約6900枚の画像からなる新しいデータセットがキュレーションされ、さまざまな現実世界の農業条件を捉えている。
重要なイノベーションはPolyLossである。これは、ノイズや不完全なラベルが存在する場合でも、学習を強化するために設計された新しいエネルギーベースの損失関数である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:00:57 GMT)
Controlization Schemes Based on Orthogonal Arrays [0.6] 制御は、最近、未知のハミルトン力学を変換するための量子アルゴリズムで使われている。
未知の2-局所ハミルトニアンに対する直交配列の助けを借りて、より効率的な制御スキームを構築することができることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:44:12 GMT)
Wyckoff Transformer: Generation of Symmetric Crystals [0.6] 内部対称性は、物理的、化学的、電子的性質を決定する上で基本的な役割を果たす。
空間群対称性に基づく材料生成モデルWyFormerを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:46:34 GMT)
Disconnect to Connect: A Data Augmentation Method for Improving Topology Accuracy in Image Segmentation [0.5] ディープニューラルネットワークは個々のピクセルを分類し、小さな誤分類でさえ、これらの構造内の細い接続を壊す可能性がある。
トポロジ損失関数のような既存のトポロジ精度向上手法は、非常に正確で、トポロジ的に正確なトレーニングラベルに依存している。
我々は、データ拡張戦略であるCoLeTraを紹介します。これは、壊れているように見える構造が実際に接続されているという以前の知識をモデルに統合するものです。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:11:55 GMT)
Subspace-thermal discrete time crystals from phase transitions between different n-tuple discrete time crystals [0.5] 駆動周期の任意の倍数に対応する新しいフロケット時間結晶モデルを提案する。
これらの周期の異なる時間結晶間の遷移は、サブスペース-熱的離散時間結晶と呼ばれる新しい物質相をもたらす。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:58:36 GMT)
Llamarine: Open-source Maritime Industry-specific Large Language Model [0.4] Llamarineは,海洋航法に特化して設計された,最初のオープンソースのLarge Language Model (LLM) である。
Llamarine 1.0は、海事教科書、研究出版物、ウィキペディアのウェブテキストを含む高品質なコーパスの訓練と微調整を継続して開発されている。
主な貢献は、(a)権威源からの総合的な海洋データセットのキュレーション、モデルの知識ベースにおける深度と信頼性を確保すること、(b)汎用LSMよりも高精度で複雑な航法課題を推論できる基礎モデルの開発、(c)ベンチマークの作成である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:12:14 GMT)
PromptPex: Automatic Test Generation for Language Model Prompts [0.4] 大規模言語モデル(LLM)は多くのアプリケーションで使われている。
プロンプトは、入力を受け取り、出力を生成し、特定の機能を実行するという、従来のソフトウェアのように振る舞う。
しかし、プロンプトは多くの点で従来のコードと異なり、堅牢であることを保証するために新しいアプローチが必要である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:31:03 GMT)
A Bot-based Approach to Manage Codes of Conduct in Open-Source Projects [0.3] 本稿では,コントリビュータ契約に基づくOSSプロジェクトの行動規範を効果的に管理する手法を提案する。
私たちのソリューションはボットベースのソリューションとして実装されており、ボットは行動規範の定義、OSSプロジェクトの監視、倫理的ルールの実施に役立ちます。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:50:02 GMT)
Operationalizing Cybersecurity Knowledge: Design, Implementation & Evaluation of a Knowledge Management System for CACAO Playbooks [0.3] サイバーセキュリティのプレイブックは 重要な手段だ 構造化され 再利用可能な インシデント対応への アプローチを継続的に改善する
新たなコラボレーティブ・オートマチック・コース・オブ・アクション・オペレーション(CACAO)標準は、サイバーセキュリティのプレイブックのための一般的なマシン処理可能なスキーマを定義している。
本稿では,CACAOのサイバーセキュリティプレイブックを管理するための知識管理システム(KMS)の設計,開発,評価について述べる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:54:43 GMT)
Exact steady state of quantum van der Pol oscillator: critical phenomena and enhanced metrology [0.3] 定常状態特性の急激な変化を伴う散逸相転移に対応する閾値を示す。
臨界挙動と有限サイズ効果は解析的定常状態を通して研究される。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 07:48:29 GMT)
Visual Cues of Gender and Race are Associated with Stereotyping in Vision-Language Models [0.3] プロトタイプ性が異なる標準化された顔画像を用いて、4つの視覚言語モデルを用いて、オープンエンドコンテキストにおける特徴関連と均質性バイアスの両方を検査する。
VLMは男性に比べて一貫して女性向けの均一なストーリーを生成しており、外見がより独特な人はより均一に表現される。
特徴的関連性については、ステレオタイピングと黒人が全てのモデルで一貫してバスケットボールと結びついているという限られた証拠が得られ、他の人種的関連性(芸術、医療、外見など)は特定のVLMによって異なる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:25:16 GMT)
Real-Time Convolutional Neural Network-Based Star Detection and Centroiding Method for CubeSat Star Tracker [0.3] 星追跡装置は、絶対的な姿勢決定に使用される最も正確な天体センサの1つである。
恒星検出と遠方偏移のアルゴリズムは、しばしば恒星検出のしきい値調整と遠方偏移のピクセル輝度重み付けに頼っている。
本稿では、星検出とセントロイド化のための畳み込みニューラルネットワーク(CNN)に基づくアプローチを紹介する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:36:20 GMT)
Exploring Tensor Network Algorithms as a Quantum-Inspired Method for Quantum Reservoir Computing [0.3] 量子貯水池コンピューティング(QRC)は、有望なハイブリッド量子機械学習(QML)手法として登場した。
量子インスパイアされたテンソルネットワーク(TN)がQRCアルゴリズムにどのように使用できるかを示す。
この研究は、多くの特徴を持つデータセットを研究する量子機械学習アルゴリズムの能力を高めるために、量子インスパイアされたアルゴリズムとしてのテンソルネットワークの可能性も示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:03:24 GMT)
Blind calibration of a quantum computer [0.2] 我々は、特定の量子状態の正確な準備に盲目な正確な校正プロトコルを開発する。
単純なトモグラフィーデータのみからデバイスエラーを抽出し、事前指定されたエラー機構の予備実験を必要としない。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:33:01 GMT)
Keep the Future Human: Why and How We Should Close the Gates to AGI and Superintelligence, and What We Should Build Instead [0.2] AIの進歩は、AIをニッチな学術分野から、世界最大の企業の中核的なビジネス戦略へと変えた。
このエッセイでは、人間よりも賢く自律的で汎用的なAIに「ゲート」を閉じることで、未来の人間を維持するべきだと論じています。
代わりに私たちは、個人を力づけ、最善を尽くすための人間の社会の能力を変革的に改善できる、強力で信頼できるAIツールに焦点を当てるべきです。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:10:22 GMT)
Quantum Supermaps are Characterized by Locality [0.2] 我々は、逐次合成と並列合成のみを参照する公理の観点から、量子スーパーマップの新たな特徴付けを提供する。
我々は、モノイド圏上で局所適用可能変換の簡単な定義を提供することでそうする。
この図式表現を用いて、量子チャネル上の局所適用可能な変換が決定論的量子スーパーマップとの1対1の対応にあることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:35:16 GMT)
ModernBERT is More Efficient than Conventional BERT for Chest CT Findings Classification in Japanese Radiology Reports [0.2] 両言語モデルにおける経時的双方向表現(BERT)と,より新しいModernBERT-inによる胸部CT所見との比較を行った。
ModernBERTは、BERT Baseよりも24.0%少ないトークン化効率を示した。
これらの効率向上にもかかわらず、分類性能は同等であり、ModernBERTはF1スコアを8条件で上回ったが、BERTは4条件で上回った。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:28:08 GMT)
Synchronization between media followers and political supporters during an election process: towards a real time study [0.2] 我々は、2022年のフランス大統領選挙における様々な候補者の支持者の間で、Twitterにおける議論のダイナミクス(Xになる前)について分析する。
本研究は,特定のトピックに関する異なるグループ間の関心の同期を自動的に検出できることを実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:25:58 GMT)
Data-Efficient Error Mitigation for Physical and Algorithmic Errors in a Hamiltonian Simulation [0.2] 本稿では,トロッタライズド量子回路の物理・アルゴリズム誤差を軽減するために,データ効率のよい1次元外挿法を提案する。
提案手法を数値的に検証し,提案手法が従来の推定法よりも統計的および系統的な誤差を抑えることを確認した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:05:52 GMT)
Modification Takes Courage: Seamless Image Stitching via Reference-Driven Inpainting [0.2] 現在の画像縫合法は、不均一な色相や大きな視差のような挑戦的なシナリオにおいて顕著な縫い目を生み出す。
本稿では, 画像の融合と整形を基準ベースインペイントモデルとして再構成する参照駆動型インペイント・スティッチャ (RDIStitcher) を提案する。
本稿では,Multimodal Large Language Models (MLLM) を用いた画像品質評価手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:06:51 GMT)
Melting of devil's staircases in the long-range Dicke-Ising model [0.1] 反強磁性長距離イジングモデルに対する量子位相図を示す。
我々は、非超ラディアン位相の効率的なディックモデルへの正確なマッピングを利用する。
量子ゆらぎを定量的に扱うために、一般化されたワームホール量子モンテカルロアルゴリズムを用いる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:14:47 GMT)
Accelerating Earth Science Discovery via Multi-Agent LLM Systems [0.1] このパースペクティブは、地球科学における大規模言語モデル(LLM)を利用したマルチエージェントシステム(MAS)の変容の可能性を探る。
MASは、インテリジェントなデータ処理、自然言語インタフェース、協調的な問題解決機能を有効にすることで、科学者と地質学的データとの相互作用を改善するための変革的なポテンシャルを持っている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:25:56 GMT)
Evaluating open-source Large Language Models for automated fact-checking [0.1] 大規模言語モデル(LLM)は、自動ファクトチェックの潜在的なツールとして登場した。
本研究は,異なるレベルの文脈情報を用いてクレームを評価する能力に焦点をあてる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:45:33 GMT)
Generalizable Image Repair for Robust Visual Autonomous Racing [0.1] 視覚に基づく自律レースは、堅牢な制御のために正確な認識に依存している。
センサノイズ、悪天候、動的照明による画像の分布変化は知覚を低下させ、最適下制御の決定につながる。
制御器が使用する前に劣化した画像を復元するリアルタイム画像修復モジュールを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:16:40 GMT)
phepy: Visual Benchmarks and Improvements for Out-of-Distribution Detectors [0.0] 実世界のデータセット上でのOOD検出手法のテストは、入力がID(In-distriion)またはOOD(OOD)であるあいまいさによって複雑である。
OOD検出のためのベンチマークを設計する。
我々は,ID-OOD境界における監視検出器の精度を高めるために,$t$-pokingとOODサンプル重み付けという2つの改良点を導入した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:25:20 GMT)
When Clifford benchmarks are sufficient; estimating application performance with scalable proxy circuits [0.0] 幅広い種類のエラーモデルに対して、これらの懸念は保証されていない。
Pauli twirling によるノイズ調整を許容する誤差モデルに対して、任意のジェネリック回路のダイヤモンドノルムと忠実度は、クリフォードゲートのみからなるプロキシ回路の忠実度によってよく近似されることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:18:59 GMT)
Wavefunction branching: when you can't tell pure states from mixed states [0.0] 波動関数"分岐"の定義を提案する。
分岐間の相対位相情報を得る試みは、頻繁な能動誤り訂正を伴わずに失敗すると主張している。
これらの分岐分解を多体量子状態で同定することで、古典性の出現に光を当てることができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:07:09 GMT)
Video Anomaly Detection with Structured Keywords [0.0] 本稿では,基本モデルの特徴表現一般化機能を活用したキーワードを用いた監視ビデオの異常検出に焦点を当てた。
キーワード重みを用いた異常分類のための,新しい軽量パイプラインを提案する。
Ped2, Shanghai Tech, CUHK Avenueの3つのベンチマークでは, ROC AUCスコアが0.865, 0.745, 0.742であった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:05:59 GMT)
Universality of Layer-Level Entropy-Weighted Quantization Beyond Model Architecture and Size [0.0] エントロピー重み量子化(EWQ)を用いた選択モデル量子化の新しい手法を提案する。
EWQは、モデルアーキテクチャやサイズとは独立して、パフォーマンスを著しく低下させることなく、どのブロックを安全に定量化できるかを決定する。
提案手法は一様量子化手法より優れており,MMLU(Massive Multitask Language Understanding)の精度は0.5%の範囲で維持されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:12:57 GMT)
Uncertainty Quantification From Scaling Laws in Deep Neural Networks [0.0] 機械学習の分析から不確かさを定量化することは、物理科学での使用に不可欠である。
平均$mu_mathcalL$と分散$sigma_mathcalL$を多層パーセプトロンのアンサンブルとして計算する。
我々は、MNIST分類、CIFAR分類、カロリーメータエネルギー回帰の3つの課題について、有限幅ネットワークの結果と経験的に比較した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:15:11 GMT)
Umbilical Choir: Automated Live Testing for Edge-To-Cloud FaaS Applications [0.0] Umbilical Choirは、All-as-a-Serviceプラットフォームと互換性があり、さまざまなライブテスト技術をサポートしている。
複雑なリリースシナリオを通じてUmbilical Choirを評価し、さまざまなライブテストテクニックをエッジクラウドの混在配置で示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:05:56 GMT)
Tunable Two-Species Spin Models with Rydberg Atoms in Circular and Elliptical States [0.0] 超低温リドバーグ原子を用いた多用途量子シミュレータの構築手法を提案する。
内部原子状態の励起的な異なる部分空間により、原子は2つの有効なスピン種をシミュレートすることができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:16:04 GMT)
Towards democratic data agency: Attitudes and concerns about online data practices [0.0] この研究は、日々のオンラインデータプラクティスにおいて人々が望む情報の種類、透明性のレベル、エージェンシーを調査する。
透明でアクセスしやすいプライバシーポリシーとデータ管理ツールの必要性が指摘されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:27:34 GMT)
Thermodynamics of photoelectric devices [0.0] 太陽電池や光伝導体として機能する光デバイスの非平衡定常熱力学を接合の非対称性の度合いに応じて検討する。
我々の研究は、クーロン相互作用の存在下での熱力学的に効率的な光デバイスの設計原理に重要な光を当てている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:37:03 GMT)
The study of short texts in digital politics: Document aggregation for topic modeling [0.0] コーパスを分割する自然単位に基づいて,短い文書をより大きな文書に集約する効果について検討する。
我々は2016年4月から2020年9月までの米国の州議会によるツイート100万件を分析した。
アカウントレベルで集計されたドキュメントでは、トピックは個々のツイートを使用する場合よりも、個々の状態と関連付けられている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:05:46 GMT)
The NP-hardness of the Gromov-Wasserstein distance [0.0] このノートは、Gro-Wasserstein (GW) 距離が NP-hard であるという文献でしばしば言及される性質を取り上げている。
我々は、任意の有限空間に対する有限空間間の距離のNP硬度を暗示するGW問題に関するデータを提供する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:58:08 GMT)
The Effect of Warm-Glow on User Behavioral Intention to Adopt Technology: Extending the UTAUT2 Model [0.0] 温緑化の外部面と内部面の両方を捉えるための2つの追加構造を導入し,UTAUT2+WGモデルを作成する。
その結果,温暖化はユーザの行動に大きく影響し,内面は強い影響を受け,さらにヘドニックなモチベーション,パフォーマンスの期待,そして温暖化の外部側面が続くことがわかった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 00:05:01 GMT)
Testing classicality of gravity by gravitation decoherence [0.0] 曲面背景における正規化Shr"odinger-Newton方程式の拡張の助けを借りて、外部弱い重力場が重力自己脱コヒーレンス効果に与える影響を論じる。
弱重力場の古典的記述の適用性について実験的に検証された結論に至ることを実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:48:45 GMT)
Statistical Guarantees of Correctness Coverage for Medical Multiple-Choice Question Answering [0.0] 大規模言語モデル(LLM)は、現実の質問応答(QA)アプリケーションにますます多くデプロイされている。
LLMは幻覚や非現実的な情報を生み出すことが証明されており、高い医療業務における信頼性を損なう。
本研究では,CP フレームワークを医療用マルチ選択質問応答 (MCQA) タスクに適用した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:22:10 GMT)
Spectrum analysis with parametrically modulated transmon qubits [0.0] 本稿では、量子ビットのエネルギーギャップのパラメトリック変調と動的デカップリングシーケンスを融合させるパラメトリック分光法を紹介する。
我々の理論的研究は、パラメトリック分光がトランスモン中のフラックススペクトルの難しい高周波領域へのアクセスを可能にすることを示唆している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:16:20 GMT)
Sparse Bayesian Multidimensional Item Response Theory [0.0] 我々は,大規模なデータセットに対して最小限のチューニングとスケールを必要とする二項および順序項目MIRTのためのベイズプラットフォームを開発する。
ベイズ非パラメトリックスによるツールによる未知の潜在因子次元の問題に対処する。
本手法は, 微小サンプルにおいても高次元合成データの因子次元と潜時構造の両方を確実に回収する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 04:08:18 GMT)
Software tool-set for automated quantum system identification and device bring up [0.0] 本稿では、量子デバイスの理論的、最適制御ビューと実用的な操作と特徴付けタスクを組み合わせたソフトウェアツールセットを提案する。
モデルに基づくシミュレーションを行い、制御スキームを作成し、これらの制御をデバイスとクローズドループでキャリブレーションする。
最後に,シミュレーションと実験のミスマッチを最小化することにより,システムのモデルを改善する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:49:34 GMT)
Slim attention: cut your context memory in half without loss of accuracy -- K-cache is all you need for MHA [0.0] MHA(multi-head attention)を有する変圧器モデルにおけるスリムアテンションによる文脈記憶の2倍縮小
エンコーダ・デコーダ変換器では、コンテキストメモリサイズをさらに小さくすることができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:44:52 GMT)
Simple analytical model describing the collective nonlinear response of an ensemble of two-level emitters weakly coupled to a waveguide [0.0] 単一モード導波路に弱い結合を持つ2レベルエミッタのアンサンブルの非線形光学応答をモデル化し,検討する。
提案手法は,光子-光子相関が,複数の発光子に対して2光子干渉によって1つの2レベルエミッターによって散乱されるという知見を一般化する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:20:29 GMT)
Selective collective emission from a dense atomic ensemble coupled to a nanophotonic resonator [0.0] ナノフォトニックマイクロリング共振器における高密度原子アンサンブル(WGM)の集合放出について実験的に理論的に検討した。
原子-WGM結合を調整し、閉じ込められた原子の数を調整することで、超ラジカル放出をWGMに示す。
非誘導モードによる光子放出については,系が定常状態に駆動されるときのサブ放射と超放射のシグネチャを明らかにする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:25:04 GMT)
Satire: Computing Rigorous Bounds for Floating-Point Rounding Error in Mixed-Precision Loop-Free Programs [0.0] Satireは、設計者が分析時間内でエラーバウンド・タイネスを利得と交換できるツールだ。
風刺は、厳密な経験的エラー保証によって導かれる設計上のトレードオフに、数値ルーチンの設計で使用することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:46:38 GMT)
SYMBIOSIS: Systems Thinking and Machine Intelligence for Better Outcomes in Society [0.0] SYMBIOSISはAIを利用したフレームワークとプラットフォームで、システム思考が社会的な課題に対処できるように設計されている。
そこで我々は,複雑なシステム表現を自然言語に変換する生成コパイロットを開発した。
SYMBIOSISは、責任と社会中心のAIに関する将来の研究を解き放つための基礎的なステップとして機能することを目指している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:07:26 GMT)
Routing for Large ML Models [0.0] 大規模言語モデル(LLM)やその他の大規模機械学習モデルのトレーニングには、データセンターネットワーク間で大量のデータの通信が繰り返される。
本稿では,LLMやその他の大規模MLモデルのトレーニングにおいて,ネットワーク全体の効率をテキスト化するためのアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:02:17 GMT)
Robust Intrusion Detection System with Explainable Artificial Intelligence [0.0] 逆入力は、標準インターフェイスを通じて機械学習(ML)モデルを利用することができる。
敵の訓練のような従来の防御は、計算的な用語で費用がかかるため、しばしばリアルタイム検出の提供に失敗する。
eXplainable Artificial Intelligence (XAI) を用いた敵攻撃の検出と緩和のための新しい戦略を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:31:59 GMT)
Reward-Centered ReST-MCTS: A Robust Decision-Making Framework for Robotic Manipulation in High Uncertainty Environments [0.0] 本稿では,モンテカルロ木探索を強化する新しいフレームワークであるReward-Centered ReST-MCTSを紹介する。
提案手法のコアはRewarding Centerであり,部分的な報酬を動的に割り当てることで探索軌道を洗練させる。
ベースライン法と比較して,本フレームワークは計算可能性を維持しつつ,2~4%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:25:04 GMT)
Real-Time Semantic Segmentation of Aerial Images Using an Embedded U-Net: A Comparison of CPU, GPU, and FPGA Workflows [0.0] 本研究では,航空画像のリアルタイムセマンティックセグメンテーションに最適化された軽量なU-Netモデルを提案する。
実世界のデータセット上でのU-Netの精度を維持しながら、モデルのパラメータと乗算(MAC)操作を16。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:33:28 GMT)
Quantum-like cognition and decision making in the light of quantum measurement theory [0.0] 我々は、量子理論の認識への応用と一致する量子測定のクラスを特徴づける。
計測バックアクションによって生成された状態更新マップの非可換性の役割を強調します。
認知効果の量子的特性を区別することは後者の表現か、あるいはその両方であると推測する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:30:44 GMT)
Quantum systems of atoms with highly singular interaction potentials [0.0] 互いに相互作用する原子や分子からなる量子統計システムを考える。
このようなシステムの処理は、発散につながる相互作用ポテンシャルの非可積分性のため、標準近似から始めることはできない。
正則化相関は、いくつかの種類の原子系を例示する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:43:55 GMT)
Quantum smoothed particle hydrodynamics algorithm inspired by quantum walks [0.0] 時間依存型滑らかな粒子流体力学(SPH)の量子アルゴリズムを提案する。
このアルゴリズムは離散時間量子ウォークの概念を用いて一次元の対流偏微分方程式を解く。
2つの時間ステップの後により大きな対流速度が生じることには大きな矛盾があり、これは1つの時間ステップの後に状態ベクトルで生成される不要な項に起因している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:09:33 GMT)
Quantum gas microscopy of three-flavor Hubbard systems [0.0] 3成分フェルミオン系は量子色力学のモデル系の中心にある。
量子ガス顕微鏡をハバード政権の3自由度フェルミ格子ガスに拡張する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:51:01 GMT)
Quantum State Designs from Minimally Random Quantum Circuits [0.0] 任意の初期状態に対して、 (a) と (b) が大きな回路深さの限界でハール分布に近づく状態の分布を生成することを示す。
ケース (a) と (b) の両方において、ハール分布への緩和は2つのステップで起こる。
特に、最大エンタングルパワーを持つ双対単位回路は、任意の設計数に対して最適な量子状態設計準備を提供するように見える。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:59:10 GMT)
Quantum Schrodinger bridges: large deviations and time-symmetric ensembles [0.0] シュロディンガーの古典的な橋の問題の量子的相違は、半世紀にわたって改善されてきた。
マルコフ実験前後の時間対称アンサンブルについて検討する。
導出された分布は、観測された終端状態をブリッジする量子マルコフ力学を与える。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:20:07 GMT)
Programmable non-Hermitian photonic quantum walks via dichroic metasurfaces [0.0] 非単位量子ウォークを実装したフォトニックプラットフォームを導入する。
非単位量子ウォークは一般に開系力学をエミュレートするために用いられる。
我々のプラットフォームは、非エルミート量子力学の制御された研究のための光学シミュレータの範囲を広げる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:32:15 GMT)
Predicting topological quantum phase transition from dynamics via multisite entanglement [0.0] 2次元正方格子内の正確に解けるキタエフモデルは、位相量子相転移を示す。
そこで我々は,Loschmidtエコーや時間平均マルチパートの絡み合いなどの動的状態の特徴が,初期状態が位相位相に属するか否かを判断できることを示した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:00:03 GMT)
Platonic dynamical decoupling sequences for interacting spin systems [0.0] 我々は,大域回転のみで構成され,四面体,八面体および二面体点群に基づく効率的な疎結合配列を設計し,これをプラトン配列と呼ぶ。
これらの列は、スピン量子数$jleqslant 5/2$の単一のスピンに対して、環境とのいかなる種類の相互作用もキャンセルする能力において普遍的である。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:59:44 GMT)
Pinching operators for approximating multiphoton entangled states [0.0] 我々は、非ガウス作用素へのスキーズ作用素の理論を拡張するピンチ作用素を導入する。
我々はこれを、ピンチされた真空状態と階数$n$のピンチテンソルを用いて、$n$-光子絡み状態の近似に利用する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:37:30 GMT)
Physics-based machine learning for fatigue lifetime prediction under non-uniform loading scenarios [0.0] この研究は、材料の疲労寿命を予測する物理ベースの機械学習(phi$ML)の可能性を強調した。
物理的にベースとした異方性連続体損傷疲労モデルにより生成された数値シミュレーションを用いて訓練する。
提案手法は、純粋にデータ駆動型ニューラルネットワークよりも精度が高い。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 13:45:06 GMT)
PhiloBERTA: A Transformer-Based Cross-Lingual Analysis of Greek and Latin Lexicons [0.0] 古代ギリシア語とラテン語の語彙間の意味的関係を測定するモデルであるPiloBERTAを提示する。
以上の結果から,etymologically related pairsの類似度は有意に高いことがわかった。
これらの発見は、ギリシアとラテンの伝統の間の哲学的概念がどのように移行したかを調べるための定量的枠組みを確立した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:30:16 GMT)
Performance Comparisons of Reinforcement Learning Algorithms for Sequential Experimental Design [0.0] 最大情報的設計決定を行うエージェントの創出における強化学習アルゴリズムとその有効性について検討する。
エージェントのパフォーマンスは、トレーニングに使用されるアルゴリズムによって影響を受けており、特定のアルゴリズムは、ドロップアウトやアンサンブルアプローチを用いて、魅力的な一般化特性を実証的に示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:57:39 GMT)
Performance Comparison of Quantum Otto and Stirling Engines Using Atom-Photon Interactions [0.0] 2レベルのJaynes-Cummingsシステムと、光学キャビティに閉じ込められた4レベルの原子系である。
熱力学サイクルを解析し、臨界点、量子相関、および効率と仕事の出力を決定するための原子-場相互作用の役割を明らかにする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:48:12 GMT)
Operator K-complexity in DSSYK: Krylov complexity equals bulk length [0.0] ホログラフィック双対を持つカオス量子系における時間進化の下での複雑性の概念を研究する。
クリロフ複雑性は、理論のヒルベルト空間に作用する長さ作用素の期待値によって与えられる。
我々は、クリロフ鎖上の進化は、モースポテンシャルで動く粒子として等価に理解することができると結論付けた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:38:58 GMT)
On the similarity of bandwidth-tuned quantum kernels and classical kernels [0.0] 量子カーネル(QK)は量子機械学習アプリケーションで広く使われている。
しかし、古典的データセット上の古典的機械学習手法を超える可能性については、まだ不明である。
放射基底関数(RBF)カーネルによく似たQKの帯域幅調整結果を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:28:02 GMT)
On the Logical Content of Logic Programs [0.0] 本稿では,プログラムが知っていることを説明するサポートの関係を定義することで,論理プログラミング(LP)の新たな視点を紹介する。
結果は、証明理論のセマンティクスにおける基本拡張セマンティクスの考え方を用いて定式化される。
提案手法は,LPの論理的基礎に関する新たな知見を提供し,知識表現や自動推論,形式的検証などに応用できる可能性がある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:58:08 GMT)
Nonviolation of the CHSH inequality under local spin-1 measurements on two spin qutrits [0.0] 我々はスピン=1$の値でCHSH期待値の最大値を分析する。
特に、最大絡み合っている2量子GHZ状態の場合、スピン-$1$CHSHパラメータは$sqrtfrac89$に等しいが、分離可能な純粋な2量子状態の場合、このパラメータはユニティに等しい。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:35:21 GMT)
Nonstabilizerness of a Boundary Time Crystal [0.0] 境界時間結晶はその定常状態の絡み合いにおいて測定誘起相転移を示す。
我々は、異なる解法の下で魔法が不変であることを示します。
これらの発見は、オープンシステムにおける異なる量子リソースがどのように現れるかについての洞察を与える。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:54:53 GMT)
Non-equilibirum physics of density-difference dependent Hamiltonian: Quantum Scarring from Emergent Chiral Symmetry [0.0] 密度差依存ハミルトニアンにおける量子多体傷の存在を示す。
電荷密度波が秩序づけられた傷とエッジモードの傷の2種類がある。
それぞれに,他のシステムに適用可能な傷跡を生じさせる単純なメカニズムを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:09:24 GMT)
Molecular representations of quantum circuits for quantum machine learning [0.0] 量子機械学習において,分子を量子回路の記述子として用いることができることを示す。
量子アルゴリズムの精度は、特定の分子の集合からサンプリングすることで高い確率で達成できることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:49:48 GMT)
Metrological symmetries in singular quantum multi-parameter estimation [0.0] ベイジアン後部分布には,未知のパラメータの空間を貫く持続可能性の線として,気象対称性が現れることを示す。
これらの線は有効パラメータの輪郭線であり、適切なパラメータ変換を通じて、それぞれが有効なCRBを推定し、従うことができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:52:40 GMT)
Mentor initiated Bi-directional Hybrid quantum Communication Protocol [0.0] 本稿では,双方向の双方向制御型量子通信プロトコルについて述べる。
このプロトコルは、環境ノイズがない場合に決定的に動作する。
絡み合い発生のための量子回路とプロトコル全体の量子回路を提示する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:35:26 GMT)
Memory preservation in highly-connected quantum networks [0.0] 我々は、パラダイム的なXXZハミルトニアンによって記述された量子ネットワークの輸送特性について研究する。
解析的手法と数値的手法を組み合わせることで、全ての接続された正則ネットワークは、最初に注入された励起のメモリを長時間保存することがわかった。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:16:08 GMT)
Maxwell demon no-go theorem for multichannel scattering [0.0] 粒子に対する非対称反応を示すマクスウェル・デーモンや他の装置の最近の実装は、概念的および実践的関心を高めている。
大型ハミルトニアンの複雑さにかかわらず、悪魔の振る舞いはこのような方法では接近できない。
本稿では,量子光学装置において,悪魔に近い動作のデバイスを可能な限り構築する方法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:39:41 GMT)
Machine Learning for Improved Density Functional Theory Thermodynamics [0.0] 本稿では,密度汎関数理論計算における固有エネルギー分解誤差を体系的に補正する機械学習(ML)手法を提案する。
ニューラルネットワークモデルは、二元系および三元系合金および化合物に対するDFT計算と実験的に測定されたエンタルピーの相違を予測するために訓練されている。
本手法の有効性を,航空宇宙・保護コーティングにおける高温応用に関心のあるAl-Ni-PdおよびAl-Ni-Ti系に応用して説明する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:46:30 GMT)
Machine Learned Force Fields: Fundamentals, its reach, and challenges [0.0] 機械学習力場(MLFF)は、計算化学と材料科学における革命的なアプローチとして登場した。
この章では、学習の基本と、それがMLFFの構築に適用される方法を紹介します。
もっとも要素的なニューラルネットワークに基づく力場のひとつとして、SchNetモデルの構築に重点を置いている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:26:14 GMT)
Local unambiguous unidentifiability, entanglement generation, and Hilbert space splitting [0.0] 我々は、基底ヒルベルト空間の全体次元にランクが加算される相互直交部分空間上で支えられる混合状態の集合を考える。
局所的な操作や古典的コミュニケーション(LOCC)によって、ゼロではない成功確率で、集合からの状態を特定することはできない。
そのような性質が存在するためには、状態が絡み合った部分空間でサポートされなければならないという必要十分条件を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:33:19 GMT)
LapLoss: Laplacian Pyramid-based Multiscale loss for Image Translation [0.0] 本稿では,ラプラシアンピラミッド中心ネットワークに基づくI2ITコントラスト強化のための新しいアプローチであるLapLossを紹介する。
提案手法は複数の識別器アーキテクチャを用いており、それぞれ異なる解像度で動作し、高レベルな特徴をキャプチャする。
提案手法は、複数のスケールでの損失を計算し、再構成精度と知覚品質のバランスをとり、全体像生成を向上させる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:05:47 GMT)
LEWIS (LayEr WIse Sparsity) -- A Training Free Guided Model Merging Approach [0.0] LEWIS(Layer Wise Sparsity)は、ガイド付きモデルマージフレームワークである。
階層的なタスク固有の知識を保持することによって、既存のマージ手法をガイドする。
コード命令追従モデルと数解モデルの性能改善によるLEWISの有効性を実証した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:25:17 GMT)
Interpretable Visualizations of Data Spaces for Classification Problems [0.0] 分類問題によって決定される決定境界の可視化に適したハイブリッド教師なし手法を提案する。
定性的かつ定量的に分析できる人間解釈可能な地図を提供する。
本稿では, この手法を化学駆動問題の観点から論じる一方で, 機械学習分類モデルの操作を「アンボックス化」するために, サブフィールドにまたがって応用を一般化することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:47:12 GMT)
Inequality-free proof of Bell's theorem [0.0] ベルの定理は、量子力学と局所的で現実的な隠れ変数理論の間の矛盾を証明していると考えられている。
本稿では,不等式は含まないが,量子力学を用いて計算した相関関数と,局所現実的な隠れ変数理論に基づいて計算した相関関数を直接比較する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:40:06 GMT)
InDRiVE: Intrinsic Disagreement based Reinforcement for Vehicle Exploration through Curiosity Driven Generalized World Model [0.0] 本稿では,InDRiVE(Intrinsic Disagreement based Reinforcement for Vehicle Exploration)をモデルベース強化学習フレームワークとして提案する。
エージェントは、世界モデルのアンサンブルを訓練することにより、タスク固有のフィードバックなしで、環境の不確実性の高い領域を積極的に探索する。
InDRiVEはDreamerV2やDreamerV3に比べて高い成功率と少ない屈折率を達成している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:56:00 GMT)
Improving RAG Retrieval via Propositional Content Extraction: a Speech Act Theory Approach [0.0] 本稿では,ユーザ発話から提案内容を抽出することで,検索・拡張生成システムにおける検索品質が向上するかどうかを考察する。
本稿では,クエリを埋め込む前に提案する等価表現に自動的に変換する実用的な手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:15:40 GMT)
Improving Hate Speech Classification with Cross-Taxonomy Dataset Integration [0.0] この研究は、単一のフレームワーク内で幅広い定義を検出することができる普遍的な分類法とヘイトスピーチ分類法を導入している。
我々のアプローチは、2つの広く使われているが異なる注釈付きデータセットを組み合わせることで検証される。
この研究は、ヘイトスピーチの検出を推進し、効率を向上し、コンテキスト間の広範な適用性を確保する上で、データセットと分類学の統合の可能性を強調している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 12:01:02 GMT)
Implementation and verification of coherent error suppression using randomized compiling for Grover's algorithm on a trapped-ion device [0.0] 量子コンピュータにおけるコヒーレントエラーとその緩和効果について検討する。
最大10キュービットと26の2キュービットゲートを含むGroverのアルゴリズム回路を実装した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:37:14 GMT)
I/O in Machine Learning Applications on HPC Systems: A 360-degree Survey [0.0] データはAIアプリケーションの主要な燃料であり、HPCシステムのストレージとI/Oサブシステムのパフォーマンスは重要である。
本稿では,HPCシステム上でのMLアプリケーションにおけるI/Oと,2019年から2024年までの6年間のタイムウインドウ内での文学を対象とした調査を行う。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:11:30 GMT)
Harnessing Causal Indefiniteness for Accessing Locally Inaccessible Data [0.0] 古典的データ検索課題における因果不確定性について検討する。
不定因果構造に埋め込まれたものは、一般に、定因果構造内での動作よりも優れていることを示す。
また、DRタスクを個別に非効率にする2つの量子プロセスが組み合わせると有用になる、興味深いスーパーアクティベーション現象を報告する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:59:59 GMT)
Global graph features unveiled by unsupervised geometric deep learning [0.0] GAUDI(Graph Autoencoder Uncovering Descriptive Information)は,幾何学的教師なしディープラーニングフレームワークである。
GAUDIは、階層的なプーリングとアップサンプリング層を備えた革新的な時間ガラスアーキテクチャを採用し、接続情報を保存するためにスキップ接続を介してリンクする。
我々は、小型世界のネットワークのモデリング、超解像顕微鏡からのアセンブリのキャラクタリゼーション、Vicsekモデルにおける集合運動の解析、脳の接続性の変化の年齢変化の把握など、複数のアプリケーションにまたがるそのパワーを実証する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:38:41 GMT)
Generalized moduli of continuity under irregular or random deformations via multiscale analysis [0.0] 多分解近似空間の信号に対して、$U_s$ at scale $s$, $L2$ in the regime $|tau|_Linfty/sll 1$。
不安定性は、|tau|_Linfty/sgg 1$ のときに起こり、成長速度に対して鋭い上限を与える。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 08:52:46 GMT)
From Theory to Application: A Practical Introduction to Neural Operators in Scientific Computing [0.0] この研究は、Deep Operator Networks (DeepONet) や主成分分析に基づくニューラルネットワーク (PCANet) などの基礎モデルをカバーする。
レビューでは、ベイズ推論問題の代理として神経オペレーターを適用し、精度を維持しながら後部推論を加速させる効果を示した。
残差ベースのエラー修正やマルチレベルトレーニングなど、これらの問題に対処する新たな戦略を概説する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:25:25 GMT)
From Community Network to Community Data: Towards Combining Data Pool and Data Cooperative for Data Justice in Rural Areas [0.0] 本研究では,農村部におけるコミュニティネットワーク(CN)からコミュニティデータへの移行について検討する。
データプールとデータコラボレーティブを組み合わせることで、データの正義と育成と、ただのAIエコシステムの実現に重点を置いている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:41:01 GMT)
Fitted Q-Iteration via Max-Plus-Linear Approximation [0.0] 特に、これらの近似器を組み込んで、証明可能な収束性を持つ新しい適合Q-iteration(FQI)アルゴリズムを提案する。
提案したFQIアルゴリズムの各イテレーションにおける最大余剰線形回帰は、単純な最大余剰行列ベクトル乗算に還元されることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:19:24 GMT)
Fine-Grained Evaluation for Implicit Discourse Relation Recognition [0.0] 暗黙の談話関係認識は、テキストのスパン間の明示的な談話接続が欠如しているため、難しい課題である。
近年の事前学習型言語モデルは,この課題において大きな成功を収めている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:10:33 GMT)
Femtosecond Temporal Phase-Resolved Nonlinear Optical Spectroscopy in Molecules with Lock-in Enabled Phase Tracking [0.0] 超高速3次非線形光相互作用から放出される実時間電界を測定する実験について述べる。
ソフトウェアロックイン増幅型分光計とスペクトル干渉計を組み合わせることで、回転励起ガス相分子からの非線形光学信号の電界を測定する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 23:45:51 GMT)
Fast and memory efficient strong simulation of noisy adaptive linear optical circuits [0.0] 本稿では,出力振幅を多変量部分微分としてモデル化するアルゴリズムを提案する。
メモリに関しては、根から葉までの1つの経路を保存すればすべての振幅を繰り返すのに十分であり、アートメソッドの最速状態に対して$binomn+m-1n$とは対照的に、わずか2n$の要素しか必要としない。
このアプローチは、ノイズとフィードフォワードの両方のシナリオを無視可能なコストで拡張しながら、時間メモリのトレードオフを効果的にバランスさせる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:59:16 GMT)
FMCHS: Advancing Traditional Chinese Medicine Herb Recommendation with Fusion of Multiscale Correlations of Herbs and Symptoms [0.0] 伝統的な中国医学(TCM)は、疾患治療と医療において顕著な治療効果を示す。
本稿では, ハーブの分子スケール化学的特性と臨床症状を融合したFMCHS(Multiscale correlations of Herbs and Symptoms)を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 06:14:26 GMT)
Explaining the Unexplainable: A Systematic Review of Explainable AI in Finance [0.0] 本稿では、金融におけるXAI応用の変遷状況について概観する。
トピック・クラスタ、重要な研究、そして金融業界でよく使われる説明可能性戦略を見つける。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:36:44 GMT)
Evaluating Large Language Models in Code Generation: INFINITE Methodology for Defining the Inference Index [0.0] 本研究は推論指標(InI)の新しい手法を提案する。
InIは効率、一貫性、精度の3つの重要なコンポーネントに焦点を当てている。
OpenAIのGPT-4o(GPT)、OpenAI-o1 pro(OAI1)、OpenAI-o3 mini-high(OAI3)を比較し、Long-Short-Term-Memory(LSTM)モデルのPythonコードを生成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:59:44 GMT)
Establishing tool support for a concept DSL [0.0] この論文は、自己完結的で再利用可能な概念単位を用いて、ソフトウェアシステムの振る舞いをモデル化するためのDSLであるConceptualを記述している。
提案された戦略は単純なコンパイラで実装され、開発者はプログラムの推論に既存の分析ツールにアクセスして利用することができる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:18:31 GMT)
Enhancing the accuracy and efficiency of sample-based quantum diagonalization with phaseless auxiliary-field quantum Monte Carlo [0.0] 位相のない補助場量子モンテカルロ(ph-AFQMC)の非摂動的アプローチにより、かなりの量の相関エネルギーを回復できることを示す。
ph-AFQMCエネルギーとSQD試験波動関数のエネルギー分散の補間は、エネルギーの精度をさらに向上させる可能性がある。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 22:38:22 GMT)
Enhancing Reasoning with Collaboration and Memory [0.0] 我々は,LLMエージェントの集団が協調して推論問題を解く,連続的な協調学習システムを提案する。
この研究は、連鎖的推論スタイルの相互運用性を研究することによって、そのようなシステムの基盤を確立する。
凍結して連続的に学習されたメモリバンクを生成し、それらを固定的、ランダムで類似性に基づく検索機構と組み合わせる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:19:21 GMT)
Enhancing Network Security: A Hybrid Approach for Detection and Mitigation of Distributed Denial-of-Service Attacks Using Machine Learning [0.0] DDoS(Distributed Denial-of-Service)攻撃は、DoS(DoS)攻撃の先進的な形態を表している。
本稿では,1次元畳み込みニューラルネットワーク(CNN)の特徴抽出能力とランダムフォレスト(RF)とマルチレイヤパーセプトロン(MLP)の分類能力を組み合わせることで,ネットワークセキュリティを強化するハイブリッドモデルを提案する。
Snortは、さまざまなDDoS攻撃を検出し緩和するための堅牢で適応的なソリューションを提供します。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:47:56 GMT)
Encrypted Vector Similarity Computations Using Partially Homomorphic Encryption: Applications and Performance Analysis [0.0] 部分同型暗号(PHE)を用いて暗号化されたコサイン類似性を計算可能であることを示す。
PHEは計算集約性が少なく、高速で、より小さな暗号文/鍵を生成する。
結果は、PHEがメモリ制限された環境と現実世界のプライバシー保護暗号化類似性検索に適していることを示している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:52:16 GMT)
Empirical Bound Information-Directed Sampling for Norm-Agnostic Bandits [0.0] 本稿では,アキュメレーションデータを用いて,真のパラメータノルム上の高確率上限を反復的に改善する,新しい頻繁なIDSアルゴリズムを提案する。
提案手法は,当初仮定されたパラメータノルム境界に依存しないアルゴリズムに対する後悔境界を確立し,その手法が最先端IDSおよびUPBアルゴリズムより優れていることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 02:33:37 GMT)
ESSPI: ECDSA/Schnorr Signed Program Input for BitVMX [0.0] 本稿では,ECDSA/Schnorrシグネチャを最適化してBitVMXプログラム入力に署名するESSPIを紹介する。
ウィンターニッツ符号に基づく現在の最高比1:200と比較して,最適な1:1データ拡張を実現する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:09:23 GMT)
Dynamics of disordered quantum systems with two- and three-dimensional tensor networks [0.0] 2次元および3次元テンソルネットワークは、格子上のイジングスピングラスの量子アニールダイナミクスを正確に、効率的にシミュレートできることを示す。
この結果から, テンソルネットワークは2次元および3次元の量子力学をシミュレーションする上で, 実現可能な手法であることが示唆された。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:58:03 GMT)
Dirac Equation Solution with Generalized tanh-Shaped Hyperbolic Potential: Application to Charmonium and Bottomonium Mass Spectra [0.0] 一般化されたタンプ形双曲ポテンシャルにおけるディラック方程式の解析解を提案する。
本研究はGTHPを重クォーコニウム系を記述するための強力なツールとして検証した。
この研究は、複雑な相互作用を持つフェルミオン系の研究の足掛かりとなる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:04:24 GMT)
Diffusion Models for Cayley Graphs [0.0] 拡散モデルの枠組みにおける問題を定式化する方法を示す。
本稿では,従来の比較アルゴリズムよりも大幅に改善された逆スコアのアンサッツを提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:33:16 GMT)
Development and Enhancement of Text-to-Image Diffusion Models [0.0] 本研究は,テキスト・ツー・イメージ拡散モデルの開発と拡張に焦点を当てる。
提案された拡張は、ジェネレーティブAIの新しいベンチマークを確立する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 05:18:00 GMT)
Detection and Analysis of Offensive Online Content in Hausa Language [0.0] ハウサ語は、主に西アフリカで1億人以上の人々が話している主要なチャド語である。
私たちはハウサ語で最初の攻撃的用語のデータセットを作成しました。
我々の検出システムは攻撃性の70%以上を特定できたが、ベースラインモデルはしばしばその用語を誤訳した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:18:37 GMT)
Desorption-induced decoherence of nanoparticle motion [0.0] ナノ粒子の変換と回転のダイナミクスが表面吸着の放出によってどのように影響を受けるかを予測する量子マスター方程式を導出する。
十分に局在したナノ粒子の極限において、ロ-翻訳力学は古典的な期待値と定量的に一致して拡散速度によって特徴づけられる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:47:31 GMT)
Designing Secure Interconnects for Modern Microelectronics: From SoCs to Emerging Chiplet-Based Architectures [0.0] システム・オン・チップ(SoC)アーキテクチャにおけるネットワーク・オン・チップ(NoC)相互接続の確保に焦点が当てられている。
ObNoCs と POTENT の2つの手法が研究されている。
チップレット間通信やインターポーザ設計の保護などの新しい課題は、拡張された難読化、認証、暗号化メカニズムによって解決される。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 18:13:30 GMT)
Cybersafety Card Game: Empowering Digital Educators to Teach Cybersafety to Older Adults [0.0] 本研究では,高齢者がサイバー衛生の実践を概念的に学び,強化するために,新しいシディング型カードゲームを提案する。
デジタル教育者は,教師としての通常の役割から離れて,高齢者(n=16)と一緒に選手として参加するように求めた。
サイバーセーフティゲームは、詐欺の処理、パスワード管理、サイバー攻撃への応答、非公開の4つの主要なトピックに対処する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:00:45 GMT)
Correction Formulas for the Mølmer-Sørensen Gate Under Strong Driving [0.0] LDパラメータにおいて,誤りを最大4次まで明示的な解析式を提供する。
従来の理論と比較して,これらの誤差が劇的に低減されることを示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:21:12 GMT)
Controllable Complementarity: Subjective Preferences in Human-AI Collaboration [0.0] 強化学習アルゴリズムであるビヘイビア・シェーピング(BS)を用いて,AIパートナーとの共有タスクにおける制御可能性に対する人間の嗜好について検討する。
我々の発見は、タスクパフォーマンスと主観的人間の嗜好の両方を優先するAIの設計の必要性を強調した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:27:48 GMT)
Constraints from Entanglement Wedge Nesting for Holography at a Finite Cutoff [0.0] Entanglement wedge nesting (EWN) には$mathcalW_E(A) cup MathcalW_E(B) subseteq MathcalW_E(Acup B)$が必要である。
両面にETWブレーンを配したBTZブラックホール形状のEWNについて検討した。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 21:46:29 GMT)
Compliance of AI Systems [0.0] 本稿では、EUのAI法に焦点をあてて、関連する法律に対するAIシステムのコンプライアンスを体系的に検討する。
この分析は、エッジデバイスに関連する多くの課題を強調した。
データセットのコンプライアンスの重要性は、AIシステムの信頼性、透明性、説明可能性を保証するための基盤として強調されている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:53:36 GMT)
Comparing regularisation paths of (conjugate) gradient estimators in ridge regression [0.0] 線形回帰におけるペナル化リッジ基準を最小化するための反復アルゴリズムとして,勾配勾配,勾配流,共役勾配を考察する。
特に、オラクル共役勾配は勾配流の最適性を共有し、尾根回帰は定数係数までオラクルする。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 16:14:06 GMT)
Cognitive Bias Detection Using Advanced Prompt Engineering [0.0] 本稿では,大規模言語モデル(LLM)と高度なプロンプトエンジニアリング技術を用いた,ユーザ生成テキストにおけるリアルタイム認知バイアス検出のための新しいアプローチを提案する。
提案システムはテキストデータを解析して、確認バイアス、円形推論、隠れ仮定などの一般的な認知バイアスを識別する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 15:35:37 GMT)
Can Large Language Models Grasp Concepts in Visual Content? A Case Study on YouTube Shorts about Depression [0.0] 我々はAIの解釈を抽象概念の人間の理解と比較する。
我々はLLaVA-1.6 Mistral 7Bを用いて、ビデオによる自己開示に関する4つの抽象概念を解釈する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 03:06:59 GMT)
Can KAN CANs? Input-convex Kolmogorov-Arnold Networks (KANs) as hyperelastic constitutive artificial neural networks (CANs) [0.0] ICKANs (ICKANs) を応用し, 多入力弾性法則を学習する。
結果として得られるモデルは、分析関係の明示的な抽出を可能にしている。
ICKANは様々な状態におけるひずみ応力-ひずみの挙動を正確に捉えている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:42:24 GMT)
Calculation of low-energy scattering parameters using artificial oscillator trap [0.0] 量子小体系の低エネルギー散乱パラメータを推定する手法を提案する。
核モデル内の低エネルギー核子-核子散乱に1つのSigma-meson近似に比例して適用する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:19:04 GMT)
Bridging Classical and Quantum String Matching: A Computational Reformulation of Bit-Parallelism [0.0] 本稿では,ビット並列文字列マッチングアルゴリズムを量子フレームワークに変換する新しい経路を提案する。
ビット並列モデルに量子探索を埋め込むことにより、文字列マッチングの時間的複雑さを低減する。
また,Groverの探索による2次高速化を実現するため,性能の向上も図っている。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:24:00 GMT)
Blockchain As a Platform For Artificial Intelligence (AI) Transparency [0.0] AI意思決定における"ブラックボックス"問題は、ステークホルダーの成果を理解し、信頼し、検証する能力を制限します。
本稿では、意思決定のトレーサビリティ、証明データ、モデル説明責任を改善するために、ブロックチェーンとAIの統合について検討する。
ブロックチェーンは、AIシステムが説明責任を持ち、倫理的であり、規制基準に準拠していることを保証する技術である可能性を示唆している。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:57:26 GMT)
Audio-to-Image Encoding for Improved Voice Characteristic Detection Using Deep Convolutional Neural Networks [0.0] 本稿では,複数次元の音声特徴を1つのRGB画像に統合して話者認識を実現する,新しい音声画像符号化フレームワークを提案する。
これらの合成画像に基づいてトレーニングされたディープ畳み込みニューラルネットワークは、2つの話者間での話者分類において98%の精度を達成する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 20:49:56 GMT)
Assisted morbidity coding: the SISCO.web use case for identifying the main diagnosis in Hospital Discharge Records [0.0] 本論文は, 病院退院記録に適切な診断・手続きコードで記入する医師を支援するためのSISCO.webアプローチを提案することを目的とする。
このWebサービスは、NLPアルゴリズム、特定のコーディングルール、およびアドホック決定ツリーを活用して、主条件を特定する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 09:32:03 GMT)
Are AI Detectors Good Enough? A Survey on Quality of Datasets With Machine-Generated Texts [0.0] AIフラグメントを備えた膨大な数の検出器とコレクションが出現している。
しかし、そのような検出器の品質は野生では劇的に低下する傾向にある。
本稿では,AI生成フラグメントを含むデータセットの品質を評価する手法を提案する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 10:17:34 GMT)
A superconducting on-chip microwave cavity for tunable hybrid systems with optically trapped Rydberg atoms [0.0] ハイブリッド量子システムは、量子情報科学と量子センシングの課題に対処するための、非常に有望なプラットフォームである。
ここでは、希釈冷凍機における超伝導オンチップマイクロ波回路と、光学的に閉じ込められた超低温原子からなるハイブリッドシステムに向けて研究する。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 11:41:41 GMT)
A new local time-decoupled squared Wasserstein-2 method for training stochastic neural networks to reconstruct uncertain parameters in dynamical systems [0.0] 提案する局所時間分解型二乗ワッサースタイン2損失関数を最小化することにより,ネットワークニューラルモデルを効果的に訓練できることを示す。
本稿では,パラメータ分布の再構成における提案手法の有効性を示す。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 01:20:43 GMT)
A functional approach for curve alignment and shape analysis [0.0] ランダム平面曲線の $tildemathbfX$ は、スケーリング、回転、パラメトリゼーションなどの変形効果を取り除いた後に残るものである。
これまでの研究では、曲線の離散的な観察を通して$tildebf X$の分析に焦点が当てられていた。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 17:55:14 GMT)
A Zero-Shot Open-Vocabulary Pipeline for Dialogue Understanding [0.0] ドメイン分類と状態追跡(DST)をひとつのパイプラインに統合するゼロショットオープン語彙システムを提案する。
我々のアプローチには、より能力の低いモデルに対する質問応答タスクとしてDSTを再構成し、より適応可能なモデルに自己修正プロンプトを採用することが含まれる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 19:50:00 GMT)
A Quarter of a Century of Neuromorphic Architectures on FPGAs -- an Overview [0.0] ニューロモルフィックコンピューティングはコンピュータ科学の新しい分野であり、生物学的脳の計算と記憶の原理を用いて情報を処理する新しい方法を作成する。
FPGA(Field Programmable Gate Arrays)は、ハードウェアニューロモルフィックアーキテクチャ(NMA)を簡単に設計できる固有の柔軟性のため、しばしば選択される。
本稿では,FPGA上に実装されたディジタルNMAの概要について述べる。
論文参考訳(メタデータ) (Fri, 07 Mar 2025 14:18:21 GMT)