Label Distribution Learning with Biased Annotations by Learning Multi-Label Representation [121.0] マルチラベル学習(MLL)は,実世界のデータ表現能力に注目されている。
ラベル分布学習(LDL)は正確なラベル分布の収集において課題に直面している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:04:03 GMT)
Learning Efficient Positional Encodings with Graph Neural Networks [109.9] グラフのための学習可能なPEの新しいフレームワークであるPEARLを紹介する。
PEARL は線形複雑性を持つ固有ベクトルの同変関数を近似し、その安定性と高表現力を厳密に確立する。
解析の結果、PEARLは線形複雑度を持つ固有ベクトルの同変関数を近似し、その安定性と高表現能を厳密に確立することを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:28:53 GMT)
CityLoc: 6DoF Pose Distributional Localization for Text Descriptions in Large-Scale Scenes with Gaussian Representation [99.2] 本稿では,テキスト記述に基づくカメラポーズの分布生成手法を提案する。
提案手法では,ノイズの多い6DoFカメラを高精細化するために拡散型アーキテクチャを用いる。
5つの大規模データセットの標準分布推定法と比較し,本手法の優位性を検証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:49:47 GMT)
Learning Transactions Representations for Information Management in Banks: Mastering Local, Global, and External Knowledge [95.8] 銀行は人工知能を使って多様なビジネスプロセスを最適化し、顧客体験を改善する。
顧客関連タスクの大部分は,1)クライアントの現在の状態(トランザクション予測など)に焦点を当てたローカルタスクと,2)グローバルタスクの2つのグループに分類される。
本稿では,他のクライアントから収集した外部情報を組み込むことで,クライアントの表現を豊かにする手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:33:55 GMT)
Process Reinforcement through Implicit Rewards [95.7] 複雑なプロセス報酬は、大きな言語モデル(LLM)の推論時間スケーリングにおいて、スパースな結果レベルの報酬よりも効果的な選択肢であることが証明されている。
ディエンス報酬は、その微粒な報酬が結果報酬の固有の問題に対処する可能性があるため、LLMの強化学習(RL)に魅力的な選択を与える。
これは主に、高品質なプロセスラベルの収集が違法に高価であるオンラインのトレーニングプロセス報酬モデル(PRM)の課題に起因する可能性がある。
提案するPRIMEは,ポリシロールアウトと結果ラベルのみを用いて,インプットプロセス報酬によるオンラインPRM更新を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:43:48 GMT)
Energy-Guided Continuous Entropic Barycenter Estimation for General Costs [95.3] 任意のOTコスト関数に対して連続的エントロピーOT(EOT)バリセンタを近似する新しいアルゴリズムを提案する。
本手法は、弱いOTに基づくEOT問題の二重再構成に基づいている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:59:45 GMT)
Eliciting Language Model Behaviors with Investigator Agents [93.3] 言語モデルは、自由形式のテキストで促されるとき、複雑で多様な振る舞いを示す。
本研究の目的は,特定の対象行動を引き起こすプロンプトを探索することである。
我々は調査員モデルを訓練し、ランダムに目的とする振る舞いを、それらを引き出す出力の多様な分布にマッピングする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:52:44 GMT)
DeepRAG: Thinking to Retrieval Step by Step for Large Language Models [92.9] 我々はマルコフ決定過程(MDP)として検索強化推論をモデル化するDeepRAGを提案する。
クエリを反復的に分解することで、DeepRAGは外部知識を取得するか、あるいは各ステップでパラメトリック推論に依存するかを動的に決定する。
実験の結果、DeepRAGは解答精度を21.99%向上させ、検索強化推論の最適化の有効性を示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:22:45 GMT)
ZebraLogic: On the Scaling Limits of LLMs for Logical Reasoning [92.8] 我々はLLM推論性能を評価するための総合的な評価フレームワークであるZebraLogicを紹介した。
ZebraLogicは、制御可能で定量化可能な複雑さを持つパズルの生成を可能にする。
その結果,複雑性が増大するにつれて,精度が著しく低下することが明らかとなった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:44:49 GMT)
DeciMamba: Exploring the Length Extrapolation Potential of Mamba [89.1] 本研究では,マンバに特化して設計された文脈拡張手法であるDeciMambaを紹介する。
実世界の長距離NLPタスクに対する実験では、DeciMambaはトレーニング中に見られるものよりも、コンテキスト長に格段に長く当てはまることが示されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:26:20 GMT)
GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [84.4] 本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:04:29 GMT)
Persona-DB: Efficient Large Language Model Personalization for Response Prediction with Collaborative Data Refinement [79.2] 本稿では,タスクコンテキスト間の一般化を改善するための階層的な構築プロセスからなる,シンプルで効果的なフレームワークであるPersona-DBを紹介する。
応答予測の評価において,Persona-DB は精度を著しく低減した検索サイズで維持する上で,より優れたコンテキスト効率を示す。
我々の実験は、ユーザーが極めて少ないデータを持つ場合、コールドスタートシナリオで10%以上の顕著な改善が示されていることも示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:23:45 GMT)
AI-Assisted Generation of Difficult Math Questions [78.8] 現在の訓練は、数学的推論をコア能力として位置づけている。
多様で挑戦的な数学の質問には、控えめな需要がある。
本稿では,LLMの強みとHuman-in-the-loopアプローチを組み合わせた設計枠組みを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:53:41 GMT)
World Model on Million-Length Video And Language With Blockwise RingAttention [75.8] 我々は、言語検索における新しいベンチマークと、長いビデオ理解における新しい機能を設定した。
長いシーケンスでスケーラブルなトレーニングを行うための効率的なオープンソース実装を提案する。
我々は,100万トークンを超える長文文書や動画を処理できる7Bパラメータモデルのファミリをオープンソースとして公開した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:47:31 GMT)
Multi-modal Agent Tuning: Building a VLM-Driven Agent for Efficient Tool Usage [75.8] 本稿では,マルチモーダルツール使用データを自動的に生成するマルチモーダルエージェントチューニング手法を提案する。
データ品質を維持するため、GPT-4oミニモデルにクエリ、ファイル、トラジェクトリを生成するよう促す。
T3-Agentは2つの人気のあるVLMの改良を一貫して達成している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:56:55 GMT)
Human Body Restoration with One-Step Diffusion Model and A New Benchmark [74.7] 本稿では,高品質な自動収穫・フィルタリング(HQ-ACF)パイプラインを提案する。
このパイプラインは、既存のオブジェクト検出データセットやその他のラベル付けされていないイメージを活用して、高品質な人間の画像を自動的にトリミングし、フィルタリングする。
また,人体修復のための新しい1段階拡散モデルであるemphOSDHumanを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:48:40 GMT)
TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization With Estimated Weights [73.9] 本稿では,TIS-DPO と呼ばれるトークン単位の重要度サンプリング DPO の目的について,その報酬に基づいて各トークンに重要度を割り当てる手法を提案する。
TIS-DPOは、無害性、有用性アライメントおよび要約タスクにおいて、様々なベースライン手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:28:51 GMT)
Competitive Programming with Large Reasoning Models [73.7] 大規模言語モデル(LLM)に適用した強化学習は、複雑なコーディングや推論タスクの性能を大幅に向上させることを示す。
OpenAI o1 と初期チェックポイント o3 の2つの汎用推論モデルとドメイン固有のシステム o1-ioi を比較した。
以上の結果から,o1-ioiなどの特殊なパイプラインでは,手作りの推論に頼らずに,スケールアップされた汎用o3モデルがこれらの結果を上回っていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:00:15 GMT)
Joint Localization and Activation Editing for Low-Resource Fine-Tuning [73.6] 本稿では,JoLA(Joal Localization and activation editing)法を提案する。
JoLAは(1)Transformerのどのヘッダーを編集するか、(2)介入が加法的、乗法的、または両方であるべきか、(3)介入パラメータ自体を学習する。
常識推論,自然言語理解,自然言語生成を対象とする3つのベンチマークの評価を通じて,JoLAが既存の手法を一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:13:09 GMT)
SQL Injection Jailbreak: A Structural Disaster of Large Language Models [71.6] LLMの外部特性をターゲットとした新しいジェイルブレイク手法を提案する。
ユーザプロンプトにジェイルブレイク情報を注入することで、SIJは有害なコンテンツを出力するモデルをうまく誘導する。
本稿では,SIJに対抗するために,セルフリマインダーキーと呼ばれる単純な防御手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:27:20 GMT)
Preference Leakage: A Contamination Problem in LLM-as-a-judge [70.0] 審査員としてのLLM(Large Language Models)とLLMに基づくデータ合成は、2つの基本的なLLM駆動型データアノテーション法として登場した。
本研究では, 合成データ生成器とLCMに基づく評価器の関連性に起因するLCM-as-a-judgeの汚染問題である選好リークを明らかにする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:13:03 GMT)
Light Unbalanced Optimal Transport [69.2] 理論的に最適化され、軽量で、バランスの取れないEOTソルバを提案する。
我々の進歩は、トラクタブルと非ミニマックス最適化の目的をもたらすUEOT問題の最適化に関する新しい視点の開発である。
我々は,この解法がUEOT解の普遍近似を提供し,一般化限界を得ることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:14:59 GMT)
Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [69.2] IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:32:16 GMT)
Breaking Focus: Contextual Distraction Curse in Large Language Models [68.5] 大規模言語モデル(LLM)の重大な脆弱性について検討する。
この現象は、セマンティック・コヒーレントだが無関係な文脈で修正された質問に対して、モデルが一貫した性能を維持することができないときに発生する。
本稿では,CDVの例を自動生成する効率的な木探索手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:43:36 GMT)
Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining [67.9] インフォメーション・インフォメーション・インフォメーション・クロッピング(ISC)と自己精製デュアルラーニング(SRDL)
Irisは850KのGUIアノテーションだけで、複数のベンチマークで最先端のパフォーマンスを実現している。
これらの改善は、WebとOSエージェントの両方の下流タスクで大幅に向上した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:23:02 GMT)
BARE: Combining Base and Instruction-Tuned Language Models for Better Synthetic Data Generation [67.8] 本研究では,ベースモデルの多様性とインストラクション学習モデルの品質を組み合わせた合成データ生成手法であるBase-Refineを提案する。
BARE生成データによる微調整は, GSM8Kの命令のみのデータよりも101%, RAFTのSOTA法より18.4%向上することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:12:40 GMT)
Generation of photon pairs through spontaneous four-wave mixing in thin nonlinear layers [67.4] 絡み合った光子のペアは、フォトニック量子技術の鍵となる資源である。
自然パラメトリックダウン変換(SPDC)の実証に成功したにもかかわらず、自然四波混合(SFWM)の研究はほとんどない。
SFWMは、等方性と中心対称を含むどんなナノ構造でも実装できる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:30:06 GMT)
Trajectory World Models for Heterogeneous Environments [67.3] 環境を横断するセンサーやアクチュエータの不均一性は、大規模な事前訓練された世界モデルを構築する上で大きな課題となる。
我々は80の環境から100万以上のトラジェクトリからなる統一データセットUniTrajを紹介した。
本稿では,様々なセンサやアクチュエータ情報を柔軟に処理し,環境ダイナミクスをコンテキスト内で捉えることのできる,新しいアーキテクチャであるTrajWorldを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:59:08 GMT)
RFL: Simplifying Chemical Structure Recognition with Ring-Free Language [66.5] 化学構造を階層的に記述する新しいリング自由言語(RFL)を提案する。
RFLは複雑な分子構造を複数の部分に分解し、特異性と簡潔性の両方を保証する。
分子骨格と個々の環を段階的に予測する骨格生成モジュールからなる普遍的な分子骨格デコーダ(MSD)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:35:15 GMT)
Inverse Entropic Optimal Transport Solves Semi-supervised Learning via Data Likelihood Maximization [65.9] 条件分布は機械学習の中心的な問題です
ペアデータとペアデータの両方を統合する新しい学習パラダイムを提案する。
我々のアプローチはまた、興味深いことに逆エントロピー最適輸送(OT)と結びついている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:45:36 GMT)
A Statistical Learning Perspective on Semi-dual Adversarial Neural Optimal Transport Solvers [65.3] 本稿では,ミニマックス二次OT解法により得られた近似OT写像の一般化誤差の上限を確立する。
解析は二次 OT に焦点をあてるが、より一般的な OT の定式化のために類似した境界を導出できると考えている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:37:20 GMT)
InfoBridge: Mutual Information estimation via Bridge Matching [64.1] 拡散ブリッジ理論を用いることで,従来のMI推定器では困難であるデータに対する非バイアス推定器を構築することができることを示す。
我々は,一連の標準MI推定ベンチマークにおいて,推定器の性能を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:18:37 GMT)
PostEdit: Posterior Sampling for Efficient Zero-Shot Image Editing [63.4] 拡散サンプリングプロセスを制御するために後続のスキームを組み込んだPostEditを導入する。
提案したPostEditは、未編集領域を正確に保存しながら、最先端の編集性能を実現する。
インバージョンもトレーニングも不要で、約1.5秒と18GBのGPUメモリを必要とするため、高品質な結果が得られる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:33:05 GMT)
AlignVLM: Bridging Vision and Language Latent Spaces for Multimodal Understanding [63.1] AlignVLMは視覚的特徴をテキスト埋め込みの重み付き平均値にマッピングする視覚テキストアライメント手法である。
実験の結果,AlignVLMは先行アライメント法と比較して最先端の性能を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:34:51 GMT)
Deep Active Speech Cancellation with Multi-Band Mamba Network [62.7] アクティブ音声キャンセラ(ASC)のための新しい深層学習ネットワークを提案する。
提案したMulti-Band Mambaアーキテクチャは、入力音声を異なる周波数帯域にセグメントし、正確な反信号生成を可能にする。
実験の結果、ANCシナリオでは7.2dB、ASCでは6.2dBの改善が達成された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:22:26 GMT)
Language Models Prefer What They Know: Relative Confidence Estimation via Confidence Preferences [62.5] 言語モデル(LM)は、ユーザーがアウトプットの誤りを検知し、必要であれば人間の専門家に延期するのに役立つ、信頼性の高い信頼推定を提供する必要がある。
本稿では,相対的信頼度推定法を提案する。そこでは,相互に質問をマッチングし,モデルに信頼度を相対的に判断するよう求める。
各質問を、他の質問に対する「プレイヤー」として扱い、モデルの選好を一致結果として扱うことで、モデルの信頼性選好を信頼スコアに変換するために、Elo評価やBradley-Terryのようなランクアグリゲーション手法を使うことができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:43:27 GMT)
CTC-DRO: Robust Optimization for Reducing Language Disparities in Speech Recognition [61.9] グループ分散ロバストな最適化(グループDRO)は、最悪のグループ損失を最小限に抑えてこの問題に対処するが、グループ損失がグループ間の性能差を誤って表すと失敗する。
CTC-DROは群重み更新をスムースにすることで群DRO目標の欠点に対処し,一貫した高損失群に対する過剰エンハンシスを防ぐ。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:29:42 GMT)
MJ-VIDEO: Fine-Grained Benchmarking and Rewarding Video Preferences in Video Generation [61.2] MJ-BENCH-VIDEOは,5つの重要な側面にわたる映像生成を評価するために設計された大規模ビデオ選好ベンチマークである。
我々は,MJ-VIDEO(Mixture-of-Experts-based video reward model)を提案する。
MJ-VIDEOは, 全体として17.58%, 15.87%の改善がみられた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:56:33 GMT)
Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding [58.4] 注目クエリの特定の領域において、集中した巨大な値が一貫して現れることを示す。
これらの膨大な価値は文脈知識の解釈において重要な役割を担っている。
大量の値の出現を辿り、そのような濃度は回転位置によって引き起こされる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:47:03 GMT)
Context-Aware Hierarchical Merging for Long Document Summarization [57.0] 本論文では,階層的なマージをソース文書からコンテキストと統合する手法を提案する。
法的および物語的領域を表すデータセットの実験結果は、文脈的拡張がゼロショットと階層的な融合ベースラインを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:14:31 GMT)
Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization [56.7] 本稿では,複雑なメモシステムや事前の高品質な実演データを必要としない,複数のタスクに対する知識とスキルを取り入れたAIエージェントの訓練手法を提案する。
このアプローチでは,エージェントが新たな経験を収集し,ヒントの形で人間から補正フィードバックを受け取り,このフィードバックを重みに組み込む,反復的なプロセスを採用している。
Llama-3 をベースとしたエージェントに実装することで,提案手法の有効性を実証し,数ラウンドのフィードバックの後,高度なモデル GPT-4o と DeepSeek-V3 をタスクセットで向上させる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:45:46 GMT)
Reinforcement Learning with Segment Feedback [56.5] 状態ごとの反応フィードバックと軌道フィードバックのギャップを埋める一般的なパラダイムを提供するRLというモデルを考える。
バイナリフィードバックの下では、$m$のセグメント数の増加は指数率で後悔を減少させるが、驚くべきことに、和フィードバックの下では、$m$の増加は後悔を著しく減少させるものではない。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:08:42 GMT)
An Efficient Rehearsal Scheme for Catastrophic Forgetting Mitigation during Multi-stage Fine-tuning [55.5] このような忘れを緩和するための一般的なアプローチは、微調整中に以前のタスクからサンプルをリハーサルすることである。
側方損傷のリハーサルを優先するサンプリング手法である textttbf mix-cd を提案する。
我々の手法は計算効率が高く、実装が容易で、計算制約のある設定においていくつかの主要な連続学習手法より優れています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:13:30 GMT)
BD-Diff: Generative Diffusion Model for Image Deblurring on Unknown Domains with Blur-Decoupled Learning [55.2] BD-Diffは、未知の領域における劣化性能を高めるために設計された生成拡散モデルである。
構造表現とぼやけたパターン抽出器に2つのQ-Formerを別々に採用する。
構造的特徴とぼやけたパターンを補完する再構成タスクを導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:00:40 GMT)
Discovering Chunks in Neural Embeddings for Interpretability [53.8] 本稿では, チャンキングの原理を応用して, 人工神経集団活動の解釈を提案する。
まず、この概念を正則性を持つ人工シーケンスを訓練したリカレントニューラルネットワーク(RNN)で実証する。
我々は、これらの状態に対する摂動が関連する概念を活性化または阻害すると共に、入力における概念に対応する同様の繰り返し埋め込み状態を特定する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:30:46 GMT)
Fine-tuning Multimodal Large Language Models for Product Bundling [53.0] Bundle-MLLMは,大規模言語モデル(LLM)をハイブリットアイテムトークン化アプローチにより微調整する新しいフレームワークである。
具体的には、テキスト、メディア、およびリレーショナルデータを統一トークン化に統合し、テキストトークンと非テキストトークンを区別するソフトな分離トークンを導入する。
1)バンドルパターンを学習し,2)製品バンドル固有のマルチモーダルセマンティック理解の強化を行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:35:07 GMT)
DRL-based Dolph-Tschebyscheff Beamforming in Downlink Transmission for Mobile Users [53.0] 学習可能なDolph-Tschebyscheffアンテナアレイを用いた深部強化学習に基づくブラインドビームフォーミング手法を提案する。
シミュレーションの結果,提案手法は最良値に非常に近いデータレートをサポートできることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:50:43 GMT)
Learning Multiple Initial Solutions to Optimization Problems [52.9] 厳密なランタイム制約の下で、同様の最適化問題を順次解決することは、多くのアプリケーションにとって不可欠である。
本稿では,問題インスタンスを定義するパラメータが与えられた初期解を多種多様に予測する学習を提案する。
提案手法は,すべての評価設定において有意かつ一貫した改善を実現し,必要な初期解の数に応じて効率よくスケールできることを実証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:21:47 GMT)
Unsupervised Domain Adaptation via Style-Aware Self-intermediate Domain [52.8] 非教師なしドメイン適応(UDA)は、ラベル豊富なソースドメインから関連するがラベルのないターゲットドメインに知識を伝達する、かなりの注目を集めている。
本研究では,大規模なドメインギャップと伝達知識を橋渡しし,クラス非ネイティブ情報の損失を軽減するために,SAFF(style-aware feature fusion)法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:26:20 GMT)
Diffusion at Absolute Zero: Langevin Sampling Using Successive Moreau Envelopes [52.7] 本稿では,$pi(x)proptoexp(-U(x))$という形のGibbs分布から,潜在的に$U(x)$でサンプリングする方法を提案する。
拡散モデルに着想を得て、ターゲット密度の近似の列 $(pit_k)_k$ を考えることを提案し、そこで$pit_kapprox pi$ for $k$ small に対して $pit_k$ は、$k$のサンプリングに好適な性質を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:50:57 GMT)
Scalable Language Models with Posterior Inference of Latent Thought Vectors [52.6] Latent-Thought Language Models (LTM) には、潜在空間における明示的な事前モデルに従う明示的な潜在思考ベクトルが含まれている。
LTMは従来のLLMを超える拡張次元を持ち、構造化された設計空間を提供する。
LTMは従来の自己回帰モデルや離散拡散モデルよりも、検証の難易度やゼロショット言語モデリングにおいて著しく優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:50:34 GMT)
Learning to Generate Unit Tests for Automated Debugging [52.6] ユニットテスト(UT)は、コードの正確性を評価するだけでなく、大きな言語モデル(LLM)へのフィードバックを提供する上でも重要な役割を果たします。
提案するUTGenは,LLMに対して,予測出力とともにエラーを示す単体テスト入力を生成することを教える。
UTGenがUT生成ベースラインを7.59%向上させることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:51:43 GMT)
Scaling Embedding Layers in Language Models [52.5] SCONEは、キャッシュされた$n$-gram埋め込みの数を増やし、それらを学ぶのに使用されるモデルをスケーリングする、固定された推論時間FLOPSを維持しながら、2つの新しいスケーリング戦略を実現する。
両面のスケーリングにより,SCONE は推論時間 FLOPS の半分 しか使用せず,多様なコーパスで 1.9B パラメータのベースラインを上回り得ることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:32 GMT)
The Master Key Filters Hypothesis: Deep Filters Are General [51.9] 畳み込みニューラルネットワーク(CNN)フィルタはより深い層に特化している。
ImageNetで訓練した深度分離可能なCNN(DS-CNN)におけるクラスタリング可能な繰り返しパターンの最近の観察は、この論文を動機づけた。
DS-CNNの解析により,深層フィルタの一般性は維持され,クラス固有のフィルタへの移行が期待されていることに矛盾することが明らかとなった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:58:12 GMT)
Evil from Within: Machine Learning Backdoors through Hardware Trojans [51.8] バックドアは、自動運転車のようなセキュリティクリティカルなシステムの整合性を損なう可能性があるため、機械学習に深刻な脅威をもたらす。
私たちは、機械学習のための一般的なハードウェアアクセラレーターに完全に存在するバックドアアタックを導入します。
我々は,Xilinx Vitis AI DPUにハードウェアトロイの木馬を埋め込むことにより,攻撃の実現可能性を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:22:36 GMT)
LLM4Rerank: LLM-based Auto-Reranking Framework for Recommendations [51.8] リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:14:26 GMT)
WonderHuman: Hallucinating Unseen Parts in Dynamic 3D Human Reconstruction [51.2] 我々はWonderHumanをモノクラービデオから再構成し、高忠実なノベルビューの合成を行う。
提案手法は,与えられたモノクロ映像からフォトリアリスティックなレンダリングを生成する場合のSOTA性能を実現する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:43:41 GMT)
Guiding Principles for Using Mixed Methods Research in Software Engineering [51.2] 混合手法の研究はソフトウェア工学でよく用いられるが、社会科学や人間科学以外の研究者は、これらの設計を使用する際に経験を欠いていることが多い。
本稿では,混合手法の研究を設計するための指針とアドバイスを提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:08:59 GMT)
Quantum Machine Learning: A Hands-on Tutorial for Machine Learning Practitioners and Researchers [51.0] このチュートリアルでは、AIのバックグラウンドを持つ読者を量子機械学習(QML)に紹介する。
自己整合性については、基本原理、代表的QMLアルゴリズム、潜在的な応用、トレーニング容易性、一般化、計算複雑性といった重要な側面を取り上げる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:33:44 GMT)
MIND: Modality-Informed Knowledge Distillation Framework for Multimodal Clinical Prediction Tasks [51.0] マルチモーダルモデル圧縮手法である MIND (Modality-Informed Knowledge Distillation) フレームワークを提案する。
MINDは、様々なサイズの事前訓練されたディープニューラルネットワークのアンサンブルから、より小さなマルチモーダルの学生に知識を伝達する。
時系列データと胸部X線画像を用いた2値および複数ラベルの臨床予測タスクにおけるMINDの評価を行った。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:50:00 GMT)
TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [50.9] TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己注意機構はDRLエージェントの探索とこれらの戦略を融合させ、政策の収束を加速し、様々な運転条件をまたいだ堅牢性を高める。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:22:03 GMT)
SliderSpace: Decomposing the Visual Capabilities of Diffusion Models [50.8] SliderSpaceは拡散モデルの視覚的能力を自動分解するフレームワークである。
単一のテキストプロンプトから複数の解釈可能かつ多様な方向を同時に検出する。
本手法は,ベースラインに比べて多様性があり,有用である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:55 GMT)
Position: Empowering Time Series Reasoning with Multimodal LLMs [49.7] マルチモーダル言語モデル (MLLM) は時系列解析においてより強力で柔軟な推論を可能にすると論じる。
我々は、MLLMにおける信頼、解釈可能性、堅牢な推論を優先する戦略を開発することで、この可能性を活用するよう研究者や実践者に呼びかける。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:10:48 GMT)
Adversarial Reasoning at Jailbreaking Time [49.7] テスト時間計算による自動ジェイルブレイクに対する逆推論手法を開発した。
我々のアプローチは、LSMの脆弱性を理解するための新しいパラダイムを導入し、より堅牢で信頼性の高いAIシステムの開発の基礎を築いた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:01 GMT)
Learning Traffic Anomalies from Generative Models on Real-Time Observations [49.2] トラフィックデータの複雑な空間的および時間的依存関係をキャプチャするために,時空間生成適応ネットワーク(STGAN)フレームワークを用いる。
スウェーデンのヨーテボリで2020年に収集された42台の交通カメラから、STGANをリアルタイムで分単位でリアルタイムで観測する。
その結果, 精度が高く, 偽陽性率の低い交通異常を効果的に検出できることが示唆された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:23:23 GMT)
COVE: COntext and VEracity prediction for out-of-context images [49.2] 画像の真のCOntextを予測する新しい手法であるCOVEを導入し,それを用いてキャプションのVEracityを予測する。
COVEは、すべてのコンテキスト項目において、SOTAコンテキスト予測モデルを上回る。
合成データ上で最高の精度予測モデルと競合し、実世界のデータでそれらを上回る。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:33:58 GMT)
Model Tampering Attacks Enable More Rigorous Evaluations of LLM Capabilities [49.1] 大規模言語モデル(LLM)のリスクと能力は、AIのリスク管理とガバナンスフレームワークにますます取り入れられている。
現在、ほとんどのリスク評価は、システムから有害な振る舞いを誘発する入力を設計することで実施されている。
本稿では,遅延活性化や重みへの修正が可能なモデル改ざん攻撃を用いたLCMの評価を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:16 GMT)
If You Can't Use Them, Recycle Them: Optimizing Merging at Scale Mitigates Performance Tradeoffs [49.0] 多くのタスクで訓練された"ジェネラリスト"モデルをマージすることを研究する。
提案アルゴリズムは,各チェックポイントの重みを線形結合で調整し,最適モデルを生成する。
良いマージは、ほとんどすべてのチェックポイントとゼロでない重みを含む傾向があり、一見して悪い初期チェックポイントでさえ、良い最終マージに寄与することを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:31:39 GMT)
Generating Multi-Image Synthetic Data for Text-to-Image Customization [48.6] テキスト・ツー・イメージ・モデルのカスタマイズにより、ユーザーはカスタムのコンセプトを挿入し、目に見えない設定でコンセプトを生成することができる。
既存の方法は、コストのかかるテストタイム最適化か、マルチイメージの監督なしにシングルイメージのトレーニングデータセットのトレーニングエンコーダに依存している。
両制約に対処する簡単なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:41 GMT)
SELMA: A Speech-Enabled Language Model for Virtual Assistant Interactions [48.0] 仮想アシスタントインタラクションのための言語モデルであるSELMAを提示し,評価する。
オーディオエンコーダとLarge Language Modelの両方のパラメータ効率訓練に低ランク適応モジュールを用いる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:35:35 GMT)
PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback [47.8] PlotGenは、精密な科学的可視化を作成することを目的とした、新しいマルチエージェントフレームワークである。
PlotGenは複数のオーケストレーションを行う。
ブレークするクエリプランニングエージェントを含む、検索エージェント。
複雑なユーザリクエストを実行可能コードにダウンします。
回収フィードバックエージェント
実験によると、PlotGenは強力なベースラインよりも優れており、MateBenchデータセットで46%改善されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:00:29 GMT)
ChartCitor: Multi-Agent Framework for Fine-Grained Chart Visual Attribution [47.8] グラフ画像内の支持証拠を識別し,きめ細かなバウンディングボックスの引用を提供するマルチエージェントフレームワークであるChartCitorを提案する。
このシステムは、LCMエージェントを編成して、チャートからテーブルへの抽出、回答の修正、テーブル拡張、事前フィルタリングと再ランク付けによるエビデンス検索、テーブルからチャートへのマッピングを行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:00:51 GMT)
GIFT: A Framework for Global Interpretable Faithful Textual Explanations of Vision Classifiers [47.2] GIFTは、視覚分類器に対するポストホック、グローバル、解釈可能、忠実なテキスト説明を導出するためのフレームワークである。
GIFTは、深い視覚分類器が使用する課題、概念、バイアスを効果的に明らかにする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:36:25 GMT)
Channel-Wise Mixed-Precision Quantization for Large Language Models [47.0] 大規模言語モデル(LLM)は、幅広い言語タスクで顕著な成功を収めている。
重みのみの量子化は、LCMのメモリフットプリントを削減するための有望な解決策である。
本稿では,CMPQ(Channel-Wise Mixed-Precision Quantization)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:48:18 GMT)
Diffusion Model as a Noise-Aware Latent Reward Model for Step-Level Preference Optimization [46.9] 拡散モデルの優先度最適化は、画像を人間の好みに合わせることを目的としている。
従来の方法では、ビジョンランゲージモデル(VLM)を画素レベルの報酬モデルとして活用し、人間の好みを近似する。
本研究では,拡散モデルが潜伏空間におけるステップレベルの報酬モデリングに本質的に適していることを示す。
本稿では,遅延空間において,ステップレベルの優先度最適化を直接的に行う手法であるLatent Preference Optimization (LPO)を紹介する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:51:28 GMT)
Contrast-Aware Calibration for Fine-Tuned CLIP: Leveraging Image-Text Alignment [46.9] 視覚言語モデル(VLM)は例外的な能力を示しており、迅速な微調整によって下流のタスクに迅速に適応することができる。
オープン語彙設定などの非トレーニングクラスを含む分類タスクでは、微調整されたVLMは、しばしば訓練クラスに過度に適合し、信頼スコアと未確認クラスの実際の精度の誤調整をもたらす。
既存の信頼性キャリブレーション手法では、トレーニングパラメータやトレーニングデータセットの特徴の分析が必要であり、対応する列車データなしで未確認のクラスを一般化する能力を制限している。
5つの微調整方法を持つ11のデータセットを含む実験において、CACは、列車と見知らぬクラスの両方において、常に最高の校正効果を達成した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:12:30 GMT)
Toward Neurosymbolic Program Comprehension [46.9] 我々は,既存のDL技術の強みと従来の象徴的手法を組み合わせたニューロシンボリック研究の方向性を提唱する。
第1回ニューロシンボリック・プログラム・フレームワークの確立をめざして,提案するアプローチの予備的結果を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:38:58 GMT)
Structural features of the fly olfactory circuit mitigate the stability-plasticity dilemma in continual learning [46.7] 本研究では,Fly Modelと呼ばれる,現代の機械学習手法と統合可能なプラグイン・アンド・プレイコンポーネントとして,フライ嗅覚回路を導入する。
その結果,Fly Modelは記憶の安定性と学習の可塑性を両立させ,現在の継続的な学習戦略の限界を克服することを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:06:11 GMT)
RandLoRA: Full-rank parameter-efficient fine-tuning of large models [46.3] Low-Rank Adaptation (LoRA)とその変種は、大きなトランスフォーマーネットワークのトレーニング可能なパラメータとメモリ要求の数を削減した。
しかし、ウェイト更新の低ランクな性質は、本質的に微調整されたモデルの表現力を制限している。
本稿では、低ランクで非学習可能なランダム行列の線形結合を用いて、フルランク更新を行うRandLoRAを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:59:45 GMT)
ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills [46.2] ASAPは、動的ミスマッチに対処し、アジャイルなヒューマノイド全体のスキルを実現するために設計された2段階のフレームワークである。
第1段階では、リターゲットされた人間の動きデータを用いたシミュレーションにおいて、運動追跡ポリシーを事前訓練する。
第2段階では、現実の世界でポリシーをデプロイし、現実のデータを収集し、デルタ(残留)アクションモデルをトレーニングします。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:22:46 GMT)
Predicting Long Term Sequential Policy Value Using Softer Surrogates [46.0] オフ政治政策評価は、異なる政策から収集された歴史的データを用いて、新しい政策の結果を推定する。
我々は,全地平線データの10%を観測した後のみ,政策値の正確な予測を行うことができることを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:11:14 GMT)
CodeMonkeys: Scaling Test-Time Compute for Software Engineering [45.8] テスト時間計算のスケーリングは、LLM機能を改善するための有望な軸である。
ここでは、SWE-benchデータセットから現実のGitHub問題を解決するという文脈で、この問題について検討する。
CodeMonkeysという名前の私たちのシステムは、ドラフト編集と同時にテストスクリプトを共同で生成して実行することで、モデルを反復的に編集することができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:57:05 GMT)
Reducing the sampling complexity of energy estimation in quantum many-body systems using empirical variance information [45.2] パウリ分解において、与えられたハミルトニアンに対する量子状態準備のエネルギーを推定する問題を考える。
状態の実際の分散を用いた適応推定器を構築する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:00:01 GMT)
Covariant non-perturbative pointer variables for quantum fields [45.0] 我々は、検出器ポインター可変力学を支配する積分微分方程式の導出と再正規化を行う。
グリーン函数の項で表される公式解は、場上の誘導可観測物の共変と因果解析を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:53:31 GMT)
Clifford-Dressed Variational Principles for Precise Loschmidt Echoes [45.0] 我々は、最近導入されたクリフォード型時間依存変動原理(TDVP)を拡張し、計算ベースで多体波動関数の振幅を効率的に計算する。
TDVPの進化中にクリフォード・ディエンタングリングゲートを組み込むことで,これらの振幅の計算を利用可能にしつつ,効果的にエンタングメント成長を制御することができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:43:32 GMT)
Brain-Inspired AI with Hyperbolic Geometry [45.0] 経験的証拠は、双曲型ニューラルネットワークが自然言語処理、コンピュータビジョン、複雑なネットワーク分析などのタスクにおいてユークリッドモデルを上回っ、パラメータを少なくし、より良い一般化を示すことを示している。
その初期の採用にもかかわらず、双曲幾何学は、脳にインスパイアされた幾何学的表現を通じて機械学習モデルを改善することを約束している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:14:13 GMT)
Large Language Models Are Human-Like Internally [45.0] 近年の認知モデル研究は、より大きな言語モデル(LM)が人間の読書行動に適合していないことを報告している。
従来の結論は、LMの最終層に排他的に焦点を絞ったものであったと論じる。
解析の結果,より大きなLMの内部層から派生した次の単語確率は,人間の文処理データと一致していることがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:48:32 GMT)
GLOV: Guided Large Language Models as Implicit Optimizers for Vision Language Models [44.8] 大型言語モデル(LLM)は視覚言語モデル(VLM)の暗黙の役割を果たす
我々のGLOVメタプロンプトは、下流のタスク記述でLLMをメタプロンプトし、適切なVLMプロンプトに問い合わせる。
VLMの2つのファミリーを用いて16種類の多様なデータセット上でGLOVを評価した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:37:14 GMT)
SqueezeFacePoseNet: Lightweight Face Verification Across Different Poses for Mobile Platforms [44.8] 顔認識技術は、モバイルデバイスでカメラが利用できることを考えると、信頼性が高く堅牢なユーザー認証を提供することができる。
ディープ畳み込みニューラルネットワークは、多くの正確な顔認証アーキテクチャをもたらすが、その典型的なサイズ(数百メガバイト)は、ダウンロード可能なモバイルアプリケーションに組み込むことができない。
我々は,より大規模なモデルと比較して,十分な精度で動作可能な数メガバイトの軽量な顔認識ネットワークを開発した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:09:54 GMT)
E2Former: A Linear-time Efficient and Equivariant Transformer for Scalable Molecular Modeling [44.8] We introduced E2Former, an equivariant and efficient transformer architecture that with the Wigner 6,j$ convolution (Wigner 6,j$ Conv)
計算負荷をエッジからノードにシフトすることで、Wigner 6j$ Convは複雑さを$O(|mathcalE|)$から$O(| MathcalV|)$に縮める。
この開発は、スケーラブルで効率的な分子モデリングのための有望な方向を示唆する可能性がある。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:46:30 GMT)
Training and Evaluating with Human Label Variation: An Empirical Study [44.5] HLV(Human label variation)は、例が単一根拠の真理を持つという標準的な仮定に挑戦する。
本稿では,新たな評価指標とトレーニング手法を提案し,HLV評価指標を実証的にメタ評価する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:49:20 GMT)
Toward Task Generalization via Memory Augmentation in Meta-Reinforcement Learning [43.7] 強化学習(RL)では、エージェントは訓練中に遭遇したタスクと異なるタスクをうまくこなすのに苦労することが多い。
この制限は、多種多様な動的タスク設定におけるRLの広範な展開に課題をもたらす。
タスクの一般化を改善するためのメモリベースRLアプローチであるメモリ拡張を導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:00:19 GMT)
Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models [43.5] この調査は、従来のアプローチから基礎モデルへの進歩に関する、初めての包括的なレビューを提供する。
1)マルチモーダルドメイン適応,(2)マルチモーダルテスト時間適応,(3)マルチモーダルドメイン一般化,(4)マルチモーダルファンデーションモデルの助けを借りたドメイン適応と一般化,(5)マルチモーダルファンデーションモデルの適応。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:01:11 GMT)
MS-HuBERT: Mitigating Pre-training and Inference Mismatch in Masked Language Modelling methods for learning Speech Representations [43.5] MS-HuBERTは、堅牢な音声表現を学習するためのエンドツーエンドの自己教師付き事前学習手法である。
ASR Librispeechベンチマークでバニラの HuBERT を平均5%の差で上回っている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:26:54 GMT)
Large Language Model-Enhanced Multi-Armed Bandits [43.3] 大規模言語モデル(LLM)は、マルチアーム・バンディット(MAB)のようなシーケンシャルな意思決定タスクを解決するために採用されている。
古典的MABとLLMの強みを組み合わせた代替手法を提案する。
実世界のテキストデータセットを用いて設計したMABタスクと実験の両方を用いて経験的評価を行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:19:05 GMT)
PhD Knowledge Not Required: A Reasoning Challenge for Large Language Models [43.2] 一般知識のみを必要とするNPRサンデーパズルチャレンジに基づくベンチマークを提案する。
私たちの研究は、既存のベンチマークでは明らかでない機能ギャップを明らかにしています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:10:38 GMT)
ReGLA: Refining Gated Linear Attention [43.0] 線形注意は、標準変圧器に固有の2次時空の複雑さを減らすように設計されている。
我々は、以前の提案が見落としていたいくつかの重要な問題に対処する機能マッピング機能を開発した。
また, ゲーティング機構の飽和現象を探索し, 精製モジュールで補強した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:03:13 GMT)
Multibranch Generative Models for Multichannel Imaging with an Application to PET/CT Synergistic Reconstruction [43.0] 本稿では,マルチブランチ生成モデルを用いた医用画像の相乗的再構築のための新しい手法を提案する。
我々は,MNIST (Modified National Institute of Standards and Technology) とPET (positron emission tomography) とCT (Computed tomography) の2つのデータセットに対するアプローチの有効性を実証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:40:31 GMT)
Operationally classical simulation of quantum states [41.9] 古典的な状態準備装置は重ね合わせを発生できないため、出力された状態は通勤しなければならない。
このようなシミュレーションは存在しないことを示し、量子コヒーレンスを証明している。
我々のアプローチは、量子状態がいかにして、いかにして古典的デバイスに基づくジェネリックモデルをデファクトするかを理解するための道のりである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:25:03 GMT)
Predicting symmetries of quantum dynamics with optimal samples [41.4] 量子力学における対称性の同定は、量子技術に深く影響する重要な課題である。
グループ表現理論とサブグループ仮説テストを組み合わせた統合フレームワークを導入し,これらの対称性を最適効率で予測する。
我々は,並列戦略が適応プロトコルや不定値順序プロトコルと同じ性能を達成することを証明した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:57:50 GMT)
Main Predicate and Their Arguments as Explanation Signals For Intent Classification [41.1] 主動詞は行動を表し,直接目的語は会話の領域を示し,目的語の説明信号として機能することを示す。
我々は、主述語(主に動詞)とその引数を、ベンチマーク意図分類データセットATISおよびSNIPSにおける説明信号としてマークする。
分類のためにうまく機能するモデルは、妥当性や忠実さといった説明可能性の指標ではうまく機能しない。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:39:26 GMT)
"Not Aligned" is Not "Malicious": Being Careful about Hallucinations of Large Language Models' Jailbreak [41.0] 大規模言語モデル(LLM)の「ジェイルブレイク」は、大きな言語モデル(LLM)の安全性に関する主要な懸念事項である。
BabyBLUE"は、既存のjailbreakベンチマークを強化するための特別なバリデーションフレームワークを導入している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:25:08 GMT)
Understanding the Capabilities and Limitations of Weak-to-Strong Generalization [40.8] 弱強一般化に関する理論的知見を提供する。
弱いモデルは強力な一般化性能を示し、よく校正された予測を維持するべきである。
我々は、Charikar et al. (2024) の業績を、Kullback-Leibler の発散に基づく損失関数に拡張する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:48:28 GMT)
Learning from Linear Algebra: A Graph Neural Network Approach to Preconditioner Design for Conjugate Gradient Solvers [40.7] 我々は,従来のプリコンディショナーよりもシステムの条件数を大幅に削減するプリコンディショナーを得るために,GNNを訓練する。
本手法は、パラメトリック偏微分方程式の重要なクラスにおいて、古典的およびニューラルネットワークに基づく手法よりも優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:54:57 GMT)
ConDiff: A Challenging Dataset for Neural Solvers of Partial Differential Equations [40.7] 本稿では,科学的機械学習のための新しいデータセットであるConDiffを紹介する。
ConDiffは、偏微分方程式(PDE)の多くの応用における基本的な問題である空間依存係数を持つパラメトリック拡散方程式に焦点を当てている。
この種の問題は、学術的な関心事だけでなく、様々な環境・産業問題の記述の基礎にもなっている。
このようにして、ConDiffは、完全な合成と使いやすさを維持しながら、現実世界の問題とのギャップを短くする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:09:05 GMT)
VideoWebArena: Evaluating Long Context Multimodal Agents with Video Understanding Web Tasks [40.5] ビデオ理解のための長文マルチモーダルエージェントの性能を評価するためのベンチマークであるVideoWebArenaを紹介する。
本ベンチマークでは,長文ビデオベースエージェントタスクの分類を,スキル保持と事実保持の2つの分野に焦点をあてて定義する。
このモデルでは, 実効保持作業で13.3%, 実効保持QAペアで45.8%を達成でき, それぞれ73.9%, 79.3%と極めて低い結果となった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:52:31 GMT)
A High-Accuracy SSIM-based Scoring System for Coin Die Link Identification [40.4] この研究は、考古学的コイン分析の合理化と向上を約束する進歩を紹介する。
ダイリンク検出のためのコイン画像(329枚)の最初の公開データセット。
コインペアの迅速かつ正確な識別のためのSSIMに基づく新しいスコアリング法
我々のスコアを用いたクラスタリング手法の評価により, ほぼ完璧なダイリンク同定が得られた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:23:20 GMT)
AquaticCLIP: A Vision-Language Foundation Model for Underwater Scene Analysis [40.3] AquaticCLIP(AquaticCLIP)は、水文シーン理解に適した、新しいコントラスト言語画像事前学習モデルである。
AquaticCLIPは、画像とテキストを水生環境で整列させる、教師なしの新たな学習フレームワークを提供する。
我々のモデルは水中環境における視覚言語アプリケーションのための新しいベンチマークを設定している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:56:16 GMT)
COMPL-AI Framework: A Technical Interpretation and LLM Benchmarking Suite for the EU Artificial Intelligence Act [40.2] EUの人工知能法(AI Act)は、AI開発の責任を負うための重要なステップである。
明確な技術的解釈がなく、モデルのコンプライアンスを評価するのが難しい。
この研究は、この法律の最初の技術的解釈からなる包括的枠組みであるComple-AIを提示する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:51:44 GMT)
Provable Ordering and Continuity in Vision-Language Pretraining for Generalizable Embodied Agents [40.0] 人間のアクションビデオに対する事前学習型視覚言語表現は、エンボディエージェントの訓練のための大規模な専門家によるデモンストレーションへの依存を減らすための、有望なアプローチとして現れてきた。
本研究では,厳密な目標ベース制約を伴わずに,順序付きかつ連続的な視覚言語表現を学習するための行動時間的コヒーレンス学習(AcTOL)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:16:49 GMT)
The Russian-focused embedders' exploration: ruMTEB benchmark and Russian embedding model design [39.8] 本稿では,ロシア語の埋め込みモデルに関する研究に焦点をあてる。
ru-en-RoSBERTaと呼ばれる新しいロシアの埋め込みモデルとruMTEBベンチマークを導入している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:53:11 GMT)
Raising the Bar: Investigating the Values of Large Language Models via Generative Evolving Testing [39.7] 本稿では,測定理論における適応試験法に基づく新しい生成的進化試験手法であるGAAを提案する。
GETAはモデル能力に適したテスト項目を動的に生成することで、LLMの根底にある道徳的境界を探索する。
GETAは、アイテムの難易度とモデル値の整合性の連成分布を学習することでLLMと共進化する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:33:17 GMT)
Picky LLMs and Unreliable RMs: An Empirical Study on Safety Alignment after Instruction Tuning [39.5] 微調整された大きな言語モデル(LLM)は、その安全性のアライメントを必然的に低下させる。
この現象により、モデルは不適切な応答を与えるのにより敏感になる。
我々の研究は、微調整中に安全アライメントを維持する複雑さを強調している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:09:09 GMT)
Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity [39.5] 線形リカレントニューラルネットワークは、推論中に一定のメモリ使用量と時間毎の時間を含む強力な長距離シーケンスモデリングを可能にする。
非構造化空間は、互換性のあるハードウェアプラットフォームによって加速されるときに、計算とメモリの要求を大幅に削減できる魅力的なソリューションを提供する。
非常に疎い線形RNNは、高密度ベースラインよりも高い効率と性能のトレードオフを一貫して達成している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:09:21 GMT)
Wizard of Shopping: Target-Oriented E-commerce Dialogue Generation with Decision Tree Branching [39.5] 会話型商品検索(CPS)の目的は、インテリジェントなチャットベースのショッピングアシスタントを開発することである。
本稿では,大規模言語モデル(LLM)を利用して,現実的で自然な会話を生成する新しい手法TRACERを提案する。
We release the first target-oriented CPS dataset Wizard of Shopping (WoS)。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:27:13 GMT)
Enhancing Generalization via Sharpness-Aware Trajectory Matching for Dataset Condensation [37.8] 学習した合成データセットの一般化能力を高めるシャープネス認識軌道マッチング(SATM)を導入する。
我々の手法は数学的に十分サポートされており、制御可能な計算オーバーヘッドとともに実装が容易である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:30:06 GMT)
Tackling Feature and Sample Heterogeneity in Decentralized Multi-Task Learning: A Sheaf-Theoretic Approach [37.5] We introduced a novel sheaf-theoretic-based approach for Federated Multi-task Learning (FMTL)
セルラーシーブを用いてクライアント関係を表現することにより、不均一なクライアントモデル間の相互作用を柔軟にモデル化することができる。
本稿では,提案アルゴリズムであるSheaf-FMTLが,最先端の分散化FMTLアルゴリズムと一致してサブ線形収束率を達成することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:25:34 GMT)
Scaling Up Membership Inference: When and How Attacks Succeed on Large Language Models [37.4] メンバーシップ推論アタック(MIA)は、モデルのトレーニングセットで与えられたデータサンプルのメンバシップを検証する。
最近の研究は、現在のMIA法は大規模言語モデル(LLM)では機能しないと結論付けている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:33:59 GMT)
FCBoost-Net: A Generative Network for Synthesizing Multiple Collocated Outfits via Fashion Compatibility Boosting [37.3] FCBoost-Netは,事前学習された生成モデルのパワーを利用する,服飾生成のための新しいフレームワークである。
FCBoost-Netは、複数のファッションアイテムをランダムに合成し、合成されたセットの互換性は、新しいファッションコンパチブルブースターを用いて、いくつかのラウンドで改善される。
実証的な証拠は、提案手法がランダムに合成されたファッションアイテムのファッション互換性を改善し、多様性を維持することができることを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:18:09 GMT)
DietGlance: Dietary Monitoring and Personalized Analysis at a Glance with Knowledge-Empowered AI Assistant [36.8] 本稿では,日常の食生活を自動的に監視し,知識ソースからパーソナライズされた分析を行うシステムであるDietGlanceを紹介する。
DietGlanceはまず、眼鏡を使ってマルチモーダル入力から摂取エピソードを検出し、消費されているさまざまな料理のプライバシー保護食の画像をキャプチャする。
推定食品とこれらの画像からの消費量に基づいて、栄養分析とパーソナライズされた食生活の提案も提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:46:37 GMT)
SETS: Leveraging Self-Verification and Self-Correction for Improved Test-Time Scaling [36.8] 自己拡張テスト時間スケーリング(SETS)は、サンプリング、自己検証、自己補正を統一されたフレームワークに統合する新しい手法である。
SETSは、大幅なパフォーマンス改善と、より好ましいテストタイムスケーリング法則を実現している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:21:08 GMT)
ACECODER: Acing Coder RL via Automated Test-Case Synthesis [36.7] 既存のコードデータから広範な(問い合わせ、テストケース)ペアを生成するパイプラインを設計します。
我々は,Bradley-Terry損失を伴う報酬モデルをトレーニングするために,サンプルプログラムのパスレートに基づいて選好ペアを構築した。
RLトレーニングは,80段階の最適化ステップにおいて,HumanEval+を25%以上,MBPP+を6%以上改善できることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:46:04 GMT)
Firewalls to Secure Dynamic LLM Agentic Networks [36.7] 本稿では,適応性,セキュリティ,プライバシのバランスをとる制約付きLLMエージェントネットワークの実用設計を提案する。
我々のフレームワークは、以前のシミュレーションからタスク固有のルールを自動で構築し、更新し、ファイアウォールを構築します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:00:14 GMT)
Large language models that replace human participants can harmfully misportray and flatten identity groups [36.4] 我々は、現在のLLMのトレーニング方法には2つの固有の制限があることを示します。
我々は、LCMが人口集団の表現を誤解し、フラットにする可能性がある理由を分析的に論じる。
また、アイデンティティープロンプトがアイデンティティーを不可欠なものにする方法について、第3の制限についても論じる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:28:59 GMT)
Progressive Binarization with Semi-Structured Pruning for LLMs [36.3] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な成功を収めた。
彼らの高い計算量とメモリ要求は、リソース制約のあるデバイスへのデプロイに困難をもたらす。
LLM圧縮のための半構造化プルーニング(PBS$2$P)法によるプログレッシブバイナリ化を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:30:29 GMT)
Grokking vs. Learning: Same Features, Different Encodings [36.1] グラクテッドモデルと着実に訓練されたモデルは、同じ特徴を学習するが、これらの特徴が符号化される効率に大きな違いがある可能性がある。
特に, モデル損失と圧縮性の間に線形トレードオフが生じるような, 定常学習の新たな「圧縮的体制」を見いだす。
グルーキングにおけるモデル開発はタスク依存であり,グルーキング高原の直後にピーク圧縮性が達成されることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:00:02 GMT)
Visual Attention Never Fades: Selective Progressive Attention ReCalibration for Detailed Image Captioning in Multimodal Large Language Models [35.5] 本稿では,復号化時の視覚トークンの寄与を高める訓練自由手法を提案する。
自動評価と人的評価の両方を取り入れた実験は,既存の手法がリコールコストでMLLMの精度を向上させることを実証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:58:11 GMT)
Warfare:Breaking the Watermark Protection of AI-Generated Content [35.4] Warfareは、コンテンツ処理のための事前学習拡散モデルと、透かし操作のための生成的敵ネットワークを活用した統合攻撃フレームワークである。
Warfareはコンテンツ品質を維持しながら高い成功率を達成することを示す。
Warfare-Plusは有効性を損なうことなく効率を高める。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:53:40 GMT)
A Benchmark for Incremental Micro-expression Recognition [35.4] インクリメンタルなマイクロ圧縮認識に特化して設計された最初のベンチマークを紹介する。
我々は、現実世界のシナリオを反映するために、注意深くキュレートされた学習順序でシーケンシャルデータセットを編成する。
このベンチマークは、インクリメンタルなマイクロ圧縮認識研究の基盤となる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:14:52 GMT)
Sample, Scrutinize and Scale: Effective Inference-Time Search by Scaling Verification [35.3] 本研究では,サンプリングに基づく探索を規定するスケーリング傾向について検討する。
ランダムサンプリングと直接自己検証のみを用いる最小限の実装を単純にスケールアップするだけで、パフォーマンスが持続的に向上することがわかった。
テスト時間計算で自己検証能力を改善するための2つの有用な原則を同定する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:31:07 GMT)
Comply: Learning Sentences with Complex Weights inspired by Fruit Fly Olfaction [35.2] シーケンス表現を学習するニューラルネットワークComplyを紹介する。
FlyVecは、ハエの嗅覚回路からインスピレーションを得て、単語の埋め込みを学習する。
実験の結果,ComplyはFlyVecに取って代わるだけでなく,最先端モデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:30:44 GMT)
XR-VIO: High-precision Visual Inertial Odometry with Fast Initialization for XR Applications [34.2] 本稿では,視覚慣性オドメトリー(VIO)に対する新しいアプローチとして,初期化と特徴マッチングモジュールについて述べる。
ジャイロスコープの既存の方法は、運動からの視覚構造(SfM)の安定性の低下や、膨大な数のパラメータの同時解決に悩まされることが多い。
測定値の密結合により,視覚的SfMの堅牢性と精度が向上する。
特徴マッチングに関しては,光学フローとディスクリプタベースマッチングを組み合わせたハイブリッド手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:17:51 GMT)
Spectral tuning and nanoscale localization of single color centers in silicon via controllable strain [33.7] 大規模な統合では、各エミッタの光遷移を正確に制御し、量子ネットワークのために区別できない光子を生成する必要がある。
ここでは、懸濁シリコン導波路とマイクロエレクトロメカニカル(MEMS)カンチレバーを組み合わせた、ファブリファブリケートフォトニック集積回路(PIC)を実証する。
カンチレバーと基板の間に最大35Vを印加すると、100 pmを超えるゼロフォノン線の可逆波長シフトが生じる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:37:24 GMT)
Efficient Diffusion Models: A Survey [33.6] 拡散モデルは高品質なコンテンツを生成できる強力な生成モデルとして登場してきた。
これらの能力は、重要な計算資源と長い生成時間のコストがかかる。
本稿では,効率的な拡散モデルの研究を体系的かつ包括的にレビューする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:15:08 GMT)
Learning to Learn Weight Generation via Trajectory Diffusion [33.0] メタ学習と拡散アルゴリズムを統合したLt-Diを提案する。
我々は、バニラ拡散アルゴリズムを軌道拡散アルゴリズムに拡張し、最適化軌道に沿って他の重みを利用する。
実験では、Lt-Diの精度を実証し、様々なタスクにおける計算オーバーヘッドを低減した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:13:59 GMT)
Detecting Backdoor Samples in Contrastive Language Image Pretraining [32.9] 対照的に、CLIP (Contrastive Language-image Pretraining) は、バックドア攻撃の危険性が指摘されている。
これにより、CLIPを使用して未調査のWebデータ上で大規模なモデルを事前トレーニングする現在のプラクティスに対するセキュリティ上の懸念が高まる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:21:05 GMT)
Radiant Foam: Real-Time Differentiable Ray Tracing [32.7] 本稿では,近似を避けつつ,スティングの効率性と再現性を維持する新しいシーン表現を提案する。
我々は、最近のコンピュータビジョン研究で見過ごされてきた何十年もの効率的なメッシュ線トレーシングアルゴリズムを活用している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:49:57 GMT)
Explaining Context Length Scaling and Bounds for Language Models [32.6] 本稿では,文脈長が言語モデリングに与える影響を説明する理論的枠組みを提案する。
我々は、自然言語と合成データの実験を行い、提案した理論的仮定と推論を検証する。
我々のフレームワークは、トレーニングデータセットのサイズが最適なコンテキスト長を規定し、特定のケースに対してコンテキスト長のスケーリングを境界とするなど、実践的な洞察を提供することができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:16:15 GMT)
SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark [32.3] マルチビューデータ作成のためのカスタマイズ可能で時間的に使いやすいデータ生成装置を提案する。
我々の静的(3D)データセットは、2kのシーンから212kの内向きと外向きの車両画像を含んでいる。
我々の動的(4D)データセットは、10k軌道からの16.8M画像を含み、それぞれが100ポイントの時間でサンプリングされる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:21:34 GMT)
On Expressive Power of Looped Transformers: Theoretical Analysis and Enhancement via Timestep Encoding [32.0] シーケンス・ツー・シーケンス関数の連続性のモジュラリティを定義することにより、ループ変換器の近似率を確立する。
実験によって理論結果が検証され、ループ数が増加すると性能が向上することが示された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:30:21 GMT)
A Benchmark and Evaluation for Real-World Out-of-Distribution Detection Using Vision-Language Models [31.9] Out-of-Distribution(OOD)検出は、推論中にサンプルを検出して、デプロイされたモデルの安全性を保証するタスクである。
我々は3つの新しいOOD検出ベンチマークを導入し,手法特性のより深い理解と実環境の反映を可能にした。
実験の結果、最近のCLIPベースのOOD検出手法は、提案された3つのベンチマークで様々な程度に困難であることが判明した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:51:16 GMT)
BVINet: Unlocking Blind Video Inpainting with Zero Annotations [31.4] そこで本稿では,視覚障害者向け視覚障害者向け視覚障害者向けインペイントネットワーク(BVINet)を提案し,同時に「インペイントの場所」と「インペイントの方法」の両方に対処する。
BVINetは、フレームのセマンティック不連続領域を検出し、ビデオに先立って時間的一貫性を利用することにより、破損した領域のマスクを予測することができる。
我々は、合成腐敗したビデオ、現実世界の破損したビデオ、およびそれに対応する完了したビデオからなるデータセットをカスタマイズする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:17:24 GMT)
The Jumping Reasoning Curve? Tracking the Evolution of Reasoning Performance in GPT-[n] and o-[n] Models on Multimodal Puzzles [29.2] OpenAIのo1とo3のリリースは、大規模言語モデルの高度な推論機能へのパラダイムシフトを表している。
GPT-[n] および o-[n] 級数モデルの進化を、挑戦的なマルチモーダルパズル上で追跡する。
o1の優れた性能は、GPT-4oの計算コストの約750倍となり、効率性への懸念が高まった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:47:04 GMT)
FourieRF: Few-Shot NeRFs via Progressive Fourier Frequency Control [29.2] 数ショット設定で高速かつ高品質な再構成を実現するための新しいアプローチであるFourieRFを紹介する。
提案手法は,明示的なカリキュラムの訓練手順によって特徴を効果的にパラメータ化し,最適化中のシーンの複雑さを漸進的に増大させる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:36:59 GMT)
Blind Channel Estimation and Joint Symbol Detection with Data-Driven Factor Graphs [29.1] 時間変化型シンボル間干渉チャネルにおけるブラインドジョイントチャネル推定およびシンボル検出のためのフレームワークの適用について検討する。
本稿では,適切な因子グラフ上の信念パラメータ(BP)アルゴリズムを用いて,後部伝播を効率よく近似することにより,この問題に対処する。
さらに,BP更新のモーメントを導入し,適切なEM更新スケジュールを学習するデータ駆動型アルゴリズムを提案する。
数値解析実験により、提案したブラインド検出器の優れた性能を示し、高信号対雑音のシナリオにおいてコヒーレントBP検出よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:18:39 GMT)
Auction-Based Regulation for Artificial Intelligence [28.9] 規制当局は、AIの展開が壊れた後に残された安全、偏見、法的な破片をゆっくりと拾い上げている。
本稿では,デバイスに適合したモデルをデプロイする動機付けを確実に行う,オークションベースの規制機構を提案する。
規制入札は,基準規制機構と比較して,コンプライアンス率を20%,参加率を15%向上させることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:56:15 GMT)
The Nonlinear Filter Model of Stream Cipher Redivivus [28.9] 非線形フィルタモデルは、セキュアストリーム暗号の設計において、古くよく理解されたアプローチである。
我々は、既知の攻撃に対して$kappa$-bitセキュアなストリーム暗号の具体的な提案を行った。
80$-bit、28$-bit、2656$-bitのセキュリティレベルの場合、対応するストリーム暗号の回路はそれぞれ1743.5、2771.5、5607.5 NANDゲートが必要である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:01:21 GMT)
Federated Linear Dueling Bandits [28.7] 近年、リコメンデータシステムや大規模言語モデルといった重要な分野に広く応用されているため、コンテキスト線形デュエルバンドイットが注目されている。
従来の研究は、協調を達成するために、バンドイットパラメータのクローズドフォーム更新に依存する、連合線形バンドイットアルゴリズムを開発した。
本研究では, 線形関数パラメータを推定するために損失関数を最小化するために) とフェデレート学習(フェデレーション学習) を組み合わせることで, この課題を克服する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:56:22 GMT)
Advancing Generalizable Remote Physiological Measurement through the Integration of Explicit and Implicit Prior Knowledge [28.3] リモート光胸腺撮影(remote photoplethysmography、r)は、顔ビデオから生理的信号をキャプチャする有望な技術である。
既存の方法の多くは r の事前の知識を見落としており、結果として一般化能力は劣る。
本稿では,rタスクにおける暗黙的,暗黙的な事前知識手法を同時に活用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:43:39 GMT)
Enhancing Environmental Robustness in Few-shot Learning via Conditional Representation Learning [27.5] ドメイン固有の視覚認識において、トレーニングデータの不足を克服するために、ショットラーニングが広く活用されている。
現実のシナリオでは、複雑な背景、様々な照明条件、長距離射撃、移動目標などの環境要因は、テスト画像に多くの不完全なターゲットやノイズ破壊を生じさせる。
本稿では,それぞれの表現過程における条件情報として,トレーニングとテスト画像間の相互作用を統合する新しい条件表現学習ネットワーク(CRLNet)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:18:03 GMT)
Efficient Model Editing with Task Vector Bases: A Theoretical Framework and Scalable Approach [27.4] 異なる目的のために、保存されたタスクベクトルを演算で操作するのは簡単だが、構成の柔軟性は高いメモリ使用量を必要とする。
この研究は、これらの問題に、タスクベクトル演算を説明し、タスクベクトルベースフレームワークを導入する理論的に基礎付けられたフレームワークで対処する。
提案手法は,競合性能を実現し,構成上の優位性を維持しつつ,ダウンストリーム演算のメモリコストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:18:26 GMT)
DyGMamba: Efficiently Modeling Long-Term Temporal Dependency on Continuous-Time Dynamic Graphs with State Space Models [27.0] 連続時間動的グラフ(CTDG)の学習モデルであるDyGMambaを提案する。
DyGMambaは、ほとんどのケースで最先端を実現していることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:40:25 GMT)
Deep Koopman-layered Model with Universal Property Based on Toeplitz Matrices [27.0] 提案モデルは理論的固さと柔軟性の両方を有する。
提案したモデルの柔軟性により、不規則な力学系から来る時系列データを適合させることができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:46:18 GMT)
Robust-LLaVA: On the Effectiveness of Large-Scale Robust Image Encoders for Multi-modal Large Language Models [26.7] MLLM(Multi-modal Large Language Models)は、視覚言語タスクにおいて優れているが、視覚的逆境の摂動に弱いままである。
既存の手法では、ImageNet-scaleデータ上でCLIPビジョンエンコーダに制約付き逆調整を適用することにより、これらのリスクを軽減する方法が提案されている。
本稿では,大規模データに対して逆向きに事前学習された既存の視覚分類モデルを活用する方法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:59:45 GMT)
Pushing the Boundaries of State Space Models for Image and Video Generation [26.4] 我々は,現在までに最大規模の拡散SSM-Transformerハイブリッドモデル(5Bパラメータ)を構築している。
以上の結果から,複雑なテキストプロンプトや時間的一貫した動画を高ダイナミックスで再現し,忠実な結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:51:09 GMT)
When LLMs Go Online: The Emerging Threat of Web-Enabled LLMs [26.3] 個人データを含むサイバー攻撃における大規模言語モデル(LLM)の誤用に関連するリスクについて検討する。
具体的には,サイバーアタックの実施を指示されたLLMエージェントがいかに強力かを理解することを目的としている。
本稿では,PII(Personally Identible Information)の収集,偽造投稿の生成,スピアフィッシングメールの作成の3つの攻撃シナリオについて検討する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:52:55 GMT)
VideoRAG: Retrieval-Augmented Generation with Extreme Long-Context Videos [25.8] VideoRAGは、非常に長いコンテキストのビデオの処理と理解に特化して設計された最初の検索拡張生成フレームワークである。
我々の中心となる革新は、(i)グラフベースのテキスト知識をシームレスに統合し、(ii)視覚的特徴を効率的に保存するマルチモーダルコンテキストエンコーディングである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:30:19 GMT)
Evolving Symbolic 3D Visual Grounder with Weakly Supervised Reflection [25.5] Evolvable Symbolic Visual Grounder (EaSe)は、3Dビジュアルグラウンドのためのトレーニング不要なシンボルフレームワークである。
EaSeはNr3Dデータセットで52.9%、ScanReferで49.2%のAcc@0.25を達成している。
推論時間とコストを大幅に削減し、パフォーマンスと効率のバランスのとれたトレードオフを提供します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:32:36 GMT)
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models [25.5] 動作関連条件をトレーニングフェーズに混合することにより,データをスケールアップする拡散トランスフォーマーベースのフレームワークを提案する。
これらの設計により、OmniHumanはデータ駆動モーション生成を完全に活用し、最終的に非常にリアルな人間のビデオ生成を実現することができる。
既存のエンドツーエンドのオーディオ駆動方式と比較して、OmniHumanはよりリアルなビデオを生成するだけでなく、入力の柔軟性も向上している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:17:32 GMT)
VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion [25.4] 本稿では,視覚ナビゲーションと移動学習のための物理的にインタラクティブな「デジタルツイン」シミュレーション環境を生成する,リアル・ツー・シム・トゥ・リアルのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:15:05 GMT)
DecTrain: Deciding When to Train a Monocular Depth DNN Online [25.4] ディープニューラルネットワーク(DNN)は、デプロイメントデータがトレーニングデータと異なる場合、精度が低下する可能性がある。
我々は,低オーバーヘッドで自己スーパービジョンを用いて,単眼深度DNNのオンライントレーニングをいつ行うかを決定する新しいアルゴリズムであるDecTrainを提案する。
DecTrainはオンライントレーニングに比べ精度を保ち、平均的なトレーニング時間は44%に過ぎません。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:04:47 GMT)
Automatically Labeling $200B Life-Saving Datasets: A Large Clinical Trial Outcome Benchmark [24.7] 臨床試験の結果は、新薬の規制承認と患者の結果に影響を与える重要な役割を担っている。
その重要性にもかかわらず、大規模で高品質な臨床試験結果データが一般に公開されていない。
完全再現可能で大規模(約125Kの薬物および生物学的試験)な臨床治験アウトカム知識ベースについて紹介する。
また,2020-2024年に行われた最近の臨床試験のマニュアルアノテーションも実施した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:16:56 GMT)
NSmark: Null Space Based Black-box Watermarking Defense Framework for Language Models [24.5] 言語モデル(LM)は、保護を必要とする重要な知的財産権(IP)資産として登場した。
本稿では,Linear Functionality Equivalence Attack (LFEA) の攻撃シナリオを分析し,LMのブラックボックス設定に拡張する。
タスクに依存しない,LL-LFEA攻撃に抵抗可能なブラックボックス型透かし方式NSmarkを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:15:34 GMT)
HFGCN:Hypergraph Fusion Graph Convolutional Networks for Skeleton-Based Action Recognition [24.5] そこで本研究では,身体の部位と体核からの距離に基づくトポロジカルな関係分類を提案する。
特に,提案モデルでは,ヒトの骨格点と異なる身体部位に同時に焦点を合わせることができる。
ハイパーグラフを用いてこれらのスケルトン点の分類的関係を表現し、ハイパーグラフをグラフ畳み込みネットワークに組み込む。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:27:51 GMT)
Reinforced Prompt Personalization for Recommendation with Large Language Models [24.4] 本稿では,個々のユーザに対して個別のプロンプトをパーソナライズすることを目的とした,インスタンスワイドプロンプトの概念を紹介する。
効率と品質を向上させるため、RPPは単語ごとの単語を検索するのではなく、文レベルでプロンプトをパーソナライズする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:18:05 GMT)
TwinMarket: A Scalable Behavioral and SocialSimulation for Financial Markets [24.4] 大規模言語モデル(LLM)エージェントは人間の振る舞いをモデル化するためのシミュレーションツールとして注目を集めている。
社会経済システムのシミュレートにLLMを活用する新しいマルチエージェントフレームワークであるTwinMarketを紹介した。
我々のアプローチは、個人の意思決定と集団社会経済パターンの間の複雑な相互作用に関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:39:48 GMT)
Dynamic Graph Unlearning: A General and Efficient Post-Processing Method via Gradient Transformation [24.2] 動的グラフアンラーニングを初めて研究し、DGNNアンラーニングを実装するための効率的で効率的で汎用的で後処理手法を提案する。
提案手法は,将来的な未学習要求を処理できる可能性があり,性能が大幅に向上する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:55:19 GMT)
Flow-based Domain Randomization for Learning and Sequencing Robotic Skills [24.2] 強化学習におけるドメインランダム化は、シミュレーションで訓練された制御ポリシーの堅牢性を高めるための確立された手法である。
本稿では,ニューラルサンプリング分布のエントロピー規則化報酬によるサンプリング分布の自動検出について検討する。
このアーキテクチャは、より単純でパラメータ化されたサンプリング分布を学習する既存のアプローチよりも柔軟であることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:25:50 GMT)
Enhancing Feature Tracking Reliability for Visual Navigation using Real-Time Safety Filter [23.9] 視覚センサーはロボットのポーズのローカライズに広く使われている。
信頼できる機能追跡と正確なポーズ推定のためには、十分な数の機能の可視性を維持することが不可欠である。
本稿では,2次プログラミングに基づくリアルタイム安全フィルタを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:26:04 GMT)
FALCON: Fine-grained Activation Manipulation by Contrastive Orthogonal Unalignment for Large Language Model [23.7] 本研究では,FALCON(Contrastive Orthogonal uNalignment)による微細な活性化マニピュレーションを,表現誘導型未学習アプローチとして提案する。
FALCONは、モデルユーティリティを維持しながら、より優れた非学習効率を実現し、知識回復の試みに対して堅牢な抵抗を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:05:15 GMT)
Generalized Lanczos method for systematic optimization of neural-network quantum states [23.5] 量子多体計算の分野では、ニューラルネットワーク量子状態(NQS)に基づく解法を開発する。
そこで我々は,多体系のNQSを改善するための体系的アプローチを開発するために,教師付き学習,強化学習,およびLanczos法を組み合わせる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:36:46 GMT)
Soup-of-Experts: Pretraining Specialist Models via Parameters Averaging [23.4] Soup-of-Expertsは、最小の計算コストでテスト時にモデルをインスタンス化できます。
提案手法は,複数の言語モデリングタスクにおいて,小さな特化モデルを迅速に獲得する方法を実証する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:33:20 GMT)
Skewed Memorization in Large Language Models: Quantification and Decomposition [23.1] LLM(Large Language Models)のメモリ化は、プライバシとセキュリティのリスクを引き起こす。
本稿では,教師付き微調整(SFT)の記憶について検討し,トレーニング期間,データセットサイズ,サンプル間類似度との関係について検討する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:23:53 GMT)
DiffIM: Differentiable Influence Minimization with Surrogate Modeling and Continuous Relaxation [23.1] 影響最小化(IMIN)は、ノード間の伝播を減らすために入力グラフの構造を操作する問題である。
DiffIMは、加速のための2つの異なるスキームを持つIMINの新しい手法である。
提案手法は,IMINの性能劣化をほとんど(あるいは全く)伴わず,性能を著しく向上させることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:54:23 GMT)
CollabEdit: Towards Non-destructive Collaborative Knowledge Editing [23.0] この写本は、共同知識編集の第1回研究に掘り下げられている。
知識の重複、知識の衝突、知識の忘れという3つの課題を特定します。
グローバルなKE動作を模倣する新しいモデルマージ機構を用いた非破壊的協調型KEフレームワークであるCOLLABEDITを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:17:43 GMT)
Position: Towards a Responsible LLM-empowered Multi-Agent Systems [22.9] Agent AIとLarge Language Model-powered Multi-Agent Systems (LLM-MAS)の台頭は、責任と信頼性のあるシステム操作の必要性を浮き彫りにした。
LLMエージェントは固有の予測不能を示し、出力の不確実性は複雑になり、システムの安定性を脅かす。
これらのリスクに対処するためには、アクティブな動的モデレーションを備えた人間中心の設計アプローチが不可欠である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:04:30 GMT)
Towards Robust and Reliable Concept Representations: Reliability-Enhanced Concept Embedding Model [22.9] 概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、人間の理解可能な概念を意思決定の中間体として予測することにより、解釈可能性を高めることを目的としている。
概念に関係のない特徴に対する感受性と、異なるサンプルの同じ概念に対する意味的一貫性の欠如である。
本稿では,Reliability-Enhanced Concept Embedding Model (RECEM) を提案する。Reliability-Enhanced Concept Embedding Model (RECEM) は2つの戦略を導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:29:39 GMT)
Mixture of Knowledge Minigraph Agents for Literature Review Generation [22.8] 本稿では,学術文献レビューの自動化を目的とした,共同知識ミニグラフエージェント(CKMA)を提案する。
新たなプロンプトベースのアルゴリズムである知識ミニグラフ構築エージェント(KMCA)は、学術文献から概念間の関係を識別し、知識ミニグラフを自動的に構築するように設計されている。
構築された知識ミニグラフにおける大規模言語モデルの能力を活用することにより、多経路要約エージェント(MPSA)は、異なる視点から概念や関係を効率的に整理し、文献レビュー段落を生成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:11:25 GMT)
Peering Behind the Shield: Guardrail Identification in Large Language Models [22.8] 本研究では,AIエージェントを問合せするために,ガードレール固有の敵プロンプトを活用することにより,候補ガードレールの存在を識別する新しい手法であるAP-Testを提案する。
各種シナリオ下での4つのガードレールの大規模実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:02:30 GMT)
Counterfactual Situation Testing: From Single to Multidimensional Discrimination [22.6] 本稿では,意思決定データセットにおける個人識別のための因果データマイニングフレームワークであるCSTについて述べる。
CSTは、"モデルの結果が、個人、または不平が異なる保護された状態であった場合はどうだったのか?
反実的推論による差異を考慮し、公正性の概念を運用することで、法的根拠のある状況テスト(ST)を拡張します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:38:48 GMT)
On The Concurrence of Layer-wise Preconditioning Methods and Provable Feature Learning [22.5] 統計的観点から,レイヤワイドプレコンディショニング手法が確実に必要であることを示す。
我々は,SGDが理想的等方性入力を超えて拡張する際の準最適特徴であることを示す。
我々は、Adamプリコンディショニングやバッチノームのような標準ツールがこれらの問題を緩やかに緩和することを示します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:08:32 GMT)
GTG: Generalizable Trajectory Generation Model for Urban Mobility [22.4] スマートシティ管理には、軌道データマイニングが不可欠だ。
既存の軌道生成手法は都市のグローバルな道路ネットワーク構造に依存している。
本稿では、一般化可能な軌道生成モデル(GTG)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:53:35 GMT)
Topic-FlipRAG: Topic-Orientated Adversarial Opinion Manipulation Attacks to Retrieval-Augmented Generation Models [22.3] 本稿では,関連するクエリに対する意見に影響を及ぼすために,敵の摂動を利用する2段階の操作攻撃パイプラインを提案する。
実験により、提案した攻撃は特定のトピックに対するモデルの出力の意見を効果的にシフトさせることが示されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:21:42 GMT)
Docking-Aware Attention: Dynamic Protein Representations through Molecular Context Integration [22.2] 動的にコンテキスト依存的なタンパク質表現を生成する新しいアーキテクチャであるDocking-Aware Attention (DAA)を提案する。
本手法は,従来の最先端手法よりも優れた酵素反応予測法である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:52:38 GMT)
People Attribute Purpose to Autonomous Vehicles When Explaining Their Behavior: Insights from Cognitive Science for Explainable AI [22.1] 効果的な人間中心の説明可能な人工知能(XAI)は人間の推論によく似ているとしばしば主張されている。
本稿では, 機械的, 遠隔的, あるいは反現実的を問わず, 人々がどのように説明を行うかを分析するための説明モードの枠組みを提案する。
我々の主な発見は、参加者がテレロジカルな説明を、反ファクト的な説明よりもはるかに良い品質とみなし、テレロジカルな表現が、知覚された品質の最良の予測因子であると認識していることである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:49:26 GMT)
Efficient Denial of Service Attack Detection in IoT using Kolmogorov-Arnold Networks [22.0] 本稿では,KAN(Kolmogorov-Arnold Networks)に基づくDoS攻撃検出の新しい軽量アプローチを提案する。
Kanは、最小限のリソース要件を維持しながら、最先端の検知性能を達成する。
既存のソリューションと比較して、kanは競合検出率を維持しながら、メモリ要求を最大98%削減する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:19:46 GMT)
Efficient rule induction by ignoring pointless rules [22.0] ポイントレスルールを識別するLPアプローチを導入する。
ルールが冗長リテラルを含んでいるか、負の例と区別できない場合、無意味である。
点のない規則を無視した場合、ICPシステムでは仮説空間を順調に引き起こすことができることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:46:18 GMT)
Process-Supervised Reinforcement Learning for Code Generation [21.9] 結果管理に基づく既存の強化学習戦略は,コード生成のための大規模言語モデルの性能向上に有効であることが証明されている。
本稿では,複雑なコード生成タスクに対処するためのプロセス教師付き強化学習戦略を提案する。
本研究では,プロセス指導強化学習が,結果管理のみに依存する手法をはるかに上回っていることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:22:06 GMT)
CLIP-UP: A Simple and Efficient Mixture-of-Experts CLIP Training Recipe with Sparse Upcycling [21.7] Mixture-of-Experts(MoE)モデルは、推論コストを制御しながらモデルキャパシティのスケーリングに不可欠である。
CLIP-Upcycling(CLIP-UP)は,事前学習したCLIPモデルをスパースMoEアーキテクチャに変換する,効率的な代替トレーニング戦略である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:04:50 GMT)
Spectral Estimators for Multi-Index Models: Precise Asymptotics and Optimal Weak Recovery [21.4] スペクトル推定器を用いて信号が分散する部分空間の復元に焦点をあてる。
我々の主な技術的貢献はスペクトル法の性能を正確に評価することである。
分析の結果,サンプルの複雑さが増大するにつれて固有値がスペクトルの大部分から逃れる相転移現象が明らかになった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:08:30 GMT)
Exploring Prosocial Irrationality for LLM Agents: A Social Cognition View [21.3] 大規模言語モデル(LLM)は、人間のバイアスを頻繁に含んでいるデータのために幻覚に直面することが示されている。
幻覚特性を利用してLLMエージェントのソーシャルインテリジェンスを評価し,強化するオープンエンドマルチLLMエージェントフレームワークであるCogMirを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:22:35 GMT)
Reducing Ciphertext and Key Sizes for MLWE-Based Cryptosystems [21.3] パラメータ集合Kyber1024に対して,暗号文と秘密鍵のサイズを25%削減できることを示す。
さらに,256ビットのAES鍵を共有するために使用される1つのKyber暗号ブロックに対して,Kyber1024とKyber512では,暗号文サイズが39%,33%削減可能であることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:33:27 GMT)
A Privacy-Preserving Domain Adversarial Federated learning for multi-site brain functional connectivity analysis [21.2] Domain Adversarial Federated Learning (DAFed)は、非IID fMRIデータ解析を多地点で行うための新しいディープラーニングフレームワークである。
DAFedは、これらの課題に、機能分離を通じて対処し、潜在機能空間をドメイン不変およびドメイン固有コンポーネントに分解する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:26:07 GMT)
Learning Human Perception Dynamics for Informative Robot Communication [21.2] CoNav-Mazeは、ロボットが局所的な知覚を用いてナビゲートし、人間のオペレーターが不正確な地図に基づいてガイダンスを提供するシミュレーションロボット環境である。
効率的な人ロボット協調を実現するため,情報ゲインモンテカルロ木探索(IG-MCTS)を提案する。
Central to IG-MCTSは、人間がロボットのコミュニケーションからどのように情報を抽出するかを推定する、人間の知覚力学モデルである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:08:04 GMT)
Symmetry-Aware Generative Modeling through Learned Canonicalization [21.0] 対称密度の生成モデリングは、薬物発見から物理シミュレーションまで、AIの科学への応用範囲がある。
我々は、軌道毎の1つの代表要素のみが学習されるように、学習された密度のスライスをモデル化することを提案する。
分子モデルに関する予備実験の結果は有望であり, 改良された試料品質と高速な推論時間を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:33:20 GMT)
MakeAnything: Harnessing Diffusion Transformers for Multi-Domain Procedural Sequence Generation [21.0] MakeAnythingは拡散トランスフォーマー(DIT)に基づくフレームワークで、細調整を利用して、一貫した手続きシーケンスを生成するためにDITのコンテキスト内機能を活性化する。
また、画像生成のための非対称低ランク適応(LoRA)を導入し、デコーダ層を適応的に調整しながらパラメータを凍結することで、タスク固有性能を一般化する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:55:30 GMT)
Re-examining Double Descent and Scaling Laws under Norm-based Capacity via Deterministic Equivalence [20.9] パラメータの数よりも重みの点で、二重降下法則とスケーリング法則について検討する。
本研究の結果は,ノルムベースキャパシティの下で二重降下が存在するかどうかを厳格に答え,対応するスケーリング法則を再形成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:10:40 GMT)
Almost Surely Safe Alignment of Large Language Models at Inference-Time [20.5] 高い能力を持つ大規模言語モデル(LLM)でさえ、バイアスや安全でない応答を発生させることができる。
本稿では,新しい推論時間アライメント手法を提案する。
我々は、マルコフ決定プロセスとして安全な推論時間応答をフレーミングすることでこれを達成している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:59:32 GMT)
Asymptotic and Finite Sample Analysis of Nonexpansive Stochastic Approximations with Markovian Noise [20.5] 本研究は、単に拡張的でない作用素との近似を研究する。
特にマルコフ雑音による非拡張近似について検討する。
応用として、古典的な平均報酬時間差学習が標本経路依存の固定点に収束することを初めて証明する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:14:27 GMT)
Approximate Nearest Neighbour Search on Dynamic Datasets: An Investigation [20.4] 近似k-Nearest Neighbour (ANN) 法は情報マイニングや大規模高次元データセットでの機械学習支援によく用いられる。
静的なデータセットを持つアプリケーションでは、ランタイム制約とデータセットプロパティを使用して、適切な操作特性を持つANNメソッドを経験的に選択することができる。
従来の評価手法は、インデックス構造を更新する際の計算コストや、インデックス更新の率とサイズを考慮していない。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:46:29 GMT)
Marrying Causal Representation Learning with Dynamical Systems for Science [20.4] 因果表現学習は、生の絡み合った測定から隠れた因果変数に因果モデルを拡張することを約束する。
本稿では,2つの仮定とそれらの重要な仮定との間に明確な関係を描いている。
我々は、より下流のタスクに対して、軌跡固有のパラメータを分離する制御可能なモデルを明示的に学習する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:58:49 GMT)
Axiomatic Causal Interventions for Reverse Engineering Relevance Computation in Neural Retrieval Models [20.3] 本稿では,ニューラルランサーのリバースエンジニアリングにおける因果介入法を提案する。
本稿では, 項周波数公理を満たす成分を分離するために, 機械的解釈可能性法をどのように利用できるかを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:00:06 GMT)
Generative AI for fast and accurate statistical computation of fluids [20.0] 高速で正確で頑健な統計計算のプレスタスクに対処する生成AIアルゴリズムを提案する。
GenCFDと呼ばれる我々のアルゴリズムは、エンドツーエンドの条件付きスコアベース拡散モデルに基づいている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:58:10 GMT)
Learning Fused State Representations for Control from Multi-View Observations [19.9] MVRL(Multi-view Reinforcement Learning)は、エージェントに多視点観察を提供し、より有効で精度の高い環境を認識できるようにする。
MVRLの最近の進歩は、多視点観測から潜在表現を抽出し、制御タスクに活用することに焦点を当てている。
まず,MVRLにバイシミュレートメトリック学習を取り入れ,タスク関連表現を学習する多視点統合制御(MFSC)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:46:02 GMT)
CLIP-DQA: Blindly Evaluating Dehazed Images from Global and Local Perspectives Using CLIP [19.8] Blind dehazed Image Quality Assessment (BDQA) は、参照情報なしでデハズド画像の視覚的品質を正確に予測することを目的としている。
本稿では,BDQAタスクに対して,大規模画像テキストペア上で事前学習したコントラスト言語画像事前学習(CLIP)を適用することを提案する。
提案手法はCLIP-DQAと呼ばれ,既存のBDQA手法よりも高精度な品質予測を実現する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:12:25 GMT)
Can Domain Experts Rely on AI Appropriately? A Case Study on AI-Assisted Prostate Cancer MRI Diagnosis [19.7] MRI画像を用いた前立腺癌診断において,放射線科医と深く連携する。
インターフェースを開発し、AIアシストとパフォーマンスフィードバックがドメインエキスパートの意思決定をどのように形作るかを研究する2つの実験を行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:38 GMT)
Spurious Correlations in High Dimensional Regression: The Roles of Regularization, Simplicity Bias and Over-Parameterization [19.3] 学習モデルは、トレーニングデータ内の非予測的特徴と関連するラベルとの間に急激な相関関係があることが示されている。
我々は、データ共分散とリッジ正規化の強さの点から、線形回帰によって学習されたスプリアス相関の量$C$を定量化する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:38:42 GMT)
VILP: Imitation Learning with Latent Video Planning [19.3] 本稿では、遅延ビデオ計画(VILP)による模倣学習を紹介する。
複数のビューから高度にタイムアラインなビデオを生成することができる。
本稿では,映像生成モデルをロボットポリシーに効果的に統合する方法の実践例を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:55:57 GMT)
Coarse-to-Fine 3D Keyframe Transporter [18.8] Keyframe Imitation Learning (IL)は、学習ベースのエージェントが様々な操作タスクを解くことを可能にする。
この研究は、キーフレームIL内の二変量対称性を特定し、グリップによって把握されるワークスペースとオブジェクトの両方の変換を一般化するポリシーを設計する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:26:30 GMT)
kNN Retrieval for Simple and Effective Zero-Shot Multi-speaker Text-to-Speech [18.7] kNN-TTSは、ゼロショットマルチ話者テキスト音声合成のためのシンプルで効果的なフレームワークである。
我々のモデルは、1つの話者から書き起こされた音声に基づいて訓練され、最先端のモデルに匹敵する性能を達成する。
また、微細な音声モーフィングを可能にするパラメータも導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:47:44 GMT)
Improved Training Technique for Latent Consistency Models [18.6] 一貫性モデルは、単一のステップまたは複数のステップで高品質なサンプルを生成することができる。
画素空間と潜伏空間の統計的差異を解析し、潜伏データがしばしば非常にインパルス的な外れ値を含むことを発見した。
我々は,早期に拡散損失を導入し,さらに性能を高めるために最適な輸送(OT)結合を用いる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:25:58 GMT)
Preparing for Kyber in Securing Intelligent Transportation Systems Communications: A Case Study on Fault-Enabled Chosen-Ciphertext Attack [18.6] キーカプセル化機構を標準化したキーカプセル化機構であるKyberを用いて,ITS通信をセキュアにするための一般化手法を提案する。
我々は、ITSアプリケーションのセキュリティレベルをKyberの3つのバージョンにマッピングしながら、ITS通信のための暗号化と復号システムを修正した。
キーバーのセキュリティレベルが異なる場合の暗号化と復号時間とシークレットキーを復元するのに要するイテレーションの総数を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:51:11 GMT)
Encrypted Large Model Inference: The Equivariant Encryption Paradigm [18.5] Equivariant Encryption(EE)は,暗号化されたデータに対して,性能上のオーバーヘッドがゼロに近いセキュアな"盲目"推論を可能にするように設計された,新しいパラダイムである。
計算グラフ全体を暗号化する完全同型アプローチとは異なり、EEはニューラルネットワーク層内の重要な内部表現を選択的に難読化する。
EEは高い忠実性とスループットを維持しており、ロバストなデータの機密性と、現代的な大規模モデル推論の厳密な効率要件の間のギャップを効果的に埋めています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:05:20 GMT)
Dolphin: A Programmable Framework for Scalable Neurosymbolic Learning [18.5] 我々はPythonでニューロシンボリックプログラムをサポートするフレームワークであるDolphinを紹介した。
13のベンチマークでテキスト、画像、ビデオデータにまたがるタスクを網羅し、Dolphinは最先端のアキュラシーに収束する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:05:36 GMT)
Hamming Attention Distillation: Binarizing Keys and Queries for Efficient Long-Context Transformers [18.5] 本稿では,ハミング注意蒸留(HAD)について紹介する。これは注意機構のキーとクエリをバイナライズして,大幅な効率向上を実現するフレームワークである。
我々は,HADをカスタムハードウェアシミュレーションに実装し,標準的なハードウェア実装と比較して優れた性能特性を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:24:01 GMT)
CleanPose: Category-Level Object Pose Estimation via Causal Learning and Knowledge Distillation [18.5] カテゴリーレベルのオブジェクトポーズ推定は、事前に定義されたカテゴリ内の未確認インスタンスの回転、翻訳、サイズを復元することを目的としている。
ディープニューラルネットワークベースの手法は、優れたパフォーマンスを示しているが、"非クリーン"な共同設立者によって引き起こされた急激な相関に悩まされている。
因果学習と知識蒸留を統合してカテゴリーレベルのポーズ推定を強化する新しいアプローチであるCleanPoseを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:41:36 GMT)
CATSplat: Context-Aware Transformer with Spatial Guidance for Generalizable 3D Gaussian Splatting from A Single-View Image [18.4] 単視点3Dシーン再構成のための新しい一般化可能なトランスフォーマーベースのフレームワークであるCATSplatを紹介する。
シーン固有のコンテキストの詳細をテキスト埋め込みからクロスアテンションに組み込むことで、コンテキスト認識の再構築の道を開く。
大規模データセットを用いた実験により, 単視点3次元シーン再構成におけるCATSplatの最先端性能が実証された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:06:36 GMT)
Discovering Hidden Visual Concepts Beyond Linguistic Input in Infant Learning [18.4] コンピュータビジョンが人間の視覚システムを再現しようとすると、幼児の視覚発達を理解することは貴重な洞察を与えるかもしれない。
モデルの内部表現に隠れた視覚概念ニューロンを発見できる学習自由フレームワークを提案する。
我々の研究は、幼児の視覚的および言語的入力に基づいて訓練された計算モデルの内部表現を分析することによって、認知科学とコンピュータビジョンを橋渡しする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:02:56 GMT)
Online Gradient Boosting Decision Tree: In-Place Updates for Efficient Adding/Deleting Data [18.2] 本稿では,段階学習と退行学習の両方をサポートするGBDTのための効率的なオンライン学習フレームワークを提案する。
学習コストを削減するため、我々はフレームワークに最適化の集合を提示し、オンザフライで少量のデータを追加または削除できるようにした。
バックドア攻撃の結果は、我々のフレームワークが十分に訓練されたモデルでバックドアを注入して除去できることを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:04 GMT)
GPT as a Monte Carlo Language Tree: A Probabilistic Perspective [18.0] 大規模言語モデル(LLM)は、大規模ウェブクローリングデータセット内の潜伏分布を学習すると考えられている。
本稿では,モンテカルロ言語木を用いて任意の言語データセットを表現できる,という新しい視点を提案する。
実験の結果、同じデータセット上でトレーニングされた異なるGPTモデルが、GPT-Tree可視化において大きな構造的類似性を示すことがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:19:24 GMT)
Learning to Partially Defer for Sequences [18.0] モデル全体の予測の特定の出力を専門家に推論できるシーケンス出力のL2D設定を提案する。
また、旅行セールスマンソルバやニュース要約モデルにおいて、こうした粒度のデリラルが全デリラルよりもコスト精度のトレードオフを達成できることを実証的に示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:50:11 GMT)
BC-GAN: A Generative Adversarial Network for Synthesizing a Batch of Collocated Clothing [17.9] ジェネレーティブネットワークを用いたコラボレーション型衣料合成は、ファッション業界における収益を上げるための経済的価値を著しく高めている。
我々はBC-GANと呼ばれる新しいバッチ衣料品生成フレームワークを導入し、複数の視覚的に配置された衣料品画像を同時に合成することができる。
われわれのモデルは、自分自身で構築した互換性のある装束を備えた大規模データセットで検証された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:41:41 GMT)
UVGS: Reimagining Unstructured 3D Gaussian Splatting using UV Mapping [17.9] 3D Gaussian Splatting (3DGS)は3Dオブジェクトやシーンのモデリングにおいて優れた品質を示している。
しかし、3DGSの生成は、その離散的、非構造的、置換不変の性質のため、依然として困難である。
球面マッピングを用いて3DGSをUVGSと呼ばれる構造化された2次元表現に変換する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:46:30 GMT)
P4GCN: Vertical Federated Social Recommendation with Privacy-Preserving Two-Party Graph Convolution Network [17.9] プライバシ保護二要素グラフ畳み込みネットワーク(P4GCN)を利用した新しい縦型ソーシャルレコメンデーション手法を提案する。
P4GCNは推奨精度で最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:39:47 GMT)
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer [17.9] LayerTracerは拡散トランスフォーマーで、設計者の階層化された生成プロセスを、シーケンシャルな設計操作の新たなデータセットから学習することでギャップを埋める。
画像ベクトル化には,参照画像を潜在トークンにエンコードする条件拡散機構を導入する。
実験では、生成品質と編集性の両方において、最適化ベースとニューラルベースラインに対してLayerTracerの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:49:58 GMT)
Theoretical Analysis of KL-regularized RLHF with Multiple Reference Models [17.9] 厳密な統計分析を含む包括的理論的枠組みを導入し,複雑さの保証を提供する。
我々は分析を拡張し、KL規則化されたRLHFを前進させ、サンプルの複雑性要求に対する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:50:30 GMT)
DAWN: Domain-Adaptive Weakly Supervised Nuclei Segmentation via Cross-Task Interactions [17.7] 現在の弱い制御された核分割アプローチは、2段階の擬似ラベル生成とネットワークトレーニングプロセスに従う。
本稿では,クロスタスクインタラクション戦略を用いたドメイン適応型弱教師付き核セグメンテーションフレームワークを提案する。
提案手法の有効性を検証するため,6つのデータセットに対して広範囲な比較・アブレーション実験を行った。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:51:36 GMT)
CE-LoRA: Computation-Efficient LoRA Fine-Tuning for Language Models [17.6] Low-Rank Adaptation (LoRA)は、微調整時のメモリ消費を大幅に軽減する。
本稿では,メモリ効率を保ちながら計算効率を向上する計算効率LoRA(CE-LoRA)アルゴリズムを提案する。
実証評価の結果,CE-LoRAは性能劣化のないLoRAと比較して計算コストを著しく削減することがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:15:33 GMT)
Preference VLM: Leveraging VLMs for Scalable Preference-Based Reinforcement Learning [17.6] 視覚言語モデル(VLM)と選択的フィードバックを統合するフレームワークであるPrefVLMを紹介する。
提案手法はVLMを利用して初期選好ラベルを生成する。
メタワールド操作タスクの実験は、PrefVLMが最先端の手法に匹敵する成功率または優れた成功率を達成することを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:50:15 GMT)
Memorization Inheritance in Sequence-Level Knowledge Distillation for Neural Machine Translation [17.5] 我々は,教師ニューラル機械翻訳(NMT)モデルにおけるインスタンスレベルの記憶が,シーケンスレベルの知識蒸留(SeqKD)における学生モデルによってどのように継承されるかを検討する。
トレーニングデータを直接は見ていないが,学生はベースラインモデル以上に記憶し,幻覚率の向上を示した。
本稿では,記憶と幻覚を減らすためにSeqKDに介入するAdaptive-SeqKDというSeqKDの修正を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:26:06 GMT)
Near-Optimal Algorithms for Making the Gradient Small in Stochastic Minimax Optimization [17.5] 本研究では,スムーズなミニマックス最適化のための準定常点を求める問題について検討する。
コンベックスコンケーブ・コンケーブの両ケースにおいて, RAIN (SFO) が最小限の最適化を実現することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:42:21 GMT)
Quantum work statistics across a critical point: full crossover from sudden quench to the adiabatic limit [17.4] 断熱的および急激なクエンチ限界は詳細に研究されているが、これらの限界を繋ぐ交差する量子ワークの統計は、おおむねオープンな問題である。
ここでは、重要な量子不純物問題に対して、断熱から急激な待ち行列までの全交叉に沿った作業統計量の正確なスケーリング関数を得る。
これらの予測は、放散された作業が非自明な励起の生成に対応する、電荷チャネルのコンド量子ドットデバイスでテストすることができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:36:07 GMT)
Remote Blood Oxygen Estimation From Videos Using Neural Networks [17.3] 血液酸素飽和度(SpO$$)は呼吸機能の不可欠な指標であり、新型コロナウイルスのパンデミックで注目されている。
スマートフォンカメラを用いた最初の畳み込みニューラルネットワークに基づく非接触SpO$推定方式を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:46:35 GMT)
Task-free Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation [17.2] 従来の課題から得たデータのサブセットを格納し,学習スキルを維持するために経験的リプレイを活用することと,関連する知識を回復するために新しい検索型局所適応技術を適用することの2つの方法により活用する。
我々はまた、最も「忘れられた」スキルセグメントに集中し、効果的な知識回復を確保するために、選択的な重み付け機構も組み込んだ。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:08:50 GMT)
ReFusion: Learning Image Fusion from Reconstruction with Learnable Loss via Meta-Learning [17.2] ReFusionはメタ学習ベースのイメージ融合フレームワークである。
ソース画像再構成により、様々なタスクの融合損失を動的に最適化する。
赤外線可視、医療、マルチフォーカス、マルチ露光画像融合など、様々なタスクに適応することができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:16:34 GMT)
Investigating the Quality of DermaMNIST and Fitzpatrick17k Dermatological Image Datasets [17.0] 重複の有無、トレインテストのパーティション間のデータリーク、ラベルの誤り、明確に定義されたテストパーティションの欠如など、いくつかの要因がデータ品質に影響を与える可能性がある。
我々はDrmaMNISTのソースであるHAM10000とFitzpatrick17kの3つの一般的な皮膚画像データセットを綿密に分析する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:30:57 GMT)
Decoding FL Defenses: Systemization, Pitfalls, and Remedies [16.9] FL(Federated Learning)のディフェンスを評価するためのガイドラインはありません。
FLディフェンスの総合的なシステム化を3次元に沿って設計する。
我々は,トップレベル防衛紙50点を調査し,それらの評価設定でよく使用されるコンポーネントを特定した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:14:02 GMT)
Active Symbolic Discovery of Ordinary Differential Equations via Phase Portrait Sketching [16.6] 位相ポートレート・スケッチ(APPS)による正規微分方程式のアクティブ発見について紹介する。
APPSはまず位相空間内の情報領域を特定し、その後、この領域から初期条件のバッチをサンプリングする。
受動的に収集されたデータセットを使用して、ベースラインメソッドよりも正確なODE式を一貫して発見する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:45:31 GMT)
Deep Unfolding Multi-modal Image Fusion Network via Attribution Analysis [16.6] セマンティックセグメンテーションのために、より効率的に融合画像を調整するための「Unfolding Analysis Fusion Network」 (UAAFusion) を提案する。
帰属分析技術を用いて,課題識別のためのソース画像中の意味領域の寄与を探索する。
提案手法は,帰属分析から導かれる最適化目的を用いたモデル駆動型展開ネットワークを構築する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:00:21 GMT)
E2Map: Experience-and-Emotion Map for Self-Reflective Robot Navigation with Language Models [16.5] 大規模言語モデル(LLM)は、言語命令を実行するためのエンボディエージェントを誘導する大きな可能性を示している。
既存の手法は主に静的環境向けに設計されており、エージェント自身の経験を生かして初期計画を洗練しない。
本研究は,LLMの知識とエージェントの現実世界の経験を統合した経験・感情マップ(E2Map)を紹介する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:26:49 GMT)
VarDrop: Enhancing Training Efficiency by Reducing Variate Redundancy in Periodic Time Series Forecasting [16.2] 可変トークン化は時系列予測において著しく改善されている。
トレーニング中に冗長な可変トークンを省略することによりトークン使用量を削減する戦略であるVarDropを提案する。
VarDropは、与えられたバッチ内で冗長トークンを適応的に排除し、ドット生成注意のために使用されるトークンの数を削減します。
公開ベンチマークデータセットで実施された実験は、VarDropが既存の効率的なベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:21:05 GMT)
PDE-Controller: LLMs for Autoformalization and Reasoning of PDEs [16.0] 偏微分方程式(PDE)によって制御されるシステムを制御するためのフレームワークであるPDE-Controllerを提案する。
提案手法により,LLMは非公式な自然言語命令を形式仕様に変換し,PDE制御の実用性を改善するための推論と計画手順を実行することができる。
私たちのPDE-Controllerは、推論、オートフォーマル化、プログラム合成において、最新のオープンソースおよびGPTモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:03:41 GMT)
Self-Improving Transformers Overcome Easy-to-Hard and Length Generalization Challenges [16.0] 大規模言語モデルは、しばしば、トレーニング分布を超えて、長さの一般化と複雑な問題インスタンスの解決に苦労する。
モデルが自身のソリューションから反復的に生成し、学習する自己改善アプローチを提案する。
本研究は,制御された弱強曲線がモデル論理外挿法を体系的に教える方法を示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:45:22 GMT)
Log Parsing using LLMs with Self-Generated In-Context Learning and Self-Correction [15.9] 近年の大規模言語モデル(LLM)の出現は、自然言語やコードを理解する上で強力な能力を示している。
Adaは、自己生成型インコンテキスト学習(SG-ICL)と自己補正を備えたLLMを用いた、効果的で適応的なログ解析フレームワークである。
Adaはゼロショットのシナリオであっても、すべてのメトリクスで最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:11:36 GMT)
One-to-Normal: Anomaly Personalization for Few-shot Anomaly Detection [15.8] 本稿では,問合せ画像のパーソナライズされた1対正規変換を行う異常パーソナライズ手法を提案する。
また,クエリと生成した異常なデータプールとの包括的比較と情報伝達を行う3重対照的な異常推論戦略を提案する。
提案手法は,他のAD手法に柔軟に転送できることが証明され,生成した画像データは,他のAD手法の性能を効果的に向上する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:49:01 GMT)
Plan-Then-Execute: An Empirical Study of User Trust and Team Performance When Using LLM Agents As A Daily Assistant [15.7] 大きな言語モデル(LLM)は、私たちの日常生活に影響を与え続けています。
近年の作業では,計画作業における「LLM-modulo」設定と人為的に行うことの重要性が強調されている。
それぞれの段階でのユーザ関与が、信頼と協力的なチームのパフォーマンスにどのように影響するかを分析しました。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:23:22 GMT)
Unified Breakdown Analysis for Byzantine Robust Gossip [15.7] 分散機械学習では、異なるデバイスがピアツーピアで通信し、互いのデータから協調的に学習する。
我々は、堅牢な分散アルゴリズムを構築するための一般的なフレームワークである$mathrmFtext-rm RG$を紹介した。
分散化されたアルゴリズムが許容できる敵の数に上限があることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:16:23 GMT)
SIMPLOT: Enhancing Chart Question Answering by Distilling Essentials [15.5] 本稿では,チャート推論に必要な要素のみを抽出するSIMPLOTを提案する。
私たちのモデルは、追加のアノテーションやデータセットを必要とせずに、正確なチャート推論を可能にします。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:53:26 GMT)
The in-context inductive biases of vision-language models differ across modalities [15.5] 一般化は、刺激が提示されるモダリティと、刺激がテキストで記述される方法によってどのように変化するかを調べる。
モデルは通常、色よりも形状に応じて一般化する傾向を示す。
これらの結果は、視覚言語モデルがコンテキスト内の異なるタイプの入力をどのように表現するかを明らかにするのに役立つ。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:11:03 GMT)
Multimodal Inverse Attention Network with Intrinsic Discriminant Feature Exploitation for Fake News Detection [15.5] マルチモーダルフェイクニュース検出は、社会保障に深く影響しているため、大きな注目を集めている。
本稿では,ニュースコンテンツに基づく固有識別特徴を探索し,偽ニュース検出を推し進める新しい枠組みを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:58:22 GMT)
Data-Efficient Model for Psychological Resilience Prediction based on Neurological Data [15.4] 本稿では,神経学的データの不足に対処する新しいデータ効率モデルを提案する。
我々は予測モデルの構造としてNeuro Kolmogorov-Arnold Networksを採用している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:15:15 GMT)
What is a Number, That a Large Language Model May Know It? [15.3] 数字は、人間が周囲の世界をどのように表現し、表現するかの基本的な部分である。
大規模言語モデルは、テキスト入力から番号が何であるかを学ばなければならない。
LLMは文字列や数値表現をブレンドした表現空間を学習する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:17:26 GMT)
Logits are All We Need to Adapt Closed Models [15.2] 多くの商用の大規模言語モデル(LLM)は、しばしばクローズドソースであり、開発者は特定のアプリケーションとコンテンツ生成の調整を迅速に行うことができる。
このようなアクセスが利用可能であれば、迅速なエンジニアリングを超えて、より強力な適応技術を可能にするだろう、と私たちは主張する。
ブラックボックスのLCMをアプリケーション固有のコンテンツ生成に向け,トークンレベルの確率再重み付けフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:24:22 GMT)
Fisher-Rao Gradient Flows of Linear Programs and State-Action Natural Policy Gradients [15.2] 状態-作用分布のフィッシャー情報行列に基づく別の自然勾配法について検討する。
我々はフィッシャー・ラオ勾配流と自然勾配流の線形収束を近似誤差まで示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:40:30 GMT)
Secure Information Embedding in Forensic 3D Fingerprinting [15.2] SIDEは3Dプリンティングに適した新しいフィンガープリントフレームワークである。
SIDEは、セキュアな情報埋め込みと抽出の両方を提供することで、3Dプリントの敵対的課題に対処する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:14:14 GMT)
LMAct: A Benchmark for In-Context Imitation Learning with Long Multimodal Demonstrations [15.1] 今日の意思決定モデルのプレッシャーテストにベンチマークを提示する。
モデルが専門家による実演の回数をその文脈で学べるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:26:42 GMT)
Evaluation of Large Language Models via Coupled Token Generation [15.1] 最先端の大規模言語モデルは、プロンプトに対応するためにランダム化に依存している。
大規模言語モデルの評価とランク付けは,それらの機能を支えるランダム化を制御すべきである,と我々は主張する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:01:17 GMT)
Pulse-PPG: An Open-Source Field-Trained PPG Foundation Model for Wearable Applications Across Lab and Field Settings [15.1] 光胸腺撮影に基づく基礎モデルは、様々な健康分野にまたがる一般化の可能性から、注目を集めている。
既存のPSGファウンデーションモデルはオープンソースだが、臨床データやクローズドソースに基づいてトレーニングされており、現実の環境での適用性が制限されている。
我々はPulseを紹介した。Pulseは、120人の参加者による100日間のフィールド調査で収集された生PSGデータに特化して訓練された、オープンソースのPulse基盤モデルである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:56:40 GMT)
HyperSHAP: Shapley Values and Interactions for Hyperparameter Importance [15.0] 本稿では,シャプリー値と相互作用に基づくHPOのゲーム理論的説明可能性フレームワークを提案する。
その結果,高次相互作用は存在するものの,低次表現に着目してほとんどの性能改善が説明できることがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:47:52 GMT)
Robust Federated Finetuning of LLMs via Alternating Optimization of LoRA [14.8] BERT-Efficient Fine-Tuning (PEFT) 法では、ローランド適応 (LoRA) は計算と通信のコストを削減し、フェデレーショントレーニングを最適化する。
ファインチューンなLoRAアダプタに交互に最適化を施した,フェデレートされたフレームワークであるRoLoRAを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:02:00 GMT)
Tool Unlearning for Tool-Augmented LLMs [14.8] ツール強化された大規模言語モデル(LLM)は、クエリとレスポンスのペアのデータセットに基づいてトレーニングされることが多い。
ToolDeleteは、ツール拡張LDMからの未学習ツールの最初のアプローチである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:50:55 GMT)
Conformal geometry from entanglement [14.7] 2+1D量子多体系のギャップレスエッジに共形幾何が現れる量子情報理論機構を同定する。
我々は、$mathfrakc_mathrmtot$ の定常性が $eta$ を含むベクトル固定点方程式と等価であることを示し、我々の仮定は局所的に検証可能である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:42:46 GMT)
Beyond Yes or No: Predictive Compliance Monitoring Approaches for Quantifying the Magnitude of Compliance Violations [14.7] 本稿では,この研究ギャップを埋めるための2つの予測コンプライアンスモニタリング手法を提案する。
第1のアプローチは、二項分類問題を分類と回帰の両方を考慮したハイブリッドタスクとして再構成する。
第2の方法はマルチタスク学習法を用いて,既存事例に対するコンプライアンス状況と違反の大きさを同時に正確に予測する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:18:33 GMT)
Scalable Precise Computation of Shannon Entropy [14.7] 本稿では、スケーラブルな精密ツールPSEを実装するために、Boolean制約でモデル化されたプログラムに焦点を当てる。
ADDANDはプログラムの可能な出力の列挙を回避し、トラクタブルエントロピーをサポートする。
PSEとEntropyEstimationの両方が解決したベンチマークの98%に対して、PSEはEntropyEstimationの少なくとも10倍の効率である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:51:03 GMT)
De-singularity Subgradient for the $q$-th-Powered $\ell_p$-Norm Weber Location Problem [14.5] 目的の勾配は特異点のかなりの集合には存在しない。
本稿では, 1leqslant p$ と $1leqslant p2$ の$q$-th-powered $ell_p$-norm の場合のデ・シンギュラリティ(de-singularity)を定式化する。
この問題に対して,Singularityのない$q$-th-powered $ell_p$-norm Weiszfeldアルゴリズム($q$P$p$NWAWS)を開発した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:20:28 GMT)
Reinforcement Learning with Model Predictive Control for Highway Ramp Metering [14.4] この研究は、交通フロー管理を強化するためのモデルベースと学習ベースの戦略の相乗効果について考察する。
制御問題は、適切なステージコスト関数を作成することにより、RLタスクとして定式化される。
RLアルゴリズムの関数近似として MPC 最適問題を利用する MPC ベースの RL アプローチを提案し,オンランプの効率的な制御について検討した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:18:14 GMT)
Temporal-consistent CAMs for Weakly Supervised Video Segmentation in Waste Sorting [14.3] 本稿では,ビデオストリームの場合のセマンティックセグメンテーションのための正確なマスクを生成することができるWS手法を提案する。
ビデオ内の連続するフレーム間の時間的コヒーレンスを利用して、サリエンシマップを構築する。
我々は,映像セグメント化を弱めに制御する,ムダソーシングのシナリオに適用する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:43:33 GMT)
UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent [14.1] textbfUP-VLA, textbfUnified VLA model training with multi-modal textbfUnderstanding and future textbfPrediction objectives。
UP-VLAはCalvin ABC-Dベンチマークの33%の改善を実現している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:53:25 GMT)
Scalable Multi-phase Word Embedding Using Conjunctive Propositional Clauses [14.1] 入力シーケンスの文脈埋め込みを発見するために,2相学習を取り入れた新しい手法を提案する。
この技術はスケーラブルなモデルの設計を促進するだけでなく、解釈可能性も維持する。
実験の結果,提案手法は従来の手法と比較して競争性能が高いことがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:41:31 GMT)
Graphusion: A RAG Framework for Knowledge Graph Construction with a Global Perspective [13.9] この研究は、無料テキストからゼロショットの知識グラフフレームワークであるGraphusionを導入している。
ステップ1では、トピックモデリングを用いてシードエンティティのリストを抽出し、最終KGに最も関連性の高いエンティティを導く。
ステップ2ではLSMを用いて候補三重項抽出を行い、ステップ3では抽出した知識のグローバルなビューを提供する新しい融合モジュールを設計する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:48:26 GMT)
ZeroBP: Learning Position-Aware Correspondence for Zero-shot 6D Pose Estimation in Bin-Picking [13.8] ビンピッキングは、正確な6Dポーズ推定を必要とする、実用的で困難なロボット操作タスクである。
既存のソリューションは通常、学習とオブジェクト固有の推定方法である。
ビンピッキングタスクに特化したゼロショットポーズ推定フレームワークを提案する。
我々は平均的リコール推定法で9.1%の改善を実現し、正しいポーズで9.1%を達成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:57:50 GMT)
M3PT: A Transformer for Multimodal, Multi-Party Social Signal Prediction with Person-aware Blockwise Attention [13.8] 社会的なシグナルには、身体のポーズ、頭ポーズ、スピーチ、食事中に食べ物を噛んだり噛んだりといったコンテキスト特有の活動が含まれる。
複数のソーシャルキューを同時に処理するために,モータリティと時間的ブロックワイドアテンションマスキングを備えた因果トランスフォーマーアーキテクチャであるM3PTを導入する。
複数モーダルの使用により,噛み時間と発話状態の予測が向上することが実証された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:14:14 GMT)
Multi-Resolution SAR and Optical Remote Sensing Image Registration Methods: A Review, Datasets, and Future Perspectives [13.7] リモートセンシングデータ融合には合成開口レーダ(SAR)と光画像登録が不可欠である。
画像の解像度が向上するにつれて、微細なSARテクスチャがより重要になり、アライメントの問題と3次元空間の相違が生じる。
MultiResSARデータセットは10万組以上のマルチソース、マルチ解像度、マルチシーンSARおよび光学画像を含む。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:51:30 GMT)
Harmonic Loss Trains Interpretable AI Models [13.7] ニューラルネットワークと大規模言語モデルのトレーニングにおいて,標準的なクロスエントロピー損失の代替として調和損失を導入する。
まず、アルゴリズム、ビジョン、言語データセット間での調和モデルの性能を検証する。
a) 解釈可能性の向上, (b) 一般化のために少ないデータを必要とすること, (c) グルーキングを減らすこと。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:57:17 GMT)
RCAEval: A Benchmark for Root Cause Analysis of Microservice Systems with Telemetry Data [13.7] 近年,マイクロサービスシステムの根本原因分析(RCA)が注目されている。
大規模なデータセットを含み、包括的な評価環境をサポートする標準ベンチマークはまだ存在しない。
マイクロサービスシステムにおけるRCAEvalは、データセットとRCAEvalの評価環境を提供するオープンソースのベンチマークである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:35:11 GMT)
Slicing Unbalanced Optimal Transport [13.7] 最適輸送は確率測度を比較するための強力なフレームワークである。
スライスされた非平衡OTの2つの異なるバージョンを定式化し、関連するトポロジと統計的性質について検討する。
次に、対応する損失関数を計算するためのGPUフレンドリーなFrank-Wolfeのようなアルゴリズムを開発する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:00:31 GMT)
TReMu: Towards Neuro-Symbolic Temporal Reasoning for LLM-Agents with Memory in Multi-Session Dialogues [13.6] マルチセッション対話における時間的推論は、過小評価されている重要な課題である。
本稿では,LoCoMoからの対話を増強し,複数選択QAを作成することで,新しいベンチマークを構築する手法を提案する。
また,LLMエージェントの時間的推論能力の向上を目的とした新しいフレームワークであるTReMuについても紹介する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:58:19 GMT)
Using LLM-Based Approaches to Enhance and Automate Topic Labeling [13.6] 本研究では、トピックラベリングの自動化と強化にLLM(Large Language Models)を用いることを検討する。
トピックモデリングにBERTopicを適用した後、各トピック内でキーワードとドキュメントの要約を選択するための異なるアプローチを探索する。
それぞれのアプローチは、支配的なテーマや多様性といった異なる側面を優先し、ラベルの品質への影響を評価する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:07:05 GMT)
CausalCOMRL: Context-Based Offline Meta-Reinforcement Learning with Causal Representation [13.6] CausalCOMRLは、因果表現学習を統合するコンテキストベースのOMRL手法である。
CausalCOMRLは,ほとんどのベンチマークにおいて,他の手法よりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:43:54 GMT)
Self-supervised Subgraph Neural Network With Deep Reinforcement Walk Exploration [13.5] グラフデータは、化合物、タンパク質構造、ソーシャルネットワークのような複雑な現実世界の現象を表す。
従来のグラフニューラルネットワーク(GNN)は、主にメッセージパッシング機構を使用しているが、その表現力は限られており、その予測には説明性がない。
サブグラフニューラルネットワーク(SGNN)とGNN説明器が潜在的な解決策として登場したが、それぞれに制限がある。
我々は、SGNNとGNN説明器の生成アプローチを統合する新しいフレームワークを提案し、Reinforcement Walk Exploration SGNN (RWE-SGNN) と名付けた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:40:33 GMT)
Bayesian Approximation-Based Trajectory Prediction and Tracking with 4D Radar [13.4] 3Dマルチオブジェクトトラッキング(MOT)は自動運転車には不可欠だが、LiDARとカメラベースの手法は悪天候下では劣化する。
本研究では,4次元レーダベースMOTフレームワークであるBayes-4DRTrackを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:49:21 GMT)
VidSketch: Hand-drawn Sketch-Driven Video Generation with Diffusion Control [13.3] VidSketchは、手書きのスケッチや簡単なテキストプロンプトから直接高品質のビデオアニメーションを生成する方法である。
具体的には,スケッチの指導力を自動的に調整するレベルベーススケッチ制御方式を提案する。
TempSpatial Attentionメカニズムは、生成されたビデオアニメーションの一貫性を高めるように設計されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:45:00 GMT)
DyPCL: Dynamic Phoneme-level Contrastive Learning for Dysarthric Speech Recognition [12.9] 変形性音声認識のギャップを埋める動的音素レベルのコントラスト学習(DyPCL)法を提案する。
音声の発話を音素レベルのコントラスト学習のための音素セグメントに分解し、動的接続性時間的分類アライメントを活用する。
難易度による訓練への我々のアプローチは、話者の固有の多様性を軽減し、難易度の高い発話を識別する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:21:50 GMT)
Advanced Architectures Integrated with Agentic AI for Next-Generation Wireless Networks [12.9] 本稿では,ネットワーク運用の簡素化,運用費の削減(OpEx),新サービスモデルの展開を目的とした最先端技術について検討する。
i) 長期6Gネットワークの進化に対処しながら、サービスのシームレスな拡張を可能にするコントロールプレーンとユーザプレーンを備えた、新しい、より効率的な6Gアーキテクチャの提供に重点を置いている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:18:29 GMT)
A Differentiable Alignment Framework for Sequence-to-Sequence Modeling via Optimal Transport [12.8] 一次元の最適輸送に基づく新しい微分可能なアライメントフレームワークを提案する。
CTCと比較して,ASR性能のトレードオフはあるものの,アライメント性能が著しく向上することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:20:29 GMT)
Learning Mamba as a Continual Learner [12.7] 本稿では,メタ学習のMambaCLを継続学習者として提案する。
メタコンチネンタル学習におけるMambaの有望な性能と一般化能力について実験と分析を行った。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:31:32 GMT)
Deep Exploration with PAC-Bayes [12.6] 遅延報酬の下での継続的制御のための強化学習は、実生活における重要性にもかかわらず、未探索の問題である。
本研究では,PAC-ベイジアンの視点からアクター・クリティカル・ラーニングの文脈において,この深層探査問題に初めて対処する。
提案アルゴリズムはPAC-Bayesian Actor-Critic (PBAC) と名付けられ,多種多様な連続制御タスクにおける遅延報酬を継続的に発見するアルゴリズムである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:16:29 GMT)
What is the Relationship between Tensor Factorizations and Circuits (and How Can We Exploit it)? [12.5] テンソル化回路アーキテクチャを構築するために,モジュール型 "Lego block" アプローチを導入する。
この接続は、既存のモデルの類似点と相違点を明らかにするだけでなく、包括的なパイプラインの開発を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:00:48 GMT)
Global Public Sentiment on Decentralized Finance: A Spatiotemporal Analysis of Geo-tagged Tweets from 150 Countries [12.5] テクノロジーと分散金融(DeFi)は世界的な金融システムを変えつつある。
この調査は、2012年から2022年にかけて1億5000万件以上のジオタグ付きDeFi関連ツイートを分析した。
BERTに基づく多言語分類モデルからの感情スコアを用いて、これらのツイートを経済的・地政学的データと統合し、マルチモーダルデータセットを作成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:18:48 GMT)
HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers [12.4] 大型ビジョンランゲージ・アクション(VLA)モデルは、その印象的な一般化能力のためにロボット制御において有望であることが示されている。
数十億のパラメータを持つVLMバックエンドへの依存は、高い計算コストと遅延推定につながる。
本稿では,柔軟な周波数・性能トレードオフを実現する階層型ロボットトランスフォーマフレームワークであるHiRTを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:07:37 GMT)
QLESS: A Quantized Approach for Data Valuation and Selection in Large Language Model Fine-Tuning [12.4] textbfQLESS (Quantized Low-rank Gradient similarity Search)を提案する。
QLESSは、勾配量子化とLESSフレームワークを統合して、メモリ効率のよいデータバリュエーションと選択を可能にする。
実験では、QLESSがLESSに匹敵するデータ選択性能を達成し、メモリ使用量を最大16倍に削減している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:52:32 GMT)
VisioPhysioENet: Multimodal Engagement Detection using Visual and Physiological Signals [12.2] 本稿では,視覚的および生理的信号を利用して学習者のエンゲージメントを検出する新しいマルチモーダルシステムであるPhysioENetを提案する。
視覚的特徴抽出では、Dlibを使用して顔のランドマークを検出し、OpenCVはさらなる推定を提供する。
Dlib上に構築された顔認識ライブラリは、生理的信号抽出に特化した顔領域を特定するために使用される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:14:34 GMT)
SHARPIE: A Modular Framework for Reinforcement Learning and Human-AI Interaction Experiments [12.1] 強化学習(RL)は、人間とAIのインタラクションシナリオを含む、AIエージェントのモデリングとトレーニングのための一般的なアプローチを提供する。
本稿では,RLエージェントと人間を用いた実験を支援する汎用フレームワークの必要性に対処するため,SHARPIEを提案する。
モジュール設計は、RL環境とアルゴリズムライブラリのための汎用的なラッパー、参加者対応のWebインターフェース、ロギングユーティリティ、人気のあるクラウドへのデプロイ、参加採用プラットフォームで構成されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:41:43 GMT)
EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics [12.1] EmoDynamiXは、ユーザの微粒な感情と、不均一なグラフを使用してシステム戦略の間の談話ダイナミクスをモデル化し、パフォーマンスと透明性を改善します。
2つのESCデータセットの実験結果から、EmoDynamiXは従来の最先端の手法よりも優れたマージンを持つことが示された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:13:44 GMT)
DeepOSets: Non-Autoregressive In-Context Learning of Supervised Learning Operators [11.9] In-context Learning of permutation-invariant operator。DeepSets Operator Networks (DeepOSets)。
DeepOSetsはDeep Operator Networks(DeepONets)のオペレータ学習機能とDeepSetsのセット学習機能を組み合わせたものだ。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:24:30 GMT)
Molecular Odor Prediction Based on Multi-Feature Graph Attention Networks [11.9] 定量的構造・臭気関係タスクは、分子構造とそれに対応する臭気の関係を予測することを伴う。
グラフ注意ネットワークを用いて分子構造をモデル化し,局所的特徴と大域的特徴の両方を捉えるQSORの手法を提案する。
提案手法はQSOR予測タスクにおいて明らかな利点を示し, 深層学習のケミノフォマティクスへの応用に関する貴重な知見を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:11:24 GMT)
λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics [11.9] 学習ベースモデルや,基礎モデルとタスクと動作計画を組み合わせたニューロシンボリックなモジュラーアプローチなど,いくつかのモデルをベンチマークする。
発見は、よりデータ効率のよい学習ベースのMoMaアプローチの必要性を強調している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:54:17 GMT)
Policy Design for Two-sided Platforms with Participation Dynamics [11.8] 人口効果の両面プラットフォーム上での動態と政策設計について, 初めて考察した。
本研究は, 筋萎縮対策の実施に留意し, 提供者側による検討の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:12:01 GMT)
From Foresight to Forethought: VLM-In-the-Loop Policy Steering via Latent Alignment [11.8] FOREWARNは、Vision Language Modelsのランタイムポリシーステアリングの可能性を解き放つ新しいフレームワークである。
予見のために、我々は潜在世界モデルを利用して、多様な低レベルアクションプランが与えられた将来の潜在国家を想像する。
例えば、VLMをこれらの予測潜在状態と整合させて、そのネイティブ表現におけるアクションの結果を推論する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:11:02 GMT)
Strategic Classification with Randomised Classifiers [11.7] 戦略的分類の問題は、学習者が戦略的に修正された特徴に基づいてエージェントを分類するモデルを構築する必要がある。
特定の条件下では、最適ランダム化分類器は最適な決定論的分類器よりも精度が高いことを示す。
我々は、ランダム化は、実質的な欠点を導入することなく、実際に直面する可能性のある問題を緩和する可能性があると結論付けている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:41:55 GMT)
Molecular Odor Prediction with Harmonic Modulated Feature Mapping and Chemically-Informed Loss [11.7] 本稿では,新しい特徴マッピング法と分子アンサンブル最適化損失関数を提案する。
本手法は,様々な深層学習モデルにおいて,分子臭予測の精度を著しく向上させることができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:17:51 GMT)
Efficient and Scalable Density Functional Theory Hamiltonian Prediction through Adaptive Sparsity [11.4] ハミルトン予測に適応空間を組み込んだ,効率的でスケーラブルな同変ネットワークを提案する。
本研究では, 安定収束を確保し, 最大70%のスパシティレートで高い性能を実現する3相スパシティスケジューリング器を開発した。
ハミルトン予想以外にも、提案されたスペーシフィケーション手法は、他のSE(3)同変ネットワークの効率性とスケーラビリティを向上させる重要な可能性を秘めている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:04:47 GMT)
Faster Adaptive Optimization via Expected Gradient Outer Product Reparameterization [11.4] 本研究では,多種多様な関数に対して,EGOP行列スペクトルの減衰の影響を受け,適応アルゴリズムの選択に対する感度の影響を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:26:35 GMT)
PARA: Parameter-Efficient Fine-tuning with Prompt Aware Representation Adjustment [11.3] 本稿では,アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン・アンダーライン
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:06:03 GMT)
Neuro-Symbolic AI for Analytical Solutions of Differential Equations [11.2] 本稿では,ニューロシンボリックAIフレームワークを用いて微分方程式の解析解を求める。
この積分は、ニューロシンボリックAIフレームワークを介して数値方程式と記号微分方程式を統一する。
様々な問題に対して,商業的解法,記号的解法,近似ニューラルネットワークの利点を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:06:56 GMT)
Lifelong Sequential Knowledge Editing without Model Degradation [11.1] 位置対応知識編集手法が編集事実の過度な適合に繋がることを示す。
これらの手法を用いて連続的な知識編集を行うことで、編集行列のノルムが不均等に成長することを示す。
ENCORE - Early Stop and Norm-Constrained Robust knowledge Editing。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:14 GMT)
RATE: Causal Explainability of Reward Models with Imperfect Counterfactuals [11.1] 属性に対する報酬モデルの感度を測定する有効な方法として,リライトに基づく属性処理推定器(RATE)を開発した。
RATEはLSMを使って応答を書き直し、因果効果を測定するのに使える不完全な反ファクトの例を生成する。
提案手法の有効性を確立し,有効推定器であることを実証的に示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:02:31 GMT)
Disentanglement with Factor Quantized Variational Autoencoders [11.1] 本稿では,生成因子に関する基礎的真理情報をモデルに提供しない離散変分オートエンコーダ(VAE)モデルを提案する。
本研究では, 離散表現を学習する上で, 連続表現を学習することの利点を実証する。
FactorQVAEと呼ばれる手法は、最適化に基づく不整合アプローチと離散表現学習を組み合わせる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:41:44 GMT)
The ALCHEmist: Automated Labeling 500x CHEaper Than LLM Data Annotators [11.1] 大規模な事前訓練されたモデルは、アノテータとして使用することができ、クラウドワーカーを置き換えたり拡張したりするのに役立ちます。
最上位モデルを採用する場合、APIコールに数千ドルを支払わなければならない場合が多い。
事前訓練されたモデルからラベルを直接クエリする代わりに、ラベルを生成するプログラムを生成するようにモデルをタスクする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:17:53 GMT)
OCR Error Post-Correction with LLMs in Historical Documents: No Free Lunches [11.0] 本研究は,英語およびフィンランド語データセットのOCR誤り訂正にオープンウェイトLLMを用いたことを評価する。
その結果,現代のLLMでは英語の文字誤り率(CER)の低減が期待できるが,フィンランド語では実用上有用な性能は得られなかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:55:31 GMT)
ResQ: Mixed-Precision Quantization of Large Language Models with Low-Rank Residuals [10.9] 大規模言語モデル(LLM)の学習後の量子化は、推論時の計算コストを抑えるという約束を果たす。
本稿では,最先端技術をさらに推し進めるPTQ手法であるResQを提案する。
ResQは、様々なベンチマークにおいて、最近の一様および混合精度のPTQ法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:45:32 GMT)
One-step full gradient suffices for low-rank fine-tuning, provably and efficiently [10.8] 本稿では,Low-Rank Adaption (LoRA) の性能向上を理論的に検討する。
提案手法は,emphLoRA-Oneアルゴリズム(emphワンステップ勾配とプレコンディショニングを用いた)に導かれる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:50:03 GMT)
Scrutinize What We Ignore: Reining In Task Representation Shift Of Context-Based Offline Meta Reinforcement Learning [10.8] オフラインメタ強化学習(OMRL)は、相互作用回避と強力な一般化性能のための有望なアプローチとして登場した。
従来のコンテキストベースのアプローチは、コンテキストエンコーダとポリシーの最適化がパフォーマンス改善につながるという直感に依存しています。
我々はこの問題をタスク表現シフトと呼び、適切なコンテキストエンコーダ更新によってモノトニック性能の改善が保証できることを理論的に証明する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:44:54 GMT)
The dark deep side of DeepSeek: Fine-tuning attacks against the safety alignment of CoT-enabled models [10.5] 微調整攻撃は、潜在的に有害な振る舞いを明らかにするために、大きな言語モデルを利用することができる。
本稿では、微調整攻撃を受けた場合の思考の連鎖に基づく推論モデルDeepSeekの性能について検討する。
思考の連鎖(Chain of Thought)の脆弱性に光を当てて、微調整による攻撃と、その安全性と倫理的展開に影響を及ぼすことを目指している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:28:26 GMT)
DH-TRNG: A Dynamic Hybrid TRNG with Ultra-High Throughput and Area-Energy Efficiency [10.4] DH-TRNGは、超高スループットと面積エネルギー効率を備えた動的ハイブリッドTRNG回路アーキテクチャである。
提案した設計は、最大2.63倍のスループット/スライスパワーを有する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:22:46 GMT)
Heterogeneous Treatment Effect in Time-to-Event Outcomes: Harnessing Censored Data with Recursively Imputed Trees [10.3] 既存の方法は、しばしば完全な観察を前提としており、その仮定は、右検閲による生存データに違反している。
我々は,不均一な治療効果を推定するための新しい,一般かつ非パラメトリックな方法であるMultiple Imputation for Survival Treatment Response (MISTR)を紹介した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:59:34 GMT)
Security and Quality in LLM-Generated Code: A Multi-Language, Multi-Model Analysis [10.3] 本稿では,Large Language Models (LLM) が生成するコードのセキュリティを,異なるプログラミング言語間で解析する。
我々の研究によると、LLMはコード生成を自動化できるが、そのセキュリティの有効性は言語によって異なる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:03:13 GMT)
Harmful Terms and Where to Find Them: Measuring and Modeling Unfavorable Financial Terms and Conditions in Shopping Websites at Scale [10.2] 現在、好ましくない財務条件に関連するタイプや潜在的なリスクについて、包括的な理解がない。
我々は、購入、買収後、アカウントの終了、法的側面の4つのカテゴリーから22種類の分類法を開発する。
TextitTermLensは、LLM(Large Language Models)を使用して、好ましくない財務用語を識別する自動検出装置です。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:23:02 GMT)
The Impact of Logic Locking on Confidentiality: An Automated Evaluation [10.1] 悪意のある1つの論理ロックキーが、暗号化キーの70%以上を公開可能であることを示す。
この研究は、論理ロックにおける重大なセキュリティ脆弱性を明らかにする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:01:11 GMT)
Robust Online Conformal Prediction under Uniform Label Noise [10.1] 本研究では,一様ラベル雑音下でのオンラインコンフォメーション予測のロバスト性について検討する。
本稿では,新しいロバストなピンボール損失で閾値を更新することで,ノイズロバストオンラインコンフォーマル予測(NR-OCP)を提案する。
理論解析により,NR-OCPは一定の学習率と動的学習率の両方のスケジュールのカバレッジギャップをなくすことが示されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:27:43 GMT)
The Batch Complexity of Bandit Pure Exploration [10.0] マルチアームバンディットにおける純粋な探索問題では、アルゴリズムは武器を反復的にサンプリングし、できるだけ早く停止し、武器分布に関する質問に対する正しい答えを返すべきである。
私たちは、バッチ化メソッドに興味を持ち、サンプルの振る舞いを数回だけ、観察のバッチ間で変更します。
純粋な探索タスクに対して,任意のサンプル効率アルゴリズムが使用するバッチ数に対して,インスタンス依存の低いバウンダリを与える。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:03:45 GMT)
Secure & Personalized Music-to-Video Generation via CHARCHA [9.9] 私たちの仕事は、リスナーが消費者であるだけでなく、ミュージックビデオ生成プロセスの共創者でもあることを許します。
このパイプラインは、マルチモーダル翻訳と生成技術を組み合わせて、リスナーのイメージに対する低ランク適応を利用する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:25:47 GMT)
Simultaneous Automatic Picking and Manual Picking Refinement for First-Break [9.9] 我々は、外れ値やノイズのあるラベルに悩まされるデータセットを扱うために設計された、同時ピッキング・リファインメント(SPR)アルゴリズムを導入する。
本手法では,手動ピックを基本真理とみなす従来の手法とは異なり,本手法は確率モデルにおいて,真のファーストブレイクを潜在変数として扱う。
SPRは、自動ファーストブレイクピッキングにおける主要な障害のいくつかに対して、堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:05:57 GMT)
FetDTIAlign: A Deep Learning Framework for Affine and Deformable Registration of Fetal Brain dMRI [9.8] 胎児脳dMRI登録のための深層学習手法であるFetDTIAlignを導入し,正確なアフィンと変形可能なアライメントを実現する。
妊娠23週から36週のデータからFetDTIAlignの有効性を検討した。
以上の結果から,胎児脳のdMRI登録における深層学習の可能性が示唆された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:10:00 GMT)
Classic4Children: Adapting Chinese Literary Classics for Children with Large Language Model [9.8] 中国文学の古典は、文化的、教育的な価値を持っている。
これらの作品には古典中国語や複雑な物語が含まれており、子供には読みにくい。
本研究では,中国文学古典を子ども向けのエンゲージメント・アクセシビリティ・テキストに適応させるために,子どもに親しみやすい文芸適応タスクを導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:23:35 GMT)
Current Affairs: A Security Measurement Study of CCS EV Charging Deployments [9.8] 統合充電システム(CCS)は、ヨーロッパ、北米、アジアの一部でEVの高速充電をリードする技術として登場した。
トランスポート層セキュリティ(TLS)とプラグインやチャージなどのユーザビリティの強化は2014年に導入された。
我々は,2013年4月から2023年6月までに製造された325個の充電器を調査し,2024年5月までに4か国26社が設置した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:24:38 GMT)
Trust-Oriented Adaptive Guardrails for Large Language Models [9.7] ガードレールは、有害または有害な応答を抑えることで、大きな言語モデル(LLM)が人間の価値と整合することを保証するように設計されている。
既存のガードレールには、さまざまなユーザグループのニーズを満たすための、十分に確立された方法論が欠如している。
ユーザ信頼度に基づいて,機密コンテンツへの動的アクセスを適度に行うための適応ガードレール機構を導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:03:18 GMT)
Agentic Bug Reproduction for Effective Automated Program Repair at Google [9.6] 本稿では,業界,特にGoogleにおけるBRTの自動生成について検討する。
我々は、最先端のBRT生成技術であるLIBROを適応し、評価し、エージェントベースのアプローチであるBRT Agentを提示する。
以上の結果から,APRシステムにBRTを提供することで,バグが30%増えることが判明した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:57:17 GMT)
ConditionNET: Learning Preconditions and Effects for Execution Monitoring [9.6] ConditionNETは、完全にデータ駆動の方法でアクションの前提条件と効果を学ぶためのアプローチである。
実験では, 異常検出と位相予測の両方において, ConditionNET がすべてのベースラインを上回り, 性能が向上することを示した。
本研究では,実環境におけるロボットの信頼性と適応性を高めるための ConditionNET の可能性を強調した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:00:45 GMT)
Efficient Feature Fusion for UAV Object Detection [9.6] 特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:04:08 GMT)
Beyond the Crawl: Unmasking Browser Fingerprinting in Real User Interactions [9.5] ブラウザーフィンガープリント(Browser fingerprinting)は、プロファイリングやターゲット広告に頻繁に使われるオンライン追跡技術である。
これまでの研究は、人間とコンピュータの相互作用のニュアンスを再現するのに本質的に苦労した自動化ウェブクローリングに大きく依存していた。
本稿では,30人の参加者を対象とした10週間にわたるユーザ調査を行い,3000のWebサイトを対象とした実閲覧セッションからテレメトリデータを収集した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:43:34 GMT)
Dynamic object goal pushing with mobile manipulators through model-free constrained reinforcement learning [9.3] 我々は,未知の物体を所望の位置に移動させ,一連のプッシュ動作によって方向を判断する,移動マニピュレータのための学習型コントローラを開発した。
ロボットアームと移動体ベースモーションのコントローラは,制約付き強化学習(RL)の定式化を用いて訓練される。
学習されたポリシーは、シミュレーションで91.35%、挑戦的なシナリオでハードウェアで80%の成功率を達成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:28:35 GMT)
Large Language Models for Cryptocurrency Transaction Analysis: A Bitcoin Case Study [9.3] LLM(Large Language Models)機能を評価するための3層フレームワークを紹介します。
LLMは基礎的な指標に優れ、詳細な特徴的概要を提供する。
文脈解釈におけるそれらの有効性は、トランザクションの振る舞いに関する有益な説明を提供することができることを示唆している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:45:22 GMT)
CoDe: Blockwise Control for Denoising Diffusion Models [9.2] 下流タスクへの拡散モデルをアライメントするには、しばしば推論時に新しいモデルや勾配に基づくガイダンスを微調整する必要がある。
本研究では,制御デノイング(CoDe)と呼ばれる単純な推論時間勾配自由誘導手法について検討する。
CoDeは中間復調段階に適用されるブロックワイズサンプリング手法であり、下流の報酬とアライメントすることができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:23:04 GMT)
Observation Noise and Initialization in Wide Neural Networks [9.2] 任意の事前平均関数を可能にするテキストシフトネットワークを導入する。
我々の理論的な洞察は、観測ノイズとネットワークアーキテクチャの異なる値に関する実験によって実証的に検証されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:39:45 GMT)
Two-particle quantum interference in a nonlinear optical medium: a witness of timelike indistinguishability [9.1] ホン・ウー・マンデル効果(Hong-Ou-Mandel effect)は、50:50ビームスプリッターで線形に結合する2つの不明瞭な光子の干渉を示すパラダイム量子現象である。
ここでは、2つの単一光子がパラメトリックダウンコンバージョン結晶に衝突しているとき、そのような2粒子量子干渉効果を非線形状態に転移する。
増幅利得が2に調整された場合、送信された光子対と再生した光子対の破壊的干渉から生じる1つの光子対を正確に検出する確率の抑制を実験的に実証する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:15:50 GMT)
Nearly Tight Bounds for Exploration in Streaming Multi-armed Bandits with Known Optimality Gap [9.1] マルチパスストリーミングマルチアームバンディット(MAB)における純粋探索のためのサンプルメモリパストレードオフについて検討する。
最初に下界を示し、わずかにサブ線形メモリを持つ最適なアームを見つけるアルゴリズム -- $o(n/textpolylog(n))$ arms -- と $O(sum_i=2n1/Delta2_[i][i]cdot logn)$ arm pulls を示す。
すると、私たちはほとんど姿を現す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:24:35 GMT)
Choose Your Model Size: Any Compression by a Single Gradient Descent [9.1] イテレーティブ・プルーニング(ACIP)による圧縮について紹介する。
ACIPは、単一の勾配降下ランから圧縮性能トレードオフを決定するアルゴリズム的なアプローチである。
本稿では,ACIPが共通量子化に基づく圧縮手法をシームレスに補完することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:40:58 GMT)
Mitigating Information Loss in Tree-Based Reinforcement Learning via Direct Optimization [9.0] 本稿では,SYMbolic tree-based on-policy RLの新しい手法であるSYMPOLを紹介する。
SYMPOLは、ポリシー勾配法と統合されたツリーベースのモデルを採用しており、エージェントは高いレベルの解釈可能性を維持しながら、その動作を学習し、適応することができる。
我々は、SYMPOLを一連のベンチマークRLタスクで評価し、その性能と解釈可能性の観点から、代替木ベースのRLアプローチよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:19:28 GMT)
Rethinking Explainable Machine Learning as Applied Statistics [9.0] 説明可能な機械学習は、その並列性を応用統計と認識する必要がある、と我々は主張する。
研究論文では、これがほとんど議論されていないという事実が、現在の文献の主な欠点の1つである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:03:45 GMT)
Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning [9.0] 人間のフィードバックからの強化学習(RLHF)は、信頼できる生成AIモデルを構築する上で重要なステップとなっている。
本研究は、連続時間RLを用いた微動拡散モデルに対する規律付きアプローチを開発することを目的とする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:50:05 GMT)
Exploring Few-Shot Defect Segmentation in General Industrial Scenarios with Metric Learning and Vision Foundation Models [9.0] 本稿では,多種多様な欠陥を有する幅広い産業製品において,FSS(数ショットセマンティックセマンティックセマンティックセマンティクス)を探索することを目的とする。
メタラーニングに基づくものやビジョンファウンデーションモデル(VFM)に基づくものなど、メトリックラーニングに基づくFSS手法を徹底的に検討する。
特徴マッチングに基づく新しい効率的なFDS手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:13:34 GMT)
Foundation Model-Based Apple Ripeness and Size Estimation for Selective Harvesting [8.9] 本研究では,効率的なリンゴ熟度とサイズ推定のための基礎モデルに基づく新しいフレームワークを提案する。
我々は,RGBDをベースとしたFuji apple画像データセット2枚をキュレートし,果実の色とイメージキャプチャの日付に基づいて熟成のための拡張アノテーション("Ripe" vs. "Unripe")を統合した。
その結果得られた包括的データセットであるFuji-Ripeness-Sizeデータセットには、4,027の画像と16,257個のアノテートされたリンゴの熟度とサイズラベルが含まれている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:55:02 GMT)
The AI Agent Index [8.5] エージェントAIシステムは、人間の関与が限定された複雑なタスクを計画し実行することができる。
現在、エージェントシステムの技術コンポーネント、目的の用途、安全性の特徴を文書化するための構造化されたフレームワークは存在しない。
AI Agent Indexは、現在デプロイされているエージェントAIシステムに関する情報をドキュメント化する最初の公開データベースである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:59:13 GMT)
Nearly Lossless Adaptive Bit Switching [8.5] ImageNet-1K分類の実験結果から,本手法は多精度・混合精度の両面において,最先端のワンショットジョイントQATに十分な利点があることが示された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:46:26 GMT)
JoVALE: Detecting Human Actions in Video Using Audiovisual and Language Contexts [8.5] ビデオアクション検出(VAD)は、ビデオ内のアクションインスタンスのローカライズと分類を行う。
我々は、JoVALE(Joint Actor-centric Visual, Audio, Language)と呼ばれる新しいマルチモーダルVADアーキテクチャを導入する。
JoVALEは、大容量画像キャプションモデルから生成されたシーン記述コンテキストとオーディオと視覚機能を統合する最初のVAD手法である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:27:21 GMT)
Virtual Stars, Real Fans: Understanding the VTuber Ecosystem [8.5] 我々は、中国のほぼすべてのVTuberがストリーミングする主要なライブストリーミングプラットフォームであるBilibili上で、VTuber視聴者の包括的な分析を行う。
ライブストリーミング2.7Mセッションを対象とした第1種データセットをコンパイルし,VTuber視聴者の特性,エンゲージメントパターン,および影響について検討した。
我々は、VTubersに将来のサブスクライバを"推奨"するツールの開発に活用する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:33:54 GMT)
UASTHN: Uncertainty-Aware Deep Homography Estimation for UAV Satellite-Thermal Geo-localization [8.5] 本稿では,無人航空機(UAV)における深部ホログラフィー推定(DHE)タスクにおける不確実性推定(UE)の新しいアプローチであるtextitUASTHNを提案する。
データ不確実性を効果的に測定するために,クロップベースのテスト時間拡張(CropTTA)戦略を導入する。
我々の研究は、局所化と不確実性推定の幅広い交点に関する深い洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:14:20 GMT)
The Battling Influencers Game: Nash Equilibria Structure of a Potential Game and Implications to Value Alignment [8.4] 本稿では,マルチプレイヤー同時移動汎用ゲームであるBattling Influencers Game (BIG)を紹介する。
BIG はポテンシャルゲームであり、1 つまたは無限個の純同値 Nashlibria (NE) を持ち、これらの純同値NE は凸最適化によって見つけることができることを証明している。
本稿では,BIGが価値アライメントに与える影響について論じる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:45:41 GMT)
Noise-resilient host for electron qubit operation up to 0.4 K [8.3] 電荷および熱雑音に対するeNe電荷量子ビットにおけるネオン層による顕著な強靭性を示す。
ネオンの電荷(電圧)ノイズスペクトル密度は、従来のゲート定義の半導体量子ドットに匹敵する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:58:34 GMT)
Unforgettable Lessons from Forgettable Images: Intra-Class Memorability Matters in Computer Vision Tasks [8.2] また,同クラス内の画像は,カテゴリ特性の共有にもかかわらず,他のクラスよりも記憶力が高いクラス内記憶性を導入する。
画像提示の時間間隔を計算に組み込んだ新しい指標であるICMscore(Intra-Class Memorability score)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:31:57 GMT)
Quantum Codes with Addressable and Transversal Non-Clifford Gates [8.2] 我々は、$textitaddressable$ logical gateを誘導するゲートをサポートするコードを研究する。
我々は、$textitaddressable と $ell neq 2$ gates で量子コードを構築するフォーマリズムを開発する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:24:34 GMT)
Tazza: Shuffling Neural Network Parameters for Secure and Private Federated Learning [8.1] フェデレーション学習は、生データを共有せず、データのプライバシを保存することなく、分散モデルトレーニングを可能にする。
既存のソリューションはしばしばこれらの問題に別々に対処し、システムの堅牢性やモデルの精度を犠牲にする。
この作業では、両課題に同時に対処するセキュアで効率的なフェデレーション学習フレームワークであるTazzaが導入されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:23:32 GMT)
Towards the Transferability of Rewards Recovered via Regularized Inverse Reinforcement Learning [8.0] 逆強化学習は、政策よりも報酬がタスクの最も簡潔で伝達可能な記述であるという考えに動機づけられた、専門家によるデモンストレーションから報酬を推測することを目的としている。
過去の研究は、専門家の方針に完全にアクセスできるという前提の下でのみこの問題に対処してきた。
専門家の方針に完全にアクセスして開発された条件は、専門家のデモンストレーションにのみアクセス可能なより実践的なシナリオにおいて、転送可能性を保証することはできない。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:27:13 GMT)
An Investigation of FP8 Across Accelerators for LLM Inference [7.9] NVIDIA H100とIntel Gaudi 2.0という2つのAIアクセラレータ上でのFP8計算の総合的な分析を初めて提供する。
その結果,Gaudi 2はFP8を活用することにより,推論時のスループットと電力効率の向上を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:26:22 GMT)
Robust Hyperbolic Learning with Curvature-Aware Optimization [7.9] 現在の双曲型学習アプローチは、過度に適合し、計算コストが高く、不安定になりがちである。
本稿では,双曲的埋め込みを制限し,近似誤差を低減するために,新しい微調整可能な双曲的スケーリング手法を提案する。
提案手法は,コンピュータビジョン,脳波分類,階層的メトリック学習タスクにおける一貫した改善を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:43:02 GMT)
OphthBench: A Comprehensive Benchmark for Evaluating Large Language Models in Chinese Ophthalmology [7.7] 大規模言語モデル(LLM)は、様々な医学的応用において大きな可能性を示してきた。
我々は,中国の眼科領域におけるLCM性能を評価するためのベンチマークであるOphthBenchを紹介した。
この枠組みは、LSMの能力の徹底的な評価を可能にし、中国の眼科におけるその実践的応用に関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:04:51 GMT)
Enhancing Sampling Protocol for Point Cloud Classification Against Corruptions [7.7] 我々は,ポイントクラウドの破損に対するロバスト性を改善するために,ポイントSPという拡張されたポイントクラウドサンプリングプロトコルを提案する。
PointSPはキーポイント再重み付けを導入し、外部感度を緩和し、代表点の選択を確実にする。
また、スケーラブルで適応的なサンプリングを可能にする、局所的なバランスの取れたダウンサンプリング戦略も導入されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:43:20 GMT)
Training in reverse: How iteration order influences convergence and stability in deep learning [7.7] ニューラルネットワークのトレーニングは計算に高価であり、収束を低下させる不安定さに悩まされることが多い。
本研究は,定時学習率(スケジュールなし)と小バッチサイズ体制における訓練安定性に関する理論的問題について考察する。
勾配更新の順序は勾配に基づく反復の安定性と収束に影響を及ぼすことを示す。
SGDのようなバッチ勾配更新を処理するが、逆順に処理する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:40:03 GMT)
Towards Safer Chatbots: A Framework for Policy Compliance Evaluation of Custom GPTs [7.7] オープンAIの利用ポリシーに対するカスタムGPTの自動評価のためのフレームワークを提案する。
我々は,ロマン主義,サイバーセキュリティ,アカデミックGPTの3つのカテゴリにまたがって,722のカスタムGPTを用いた大規模研究を通じて評価を行った。
その結果、分析されたモデルの58.7%は、非準拠の兆候を示し、GPTストアのレビューと承認プロセスの弱点を明らかにしていることが明らかとなった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:19:28 GMT)
Role-Play Paradox in Large Language Models: Reasoning Performance Gains and Ethical Dilemmas [7.7] 大型言語モデル(LLM)におけるロールプレイは、文脈的に関連性があり高品質な応答を生成する能力を高める。
本稿では,モデルの役割を自動選択する手法であるオートチューニングが,有害なアウトプットの生成につながることを実証する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:54:28 GMT)
Sequence-Level Leakage Risk of Training Data in Large Language Models [7.6] シーケンス毎の抽出確率は、以前の研究よりもきめ細かい情報を提供する。
本研究では,Llama と OPT の2つの事前学習モデルについて,それぞれコモン・クローリングとパイルを訓練した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:53:16 GMT)
Adapter-Based Multi-Agent AVSR Extension for Pre-Trained ASR Models [7.4] 本稿では,事前学習したWhisperモデルに基づく音声認識手法を提案する。
この音声のみのモデルに視覚情報を注入するために、AV融合モジュールとLoRaアダプタで拡張する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:54:47 GMT)
ConSim: Measuring Concept-Based Explanations' Effectiveness with Automated Simulatability [7.4] 概念に基づく説明は、複雑なモデル計算を人間の理解可能な概念にマッピングすることで機能する。
既存の評価指標は、しばしば考えられる概念の誘導された空間の品質にのみ焦点をあてる。
自動シミュラビリティによる概念記述の計測のための評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:13:17 GMT)
Towards Robust and Generalizable Lensless Imaging with Modular Learned Reconstruction [7.4] 最先端のレンズレスイメージング技術は、物理モデリングとニューラルネットワークを組み合わせている。
新たなマスクのレンズレス測定に対する学習手法の一般化は研究されていない。
画像回復に先立って、重要なコンポーネントがプリプロセッサとなるモジュラー学習された再構成を用いる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:46:39 GMT)
The "Huh?" Button: Improving Understanding in Educational Videos with Large Language Models [7.2] 本稿では,大規模言語モデル(LLM)を教育に利用する簡単な方法を提案する。
具体的には、オンラインビデオに新たな機能を追加することで、個人の理解を改善することを目的としている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:15:58 GMT)
Beyond Random Missingness: Clinically Rethinking for Healthcare Time Series Imputation [7.2] 本研究では,医療環境におけるマスキング戦略が時系列計算モデルに及ぼす影響について検討した。
PhysioNet Challenge 2012データセットを使用して、異なるマスキング実装が、計算精度と下流臨床予測の両方にどのように影響するかを分析する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:24:40 GMT)
Invariant Kernels: Rank Stabilization and Generalization Across Dimensions [7.2] 対称性がカーネル行列のランクに顕著な影響を与えることを示す。
具体的には、その2つの引数に対して独立に作用する様々な群の下で不変な固定次数の核のランクを計算する。
上記の3つの例を含む具体的状況において、対称性はデータ次元から独立させるランクを劇的に減少させる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:37:43 GMT)
An Effectiveness Study Across Baseline and Learning-based Force Estimation Methods on the da Vinci Research Kit Si System [7.1] ダ・ヴィンチ5号に先立ち、ダ・ヴィンチのシステムは直接の力覚能力に欠けており、外科医は触覚のフィードバックなしに手術をせざるを得なかった。
本研究では,従来の手法を新しいdVRK-Siシステムに拡張する。
学習に基づく手法では,dVRK-Siに対して平均根平均2乗誤差(RMSE)が5.21%に達することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:16:57 GMT)
Whom do Explanations Serve? A Systematic Literature Survey of User Characteristics in Explainable Recommender Systems Evaluation [7.0] ユーザ調査では,レコメンダシステムの説明が評価された124の論文を調査した。
本研究の結果は,主に特定のユーザを対象としていることが明らかとなった。
より包括的で再現可能な評価に向けた行動を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:50:32 GMT)
Evaluating the Impacts of Swapping on the US Decennial Census [7.0] 我々は,Censusの出版物と裁判所文書に基づくパラメータ化スワップアルゴリズムを記述し,実装する。
差分プライバシを用いたテクニックをスワップして比較することで生じるシフトのタイプを直感的に評価する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:51:16 GMT)
Toward Conditional Distribution Calibration in Survival Prediction [6.9] 本研究では,モデルが観測した時点における個人生存確率を用いて,共形予測に基づく手法を提案する。
限界キャリブレーションと条件キャリブレーションの両方に関する理論的保証を提供し、15の多様な実世界のデータセットに対して広範囲にテストする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:47:09 GMT)
Omni-Mol: Exploring Universal Convergent Space for Omni-Molecular Tasks [6.8] 一般論モデルの構築は、近年、様々な科学的領域において顕著な能力を示している。
分子表現の競合は、モデルの最適化に困難をもたらす可能性がある。
本稿では,Omni-Molについて述べる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:33:51 GMT)
A Mixed-Methods Study of Open-Source Software Maintainers On Vulnerability Management and Platform Security Features [6.8] 本稿では,OSSメンテナの脆弱性管理とプラットフォームセキュリティ機能について考察する。
サプライチェーンの不信や、脆弱性管理の自動化の欠如が、最も困難であることに気付きました。
プラットフォームのセキュリティ機能を採用する上での障壁は、認識の欠如と、それらが必要ないという認識の欠如である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:22:47 GMT)
A Deep Dive Into How Open-Source Project Maintainers Review and Resolve Bug Bounty Reports [6.8] 主に、バグ報奨金プラットフォームである texttthuntr を使用したオープンソースソフトウェア (OSS) メンテナの視点について検討する。
その結果,40の特徴を,メリット,課題,有用な機能,望まれる機能に分類した。
プライベートな情報開示とプロジェクトの可視性が最も重要なメリットであることに気付きました。一方、お金やCVEに焦点を当てたハンターやレビューのプレッシャーは克服するのが最も難しいのです。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:25:52 GMT)
TESS: A Scalable Temporally and Spatially Local Learning Rule for Spiking Neural Networks [6.8] リソース制約のあるデバイス上でのニューラルネットワーク(SNN)のトレーニングは、高い計算とメモリ要求のため、依然として困難である。
本稿では,SNNの学習のための時間的・空間的学習ルールであるTESSを紹介する。
本手法は,各ニューロン内の局所的な信号にのみ依存することにより,時間的および空間的クレジット割り当てに対処する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:23:15 GMT)
Wrapped Gaussian on the manifold of Symmetric Positive Definite Matrices [6.8] 円形および非平坦なデータ分布は、データ科学の様々な領域で広く使われている。
このようなデータの基盤となる幾何学を考慮に入れるための原則的なアプローチは、重要なものである。
この研究は、古典的な機械学習と統計手法をより複雑で構造化されたデータに拡張するための基礎となる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:46:46 GMT)
Improving the Robustness of Representation Misdirection for Large Language Model Unlearning [6.7] Representation Misdirection (RM) および variants is established large language model (LLM) unlearning method with state-of-the-art performance。
RM法は本質的にモデルのロバスト性を低下させ,一方の非逆方向のドナートケンが保持クエリにある場合でも誤動作を生じさせることを示す。
本稿では,RM法のロバスト性向上のための理論的保証付きモデルおよび手法アプローチであるランダムノイズ増強法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:05:36 GMT)
Additivity and chain rules for quantum entropies via multi-index Schatten norms [6.6] 我々は、最適化された量子チャネルのR'enyiエントロピーに対する一般的な付加性ステートメントを確立する。
応用として、[Van Himbeeck and Brown, 2025] の付加性ステートメントを強化し、時間適応型量子暗号プロトコルの解析を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:44:59 GMT)
Faster Configuration Performance Bug Testing with Neural Dual-level Prioritization [6.6] 設定パフォーマンスバグ(CPBugs)は、ソースコードに深く隠される可能性がある。
既存のテストツールは、長いランタイムに悩まされているか、予算が制限されたときにCPBugを検出するのに効果がなかった。
本稿では,設定オプションと値範囲レベルでのテストをニューラルネットワークで優先することで,CPBugテストの高速化を図る。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:24:04 GMT)
MeetMap: Real-Time Collaborative Dialogue Mapping with LLMs in Online Meetings [6.5] 異なるレベルのAIアシストを含む2つのシステム変種について検討する。
Human-Mapでは、AIは会話の要約をノードとして生成し、ユーザはノードとの対話マップを作成する。
AIマップでは、AIはユーザーが編集できる対話マップを生成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:47:15 GMT)
Efficient Prior Selection in Gaussian Process Bandits with Thompson Sampling [6.5] GPバンディットにおける共同選択と後悔の最小化のための2つのアルゴリズムを提案する。
理論的にはアルゴリズムを解析し,それぞれの後悔に対する上限を確立する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:29:35 GMT)
Revisiting VerilogEval: A Year of Improvements in Large-Language Models for Hardware Code Generation [6.5] オープンソースのVerilogEvalベンチマークのリリース以降,新しい商用およびオープンなモデルを評価する。
最先端のモデルでは測定可能な改善が得られます。
高いパスレートを達成するためには、迅速なエンジニアリングが不可欠であることに気付きました。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:29:27 GMT)
Strong and noise-tolerant entanglement in dissipative optomechanics [6.5] 我々は、ミシェルソン・サニャック干渉計と可動膜によって実現された散逸光力学における量子絡みについて研究した。
分散結合によって生じる量子絡み合いは、コヒーレント結合によって生じるものよりも著しく強く、耐雑音性が高いことを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:30:53 GMT)
CondAmbigQA: A Benchmark and Dataset for Conditional Ambiguous Question Answering [6.3] 大きな言語モデル(LLM)は、曖昧な質問に直面した場合、質問応答(QA)タスクにおいて幻覚を起こす傾向にある。
我々は200の曖昧なクエリを持つベンチマークであるCondAmbigQA(CondAmbigQA)を紹介する。
我々の研究は、あいまいなQAタスクにおける「条件」の概念の先駆者であり、条件はあいまいさを解決する文脈的制約や仮定を表す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:01:51 GMT)
ViewpointDepth: A New Dataset for Monocular Depth Estimation Under Viewpoint Shifts [6.3] 本稿では,異なるカメラ位置と方向が単眼深度推定性能に与える影響を定量化するための新しいデータセットと評価手法を提案する。
ホログラフィー推定とオブジェクト検出に基づく地上真実戦略を提案し、高価なLIDARセンサの必要性を排除した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:19:35 GMT)
STOP! Benchmarking Large Language Models with Sensitivity Testing on Offensive Progressions [6.2] 大規模言語モデル(LLM)における明示的バイアスと暗黙的バイアスの緩和は、自然言語処理の分野において重要な焦点となっている。
我々は,2700のユニークな文を含む450の攻撃的進行を含む,攻撃的進行に関する感性テストデータセットを紹介した。
以上の結果から,最も優れたモデルでさえバイアスを不整合に検出し,成功率は19.3%から69.8%であった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:06:34 GMT)
Query Brand Entity Linking in E-Commerce Search [6.2] 名前の一致認識とマッチングを組み合わせた2段階のアプローチと、極端な多クラス分類を用いた新しいエンドツーエンドソリューションを提案する。
オフラインベンチマークとオンラインA/Bテストの影響でソリューションを検証する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:37:37 GMT)
Sparks of Explainability: Recent Advancements in Explaining Large Vision Models [6.2] この論文は、ディープニューラルネットワークによって利用される特徴を分析し、モデル化することにより、コンピュータビジョンにおける説明可能性を改善するための高度なアプローチを探求する。
アルゴリズム的安定性に基づく計量とソボル指標を用いたアプローチを導入することにより、帰属法、特にサリエンシマップを評価する。
モデルと人間の推論を一致させ、概念的説明可能性アプローチを採用するという2つの仮説が検討されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:49:32 GMT)
Quantum-limited stochastic optical neural networks operating at a few quanta per activation [6.1] 計算におけるエネルギー効率は最終的にノイズによって制限され、量子制限は基本的なノイズフロアを設定する。
我々は、各ニューロンを1つの光子で活性化できる限界において、最後の層を除くすべての層が作動する光学ニューラルネットワークについて研究する。
トレーニングにおけるニューロン活性化の物理モデルを用いて、極めて高いショットノイズにもかかわらず、正確な機械学習推論を行うことができることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:23:03 GMT)
Higher-Order Causal Message Passing for Experimentation with Complex Interference [6.1] 本研究では、因果的メッセージパッシングに基づく新しい推定器のクラスを導入し、広範で未知な干渉のある設定に特化して設計する。
我々の推定器は、サンプルの平均値と時間とともに単位結果と処理のばらつきから情報を抽出し、観測データの効率的な利用を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:13:34 GMT)
Can We Validate Counterfactual Estimations in the Presence of General Network Interference? [6.1] 対実推定のためのクロスバリデーションを実現する新しいフレームワークを提案する。
中心となるのは、分散保存ネットワークブートストラップ方式です。
我々は、不均一な単位レベル特性を取り入れることで、最近の因果メッセージパッシングの発展を拡大する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:51:04 GMT)
Al-Khwarizmi: Discovering Physical Laws with Foundation Models [6.1] データから物理法則を推定することは、科学と工学の重要な課題である。
この研究は、データから物理法を発見するための新しいエージェントフレームワークであるAl-Khwarizmiを紹介している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:54:00 GMT)
SubTrack your Grad: Gradient Subspace Tracking for Memory and Time Efficient Full-Parameter LLM Training [6.1] 大規模言語モデル(LLM)の訓練は、大きなモデルのサイズと状態のために、かなりの時間と計算資源を必要とする。
進化する勾配部分空間を効率的に追跡する部分空間追跡に基づく最適化手法であるSubTrack-Gradを提案する。
SubTrack-Grad は GaLore よりも優れており、BAdam よりも優れています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:13:52 GMT)
Simulating Rumor Spreading in Social Networks using LLM Agents [6.0] 本研究では,ソーシャルネットワーク上でのうわさ伝播のダイナミクスをシミュレートし,解析するために,LLMエージェントを用いた新しいフレームワークを提案する。
本フレームワークは,各種ネットワーク構築とエージェントの動作が噂の拡散に与える影響を評価する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:39:56 GMT)
RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models [6.0] 我々は,Google Earth Engine (GEE) プラットフォームから取得した画像に対して,平易な OpenStreetMap (OSM) データから,意味的に豊富なキャプションを持つマルチモーダルデータセットを大規模に生成するワークフローを提案する。
本稿では,13万以上のRS画像からなるマルチモーダルデータセットであるRSTellerについて述べる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:57:01 GMT)
Improving Transformer World Models for Data-Efficient RL [5.9] 本稿では, Craftax-classicベンチマークにおいて, アートパフォーマンスの新たな状態を実現するためのモデルベースRLへのアプローチを提案する。
提案アルゴリズムは,1M環境ステップのみで67.4%の報酬を達成し,53.2%のDreamerV3を著しく上回り,初めて65.0%の人的パフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:25:17 GMT)
Divide and Conquer: Provably Unveiling the Pareto Front with Multi-Objective Reinforcement Learning [5.9] 反復パレート参照最適化(IPRO)を導入する。
IPROはParetoフロントを制約付き単目的問題の列に分解する。
問題固有の単目的解法を利用することで、本手法は多目的強化学習を超える応用を約束する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:02:03 GMT)
Geoinformatics-Guided Machine Learning for Power Plant Classification [5.9] 本稿では,知識誘導機械学習(KGML)分野におけるアプローチを提案する。
CNN (Convolutional Neural Networks) と ViT (Vision Transformers) とGIS (Geographic Information Systems) で構成されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:19:45 GMT)
Federated Detection of Open Charge Point Protocol 1.6 Cyberattacks [5.8] 電気自動車(EV)充電ステーションは、サイバー物理的およびプライバシー上の重大なリスクをもたらす。
本稿では,EV充電インフラのモニタリングにフェデレートラーニング(FL)アーキテクチャを採用することを提案する。
その結果,提案したFL系溶液の高検出性能が示された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:50:54 GMT)
Knowing When to Stop: Dynamic Context Cutoff for Large Language Models [5.8] 大規模言語モデル(LLM)は、クエリに応答するために必要な情報がコンテキスト内にローカライズされる場合、入力コンテキスト全体を無差別に処理する。
タスク関連情報を取得する際に, LLM が自己決定処理を行えるようなヒューマンインスピレーション付き手法である動的コンテキストカットオフを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:38:29 GMT)
Resilient UAV Trajectory Planning via Few-Shot Meta-Offline Reinforcement Learning [5.8] 本研究は、オフラインRLとモデルに依存しないメタ学習を組み合わせた、新しい、レジリエントで、少数ショットのメタオフラインRLアルゴリズムを提案する。
提案する数ショットメタオフラインRLアルゴリズムは,ベースライン方式よりも高速に収束することを示す。
オフラインデータセットを使用して最適な共同AoIと送信パワーを達成できる唯一のアルゴリズムである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:39:12 GMT)
On Probabilistic Pullback Metrics on Latent Hyperbolic Manifolds [5.7] 本稿では,階層関係のモデル化に適した双曲多様体について述べる。
本稿では, LVM の非線形写像によって生じる歪みを考慮に入れた, プルバック計量による双曲的計量の増大を提案する。
実験により, 引き戻し距離の測地学は双曲型潜在空間の幾何学を尊重するだけでなく, 基礎となるデータ分布と整合することを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:36:21 GMT)
Gradient Norm-based Fine-Tuning for Backdoor Defense in Automatic Speech Recognition [5.7] 本稿では,音声領域における攻撃に対する新たな防御戦略を提案する。
傾斜ノルム正規化を組み込むことでバックドアモデルの微調整を行い、バックドアニューロンの弱化と縮小を図る。
この研究は、オーディオ領域におけるバックドア攻撃に対して、初めて専門的で効果的な防御である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:42:46 GMT)
Applying the maximum entropy principle to neural networks enhances multi-species distribution models [5.7] 我々は、ニューラルネットワークを利用して種間の共有機能を自動的に学習するDeepMaxentを提案する。
我々は、その空間的サンプリングバイアスで知られるベンチマークデータセットでDeepMaxentを評価する。
以上の結果から,DeepMaxentはすべての地域やグループでMaxentよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:21:07 GMT)
Conformal Prediction for Hierarchical Data [5.6] 点推定誤差の経験的量に基づく予測領域を出力する多変量データ列の共形予測について考察する。
直感的には、階層構造は、所定のカバレッジレベルに対するそれらのサイズの観点から予測領域を改善するために利用することができる。
この直観は分割共形予測手順にプロジェクションステップを組み込むことで実現し、その結果の予測領域がプロジェクションステップなしでは世界規模で小さいことを証明する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:16:29 GMT)
VisTA: Vision-Text Alignment Model with Contrastive Learning using Multimodal Data for Evidence-Driven, Reliable, and Explainable Alzheimer's Disease Diagnosis [5.6] コントラスト学習を支援するマルチモーダル言語ビジョンモデルVisTAを提案する。
VisTAは4つのアウトプットを生成する:予測異常タイプ、参照ケースと類似性、エビデンス駆動の説明、そして最終AD診断である。
ベースライン前訓練に使用した1500万枚の画像と比較して、VisTAは微細調整に170個のサンプルしか使用せず、異常検索と認知症予測の大幅な改善を得た。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:15:01 GMT)
Quantum enhanced real-time sensing of protein-gold adsorption kinetics [5.5] 表面プラズモン共鳴(SPR)技術は,タンパク質結合動態のラベルなしリアルタイム測定に有効である。
信号と雑音の比を時間関数として記録し,運動過程を通じて維持する4dBのスクイージングを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:32:34 GMT)
RiskHarvester: A Risk-based Tool to Prioritize Secret Removal Efforts in Software Artifacts [5.4] 2020年以降、GitGuardianはGitHubリポジトリのチェックインされたハードコードシークレットを検出している。
2020-2023年の間に、GitGuardianはハードコードされたシークレットが4倍に増加し、2023年には1280万が公開された。
RiskHarvesterは、資産の価値とデータベースに対する攻撃の容易さに基づいて、セキュリティリスクスコアを計算するリスクベースのツールである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:32:12 GMT)
Mitigating Hallucinations in Large Vision-Language Models with Internal Fact-based Contrastive Decoding [5.4] 内部Fact-based Contrastive Decoding (IFCD)は、大規模視覚言語モデル(LVLM)の推論過程における幻覚の緩和と抑制を目的としている。
IFCDはLVLMの出力を校正し、最終予測から幻覚ロジットを効果的に除去する。
実験の結果, IFCD はPOPE では平均9% の精度向上, MME では8% の精度向上を実現し, オブジェクトレベルの幻覚と属性レベルの幻覚の両方を著しく軽減することがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:08:35 GMT)
Metric Privacy in Federated Learning for Medical Imaging: Improving Convergence and Preventing Client Inference Attacks [5.3] フェデレートラーニング(Federated Learning)とは、異なるデータオーナによるグローバルモデルのトレーニングを可能にする、分散学習技術である。
差分プライバシー(DP)は、ノイズを加えることでグローバルモデルを民営化するために利用することができる。
本稿では,従来のサーバ側グローバルDPが集約モデルの収束に与える影響を軽減するために,メートル法プライバシの概念を導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:41:52 GMT)
Scalable diffusion posterior sampling in infinite-dimensional inverse problems [5.3] 本研究では,サンプリング中の前方マッピング評価を回避できる拡張拡散後サンプリング法を提案する。
この手法は無限次元拡散モデルに一般化され、厳密な収束解析と高次元CT画像実験によって検証される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:49:31 GMT)
Boosting Graph Robustness Against Backdoor Attacks: An Over-Similarity Perspective [5.3] グラフニューラルネットワーク(GNN)は、ソーシャルネットワークやトランスポートネットワークなどのタスクにおいて顕著な成功を収めている。
最近の研究は、GNNのバックドア攻撃に対する脆弱性を強調し、現実世界のアプリケーションにおける信頼性に関する重大な懸念を提起している。
そこで我々は,新しいグラフバックドアディフェンス手法SimGuardを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:41:42 GMT)
On Exact Space-Depth Trade-Offs in Multi-Controlled Toffoli Decomposition [5.3] Clifford $+$ T ゲートセットを用いた Multi Toffoli (MCT) の最適化実装について検討する。
古典的2制御トフォリを用いたトフォリ深度と深度とのトレードオフの定量化を行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:16:11 GMT)
End-to-end Training for Text-to-Image Synthesis using Dual-Text Embeddings [5.2] 本研究では,テキスト・ツー・イメージ合成ネットワークに適したテキスト埋め込み学習手法について検討する。
生成的およびコントラスト的なトレーニングを組み合わせることで、生成画像の写実性を高めるために最適化された2つの埋め込みと、テキストと画像のアライメントをキャプチャする2つの埋め込みを利用する。
3つのテキスト・ツー・イメージ・ベンチマーク・データセットに対する総合的な実験により、2つの別々の埋め込みが共有テキストを使用するよりも優れた結果をもたらすことが明らかとなり、差別的アプローチを用いて訓練された事前学習されたテキストエンコーダのテキスト表現を使用する手法と比較して、そのようなアプローチが好適に機能することが確認された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:40:47 GMT)
Strong-to-weak spontaneous breaking of 1-form symmetry and intrinsically mixed topological order [5.2] 2+1d の位相順序は、純粋な状態における 1-形式対称性の自発的対称性を破る位相である。
我々は、混乱したアンサンブルが有限パラメータ範囲上に存在するという意味で「安定な位相を形成する」ことを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:05:13 GMT)
Prithvi-EO-2.0: A Versatile Multi-Temporal Foundation Model for Earth Observation Applications [5.2] Prithvi-EO-2.0は、新しい地理空間基盤モデルであり、前者よりも大幅に改善されている。
これは、NASAのハーモナイズド・ランドサットとセンチネル2のデータアーカイブから、30m解像度で4.2Mのグローバル時系列サンプルで訓練されている。
6億バージョンは以前のPrithvi-EOモデルより8%上回っている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:21:58 GMT)
A Multi-Scale Feature Fusion Framework Integrating Frequency Domain and Cross-View Attention for Dual-View X-ray Security Inspections [5.2] シングルビューX線装置は複雑な積み重ねシナリオにおいてコントラバンドを正確に識別するのに苦労する。
デュアルビューX線セキュリティ検査画像分類に適した,革新的なマルチスケールインタラクティブ機能融合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:18:54 GMT)
What is causal about causal models and representations? [5.1] 因果ベイズネットワークは介入分布の予測を行うため「因果」モデルである。
このような因果モデル予測と実世界の成果を結びつけるためには、どの行動がモデル内のどの介入に対応するかを決定する必要がある。
我々は、介入の正確さとして、行動の異なる解釈にそのような要件を課すための正式な枠組みを導入する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:24:50 GMT)
PSSD: Making Large Language Models Self-denial via Human Psyche Structure [5.1] 本稿では,3つの異なる役割が人間の推論に寄与するように,人間の精神構造を参照し,実装する。
大規模な実験では、提案された設計が推論能力を向上するだけでなく、現行のモデルとシームレスに統合できることが示されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:37:21 GMT)
Online Clustering with Bandit Information [5.0] 固定信頼設定の下で,マルチアーム・バンディット・フレームワークにおけるオンラインクラスタリングの問題点について検討する。
本稿では,Average Tracking Bandit Online Clustering (ATBOC) という新しいアルゴリズムを導入する。
LUCBアルゴリズムにインスパイアされた、より効率的なLow and Upper Confidence BoundベースのBandit Online Clustering (LUCBBOC)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:54:14 GMT)
Stream-level flow matching with Gaussian processes [4.9] 条件付きフローマッチング(CFM)は、連続正規化フロー(CNF)を適合させる訓練アルゴリズムの一群である。
我々は、ストリームに沿った条件付き確率パス、ソースとターゲットのデータペアを接続する遅延パスのインスタンスを定義することで、CFMアルゴリズムを拡張した。
本研究では, CFMの一般化により, 推定限界ベクトル場の分散を適度な計算コストで効果的に低減できることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:31:17 GMT)
A Framework for Double-Blind Federated Adaptation of Foundation Models [4.9] 完全同型暗号(FHE)を用いたFMの二重盲連合適応のためのフレームワークを提案する。
提案したフレームワークは、FMを知識蒸留によりFHEフレンドリーなブロックの列に分解する。
結果として生じるFHEフレンドリーなモデルは、低ランクの並列アダプタを介して下流タスクに適応する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:00:11 GMT)
FastKV: KV Cache Compression for Fast Long-Context Processing with Token-Selective Propagation [4.9] 大きな言語モデル(LLM)は、長いコンテキストシーケンスを扱うのに優れている。
コンテキスト情報を格納するために、かなりのキーバリュー(KV)キャッシュが必要である。
FastKVは、長いコンテキストシーケンスのレイテンシを高めるために設計されたKVキャッシュ圧縮方式である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:25:09 GMT)
GRADIEND: Monosemantic Feature Learning within Neural Networks Applied to Gender Debiasing of Transformer Models [4.8] ジェンダー情報を符号化する単一単意味特徴ニューロンを学習するための新しいエンコーダ・デコーダ手法を提案する。
提案手法はトランスフォーマーに基づく言語モデルのデバイアス化に有効であり,他の機能も維持可能であることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:38:27 GMT)
Vessel segmentation for X-separation [4.8] $chi$-セパレーション(英: $chi$-separation)は、準磁性(chi_para$)および反磁性(chi_dia|$)の感受性マップを生成するために設計された、高度な定量的感受性マッピング(QSM)法である。
しかし、船体は人工物を示しており、鉄とミエリンの正確な定量化に干渉している。
この課題に対処するために、$chi$-セパレーションのための新しい容器セグメンテーション法を開発した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:37:46 GMT)
PolyhedronNet: Representation Learning for Polyhedra with Surface-attributed Graph [4.7] PolyhedronNetは3D多面体オブジェクトの表現を学習するための一般的なフレームワークである。
本実験は,ポリヘドロンネットによる3次元多面体物体の包括的および情報的表現の取得の有効性を実証するものである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:45:19 GMT)
LLM-TA: An LLM-Enhanced Thematic Analysis Pipeline for Transcripts from Parents of Children with Congenital Heart Disease [4.7] Thematic Analysis (TA)はリソース集約型であり、大規模で複雑なデータセットのスケールが困難である。
本研究では, 大規模言語モデル (LLM) が高用量医療環境において誘導的TAプロセスを増大させる可能性について検討した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:51:46 GMT)
Category-Theoretical and Topos-Theoretical Frameworks in Machine Learning: A Survey [4.7] カテゴリー理論に基づく機械学習を4つの主流視点から概観する。
最初の3つのトピックについて、主に過去5年間の調査をレビューし、以前の調査を更新し、拡張しました。
第4のトピックは、高次圏論、特にトポス理論を論じるもので、この論文で初めて調査される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:09:42 GMT)
Adapting Foundation Models for Few-Shot Medical Image Segmentation: Actively and Sequentially [4.7] FSDAにおける動的補助的データセット選択のためのフレームワークを提案する。
我々は、目標タスクと密接に一致した補助データセットのトレーニングを優先する効率的な報酬関数を導出する。
提案手法はMRIでは平均27.75%,CTでは7.52%,Diceでは平均27.75%であった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:47:10 GMT)
Towards Agile Swarming in Real World: Onboard Relative Localization with Fast Tracking of Active Blinking Markers [4.7] アクティブ・ブリンク・マーカ・トラッキング(AMT)を用いた視覚に基づく相対的局所化と通信を可能にする新しいオンボードトラッキング手法を提案する。
AMTは重み付き回帰を用いて、予測の不確実性を考慮しつつ、アクティブな点滅マーカーの将来の出現を予測する。
屋外実験では、AMTアプローチは密度、精度、複雑さを追跡する最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:05:00 GMT)
Inversely Learning Transferable Rewards via Abstracted States [4.5] 逆強化学習(IRL)は、行動データから離散領域と連続領域の両方において、基礎となる報酬を正確に学習する方向に大きく進歩している。
ロボットアプリケーションのコンテキストでは、ロボットをスクラッチからプログラミングすることなく、新しいタスクを含む処理ラインに統合するのに役立つ。
ドメインの2つ以上の異なるインスタンスにおける行動軌跡から抽象的な報酬関数を逆学習する手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:08:17 GMT)
Wave-U-Mamba: An End-To-End Framework For High-Quality And Efficient Speech Super Resolution [4.5] SSR(Speech Super-Resolution)は、高周波数成分の欠如を回復させることにより低分解能音声信号を強化するタスクである。
従来の手法では、通常、対数メルの特徴を再構成し、次いで波形領域で高分解能な音声を生成するボコーダが続く。
本稿では,SSRを時間領域で直接実行するWave-U-Mambaという手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:07:17 GMT)
Learning Hyperparameters via a Data-Emphasized Variational Objective [4.5] グリッド検索は計算コストが高く、検証セットを彫り出す必要があり、ユーザは候補値を指定する必要がある。
正規化ハイパーパラメータを,エビデンスローバウンド(ELBo)の目的を通じて,フルトレーニングセット上で直接学習する手法を提案する。
提案手法により,過去の作業の88時間以上のグリッド検索を3時間以内の精度で行うことができることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:19:35 GMT)
Relating Misfit to Gain in Weak-to-Strong Generalization Beyond the Squared Loss [4.5] 強クラスにおける$k$強モデルの凸結合に対する弱強一般化について検討する。
同様の不適合性に基づく性能向上のキャラクタリゼーションが得られ、$k$が大きくなると消滅する追加のエラー項が現れる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:44:05 GMT)
Identification and explanation of disinformation in wiki data streams [4.4] 本研究は,ウィキページ上のオンラインコンテンツの急速な成長に対処するため,自動データ品質検証分野への貢献を目的としている。
我々のスケーラブルなソリューションには、機能エンジニアリングによるストリームベースのデータ処理、特徴分析と選択、ストリームベースの分類、予測結果のリアルタイム説明が含まれる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:34:39 GMT)
Modular and Integrated AI Control Framework across Fiber and Wireless Networks for 6G [4.3] 本稿では,光ファイバーネットワークと無線ネットワークの両方で使用するために,高度に柔軟で適応可能なAIコントローラの包括的なフレームワークを提案する。
当社のアプローチでは,さまざまなネットワークトランスポート技術やドメインにまたがる統合AIコントロールフレームワークの必要性に対処し,インテリジェントで自動化された,スケーラブルな6Gネットワークの開発を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:12:44 GMT)
Optimal State Preparation for Logical Arrays on Zoned Neutral Atom Quantum Computers [4.3] 高誤差率は、実用的な応用のために量子エラー補正を必要とする。
ゾーン型中性原子アーキテクチャによるセミナー実験は、フォールトトレラント量子コンピューティングの顕著な可能性を示している。
この研究は、SMTソルバの計算能力を活用し、論理配列の状態作成のための最小スケジュールを生成することでギャップに対処する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:06:14 GMT)
TFBS-Finder: Deep Learning-based Model with DNABERT and Convolutional Networks to Predict Transcription Factor Binding Sites [4.3] 我々は,事前学習したDNABERT,CNNモジュール,MCBAMモジュール,MSCAモジュール,出力モジュールを用いたディープラーニングモデルを開発した。
TFBS-Finderは165のENCODE ChIP-seqデータセットでトレーニングされ、テストされる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:41:11 GMT)
Clarify Confused Nodes via Separated Learning [4.3] グラフニューラルネットワーク(GNN)は,グラフ指向タスクにおいて顕著な進歩を遂げている。
実世界のグラフは、必ずある種の不均一なノードを含み、伝統的なGNNのホモフィリーな仮定に挑戦する。
我々は,ノードのより信頼性の高い分離を容易にするため,Nighborhood Confusion(NC)と呼ばれる新しいメトリクスを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:06:55 GMT)
Deep Active Learning based Experimental Design to Uncover Synergistic Genetic Interactions for Host Targeted Therapeutics [4.2] 本稿では,生物知識グラフからの情報を組み込んだDeep Active Learningフレームワークを提案する。
このフレームワークは、探索と探索のトレードオフのバランスを保ち、非常に効果的な二重ノックダウンペアをピンポイントにしながら、タスク特異的な遺伝子表現を生成することができる。
これは、評価可能なスケールの二重遺伝子ノックダウン実験データに対する有望な結果を示す最初の研究である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:03:21 GMT)
A comparison between humans and AI at recognizing objects in unusual poses [4.2] 物体が異常なポーズで見えるような難解な画像のギャップについて検討する。
人間はそのようなポーズで物体を認識するのが得意である。
視覚のための深いネットワークは、異常なポーズで体系的に不安定である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:37:06 GMT)
Large-scale Time-Varying Portfolio Optimisation using Graph Attention Networks [4.2] 本研究では、中規模企業における30年間のデータを活用し、距離相関と三角最大フィルタグラフを用いた企業のグラフを作成する。
GATベースのモデルが生み出すポートフォリオは、すべてのベンチマークより優れており、長期にわたって他の戦略よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:04:58 GMT)
An Agentic AI Workflow for Detecting Cognitive Concerns in Real-world Data [4.2] 認知的関心事の早期発見は批判的であるが、微妙な症状の提示によってしばしば妨げられる。
この研究は、LLaMA 3 8Bを用いた完全に自動化されたマルチエージェントAIワークフローを開発し、検証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:08:33 GMT)
Error dynamics of mini-batch gradient descent with random reshuffling for least squares regression [4.2] 最小二乗回帰に対するランダムリシャッフルによるミニバッチ勾配勾配のダイナミクスについて検討する。
トレーニングと誤差は、サンプルのクロス共分散行列$Z$に依存することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:54:07 GMT)
Improving Pareto Set Learning for Expensive Multi-objective Optimization via Stein Variational Hypernetworks [4.1] 重大多目的最適化問題(EMOP)は、目的関数の評価にコストがかかる実世界のシナリオでは一般的である。
本稿では,Stein Variational Gradient Descent (SVGD) を Hypernetworks に統合した SVH-PSL という新しい手法を提案する。
本手法は, 解空間を滑らかにするために粒子を集合的に移動させることにより, フラグメント化サロゲートモデルと擬似局所最適化の問題に対処する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:33:25 GMT)
Grokking Explained: A Statistical Phenomenon [4.1] グローキング(英: Grokking)または遅延一般化(英: delay generalization)は、モデルのトレーニングセットの損失が収束した後のみ、テストセットの損失が急激に減少する興味深い学習現象である。
本稿では,グルーキングを定式化し,その出現の鍵となる要素がトレーニングデータとテストデータ間の分散シフトであることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:28:11 GMT)
Continuous Autoregressive Modeling with Stochastic Monotonic Alignment for Speech Synthesis [4.1] 音声合成のための新しい自己回帰モデル手法を提案する。
本稿では,変分型オートエンコーダ(VAE)と多モード潜在空間と,ガウス混合モデル(GMM)を条件付き確率分布として用いた自己回帰モデルを組み合わせる。
提案手法は, 主観的, 客観的な評価において, 最先端の自己回帰モデルであるVALL-Eよりも優れていた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:53:59 GMT)
Maximizing free energy gain [4.0] 自由エネルギーの利得がシステムの初期状態にどのように依存するかを考察する。
我々は、他の最適初期状態ではなく、最適初期状態を用いて得られる自由エネルギーを関係づける公式を導出する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:33:54 GMT)
Fine-Tuning Discrete Diffusion Models with Policy Gradient Methods [4.0] 非微分可能報酬に対する離散拡散モデルを微調整するための、効率的で、広く適用でき、理論的に正当化されたポリシー勾配アルゴリズムを提案する。
複数の離散的生成タスクに対する数値実験により,本手法のスケーラビリティと効率性を実証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:20:19 GMT)
An Algorithm for Fixed Budget Best Arm Identification with Combinatorial Exploration [4.0] 我々は、K$$armed banditフレームワークにおける最適な腕識別問題を考察する。
エージェントは1つのアームではなく、各タイムスロットでアームのサブセットをプレイすることができる。
我々は、$log K$グループを構築し、最適なアームの存在を検出するための確率比テストを実行するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:10:08 GMT)
BLens: Contrastive Captioning of Binary Functions using Ensemble Embedding [3.9] 本稿では,複数のバイナリ関数の埋め込みを新しいアンサンブル表現に組み合わせたBLensを提案する。
我々の実験は、BLensが芸術の状態を著しく上回ることを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:26:39 GMT)
Emancipatory Information Retrieval [3.9] 本論文は,コンピュータによる情報アクセスの課題における役割を挑発するものである。
ここでの「解放」という言葉は、すべての人々の普遍的人間化に関する道徳的な懸念を表している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:16:43 GMT)
Adaptive Observation Cost Control for Variational Quantum Eigensolvers [3.9] SMOの信頼性領域(SubsCoRe)における部分空間と呼ばれる適応的コスト制御法
SubsCoReはSMOの効率を大幅に改善し、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:14:45 GMT)
Can message-passing GNN approximate triangular factorizations of sparse matrices? [3.9] スパース行列プレコンディショナー学習のためのグラフニューラルネットワーク(GNN)の基本的限界について検討する。
我々はこれらの制限を説明するための理論的解析と経験的証拠を提供し、数値線型代数における GNN の広範な利用を示唆する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:28:20 GMT)
Activation by Interval-wise Dropout: A Simple Way to Prevent Neural Networks from Plasticity Loss [3.8] 塑性損失は、新しいタスクやデータ分散のシフトに適応するモデルの能力を制限する。
本稿では,AID (Activation by Interval-wise Dropout) について紹介する。
AIDはネットワークを正規化し,可塑性損失を伴わない深い線形ネットワークに類似した振舞いを促進する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:34:53 GMT)
Hierarchical Correlation Clustering and Tree Preserving Embedding [3.8] 本稿では,よく知られた相関クラスタリングを拡張する階層的相関クラスタリング手法を提案する。
本稿では,このような階層的相関クラスタリングを用いた教師なし表現学習について検討する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:40:55 GMT)
Towards Detecting Prompt Knowledge Gaps for Improved LLM-guided Issue Resolution [3.8] GitHubイシュースレッド内の433人の開発者-ChatGPT会話を分析し、インシデントギャップと会話スタイルが課題解決に与える影響を調べる。
不効果的な会話は44.6%のプロンプトで知識ギャップを含んでいるのに対し、効果的な会話では12.6%しかなかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:14:09 GMT)
Mutual Information Preserving Neural Network Pruning [3.7] 我々は,Mutual Information Preserving Pruning (MIPP)を導入する。
MIPPは、訓練前または訓練後のプルーニングが実行されたかどうかにかかわらず、最先端の手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:55:40 GMT)
On the Robustness of Temporal Factual Knowledge in Language Models [3.7] 本稿では,事実知識を扱う上での言語モデル(LM)の時間的堅牢性について考察する。
LM内部の時間的事実知識の堅牢性をテストするための制御実験を設計する。
Llama-3.1-70Bのような非常に大きな最先端モデルでさえ、時間的事実に関する堅牢な知識を欠いていることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:24:55 GMT)
Mind the Gap: a Spectral Analysis of Rank Collapse and Signal Propagation in Attention Layers [3.7] ソフトマックスに基づく注意の代替は、効果的な情報の流れを妨げる傾向があるためである。
我々は、注目行列の2つの最大の特異勾配の間のスペクトルギャップを明らかにするために厳密な解析を行う。
外れ値を取り除き、広さのランク崩壊を解消する新しい簡単な実用的解法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:45:29 GMT)
Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees [3.7] Learning-to-Defer(L2D)は、AIシステムと意思決定者間の最適なタスク割り当てを容易にする。
本稿では, 2段階のL2Dフレームワークにおいて, 対向ロバスト性の最初の包括的解析を行う。
我々はベイズと$(mathcalR,mathcalG)$-consistencyをルーツとする頑健で凸なdeferralアルゴリズムであるSARDを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:44:35 GMT)
Standardizing Intelligence: Aligning Generative AI for Regulatory and Operational Compliance [3.7] 我々は、ドメインやセクター間で異なる標準の臨界レベルを評価し、最先端のGenAIモデルの現在のコンプライアンス能力を評価することでそれらを補完する。
全体として、GenAIと標準を計算手法で整合させることは、規制と運用のコンプライアンスを強化するのに役立つと論じる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:55:01 GMT)
Disentangling Exploration of Large Language Models by Optimal Exploitation [3.6] この作業は、探索を唯一の目的として分離し、エージェントに将来のリターンを高める情報の提供を任せる。
様々なモデルによる総合的な実験は、ほとんどの場合、状態空間を十分に探索するのに苦労していることを示している。
パラメータカウントと探索性能の正の相関を観測し,より大きなモデルで優れた性能を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:17:44 GMT)
Geometric Framework for 3D Cell Segmentation Correction [3.5] 3次元の細胞画像分割法は, 一般に非2次元と2次元のアプローチに分けられる。
2D結果の誤差はしばしば伝播し、最終3D結果の過小評価につながる。
本稿では,隣接層からの幾何情報に基づいて2次元分割結果を補正することにより,過分割に対処する解釈可能な幾何学的枠組みを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:47:45 GMT)
A Two-Stage Learning-to-Defer Approach for Multi-Task Learning [3.4] 分類タスクと回帰タスクを共同で扱うマルチタスク学習のための新しい2段階学習フレームワークを提案する。
我々は,分類と回帰が密結合した物体検出,電子健康記録解析の2つの課題に対して,我々の枠組みを検証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:12:17 GMT)
Learning Nonlinearity of Boolean Functions: An Experimentation with Neural Networks [3.4] 我々は,ブール関数の非線形性を学習するために,エンコーダスタイルのディープニューラルネットワークを訓練する。
ディープニューラルネットワークは,4変数と5変数の関数の性質を95%以上の精度で予測できることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:10:25 GMT)
Global universal approximation of functional input maps on weighted spaces [3.4] 無限次元の重み付き空間上で定義されたいわゆる関数型入力ニューラルネットワークを導入し、無限次元の出力空間にも値を導入する。
連続函数に対する重み付き空間上の大域的普遍近似結果が、コンパクト集合上の通常の近似を超えていることを証明する。
署名核のヒルベルト核空間の再現は、ある種のガウス過程のキャメロン・マルティン空間であることを強調する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:10:09 GMT)
Predict. Optimize. Revise. On Forecast and Policy Stability in Energy Management Systems [3.3] 本研究は,エネルギー管理システムにおける予測と最適化の統合という課題に対処する。
スイッチングコストを用いてオンライン最適化問題を解析し,決定論的および確率的予測によって実現するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:41:20 GMT)
Efficiently Integrate Large Language Models with Visual Perception: A Survey from the Training Paradigm Perspective [3.2] 本稿では,トップカンファレンス,ジャーナル,高度に引用されたArxiv論文から34の視覚大言語モデル(VLLM)を分類し,レビューする。
まず,大規模言語モデルとパラメータ効率の学習手法のアーキテクチャを導入し,視覚エンコーダとモダリティエンコーダの包括的分類法について議論した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:01:59 GMT)
Land Surface Temperature Super-Resolution with a Scale-Invariance-Free Neural Approach: Application to MODIS [3.2] 小型ランドサーフェスサーフェス(LST)マップを提供するための超解像法が開発されている。
その多くは低分解能で訓練されているが、微細分解能で応用されているため、必ずしも適応されないスケール不変仮説が必要である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:52:19 GMT)
Are We Learning the Right Features? A Framework for Evaluating DL-Based Software Vulnerability Detection Solutions [3.2] 本論文は,本領域における研究を適切に評価するための基盤を提供することを目的とする。
脆弱性に寄与するコードの構文的および意味的特徴に対する脆弱性データセットを分析する。
この表現は、コード内の脆弱性と突発的な機能の両方の存在を検出するのに使われます。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:35:01 GMT)
Learning with Differentially Private (Sliced) Wasserstein Gradients [3.2] 本稿では,データ依存的経験的尺度間のワッサーシュタイン距離に依存する目的をプライベートに最適化するための新しい枠組みを提案する。
我々の主要な理論的貢献は、ワッサーシュタイン勾配を完全に離散的に明示的に定式化することに基づいている。
本研究では,有限サム構造を持つ問題に対するDP学習を目的とした,勾配とアクティベーションのクリッピングを取り入れたディープラーニング手法を開発した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:14:26 GMT)
Mitigation of Camouflaged Adversarial Attacks in Autonomous Vehicles--A Case Study Using CARLA Simulator [3.1] AVにおける交通信号認識を目的としたカメラカモフラージュ対向攻撃を開発した。
その結果、このような攻撃は停止標識に対する自動ブレーキ応答を遅らせる可能性があり、潜在的な安全上の問題を引き起こす可能性が示唆された。
提案手法は、他のエンドツーエンドの自律サイバー物理システムに適用可能である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:30:43 GMT)
Regression and Forecasting of U.S. Stock Returns Based on LSTM [3.1] 本稿では、米国株式市場における3つの株式セクター、Manuf、Hitec、およびその他の投資リターンについて分析する。
ファマ・フレンチの3要素モデル、カーハートの4要素モデル、ファマ・フレンチの5要素モデルに基づいている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:26:44 GMT)
Low Resource Video Super-resolution using Memory and Residual Deformable Convolutions [3.0] トランスフォーマーベースのビデオスーパーレゾリューション(VSR)モデルは近年、新しいベンチマークを設定しているが、その相当な計算要求により、リソースに制約のあるデバイスへの展開には適さないものが多い。
本稿では,VSRのための軽量・パラメータ効率の深い残留変形可能な畳み込みネットワークを提案する。
パラメータはわずか230万であり、REDS4データセット上での最先端のSSIMは0.9175である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:46:15 GMT)
The Differences Between Direct Alignment Algorithms are a Blur [3.0] 直接アライメントアルゴリズム(DAA)は、強化学習(RL)と報酬モデリング(RM)を置き換えることで言語モデルのアライメントを簡素化する
DAAは、ランキングの損失(ペアワイズ対ポイントワイズ)、それらの損失に使用される報酬(例えば、ポリシーと参照ポリシーの確率比、オッズ比)、または監督された微調整フェーズが必要かどうか(2段階対1段階)によって分類することができる。
これらの結果は、アライメントアルゴリズムにおける性能向上の早期主張や全体的な優位性を回避するために、注意深い評価の重要性を強調している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:54:14 GMT)
Uhlmann's theorem for relative entropies [3.0] ウルマンの定理を $alpha$-R'enyi 相対エントロピーに一般化する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:00:12 GMT)
Large Language Models are Advanced Anonymizers [2.9] 大規模言語モデル(LLM)に関する最近のプライバシー調査では、オンラインテキストから個人データを推測することで、ほぼ人間レベルのパフォーマンスを達成することが示されている。
既存のテキスト匿名化手法は現在、規制要件や敵の脅威に欠けています。
逆LLM推論の面における匿名性を評価するための新しい設定法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:03:13 GMT)
Generalization Error Analysis for Selective State-Space Models Through the Lens of Attention [2.9] ステートスペースモデル(State-space Model、SSM)は、トランスフォーマーの代替として登場した新しい基礎モデルである。
本稿では,MambaアーキテクチャとMamba-2アーキテクチャのコアコンポーネントである選択SSMの詳細な理論的解析を行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:05:31 GMT)
The controlled exciton transport of the Multi-chain system by cavity-dressed energy level crossings and anticrossings [2.9] 本研究では, キャビティ内における結合形状の異なる2層多鎖系からなる2次元系の励起子輸送について検討した。
鎖間結合, 二量化パラメータ, 空洞, 鎖の長さと数がエクシトン輸送に及ぼす影響について検討した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:01:29 GMT)
GauCho: Gaussian Distributions with Cholesky Decomposition for Oriented Object Detection [2.8] 本稿では,コレスキー行列分解に基づいてガウス分布を直接生成するOODの回帰ヘッドを提案する。
提案したヘッドはGauChoと呼ばれ、理論上境界不連続問題を緩和し、最近のガウスに基づく回帰損失関数と完全に互換性がある。
実験の結果,GauCho は従来の OBB ヘッドの代替として実現可能であり,挑戦的なデータセット DOTA の最先端検出器に匹敵する結果が得られることが示された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:47:26 GMT)
AtmosSci-Bench: Evaluating the Recent Advance of Large Language Model for Atmospheric Science [2.8] 本稿では,大気科学問題の5つの中核カテゴリにわたる大規模言語モデル(LLM)を評価するために設計された新しいベンチマークを提案する。
我々はテンプレートベースの質問生成フレームワークを採用し、大学院レベルの大気科学問題から、スケーラブルで多様な複数選択の質問を可能にする。
我々の分析は、大気科学におけるLCMの推論と問題解決能力に関する興味深い洞察を与えてくれる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:50:46 GMT)
FireCastNet: Earth-as-a-Graph for Seasonal Fire Prediction [2.7] 本稿では,3次元畳み込みエンコーダとGraphCastを組み合わせた新しいアーキテクチャFireCastNetを提案する。
FireCastNetは、異なる空間スケールと時間スケールで、山火事につながるコンテキストをキャプチャするために訓練されている。
本研究は,燃えている地域の存在を予測するためのモデルの有効性を評価することに焦点を当てた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:30:45 GMT)
The Effects of Enterprise Social Media on Communication Networks [2.7] エンタープライズソーシャルメディアプラットフォーム(ESMP)は、標準的なソーシャルメディア機能を備えたWebベースのプラットフォームである。
この研究の最初の貢献は、企業の通信ネットワークにおけるESMPの因果的影響を測定するために、99ドルの企業の差分差分分析を使用することである。
この研究の2つ目の貢献は、Microsoft自身のコミュニケーションネットワークのデータを利用して、これらのコミュニケーション技術が企業階層をまたいで人々を接続する方法を理解することである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:59:25 GMT)
FairUDT: Fairness-aware Uplift Decision Trees [2.6] フェアネスを意識したアップリフトに基づく識別木であるFairUDTを提案する。
本稿では, 昇降モデルと決定木の統合が, 公平な分断基準を含むようにどのように適応できるかを示す。
また、FairUDTは本質的に解釈可能であり、識別検出タスクに利用できることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:24:01 GMT)
Leveraging Multi-facet Paths for Heterogeneous Graph Representation Learning [2.6] MF2Vecは、事前に定義されたメタパスの代わりに、多面的(きめ細かい)パスを使用するモデルである。
この方法はノードとその関係の多様な側面を学習し、均質なネットワークを構築し、分類、リンク予測、クラスタリングのためのノード埋め込みを生成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:26:04 GMT)
Learning Time-Varying Multi-Region Communications via Scalable Markovian Gaussian Processes [2.6] 我々はマルコフ的ガウス過程を用いて時間変化の時間的遅延で脳のコミュニケーションを学習する新しい枠組みを提案する。
この研究は、分散ニューラルネットワークの理解を深め、動的脳ネットワークを解析するためのスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:40:43 GMT)
Augmented Knowledge Graph Querying leveraging LLMs [2.5] 我々は、知識グラフ(KG)のクエリを強化するフレームワークであるSparqLLMを紹介する。
SparqLLMは、生データからKGを構築するために、Extract, Transform, and Load (ETL)パイプラインを実行する。
また、Large Language Models(LLMs)を利用した自然言語インターフェースを備え、自動SPARQLクエリ生成を実現している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:18:39 GMT)
A generative foundation model for an all-in-one seismic processing framework [2.5] 生成的震源モデル(GSFM)は、生成的拡散モデル(GDM)に基づく統一的な枠組みである
目標指向拡散過程予測を採用することにより、GSFMは精度を損なうことなく計算効率を向上させる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:01:36 GMT)
State of practice: evaluating GPU performance of state vector and tensor network methods [2.5] 本稿では,8種類の量子サブルーチンを用いたテストベンチにおける現状シミュレーション手法の限界について検討する。
我々は,最大1桁のスピードアップを達成し,最適なシミュレーション戦略を選択する方法について強調する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:48:39 GMT)
CTBENCH: A Library and Benchmark for Certified Training [2.5] 認定トレーニングのための高品質なベンチマークであるCTBenchを紹介する。
我々は,CTBenchのほぼ全てのアルゴリズムが,文学における報告された性能を上回ることを示す。
認定トレーニングの現状に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:49:02 GMT)
Style-based Clustering of Visual Artworks and the Play of Neural Style-Representations [2.4] スタイルに基づくクラスタリングアートは、アートレコメンデーションやスタイルベースの検索、検索など、現実世界の多くのアプリケーションを提供できる。
スタイルに基づいたクラスタリングアートワークは,主に非適応的な問題である,と我々は主張する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:58:02 GMT)
Beyond Pixels: Enhancing LIME with Hierarchical Features and Segmentation Foundation Models [2.4] LIMEは、ビジョン機械学習モデルにおける意思決定プロセスを解き放つための人気のあるXAIフレームワークである。
本稿では,DSEG-LIME(Data-Driven LIME)フレームワークについて紹介する。
以上の結果から,DSEGは事前学習したImageNetモデルにおいて,XAIの指標よりも優れていた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:44:34 GMT)
Quantum Quandaries: Unraveling Encoding Vulnerabilities in Quantum Neural Networks [2.3] この研究は、量子クラウド環境の敵がQMLモデルへのホワイトボックスアクセスを活用できることを実証している。
95%の時間、符号化が正しく予測可能であることを報告した。
この脅威を軽減するために,指紋を隠蔽する一過性の難読化層を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:21:16 GMT)
Adaptive Channel Reshaping for Improved Entanglement Distillation [2.2] 我々は、蒸留プロトコルが、非常にノイズの多いチャネルのいくつかの使用をより良い効果のあるチャネルに再形成する鍵となる観察に基づいて構築する。
振幅減衰流路では,提案プロトコルはチャネルを消去流路に再設定し,最もよく知られた下界を超える速度を達成する。
脱分極チャネルでは、性能保証が証明されたGreedy繰り返しプロトコルを導入し、組み合わせたプロトコルを構築する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:17:16 GMT)
BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics [2.2] textttBirdSetは、鳥のバイオ音響に焦点を当てたオーディオ分類のための大規模なベンチマークデータセットである。
textttBirdSetは、トレーニング用に1万近いクラス($uparrow!18times$)から6800以上の録音時間($uparrow!17%$)、強くラベル付けされた8つの評価データセットで400時間以上($uparrow!7times$)でAudioSetを上回っている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:39:15 GMT)
Knowledge Synthesis of Photosynthesis Research Using a Large Language Model [2.2] 本研究は,OpenAIのGPT-4oに基づく光合成研究アシスタント(PRAG)を提案する。
PRAGは、科学的記述に関連する5つの指標に対して平均8.7%の改善を示し、ソース透明性は25.4%増加した。
その科学的深度と領域範囲は光合成研究論文に匹敵するものであった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:10:19 GMT)
Interpreting Outliers in Time Series Data through Decoding Autoencoder [2.2] 本研究は、ドイツの自動車供給産業における時系列データの製造に焦点をあてる。
我々はオートエンコーダを用いて時系列全体を圧縮し,その潜在特徴に異常検出技術を適用する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:56:36 GMT)
Forecasting VIX using interpretable Kolmogorov-Arnold networks [2.1] 本稿では,CBOEボラティリティ指数(VIX)予測におけるKAN(Kolmogorov-Arnold Networks)の利用について述べる。
ブラックボックスの性質でしばしば批判される従来のニューラルネットワークとは異なり、kanは学習可能なスプラインベースのアクティベーション関数とシンボル化を通じて解釈可能なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:24:02 GMT)
Universal Approximation Theorem and error bounds for quantum neural networks and quantum reservoirs [2.1] ここでは、関数の特定のクラスに対して正確な誤差境界を提供し、これらの結果をランダム化された量子回路の興味深い新しいセットアップに拡張する。
特に, $mathcalO(varepsilon-2)$ weights および $mathcalO(lceil log_2(varepsilon-1) rceil)$ qubits suffices を用いて, 積分フーリエ変換で関数を近似すると, 精度が $varepsilon>0$ となることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:16:52 GMT)
Real-Time Anomaly Detection with Synthetic Anomaly Monitoring (SAM) [2.1] 異常検出は、財務、サイバーセキュリティ、ネットワーク監視など、さまざまな領域にわたる稀で重要な事象を特定するために不可欠である。
本稿では、因果推論から合成制御手法を適用し、異常検出プロセスの精度と解釈性を向上させる革新的なアプローチであるSynthetic Anomaly Monitoring(SAM)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:12:21 GMT)
Numerical solution of a PDE arising from prediction with expert advice [2.0] 本研究は,エキスパート・アドバイスを用いたオンライン機械学習における予測問題について,対向的な環境で検討する。
このゲームの多くのステップに対する連続極限は、この解が両方のプレイヤーにとって最適な戦略を符号化する退化楕円型方程式である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:20:33 GMT)
Online Curvature-Aware Replay: Leveraging $\mathbf{2^{nd}}$ Order Information for Online Continual Learning [2.0] 我々は、リプレイデータに対する明示的なKL分割制約により、リプレイベースのオンライン共同最適化を定式化する。
非IDデータに対する連続的な2次最適化にFIMの推定を適用する方法について述べる。
OCARは3つの異なるベンチマークでトレーニングプロセスを通して高い平均精度を達成するために、連続的なメトリクスで最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:31:36 GMT)
Detection, Retrieval, and Explanation Unified: A Violence Detection System Based on Knowledge Graphs and GAT [2.0] 本稿では,TIO(Three-in-One)システムと呼ばれる新しい暴力検出システムを提案する。
システムは、暴力行為の可能性のある動画に対して、大きな言語モデルによって生成されたテキスト記述とともに、各ビデオフレームを処理する。
知識グラフを構築するための高次元埋め込みを生成するためにImageBindを使用し、推論にGATを使用し、ビデオ埋め込み機能を抽出するために軽量な時系列モジュールを適用している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:23:40 GMT)
Flow Matching: Markov Kernels, Stochastic Processes and Transport Plans [2.0] フローマッチング技術は、逆問題の解決に利用できる。
逆問題の解法として,フローマッチングが有効であることを示す。
本稿では,連続正規化フローとスコアマッチング手法について簡潔に述べる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:03:48 GMT)
The TIP of the Iceberg: Revealing a Hidden Class of Task-In-Prompt Adversarial Attacks on LLMs [1.9] LLMに対する新たなジェイルブレイク攻撃のクラスを提示する。
提案手法では,シーケンス・ツー・シーケンス・タスクをモデルが間接的に禁止された入力を生成するプロンプトに組み込む。
我々は,6つの最先端言語モデルにおいて,安全対策を回避できることを実証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:19:04 GMT)
Originality in scientific titles and abstracts can predict citation count [1.9] 本稿では,創造科学の独創性に関連する計算尺度をDSI(Didergent Semantic Integration)に適用する。
対象と研究分野のDSIの統計的に有意な差異を観察し、時間とともにDSIのわずかな増加を観察した。
すべての研究分野において統計的に有意な正の相関が、調整されたR2$の0.13であることがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:55:52 GMT)
Assessing Data Augmentation-Induced Bias in Training and Testing of Machine Learning Models [1.9] データ拡張は、制限されたデータセットや不均衡なデータセットに対処するソフトウェア工学の標準的プラクティスとなっている。
モデル評価において,テストセットに拡張サンプルを組み込むことがもたらす影響について,バイアスに対するテスト方法と理解について述べる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:06:35 GMT)
Bias Beware: The Impact of Cognitive Biases on LLM-Driven Product Recommendations [1.9] 大規模言語モデル(LLM)は製品レコメンデーションシステムに革命をもたらした。
敵の操作に対する感受性は、現実世界の商用アプリケーションにおいて重要な課題となっている。
当社のアプローチは、製品記述をシームレスに修正して、人間の心理的原則を初めて取り入れたものです。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:39:28 GMT)
Jailbreaking with Universal Multi-Prompts [1.9] JUMPは大規模言語モデル(LLM)をジェイルブレイクするためのプロンプトベースの手法である。
また,DuMPと呼ばれる防衛手法にも適応し,汎用マルチプロンプトの最適化手法が既存の技術より優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:44:24 GMT)
Detection of Distributed Denial of Service Attacks based on Machine Learning Algorithms [1.8] 我々は、DDoS攻撃インスタンスを良質なインスタンスから分離するために、異なる機械学習(ML)技術を研究し、適用する。
本稿では,Webサーバから提供されるサービスが利用可能であることを確実にするために,さまざまな機械学習技術を用いて攻撃を効率的に検出する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:03:39 GMT)
Insights from Network Science can advance Deep Graph Learning [1.8] 深層グラフ学習における課題として,データ強化,評価プラクティスの改善,高次モデル,プーリング手法などについて論じる。
大規模なグラフへのスケーリング、継続的な勾配ベースの最適化の統合、標準化されたベンチマークの開発など、ネットワーク科学における課題を強調します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:11:35 GMT)
A Unified Comparative Study with Generalized Conformity Scores for Multi-Output Conformal Regression [1.7] 本稿では,異なるマルチアウトプットベースモデルを用いた9種類のコンフォメーション法の比較検討を行う。
また、多出力回帰のための適合度スコアの2つの新しいクラスも導入する。
1つのクラスは任意の生成モデルと互換性があり、もう1つのクラスは計算的に効率的であり、可逆生成モデルの性質を利用する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:58:06 GMT)
Annotation Tool and Dataset for Fact-Checking Podcasts [1.7] ポッドキャストはウェブ上で人気のあるメディアであり、多言語コンテンツが多種多様で、しばしば不確定なクレームを含んでいる。
我々のツールは、再生中にコンテキストのリアルタイムアノテーションを有効にすることで、これらの課題に対処するための新しいアプローチを提供する。
このユニークな機能は、ユーザがポッドキャストを聴いて、チェック価値のあるクレーム、クレームスパン、コンテキストエラーなどの重要な要素を同時にアノテートすることを可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:34:17 GMT)
Texture Image Synthesis Using Spatial GAN Based on Vision Transformers [1.6] 本研究では,視覚変換器(ViT)と空間生成支援ネットワーク(SGAN)を融合した新しいハイブリッドモデルViT-SGANを提案する。
平均分散(mu, sigma)やテクソンなどの特殊テクスチャ記述子をViTの自己保持機構に組み込むことで, 優れたテクスチャ合成を実現する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:39:30 GMT)
GUIDEd Agents: Enhancing Navigation Policies through Task-Specific Uncertainty Abstraction in Localization-Limited Environments [1.6] 本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合する計画手法を提案する。
本稿では,これらの不確実性要件をロボットの意思決定に組み込んだ政策条件付けフレームワークGUIDEを提案する。
本稿では,GUIDEを強化学習フレームワークに組み込むことで,作業完了と不確実性管理を明確な報奨エンジニアリングなしで効果的にバランスするナビゲーションポリシーを学習することができることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:57:52 GMT)
Boosting Asynchronous Decentralized Learning with Model Fragmentation [1.6] DivShareは通信ストラグラーの存在下で高速なモデル収束を実現する新しいDLアルゴリズムである。
我々はDivShareを、AD-PSGDとSwiftの2つの最先端DLベースラインに対して実験的に評価した。
CIFAR-10データセットのAD-PSGDと比較して、通信ストラグラーを持つDivShareは、時間と精度を最大3.9倍下げることがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:24:33 GMT)
Develop AI Agents for System Engineering in Factorio [1.6] 本稿では,自動サンドボックスゲームによるAIエージェントのシステムエンジニアリング能力の育成と評価を提唱する。
この方向に研究努力を向けることで、明日最も要求されるエンジニアリングプロジェクトの設計、保守、最適化に必要な特別な推論と長期計画を備えたAIエージェントを装備できる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:26:17 GMT)
Prioritizing App Reviews for Developer Responses on Google Play [1.6] 2013年以降、Google Playは開発者がユーザーレビューに応答できるようにしてきた。
13%から18%の開発者がこのプラクティスに従事しています。
応答優先度に基づいてレビューを優先順位付けする手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:56:08 GMT)
How Do the Architecture and Optimizer Affect Representation Learning? On the Training Dynamics of Representations in Deep Neural Networks [1.6] トレーニング中に深層ニューラルネットワーク(DNN)の表現がどのように進化するかを明らかにする。
学習過程全体に沿った学習表現の進化について検討する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:24:22 GMT)
Traffic expertise meets residual RL: Knowledge-informed model-based residual reinforcement learning for CAV trajectory control [1.5] 本稿では,知識インフォームドモデルに基づく残留強化学習フレームワークを提案する。
交通専門家の知識を仮想環境モデルに統合し、基本力学にIntelligent Driver Model(IDM)、残留力学にニューラルネットワークを使用する。
本稿では,従来の制御手法を残差RLと組み合わせて,スクラッチから学習することなく,効率的な学習と政策最適化を容易にする新しい戦略を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:48:01 GMT)
Learnable polynomial, trigonometric, and tropical activations [1.5] 本稿では,関数ベースと熱帯性に基づく学習可能な活性化関数を持つスケーラブルニューラルネットワークについて検討する。
本稿では,変圧器と畳み込みネットワークのユニタリ分散を保ち,深いアーキテクチャにおいても安定した勾配流を確保する手法を提案する。
実験により、Hermite、Fourier、Tropicalをベースとした学習可能なアクティベーションを持つネットワークは、GPT-2およびConvNeXtネットワークよりも、列車とテストの精度とパープレキシティにおいて著しく改善されていることが示された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:13:58 GMT)
Musical ethnocentrism in Large Language Models [1.5] 大規模言語モデル(LLM)における音楽バイアスの分析に向けての第一歩を踏み出す。
我々は、各国の音楽文化の様々な側面を数値的に評価するようLLMに求めている。
両実験とも,西洋音楽文化に対するLLMの強い嗜好が示唆された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:52:15 GMT)
A Wearable Device Dataset for Mental Health Assessment Using Laser Doppler Flowmetry and Fluorescence Spectroscopy Sensors [1.4] 本稿では,LDF(Laser Doppler Flowmetry)とFS(Fluorescence Spectroscopy)センサーを備えた非侵襲ウェアラブルデバイスにおいて,機械学習モデルを構築し,メンタルヘルスを予測する新しい手法を提案する。
DAS-21の質問紙から,抑うつ,不安,ストレスレベルなどのメンタルヘルスを予測するためのデータセットを提示した。
以上の結果から,女性,若年者,BMI(Body Mass Index)あるいは心拍数が高い者は,ストレスや不安などのメンタルヘルスを経験する可能性が示唆された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:51:10 GMT)
Nomic Embed: Training a Reproducible Long Context Text Embedder [1.4] nomic-embed-text-v1は、最初の完全再現可能なオープンソース、オープンソース、オープンデータ、8192コンテキスト長の英語テキスト埋め込みモデルである。
トレーニングコードとモデルの重み付けをApache 2.0ライセンスでリリースしています。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:26:56 GMT)
Rational Gaussian wavelets and corresponding model driven neural networks [1.4] ガウスウェーブレットを用いた連続ウェーブレット変換を適切な有理項で乗算する。
この有理修飾子の零点と極は自由パラメータとして作用し、その選択は母ウェーブレットの形状に大きな影響を及ぼす。
提案した有理ガウスウェーブレットは許容可能であることを示し、ウェーブレット係数の数値近似を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:53:11 GMT)
A Single Model Ensemble Framework for Neural Machine Translation using Pivot Translation [1.4] 低リソース言語ペアのためのピボットベースの単一モデルアンサンブルを提案する。
最初のステップでは、ピボット変換によって候補を生成する。
次に、集約ステップにおいて、生成した候補から高品質な候補をk個選択し、それらをマージして最終翻訳を生成する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:17:45 GMT)
ML-Dev-Bench: Comparative Analysis of AI Agents on ML development workflows [1.4] 本稿ではML-Dev-Benchについて述べる。ML-Dev-Benchは機械学習開発タスクにおけるエージェント機能のテストを目的としたベンチマークである。
さまざまな25のタスクセットでReAct、Openhands、AIDEの3つのエージェントを評価します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:04:49 GMT)
Harnessing Generative AI for Economic Insights [1.3] 私たちはジェネレーティブAIを使用して、12万件のコーポレートカンファレンスの書面から、彼らの経済見通しに対する管理上の期待を抽出しています。
AIエコノミースコア(AI Economic Score)は、GDPの成長、生産、雇用などの将来の経済指標を強く予測する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:40:03 GMT)
Generative AI Models: Opportunities and Risks for Industry and Authorities [1.3] 生成AIモデルは、伝統的に創造性と人間の理解を必要とする幅広いタスクを実行することができる。
トレーニング中は、既存のデータからパターンを学び、その後、新しいコンテンツを生成することができる。
生成AIに関連する多くのリスクは、開発中に対処する必要がある。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:03:02 GMT)
Automated Graph-Based Detection of Quantum Control Schemes: Application to Molecular Laser Cooling [1.3] 本稿では, 実現可能なレーザ冷却方式のためのグラフベースの自動探索手法を提案し, 実証する。
この研究の中心的な洞察は、量子状態とそれらの間の遷移をグラフとして再解釈することで、複雑な量子系の新しい量子制御スキームを特定する能力が劇的に向上するということである。
このアプローチはまた、複雑な原子や、実際には内部状態の離散スペクトルを持つ複雑な多体量子系にも適用される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:46:28 GMT)
Finding Rule-Interpretable Non-Negative Data Representation [1.2] ルールベース記述と部分ベース表現の利点を融合したNMF方式を提案する。
潜在因子、それらの相互作用と値範囲の重要な属性を明らかにすることに加えて、このアプローチは集中的な埋め込みを可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:24:55 GMT)
Analysis of Student-LLM Interaction in a Software Engineering Project [1.2] 我々は、ソフトウェア工学学習におけるAIのメリットを理解するために、13週間の学期で126人の学部生とAIアシスタントとのインタラクションを分析した。
以上の結果から,CoPilotよりもChatGPTが好ましいことが示唆された。
会話ベースのインタラクションは、自動生成コードと比較して生成されたコードの品質を改善するのに役立つ。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:44:00 GMT)
Rule-Based Error Detection and Correction to Operationalize Movement Trajectory Classification [1.2] 動作軌跡プラットフォームに組み込むためのモデルの誤り訂正と検出を行う,ニューロシンボリックなルールベースのフレームワークを提供する。
最大0.984の誤差を予測するためのF1スコア、分布外精度の大幅な向上(ゼロショット精度のSOTAよりも8.51%向上)、SOTAモデルよりも精度の向上を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:26:48 GMT)
Spectral Properties Versus Magic Generation in $T$-doped Random Clifford Circuits [1.2] 深部ランダムな$N$-qubit $T$gateドープクリフォード回路における複雑性の出現について検討する。
純粋なクリフォード回路の場合、パウリ弦空間におけるユニークな周期軌道構造は、特別なスペクトル相関と大きな退化を伴うレベル統計を暗示する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:21:20 GMT)
Deep generative computed perfusion-deficit mapping of ischaemic stroke [1.1] 虚血性脳梗塞における骨欠損は、臨界血管閉塞の下流への灌流障害によるものである。
破壊された灌流の根底にあるパターンは、病変の上流に情報をもたらし、早期の予測および局所的なシグナルをもたらす可能性がある。
急性虚血性脳梗塞患者1,393人の心電図解析
深部発生推論は、前インターベンショナルウィンドウ内の虚血性脳卒中における機能的解剖学的関係の高発現モデルに有効である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:14:31 GMT)
Impact of Fixing Spins in a Quantum Annealer with Energy Rescaling [1.1] 本研究では,固定スピン,有望なサイズ縮小法,およびエネルギー再スケーリングの影響について検討した。
量子アニール器を用いた数値シミュレーションと実験により、固定スピン法が量子アニール性能を向上させることを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:01:08 GMT)
Metareasoning in uncertain environments: a meta-BAMDP framework [1.1] 正しい$P$を見つけることは、推論プロセスの空間上の最適化問題として表すことができる。
本稿では,未知の報酬/遷移分布を持つ環境におけるメタ推論を扱うメタベイズ適応型MDPフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:11:31 GMT)
Hybrid Firefly Algorithm and Sperm Swarm Optimization Algorithm using Newton-Raphson Method (HFASSON) and its application in CR-VANET [1.1] HFASSONの性能は、CEC 2017スイートの23のベンチマーク関数を用いて評価され、30、50、100次元でテストされた。
フリードマンランクテストの結果はHFASSONの優れた性能を示している。
HFASSONは、CR-VANET(Cognitive Radio Vehicular Ad-Hoc Networks)に適用され、スペクトル利用における基礎的CR-VANETよりも優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:58:34 GMT)
Dynamic Learning Rate for Deep Reinforcement Learning: A Bandit Approach [1.0] 勾配に基づく手法を用いて訓練された深層強化学習(RL)モデルでは、勾配の選択とその学習速度は優れた性能を達成するために不可欠である。
本稿では,学習中のエージェントのパフォーマンスに基づいて学習率を選択するメタ学習手法である深層強化学習(LRRL)の動的学習率を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:42:39 GMT)
Multimodal ELBO with Diffusion Decoders [0.9] 拡散生成モデルを用いて,より優れたデコーダを組み込んだマルチモーダルVAE ELBOを提案する。
拡散デコーダにより、モデルは複雑なモダリティを学習し、高品質な出力を生成することができる。
提案モデルでは,異なるデータセットにおける他のマルチモーダルVAEと比較して,コヒーレンスが高く,生成したモダリティの品質も優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:27:50 GMT)
Emergent Stack Representations in Modeling Counter Languages Using Transformers [0.9] 4つの対向言語でトランスモデルを訓練し、スタックを使ってこれらの言語を等価に定式化する。
入力トークン毎のスタック深度に関する内部表現を探索し、次のトークン予測器として訓練された場合、スタックのような表現が学習されることを示す。
これにより、トランスフォーマーが言語を学習し、回路発見に役立つアルゴリズムの詳細を理解することができます。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:11:49 GMT)
Supervised Similarity for High-Yield Corporate Bonds with Quantum Cognition Machine Learning [0.9] 企業債券市場における距離メトリック学習への量子認知機械学習(QCML)の適用について検討する。
QCMLは、高利回り(HY)市場では古典的ツリーベースモデルよりも優れており、投資適格(IG)市場では同等またはより良いパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:28:44 GMT)
Robust Counterfactual Explanations under Model Multiplicity Using Multi-Objective Optimization [0.9] 対実的説明(CE)は、類似した精度で複数の機械学習モデルが存在する場合、堅牢ではない。
本稿では,新しい視点を導入する頑健なCEと,その生成に多目的最適化を用いる手法を提案する。
この研究は、機械学習の説明可能性、意思決定、機械学習に基づくアクションプランニングなど、さまざまな分野の貴重な基盤となる可能性があると我々は信じている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:07:24 GMT)
Probabilistic adaptation of language comprehension for individual speakers: Evidence from neural oscillations [0.8] ステレオタイプ非一致発話の話者の可能性に基づいて,聴取者が理解に適応するかどうかを検討する。
本研究は,話者関係に対する全体的な期待を調節する話者一般機構と,個々の話者モデルを更新する話者特化メカニズムの2つのメカニズムを明らかにする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:19:20 GMT)
Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG [0.8] 大規模言語モデル(LLM)は、人間のようなテキスト生成や自然言語理解を可能にすることによって、人工知能(AI)に革命をもたらした。
Retrieval Augmented Generation (RAG) がソリューションとして登場し、リアルタイムデータ検索を統合して文脈に関連のある応答を提供することでLLMを強化している。
Agentic Retrieval-Augmented Generation (RAG)は、自律的なAIエージェントをRAGパイプラインに埋め込むことによって、これらの制限を超越する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:01:36 GMT)
Auditing a Dutch Public Sector Risk Profiling Algorithm Using an Unsupervised Bias Detection Tool [0.8] 本稿では,人口集団のデータが利用できない場合,教師なしクラスタリングツールを用いたバイアス検出について検討する。
我々はオランダ教育庁と協力し、大学生にリスクスコアを割り当てるアルゴリズムを監査した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:58:42 GMT)
Next Steps in LLM-Supported Java Verification [0.8] 大きな言語モデル(LLM)はコード生成に適したツールであるだけでなく、アノテーションベースのコード仕様を生成することもできる。
本稿では、この厳密なツールセットを用いて、信頼できないLCMから正しい仕様アノテーションを確実に取り出す方法について、初期の結果を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:55:50 GMT)
Compact Rule-Based Classifier Learning via Gradient Descent [0.8] 透明性と説明責任のある意思決定を必要とするシナリオにおいて、ルールベースのモデルは重要な役割を果たす。
そこで本研究では,規則の最大数と長さをユーザが制御できる,勾配降下法を用いて学習した新しいルールベース分類器を提案する。
数値的なパーティションの場合、ユーザはファジィセットで使用されるパーティションを制御できる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:13:39 GMT)
SE Arena: Benchmarking Software Engineering Chatbots with Iterative Interactions [0.8] ソフトウェアエンジニアリング活動の基盤モデル(FM)を評価するために設計されたインタラクティブなプラットフォームであるSE Arenaを紹介する。
SE Arenaは透明でオープンソースのリーダーボードを提供し、マルチラウンドの会話チャットボットをサポートし、エンドツーエンドのモデル比較を可能にする。
本稿では,SE Arenaの設計と機能について概説し,ソフトウェア工学におけるFMの評価と実用化を前進させる可能性を強調した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:19:28 GMT)
Operator-basis Matrix Product State formalism for optical circuits [0.7] 演算子基底行列積状態(MPS)という別のテンソルネットワークフレームワークを提案する。
MPSは、ユニタリ干渉計行列に符号化された量子光学回路の入出力関係を利用する。
我々はテンソルネットワークの柔軟性を利用して、偏微分可能性と光子損失を組み込むフォーマリズムを拡張した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:00:02 GMT)
Explainability-Driven Quality Assessment for Rule-Based Systems [0.7] 本稿では,知識に基づく推論システムにおけるルールの質を高めるための説明フレームワークを提案する。
規則推論の説明を生成し、人間の解釈を利用して規則を洗練させる。
その実用性は金融のユースケースを通じて実証される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:26:09 GMT)
Converting MLPs into Polynomials in Closed Form [0.7] 我々は、フィードフォワードネットワークの理論的に閉じた最小二乗近似を導出する。
本研究では,2次近似法を用いて,SVDに基づく逆数例を作成できることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:54:41 GMT)
FedGES: A Federated Learning Approach for BN Structure Learning [0.7] 本研究は,分散環境におけるBN構造学習に適した新しいフェデレーション学習手法であるフェデレーションGES(FedGES)を紹介する。
FedGESは、パラメータやデータではなく、進化するネットワーク構造のみを交換することによって、プライバシとセキュリティの問題に固有の対処を行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:16:02 GMT)
Analytical solutions for optimal photon absorption into inhomogeneous spin memories [0.7] 本研究では, 単一モード共振器に結合したスピンアンサンブルの量子電気力学モデルを用いて, 最適光子吸収について検討した。
我々は共振器の周波数と結合率を変調する可能性を利用する。
特に、外部損失が空洞の内部損失を支配している場合、異なるパラメータに対して最適な協調性を見出す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:24:13 GMT)
Scalable, nanoscale positioning of highly coherent color centers in prefabricated diamond nanostructures [0.7] 高収率のプレハブナノ構造において, ナノスケールの3次元局在を伴う高コヒーレントダイヤモンド窒素空洞(NV)を創出する。
我々の高収率欠陥生成手法は、固体欠陥センサとプロセッサのスケーラブルな生産を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:45:13 GMT)
Enhancing Quantum Metrology by Quantum Resonance Dynamics [0.7] 量子論における量子効果は、いわゆる標準量子限界からハイゼンベルク限界までの測定精度を高めることができる。
本稿では,多くの既知の障害を回避し,なおも時間の有効利用が可能なプロトコルを提案する。
提案プロトコルは、利用可能な実験プラットフォーム上でテストすることができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:53:19 GMT)
Using Stochastic Gradient Descent to Smooth Nonconvex Functions: Analysis of Implicit Graduated Optimization [0.7] バッチ降下(SGD)におけるノイズは,目的関数の平滑化の効果を示す。
SGDsノイズによるスムース化の程度と、よく研究されたシャープネスの指標との間には、興味深い関係があることが示されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:56:18 GMT)
Momentum Does Not Reduce Stochastic Noise in Stochastic Gradient Descent [0.7] ニューラルディープネットワークでは、運動量を持つ勾配降下(SGD)は、運動量を持たないSGDよりも速く収束し、より一般化できると言われている。
特に、運動量を加えることでこのバッチノイズが減少すると考えられている。
探索方向と最急降下方向の誤差として定義される雑音である探索方向雑音の効果を解析した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:18:56 GMT)
Controlling nonlocality of bipartite qubit states via quantum channels [0.7] 我々は、X状態として知られる2量子状態のクラスから導かれる量子チャネルを解析する。
特に、ベルのCHSH条件を破る X 状態を考え、それに付随するChoi-Jamiolkowski 写像を特徴づける。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:33:08 GMT)
Compact Yet Highly Accurate Printed Classifiers Using Sequential Support Vector Machine Circuits [0.7] 本稿では,最初のシーケンシャルサポートベクトルマシン(SVM)分類器を紹介する。
我々のSVMは平均6倍低い面積と4.6%の精度で出力される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:30:27 GMT)
Federated Learning with Discriminative Naive Bayes Classifier [0.7] フェデレーション学習は、分散データソース上で機械学習モデルをトレーニングするための有望なアプローチとして登場した。
本稿では,個別変数を仮定して,NB分類のための新たなフェデレーション手法を提案する。
提案手法はNBの識別的変種をフェデレートし,条件付き確率表の代わりに無意味なパラメータを共有する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:12:02 GMT)
Enhancing Bayesian Network Structural Learning with Monte Carlo Tree Search [0.7] 本稿では,ベイジアンネットワーク(BN)の構造学習のためのモンテカルロ木探索(MCTS)アルゴリズムの適応について述べる。
当初はゲームツリー探索用に設計されていたが、BN構造学習の課題に対処するためにMCTSが再利用された。
我々は、Greedy Equivalent Search (GES)、PC、HCなど、他の検索アルゴリズムから得られる可変順序を組み込むことにより、この問題に対処する半ランダム化アプローチを採用する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:08:21 GMT)
Assessing the use of Diffusion models for motion artifact correction in brain MRI [0.7] 我々は2次元脳MRIにおける運動アーチファクトの修正に拡散モデルを用いることを批判的に評価した。
本研究では,拡散モデルに基づく手法と最先端の手法との比較を行った。
拡散モデルは正確な予測や有害な幻覚を生成できる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:56:48 GMT)
Jacobian Descent for Multi-Objective Optimization [0.6] 勾配降下は単目的最適化に限られる。
Jacobian descent (JD) はベクトル値の目的関数のヤコビ行列を用いてパラメータを反復的に更新する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:29:44 GMT)
Sea-cret Agents: Maritime Abduction for Region Generation to Expose Dark Vessel Trajectories [0.6] 船舶の自動識別システム(AIS)を無効にした後、海上産業の悪役が違法行為を行う
機械学習のアプローチは、近い将来、これらの暗黒船の位置を特定することにしか成功しない。
我々は、誘拐、論理プログラミング、ルール学習の概念を組み合わせて、暗い容器の完全なリコールにアプローチする効率的な方法を作成します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:36:26 GMT)
FutureVision: A methodology for the investigation of future cognition [0.6] 本研究では,未来シナリオの評価において,視覚的固定パターンがどう変化するかを検討する。
予備的な結果は、遠未来と悲観的なシナリオがより長い固定とより不規則なサケードと関連していることを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:29:06 GMT)
PtyGenography: using generative models for regularization of the phase retrieval problem [0.6] 古典的および生成的逆問題定式化の再構成特性を比較する。
本稿では,様々なノイズレベルに対する生成モデルへの過度適合を緩和する新しい統一的再構成手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:26:55 GMT)
Building a Cognitive Twin Using a Distributed Cognitive System and an Evolution Strategy [0.6] 身体的, 仮想的に多数のデバイスを編成し, 対話行動の近似を良好に行うことが可能であることを示す。
生成されたCognitive Twinは、後にタスクの自動化、より現実的な人間のような人工エージェントの生成、さらにその振る舞いを調べるために使われる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:19:13 GMT)
Improving the Effectiveness of Potential-Based Reward Shaping in Reinforcement Learning [0.6] 報酬形成の有効性を向上させるために,ポテンシャル関数の線形シフトがいかに簡単なかを示す。
正および負の報酬形成値を正しく割り当てるための連続ポテンシャル関数の理論的制限を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:32:50 GMT)
DocNet: Semantic Structure in Inductive Bias Detection Models [0.5] 本稿では,新しい,インダクティブで低リソースなドキュメント埋め込みと政治的バイアス検出モデルであるDocNetを紹介する。
文書レベルのグラフ埋め込みに代表される、対立する政治的側からのニュース記事の意味的構造は、大きな類似性を持っていることを実証する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:19:23 GMT)
Applications and Implications of Large Language Models in Qualitative Analysis: A New Frontier for Empirical Software Engineering [0.5] この研究は、ソフトウェア工学における質的研究におけるLCMの使用を最適化するための構造化戦略とガイドラインの必要性を強調している。
LLMは質的な分析をサポートすることを約束していますが、データの解釈には人間の専門知識が不可欠です。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:59:00 GMT)
Label Correction for Road Segmentation Using Road-side Cameras [0.4] 既存の道路カメラインフラを利用して、様々な気象条件の道路データを自動的に収集する。
道路カメラの半自動アノテーション手法を提案する。
冬期にフィンランド全土の927台のカメラから収集した路面カメラデータを用いて,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:52:23 GMT)
Performance of quantum annealing for 2-SAT problems with multiple satisfying assignments [0.4] 量子アニールの数値シミュレーションとD-Waveが提供する物理量子アニールのスケーリングとサンプリング性能について検討した。
サンプリングの挙動は理論によって説明でき、解法までの時間のスケーリングの挙動は最小エネルギーギャップのスケーリングの挙動に依存する。
D-Wave量子アニールの対応する結果は、この理想像には適合しないが、量子アニールからの解のスケーリングは平衡確率分布から計算した値と一致することを示唆している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:02:53 GMT)
Unsupervised anomaly detection in large-scale estuarine acoustic telemetry data [0.3] 本稿では,データ前処理,再サンプリング戦略,ラベル付けプロセス,特徴工学,データ分割手法,および異常検出のための機械学習モデルの選択と解釈に関するガイドラインを提案する。
評価モデルでは,ニューラルネットワークオートエンコーダ(NN-AE)の性能が向上し,しきい値決定アルゴリズムが有効であった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:23:29 GMT)
On the stability of gradient descent with second order dynamics for time-varying cost functions [0.3] この研究は、Gaudio et al. 2021 と Moreu & Annaswamy 2022 の2次ダイナミクスによる勾配降下を明示的に時間変化のコスト関数に適用した結果に基づいている。
これらのより一般的な結果は、リアルタイム学習アプリケーションに対する安全で信頼性の高いデプロイメントを保証するために、これらの最適化スキームの設計と認定に役立つ。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:42:56 GMT)
OpenAI ChatGPT interprets Radiological Images: GPT-4 as a Medical Doctor for a Fast Check-Up [0.3] GPT-4は、2022年11月に発表されたChatGPTの成功を受けて、2023年3月14日にリリースされた。
本研究では,人工知能(AI)を用いた医療における放射線画像の解釈について検討した。
以上の結果から,ChatGPTは胸部X線像を解析するには不十分であり,医師や臨床医を支援できる解釈が得られた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:25:52 GMT)
Efficient Annotator Reliability Assessment and Sample Weighting for Knowledge-Based Misinformation Detection on Social Media [0.3] 本研究は,誤情報検出に対する知識に基づくアプローチを取り入れ,自然言語推論の手法と類似した問題をモデル化する。
EffiARAアノテーションフレームワークは、アノテーション間の合意とアノテーション間の合意を利用して、各アノテーションの信頼性を理解することを目的としている。
本研究は,アノテータ信頼度を用いたサンプル重み付けが,アノテータ間およびアノテータ内合意とソフトラベルトレーニングの両方を活用することにより,最良であることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:10:18 GMT)
Quantum key distribution with imperfectly isolated devices [0.3] 我々は,デコイ状態BB84プロトコルのすべての状態準備設定から情報漏洩が存在する場合のセキュリティ証明を導入する。
この証明は、ソースの分離に関連する1つのパラメータのみを決定する必要があるため、最小限の実験的な特性を必要とする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:44:11 GMT)
Deeply Optimizing the SAT Solver for the IC3 Algorithm [0.2] 観測結果に基づいて,IC3におけるSATソルバの最適化について述べる。
バイナリヒープをバケットに置き換えて、一定時間操作を実現しています。
我々はこれらの最適化を統合した新しい軽量CDCL SATソルバであるGipSATを開発した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:49:14 GMT)
Generalized Gaussian Temporal Difference Error for Uncertainty-aware Reinforcement Learning [0.2] 深部強化学習における一般化されたガウス誤差モデリングのための新しい枠組みを提案する。
我々はデータ依存型アレタリック不確実性の推定と緩和を改善する。
ポリシー勾配アルゴリズムによる実験は、大幅な性能向上を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:14:18 GMT)
Optimizing Online Advertising with Multi-Armed Bandits: Mitigating the Cold Start Problem under Auction Dynamics [0.2] 不十分な行動データ(クリック)は、新しい広告の正確なクリックスルー率予測を難しくする。
位置ベースモデルのためのマルチアーム・バンディット(MAB)設定下でUCBライクなアルゴリズムを開発する。
また,プラットフォームにおける長期的収益性の向上に加えて,短期的利益維持のメカニズムも提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:33:24 GMT)
SelfCheckAgent: Zero-Resource Hallucination Detection in Generative Large Language Models [0.2] SelfCheckAgentは、3つの異なるエージェントを統合する新しいフレームワークである。
これらのエージェントは幻覚検出に対する堅牢な多次元アプローチを提供する。
このフレームワークには三角形戦略も組み込まれており、SelfCheckAgentの強みを高めている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:42:32 GMT)
Meursault as a Data Point [0.1] 本研究では,NLP技術を用いて,Mursaultの生涯における重要な出来事と行動の定量化を行う。
この研究は、現代のAIツールがどのようにMeursaultの行動と感情を誤って解釈するかを調べることで、人間の物語をデータポイントに還元する幅広い倫理的ジレンマを浮き彫りにする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:56:48 GMT)
FragmentNet: Adaptive Graph Fragmentation for Graph-to-Sequence Molecular Representation Learning [0.1] 分子グラフを化学的に有効なフラグメントに分解する適応型学習トークン化器を備えたグラフからシーケンスへの基礎モデルであるFragmentNetを紹介する。
FragmentNetは、階層的な断片埋め込みのためのVQVAE-GCN、グラフシリアライゼーションのための空間的位置符号化、グローバルな分子記述子、トランスフォーマーを統合する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:21:49 GMT)
eagle: early approximated gradient based learning rate estimator [0.1] 本稿では,トレーニングの初期段階における損失収束を高速化する新しい最適化手法を提案する。
更新アルゴリズムは、パラメータの変化を計算し、連続的なトレーニングステップ間で最適なパラメータを推定する。
本稿では,AdamとEagleの更新ルールを選択する適応スイッチング機構を導入し,トレーニング安定性を向上させる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:15:34 GMT)
Tutorial on Using Machine Learning and Deep Learning Models for Mental Illness Detection [0.0] 本チュートリアルは、ソーシャルメディア上でのメンタルヘルス検出に機械学習およびディープラーニング手法を適用する際の共通の課題に対処するためのガイダンスを提供する。
実世界の例とステップバイステップの指示は、これらのテクニックを効果的に適用する方法を実証する。
これらのアプローチを共有することで、このチュートリアルは、研究者がより信頼性が高く、広く適用可能なメンタルヘルス研究モデルを構築するのを助けることを目的としている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:43:12 GMT)
Wasserstein multivariate auto-regressive models for modeling distributional time series [0.0] 本稿では,複数の確率測度の集合からなるデータの統計的解析に着目する。
時間依存確率測度をワッサーシュタイン空間のランダムな対象としてモデル化することにより、新しい自己回帰モデルを提案する。
このようなモデルの解の存在、特異性、定常性に関する結果が提供される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:13:05 GMT)
Universal fluctuations of localized two interacting particles in one dimension [0.0] 一次元不規則系における2つの相互作用粒子のフォック空間における局所波動関数の普遍的ゆらぎについて検討する。
ランダムポテンシャルだけではフォック空間の部位に相関エネルギーが生じることが示され, ゆらぎ成長指数 1/2 が生じる。
ランダムな長距離相互作用を導入すると、これらの相関が変化し、指数 1/3 を持つ (1+1)D において系のゆらぎをカルダル・パリ・張普遍性クラスへと導く。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:30:19 GMT)
Understanding Model Calibration -- A gentle introduction and visual exploration of calibration and the expected calibration error (ECE) [0.0] このブログ記事では、キャリブレーションの最もよく使われる定義を見ていきます。
次に、この尺度の欠点と、これらがどのようにキャリブレーションのさらなる概念の必要性を表面化したかを取り上げる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:57:53 GMT)
Transformers trained on proteins can learn to attend to Euclidean distance [0.0] 座標の線形埋め込みをパスした場合,トランスフォーマーは構造モデルとして独立に機能することを示す。
また,事前学習したタンパク質トランスフォーマーエンコーダの構造により,下流タスクの性能が向上することを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:12:44 GMT)
Topological Casimir effect for fermionic condensate in AdS spacetime with compact dimensions [0.0] 局所反ド・ジッター時空における巨大なディラック場に対するフェルミオン凝縮体(FC)に対する重力場と空間トポロジーの複合効果について検討した。
AdS曲率半径よりも小さいコンパクト次元の適切な長さの場合、重力場の影響は弱い。
大きな固有長の場合、トポロジカルFCの崩壊は質量場と質量場の両方の力則に従う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:06:43 GMT)
To share and not share a singlet: control qubit and nonclassicality in teleportation [0.0] 我々は、量子テレポーテーションの過程における重ね合わせの役割を理解しようと試みる。
我々は、量子テレポーテーションのシナリオの中で、送信側と受信側が重畳された状態にある設定を考える。
制御量子ビットプロトコルの忠実度と両者が古典的混合状態にある場合の忠実度を比較した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:40:04 GMT)
Time-resolved diamond magnetic microscopy of superparamagnetic iron-oxide nanoparticles [0.0] 超常磁性酸化鉄ナノ粒子(SPION)は生体医用イメージングのための有望なプローブである。
ここでは、何百もの孤立した30nmのSPIONが生成する強磁場をワイドフィールドで撮像する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:49:37 GMT)
Time-dependent quantum geometric tensor and some applications [0.0] 量子状態に対する時間-パラメータ空間の幾何学を記述するために、時間依存的な量子幾何テンソルの拡張を定義する。
このテンソルは新しい時相成分を導入し、非時間分離または明示的に時間依存の量子状態を持つ系の分析を可能にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:08:02 GMT)
Time dilation of quantum clocks in a relativistic gravitational potential [0.0] 一般相対性理論におけるシュワルツシルト解から得られる重力時間拡張と一致する時間拡張効果を求める。
我々の枠組みから現れる重力赤方偏移も提案され議論されている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:40:22 GMT)
The dynamics of the Reddit collective action leading to the GameStop short squeeze [0.0] Redditの議論の高まりは、取引量の増加を予想している。
この効果はイベントの数週間前に突然現れたが、コミュニティがTwitterを通じて広く知られるようになると消えていった。
この結果から,GameStopショートストリップのダイナミックスにおけるRedditユーザの役割について,新たな知見が得られた。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:30:35 GMT)
The Physics-Informed Neural Network Gravity Model: Generation III [0.0] 第3世代物理インフォームドニューラルネットワーク重力モデル(PINN-GM-III)
本稿では,第3世代物理インフォームドニューラルネットワーク重力モデル(PINN-GM-III)を紹介する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:39:01 GMT)
The Dirac Vacuum in Discrete Spacetime [0.0] 離散時空におけるフェルミオンの量子セルオートマトンモデルにおけるディラック海の導入を検討する。
新しい境界は正と負のエネルギー状態の間に形成され、ペアの生成はエネルギー的に有利であるように見える。
これは離散時間モデルにおけるエネルギーのモジュラーの性質のためである。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:36:43 GMT)
The Aharonov-Bohm effect for a constant scalar matter potential in neutrino flavour interferometry [0.0] 我々は、その対称性特性に特徴的な可観測性を用いて、ポテンシャルによる位相シフトをアンタングルする方法を示す。
これらの発見は、量子物理学と粒子物理学の完全な共生において、ポテンシャルの物理的重要性を単一の実験で観察する経路を定義する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:21:16 GMT)
Template Matching in Images using Segmented Normalized Cross-Correlation [0.0] 提案アルゴリズムはテンプレート画像近似の事前計算に基づく。
提案アルゴリズムは、無視可能なNCC近似誤差で優れた計算性能を実現する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:58:33 GMT)
TIMeSynC: Temporal Intent Modelling with Synchronized Context Encodings for Financial Service Applications [0.0] NMT変換器は、コンテキストを符号化し、長距離依存を表現するための次の最良のアクションを復号することで、最先端のシーケンシャルな表現学習を実現する。
本稿では,金融サービスアプリケーションにおけるコンテキストおよびシーケンシャルな意図予測の課題に対処するエンコーダ・デコーダ・トランスフォーマモデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:34:56 GMT)
Spectral Entanglement Fingerprinting: A Novel Framework for Ransomware Detection Using Cross-Frequency Anomalous Waveform Signatures [0.0] 悪意のある暗号化技術は進化を続け、従来の検出メカニズムをバイパスしている。
スペクトル分析は、システムのアクティビティデータを周波数領域に変換する別のアプローチを示す。
提案したスペクトルエンタングルメントフィンガープリント(SEF)フレームワークは、パワースペクトル密度、コヒーレンス関数、エントロピーに基づくメトリクスを利用して隠れパターンを抽出する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:46:41 GMT)
Single-neuron deep generative model uncovers underlying physics of neuronal activity in Ca imaging data [0.0] 自己回帰変分オートエンコーダ(AVAE)を用いた単一ニューロン表現学習のための新しいフレームワークを提案する。
我々のアプローチでは、スパイク推論アルゴリズムを必要とせずに、個々のニューロンの信号を縮小次元空間に埋め込む。
AVAEは、より情報的で差別的な潜在表現を生成することによって、従来の線形手法よりも優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:46:34 GMT)
Simple Linear Neuron Boosting [0.0] 本稿では,Boosted Backpropagation を用いた関数空間におけるネットワークニューロンの最適化について検討する。
適応的なステップサイズを持つオンライン行列自由学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:53:41 GMT)
Showing Ambiguity in the Pilot-Wave Theory Equations of Motion via the Derivation of Unique Scalar Fields Using a 2D Quantum Harmonic Oscillator [0.0] De Broglie-Bohm Pilot-Wave Theory では、粒子の運動とスカラー場のユニークな方程式を定式化することができる。
ド・ブロイ=ボームのパイロット波動理論における粒子の運動方程式は任意の数のスカラー場に理論的に依存することができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:47:25 GMT)
Self-induced Josephson oscillations and self-trapping in a supersolid dipolar quantum gas [0.0] 理論上、超固体はボソニックジョセフソン接合のすべての標準特性を特徴付けていることを示す。
我々の研究は超固体の力学に新たな光を当て、ジョセフソン接合の新しいクラスの研究への道を開く。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:44:05 GMT)
Self-Organizing Interaction Spaces: A Framework for Engineering Pervasive Applications in Mobile and Distributed Environments [0.0] 本稿では,工学的普及のための新しいフレームワークであるSOISを紹介する。
SOISは移動ノードの動的で異質な性質を活用し、適応的な組織構造を形成する。
結果は、効率を高め、従来のクラウドモデルへの依存を減らす可能性を強調している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:11:30 GMT)
Search-Based Adversarial Estimates for Improving Sample Efficiency in Off-Policy Reinforcement Learning [0.0] 本稿では,この問題を緩和するための新しい,シンプルかつ効率的なアプローチとして,Adversarial Estimatesを提案する。
我々のアプローチは、学習を促進するために、小さな人間の軌道の集合からの潜在類似性探索を活用する。
本研究の結果から,適応推定を用いた学習アルゴリズムは,元のバージョンよりも高速に収束することがわかった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:41:02 GMT)
SatFlow: Generative model based framework for producing High Resolution Gap Free Remote Sensing Imagery [0.0] SatFlowは低分解能MODIS画像とランドサット観測を融合して高分解能・高分解能表面反射率画像を生成する生成モデルベースフレームワークである。
条件付きフローマッチングを用いて学習した本モデルでは, 構造的・スペクトル的整合性のある画像の生成性能が向上した。
この機能は、作物のフェノロジー追跡や環境変化検出など、下流のアプリケーションに不可欠である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:40:13 GMT)
Retrieval of Temporal Event Sequences from Textual Descriptions [0.0] TESRBenchはテキスト記述から時間的イベントシーケンスを検索するためのベンチマークである。
イベントシーケンスの埋め込みと検索のための新しいモデルであるTPP-Embeddingを提案する。
TPP-EmbeddingはTESRBenchデータセットのベースラインモデルよりも優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:50:39 GMT)
Reliability-Driven LiDAR-Camera Fusion for Robust 3D Object Detection [0.0] 本稿では,鳥眼ビュー(BEV)空間で動作するLiDARカメラ融合フレームワークReliFusionを提案する。
ReliFusionは、Spatio-Temporal Feature Aggregation (STFA)モジュール、Reliabilityモジュール、Confidence-Weighted Mutual Cross-Attention (CW-MCA)モジュールという3つの重要なコンポーネントを統合している。
nuScenesデータセットの実験では、ReliFusionは最先端の手法よりも優れており、LiDARの視野に制限のあるシナリオにおいて、より優れた堅牢性と精度を実現している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:07:14 GMT)
Regularized interpolation in 4D neural fields enables optimization of 3D printed geometries [0.0] 3Dプリンティングには、例外的なデザインの自由と複雑さが特徴だ。
また、その潜在能力を最大限に発揮するためには、幾何学的な欠陥やその他の欠陥も解決しなければならない。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:50:57 GMT)
Real-Time Scattering Processes with Continuous-Variable Quantum Computers [0.0] 本稿では,量子場理論のリアルタイムダイナミクスをシミュレーションするためのフレームワークを提案する。
連続変数量子コンピューティングプラットフォームのための非ガウス演算を実装した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:11:38 GMT)
Readout Error Mitigation for Mid-Circuit Measurements and Feedforward [0.0] 現在の量子コンピューティングプラットフォームは読み取りエラーに悩まされており、デバイスが測定結果の不良を報告している。
本稿では,フィードフォワードの存在下での中間回路計測誤差を軽減するための一般的なプロトコルを提案する。
本手法は超伝導量子プロセッサの誤差を最大で60%削減できることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:52:50 GMT)
Ransomware IR Model: Proactive Threat Intelligence-Based Incident Response Strategy [0.0] ランサムウェア攻撃下で異なるビジネスの優先順位と目的を詳細に満たす、明確で実証されたインシデント対応戦略はありません。
本稿では,企業Xにおける代表的なランサムウェアインシデント対応事例の1つを引用する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:25:26 GMT)
Quasiperiodic Floquet-Gibbs states in Rydberg atomic systems [0.0] Floquet-Gibbs状態は周期的に変調されたRydberg原子系において自然に現れることを示す。
この系の2階フロケ・ギブズ状態は、本質的に対応するレッドフィールド方程式の定常状態と区別できない。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:43:37 GMT)
Quantum-like product states constructed from classical networks [0.0] 量子的なゲートが古典的なネットワーク上でどのように作用し、状態空間における量子的な操作を可能にするかを示す。
量子的なゲートが古典的なネットワーク上でどのように作用し、状態空間における量子的な操作を可能にするかを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:38:58 GMT)
Quantum Interference in Atomic Systems [0.0] 量子干渉は、量子粒子の領域において中心的な段階を取る。
これは重ね合わせの概念に依存しており、異なるプロセスの確率振幅が互いに干渉する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:28:49 GMT)
Quantum Friction near the Instability Threshold [0.0] 不安定なしきい値付近で、量子摩擦力は対数的に分散することを示す。
我々の発見は、量子的および古典的な状態における摩擦力学における不安定性、臨界ばらつき、温度の役割に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:24:29 GMT)
Propagation of initial uncertainties to Arthurs-Kelly inequality [0.0] アーサース・ケリー不等式の一般化版は、初期プローブ状態が絡み合っている場合、破ることができることを示す。
特例を導入することで、違反を明示的に示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:00:51 GMT)
Postselection-free experimental observation of the measurement-induced phase transition in circuits with universal gates [0.0] 多体系は、システムが進化するにつれて測定される強度を調整することによって、エンタングリングとアンタングリングの動的相の間の相転移を示すことができる。
この現象は測定誘起相転移(MIPT)と呼ばれる。
単純な古典的復号法のみを用いて, ポストセレクションなしでMIPTを検出可能であることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:00:01 GMT)
Persistent fermionic entanglement under decoherence [0.0] 4つのアクセシブルな状態を持つ2つの不明瞭なフェルミオンは、一定温度でボソニック浴とカップリングするため、消散することなく脱コヒーレンスに悩まされる。
浴槽との相互作用によるノイズの影響にもかかわらず, 進化を通じて絡み合いが完全にあるいは部分的に持続する2つのフェミオン状態の家族を同定した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:02:03 GMT)
Optimal and robust error filtration for quantum information processing [0.0] 誤差フィルタリング(Error filtration)は、補助量子ビットとエンタングゲートを利用してノイズを緩和するハードウェアスキームである。
異なるアプリケーションに対応するメリットの数字に対して、我々のアプローチをベンチマークします。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:28:31 GMT)
Open transmission channels in multimode fiber cavities with random mode mixing [0.0] 乱れた媒体における光の輸送は、オープントランスミッションチャネルによって制御される。
開水路は、普遍空間構造や拡張ドウェル時間のようなユニークな性質を示す。
オープンチャネルを探索するためのプラットフォームとして,マルチモードファイバキャビティ(MMFC)を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:28:23 GMT)
On Exact Learning of $d$-Monotone Functions [0.0] 我々は、$d$-monotone 関数 $f:cal Xto0,1$ のブールクラスの学習可能性について、メンバシップと等価クエリから検討する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:37:20 GMT)
On Bob Dylan: A Computational Perspective [0.0] 私は1962年から2012年まで、Dylanの歌詞の大規模な計算分析を通じて、Cass Sunsteinの観測を拡張した。
歌詞から概念間関係を抽出し,ダイランの主題構造を捉えた有向知識グラフを構築した。
そして、時間とともに感情、比喩表現、テーマの多様性、ネットワークの複雑さの変化を定量化します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:25:08 GMT)
Nonlinearity of transparent SNS weak links decreases sharply with length [0.0] 弱リンクの有限長は、その零長極限と比較して非線形性を強く抑制することを示す。
我々は、非相互作用ジョセフソン接合に対して、非調和性はゼロと最大負の値の間に有界であると予想する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:09:47 GMT)
Non-reciprocal Scattering in a Microwave Frequency Comb [0.0] マイクロ波周波数コムのモード内における非相互散乱について検討する。
散乱過程に対する構成的干渉を制御しつつ、逆過程に対する破壊的干渉を同時に達成する。
非相互散乱はパラメトリック制御のためのツールセットを拡張し、新しい量子相関を設計する可能性がある。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:47:27 GMT)
Non-Stabilizerness of Sachdev-Ye-Kitaev Model [0.0] Sachdev-Ye-Kitaev(rm SYK$)モデルの非安定化性や量子魔法について検討する。
結果と$rm SYK$モデルとの比較を行った。
我々は、$rm SYK$モデルのSREが急速に平衡することを示したが、定常状態では、カオスSYKモデルは単純なモデルよりも魔術的である。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:07:39 GMT)
Neural Cellular Automata for Decentralized Sensing using a Soft Inductive Sensor Array for Distributed Manipulator Systems [0.0] ニューラルセルラオートマタ(NCA)を用いた分散マニピュレータシステムにおける分散化アプローチを提案する。
実験により、NAAベースのセンシングネットワークは、物体の位置をセンサー間距離の0.24倍の精度で推定することを示した。
これらの知見は、DMSにおける拡張性、耐障害性、耐雑音性のあるオブジェクト特性推定を可能にする、局所的、分散化された計算の可能性を示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:04:41 GMT)
Near-deterministic photon entanglement from a spin qudit in silicon using third quantisation [0.0] 単一の光子は容易に複数のモードに広がり、複数のモード内で絡み合いを決定的に生成する。
シリコンチップにおけるアンチモン供与体を用いて第3量子化を実現するための短期実験を提案する。
このアプローチはシリコンベースのフォトニック量子コンピューティングの代替経路を開く。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:37:23 GMT)
Modelling change in neural dynamics during phonetic accommodation [0.0] 我々は,音素調節における音素表現の変化の計算モデルを進めた。
シャドーイング中に母音固有の収束度を示し,その後,ベースラインに戻す。
音声変化の短期的調節と長期的パターンとの関係について考察する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 10:00:29 GMT)
Methods to achieve near-millisecond energy relaxation and dephasing times for a superconducting transmon qubit [0.0] エネルギー緩和とエコー強調時間を持つ高コヒーレンストランモン量子ビットは、既存の文献のそれを上回っている。
我々は,高コヒーレンストランスモン量子ビットの再生と広く採用を容易にするため,設計,製造プロセス,測定装置について詳細に報告する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:48:28 GMT)
Matrix systems, algebras, and open maps [0.0] M_n$ のすべての *-部分代数に対する制限は開であることを示す。
これは行列理論と量子情報理論における位相問題を簡単にする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:05:12 GMT)
Magic State Cultivation on the Surface Code [0.0] マジックステート栽培は、マジックステート生成における技術の状態を表す新しいプロトコルである。
我々は,すべてのCSSコードに対する制御X操作の重み付けを利用して,移植を避ける新しい培養プロトコルを提案する。
両品種の栽培における消去量子ビットの影響を解析し, 栽培の論理的誤り率をさらに低減させる方法について検討した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:00:03 GMT)
Long-range interacting systems are locally non-interacting [0.0] 長距離相互作用システムは情報伝達のための非線形光円錐のような新しい物理学を示す。
我々は、量子状態の減少によって得られた熱力学的極限局所的性質が、創発的非相互作用理論によって記述されていることを証明した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:29:16 GMT)
Learning Fairer Representations with FairVIC [0.0] 自動意思決定システムにおけるバイアスの緩和は、公平さとデータセット固有のバイアスのニュアンスな定義のために重要な課題である。
学習中の損失関数に分散項、不変項、共分散項を統合することにより、ニューラルネットワークの公平性を高める革新的なアプローチであるFairVICを導入する。
ベンチマークデータセットにおけるFairVICを,グループと個人の両方の公正性を考慮して比較して評価し,精度と公正性のトレードオフに関するアブレーション研究を行う。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:49:14 GMT)
Layered Chain-of-Thought Prompting for Multi-Agent LLM Systems: A Comprehensive Approach to Explainable Large Language Models [0.0] 提案するLayered Chain-of-Thought (Layered-CoT) Promptingは,推論プロセスを複数の層に体系的に分割する新しいフレームワークである。
医療トリアージ、財務リスク評価、アジャイルエンジニアリングの3つのシナリオを紹介し、透明性、正確性、ユーザエンゲージメントの観点から、Layered-CoTがバニラCoTをどのように上回っているかを示します。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:51:11 GMT)
Latent Lexical Projection in Large Language Models: A Novel Approach to Implicit Representation Refinement [0.0] ラテントレキシカル射影 (LLP) は、構造化された空間からラテント空間への変換を通じて、レキシカル表現を洗練するために導入された。
LLPは既存の言語モデルアーキテクチャに最適化されたプロジェクション機構を統合する。
評価は、パープレキシティの低下とBLEUスコアの上昇を示し、予測精度と流布率の改善を示唆している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:18:53 GMT)
Invisible Traces: Using Hybrid Fingerprinting to identify underlying LLMs in GenAI Apps [0.0] 大規模言語モデル(LLM)のフィンガープリントは、AI統合アプリケーションのセキュリティと透明性を保証するために欠かせないものとなっている。
静的および動的フィンガープリント技術を統合することにより,これらの課題に対処する新しいフィンガープリントフレームワークを提案する。
提案手法は, 動的環境下でのLDMの高精度かつ堅牢なフィンガープリントを可能にするため, 建築特性と挙動特性を同定する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:36:08 GMT)
Induced Berry Connection and Photonic Spin Hall Effect in Optical Dirac Theory [0.0] スピン軌道相互作用とフォトニックスピン/軌道ホール効果の場-理論モデルを提案する。
提案手法は, 線量座標系におけるマクスウェル方程式の解法として, ヘリカルパスに沿った光伝搬を再構成する。
エバネッセント波の逆スピンはEOAMと重なり、楕円偏光の幾何学的位相が円偏光のそれと異なることが明らかになった。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:19:56 GMT)
Hybrid sub- and superradiant states in emitter arrays with quantized motion [0.0] ラム・ディッケ極限内におけるこの量子化運動の存在下での集合原子-光結合の理論を開発する。
電子励起と振動励起のハイブリッドである準放射状態と超放射状態の存在を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:07:20 GMT)
Hybrid Machine Learning Model for Detecting Bangla Smishing Text Using BERT and Character-Level CNN [0.0] スマイッシング攻撃は328%増加し、モバイルユーザーにとって大きな脅威となった。
人気は高まっているものの、この問題は依然としてかなり過小評価されている。
本稿では,バングラスミッシングテキストを検出するためのハイブリッド機械学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:51:58 GMT)
How to warm-start your unfolding network [0.0] オーバーパラメータ化された展開ネットワークの性能を高めるための新しいアンサンブルフレームワークを提案する。
C-DECのトレーニングと評価のために,ログコッシュ損失関数を組み込んだ。
実画像上でC-DECの性能を数値的に評価する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 22:05:45 GMT)
High-performance conditional-driving gate for Kerr parametric oscillator qubits [0.0] ゲート動作のフラックスパルスによるAC-Zeemanシフトがゲート性能に大きく影響を与えることを示す。
この望ましくない効果を解消する手法を提案する。
提案手法を使わずに,平均忠実度が99.9$%を超える条件付き運転ゲートを数値的に示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:03:58 GMT)
Heterogeneous Image GNN: Graph-Conditioned Diffusion for Image Synthesis [0.0] 本稿では、変数と対象画像を2つの相互接続グラフとしてモデル化する新しい表現である、異種画像グラフ(HIG)を提案する。
また,HIGを既存のEDM2拡散モデルに統合した大域保存型GNNを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:36:14 GMT)
Heralded generation of entanglement with photons [0.0] 光子の絡み合った状態は多くの量子技術のバックボーンを形成する。
ポストセレクション(postelection)として知られる、一般的だが基本的に制限された生成技術では、生成過程においてターゲット光子が破壊的に測定される。
代替のアプローチ -- 条件付き状態生成 -- では、望まれる状態の生成が、補助光子の検出によって検証される。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:34:48 GMT)
Grid-based exoplanet atmospheric mass loss predictions through neural network [0.0] 我々は、機械学習(ML)を用いて、上層大気モデルの既存の大きなグリッドを高速に観察する。
ニューラルネットワークを用いたDense MLスキーム("atmospheric Inquiry frameworK"; MLink)を開発した。
我々は、慎重に選択された合成惑星の小さなサンプルの進化に異なるスキームが与える影響について研究する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:46:12 GMT)
Generating logical magic states with the aid of non-Abelian topological order [0.0] 本稿では,マジック状態の準備とコード切換えを組み合わせて,論理的非クリフォード演算を実現する新しいプロトコルを提案する。
我々のアプローチは、$mathbbZ_4$ surface codeの特別な論理状態から始まります。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:38:32 GMT)
Generalized hydrodynamics of integrable quantum circuits [0.0] 原型可積分モデルであるXXZハイゼンベルクスピン鎖の可積分トロッター化について検討する。
接合部における単一微細な欠陥、例えば1量子ビットの追加は、遅く出現する非平衡マクロ状態を変化させる可能性がある。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:22:46 GMT)
Gamma/hadron separation in the TAIGA experiment with neural network methods [0.0] ニューラルネットワークを用いた希少なVHEガンマ線選択能力について,宇宙線束が強く普及している場合に検討した。
クレーター大星雲の観測から21時間で5.5シグマ以上の信号が受信された。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:34:44 GMT)
GNN-DT: Graph Neural Network Enhanced Decision Transformer for Efficient Optimization in Dynamic Environments [0.0] 本稿では,グラフニューラルネットワーク(GNN)を組み込んだ新しいDecision Transformer(DT)アーキテクチャであるGNN-DTを紹介する。
以前に収集した軌道から学習することで、GNN-DTは正確なシミュレータへの依存を減らし、オンライン強化学習(RL)アルゴリズムのスパース報酬に対処する。
複雑な電気自動車(EV)の充電最適化問題に対するGNN-DTの評価を行い、その性能が優れていること、およびトレーニング軌道を著しく少なくする必要があることを証明した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:35:23 GMT)
Extended string-net models with all anyons at finite temperature [0.0] 格子の各小包に1つのテールをアタッチすることで,拡張文字列ネットモデルを考える。
有限サイズ系では、位数は1次元古典イジングモデルと同様、有限温度まで生存する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:43:19 GMT)
Exploratory Utility Maximization Problem with Tsallis Entropy [0.0] 本研究では, 相対リスク回避ユーティリティ機能を有する予測ユーティリティ問題を, 強化学習フレームワークの下で完全市場において検討した。
有効性探索問題は, 過度な探索のため, 一部事例では不十分であることが判明した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:39:12 GMT)
Estimating Network Models using Neural Networks [0.0] 本稿では,パラメータから平均的ネットワーク統計へのマッピングを学習するために,一組のパラメータシミュレーションペアを訓練するニューラルネットワークアプローチを提案する。
一度訓練すると、この写像は逆転し、高速で並列化可能な推定法が得られる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:41:06 GMT)
Entanglement asymmetry in the Hayden-Preskill protocol [0.0] 本研究では,Hayden-Preskillシンキング実験におけるブラックホール放射のエンタングルメント非対称性の時間発展について考察する。
放射の$U(1)$対称性は、ある遷移時間の前に現れる。
さらに、ブラックホールの初期状態が極大に混合されると、この創発対称性はブラックホールの放射の過程全体を通して生き残る。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:41:50 GMT)
Enhancing Aspect-based Sentiment Analysis with ParsBERT in Persian Language [0.0] 本稿ではペルシャ語に合わせた言語モデルの効率を向上することを目的とする。
ペルシャ語ウェブサイト「ジギカラ」から抽出したユーザ意見の感情分析を中心にした研究。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 06:25:06 GMT)
End-to-End Imitation Learning for Optimal Asteroid Proximity Operations [0.0] 本稿ではニューラルネットワークを用いたエンドツーエンドのアルゴリズムを提案する。
ハイブリッドモデル予測制御(MPC)ガイド付き模倣学習コントローラは、従来のMPCコントローラよりも計算効率が向上する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:09:20 GMT)
Emergent Topology in Many-Body Dissipative Quantum Matter [0.0] 擬エルミート多体量子系の散逸ダイナミクスについて検討する。
我々は、それらが普遍的であることを示す幅広いパラメータについて、同じトポロジ的特徴を見出した。
浴への弱いカップリングの限界において、トポロジカルモードは平衡へのアプローチを支配している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:46:01 GMT)
Electronic superradiance mediated by nuclear dynamics [0.0] 我々は、核運動が超放射能放出に与える影響を明らかにするためにディックモデルを拡張した。
我々のシミュレーションは、暗黒の亜ラジカル状態の集団流出に起因する新しい時間スケールを明らかにした。
これらの発見は超ラジカル状態と分子自由度をどのように活用し、量子光学系で活用するかに影響を及ぼす。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 23:08:52 GMT)
Electrically induced bulk and edge excitations in the fractional quantum Hall regime [0.0] 発光スペクトルエネルギーシフトによるエッジとバルクの集合励起について検討した。
電圧パルスにおけるオフセットの導入は励起信号を大幅に向上させる。
結果は、エッジとバルク状態のトポロジカルな関係を強調し、量子重力の固体アナログを探索するための新しいアプローチを提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 04:51:37 GMT)
Efficient preparation of entangled states in cavity QED with Grover's algorithm [0.0] グロバーの探索アルゴリズムは、量子ビットのアンサンブルの絡み合った状態を効率的に作成することができる。
我々は、Dicke状態、GHZ状態、およびSchr"odinger cat superpositions of $N$atomsを、少数の光子散乱イベントによって決定的に生成することを示した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:50:34 GMT)
Efficient evaluation of the nonstabilizerness in unitary and monitored quantum many-body systems [0.0] 我々は、スタッガードXXZ鎖の量子状態拡散力学を考察する。
我々は、安定化器R'enyi entropy(SRE)を用いて、軌道に沿った非安定化剤性(マジック'とも呼ばれる)を評価する。
測定がない場合、SYKモデルだけが、時間平均SREが完全にランダムな状態境界を飽和する唯一のモデルであることが分かる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:11:42 GMT)
Effective time-dependent temperature for fermionic master equations beyond the Markov and the secular approximations [0.0] 本研究では, 粒子と環境とを一定温度で交換する量子系について検討する。
この記述を標準形 Redfield-II 方程式に効率的に還元することができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 17:14:59 GMT)
EdgeMark: An Automation and Benchmarking System for Embedded Artificial Intelligence Tools [0.0] 組み込みデバイスへの人工知能(AI)の統合は、エッジでインテリジェントなデータ処理を可能にすることで産業を変革している。
本稿では、既存のeAIツールのレビューを行い、それらの機能、トレードオフ、制限を強調します。
EdgeMarkは、組み込みプラットフォームに機械学習(ML)モデルをデプロイし、ベンチマークするためのベンチマークワークフローを合理化するように設計されたオープンソースの自動化システムです。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:28:01 GMT)
Dynamic thermalization on noisy quantum hardware [0.0] 電子量子コンピュータ上の熱可観測物質をエミュレートすることは、多体物理学の量子シミュレーションに不可欠である。
熱風呂のない小型閉鎖系では, 熱可観測物と揺らぎが得られうることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 19:00:00 GMT)
Dissipative quantum phase transitions monitored by current fluctuations [0.0] 散逸相転移(DPT)は、非平衡開量子系の物理的性質の急激な変化によって定義される。
ここでは、オープン量子システムと環境の間の単位時間あたりの平均量子ジャンプとして定義される$textitoutput current$を考える。
本稿では, 出力電流変動, 特にその動的相関, パワースペクトル, 特性時間スケールが, DPTに関する貴重な情報を提供することができることを提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 08:08:08 GMT)
Digital quantum simulation of bosonic systems and quantum complementarity [0.0] 多くの粒子ボソニック系と複雑な光学実験装置は、古典的なシミュレーション手法に重大な課題をもたらす。
我々は、IBMの量子コンピュータにおけるアフシャーの実験のインターフェロメトリの変種をデジタル的にシミュレートする。
我々はこれらの実験を、更新された量子補性原理の枠組みの中で分析する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:04:34 GMT)
Deterministic carving of quantum states with Grover's algorithm [0.0] 我々は、グローバーのアルゴリズムのいくつかのユニタリステップが、キャビティ内の$N$原子のディック状態を完全に準備するのに十分であることを示した。
また,GHZ状態とCat状態を生成するために,その後のGroverステップをいくつかのステップで適用できることも示している。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 01:52:37 GMT)
Deep Reinforcement Learning for Dynamic Resource Allocation in Wireless Networks [0.0] 本報告では,無線通信システムにおける動的リソース割り当てに対する深部強化学習(DRL)アルゴリズムの適用について検討する。
アルゴリズムと学習率の選択はシステム性能に大きく影響を与え、DRLは従来の手法よりも効率的なリソース割り当てを提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 07:49:00 GMT)
Dance recalibration for dance coherency with recurrent convolution block [0.0] R-Lodgeは、Recurrent Sequential Representation LearningをDance Recalibrationと名づけた独自の粗いロングダンス生成モデルに組み込んでいる。
The results shows that R-Lodge enhances the consistency of the entire generated dance motions。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 09:29:02 GMT)
Conditional t-independent spectral gap for random quantum circuits and implications for t-design depths [0.0] N クォーディット上の1次元ブリックワークアーキテクチャの T 次モーメントのスペクトルギャップに新たな境界を確立する。
スペクトルギャップの改善は、既知の結果の定数因子に大きな改善をもたらす。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 20:46:07 GMT)
ConceptVAE: Self-Supervised Fine-Grained Concept Disentanglement from 2D Echocardiographies [0.0] ConceptVAEは、自制的なスタイル特性からきめ細かい概念を検知し、切り離す新しい事前学習フレームワークである。
入力データを、その局所的なスタイルとともに予め設定された多数の概念に分解するように設計された、損失項とモデルアーキテクチャプリミティブの組を提示する。
心エコー図から血液プールや中隔壁などの微細な解剖学的構造を検出する能力を実証し,定性的かつ定量的にConceptVAEを検証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:18:01 GMT)
Comprehensive Modeling Approaches for Forecasting Bitcoin Transaction Fees: A Comparative Study [0.0] 本研究は,Bitcoin取引手数料予測のための6つの予測モデルについて,体系的評価を行った。
当社のアプローチでは,メムプールメトリクス,ネットワークパラメータ,履歴料金パターンにまたがる包括的機能エンジニアリングを統合している。
従来の統計的アプローチは、より複雑なディープラーニングアーキテクチャよりも優れている。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 03:52:07 GMT)
Common Foundations for SHACL, ShEx, and PG-Schema [0.0] このようなグラフのスキーマを記述する必要がある。
Semantic Webとデータベースコミュニティは、SHA、ShEx、PG-CLというグラフスキーマ言語を独立して開発している。
各言語には、制約を定義し、グラフデータを検証するための独自のアプローチがあり、潜在的なユーザは、共通点と相違点について暗黙に残されている。
言語間の包括的比較を容易にし,共通機能の集合を同定するために,一様フレームワークを用いる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 12:17:25 GMT)
Comment on "The unphysicality of Hilbert spaces" (arXiv:2308.06669v3) [0.0] これは量子力学の数学的構造の思慮深い解法である。
物理的状態がヒルベルト空間の元であるという仮定に固有の困難を指摘しようとする。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:55:44 GMT)
Can sparse autoencoders make sense of latent representations? [0.0] 潜在表現は、重ね合わせで観測可能で直接接続された隠れ変数をエンコードできる。
単一セルマルチオミクスデータの適用により,SAEが重要な生物学的プロセスを明らかにすることができることを示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:20:35 GMT)
Beyond Win Rates: A Clustering-Based Approach to Character Balance Analysis in Team-Based Games [0.0] 競争ゲームにおけるキャラクターの多様性は、プレイヤーの経験と戦略的な深さに悪影響を及ぼす可能性がある。
従来のバランスアセスメントは、勝利率やピックレートといった総合的な指標に依存しています。
本稿では,キャラクタバランスを解析するためのクラスタリングに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 11:20:21 GMT)
Aspects of Artificial Intelligence: Transforming Machine Learning Systems Naturally [0.0] 我々は、機械学習システムとして、私たちが共に関心を持っている機械学習要素について研究する。
2つのシステム間の機械学習システム変換は、システム間のマップである。
機械学習システム間の接続は、問題解決の最適な方法を提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 14:45:02 GMT)
An Implementation of the Finite Element Method in Hybrid Classical/Quantum Computers [0.0] この原稿は、ノイズの多い中間スケール量子コンピュータで使用されるために開発された量子有限要素法(Q-FEM)を提示する。
Q-FEMは有限要素の離散化の構造をそのまま保持し、可変要素の長さと材料係数をFEMの離散化に用いることができる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 21:03:56 GMT)
Amplified quantum battery via dynamical modulation [0.0] 本研究では,周波数変調型量子電池の発散キャビティ環境における充電特性について検討する。
高振幅低周波変調は、強い結合状態における充電性能と作業抽出を著しく向上させる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 05:51:09 GMT)
AirTag, You're It: Reverse Logistics and Last Mile Dynamics [0.0] 本研究は, 逆ロジスティクスの課題, 特にインフラ破壊が適応解を必要とする災害救済シナリオに対処する。
この研究は、パッケージに埋め込まれた20個のApple AirTagsを使用して、Apple Find Myネットワークと統合されたBluetooth LE(BLE)5トラッカーを介して、粒度の空間的および時間的データをキャプチャする、論理フローに関する実証的な洞察を提供する。
これらのトラッカーは、動的貨物移動を監視することの価値を示し、特にハリケーン・ヘレーンのような災害災害時の移動ハブ配置や経路最適化のリアルタイム調整を可能にした。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 02:21:23 GMT)
AI-Powered Spearphishing Cyber Attacks: Fact or Fiction? [0.0] ディープフェイク技術は、ある個人の類似性や声を、警告の精度で別の個人に置き換えることができる。
本稿では,この技術を悪意ある利用によって引き起こされる脅威について,特にスピアフィッシング攻撃の形で検討する。
ディープフェイク技術を使って、スピアフィッシングのような攻撃シナリオを作成し、平均的な個人に対して検証する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 00:02:01 GMT)
A two-disk approach to the synthesis of coherent passive equalizers for linear quantum systems [0.0] そこで本稿では, フィルタの等化のための変換関数の合成法の改良について述べる。
提案手法は、より広範な線形量子通信チャネルのクラスに適用できる。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:10:15 GMT)
A simple algorithm for output range analysis for deep neural networks [0.0] 本稿では,Deep Neural Networks (DNN) における出力範囲推定問題に対して,Simulated Annealing (SA) アルゴリズムを統合した新しい手法を提案する。
この方法はResNetsに固有の幾何学的情報や非線形性の欠如による課題に効果的に対処する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:52:49 GMT)
A Relative Homology Theory of Representation in Neural Networks [0.0] 従来の研究では、ReLUアクティベーション関数を持つニューラルネットワークによって実装されたマップの集合は、断片的線形連続写像の集合と同一であることが証明されている。
これは$Phi_J$の局所ランクと$cap textImPhi_J_i$の交叉に関する2つのセットに分けることができる。
後者を重複分解 $O_Phi$ と呼び、各ポリヘドロンと入力多様体の間の交叉が成立することを証明する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:52:17 GMT)
A Poisson Process AutoDecoder for X-ray Sources [0.0] Poisson Process AutoDecoder (PPAD) は、固定長遅延特徴を連続したPoissonレート関数にマッピングするニューラルネットワークデコーダである。
再建, 回帰, 分類, 異常検出実験によるPPADの有効性を実証した。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 18:56:39 GMT)
A Novel Multi-Objective Evolutionary Algorithm for Counterfactual Generation [0.0] 機械学習アルゴリズムはブラックボックス予測モデル(直接解釈できない)を学ぶ
特に,モデルがユーザに対して負の予測を出力した場合に,そのようなモデルの予測を理解することが重要である。
カウンターファクトの説明は、ユーザーに対して、異なる肯定的な分類を受けるために、その特性の一部をどう変えるかのガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 15:50:59 GMT)
A Lower Bound on the Critical Momentum of an Impurity in a Bose-Einstein Condensate [0.0] ボース=アインシュタイン凝縮体に浸漬された不純物は、全運動量が音速の質量よりも小さいときに安定な準粒子を形成する。
この系は、この準粒子が摩擦を経験しないため、超流動的な挙動を示す。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 13:53:41 GMT)
100 Particles Quantum Heat Engine: Exploring the Impact of Criticality on Efficiency [0.0] 長距離Ising鎖を作用物質として用いた量子オットーサイクルの性能について検討する。
本研究では, 内部要因, 特にパワーロー指数, 粒子数, 高温および低温の貯水池温度が, システム動作にどう影響するかを検討する。
論文参考訳(メタデータ) (Mon, 03 Feb 2025 16:03:17 GMT)