SmartEraser: Remove Anything from Images using Masked-Region Guidance [114.4] SmartEraserはMasked-Region Guidanceと呼ばれる新しい削除パラダイムで構築されている。
Masked-Region Guidanceは、削除プロセスのガイダンスとして、入力中のマスクされた領域を保持します。
大規模オブジェクト除去データセットであるSyn4Removalを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:55:12 GMT)
Set-based Neural Network Encoding Without Weight Tying [91.4] 本稿では,ネットワーク特性予測のためのニューラルネットワーク重み符号化手法を提案する。
我々のアプローチは、混合アーキテクチャのモデル動物園でニューラルネットワークを符号化することができる。
ニューラルネットワークのプロパティ予測には,クロスデータセットとクロスアーキテクチャという,2つの新しいタスクを導入する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:48:49 GMT)
Edicho: Consistent Image Editing in the Wild [90.4] エディコは拡散モデルに基づく訓練なしの解を踏む。
これは、明示的な画像対応を使って直接編集する基本的な設計原理を特徴としている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:23:30 GMT)
Vchitect-2.0: Parallel Transformer for Scaling Up Video Diffusion Models [89.8] Vchitect-2.0は、大規模テキスト・ビデオ生成のためにビデオ拡散モデルをスケールアップするために設計された並列トランスフォーマーアーキテクチャである。
新たなマルチモーダル拡散ブロックを導入することで,テキスト記述と生成されたビデオフレームの整合性を実現する。
メモリと計算のボトルネックを克服するために,メモリ効率のトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:53:11 GMT)
Spurious Feature Eraser: Stabilizing Test-Time Adaptation for Vision-Language Foundation Model [87.0] 視覚言語基礎モデルは、画像とテキストのペアデータに拡張性があるため、多数の下流タスクで顕著な成功を収めている。
しかし、これらのモデルは、決定ショートカットの結果、きめ細かな画像分類などの下流タスクに適用した場合に重大な制限を呈する」。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:37:26 GMT)
Beyond Sight: Finetuning Generalist Robot Policies with Heterogeneous Sensors via Language Grounding [85.6] FuSeは、不均一なセンサのモダリティに対する微調整型ビズモータ一般政策を可能にする新しいアプローチである。
FuSeは視覚,触覚,音などのモーダル性に対して共同で推論を必要とする挑戦的なタスクを実行できることを示す。
実世界での実験では、FuSeisはすべての基準ラインと比較して成功率を20%以上引き上げることができた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:28:39 GMT)
MangaNinja: Line Art Colorization with Precise Reference Following [84.2] MangaNinjiaは、ラインアートのカラー化に特化している。
文字の詳細を正確に書き起こすために、2つの思慮深い設計を取り入れる。
基準カラー画像と対象ラインアートとの対応学習を容易にするパッチシャッフルモジュールと、きめ細かい色マッチングを可能にするポイント駆動制御スキームとを備える。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:59:55 GMT)
BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature [73.4] BIOMEDICAはスケーラブルでオープンソースのフレームワークで、PubMed Central Open Accessサブセット全体を抽出、注釈付け、シリアライズして、使いやすく、公開可能なデータセットにする。
われわれのフレームワークは600万以上の記事から2400万以上のユニークな画像テキストペアで包括的なアーカイブを生成する。
BMCA-CLIPは、ストリーミングを通じてBIOMEDICAデータセット上で継続的に事前トレーニングされたCLIPスタイルのモデルのスイートで、27TBのデータをローカルにダウンロードする必要がなくなる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:46:14 GMT)
Reasoning with Graphs: Structuring Implicit Knowledge to Enhance LLMs Reasoning [73.3] 大規模言語モデル(LLM)は、幅広いタスクで顕著な成功を収めている。
しかし、彼らは情報片間の関係を理解し、推論する必要があるタスクの推論において、依然として課題に直面している。
この課題は、論理的推論やマルチホップ質問応答など、多段階プロセスに関わるタスクにおいて特に顕著である。
本稿では、まず文脈から明示的なグラフを構築することにより、グラフを用いた推論(RwG)を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:18:20 GMT)
Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax [73.0] 我々はDeep InfoMax(DIM)を拡張し、学習した表現を選択された事前分布に自動マッチングできるようにする。
このような修正により、一様かつ通常に分散した表現を学習できることを示す。
その結果,下流作業における性能とDMの品質の中間的なトレードオフが示唆された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:52:40 GMT)
Learning Discrete Concepts in Latent Hierarchical Models [73.0] 自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。
我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。
我々は、理論的な主張を合成データ実験で裏付ける。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:44:45 GMT)
GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [73.0] 我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:02:50 GMT)
EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.8] 本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:42:22 GMT)
Audio-Agent: Leveraging LLMs For Audio Generation, Editing and Composition [72.2] 本稿では,テキストやビデオの入力に基づく音声生成,編集,合成のためのフレームワークであるAudio-Agentを紹介する。
提案手法では,事前学習したTTA拡散ネットワークを音声生成エージェントとして利用し,GPT-4でタンデムで動作させる。
VTA(Video-to-audio)タスクでは、既存のほとんどのメソッドは、生成されたオーディオとビデオイベントを同期させるタイムスタンプ検出器のトレーニングを必要とする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:59:03 GMT)
One Language, Many Gaps: Evaluating Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks [68.3] 本研究は,大言語モデル(LLM)の標準推論タスクにおける方言処理における妥当性と頑健さを客観的に評価することを目的とした最初の研究である。
我々は、コンピュータサイエンスのバックグラウンドの専門家を含むAAVEスピーカーを雇い、HumanEvalやGSM8Kといった7つの人気のあるベンチマークを書き換えます。
以上の結果から,これら広く使用されているモデルのほとんどは,AAVEにおけるクエリに対する不安定さと不公平さを顕著に示していることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:52:50 GMT)
FramePainter: Endowing Interactive Image Editing with Video Diffusion Priors [64.5] 本稿では,画像から映像への効率のよい生成問題としてFramePainterを紹介した。
軽量のスパース制御エンコーダのみを使用して編集信号を注入する。
従来の最先端の手法をはるかに少ないトレーニングデータで上回ります。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:09:16 GMT)
WebWalker: Benchmarking LLMs in Web Traversal [64.5] WebWalkerQAは,LLMがWebトラバースを実現する能力を評価するためのベンチマークである。
本稿では,WebWalkerを提案する。WebWalkerは,探索的・批判的パラダイムを通じて,人間のようなWebナビゲーションを模倣するマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:06:56 GMT)
Unsupervised Query Routing for Retrieval Augmented Generation [64.5] 本稿では,検索強化応答の質を評価するために,"upper-bound"応答を構成する新しい教師なし手法を提案する。
この評価により、与えられたクエリに対して最も適切な検索エンジンを決定することができる。
手動のアノテーションをなくすことで、大規模なユーザクエリを自動的に処理し、トレーニングデータを作成することができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:27:06 GMT)
Predicting 4D Hand Trajectory from Monocular Videos [63.8] HaPTICはモノクロビデオからコヒーレントな4Dハンドトラジェクトリを推論するアプローチである。
既存の手法をグローバルな軌道精度で大幅に上回る。
これは、単一画像のポーズ推定における最先端の手法に匹敵する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:59:05 GMT)
FLM-101B: An Open LLM and How to Train It with $100K Budget [63.2] その結果,FLM-101Bは,予算1万ドルで成長戦略を訓練し,浮動小数点演算の10%に過ぎず,ベースラインのパフォーマンスの80%に達することがわかった。
先進的なトレーニングに関するさらなる研究は、コストを削減し、グリーンAIを促進することで、コミュニティに恩恵をもたらすと信じている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:40:36 GMT)
AVS-Mamba: Exploring Temporal and Multi-modal Mamba for Audio-Visual Segmentation [62.7] 音声・視覚的セグメンテーションタスクに対処する選択状態空間モデルであるAVS-Mambaを導入する。
我々のフレームワークはビデオ理解とクロスモーダル学習の2つの重要な要素を取り入れている。
提案手法は, AVSBench-object と AVS-semantic のデータセット上で, 最新の結果を実現する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:20:20 GMT)
Vid2Sim: Realistic and Interactive Simulation from Video for Urban Navigation [62.6] Vid2Simは、ニューラル3Dシーンの再構築とシミュレーションのためのスケーラブルで費用効率のよいReal2simパイプラインを通じてsim2realギャップをブリッジする新しいフレームワークである。
実験により、Vid2Simはデジタル双生児と現実世界の都市ナビゲーションの性能を31.2%、成功率68.3%で大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:29:06 GMT)
Real-time Verification and Refinement of Language Model Text Generation [60.0] 大規模言語モデル(LLM)は、幅広い自然言語タスクにおいて顕著な性能を示している。
重要な課題は、時に事実的に誤った答えを生じさせることである。
本稿では,LLM出力の検証と改善の効率化を目的とした新しい手法であるStreaming-VRを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:59:48 GMT)
MiniMax-01: Scaling Foundation Models with Lightning Attention [59.4] MiniMax-Text-01とMiniMax-VL-01は、より長いコンテキストを処理するのに優れた機能を提供する。
MiniMax-Text-01は、トレーニング中に最大100万のトークンに到達でき、推論時に400万のトークンを安価な価格で外挿できる。
私たちのビジョン言語モデルであるMiniMax-VL-01は、512億のビジョン言語トークンによる継続的なトレーニングによって構築されます。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:50:05 GMT)
Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks [59.1] 我々は、画像とビデオの両方の領域レベルの理解を容易にするために設計された大規模な言語モデルであるOmni-RGPTを提案する。
視覚的特徴空間内の対象領域をハイライトするトークンセットであるToken Markを紹介した。
また、大規模領域レベルのビデオインストラクションデータセット(VID-300k)も導入する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:58:04 GMT)
FDPP: Fine-tune Diffusion Policy with Human Preference [57.4] 人間の嗜好を考慮した微調整拡散政策は、嗜好に基づく学習を通して報酬関数を学習する。
この報酬は、訓練済みの政策を強化学習で微調整するために使われる。
実験により、FDPPは性能を損なうことなく、効果的にポリシーの動作をカスタマイズできることが示されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:15:27 GMT)
JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning [57.4] JsonTuningは、構造から構造へのアプローチで、構造を使ってタスクを表現します。
タスク要素とその関係を明確にすることで一般化を向上し、あいまいさを最小化して堅牢性を高め、出力の正確な制御を可能にして可制御性を高める。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:55:27 GMT)
Causal vs. Anticausal merging of predictors [57.3] 同じデータを用いて、因果方向と反因果方向の融合予測器から生じる差について検討した。
帰納的バイアスとしてCausal Maximum Entropy (CMAXENT) を用いて予測器をマージする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:38:15 GMT)
Data-driven Bayesian State Estimation with Compressed Measurement of Model-free Process using Semi-supervised Learning [57.0] 研究テーマは、圧縮測定によるデータ駆動ベイズ状態推定である。
状態の基本的な力学モデルは未知であると仮定される。
既存の2つの教師なし学習ベースのデータ駆動手法は、BSCMの問題に対処できない。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:28:06 GMT)
Gradient Equilibrium in Online Learning: Theory and Applications [56.0] 勾配平衡は標準オンライン学習法によって達成される。
勾配平衡は、オンライン予測問題において解釈可能かつ有意義な性質に変換される。
勾配平衡フレームワークは,ブラックボックス予測の偏りを緩和する手法の開発に利用できることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:59:09 GMT)
ELDER: Enhancing Lifelong Model Editing with Mixture-of-LoRA [55.7] 大規模言語モデル(LLM)は、特定の知識を効率的に更新し、事実の誤りを避けるためにモデル編集を必要とする。
従来のアプローチでは、元のパラメータを凍結し、知識更新毎に新しいパラメータを個別に割り当てることで、シーケンシャルな編集を管理する。
本稿では,データとアダプタを連続的に関連付ける新しい手法であるELDERを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:25:23 GMT)
Knowledge-Guided Prompt Learning for Deepfake Facial Image Detection [54.3] ディープフェイク顔画像検出のための知識誘導型プロンプト学習法を提案する。
具体的には、学習可能なプロンプトの最適化を導くための専門家知識として、大規模言語モデルから偽造関連プロンプトを抽出する。
提案手法は最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:04:35 GMT)
Joint Beam Search Integrating CTC, Attention, and Transducer Decoders [53.3] 4つのデコーダが同一のエンコーダを共有するような共同モデリング手法を提案する。
4Dモデルは共同で訓練され、モデルの正規化とモデルの堅牢性を最大化する。
さらに,3つのデコーダを組み合わせることで,新しい3つのビーム探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:03:19 GMT)
Skeleton and Font Generation Network for Zero-shot Chinese Character Generation [53.1] そこで我々は,より堅牢な漢字フォント生成を実現するために,新しいSkeleton and Font Generation Network (SFGN)を提案する。
ミススペル文字について実験を行い、その大部分は共通文字とわずかに異なる。
提案手法は、生成した画像の有効性を視覚的に実証し、現在最先端のフォント生成方法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:15:49 GMT)
Flow: A Modular Approach to Automated Agentic Workflow Generation [53.1] 大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし,実行中のエージェントの効果的な調整は十分に研究されていない。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:35:37 GMT)
Optimizing Speech Multi-View Feature Fusion through Conditional Computation [51.2] 自己教師付き学習(SSL)機能は、軽量で多目的な多視点音声表現を提供する。
SSLは、FBanksのような従来のスペクトル機能とアップデートの方向で競合する。
本稿では,条件計算に基づく新しい一般化された特徴融合フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:12:06 GMT)
NeuroBench: A Framework for Benchmarking Neuromorphic Computing Algorithms and Systems [50.1] ニューロベンチ(NeuroBench)はニューロモルフィックコンピューティングアルゴリズムとシステムのためのベンチマークフレームワークである。
NeuroBenchは、業界や学界にまたがる研究者のオープンなコミュニティによる共同開発である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:38:46 GMT)
Parameter-Inverted Image Pyramid Networks for Visual Perception and Multimodal Understanding [49.2] 現在の画像ピラミッドは、複数の解像度を処理するために同じ大規模なモデルを使用しており、計算コストを大幅に上回っている。
我々はCOCO変換画像ピラミッドネットワーク(PIIP)と呼ばれる新しいネットワークアーキテクチャを提案する。
PIIPは、事前訓練されたモデル(ViTまたはCNN)を、より小さなネットワークブランチによって高解像度の画像が処理され、計算コストと性能のバランスをとるマルチスケールイメージの処理に使用する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:57:41 GMT)
3UR-LLM: An End-to-End Multimodal Large Language Model for 3D Scene Understanding [49.2] オープンソースの2D MLLMとLCMをベースとしたパイプラインを開発し,高品質な3Dテキストペアを生成する。
本稿では,3次元シーンの正確な解釈を目的としたエンドツーエンド3次元MLLMである3UR-LLMモデルを紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:50:23 GMT)
Learning Motion and Temporal Cues for Unsupervised Video Object Segmentation [49.1] 本稿では,動きと時間的手がかりを同時に活用する,MTNetと呼ばれる効率的なアルゴリズムを提案する。
MTNetは、エンコーダ内の特徴抽出過程において、外観と動作の特徴を効果的にマージすることによって考案される。
派生した機能を最適に活用するために、すべての機能レベルのデコーダのカスケードを使用します。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:15:46 GMT)
Smooth Handovers via Smoothed Online Learning [49.0] まず、欧州の商用モバイルネットワークオペレータ(MNO)から4000万人以上のユーザを対象に、HOに対する重要な特徴とパフォーマンスへの影響を理解し、明らかにするために、広範なデータセットを分析した。
本研究は, HO故障/遅延と無線セルとエンドユーザーデバイスの特徴の相関関係を明らかにする。
本稿では,HO最適化にデバイスとセルの機能を組み込むことで,既存のアプローチを拡張したスムーズで高精度なHOのための現実的なシステムモデルを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:16:33 GMT)
Radar Signal Recognition through Self-Supervised Learning and Domain Adaptation [48.3] RFサンプルとラベルを限定した環境下でのレーダ信号認識を強化するための自己教師付き学習(SSL)手法を提案する。
具体的には,各種RF領域のベースバンド内位相および2次(I/Q)信号に対する事前学習マスク付きオートエンコーダ(MAE)について検討する。
その結果,ドメイン適応型軽量自己教師型ResNetモデルでは,1ショットの分類精度が最大17.5%向上した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:53:30 GMT)
Dynamic Sub-graph Distillation for Robust Semi-supervised Continual Learning [47.6] 半教師付き連続学習(SSCL)に焦点をあて、そのモデルが未知のカテゴリを持つ部分ラベル付きデータから徐々に学習する。
半教師付き連続学習のための動的サブグラフ蒸留法(DSGD)を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:14:00 GMT)
Talk to Right Specialists: Routing and Planning in Multi-agent System for Question Answering [47.3] RopMuraは、複数の知識ベースを統一的なRAGベースのエージェントに統合する、新しいマルチエージェントシステムである。
RopMuraには2つの重要なコンポーネントがある。知識境界に基づいて最も関連性の高いエージェントをインテリジェントに選択するルータと、複雑なマルチホップクエリを管理可能なステップに分解するプランナだ。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:25:26 GMT)
AgentPose: Progressive Distribution Alignment via Feature Agent for Human Pose Distillation [46.8] AgentPoseは、教師の特徴の分布をモデル化し、学生の特徴の分布と教師の特徴の分布を段階的に整合させる特徴剤を統合する新しいポーズ蒸留法である。
COCOデータセットを用いた包括的実験により,特に高いキャパシティギャップを有するシナリオにおいて,知識伝達における本手法の有効性が実証された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:57:17 GMT)
V-Trans4Style: Visual Transition Recommendation for Video Production Style Adaptation [46.8] V-Trans-4Styleは、ドキュメンタリー、ドラマ、フィーチャー映画、特定のYouTubeチャンネルのビデオ制作技術など、さまざまなプロダクションスタイルにビデオを適用するように設計されている。
我々のアルゴリズムは、よりボトムアップなアプローチを用いて、この柔軟性を達成するために最適な視覚遷移を推奨する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:06:02 GMT)
LayerAnimate: Layer-specific Control for Animation [46.7] アニメーション化されたビデオは、前景と背景の要素をレイヤーに分け、スケッチ、精製、着色、および中間の処理を行う。
既存のビデオ生成方法は、アニメーションをモノリシックなデータドメインとして扱い、個々の層に対するきめ細かい制御を欠いている。
本稿では,ビデオ拡散モデルにおける個々のアニメーション層に対するきめ細かい制御を強化する新しいアーキテクチャ手法であるLayerAnimateを紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:22:21 GMT)
Learning Symmetries via Weight-Sharing with Doubly Stochastic Tensors [46.6] グループ平等は、ディープラーニングにおいて価値ある帰納的バイアスとして現れてきた。
群同変法は、利害の群を事前に知る必要がある。
データセットが強い対称性を示すと、置換行列は正規群表現に収束することを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:03:05 GMT)
Anytime Cooperative Implicit Hitting Set Solving [46.0] Implicit Hitting Set (HS)アプローチは、MaxSAT、Pseudo-boolean最適化、その他のフレームワークに非常に効果的であることが示されている。
いずれのコンポーネントによって発見されたコアが利用できるマルチスレッドアーキテクチャにおいて、どのように簡単に組み合わせられるかを示す。
その結果,HS-lub は HS-lb と HS-ub のどちらよりも独立に優れていることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:23:52 GMT)
AdaSociety: An Adaptive Environment with Social Structures for Multi-Agent Decision-Making [45.7] AdaSocietyは、拡張状態とアクション空間を特徴とするカスタマイズ可能なマルチエージェント環境である。
エージェントが進むにつれて、エージェントが実行する社会的構造を持つ新しいタスクを適応的に生成する。
AdaSocietyは、さまざまな物理的および社会的環境におけるインテリジェンスを探索するための、貴重な研究プラットフォームとして機能する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:23:03 GMT)
Robust Low-Light Human Pose Estimation through Illumination-Texture Modulation [45.4] 現在の手法では、ピクセルレベルの拡張に依存するため、高品質な表現が提供できない。
本稿では,低照度人間のポーズ推定のための周波数に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:42:54 GMT)
Leveraging Metamemory Mechanisms for Enhanced Data-Free Code Generation in LLMs [44.8] M2WFは、大規模言語モデルのワンタイムコード生成を改善するためのフレームワークである。
従来の方法とは異なり、キュレートされたデータへの依存を最小限に抑え、さまざまなコーディングシナリオに適応する。
コードとフレームワークはGitHubとHuggingFaceで公開されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:16:43 GMT)
Poseidon: A ViT-based Architecture for Multi-Frame Pose Estimation with Adaptive Frame Weighting and Multi-Scale Feature Fusion [43.6] 単一フレームのポーズ推定は大きな進歩を遂げているが、複雑な連続的な動きを理解するために時間的ダイナミクスを捉えるのに失敗することが多い。
時間情報を統合することでViTPoseモデルを拡張する新しい多フレームポーズ推定アーキテクチャであるPoseidonを提案する。
提案手法は,PoseTrack21とPoseTrack18データセットの最先端性能を実現し,それぞれ88.3と87.8のmAPスコアを得た。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:34:34 GMT)
Expressive Text-to-Image Generation with Rich Text [42.9] フォントスタイル,サイズ,色,フットノートなどのフォーマットをサポートするリッチテキストエディタを提案する。
それぞれの単語の属性をリッチテキストから抽出し、局所的なスタイル制御、明示的なトークン再重み付け、正確な色レンダリング、詳細な領域合成を可能にする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:30:10 GMT)
MambaTrack: Exploiting Dual-Enhancement for Night UAV Tracking [41.8] 夜間無人航空機(UAV)の追跡は、照明不足の課題によって妨げられる。
そこで我々は,夜間UAV追跡の強化に2つの拡張技術を活用し,効率的なマンバベーストラッカーを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:10:46 GMT)
Frontier Models are Capable of In-context Scheming [41.3] 安全上の懸念の1つは、AIエージェントが間違った目標を隠蔽し、真の能力と目的を隠蔽する可能性があることである。
モデルが目標を追求するように指示される6つのエージェント評価スイート上でフロンティアモデルを評価する。
o1、Claude 3.5 Sonnet、Claude 3 Opus、Gemini 1.5 Pro、Llama 3.1 405Bは全てコンテキスト内スケジューリング機能を示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:16:01 GMT)
D$^2$-DPM: Dual Denoising for Quantized Diffusion Probabilistic Models [39.8] 本稿では、雑音推定ネットワークにおける量子化雑音の悪影響を正確に軽減することを目的とした二重復調機構D2-DPMを提案する。
実験により、D2-DPMはより優れた生成品質を示し、フル精度モデルよりも1.42低いFIDが得られることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:03:53 GMT)
HALoGEN: Fantastic LLM Hallucinations and Where to Find Them [39.7] 9つの領域にまたがる生成モデルに対する10,923のプロンプトからなる包括的な幻覚ベンチマークであるHALoGENをリリースする。
このフレームワークを使って14の言語モデルから15万世代を評価し、最高のパフォーマンスのモデルでさえ幻覚に満ちていることに気付きました。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:13:08 GMT)
EventHallusion: Diagnosing Event Hallucinations in Video LLMs [39.7] MLLM(Multimodal Large Language Models)はビデオ理解の分野で大きな進歩を遂げている。
本稿では,イベントに対するビデオLLMの幻覚を評価する新しいベンチマークであるEventHallusionを提案する。
また,ビデオLLMの幻覚化問題に対処するため,TCD(Temporal Contrastive Decoding)と呼ばれるシンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:27:28 GMT)
EPIC: Effective Prompting for Imbalanced-Class Data Synthesis in Tabular Data Classification via Large Language Models [39.3] 大規模言語モデル (LLM) は、多様なアプリケーションにまたがるテキスト内学習能力を示す。
バランスの取れたデータサンプルと一貫したフォーマットと独自の変数マッピングを併用した新しい手法であるEPICを導入し、不均衡なデータセットであっても、全てのクラスで正確な合成データを生成するのにLLMをガイドする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:41:21 GMT)
RWKV-UNet: Improving UNet with Long-Range Cooperation for Effective Medical Image Segmentation [39.1] 本稿では,RWKV構造をU-Netアーキテクチャに統合する新しいモデルであるRWKV-UNetを提案する。
この統合により、長い範囲の依存関係をキャプチャし、コンテキスト理解を改善するモデルの能力が向上する。
RWKV-UNetは,様々な種類の医用画像のセグメンテーションにおいて最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:03:00 GMT)
Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models [38.8] ディープ圧縮オートエンコーダ (DC-AE) は高分解能拡散モデルの高速化を目的とした新しいオートエンコーダモデルである。
遅延拡散モデルへの直流-AEの適用により,精度低下のない大幅な高速化を実現した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:47:44 GMT)
ONER: Online Experience Replay for Incremental Anomaly Detection [38.3] エンド・ツー・エンドのオンライン体験再生手法であるONERを提案する。
ONERは、最小のコストで新しいタスクに適応しながら、破滅的な忘れを効果的に軽減する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:40:53 GMT)
Scaling White-Box Transformers for Vision [38.2] CRATEは、圧縮およびスパース表現を学習するために設計されたホワイトボックストランスフォーマーアーキテクチャである。
我々はCRATE-$alpha$を提案し、CRATEアーキテクチャ設計におけるスパースコーディングブロックの戦略的かつ最小限の修正を特徴としている。
CRATE-$alpha$は、より大きなモデルサイズとデータセットで効果的にスケールできることを示します。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:38:36 GMT)
Differentially Private Distance Query with Asymmetric Noise [37.2] エッジをプライバシとみなし,エッジDPに基づく距離パブリッシング機構を提案する。
我々は、正式に非対称地区の定義を与え、個別非対称微分プライバシーを提案する。
非対称近傍における距離クエリのスムーズな感度を効率的に計算する2つの方法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:19:06 GMT)
Visual Language Models as Operator Agents in the Space Domain [36.9] VLM(Vision-Language Models)は、宇宙ミッションにおける自律的な制御と意思決定を強化する。
ソフトウェア環境では、複雑な軌道操作を行うために、VLMを用いてグラフィカルユーザインタフェースの視覚的なスクリーンショットを解釈する。
ハードウェアの分野では、衛星などの物理空間オブジェクトを検査・診断するためのカメラを備えたロボットシステムとVLMを統合する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:03:37 GMT)
An Empirical Wall-Pressure Spectrum Model for Aeroacoustic Predictions Based on Symbolic Regression [36.8] 本稿では,電流予測の堅牢性と精度を高めるために,新しい壁圧スペクトル実験モデルを提案する。
このモデルは、遺伝的アルゴリズムに基づくアプローチを用いて、AIに基づく象徴的回帰を用いて開発されている。
これは、フルスケールの風力タービンの空気音響ノイズを予測するために、Amietの理論と統合されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:14:22 GMT)
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination [35.9] このデータセットは、スペイン語と英語の大学入学レベルの試験に関する1003の質問からなる。
現在のオープンソースモデルとプロプライエタリモデルの選択は、一様ゼロショット実験環境で評価される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:41:28 GMT)
Active Sampling for Node Attribute Completion on Graphs [35.7] 本稿では、欠落したノード属性を復元するための新しいAcTive Smplingアルゴリズム(ATS)を提案する。
各ノードの情報の代表性と不確実性は、まずグラフ構造、表現類似性、学習バイアスに基づいて測定される。
4つの公開ベンチマークデータセットと2つのダウンストリームタスクの実験は、ノード属性の補完におけるATSの優位性を示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:38:23 GMT)
AttriBoT: A Bag of Tricks for Efficiently Approximating Leave-One-Out Context Attribution [35.2] 本稿では,文脈属性に対するLOO誤差の近似を効率的に計算する一連の新しい手法であるAttriBoTを紹介する。
AttriBoTは、以前のコンテキスト属性メソッドよりもターゲットモデルのLOOエラーに忠実でありながら、>300倍のスピードアップを提供することができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:07:55 GMT)
Scalable and Resource-Efficient Second-Order Federated Learning via Over-the-Air Aggregation [34.8] スパースヘッセン推定を用いたスケーラブルな第2次フェデレーション学習アルゴリズムを提案する。
シミュレーションの結果,他の1次および2次ベースラインと比較して67%以上の通信資源と省エネ効果が示された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:41:34 GMT)
Iterative Label Refinement Matters More than Preference Optimization under Weak Supervision [34.6] 我々は、小さな言語モデルと人間を用いて、信頼できないデモンストレーションと比較フィードバックをシミュレートする。
信頼性の低い監視が存在する場合、SFTは依然として有効性を維持するが、DPO(共通RLHFアルゴリズム)はSFT以外のモデルの改善に失敗する。
以上の結果から,LMは人間の監督が信頼できない複雑なタスクに使用されるため,RLHFはもはや人間の比較フィードバックの最良の利用ではない可能性が示唆された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:54:17 GMT)
Unveiling Provider Bias in Large Language Models for Code Generation [34.4] 大規模言語モデル(LLM)が新しいレコメンデーションエンジンとして登場した。
我々の研究は、LSMにおける新たなプロバイダバイアス、すなわち明示的な入力プロンプトを伴わないことを明らかにする。
このバイアスは、市場のダイナミクスと社会的均衡に重大な影響を及ぼす。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:21:27 GMT)
PastNet: Introducing Physical Inductive Biases for Spatio-temporal Video Prediction [33.5] 我々は、高品質なビデオ予測のためのアンダーラインPhysics-underlineassisted underlineS-underlinetmporal underlineNetwork(PastNet)という新しいフレームワークを導入する。
PastNetの中核はフーリエ領域のスペクトル畳み込み演算子であり、基礎となる物理法則からの帰納バイアスを効率的に導入する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:59:17 GMT)
PSReg: Prior-guided Sparse Mixture of Experts for Point Cloud Registration [33.4] 本研究では,SMoEをベースとした事前誘導型登録手法を提案する。
提案手法の有効性を実証し,3DMatch/3DLoMatchベンチマークで最先端の登録リコール(95.7%/79.3%)を達成した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:30:22 GMT)
GameFactory: Creating New Games with Generative Interactive Videos [33.0] 本稿では,ゲームビデオ生成におけるシーンの一般化を探求するフレームワークであるGameFactoryを紹介する。
オープンドメインの一般化を保ちつつ,アクション制御からゲームスタイルの学習を分離する多段階学習戦略を提案する。
フレームワークを拡張して、自動回帰アクション制御可能なゲームビデオ生成を可能にし、無制限のインタラクティブなゲームビデオの作成を可能にします。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:57:21 GMT)
A Multi-Modal AI Copilot for Single-Cell Analysis with Instruction Following [32.7] 大きな言語モデルは複雑な自然言語命令の解釈に優れており、幅広いタスクを実行できる。
InstructCellは、自然言語を媒体として活用し、より直接的で柔軟な単細胞分析を行うマルチモーダルAIコラボロである。
InstructCellは、細胞型アノテーション、条件付き擬似細胞生成、薬物感受性予測を用いた単純な自然言語コマンドなどの重要なタスクを研究者に実行させる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:12:19 GMT)
TextureDiffusion: Target Prompt Disentangled Editing for Various Texture Transfer [32.5] 各種テクスチャ転送に適用可能なチューニング不要な画像編集手法であるTextureDiffusionを提案する。
テクスチャ拡散は様々なテクスチャを高い構造と背景保存で調和的に伝達できることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:44:01 GMT)
Correlation-Aware Graph Convolutional Networks for Multi-Label Node Classification [32.5] マルチラベルノード分類のための相関対応グラフ畳み込みネットワーク(CorGCN)を提案する。
CorGCNは新しい相関対応グラフ分解モジュールを導入することで、ラベルごとにリッチなラベル関連情報を含むグラフを学習できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:34:26 GMT)
Benchmarking Graph Representations and Graph Neural Networks for Multivariate Time Series Classification [32.1] 本稿では,広く使用されている3つのノード特徴定義戦略,4つのエッジ特徴学習戦略,5つのGNNアーキテクチャの有効性を検証した最初のベンチマークを示す。
実験の結果,ノード特徴がMTSC性能に著しく影響を及ぼすのに対し,エッジ特徴の可視化は,適応的エッジ学習が他のエッジ特徴学習法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:41:15 GMT)
Multiple-Input Variational Auto-Encoder for Anomaly Detection in Heterogeneous Data [31.7] 異常検出は、分類におけるAIアプリケーション、サイバーセキュリティにおける侵入/脅威検出などにおいて重要な役割を果たす。
本稿では,この問題に対処するために,Multiple-Input Auto-Encoder for AD (MIAEAD) と呼ばれる新しいニューラルネットワークモデルを提案する。
MIAEADは、異常である可能性を示すために、データサンプルの各特徴サブセットに異常スコアを割り当てる。
すべてのサブエンコーダは同時に教師なし学習を用いて訓練され、特徴部分集合の異常スコアを決定する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:25:10 GMT)
Verifying Device Drivers with Pancake [31.4] Pancakeはシステムプログラミングのための命令型言語で、よく定義され、検証しやすいセマンティクスを備えている。
我々は、バイナリがソースコードのセマンティクスを保持することを保証するPancake用のコンパイラを開発する。
そこで我々は,PancakeのVier SMTフロントエンドへの自動翻訳を行い,Ethernet NICの性能検証を行った。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:40:05 GMT)
QGHNN: A quantum graph Hamiltonian neural network [30.6] グラフニューラルネットワーク(GNN)は、複雑な高次元グラフデータによってもたらされる課題に対処する。
量子ニューラルネットワーク(QNN)は、量子並列性の可能性から、魅力的な代替手段を提供する。
本稿では、ノイズの多い中間規模量子コンピュータ上でのグラフ表現と学習を強化する量子グラフハミルトンニューラルネットワーク(QGHNN)を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:15:17 GMT)
MoPE: Mixture of Prompt Experts for Parameter-Efficient and Scalable Multimodal Fusion [29.5] プロンプトエキスパートの混合 (Mixture of Prompt Experts, MOPE) は、標準のプロンプトを分解することで制限を克服するために設計された最初の技術である。
本手法は, トレーニングデータとトレーニング可能なパラメータの総数により, より効果的にスケールできることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:01:17 GMT)
LLaVA-ST: A Multimodal Large Language Model for Fine-Grained Spatial-Temporal Understanding [29.4] LLaVA-STは空間的・時間的マルチモーダル理解のためのMLLMである。
LLaVA-STでは,座標の特別なトークンを視覚空間に埋め込んだLanguage-Aligned Positional Embeddingを提案する。
また、時間分解能と空間分解能の特徴圧縮を2つの異なるポイント・ツー・リージョンのアテンション処理ストリームに分離する空間-テンポラル・パッカーを設計する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:58:12 GMT)
Gaussian Eigen Models for Human Heads [28.5] 現在のパーソナライズされたニューラルヘッドアバターはトレードオフに直面している。軽量モデルは詳細とリアリズムを欠いているが、高品質でアニマタブルなアバターは計算資源がかなり必要である。
本稿では,高品質で軽量で制御しやすい頭部アバターを提供するガウス固有モデル(GEM)を紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:20:45 GMT)
An in-depth study of the power function $x^{q+2}$ over the finite field $\mathbb{F}_{q^2}$: the differential, boomerang, and Walsh spectra, with an application to coding theory [28.5] 有限体 $mathbbF_q2$ は$q2$ 要素からなる。
まず、いくつかの重要な単純化を取り入れた電力関数 $f(x) = xq+2$ on $mathbbF_q2$ の微分スペクトルを決定する方法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:09:20 GMT)
AdaptVC: High Quality Voice Conversion with Adaptive Learning [28.3] 鍵となる課題は、ソースと音声スタイルから絡み合った言語コンテンツを抽出することである。
本稿では,アダプタを用いた自己教師型音声特徴の調整により,コンテンツと話者の特徴のアンタングル化を成功させる。
アダプタは、リッチな自己教師付き特徴からニュアンス特徴を動的に符号化するように訓練され、デコーダはそれらを融合して参照に正確に類似した音声を生成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:36:42 GMT)
Decoupled Functional Central Limit Theorems for Two-Time-Scale Stochastic Approximation [28.1] 2回のスケール近似では、異なるステップサイズで異なるレートで2つのイテレーションが更新され、それぞれが他方に影響を与える。
以前の研究では、これらの更新に対する誤差項の収束率はそれぞれのステップサイズにのみ依存していることが示されており、これは分離収束と呼ばれる性質である。
我々の研究はこのギャップを埋めるために、2段階のSAに対して分離された機能中心極限定理を確立し、その挙動をより正確に評価する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:16:27 GMT)
Schrödinger cat states of a nuclear spin qudit in silicon [27.7] シリコンナノエレクトロニクスデバイスに埋め込まれたアンチモン原子のスピン-7/2核を用いたシュロディンガー猫状態の生成と操作を実証した。
本研究は、量子情報処理および量子誤り訂正における応用の前提条件である、非古典的資源状態の準備と制御能力を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:08:11 GMT)
Towards Federated Graph Learning in One-shot Communication [27.3] Federated Graph Learning(FGL)は、分散プライベートグラフ間のデータサイロを壊すための有望なパラダイムとして登場した。
ワンショットフェデレートラーニング(OFL)は1ラウンドでのコラボレーションを可能にするが、既存のOFLメソッドはグラフデータには有効ではない。
本稿では,ノード分類のための最初の$textbfO-pFGL$メソッド(textbfO-pFGL$)を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:36:51 GMT)
Make-A-Character 2: Animatable 3D Character Generation From a Single Image [27.3] Make-A-Character 2は、1枚の肖像画から高品質な3D文字を生成する高度なシステムである。
画像から3D文字を生成するのに2分もかからない。
これらの技術は、私たちの会話型AIアバター製品に統合されました。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:21:31 GMT)
Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models [27.2] 長文言語モデル(LCLM)は知識ベース全体を処理し、直接検索と推論を行うことができる。
LOFTのような既存のベンチマークは、過度に単純化されたコンテキストを提供することでLCLMのパフォーマンスを過大評価することが多い。
ICR2はLCLMをより現実的なシナリオで評価するベンチマークである。
次に, LCLMの性能向上のための3つの手法を提案する。(1) 検索-then-generate fine-tuning, (2) 注意頭を用いてデコード中の長いコンテキストをフィルタリング・復調する検索-attention-probing, (3) 生成ヘッドと併用した共同検索ヘッドトレーニング。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:38:33 GMT)
Uncovering Bias in Foundation Models: Impact, Testing, Harm, and Mitigation [26.7] Bias in Foundation Models (FMs) は、医療、教育、金融といった分野における公平性と株式に対する重大な課題を提起する。
これらのバイアスは、トレーニングデータにおけるステレオタイプと社会的不平等の過剰表現に根ざし、現実世界の差別を悪化させ、有害なステレオタイプを強化し、AIシステムにおけるゼロ信頼を補強する。
本稿では,意味論的に設計されたプローブを用いて,明示的かつ暗黙的なバイアスを検出するシステムテスト手法であるTriProTestingを紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:06:37 GMT)
VENOM: Text-driven Unrestricted Adversarial Example Generation with Diffusion Models [26.5] VENOMは拡散モデルによる高品質な非制限逆例生成のための最初のフレームワークである。
本研究では,適応的逆方向誘導戦略を運動量付きで導入し,生成した逆方向の例が自然画像の逆方向の分布$p(x)$と一致することを保証する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:12:20 GMT)
Towards an End-to-End (E2E) Adversarial Learning and Application in the Physical World [26.5] 本稿では,デジタルドメインからの逆学習をプロジェクタを用いて物理ドメインに変換する,新しいエンドツーエンド(E2E)フレームワークであるPAPLAフレームワークを提案する。
実験室の環境や現実的な屋外環境など,様々なシナリオでPAPLAを評価した。
以上の結果から,物理領域におけるE2E対角学習は伝達可能性の問題を取り除き,物体検出装置による回避を確実にすることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:10:02 GMT)
Diffusion Adversarial Post-Training for One-Step Video Generation [26.1] 本稿では,1ステップビデオ生成のための拡散事前学習後の実データに対して,APT(Adversarial Post-Training)を提案する。
我々のモデルは1ステップで1024px画像を生成することができ、最先端の手法に匹敵する品質を実現することができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:51:48 GMT)
RMem: Restricted Memory Banks Improve Video Object Segmentation [26.1] ビデオオブジェクトセグメンテーション(VOS)ベンチマークは、挑戦的なシナリオへと進化している。
我々は、メモリバンクのサイズを制限するという、単純だが見過ごされた戦略を再考する。
メモリバンクを限られた数の必須フレームに制限することにより、VOSの精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:46:01 GMT)
Tag&Tab: Pretraining Data Detection in Large Language Models Using Keyword-Based Membership Inference Attack [26.1] 大規模言語モデル(LLM)はデジタルタスク支援ツールとして欠かせないものとなっている。
LLMにおける事前学習データの検出に関する最近の研究は、主に文レベルまたは段落レベルのメンバシップ推論攻撃に焦点を当てている。
LLMプレトレーニングの一部として使用されているデータを検出する新しい手法であるTag&Tabを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:55:37 GMT)
ReARTeR: Retrieval-Augmented Reasoning with Trustworthy Process Rewarding [25.3] ReARTeR(Retrieval-Augmented Reasoning)を提案する。
ReARTeRは、ポストトレーニングとテストタイムスケーリングを通じて、RAGシステムの推論能力を向上する。
マルチステップ推論ベンチマークの実験結果から,大幅な改善が示された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:56:26 GMT)
EEG-ReMinD: Enhancing Neurodegenerative EEG Decoding through Self-Supervised State Reconstruction-Primed Riemannian Dynamics [24.6] 脳波復号法(EEG-ReMinD)と呼ばれる新しい脳波復号法を提案する。
EEG-ReMinDは教師付き学習への依存を緩和し、固有の幾何学的特徴を統合する。
EEGデータの破損を効率的に処理し、ラベルへの依存を減らす。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:19:40 GMT)
A Random Matrix Approach to Low-Multilinear-Rank Tensor Approximation [24.6] 本研究では,データテンソルの展開のスペクトルの多次元的挙動を特徴付け,信号の主方向の検出性を決定する関連信号-雑音比を示す。
その結果,非自明な状態下でのマルチリニアSVD (MLSVD) の再構成性能を正確に予測することができた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:32:56 GMT)
HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models [24.5] 我々は,ヒトの長期記憶の海馬索引付け理論に触発された新しい検索フレームワークであるHippoRAGを紹介する。
その結果,本手法は最先端の手法を最大20%向上させることができた。
提案手法は,既存の手法に及ばない新たなシナリオに対処することができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:17:49 GMT)
Perception Matters: Enhancing Embodied AI with Uncertainty-Aware Semantic Segmentation [24.3] Embodied AIは、探索されていない環境での行動に大きな進歩を遂げた。
現在の探索法は主に、日付付き知覚モデルに焦点をあて、時間的集約を無視し、地上の真実から試験時にノイズの多い知覚へ直接移行する。
本研究は,アグリゲーション間の知覚確率と不確かさを校正し,決定を下すことによって,同定された問題に対処する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:27:40 GMT)
Click Without Compromise: Online Advertising Measurement via Per User Differential Privacy [24.0] 本稿では,オンライン広告測定結果を対象とした新しいユーザレベル差分プライバシー保護スキームであるAdsBPCを紹介する。
AdsBPCは、広告測定に適用された既存のストリーミングDPメカニズムよりも33%から95%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:36:22 GMT)
FaVoR: Features via Voxel Rendering for Camera Relocalization [23.8] カメラ再ローカライズ手法は、高密度画像アライメントから、クエリ画像からの直接カメラポーズ回帰まで様々である。
本稿では,世界規模で疎密だが局所的に密集した2次元特徴の3次元表現を活用する新しい手法を提案する。
一連のフレーム上でのランドマークの追跡と三角測量により、追跡中に観察された画像パッチ記述子をレンダリングするために最適化されたスパースボクセルマップを構築する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:33:46 GMT)
Unexploited Information Value in Human-AI Collaboration [23.4] ヒューマンAIチームのパフォーマンスを改善する方法は、各エージェントがどのような情報や戦略を採用しているかを知らなければ、しばしば明確ではない。
本稿では,人間とAIの協調関係を分析するための統計的決定理論に基づくモデルを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:08:13 GMT)
CVaR-Based Variational Quantum Optimization for User Association in Handoff-Aware Vehicular Networks [23.1] 本稿では、車両ネットワーク(VNet)における一般化代入問題(GAP)に対処するための、CVaRに基づく変動量子固有解法(VQE)フレームワークを提案する。
提案手法は, 目的と制約固有のペナルティのバランスを保ち, 解の質と安定性を向上させるために, 調整されたコスト関数を統合するハイブリッド量子古典構造を利用する。
本稿では,この枠組みを,ディープニューラルネットワーク(DNN)アプローチと比較して23.5%改善したVNetのユーザ連想問題に適用する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:21:06 GMT)
Towards A Hybrid Quantum Differential Privacy [22.6] 量子微分プライバシー(QDP)は、固有の量子ノイズを利用してプライバシーを保護する。
本稿では,QDPに有用なノイズタイプを特定し,理論的モデルを超えた実用的な実装の必要性を強調した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:13:37 GMT)
UrbanIR: Large-Scale Urban Scene Inverse Rendering from a Single Video [22.6] UrbanIRは、1つのビデオで様々な照明条件下でのシーンのリアルで自由視点のレンダリングを可能にする新しい逆グラフィックモデルである。
形状、アルベド、可視性、そして太陽と空の照明は、車載カメラなど、幅広いベースラインのビデオから正確に推測する。
UrbanIRはこれらの問題に、逆グラフィック推論とレンダリングアーティファクトのエラーを減らす新たな損失で対処する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:05:06 GMT)
MiniRAG: Towards Extremely Simple Retrieval-Augmented Generation [22.5] MiniRAG(ミニラグ)は、極端に単純で効率的に設計された新規なレトリーバル拡張世代(RAG)システムである。
MiniRAGは,(1)テキストチャンクと名前付きエンティティを統一構造に結合し,複雑な意味理解への依存を軽減し,(2)高度な言語能力を必要としない効率的な知識発見のためにグラフ構造を利用する軽量なトポロジ強化検索手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:03:56 GMT)
Analyzing Infrastructure LiDAR Placement with Realistic LiDAR Simulation Library [22.1] インフラセンサは、V2X(Vine-to-Everything)協調知覚において重要な役割を果たす。
インフラセンサの最適配置を見つける方法はめったに研究されていない。
本研究では,現実的なシミュレーション環境下で,インフラセンサの最適設置位置を効率よく,効果的に見つけることができるパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:55:17 GMT)
MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models [22.0] マルチモーダル統合によるジェスチャーの多様性とリズムを向上させるMambaTalkを紹介する。
我々の手法は最先端のモデルの性能と一致するか超えている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:59:06 GMT)
Rate-In: Information-Driven Adaptive Dropout Rates for Improved Inference-Time Uncertainty Estimation [22.0] 本稿では,各レイヤの特徴マップにおけるドロップアウトによって引き起こされる情報損失を定量化することにより,推論中のドロップアウト率を動的に調整するアルゴリズムであるRate-Inを提案する。
特徴マップにおける機能的情報損失を定量化することにより、様々な医用画像タスクや建築構成の知覚品質を維持するために、ドロップアウト率を適応的に調整する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:51:43 GMT)
Generating Less Certain Adversarial Examples Improves Robust Generalization [22.0] 本稿では,対人訓練における頑健なオーバーフィット現象を再考する。
我々は、敵の例を予測する際の過信が潜在的な原因であると主張している。
本稿では, モデルが予測するロジットの分散を, 逆数例で捉えた逆数確かさの形式的定義を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:42:51 GMT)
MassSpecGym: A benchmark for the discovery and identification of molecules [21.5] 我々はMS/MSデータから分子の発見と同定のための最初の包括的なベンチマークであるMassSpecGymを提案する。
当社のベンチマークは,MS/MSスペクトルをラベル付けした高品質な画像集としては最大である。
これは、3つのMS/MSアノテーションの課題を定義している: textitde novo 分子構造の生成、分子検索、スペクトルシミュレーションである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:08:40 GMT)
Towards Best Practices for Open Datasets for LLM Training [21.4] 多くのAI企業は、著作権所有者の許可なく、データ上で大きな言語モデル(LLM)をトレーニングしています。
創造的なプロデューサーは、いくつかの著名な著作権訴訟を引き起こした。
データ情報を制限するこの傾向は、透明性、説明責任、革新を妨げることによって害をもたらす。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:18:05 GMT)
KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model [21.4] KaLM-Embeddingは、よりクリーンで、より多様な、ドメイン固有のトレーニングデータを活用する一般的な多言語埋め込みモデルである。
我々のモデルは、性能を向上させることが証明された重要な技術で訓練されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:19:52 GMT)
Enhanced SPS Velocity-adaptive Scheme: Access Fariness in 5G NR V2I Networks [21.0] V2I技術は、車両と道路インフラ間の情報交換を可能にする。
本稿では、車両ネットワークの最適化問題を定式化する。
5G NR V2Iモード2のSPS機構における選択ウィンドウを調整し,多目的最適化手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:42:51 GMT)
Symmetry-Aware Generative Modeling through Learned Canonicalization [21.0] 対称密度の生成モデリングは、薬物発見から物理シミュレーションまで、AIの科学への応用範囲がある。
我々は、軌道毎の1つの代表要素のみが学習されるように、学習された密度のスライスをモデル化することを提案する。
分子モデルに関する予備実験の結果は有望であり, 改良された試料品質と高速な推論時間を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:08:15 GMT)
GRAPHMOE: Amplifying Cognitive Depth of Mixture-of-Experts Network via Introducing Self-Rethinking Mechanism [20.8] GraphMOE は Pseudo GraphMoE ネットワーク上に構築された自己再考機構により,言語モデルの認知深度を増大させる新しい手法である。
ローランド適応技術(LoRA)を用いて GraphMOE アーキテクチャを実装し,様々なベンチマークデータセットに対して広範な実験を行う。
実験の結果, GraphMOEは他のLoRAモデルよりも優れ,SOTA(State-of-the-art)性能を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:59:51 GMT)
Impatient Bandits: Optimizing for the Long-Term Without Delay [20.8] 本稿では,遅延報酬を伴う盗賊問題として定式化したコンテンツ探索課題について検討する。
これまでに得られたすべての情報を組み込んだ遅延報酬の予測モデルを開発した。
我々は,長期的成功に対応するコンテンツの識別を素早く学習するバンディットアルゴリズムを考案した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:28:26 GMT)
CWEval: Outcome-driven Evaluation on Functionality and Security of LLM Code Generation [20.7] 大規模言語モデル(LLM)は、コード記述の生成や支援によって、開発者を大いに助けている。
機能的に正しいコードの脆弱性を検出することは、特にセキュリティ知識が限られている開発者にとっては、より難しい。
我々は、LLMによるセキュアコード生成の評価を強化するために、新しい結果駆動型評価フレームワークであるCWEvalを紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:27:01 GMT)
DIDLM: A SLAM Dataset for Difficult Scenarios Featuring Infrared, Depth Cameras, LIDAR, 4D Radar, and Others under Adverse Weather, Low Light Conditions, and Rough Roads [20.6] 積雪天候,雨天,夜間条件,スピードバンプ,荒地など,困難なシナリオをカバーするマルチセンサデータセットを提案する。
このデータセットには、4Dミリ波レーダー、赤外線カメラ、深度カメラなどの極端な状況に利用されないセンサーと、3D LiDAR、RGBカメラ、GPS、IMUが含まれる。
自律走行と地上ロボットの両方のアプリケーションをサポートし、構造化された地形と半構造化された地形をカバーする信頼性の高いGPS/INS地上真実データを提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:22:35 GMT)
Text-Diffusion Red-Teaming of Large Language Models: Unveiling Harmful Behaviors with Proximity Constraints [20.5] テキスト拡散モデルにインスパイアされたブラックボックスのレッドチーム方式: 監査とレッドチームのための拡散(DART)について紹介する。
DARTは、それを埋め込み空間に摂動させ、導入した変更量を直接制御することで参照プロンプトを変更する。
以上の結果より,DARTは基準プロンプトに近接して有害な入力を発見できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:32:01 GMT)
Continual Learning with Embedding Layer Surgery and Task-wise Beam Search using Whisper [20.1] 現在のASRモデルは世界の言語の一部しかサポートしていない。
新しい言語ごとに異なるトークン埋め込みのコピーを作成できる埋め込み層手術を提案する。
その結果,経験リプレイと比較して,事前学習した言語の平均 WER (AWER) は14.2% から11.9% に減少した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:33:40 GMT)
Relaxed Rotational Equivariance via $G$-Biases in Vision [19.8] 群同変畳み込み(GConv)は、元のデータから回転同値を取ることができる。
しかし、実世界のデータの提示や分布は、しばしば厳密な回転同値に適合する。
本稿では,G$-Biasesと呼ばれる学習可能なバイアスの集合を利用して,この問題に対処する,単純かつ高効率な手法を提案する。
実験により,提案手法は既存のGConv法と比較して,2次元オブジェクト検出タスクと分類作業の両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:35:55 GMT)
Comprehensive Metapath-based Heterogeneous Graph Transformer for Gene-Disease Association Prediction [19.8] Metapath-based heterogeneous graph Transformer (COMET) を用いた遺伝子解析
本手法は, 最先端手法と比較して, 優れたロバスト性を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:41:18 GMT)
Pareto Set Learning for Multi-Objective Reinforcement Learning [19.7] MORL(Multi-Objective RL)のための分解ベースフレームワークを提案する。
PSL-MORLは、ハイパーネットワークの生成能力を利用して、各分解重量に対するポリシーネットワークのパラメータを生成する。
PSL-MORL は高体積, 疎度指標において最先端の MORL 法より有意に優れていた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:08:28 GMT)
Securing Distributed Network Digital Twin Systems Against Model Poisoning Attacks [19.7] ディジタルツイン(DT)は、リアルタイム監視、予測、意思決定能力の向上を具現化する。
本研究では,分散ネットワークDTシステムにおけるセキュリティ上の課題について検討し,その後のネットワークアプリケーションの信頼性を損なう可能性がある。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:02:24 GMT)
Exploring Gradient Subspaces: Addressing and Overcoming LoRA's Limitations in Federated Fine-Tuning of Large Language Models [19.5] 本稿ではLow-Rank Adaptation (LoRA)を用いたFLフレームワークの収束と性能保証を批判的に分析する。
直接重み付けはLoRAベースの戦略よりも優れており、微調整モデルでは優れた性能が得られることを示す。
以上の結果から,直接重み付けと併用したGaLoreの方が,FlexLoRAやFFA-LoRAといったフェデレートされたLoRA法よりも,テキストや画像のモダリティが優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:25:54 GMT)
Don't Command, Cultivate: An Exploratory Study of System-2 Alignment [19.5] o1システムカードは、o1モデルをOpenAIの中でもっとも堅牢なものとして識別する。
モデル安全性に及ぼすシステム2思考パターンの影響について検討する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:05:10 GMT)
Experimentally Probing Non-Hermitian Spectral Transition and Eigenstate Skewness [19.5] 非エルミート系(NH)は複雑な値の固有エネルギーから生じる複雑なスペクトルトポロジーを示す。
複素数値エネルギースペクトルと左右固有状態の両方の直接測定と評価を可能にするグリーン関数に基づく手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:40:05 GMT)
Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise [19.4] 本研究では,構造付き潜時雑音サンプリングによる動画拡散モデルの構築を行う。
本稿では,ランダムな時空間のガウス性と相関した雑音を置き換え,リアルタイムに動作可能な新しいノイズワープアルゴリズムを提案する。
提案アルゴリズムの効率性により,ワープノイズを最小限のオーバーヘッドで使用することで,最新の映像拡散ベースモデルを微調整することができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:59:10 GMT)
Maximizing Uncertainty for Federated learning via Bayesian Optimisation-based Model Poisoning [19.4] 悪意のあるユーザは、悪意のあるモデルパラメータを作成して、予測と生成能力を損なうことができる。
我々は,グローバルモデル出力の不確実性を最大化することを目的とした,Delphiという新しいモデル中毒攻撃手法を提案する。
数値的な結果から,Delphi-BOはDelphi-LSTRよりも高い不確実性を誘導することが示された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:46:41 GMT)
TreeKV: Smooth Key-Value Cache Compression with Tree Structures [19.1] TreeKVは、スムーズなキャッシュ圧縮のためにツリー構造を利用するトレーニング不要の手法である。
PG19とOpenWebText2の言語モデリングタスクのベースラインモデルを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:06:33 GMT)
Empathetic Conversational Agents: Utilizing Neural and Physiological Signals for Enhanced Empathetic Interactions [18.9] 会話エージェント(CA)は、テキストベースのチャットボットから豊かな感情表現が可能な共感的デジタル人間(DH)へと進化することで、人間とコンピュータの相互作用に革命をもたらしている。
本稿では,脳神経信号と生理信号とをCAの知覚モジュールに統合し,共感的相互作用を増強する方法について検討する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:19:37 GMT)
CriSPO: Multi-Aspect Critique-Suggestion-guided Automatic Prompt Optimization for Text Generation [18.4] 本稿では,CriSPO(Prompt Optimization)アプローチを提案する。
CriSPO はコアコンポーネントとして critique-suggestion モジュールを導入している。
このモジュールは自然にアスペクトを発見し、これらのアスペクト間で生成された参照テキストを比較し、即時修正のための実行可能な提案を提供する。
マルチメトリック最適化によりCrisPOをさらに改善するため、複数のメトリクスにわたるタスクプロンプトのパフォーマンスを向上させるために、自動サフィックスチューニング(AST)拡張を導入する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:20:04 GMT)
ORFormer: Occlusion-Robust Transformer for Accurate Facial Landmark Detection [18.3] ORFormerは、見えない領域を検出し、見えない部分から欠落した機能を回復することができる。
本手法は,下流FLDタスクに対して高品質なヒートマップをコンパイルする。
得られた熱マップを既存のFLD手法に組み込むことで,挑戦的なデータセット上での芸術的状況に対して好意的に機能する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:48:32 GMT)
Black-box Optimization with Simultaneous Statistical Inference for Optimal Performance [18.1] ブラックボックス最適化は複雑なシステム管理における意思決定においてしばしば発生する。
我々のゴールは、最適化と統計的推測の2つのタスクをオンライン方式で最適性能に対処することである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:37:09 GMT)
To Analyze and Regulate Human-in-the-loop Learning for Congestion Games [18.0] 混雑ゲームでは、利己的なユーザは最短経路に群がり、ソーシャルプランナーは情報や支払いインセンティブを通じて、そのような利己的なルーティングを規制する仕組みを設計する。
我々は,到着時パスを過度に発見しようとする場合にのみ最新の交通情報を公開すると同時に,過度に発見したい場合にその情報を隠蔽する,新しい選択情報開示機構を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:46:44 GMT)
NOMTO: Neural Operator-based symbolic Model approximaTion and discOvery [17.5] 本稿では,ニューラル演算子に基づく記号モデル近似法とdisOvery(NOMTO)法を提案する。
我々はNOMTOが特異点、特殊関数、微分を持つ基本関数を含む記号表現をうまく識別できることを実証した。
また、NOMTOは2階非線形偏微分方程式を正確に再発見できることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:55:48 GMT)
Personalized LLM Response Generation with Parameterized Memory Injection [17.5] 大規模言語モデル(LLM)は、自然言語の理解と生成に優れた能力を発揮している。
パーソナライズされたLSM応答生成は、医療などの重要な分野の個人に多大な利益をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:30:50 GMT)
Towards Lightweight Time Series Forecasting: a Patch-wise Transformer with Weak Data Enriching [17.5] LiPFormerは、弱いデータを豊かにする軽量なパッチワイドトランスである。
パラメータスケール、トレーニング時間、GPUメモリ使用量を大幅に削減しつつ、最先端の手法よりも精度が高い。
エッジデバイスへのデプロイにより、LiPFormerは従来のTransformerに比べて1/3の推論時間しかかからないことが明らかになった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:35:03 GMT)
DehazeGS: Seeing Through Fog with 3D Gaussian Splatting [17.1] DehazeGSは,霧のない背景をメディアから分解・レンダリングできる手法である。
合成と実世界の霧のデータセットの実験は、DehazeGSが最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:52:51 GMT)
Physically Guided Deep Unsupervised Inversion for 1D Magnetotelluric Models [16.9] 本稿では,物理で導かれる新しい深部非教師付き逆変換アルゴリズムを提案し,MTモデルについて検討する。
本手法では,観測データと各モデルのデータセットをトレーニング中にラベルとして使用する代わりに,コスト関数の最小化を物理的に導く,微分可能なモデリング演算子を用いる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:52:40 GMT)
Snake Learning: A Communication- and Computation-Efficient Distributed Learning Framework for 6G [16.4] 本稿では,6Gネットワークのための費用効率の高い分散学習フレームワークであるSnake Learningを紹介する。
具体的には、Snake Learningは6Gネットワークにおけるノード間計算能力とローカルデータ分散の不均一性を尊重し、個々のノード上でモデルレイヤの指定された部分を逐次訓練する。
このレイヤ・バイ・レイヤのセルペンチン更新機構は、モデルトレーニングフェーズにおけるストレージ、メモリ、通信の要求を大幅に削減する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:26:51 GMT)
Religious Bias Landscape in Language and Text-to-Image Models: Analysis, Detection, and Debiasing Strategies [16.2] 言語モデルの普及は、言語モデル固有のバイアスに対する批判的な検査の必要性を強調している。
本研究では,言語モデルとテキスト・ツー・イメージ生成モデルの両方において,宗教的バイアスを系統的に研究する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:10:08 GMT)
Energy-Efficient Split Learning for Fine-Tuning Large Language Models in Edge Networks [15.7] 大規模言語モデルを微調整するためのエネルギー効率の高い分割学習フレームワークを提案する。
提案手法は,ベンチマークと比較すると,平均トレーニング遅延とサーバのエネルギー消費を70.8%,53.1%削減する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:27:10 GMT)
Optimal Policy Adaptation under Covariate Shift [15.7] 目的領域における最適ポリシーを2つのデータセットを用いて学習するための原則的アプローチを提案する。
我々は、所定の政策によって引き起こされた報酬に対する識別可能性の仮定を導出する。
そして、推定報酬を最適化することで最適な政策を学ぶ。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:33:02 GMT)
Do generative video models learn physical principles from watching videos? [15.5] AIビデオ生成は、品質とリアリズムが急速に進歩し、革命を遂げている。
ビデオモデルは物理の法則を発見する「世界モデル」を学習するのか、それとも、現実の物理原理を理解せずに視覚的リアリズムを達成するための高度なピクセル予測器なのか?
我々は,様々な物理原理の深い理解を得ることによってのみ解決できるベンチマークデータセットであるPhysical-IQを開発することで,この問題に対処する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:59:37 GMT)
On the Geometry of Deep Learning [15.3] 本稿では,深層ネットワークのアフィンスプラインマッピングの幾何特性の解明について概説する。
ご覧のように、アフィンスプライン接続と幾何学的視点は、ディープネットワークの内部構造を閲覧、分析、改善するための強力なポータルを提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:42:28 GMT)
SEAL: Speaker Error Correction using Acoustic-conditioned Large Language Models [15.1] 音響ダイアリザからLLMへよりきめ細かな情報を提供するための新しい音響条件付け手法を提案する。
提案手法は,Fisher,Callhome,RT03-CTSデータセットの話者誤り率を24~43%削減する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:24:12 GMT)
A Comparative Study of Full Apps and Lite Apps for Android [15.0] 本研究では,ライトアプリとフルアプリの類似点と相違点について,様々な観点から検討する。
われわれの調査結果は、既存の定型アプリが意図した目標を達成できないことを示唆している。
私たちの研究は、ライトアプリに関連する潜在的なセキュリティリスクも明らかにしています。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:16:18 GMT)
Enhancing Automated Interpretability with Output-Centric Feature Descriptions [14.6] 本稿では,特徴記述を自動生成する効率的な出力中心手法を提案する。
我々の記述は、入力中心の記述よりもモデル出力に対する特徴の因果効果をよりよく捉えている。
以前は"デッド"と思われていた特徴を活性化するインプットを見つけるために,出力中心の記述が利用できることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:53:00 GMT)
Object-Centric 2D Gaussian Splatting: Background Removal and Occlusion-Aware Pruning for Compact Object Models [14.6] 現在のガウシアン・スプレイティング・アプローチはシーン全体を再構築するのに有効であるが、特定の対象をターゲットするオプションがない。
本研究では,対象のマスクを応用して対象の再構成を可能にし,オブジェクト中心モデルを実現する手法を提案する。
提案手法は,オブジェクト中心のガウス表現とメッシュ表現を最大96%,学習速度を最大71%向上するコンパクトオブジェクトモデルを再構成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:56:31 GMT)
Energy Backdoor Attack to Deep Neural Networks [14.4] ディープラーニング(DL)は計算の複雑さとエネルギー使用量を増やし、エネルギー効率のよいエッジとモバイルデプロイメントにアプリケーション固有の集積回路(ASIC)を採用する。
最近の研究は、これらの加速器のエネルギー攻撃に対する脆弱性を実証している。
本稿では,疎結合型加速器で動作するディープニューラルネットワーク(DNN)に対する革新的なエネルギーバックドア攻撃を設計する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:26:18 GMT)
Selective Attention Merging for low resource tasks: A case study of Child ASR [14.2] 音声基礎モデル(SFM)は様々な音声タスクに優れるが、低リソースタスクのパフォーマンスは、限られた事前学習データによって妨げられる。
本稿では,Selective Attention (SA) Mergeというタスクベクトルを選択的にマージし,低リソースタスクにおけるSFM性能を向上させる手法を提案する。
MySTデータベース上での実験では、単語の単語誤り率を最大14%削減し、既存のモデルのマージやデータ拡張技術よりも優れていた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:27:48 GMT)
Combining imaging and shape features for prediction tasks of Alzheimer's disease classification and brain age regression [14.1] 脳年齢予測とアルツハイマー病分類の臨床的タスクにおいてMRIから抽出した画像と形状の特徴を組み合わせることを検討した。
提案モデルでは,ResNetで抽出した画像埋め込みと,ベスポークグラフニューラルネットワークからの形状埋め込みを融合する。
両タスクにおける予測性能の改善を観察し,分類においてかなりの利益を得た。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:38:18 GMT)
LeapVAD: A Leap in Autonomous Driving via Cognitive Perception and Dual-Process Thinking [13.9] LeapVADは、運転決定に影響を及ぼす重要な交通要素を特定し、焦点を合わせるための人間中心のメカニズムを実装している。
システムは、論理的推論を通じて駆動経験を蓄積する分析プロセス(System-II)と、微調整と少数ショット学習によってこの知識を洗練するヒューリスティックプロセス(System-I)から構成される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:49:45 GMT)
Counterfactually Fair Reinforcement Learning via Sequential Data Preprocessing [13.3] 対実公正(CF)は、因果推論に基づく有望な統計ツールであり、公正を定式化し研究する。
我々は,最適なCFポリシーを理論的に特徴づけ,その定常性を証明し,最適なCFポリシーの探索を大幅に単純化する。
我々は、不公平を防ぎ、シミュレーションを通じて最適な価値を得るための政策学習アプローチを証明し、検証する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:42:08 GMT)
A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation [13.1] 絶対距離の予測を伴う計量深度推定は、特定の課題を提起する。
我々は、現在最先端のDepthAnythingV2基盤モデルを用いて、5つの異なる不確実性定量化手法を融合する。
ガウス陰性対数損失(GNLL)による微調整は特に有望なアプローチである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:13:00 GMT)
SkipClick: Combining Quick Responses and Low-Level Features for Interactive Segmentation in Winter Sports Contexts [13.0] 冬季スポーツにおける対話型セグメンテーションのための新しいアーキテクチャを提案する。
我々のシステムはHQSeg-44kデータセットに適用した場合、NoC@90が6.00、NoC@95が9.89の最先端結果を提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:24:27 GMT)
FairTTTS: A Tree Test Time Simulation Method for Fairness-Aware Classification [12.6] アルゴリズムによる意思決定は多くの領域で深く浸透しているが、機械学習モデルのバイアスは依然として差別的な結果をもたらす。
木試験時間シミュレーション(TTTS)法にインスパイアされた新しい後処理バイアス緩和法であるFairTTTSを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:29:36 GMT)
Synthesis and Analysis of Data as Probability Measures with Entropy-Regularized Optimal Transport [12.6] エントロピー規則化ワッサースタイン2コストとその非バイアスバージョンであるシンクホーン発散を用いた確率測定の合成と解析について検討する。
合成問題は、これらのコストに関して、$m$次元の単純集合に属する係数のセットを与えられた$m$参照測度をバリセンタの計算によって構成する。
解析問題は、ワッサーシュタイン-2距離における最も近いバリセンタの係数を、与えられた測度$mu$まで求めることである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:17:26 GMT)
LLM Reading Tea Leaves: Automatically Evaluating Topic Models with Large Language Models [12.5] トピックモデリングのための新しい評価手法であるWALM(Word Agreement with Language Model)を提案する。
異なる種類のトピックモデルを含む広範な実験により、WALMは人間の判断に合致することを示した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:21:55 GMT)
GDiffRetro: Retrosynthesis Prediction with Dual Graph Enhanced Molecular Representation and Diffusion Generation [12.4] 再合成予測は、標的生成物に作用する反応物質を同定することに焦点を当てる。
GDiffRetroは、元のグラフと対応する二重グラフを統合し、分子構造を表現する。
反応生成のために、GDiffRetroは3次元の条件拡散モデルを使用し、得られたシンソンを完全な反応物質に変換する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:44:38 GMT)
TextureCrop: Enhancing Synthetic Image Detection through Texture-based Cropping [12.3] 合成画像検出(SID)法は、オンラインのAI生成コンテンツを識別するために不可欠である。
我々は,事前学習した任意のSIDモデルにプラグインして,その性能を向上させるイメージ前処理コンポーネントであるTextureCropを提案する。
実験結果は、中央の収穫に比べてAUCが6.1%改善し、リサイズに比べて15%改善したことを示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:02:13 GMT)
Let the Rule Speak: Enhancing In-context Learning Debiasing with Interpretability [12.3] In-context Learningは、多クラステキスト分類において、クラスごとの予測精度が不均衡であることが判明した。
本稿ではファジィルール最適化に基づくデバイアス法であるFuRudを提案する。
FuRudは、ペア級精度バイアス(COBias)を半分以上(56%)削減し、相対的に21%の精度を達成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:42:40 GMT)
Big Batch Bayesian Active Learning by Considering Predictive Probabilities [12.3] 疫学的な不確実性のみを示す予測確率に焦点をあてることを提案する。
その結果、より良いパフォーマンスを実現するだけでなく、評価も高速になり、以前よりも大きなバッチ処理が可能になる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:06:54 GMT)
Modeling Quantum Machine Learning for Genomic Data Analysis [12.2] 量子機械学習(QML)は進化を続け、多様なアプリケーションに新たな機会を開放している。
ゲノム配列データのバイナリ分類におけるQMLモデルの適用性について,様々な特徴マッピング手法を用いて検討・評価する。
ベンチマークゲノミクスデータセット上で実験を行うために,オープンソースで独立したQiskitベースの実装を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:14:26 GMT)
Modeling Feature Maps for Quantum Machine Learning [12.2] 本研究では、様々な量子ノイズモデルがキー量子機械学習(QML)アルゴリズムにどのように影響するかを体系的に評価する。
その結果,QSVCは特に雑音下では頑健であるのに対し,Peg-QSVCとQNNはより感度が高く,特に脱分極および振幅減衰ノイズに対して顕著であることがわかった。
これらの結果は,QMLをゲノム分類に最適化する上で,特徴マップの選択とノイズ緩和戦略の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:45:27 GMT)
A User's Guide to $\texttt{KSig}$: GPU-Accelerated Computation of the Signature Kernel [12.1] シグネチャカーネルは、シーケンシャルおよびテンポラルデータのための正定カーネルである。
この章では、署名カーネルを演算するためのGPUアクセラレーションアルゴリズムを実装した、$textttKSig$、$textttScikit-Learn$互換Pythonパッケージについて短い紹介を行う。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:38:10 GMT)
AfriHate: A Multilingual Collection of Hate Speech and Abusive Language Datasets for African Languages [12.0] AfriHateは15のアフリカの言語におけるヘイトスピーチと虐待的な言語データセットのコレクションである。
AfriHateの各インスタンスは、地元の文化に詳しいネイティブスピーカーによって注釈付けされている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:00:07 GMT)
Text-guided Image Restoration and Semantic Enhancement for Text-to-Image Person Retrieval [11.8] テキスト・ツー・イメージ・パーソナリティ検索(TIPR)の目的は、与えられたテキスト記述に従って特定の人物画像を取得することである。
本稿では,人物画像と対応するテキスト間のきめ細かいインタラクションとアライメントを構築するための新しいTIPRフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:11:11 GMT)
Multiplayer Federated Learning: Reaching Equilibrium with Less Communication [11.8] MpFL(Multiplayer Federated Learning)は、FL環境のクライアントをゲーム理論の文脈でプレイヤーとしてモデル化する新しいフレームワークである。
MpFL内ではPEARL-SGD(Per-Player Local Gradient Descent)を提案する。
理論的にPEARL-SGDを解析し、非局所的な通信に比べて通信の少ない平衡付近に到達することを証明した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:23:14 GMT)
Change Captioning in Remote Sensing: Evolution to SAT-Cap -- A Single-Stage Transformer Approach [11.7] 既存の変更キャプション手法では、高い計算要求とオブジェクト記述の詳細な説明が不十分な2つの大きな課題に直面している。
リモートセンシング変換キャプションのための単一段機能融合を用いたトランスフォーマーモデルに基づくSAT-Capを提案する。
特にSAT-CapはSpatial-Channel Attention, Different-Guided Fusionモジュール, Caption Decoderを統合している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:46:03 GMT)
Audio-visual Deepfake Detection With Local Temporal Inconsistencies [11.7] 本稿では,音声と視覚の微妙な時間的不整合を捉えることを目的とした,音声-視覚的ディープフェイク検出手法を提案する。
アーキテクチャの観点からは、時間距離マップと注意機構が組み合わさって、これらの矛盾を捉えるように設計されている。
本手法はDFDCおよびFakeAVCelebデータセットを用いた最先端手法に対して評価を行った。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:15:10 GMT)
Physics-informed neural networks for phase-resolved data assimilation and prediction of nonlinear ocean waves [11.4] 相分解表面重力波の同化と予測は、海洋科学と工学において重要な課題である。
本稿では,PFT解をニューラルネットワークとしてパラメータ化する新しい解法を提案する。
これにより、ウェーブデータを同化して予測する計算的に安価な方法が提供される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:44:17 GMT)
Knowledge Transfer and Domain Adaptation for Fine-Grained Remote Sensing Image Segmentation [11.3] そこで本研究では,知識指導とドメイン改良を組み合わせたエンド・ツー・エンドの学習パラダイムを導入し,性能向上を図る。
FAM(Feature Alignment Module)とFMM(FeatureModulation Module)の2つの重要なコンポーネントを提示する。
実験により,本手法は草地データセットでは2.57 mIoU,クラウドデータセットでは3.73 mIoUの大幅な改善が得られた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:33:08 GMT)
Scheme to Detect the Strong-to-weak Symmetry Breaking via Randomized Measurements [11.2] 最近の進歩は、新しい対称性を破るパターンを強調している。
強弱対称性の破れは、典型的にはR'enyi-2相関器のような多重レプリカ相関関数を用いて検出される。
本稿では,ランダム化計測ツールボックスを用いた実験において,強弱対称性の破れを検出するための実用的なプロトコルを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:56:59 GMT)
Advancing Semantic Future Prediction through Multimodal Visual Sequence Transformers [11.1] 本稿では,統合的かつ効率的な視覚シーケンス変換器アーキテクチャを用いたマルチモーダルな将来の意味予測手法であるFUTURISTを紹介する。
計算複雑性を低減し,トレーニングパイプラインを合理化し,高解像度なマルチモーダル入力によるエンドツーエンドのトレーニングを可能にする,VAEフリー階層型トークン化プロセスを提案する。
我々は,Cityscapesデータセット上でFUTURISTを検証し,短期予測と中期予測の両方において将来的なセマンティックセグメンテーションにおける最先端性能を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:34:14 GMT)
Failure Diagnosis in Microservice Systems: A Comprehensive Survey and Analysis [10.9] この調査は2003年から現在までの98の科学論文の総括的なレビューを提供する。
これには、基本的な概念、システムアーキテクチャ、問題ステートメントの徹底的な検証と解明が含まれる。
ディメンションの質的な分析も含み、現在のベストプラクティスと今後の方向性に関する詳細な議論を提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:49:10 GMT)
GAC-Net_Geometric and attention-based Network for Depth Completion [10.6] 本稿では,チャネルアテンション機構と3次元グローバル特徴知覚(CGA-Net)を組み合わせたディープコンプリートネットワークを提案する。
KITTI深度補完データセットの実験により、CGA-Netは深度マップの予測精度を大幅に向上できることが示された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:24:20 GMT)
I Can Find You in Seconds! Leveraging Large Language Models for Code Authorship Attribution [10.5] State-of-the-art large language model (LLM)は、様々な言語でソースコードのオーサリングに成功している。
LLMは、悪質な攻撃に対する敵対的な堅牢性を示す。
本稿では,大規模属性に対するトーナメント方式のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:46:19 GMT)
On the Statistical Capacity of Deep Generative Models [10.3] 深部生成モデルでは,光尾を呈する濃縮試料しか生成できないことを示す。
これらの結果は、重い尾を扱う共通の深部生成モデルの限られた能力に光を当てた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:39:46 GMT)
VINGS-Mono: Visual-Inertial Gaussian Splatting Monocular SLAM in Large Scenes [10.3] VINGS-Monoは、大きなシーン用に設計された単分子(慣性)ガウススプラッティング(GS)SLAMフレームワークである。
このフレームワークは、VIO Front End、2D Gaussian Map、NVS Loop Closure、Dynamic Eraserの4つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:01:15 GMT)
Generalized and Efficient 2D Gaussian Splatting for Arbitrary-scale Super-Resolution [10.1] Inlicit Neural Representation (INR) は、任意スケール超解法 (ASR) に成功している
各ピクセルをレンダリングするために、何度もクエリするのは計算コストがかかる。
近年,Gaussian Splatting (GS)は3次元タスクの視覚的品質とレンダリング速度の両方において,INRよりも優位性を示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:09:23 GMT)
CodeCoR: An LLM-Based Self-Reflective Multi-Agent Framework for Code Generation [10.0] コード生成は、自然言語で書かれた要求を自動的に満たすコードを生成することを目的としている。
ChatGPTのような大きな言語モデル(LLM)は、生成されたコードの構文的および意味論的正確性を保証するのに失敗する。
我々は,各エージェントとそのコラボレーションの有効性を評価する,自己表現型マルチエージェントフレームワークであるCodeCoRを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:21:10 GMT)
Quantum advantage in zero-error function computation with side information [10.0] 本稿では,サイド情報を用いたゼロエラー関数計算の問題点について考察する。
Alice and Bob has correlation source $X,Y$ with joint p.m.f. $p_XY(cdot, cdot)$.
単一インスタンスの場合における量子アドバンテージの挙動と、混乱グラフのいくつかのクラスについて検討する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 23:45:09 GMT)
An Intra- and Cross-frame Topological Consistency Scheme for Semi-supervised Atherosclerotic Coronary Plaque Segmentation [9.9] 冠状動脈硬化解析 (CAA) は, 湾曲平面再構成法を用いて再建した血管断面画像の解析に頼っている。
この課題は、プラークと血管の境界や構造がはっきりしないため、重大な課題を提起する。
フレーム内トポロジ的整合性(ITC)とクロスフレームトポロジ的整合性(CTC)を統合した,新しい二重整合性半教師型フレームワークを提案する。
提案手法は,既存の半教師付き手法を超越し,CAAにおける教師付き手法の性能にアプローチする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:23:42 GMT)
How Far are App Secrets from Being Stolen? A Case Study on Android [9.9] Androidアプリは、クラウドサービスの認証情報や暗号化キーなど、自分自身の秘密の文字列を保持することができる。
このような秘密文字列の漏洩は、金銭的損失やユーザーの個人情報の漏洩といった前例のない結果を引き起こす可能性がある。
この研究は、Google Play上の14,665のAndroidアプリからサンプリングされた575のアプリ秘密に基づいて、アプリのシークレットリークの問題を特徴付けている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:15:31 GMT)
Inductive Learning of Logical Theories with LLMs: An Expressivity-Graded Analysis [9.9] 本研究は,Large Language Models(LLM)の機能と限界を分析するための,新しい体系的方法論を提案する。
この分析は、LLM性能に関する特定の推論課題の定量化を可能にする、複雑性グレードのw.r.t.ルール依存構造である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:26:03 GMT)
Consistency of Responses and Continuations Generated by Large Language Models on Social Media [9.8] 大規模言語モデル(LLM)は、テキスト生成において顕著な能力を示すが、ソーシャルメディアの文脈における感情的一貫性とセマンティック・コヒーレンス(セマンティック・コヒーレンス)は十分に理解されていない。
本研究では,2つのオープンソースモデル,Gemma と Llama を用いて,LLM が情緒的内容をどのように処理し,セマンティックな関係を維持するかを検討する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:19:47 GMT)
Quantum Compilation Toolkit for Rydberg Atom Arrays with Implications for Problem Hardness and Quantum Speedups [9.8] 我々は、Rydberg atom array に基づく量子ハードウェア上での最大独立集合(MIS)問題を解決するための量子コンパイルツールキットを提案し、実装する。
第1のモジュール(リデューサ)はハードウェアに依存しない決定論的還元論理を提供し、遅延斜め除去による問題サイズを反復的に減少させる。
第2モジュール(互換性チェッカー)はハードウェア互換性チェッカーを実装し、与えられた入力グラフがRydberg量子ハードウェアの制約と互換性があるかどうかを素早く判定する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:41:17 GMT)
Distributed Nonparametric Estimation: from Sparse to Dense Samples per Terminal [9.8] 我々は,すべてのレシエーションに対して最小値の最適レートを特徴付けるとともに,各端末毎のサンプルがスパースから密度に変化するため,最適レートの位相遷移を同定する。
これにより、以前の研究で残された問題が完全に解決され、その範囲は密度の高いサンプルを持つレギュレーションまたは終端あたりの1つのサンプルに限られる。
最適率は、密度推定、ガウス、二分法、ポアソン、ヘテロスケダスティック回帰モデルなど、様々な特殊ケースに即時に適用される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:41:55 GMT)
Towards Zero-Shot & Explainable Video Description by Reasoning over Graphs of Events in Space and Time [9.8] トランスフォーマーはコンピュータビジョンや自然言語処理など、さまざまな領域で事実上のアプローチとなっている。
本稿では,空間的・時間的事象に基づく視覚と言語間の共通基盤を,説明可能かつプログラム的に提案する。
我々のアルゴリズムアプローチは、さまざまなデータセットから収集したビデオに対して、一貫性があり、リッチで、関連するテキスト記述を生成することができることを検証します。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:09:06 GMT)
Bootstrapping Corner Cases: High-Resolution Inpainting for Safety Critical Detect and Avoid for Automated Flying [9.7] 本稿では,自動飛行中の航空交通を安全のために検出するドローンの安全クリティカル機能である検出・回避のための物体検出について述べる。
ほとんどのモデルは、航空交通の記録や小型機による正面飛行など、生データにおける地上の真実の制限に悩まされている。
我々は、インペイント手法を用いてデータセットをブートストラップし、生データのコーナーケースを明示的に含むことで、この問題を克服する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:21:48 GMT)
Diversified Augmentation with Domain Adaptation for Debiased Video Temporal Grounding [9.6] ビデオ(TSGV)における時間文グラウンドングは、時間的バイアスを含む公開TSGVデータセットによる課題に直面している。
本稿では,データ拡張の多様化とドメイン識別を補完する新しいトレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:40:35 GMT)
Cloud Removal With PolSAR-Optical Data Fusion Using A Two-Flow Residual Network [9.5] 近年,クラウドフリーの光学画像の再構成が重要な課題となっている。
本稿では,2フローポラリメトリック合成開口レーダ(PolSAR)-オプティカルデータ融合雲除去アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:35:14 GMT)
WINE: Wavelet-Guided GAN Inversion and Editing for High-Fidelity Refinement [9.5] WINEはウェーブレット誘導GAN反転aNd編集モデルであり、ウェーブレット係数を介して高周波情報を転送する。
WINEは、編集性と復元品質の微妙なバランスを保ち、既存の最先端のGANインバージョンモデルより優れていることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:22:05 GMT)
Efficient Deep Learning-based Forward Solvers for Brain Tumor Growth Models [9.5] 非常に攻撃的な脳腫瘍であるグリオ芽腫は、予後不良と高い死亡率のために大きな課題となる。
偏微分方程式に基づくモデルは、治療効果を高める有望なポテンシャルを提供する。
本稿では,勾配に基づく最適化とニューラルフォワード解法を併用してキャリブレーション時間を大幅に短縮する手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:10:25 GMT)
VBIM-Net: Variational Born Iterative Network for Inverse Scattering Problems [9.4] フルウェーブ逆散乱問題の解法として,新しい変分ボルン反復ネットワーク,すなわちV BIM-Netを提案する。
提案したV BIM-Netは変動ボルン反復法における全電界とコントラストの交互更新をエミュレートする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:14:00 GMT)
Privacy-Preserving Model and Preprocessing Verification for Machine Learning [9.4] 本稿では、機密データに基づいてトレーニングされたモデルに着目し、機械学習モデルのプライバシ保護検証のためのフレームワークを提案する。
バイナリ分類は、適切な前処理ステップを適用してターゲットモデルが正しくトレーニングされたかどうかを検証し、特定の前処理エラーを特定するマルチクラス分類という2つの重要なタスクに対処する。
その結果、検証精度はデータセットやノイズレベルによって異なるが、このフレームワークは、事前処理エラー、強力なプライバシ保証、機密データの保護のための実践的適用性を効果的に検出する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:21:54 GMT)
Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving [9.4] 強化学習(Reinforcement Learning, RL)は, 自律運転における意思決定と制御の問題を解く上で, 優れた性能を示した。
ドライビングは多属性問題であり、現在のRL法における多目的互換性を実現する上での課題となっている。
マルチオブジェクト対応自律運転のためのハイブリッドパラメタライズアクションを用いた多目的アンサンブル・クリティカル強化学習法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:10:13 GMT)
Robust Hyperspectral Image Panshapring via Sparse Spatial-Spectral Representation [9.3] S$3$RNetはハイパースペクトル画像パネルペンのための新しいフレームワークである。
低分解能ハイパースペクトル画像(LRHSI)と高分解能マルチスペクトル画像(HRMSI)を疎空間スペクトル表現により組み合わせる。
S$3$RNetは、複数の評価指標で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:09:14 GMT)
DAViD: Modeling Dynamic Affordance of 3D Objects using Pre-trained Video Diffusion Models [9.1] 本稿では,合成2Dビデオから3次元ダイナミックアプライアンスを学習する手法を提案する。
具体的には、まず3Dオブジェクトから2D HOIビデオを生成し、次にそれを3Dに持ち上げて4D HOIサンプルを生成するパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:59:59 GMT)
Nigerian Software Engineer or American Data Scientist? GitHub Profile Recruitment Bias in Large Language Models [9.0] 私たちはOpenAIのChatGPTを使って、4つのリージョンからGitHub User Profileを使って6人のソフトウェア開発チームを募集しています。
結果から,ChatGPTは2つのプロファイルの位置情報文字列をスワップしても,他のリージョンよりも好みを示すことがわかった。
ChatGPTは特定の国のユーザに特定の開発者ロールを割り当てる傾向があり、暗黙の偏見が浮かび上がっていた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:20:53 GMT)
OptiChat: Bridging Optimization Models and Practitioners with Large Language Models [9.0] 本稿では,最適化モデルから結論を導出するための自然言語対話システムOptiChatを紹介する。
最適化モデルに適した関数呼び出しとコード生成による大規模言語モデルの拡張により、シームレスな相互作用を可能にし、幻覚のリスクを最小限に抑える。
OptiChatは、最適化モデルと実践者の間のギャップを効果的に埋め、自律的で正確でインスタントな応答を提供することを示した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:53:58 GMT)
Large Language Models for Knowledge Graph Embedding Techniques, Methods, and Challenges: A Survey [9.0] 大きな言語モデル(LLM)は、その優れたパフォーマンスのために、様々な分野で多くの注目を集めています。
彼らは、自然言語を理解して生成するために、大量のテキストデータに数億以上のパラメータを訓練することを目指している。
自然言語処理(NLP)の分野におけるディープラーニングモデルとして、大量のテキストデータを学習し、次の単語を予測したり、与えられたテキストに関連するコンテンツを生成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:47:24 GMT)
Set-Based Training for Neural Network Verification [9.0] 小さな入力摂動はニューラルネットワークの出力に大きな影響を与える。
安全クリティカルな環境の安全性を確保するためには、ニューラルネットワークの堅牢性を検証する必要がある。
本稿では,可能な出力の集合を計算するための,新しいセットベーストレーニング手順を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:56:48 GMT)
GenSafe: A Generalizable Safety Enhancer for Safe Reinforcement Learning Algorithms Based on Reduced Order Markov Decision Process Model [8.9] 我々は、データ不足の課題を克服できる新しいジェネリザブル・セーフティ・エンハンサー(GenSafe)を導入する。
我々は、複数のSRLアプローチとベンチマーク問題でGenSafeを評価する。
提案するGenSafeは,既存のSRL手法を拡張するための新しい手段を提供するだけでなく,様々なSRLアルゴリズムとの広範な互換性を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:32:32 GMT)
Gradient descent with generalized Newton's method [8.9] 本稿では,SGDやAdamなどのトピックに適用可能なヘシアンインフォームドアプローチを提案する。
本手法は,収束を加速する学習率を自動的に動的に選択する。
実際,本手法は計算オーバーヘッドがほとんどゼロのフォワードパスのみを必要とするため,実装が容易である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:30:09 GMT)
A Comprehensive Survey of Foundation Models in Medicine [8.9] ファンデーションモデル(FM)は、大規模なデータセットと自己教師型学習手法を用いて開発された大規模ディープラーニングモデルである。
私たちは、医療におけるFMの歴史、学習戦略、旗艦モデル、アプリケーション、課題に焦点を当てています。
臨床NLP, 医用コンピュータビジョン, グラフ学習, その他の生物学関連タスクなど, FMによって促進される医療応用の詳細な分類法を提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:17:00 GMT)
DomainDemo: a dataset of domain-sharing activities among different demographic groups on Twitter [8.9] 我々は、Twitter上で共有されたドメインと関連するユーザの人口統計特性をリンクするユニークなデータセットであるDomainDemoを紹介した。
この新しいリソースは、アメリカの有権者登録記録と一致した15万以上のTwitterユーザーからなるパネルから生まれた。
129,000以上のWebサイトに対して重要な洞察を提供する5つの指標を導出します。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:42:39 GMT)
Continual Deep Active Learning for Medical Imaging: Replay-Base Architecture for Context Adaptation [8.9] 医療画像の深層学習は、新しい文脈への適応と一般化の課題に直面している。
本研究は、堅牢な医用画像解析のための新しいフレームワークを開発するための2つのアプローチ(CAL)を探求する。
RBACAはCALのないベースラインフレームワークよりも優れており、様々なメモリサイズやアノテーション予算にまたがる最先端のCALメソッドである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:31:01 GMT)
PolyLUT: Ultra-low Latency Polynomial Inference with Hardware-Aware Structured Pruning [8.8] 本稿では,CERNを基本構成ブロックとして,FPGAデプロイメントのためのDNNのトレーニング手法を提案する。
本手法はソフトロジックによって提供される柔軟性を活用し,LUT内の評価を最小限のオーバーヘッドで隠蔽する。
本稿では,ネットワーク侵入検出,大型ハドロン衝突型加速器におけるジェット識別,MNISTの3つの課題に対するPolyLUTの有効性を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:51:57 GMT)
HyFusion: Enhanced Reception Field Transformer for Hyperspectral Image Fusion [8.7] 高分解能マルチスペクトル画像(HR-MSIs)と低分解能HSI(LR-HSIs)から高分解能HSI(HR-HSIs)を再構成する課題について
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:11:42 GMT)
Accelerating the discovery of low-energy structure configurations: a computational approach that integrates first-principles calculations, Monte Carlo sampling, and Machine Learning [8.7] 我々は,モンテカルロサンプリング,第一原理DFT計算,機械学習を組み合わせた物理に基づくデータ駆動手法を開発した。
タングステン系4元系高エントロピー合金の特別な場合に対する提案手法の有効性を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:02:17 GMT)
3D Gaussian Splatting with Normal Information for Mesh Extraction and Improved Rendering [8.6] ガウス関数から推定される符号距離関数の勾配を用いた新しい正規化法を提案する。
我々は、Mip-NeRF360、Tamps and Temples、Deep-Blendingなどのデータセットに対するアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:40:33 GMT)
Double Equivariance for Inductive Link Prediction for Both New Nodes and New Relation Types [8.6] 二重置換同変表現の概念を導入し,その有効性能を実証する。
二重置換同変表現に固有の制約を同定し、これらのモデルが効果的に学習する能力を制限する。
二重置換同変モデルと、すべての領域にまたがるパターンを学習するために設計された基礎モデルの概念の間には、根本的なギャップが残っている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:28:03 GMT)
Decoding Interpretable Logic Rules from Neural Networks [8.6] 本稿では,ニューラルネットワークから解釈可能な論理規則を復号化するための新しいアプローチであるNeuroLogicを紹介する。
NeuroLogicは幅広いニューラルネットワークに適応することができる。
NeuroLogicはニューラルネットワークのブラックボックスの性質を理解するのに役立ちます。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:57:26 GMT)
Retrieval-Reasoning Large Language Model-based Synthetic Clinical Trial Generation [8.6] 本稿では, 大規模言語モデルを利用した新規な検索・推論フレームワークを提案する。
urlClinicalTrials.govデータベースによる実際の臨床試験で実施された実験は、我々の合成データが実際のデータセットを効果的に増大させることができることを示した。
本研究は, 臨床研究を加速し, 患者プライバシの倫理基準を高くする上で, 総合臨床試験生成のためのLCMが期待できることを示唆する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:19:49 GMT)
AfriMed-QA: A Pan-African, Multi-Specialty, Medical Question-Answering Benchmark Dataset [8.5] AfriMed-QAはPan-African English multi-choice Medical Question-Answering データセットである。
15,000の質問が16カ国の60以上の医療学校から寄せられ、32の医療専門学校から寄せられた。
バイオメディカル LLM は一般的なモデルよりも優れており、エッジフレンドリーな LLM はパススコアの達成に苦慮している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:35:08 GMT)
Spacewalker: Traversing Representation Spaces for Fast Interactive Exploration and Annotation of Unstructured Data [8.4] Spacewalkerは、複数のモードでデータを分析、探索、注釈付けするインタラクティブツールである。
ユーザは、データ表現を抽出し、低次元空間で視覚化し、探索的または関心のある領域を問合せすることによって、大きなデータセットをトラバースすることができる。
従来の手法と比較して,Spacewalkerは時間と労力を削減できることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:47:17 GMT)
Many-Objective Neuroevolution for Testing Games [8.4] テストジェネレータNEATESTは、検索ベースのソフトウェアテスト原則と神経進化を組み合わせることで、課題に取り組む。
我々はNEATESTを複数のプログラム状態を同時に対象とする多目的探索アルゴリズムに変換する。
実験の結果,NEATESTを複数の目的に拡張することで,平均枝面積が75.88%から81.33%に増加することがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:18:34 GMT)
A Roadmap to Guide the Integration of LLMs in Hierarchical Planning [8.4] 階層型計画(HP)におけるLLM(Large Language Models)の可能性を活用するためのロードマップを提案する。
本稿では,HP ライフサイクルにおいて LLM をどのように活用できるかを考察する統合手法の分類法を提案する。
我々は、将来のLCMベースのHPアプローチの性能を評価するための標準化されたデータセットを用いたベンチマークを提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:34:25 GMT)
Leveraging 2D Masked Reconstruction for Domain Adaptation of 3D Pose Estimation [8.4] RGBベースの3Dポーズ推定手法はディープラーニングの開発で成功している。
既存のほとんどの手法は、トレーニングデータとは程遠い分布のイメージをテストするためにうまく動作しない。
本稿では,3次元ポーズ推定のための教師なし領域適応フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:56:43 GMT)
New Constraints on Axion Mediated Dipole-Dipole Interactions [8.2] 鉄シールドSmCo$_5$スピン源を用いた軸イオンを介するエキゾチックスピン-スピン相互作用の実験結果について報告する。
我々は、電子と中性子のカップリングに新たな制約を設け、以前の実験的な限界をアクシオンウィンドウ内で10000回以上超えた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:06:14 GMT)
An Adaptive Orthogonal Convolution Scheme for Efficient and Flexible CNN Architectures [8.1] 我々は直交畳み込みを構築するスケーラブルな方法であるAOC(Adaptative Orthogonal Convolution)を紹介する。
実験を通して,本手法がスケールするにつれて効率が向上する表現モデルを生成することを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:32:12 GMT)
UFGraphFR: An attempt at a federated recommendation system based on user text characteristics [8.0] フェデレーテッド・ラーニングは、訓練中のデータの「使用不能」のため、「プライベート・コンピューティング」において重要な研究領域となっている。
本稿では,ユーザテキストの特徴によって構築されたユーザ関係グラフに基づいて,個人化されたフェデレーション・レコメンデーション・アルゴリズムを提案する。
本実験により,推薦システムの性能に影響を及ぼすことなく,ユーザプライバシをある程度保護できることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:52:16 GMT)
UTMath: Math Evaluation with Unit Test via Reasoning-to-Coding Thoughts [7.9] 本稿では,大規模言語モデルの評価を目的とした頑健な評価フレームワークであるUTMath Benchmarkを紹介する。
これは9つの数学領域にまたがる1053個の最先端問題を含み、平均68個のテストケースがある。
最高の性能モデルであるo1-miniはわずか32.57%の問題を解き、o1-previewは27.16%、GPT-4oは26.93%であった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:57:26 GMT)
E2ESlack: An End-to-End Graph-Based Framework for Pre-Routing Slack Prediction [7.8] E2ESlackは,スラック予測のためのエンドツーエンドグラフベースのフレームワークである。
私たちの知る限りでは、これは経路レベルのスラックスを事前に予測できる最初の作品です。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:38:26 GMT)
A systematic review of the use of Deep Learning in Satellite Imagery for Agriculture [7.8] 現代のディープラーニング手法は、ほとんどのタスクで従来の機械学習よりも一貫して優れていた。
LSTMリカレントニューラルネットワークは、収量予測のためにランダムフォレストを一貫して上回らなかった。
いくつかの研究は、衛星画像で利用可能な余分なスペクトル分解能を特に利用した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:34:10 GMT)
Transforming Indoor Localization: Advanced Transformer Architecture for NLOS Dominated Wireless Environments with Distributed Sensors [7.6] 本稿では,電力遅延プロファイル (PDP) の可変固有表現を保存する新しいトークン化手法であるSensor Snapshot Tokenization (SST) を提案する。
また,Swish-Gated Linear Unit-based Transformer (L-SwiGLU Transformer) モデルを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:16:30 GMT)
Addressing the sustainable AI trilemma: a case study on LLM agents and RAG [7.6] 大規模言語モデル(LLM)は重要な機能を示しているが、その広範なデプロイメントとより高度なアプリケーションによって、重要な持続可能性の課題が提起されている。
本稿では、持続可能なAIトリレムマの概念を提案し、AI能力、デジタルエクイティ、環境サステナビリティの緊張関係を強調する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:21:16 GMT)
Multifractal-enriched mobility edges and emergent quantum phases in one-dimensional exactly solvable lattice models [7.5] 我々は、正確に解けるフラットバンド準周期格子モデルのクラスを提案する。
格子空間と双対空間の両方におけるリャプノフ指数の正確な式を導出する。
実空間と双対空間の固有状態の逆参加比を数値計算する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:07:44 GMT)
Reward Compatibility: A Framework for Inverse RL [7.4] 本稿では,報酬相反のレンズによる逆強化学習(IRL)の理論的研究について述べる。
報酬は、その報酬で計算された専門家のポリシーのパフォーマンスを、その報酬のために最適なパフォーマンスに近づけることと、より互換性がある。
我々は、最適および準最適専門家のデモンストレーション、オンラインとオフラインの両方のデータ収集など、さまざまな設定でIRLの問題を解析する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:39:04 GMT)
Exploring Robustness of Multilingual LLMs on Real-World Noisy Data [7.3] 本稿では,実世界のスペルミスが9言語モデルの性能に与える影響について検討する。
我々は、6つの異なる言語で実験を行い、ウィキペディア編集履歴を用いた実世界のノイズの辞書を構築した。
特に、mT5 (13B) は、平均して3つのタスク、そして6つの言語のうち4つのタスクで、最も堅牢であった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:55:35 GMT)
Exploring Robustness of LLMs to Sociodemographically-Conditioned Paraphrasing [7.3] 我々は、社会デミノグラフィーの次元にまたがる幅広いバリエーションを探求するために、より広いアプローチを取る。
我々はSocialIQAデータセットを拡張し、ソシオデミノグラフィースタイルを条件とした多様なパラフレーズセットを作成する。
人口統計学的パラフレーズが言語モデルの性能に大きく影響していることが判明した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:50:06 GMT)
STTS-EAD: Improving Spatio-Temporal Learning Based Time Series Prediction via [7.2] 時系列予測のトレーニングプロセスに異常をシームレスに統合するエンドツーエンドのSTTS-EADを提案する。
提案するSTTS-EADは,時間的情報を用いて予測と異常検出を行う。
提案手法は,トレーニング段階において検出された異常を効果的に処理し,推論段階における予測性能を向上し,ベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:26:05 GMT)
SplatMAP: Online Dense Monocular SLAM with 3D Gaussian Splatting [7.2] 本稿では,高忠実度3DGSに高密度SLAMを組み込むことにより,リアルタイム・高密度化を実現するフレームワークを提案する。
本手法では,SLAMから高密度点雲を利用することにより,ガウスモデルを動的に更新・密度化するSLAM-Informed Adaptive Densificationを導入する。
ReplicaとTUM-RGBDデータセットの実験は、我々のアプローチの有効性を実証している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:02:31 GMT)
Zero-shot Video Moment Retrieval via Off-the-shelf Multimodal Large Language Models [7.2] 本稿では,凍結MLLMを用いたゼロショットVMRのためのチューニング不要パイプラインであるMoment-GPTを提案する。
我々はまずLLaMA-3を用いて言語バイアスを軽減するためにクエリの修正と表現を行い、その後MiniGPT-v2と組み合わせたスパンジェネレータを設計し、候補スパンを適応的に生成する。
提案手法は,複数の公開データセット上で,最先端のMLLMベースおよびゼロショットモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:45:10 GMT)
READ: Reinforcement-based Adversarial Learning for Text Classification with Limited Labeled Data [7.2] BERTのような事前訓練されたトランスフォーマーモデルは、多くのテキスト分類タスクで大幅に向上している。
本稿では,強化学習に基づくテキスト生成と半教師付き対角学習アプローチをカプセル化する手法を提案する。
提案手法であるREADは、ラベルのないデータセットを用いて、強化学習を通じて多様な合成テキストを生成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:39:55 GMT)
Benchmarking Vision Foundation Models for Input Monitoring in Autonomous Driving [7.1] ディープニューラルネットワーク(DNN)は、自動運転(AD)のような複雑なオープンワールドドメインにおける分散シフトによって問題になる
OOD分類の現在のアプローチは、ADのような複雑なドメインでは証明されていない。
本稿では,すべてのシフトの検出を統一する,原則付き,教師なし,モデルに依存しない手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:51:34 GMT)
DisCoPatch: Batch Statistics Are All You Need For OOD Detection, But Only If You Can Trust Them [7.0] アウト・オブ・ディストリビューション(OOD)検出は多くのアプリケーションにおいて重要な意味を持つ。
本稿では,この機構を利用した教師なし適応変分自動エンコーダフレームワークであるDisCoPatchを紹介する。
DisCoPatchは、公開OOD検出ベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:49:26 GMT)
CellOMaps: A Compact Representation for Robust Classification of Lung Adenocarcinoma Growth Patterns [6.9] 肺腺癌(Lung adenocarcinoma, LUAD)は, 形態学的に異質な疾患である。
肺組織を5つのパターンの1つまたは非腫瘍の1つに分類できる一般化可能な機械学習パイプラインを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:09:36 GMT)
Can Bayesian Neural Networks Explicitly Model Input Uncertainty? [6.9] 我々は2つの入力ベイズニューラルネットワーク(平均偏差と標準偏差)を構築し、入力不確かさ推定の能力を評価する。
提案手法は,入力不確実性,特にEnsemblesとFlipoutをモデル化できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:00:41 GMT)
Self-supervised Deep Hyperspectral Inpainting with the Plug and Play and Deep Image Prior Models [6.9] ハイパースペクトル画像は、典型的には数百の狭く連続したスペクトルバンドで構成され、それぞれが撮像されたシーンの構成に関する情報を含んでいる。
これらの画像は、様々なノイズ、歪みデータ、材料損失の影響を受け、品質と有用性を著しく低下させることができる。
本稿では,DHPの不安定性問題に対処するアルゴリズム LRS-nt-DIP を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:18:28 GMT)
Neural Network Emulator for Atmospheric Chemical ODE [6.8] 高速な化学濃度モデリングのためのニューラルネットワークエミュレータを提案する。
初期状態と今後の時間進化の間の隠れた相関関係を抽出するために,ChemNNEを提案する。
提案手法は,モデリング精度と計算速度において最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:10:21 GMT)
Tarsier2: Advancing Large Vision-Language Models from Detailed Video Description to Comprehensive Video Understanding [6.8] Tarsier2は、詳細なビデオ記述を生成するために設計された大型の視覚言語モデル(LVLM)である。
Tarsier2-7B は GPT-4o や Gemini 1.5 Pro など主要なプロプライエタリモデルより一貫して優れていた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:54:39 GMT)
Exploiting Boosting in Hyperdimensional Computing for Enhanced Reliability in Healthcare [6.8] 本稿では,超次元空間を部分空間に分割するために,ブースティングアルゴリズムを適用したBoostHDを紹介する。
医療データセットの実験によると、BoostHDは最先端の手法よりも優れています。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:20:32 GMT)
Self-Attentive Spatio-Temporal Calibration for Precise Intermediate Layer Matching in ANN-to-SNN Distillation [6.8] スパイキングニューラルネットワーク(SNN)は、イベント駆動機構による低消費電力計算を約束している。
SNNはニューラルネットワーク(ANN)に比べて精度が低いことが多い
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:56:00 GMT)
Demographic Variability in Face Image Quality Measures [6.8] 顔画像品質評価(FIQA)アルゴリズムは、オンラインアイデンティティ管理アプリケーションに統合されている。
バイオメトリックシステムに関して、人口統計バイアスに関する懸念が高まっている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:26:55 GMT)
ArithmAttack: Evaluating Robustness of LLMs to Noisy Context in Math Problem Solving [6.7] 本稿では,ArithmAttackを提案する。
GSM8KとMultiArithmデータセットを用いて,LLama3,Mistral,Mathstralを含む7つのLLMのロバスト性を評価する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:38:41 GMT)
What type of inference is planning? [6.7] 計画法は, 変分問題において, 異なる重みの集合と正確に一致することを示す。
我々は,マルコフ決定過程における近似計画の実行を可能にする,ループ的信念伝達の類推を開発する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:33:19 GMT)
Facial Dynamics in Video: Instruction Tuning for Improved Facial Expression Perception and Contextual Awareness [6.6] 本稿では,動的表情キャプションに適した命令追従データセットを提案する。
データセットは、5,033本の高品質なビデオクリップを手動で注釈付けし、70,000以上のトークンを含んでいる。
また,このタスクにおける既存のビデオMLLMの性能を評価するためのベンチマークであるFEC-Benchを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:52:56 GMT)
Deep Learning for Disease Outbreak Prediction: A Robust Early Warning Signal for Transcritical Bifurcations [6.6] 早期警戒信号(EWS)は、病気がパンデミックになる前に予防措置を実施するのに不可欠である。
病気の発生時の測定は、しばしば異なるノイズ源によって破壊される。
本研究は,雑音環境下での強靭な早期警告信号の提供により,深層学習の進歩を橋渡しする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:47:05 GMT)
Revisiting Birds Eye View Perception Models with Frozen Foundation Models: DINOv2 and Metric3Dv2 [6.4] 我々は,Metric3Dv2の深度情報を,Simple-BEVアーキテクチャに組み込まれたPseudoLiDARポイントクラウドとして,革新的な応用を紹介した。
この統合により、カメラのみのモデルに比べて+3 IoUが改善される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:51:14 GMT)
Isochronous oscillator with a singular position-dependent mass and its quantization [6.4] 方程式 $ddotx - (1/2x) dotx2 + 2 omega2 x - 1/8x = 0$, ここで $omega > 0$ と $x = x(t)$ は実数値変数である。
動力学は枝と定性の両方に対して正確に解けるので、$x > 0$ブランチに固執する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:33:16 GMT)
Enhanced Masked Image Modeling to Avoid Model Collapse on Multi-modal MRI Datasets [6.3] マスク付き画像モデリング(MIM)は、ラベルなしデータの利用において有望であることを示す。
モデル崩壊を, 完全崩壊と次元崩壊の2つのタイプで解析し, 対処する。
HMPとPBTモジュールを併用した拡張MIM(E-MIM)を構築し,マルチモーダルMRIのモデル崩壊を回避する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:30:19 GMT)
DM-Mamba: Dual-domain Multi-scale Mamba for MRI reconstruction [6.3] Mambaは、線形複雑性を伴う長距離依存性モデリングの新しいパラダイムである。
マンバの行回りと列回りの走査はk空間のユニークなスペクトルを妨害する。
提案手法は,計算コストの低い最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:41:51 GMT)
BioPose: Biomechanically-accurate 3D Pose Estimation from Monocular Videos [6.3] BioPoseは、モノクロビデオから直接、生体力学的に正確な3Dポーズを予測するための学習ベースのフレームワークである。
マルチクエリヒューマンメッシュリカバリモデル(MQ-HMR)、ニューラル・インバース・キネマティクス(NeurIK)モデル、および2Dインフォームド・ポーズ・リファインメント技術を含んでいる。
ベンチマークデータセットの実験では、BioPoseが最先端の手法を大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:56:19 GMT)
Mathematical Information Retrieval: Search and Question Answering [6.2] マルチモーダル検索エンジンと数学的質問応答システムは、数学関連の質問に答えるのに役立つ。
この本は、数学的情報を見つけ、利用するのに役立つシステムに興味を持つ学生、インストラクター、研究者を対象としている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:34:12 GMT)
SoK: Design, Vulnerabilities, and Security Measures of Cryptocurrency Wallets [6.1] 既存の財布や斬新な財布の多次元設計分類について紹介する。
以前に発生した脆弱性を特定し、設計決定のセキュリティへの影響について議論する。
2012年から2024年にかけて、84件のインシデントを調査し、5.4億ドルを計上する多層攻撃フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:03:42 GMT)
Predict Confidently, Predict Right: Abstention in Dynamic Graph Learning [6.0] 本稿では,時間的動的グラフに対する時間的グラフニューラルネットワーク(GNN)のフレームワーク内でのリジェクションオプション戦略を提案する。
これにより、モデルが不確実性が高く、信頼性が低い場合に、戦略的に予測を控えることができる。
動的グラフシナリオにおける予測のための曲線(AUC)/平均精度(AP)スコアの信頼性と面積を改善するためのアプローチの有効性を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:27:58 GMT)
Optical information encryption using general temporal ghost imaging with practical experimental condition [6.0] テンポラルゴーストイメージングは、遅い検出器を用いて高速の時間信号を再構成する。
画像品質に及ぼす遅い検出器の実験パラメータの影響を理論的に検討する。
量子および古典的TGI手法の両方に基づくマルチビット情報伝送方式を実装した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:14:29 GMT)
Assessment of Personalized Learning in Immersive and Intelligent Virtual Classroom on Student Engagement [6.0] この研究は、パーソナライズされた学習アプローチが学生の参加、モチベーション、学業成績をいかに向上させるかについての洞察を提供することを目的としている。
眼球運動パラダイムは、学生のエンゲージメントを評価し、より良い教育効果を促進する可能性がある。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:49:22 GMT)
Balance Divergence for Knowledge Distillation [6.0] 既存の知識蒸留法の多くは、教師ネットワークと学生ネットワーク間のロジット出力確率を模倣するために、Kulback-Leibler分散を用いる。
この欠損は蒸留過程でのロジットの模倣において最適以下の性能をもたらす可能性がある。
本稿では,バランス分散蒸留法という新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:12:25 GMT)
FoMo: A Foundation Model for Mobile Traffic Forecasting with Diffusion Model [6.0] モバイルトラフィック予測のための革新的なファンデーションモデル(FoMo)を提案する。
FoMoは、ネットワーク計画と最適化をサポートするために、複数の都市にまたがる短期・長期予測と分布生成の多様な予測タスクを処理することを目的としている。
FoMoは拡散モデルと変換器を組み合わせており、FoMoが様々なタスクの固有の特徴を学習できるようにするために様々な普遍性マスクが提案されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:59:12 GMT)
Enhancing Performance of Point Cloud Completion Networks with Consistency Loss [5.9] 本稿では,1対1のマッピング問題を緩和するために,新しい完了整合性損失を用いて従来の学習目標を強化することを提案する。
提案した整合性損失は,既存ネットワークの補完性能を向上させるのに優れる。
特に、提案された一貫性損失でトレーニングされた最先端のポイントコンプリートネットワークは、挑戦的な新しいMVPデータセットで最先端の精度を達成することができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:26:13 GMT)
PUFBind: PUF-Enabled Lightweight Program Binary Authentication for FPGA-based Embedded Systems [5.9] Schemeはプラットフォームに依存しないため、最大限の柔軟性を得るために"ベアメタル"モード(システムソフトウェアを必要としない)で動作することができる。
我々は,AMD/Xilinx FPGA上で,オープンソースのPicoBlazeマイクロコントローラを用いたプロトタイプ実装に成功した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:12:36 GMT)
Nonlinear functions of quantum states [5.6] 我々は、ユニタリとパラメタライズド量子回路の線形結合によりSWAPテストを拡張することにより、量子状態関数(QSF)フレームワークを導入する。
我々は基本課題の量子アルゴリズムを開発し、フォン・ノイマンエントロピー推定と量子状態忠実度計算の両方に対して$tildemathcalO (1/(varepsilon2kappa)$のサンプル複雑性を達成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:35:25 GMT)
Doubly-Bounded Queue for Constrained Online Learning: Keeping Pace with Dynamics of Both Loss and Constraint [5.5] 二重有界キューを用いた制約付きオンライン学習(COLDQ)という効率的なアルゴリズムを提案する。
我々は、新しいリアプノフドリフト解析により、COLDQが$O(Tfrac1+V_x2)$動的後悔と$O(TV_g)$ハード制約違反を達成することを証明した。
強い凸損失関数の場合、COLDQはよく知られた$O(logT)$静的後悔と一致し、$O(TV_g)$ハード制約違反を維持している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:02:00 GMT)
CHEQ-ing the Box: Safe Variable Impedance Learning for Robotic Polishing [5.5] 本研究では, 可変インピーダンスを有するロボット研磨のためのハイブリッドRLアルゴリズムCHEQの実験的検討を行った。
ハードウェア上では、CHEQは効果的な研磨動作を実現し、8時間のトレーニングを必要とせず、5回の障害しか発生しない。
その結果、ハードウェア上で直接訓練された実世界のコンタクトリッチなタスクに対して、適応型ハイブリッドRLの可能性を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:13:41 GMT)
UIFV: Data Reconstruction Attack in Vertical Federated Learning [5.4] Vertical Federated Learning (VFL)は、参加者が生のプライベートデータを共有することなく、協調的な機械学習を促進する。
近年の研究では、学習プロセス中にデータ漏洩によって、敵が機密性を再構築する可能性のあるプライバシーリスクが明らかにされている。
我々の研究は、実用的なVFLアプリケーションに真の脅威をもたらす、VFLシステム内の深刻なプライバシー上の脆弱性を露呈する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:17:58 GMT)
OpenCSG Chinese Corpus: A Series of High-quality Chinese Datasets for LLM Training [5.4] OpenCSG Chinese Corpusは、中国語の訓練用に特別に設計された高品質なデータセットである。
本発明のコーパスは、Fineweb-edu-chinese、Fineweb-edu-chinese-v2、Cosmopedia-chinese、Smoltalk-chineseを含む。
OpenCSG Chinese Corpusの特徴は、高品質なテキスト、ドメイン間の多様なカバレッジ、スケーラブルで再現可能なデータキュレーションプロセスである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:22:47 GMT)
A Low-cost and Ultra-lightweight Binary Neural Network for Traffic Signal Recognition [5.3] ハードウェア展開用に設計された超軽量バイナリニューラルネットワーク(BNN)モデルを提案する。
提案モデルでは、97.64%の精度で優れた認識性能を示す。
我々の研究は、コンピュータビジョンモデルのハードウェア展開におけるBNNの大きな可能性を示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:19:10 GMT)
Mode-conditioned music learning and composition: a spiking neural network inspired by neuroscience and psychology [5.2] そこで我々は,脳のメカニズムや心理的理論にインスパイアされたスパイクニューラルネットワークを提案し,音楽モードとキーを表現する。
我々の研究は、音楽を学び、生成するだけでなく、人間の認知と人工知能のギャップを埋めるシステムを作ることを目指している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:16:18 GMT)
Addressing Quality Challenges in Deep Learning: The Role of MLOps and Domain Knowledge [5.2] 本稿では,透過的で再現可能な実験環境を構築する上で,MLOpsの実践が果たす役割について述べる。
本稿では,DLモデルの設計にドメイン知識を組み込むことによる品質問題に対処する経験について報告する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:37:08 GMT)
FLAVARS: A Multimodal Foundational Language and Vision Alignment Model for Remote Sensing [5.2] コントラスト学習とマスクモデリングを組み合わせた事前学習手法であるFLAVARSを提案する。
FLAVARSは、KNN分類のような視覚のみのタスクにおいて、SkyCLIPのベースラインを著しく上回っている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 23:31:20 GMT)
Detecting Contextual Anomalies by Discovering Consistent Spatial Regions [5.2] 本稿では,映像の異常検出を可能にする空間コンテキストをモデル化する手法について述べる。
主なアイデアは、共同オブジェクト属性をクラスタリングすることで、類似したオブジェクトレベルのアクティビティを共有する領域を見つけることである。
本稿では, 競合モデルよりも桁違いに少ないパラメータを用いて, 空間コンテキストに依存したストリートシーンデータセットを用いて, このアプローチを実証する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:33:07 GMT)
Computational and Statistical Asymptotic Analysis of the JKO Scheme for Iterative Algorithms to update distributions [5.1] ヨルダン、キンデレーア、オットーの論文は、現在広く知られているJKOスキームを導入した。
我々は、未知のパラメータを持つモデルに対応するために、JKOスキームを拡張した。
我々のフレームワークはパラメータ推定に使用されるサンプルサイズとアルゴリズムの反復回数の両方を無限にすることができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:30:31 GMT)
Modeling Discrimination with Causal Abstraction [4.9] 人は、彼女の人種が彼女のひどい治療を引き起こした場合にのみ、直接人種的に差別されます。
これは、人種がその因果的役割を分離するために他の属性と十分に分離できることを意味している。
しかし、人種は孤立した治療に抵抗する社会的要因のネクサスに埋め込まれている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:42:57 GMT)
Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models [4.9] 本稿では,合成顔画像のリアリズム向上を目的とした,リアリズム伝達のための新しいフレームワークを提案する。
グラフィクスパイプラインの制御可能な側面とリアリズム強化技術を統合することで、我々は大量のリアルなバリエーションを生成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:27:32 GMT)
TSEML: A task-specific embedding-based method for few-shot classification of cancer molecular subtypes [4.8] 異種および小癌のデータセットにおける数発の分子サブタイプ予測問題に焦点をあてる。
タスク固有の埋め込み型メタラーニングフレームワーク(TSEML)を導入する。
本フレームワークは,数発の分子サブタイプ分類の問題に対処する上で,優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:18:03 GMT)
Dynamic Pricing in High-Speed Railways Using Multi-Agent Reinforcement Learning [4.8] 本稿では,競合演算子や協調演算子のコンテキストにおいて,効果的な動的価格戦略を設計する上での課題について述べる。
非ゼロサムマルコフゲームに基づく強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:19:25 GMT)
Dissecting Query-Key Interaction in Vision Transformers [4.7] 視覚変換器における自己注意はしばしば知覚的なグループ化を行うと考えられている。
相互作用行列の特異値分解による問合せキーの相互作用の解析を行う。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:57:44 GMT)
Lean Attention: Hardware-Aware Scalable Attention Mechanism for the Decode-Phase of Transformers [4.7] トランスフォーマーベースのモデルは、自然言語処理の最も広く使われているアーキテクチャの1つとして登場した。
これらの巨大なモデルはメモリが空腹で、最先端のAIアクセラレータでも大きな推論レイテンシが生じる。
本稿ではトークン生成フェーズの自己認識をスケーラブルに計算する手法であるLeanAttentionを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:00:34 GMT)
A Refreshment Stirred, Not Shaken (II): Invariant-Preserving Deployments of Differential Privacy for the US Decennial Census [4.5] 我々は,アメリカ十年国勢調査における統計的制御法(SDC)を開発した。
PSAアルゴリズムは差分プライバシー(DP)と整合可能な不変$varepsilon$sを誘導することを示した。
私たちの結果は、PSAが提供するSDCの保証を詳細に説明しますが、DASと2020年DASは、一般的に、実際のプライバシ保護に対してx2013$とされなければなりません。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:38:01 GMT)
Towards Optimizing the Expected Performance of Sampling-Based Quantum-Inspired Algorithms [4.5] 我々はサンプリングベース量子インスパイアされたアルゴリズムにおいて2つの主要なサブルーチンを分析する。
データ構造を一般化することで改善の可能性について議論する。
我々は,様々な量子および量子に着想を得た機械学習アルゴリズムの最適実装を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:38:04 GMT)
Quantifying the imaginarity via different distance measures [4.5] 本稿では,様々な距離測定値を用いた虚偽性の評価手法を提案する。
我々は,Tsallis relative $alpha$-entropy, Sandwiched R'enyi relative entropy, Tsallis relative operator entropy などの尺度を用いて,虚偽性を定量的に評価することに集中する。
以上の結果から,Tsallis 相対$$alpha$-entropy of imaginarity は,他の測度に比べて量子チャネル下での崩壊率が高いことが明らかとなった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:16:51 GMT)
Implicit Neural Representations with Fourier Kolmogorov-Arnold Networks [4.5] 入射神経表現(INR)は、複雑な信号の連続的および分解非依存的な表現を提供するためにニューラルネットワークを使用する。
提案したFKANは、第1層のフーリエ級数としてモデル化された学習可能なアクティベーション関数を用いて、タスク固有の周波数成分を効果的に制御し、学習する。
実験結果から,提案したFKANモデルは,最先端の3つのベースラインスキームよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:56:00 GMT)
Continuous GNN-based Anomaly Detection on Edge using Efficient Adaptive Knowledge Graph Learning [4.5] ビデオ異常検出(VAD)は、インテリジェント監視、証拠調査、暴力検出などのアプリケーションにおいて重要なタスクである。
VADの従来のアプローチは、しばしば大規模で事前訓練されたモデルの微調整に依存しており、計算コストが高く、リアルタイムやリソース制約のある環境では実用的ではない。
本稿では,クラウド依存の限界を克服し,エッジデバイス上での連続KG適応を容易にする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:21:51 GMT)
Can Go AIs be adversarially robust? [4.5] 自然対策を加えることで、Goの堅牢性が達成できるかどうかを考察する。
これらの防御策のいくつかは、以前発見された攻撃から守られているが、新しく訓練された敵には耐えられない。
我々の研究結果は、堅牢なAIシステムの構築は、非常に超人的なシステムであっても、最も難易度の高い設定で難しいことを示唆している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:08:02 GMT)
What Makes Cryptic Crosswords Challenging for LLMs? [4.5] クリプティッククロスワード(英: Cryptic crosswords)は、一般的な知識と、解法が異なるレベルで言語を操作する能力に依存するパズルである。
従来の研究では、そのようなパズルを解くことは、Large Language Models (LLMs)を含む現代のNLPモデルにおいても難しいことが示唆されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:06:54 GMT)
Entropy Mixing Networks: Enhancing Pseudo-Random Number Generators with Lightweight Dynamic Entropy Injection [4.4] 本稿では,新しいハイブリッド乱数生成器であるEntropy Mixing Network (EMN)を提案する。
決定論的擬似ランダム生成と周期的エントロピー注入を組み合わせてランダム性を向上させる。
EMNはPythonのSystemRandomとMersenneTwisterを重要なメトリクスで上回っている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:36:54 GMT)
ADAM-1: AI and Bioinformatics for Alzheimer's Detection and Microbiome-Clinical Data Integrations [4.4] Alzheimer's Disease Analysis Model Generation 1 (ADAM) は、マルチモーダルデータの統合と解析を目的としたマルチエージェント・大規模言語モデル(LLM)フレームワークである。
ADAM-1は多様なデータソースから洞察を合成し、文献駆動のエビデンスを用いて知見を文脈化する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:56:33 GMT)
A Hardware-Friendly Shuffling Countermeasure Against Side-Channel Attacks for Kyber [4.4] CRYSTALS-Kyberは、大規模な量子コンピュータによる攻撃に耐えるために、NISTによる唯一の鍵カプセル化機構(KEM)スキームとして標準化されている。
本稿では,新しいコンパクトシャッフルアーキテクチャを取り入れた,キーバーのセキュアで効率的なハードウェア実装を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:43:22 GMT)
Artificial Liver Classifier: A New Alternative to Conventional Machine Learning Models [4.4] 本稿では,ヒト肝臓の解毒機能に触発された新しい教師付き学習分類器であるArtificial Liver(ALC)を紹介する。
ALCの特徴は、その単純さ、速度、ハイパーパラメータフリー、オーバーフィッティングを減らす能力、そして多重分類問題に対処する効果である。
Iris Flower、Breast Cancer Wisconsin、Wine、Voice Gender、MNISTの5つのベンチマーク機械学習データセットで評価された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:42:01 GMT)
Advice for Diabetes Self-Management by ChatGPT Models: Challenges and Recommendations [4.3] 糖尿病患者に対するChatGPT 3.5および4の反応について検討した。
以上の結果から,精度と埋込バイアスの相違が判明した。
本稿では,病原性外部記憶を迅速に評価し,組み込むコモンセンス評価層を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:32:16 GMT)
BiDepth Multimodal Neural Network: Bidirectional Depth Deep Learning Arcitecture for Spatial-Temporal Prediction [4.3] 本稿では,双方向深度変調を用いたBDMNN(BiDepth Multimodal Neural Network)を提案する。
ケーススタディでは,都市交通予測のための平均二乗誤差を12%削減し,降雨予測を15%改善した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:59:59 GMT)
Addressing Hallucinations in Language Models with Knowledge Graph Embeddings as an Additional Modality [4.2] 本稿では,Large Language Models (LLMs) における幻覚を減らすために,知識グラフ (KGs) を付加的なモダリティとして組み込んだアプローチを提案する。
本手法では,入力テキストを一組のKG埋め込みに変換し,アダプタを用いて言語モデル空間に組み込む。
我々は、このデータセットを用いてMistral 7B、LLaMA 2-7B(チャット)、LLaMA 3-8B(インストラクション)モデルのアダプタを訓練し、我々のアプローチが性能を向上させることを示した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:56:34 GMT)
Prediction Interval Construction Method for Electricity Prices [4.2] 電力価格シナリオを生成する条件付き生成対向ネットワークを最初に提示する。
異なる生成シナリオを積み重ねて確率密度を求め、電気価格の不確かさを正確に反映することができる。
スパイクや揮発性価格に対処するため、気象要因のボラティリティレベルに基づく強化予測機構を導入する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:02:08 GMT)
Distributed Identity for Zero Trust and Segmented Access Control: A Novel Approach to Securing Network Infrastructure [4.2] 本研究は、分散IDをZTA原則で適用した際のセキュリティ改善を評価する。
この研究は、分散IDを採用することで、全体的なセキュリティ姿勢を桁違いに向上させることができることを示唆している。
この研究は、技術的標準の洗練、分散IDの実践的利用の拡大、および現代のデジタルセキュリティ分野への応用を推奨している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:02:02 GMT)
Safety Implications of Explainable Artificial Intelligence in End-to-End Autonomous Driving [4.2] 本稿では,エンド・ツー・エンドの自動運転における説明の安全性への影響について述べる。
我々はまず、エンド・ツー・エンドの運転における安全と説明可能性の概念を再考し、また、自動運転の安全性向上における説明の要点を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:44:14 GMT)
Optimization of Link Configuration for Satellite Communication Using Reinforcement Learning [4.1] 最適なリンク構成の計画は非常に複雑で、多くのパラメータやメトリクスに依存します。
強化学習アルゴリズムPPOとメタヒューリスティック・シミュレート・アニーリングを比較した。
その結果,Simulated AnnealingはPPOアルゴリズムよりも,この静的問題に対してより良い結果をもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:04:46 GMT)
Advancing Brainwave-Based Biometrics: A Large-Scale, Multi-Session Evaluation [4.1] 345名の被験者と6000名以上のセッション(被験者17名)を3つのヘッドセットで5年間にわたって記録した。
EER(Equal Error Rates)における古典的特徴抽出法を16.4%向上させる深層学習手法
脳波計測センサーの使用は少なく、EERの増大は許容できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:42:50 GMT)
PokerBench: Training Large Language Models to become Professional Poker Players [3.9] PokerBenchは、大規模言語モデル(LLM)のポーカー演奏能力を評価するためのベンチマークである。
不完全な情報ゲームであるポーカーは、数学、推論、計画、戦略、ゲーム理論と人間の心理学の深い理解といった様々なスキルを要求する。
PokerBenchは、11,000の最も重要なシナリオを総合的にコンパイルし、プレフロップとポストフロップのプレイを分割する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:59:03 GMT)
MSCViT: A Small-size ViT architecture with Multi-Scale Self-Attention Mechanism for Tiny Datasets [3.9] Vision Transformer (ViT) は、長距離依存をモデル化する強力な能力のため、様々な視覚タスクにおいて有意義な可能性を証明している。
本稿では,マルチスケールの自己認識機構とコンボリューションブロックを備えた小型ViTアーキテクチャを提案する。
CIFAR-100では14.0Mパラメータと2.5GFLOPで84.68%の精度を達成し、大規模なデータセットで事前トレーニングを行わない。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:33:55 GMT)
Cross-Modal Transferable Image-to-Video Attack on Video Quality Metrics [3.8] 最新の画像品質評価(IQA/VQA)メトリクスは、敵の攻撃に対して脆弱である。
文献で研究されている攻撃のほとんどはホワイトボックス攻撃であり、VQAの文脈におけるブラックボックス攻撃は、あまり注目されていない。
本稿では,現代のVQAモデルの脆弱性の探索を目的としたクロスモーダル攻撃手法IC2VQAを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:12:09 GMT)
The Theater Stage as Laboratory: Review of Real-Time Comedy LLM Systems for Live Performance [3.8] 我々は、AIコメディは、実環境、観客の前で物理的またはオンラインの空間を共有し、リアルタイムの制約の下で評価されるべきである、と論じる。
AIを応用した番組の成功例を用いて、ライブパフォーマンスが計算的ユーモア生成に3つの課題を提起することを示した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:38:55 GMT)
A Multi-Encoder Frozen-Decoder Approach for Fine-Tuning Large Language Models [3.7] 多様な自然言語タスクからなるマルチタスク構成において,デコーダの凍結の影響について検討する。
AlexaTMモデルの個別設定とマルチタスク設定の両方を微調整して実施した本実験では,凍結デコーダが自然言語出力のタスクに極めて有効であることが判明した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:43:23 GMT)
Building Symbiotic AI: Reviewing the AI Act for a Human-Centred, Principle-Based Framework [3.7] 欧州連合(EU)は、AIを規制する新たな法的枠組みであるAI Actをリリースした。
同時に、研究者はAIシステム(通称Human-Centred AI(HCAI))について、新たな視点を提供する。
本稿では,共生型AIシステムの設計と開発を特徴付ける原則を明らかにすることを目的とする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:53:10 GMT)
Secure Composition of Quantum Key Distribution and Symmetric Key Encryption [3.7] 量子鍵分布(QKD)により、アリスとボブは秘密鍵を秘密のチャネル上で共有し、物理法則にのみ拘束される敵に対する情報理論上のセキュリティを証明した。
セキュアな対称鍵ベース暗号アルゴリズムを用いたQKD確立鍵を用いた場合の問題点を考察し,ハイブリッド暗号に基づくアプローチを用いて構成の安全性の証明を行う。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:58:02 GMT)
LLM-Ehnanced Holonic Architecture for Ad-Hoc Scalable SoS [3.6] 推論,通信,機能レイヤを含むホロンの階層化アーキテクチャを提案する。
第2に、インテリジェント製造の原則に触発され、スーパーバイザー、プランナー、タスク、リソースホロンといった専門ホロンを導入します。
これらの専門ホロンは、意思決定をサポートし、リアルタイム適応性を確保するために、推論層内で大きな言語モデルを利用する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:35:54 GMT)
Optimal Sampling for Generalized Linear Model under Measurement Constraint with Surrogate Variables [3.6] 場合によっては、代理変数はデータセット全体を通してアクセスでき、真の応答変数の近似として機能する。
本稿では,サロゲート変数から得られる情報を効果的に活用する最適なサンプリング戦略を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:01:02 GMT)
Threshold Attention Network for Semantic Segmentation of Remote Sensing Images [3.5] 自己認識機構(SA)はセグメンテーションネットワークの設計に有効な手法である。
セマンティックセグメンテーションのための新しいしきい値注意機構(TAM)を提案する。
TAMに基づいて,セマンティックセグメンテーションのためのしきい値注意ネットワーク(TANet)を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:09:55 GMT)
PhyDeformer: High-Quality Non-Rigid Garment Registration with Physics-Awareness [3.5] PhyDeformerは、高品質なメッシュ登録のための新しい変形方法である。
第1フェーズでは、メッシュテンプレートとターゲットメッシュとの間の粗い3Dアライメントを達成するために、衣服グレーディングが行われる。
グラデーションメッシュは、ジャコビアンベースの変形フレームワークと組み合わせた最適化により、3Dターゲットの微細な細部と整合するように洗練される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:02:59 GMT)
Gapless higher-order topology and corner states in Floquet systems [3.4] 異なるFloquet HOTP間の臨界点に現れる0と$pi$のコーナーモードを解析的に特徴付け,数値的に示す。
我々の研究は、フロケ系におけるコーナーモードの生き残りトポロジカル遷移の可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:45:07 GMT)
Early prediction of the transferability of bovine embryos from videomicroscopy [3.4] 2Dタイムラプス顕微鏡映像を入力として4日以内に胚移植性を予測することを目的としている。
本稿では3つの経路を含む3次元畳み込みニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:56:59 GMT)
Rethinking Decoders for Transformer-based Semantic Segmentation: A Compression Perspective [3.2] セマンティックセグメンテーションと圧縮の間には根本的な関係があることを論じる。
PrIncipled SemantiC SegemenTation(DEPICT)のためのホワイトボックス完全注意型Decoderを考案した。
ADE20Kで行った実験では、DEPICTはブラックボックスであるSegmenterよりも一貫して優れていた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:34:00 GMT)
Globally Convergent Variational Inference [3.1] 本研究では, 特定の VI 手法のグローバル収束性を確立する。
この方法は神経後部推定(NPE)の例と考えられる。
アブレーション研究と実際的な問題では,NPEの非漸近的有限ニューロン設定における挙動が説明できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:36:32 GMT)
Refusal Behavior in Large Language Models: A Nonlinear Perspective [3.0] 大きな言語モデル(LLM)における拒絶行動は、有害、非倫理的、不適切なプロンプトに対する反応を減少させる。
本稿では,3つの建築家族の6つのLLMにおける拒絶行動について検討する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:23:18 GMT)
Gandalf the Red: Adaptive Security for LLMs [2.9] 大規模言語モデル(LLM)アプリケーションにおける迅速な攻撃に対する防御の現在の評価は、しばしば2つの重要な要因を見落としている。
D-SEC(Dynamic Security Utility Threat Model)を提案する。
我々は、クラウドソースでゲーミフィケーションされたレッドチームプラットフォームであるGandalfを使って、279kのプロンプト攻撃のデータセットをリリースしました。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:30:49 GMT)
Smartphone-based Eye Tracking System using Edge Intelligence and Model Optimisation [2.9] 我々は、コンボリューショナルニューラルネットワーク(CNN)と2つの異なるリカレントニューラルネットワーク(RNN)を組み合わせることで、ビデオ型視覚のための2つの新しいスマートフォンアイトラッキング技術を開発した。
我々のCNN+LSTMモデルとCNN+GRUモデルは平均根平均角誤差0.955cmと1.091cmを達成した。
スマートフォンの計算制約に対処するため,スマートフォンによるアイトラッキングの性能向上を目的としたエッジインテリジェンスアーキテクチャを開発した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:57:04 GMT)
Training Hybrid Neural Networks with Multimode Optical Nonlinearities Using Digital Twins [2.8] 大規模非線形変換を行う多モードファイバに超短パルス伝搬を導入する。
ハイブリッドアーキテクチャのトレーニングは、光学系を微分的に近似するニューラルモデルによって達成される。
実験により,最先端の画像分類精度とシミュレーション精度が得られた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:35:18 GMT)
Hierarchical Autoscaling for Large Language Model Serving with Chiron [2.8] 大規模言語モデル(LLM)のサービス提供は、クラウドプロバイダにとってますます重要なワークロードになりつつある。
LLMサービスのための以前のオートスケーラは、不要なスケーリングとリソースのアンダーユーティリティ化につながる要求SLOを考慮しない。
我々は,待ち行列サイズ,利用率,SLOを用いて推定した階層的バックプレッシャを用いた自動スケーラであるChironを紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:57:40 GMT)
PRESERVE: Prefetching Model Weights and KV-Cache in Distributed LLM Serving [2.7] 大規模言語モデル (LLMs) は様々なアプリケーションで広く使われているが、その相当な計算要求は大きな課題を生んでいる。
モデル重みに対するメモリリードとKVキャッシュを重畳してLLM推論を最適化する新しいプレフェッチフレームワークであるPreSERVEについて述べる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:14:10 GMT)
Recognizing Artistic Style of Archaeological Image Fragments Using Deep Style Extrapolation [2.7] 考古学的な発掘で得られた古代の美術品は通常、ある程度の断片化と物理的劣化に悩まされている。
本研究では,画像断片の芸術的スタイルを予測するための一般化されたディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:49:16 GMT)
Derivation of Output Correlation Inferences for Multi-Output (aka Multi-Task) Gaussian Process [2.7] マルチタスクGP(MTGP)は、複数の出力の依存関係を考慮するために定式化される。
本稿ではMTGPの定式化とその勾配のフレンドリな導出を行う。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:35:49 GMT)
Private Collaborative Edge Inference via Over-the-Air Computation [2.7] 我々は、各クライアントのモデルをローカルデータセットで独立してトレーニングするワイヤレスエッジでの協調推論を検討する。
我々は、マルチアクセスチャネルの重畳特性を利用して、帯域効率の良いマルチユーザ推論手法を実装した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:58:24 GMT)
Decoding general error correcting codes and the role of complementarity [2.7] 一般的なQECCを扱うために,Calderbank-Shor-Steane(CSS)符号の復号回路を簡単に拡張できることを示す。
ブラックホール情報パラドックスの玩具モデルにおける復号回路のパワーを実証する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:03:43 GMT)
Language-Agnostic Modeling of Source Reliability on Wikipedia [2.6] 本稿では,ウィキペディアの複数の言語版にまたがる情報源の信頼性を評価するために,言語に依存しないモデルを提案する。
このモデルはソースの信頼性を効果的に予測し、英語のF1マクロスコアは約0.80に達する。
さまざまなリソースレベルの言語で一貫性のあるモデルパフォーマンスを維持するという課題を強調します。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:54:54 GMT)
Flash Window Attention: speedup the attention computation for Swin Transformer [2.6] Swin Transformerは、画像ピクセルの高解像度化に対応するために、ウィンドウアテンションを導入する。
このメカニズムは、画像をオーバーラップしないウィンドウに分割し、各ウィンドウ内での注意計算を制限する。
我々は、特にウィンドウアテンション用に調整された、Flash Window Attentionと呼ばれる最適化されたソリューションを提示します。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:16:54 GMT)
Random Policy Enables In-Context Reinforcement Learning within Trust Horizons [2.5] State-Action Distillation (SAD) は、ランダムポリシーのみによってガイドされる効果的な事前学習データセットを生成する。
SADはオフライン評価では236.3%、オンライン評価では135.2%で最高のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:18:03 GMT)
Feedback-driven object detection and iterative model improvement [2.4] 本稿では,オブジェクト検出モデルの改良を目的としたプラットフォームの開発と評価について述べる。
このプラットフォームでは、イメージのアップロードとアノテートに加えて、微調整されたオブジェクト検出モデルも可能だ。
手動アノテーションと比較して,半自動で最大53%の時間短縮効果を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:53:10 GMT)
Principles for Open Data Curation: A Case Study with the New York City 311 Service Request Data [2.3] ニューヨーク市(NYC)は、2012年にオープンデータ法が制定されて以来、この運動の最前線にある。
現在、ポータルは2700のデータセットをホストしており、さまざまな領域で研究するための重要なリソースとなっている。
オープンデータの効果的な利用は、データ品質とユーザビリティに大きく依存する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:06:20 GMT)
The Collection of a Human Robot Collaboration Dataset for Cooperative Assembly in Glovebox Environments [2.3] 産業4.0は、製造プロセスの近代化のための変革的ソリューションとしてAIを導入した。その後継である産業5.0は、AI駆動製造ソリューションを導くために、人間を協力者と専門家として想定している。
新しい技術は、共同組み立て中にシーン、特に手の位置を安全かつリアルタイムに識別できるアルゴリズムを必要とする。
このデータセットは、産業用人間ロボットコラボレーションシナリオにおいて、手動と手袋のセグメンテーションに向けたアプリケーションを構築する上で、困難な例を提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:39:22 GMT)
U-MATH: A University-Level Benchmark for Evaluating Mathematical Skills in LLMs [2.2] 教材から得られた大学レベルの未発表問題1,100件の新規ベンチマークであるU-MATHを紹介する。
6つの中核領域でバランスが取れており、20%のマルチモーダル問題がある。
U-MATH問題のオープンな性質を考えると、生成した解の正しさを判断するために LLM を用いる。
その結果,LLMはテキストベースのタスクでは最大63%の精度しか得られず,視覚的問題では45%以下であった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:58:47 GMT)
Private Electronic Payments with Self-Custody and Zero-Knowledge Verified Reissuance [2.2] われわれはGoodell、Toliver、Nakibによって記述されたデジタルトランスファーのプロトコルを構築している。
プロトコルを拡張して、再発行された資産の検証を可能にします。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:19:47 GMT)
Realization of a doped quantum antiferromagnet with dipolar tunnelings in a Rydberg tweezer array [2.2] 我々は、Rydberg tweezer プラットフォームを用いて、next-nearest neighbor (NNN) トンネルを$t'$で、ハードコアのボソニックホールをトンネルするドープ量子反強磁性を実現する。
ホール領域とスピン領域の動的位相分離を$|t/J|ll 1$で観測し、様々なスピン背景における反発束縛孔対の形成を実証する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:18:58 GMT)
Tomonaga-Luttinger Liquid Behavior in a Rydberg-encoded Spin Chain [2.1] 量子揺らぎは1次元系の長距離秩序を乱し、友長・ラッティンガー液体(TLL)の普遍的パラダイムに取って代わる。
我々は、スピン鎖の低エネルギー特性においてTLL物理学がどのように現れ、強磁性または反強磁性双極子XYハミルトニアンの下で相互作用するかを研究する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:03:51 GMT)
Reciprocal Reward Influence Encourages Cooperation From Self-Interested Agents [2.1] 自己関心の個人間の協力は、自然界で広く見られる現象であるが、人工的な知的エージェント間の相互作用においては、いまだ解明されていない。
そこで,本研究では,リターンに対する相手の行動の影響を再現するために,本質的に動機づけられた強化学習エージェントであるReciprocatorを紹介する。
本研究では,同時学習において,時間的に拡張された社会的ジレンマにおける協調を促進するために,共用者が利用できることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 23:08:11 GMT)
AI Guide Dog: Egocentric Path Prediction on Smartphone [2.1] 本稿では、視覚障害者のための軽量なエゴセントリックナビゲーション支援システムであるAIGDについて紹介する。
本稿では,GPS信号と高次方向を統合することで,ゴールベースの屋外ナビゲーションを可能にする新しい手法を提案する。
我々は、補助ナビゲーションシステムにおけるさらなる革新を促進するために、方法、データセット、評価、デプロイメントの洞察を提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:21:17 GMT)
Are LLMs Good Literature Review Writers? Evaluating the Literature Review Writing Ability of Large Language Models [2.0] 本稿では,大規模言語モデルの文献レビュー作成能力を自動評価するフレームワークを提案する。
我々は,3つのタスク(参照の生成,要約の執筆,文献レビューの執筆)でLLMの性能を評価する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:16:45 GMT)
Inference-Time-Compute: More Faithful? A Research Note [2.0] 忠実なCoT試験において,2つのITCモデル(Qwen-2.5とGemini-2に基づく)を評価した。
MMLU質問に対する回答に影響を与えるプロンプトにおいて,モデルが明瞭に手がかりを提示するかどうかを検証する。
私たちがテストしたITCモデルは、忠実性を大幅に改善したことを示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:31:45 GMT)
AI Foundation Models for Wearable Movement Data in Mental Health Research [2.0] 本稿では,時系列ウェアラブル運動データを対象とした最初のオープンソース基盤モデルであるPretrained Actigraphy Transformer (PAT)を紹介する。
PATは、いくつかのメンタルヘルス予測タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:10:46 GMT)
Wasserstein distances and divergences of order $p$ by quantum channels [1.9] 量子力学的最適輸送問題の2次でない一般化を導入する。
この一般的な機械に基づいて、$p$-Wasserstein 距離と発散を導入する。
ワッサーシュタインの発散に対する三角形の不等式は、関係する状態の任意の1つが純粋であるという唯一の仮定の下で証明する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:29:05 GMT)
The Qudit Cirq Library: An Extension of Google's Cirq Library for Qudits [1.8] Qudit CirqライブラリはGoogleのqudits用Cirqライブラリの拡張である。
我々の拡張は、キューディットの作成、一般的なキューディットゲートの適用、回路の構築、これらの回路上の量子計算のシミュレーションのためのビルトインメソッドを備えている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:21:21 GMT)
Data-driven inventory management for new products: A warm-start and adjusted Dyna-$Q$ approach [1.8] 本稿では,新発売商品の在庫管理を行うための新しい強化学習アルゴリズムを提案する。
調整したDyna-$Q$は、30日間の試験において、全アルゴリズムにおいて、最小の総コスト、最小の総コストの分散、および比較的低い不足率を有することを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:40:08 GMT)
Superdiffusive transport in chaotic quantum systems with nodal interactions [1.8] 超拡散輸送を示す節間相互作用を持つ$d$次元で相互作用するフェルミオン量子モデルのクラスを導入する。
相互作用の結節構造が、拡散定数のばらつきをもたらす長寿命準粒子励起を引き起こすことを、非摂動的に確立する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:00:04 GMT)
Ensemble of Large Language Models for Curated Labeling and Rating of Free-text Data [1.7] 本稿では,プライバシ制約下での自由テキストデータにおける所定のトピックのラベル付けを強化する枠組みを提案する。
我々は,摂食障害関連フォーラムから公開されているRedditデータと摂食障害患者の自由テキスト応答を用いて,アンサンブルアプローチを評価した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:08:16 GMT)
High-dimensional learning of narrow neural networks [1.7] この原稿は、機械学習の最近の進歩の根底にあるツールとアイデアをレビューしている。
本稿では,これまで研究されてきたモデルを特殊インスタンスとして包含する汎用モデル(シーケンスマルチインデックスモデル)を提案する。
複製法や近似メッセージパッシングアルゴリズムなどの統計物理手法を用いて,シーケンス多重インデックスモデルの学習過程を詳細に解析する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 23:31:03 GMT)
Automating Explanation Need Management in App Reviews: A Case Study from the Navigation App Industry [1.6] 本稿では,ユーザレビューにおける説明要求を管理するための半自動アプローチを提案する。
このアプローチは分類のカテゴリを活用して、レビューを分類し、関連する内部チームやレスポンスソースに割り当てる。
Google Play StoreとApple App Storeの2,366のアプリレビューが取り壊され、説明の必要性を検出するために単語とフレーズのフィルタリングシステムを使用して分析された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:57:16 GMT)
SAR Strikes Back: A New Hope for RSVQA [1.6] RSVQAフレームワークにSAR画像を導入するデータセットを提案する。
SAR画像は、現場から電磁的な情報を捉え、雲のような大気条件の影響を受けない。
本研究では,SARデータに光モダリティを融合させた場合,特に水域などの特定の土地被覆クラスに関する質問に対して,付加的な情報を提供することを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:07:48 GMT)
Layer-Adaptive State Pruning for Deep State Space Models [1.6] SSMのための構造化プルーニング法、Layer-Adaptive STate pruning (LAST) を提供する。
最後のスコアはサブシステムの$mathcalH_infty$ノルムと層次エネルギー正規化を用いて評価される。
平均的な33%の州は、再学習せずに、0.52%の精度で性能を保ち、マルチインプットのマルチアウトプットSSMでは精度が低下することを示した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:30:20 GMT)
Investigating Energy Efficiency and Performance Trade-offs in LLM Inference Across Tasks and DVFS Settings [1.6] 大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクにおいて大幅に改善されている。
LLMはリソース集約型であり、トレーニングと推論の両方に広範な計算資源を必要とする。
導入が加速するにつれて、LLMの持続性は重要な問題となっている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:02:33 GMT)
Hierarchical Repository-Level Code Summarization for Business Applications Using Local LLMs [1.5] 既存のメソッドは主に関数のような小さなコードユニットにフォーカスし、ファイルやパッケージのような大きなコードアーティファクトと競合する。
本稿では,ビジネスアプリケーションに適した,リポジトリレベルのコード要約のための2段階階層的アプローチを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:48:27 GMT)
Approximation Rates in Fréchet Metrics: Barron Spaces, Paley-Wiener Spaces, and Fourier Multipliers [1.5] フーリエ領域の対応する記号を近似することで線形微分作用素の一般近似機能について検討する。
その意味で、近似誤差をFr'echetメートル法で測定する。
すると、我々は主定理の自然な拡張に焦点を合わせ、そこでは半ノルムの列の仮定を小さくすることができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:40:35 GMT)
Optimal Classification Trees for Continuous Feature Data Using Dynamic Programming with Branch-and-Bound [1.4] 与えられたサイズ制限内でのトレーニング性能を最大化する最適な分類木はNPハードであり、実際にはほとんどの最先端手法は、深さ3の最適木を計算できない。
本稿では,分岐とバウンドを持つ動的プログラミングを用いて,連続的な特徴データに基づいて木を直接最適化する新しいアルゴリズムを提案する。
実験により、これらの手法は、最先端の最適手法よりも1桁以上の実行時間を改善するとともに、グレディよりもテスト精度を5%向上することを示した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:46:33 GMT)
XVertNet: Unsupervised Contrast Enhancement of Vertebral Structures with Dynamic Self-Tuning Guidance and Multi-Stage Analysis [1.4] 胸部X線は救急医療の主要な診断ツールであり続けているが、微細な解剖学的詳細を捉える能力に限界があるため、診断が遅れることがある。
XVertNetは,X線画像における脊椎構造の可視化を著しく向上するために設計された,新しいディープラーニングフレームワークである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:10:52 GMT)
Evaluation of Artificial Intelligence Methods for Lead Time Prediction in Non-Cycled Areas of Automotive Production [1.3] 本研究では,自動車生産環境における人工知能適用の有効性について検討した。
データ構造は、コンテキストの特徴を識別するために分析され、ワンホット符号化を使用して前処理される。
この研究は、高度に可変された生産データにAIメソッドを効果的に適用し、ビジネス価値を付加できることを実証している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:00:27 GMT)
Everybody Likes to Sleep: A Computer-Assisted Comparison of Object Naming Data from 30 Languages [1.3] オブジェクト命名データセットは、人間が周囲のオブジェクトにどのようにアクセスし、選択するかについての洞察を得るために使用される。
本研究は,多言語・コンピュータ支援手法を用いて,現在のオブジェクトの命名データを透過的かつ同等にすることを試みる。
本研究は,言語横断的オブジェクト命名研究の基盤となる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:50:00 GMT)
Exploring visual language models as a powerful tool in the diagnosis of Ewing Sarcoma [1.3] ユーイング肉腫(Ewing's sarcoma, ES)は、特に青年期において重要な健康上の問題である。
本研究では,他の軟部組織や骨肉腫とESを区別するための各種事前訓練戦略の特徴抽出能力について検討した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:47:35 GMT)
A Comparative Analysis of DNN-based White-Box Explainable AI Methods in Network Security [1.3] 本稿では,ニューラルネットワークモデルのエンドツーエンドフレームワークを用いて,NIDSのWhite-Box XAI技術(特にLRP,IG,DeepLift)を適用し,評価する。
グローバルおよび地域の範囲を評価し,6つの異なる評価尺度(記述精度,疎度,安定性,堅牢性,効率,完全性)について検討する。
その結果,White-box XAI技術を用いることで,IDSにとって重要な指標であるロバスト性や完全性が高く評価されることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:57:20 GMT)
Quantifying the Importance of Data Alignment in Downstream Model Performance [1.3] 本研究では,Task2Vecに基づくアライメント係数を用いて,トレーニングデータと評価データとのアライメントが下流の性能に与える影響を定量化する。
モデルのトレーニングと評価データのアライメント係数と,各下流タスクにおけるモデルの損失/複雑度との間には,強い負の相関関係が認められた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 23:59:23 GMT)
Examining the Representation of Youth in the US Policy Documents through the Lens of Research [1.2] この研究は、学術研究と政策定式化の関係を明らかにすることを目的としている。
本研究は、政策文書における引用を受ける若者研究における頻繁に議論されるトピックの特定、政策における引用率の向上に寄与する若者研究におけるパターンの識別、政策文書を引用する若者研究におけるトピックのアライメントの比較という3つの重要な課題に焦点をあてる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:54:07 GMT)
A Similarity Measure Between Functions with Applications to Statistical Learning and Optimization [1.2] 2つの関数間の類似性の新たな尺度を示す。
2つの函数の準最適ギャップが相互にどのように変換するかを定量化し、機能的類似性のいくつかの既存の概念を統一する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:52:27 GMT)
The Impact of AI-Driven Tools on Student Writing Development: A Case Study From The CGScholar AI Helper Project [1.1] CGScholar (Common Ground Scholar) AI Helperの英語教育における11年生の書き方に関するパイロット研究活動への影響についての検討
CGScholar AI Helperは、特定のAI生成フィードバックを提供することで、学生の執筆作業を支援するために設計された、革新的で革新的なWebベースアプリケーションである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:38:14 GMT)
PINN-FEM: A Hybrid Approach for Enforcing Dirichlet Boundary Conditions in Physics-Informed Neural Networks [1.1] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)を解く
本稿では, PINNを有限要素法(FEM)と組み合わせ, ドメイン分解による強いディリクレ境界条件を課すハイブリッド手法PINN-FEMを提案する。
この方法はFEMに基づく表現を境界付近に組み込み、収束を損なうことなく正確な強制を確実にする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:47:15 GMT)
Cooperative and Asynchronous Transformer-based Mission Planning for Heterogeneous Teams of Mobile Robots [1.1] エージェント間の分散意思決定を協調するための協調型非同期トランスフォーマーベースミッションプランニング(CATMiP)フレームワークを提案する。
我々は,CATMiPを2次元グリッドワールドシミュレーション環境で評価し,その性能を計画に基づく探索法と比較した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:43:44 GMT)
Quantum Direct Steganography Scheme Based on Modified Generator Projection Directions of Steane Code over a Single-Type Pauli Channel [1.1] 量子安定化器符号におけるジェネレータ投影方向(MGPD)の修正手法を提案する。
単一型パウリチャネルを横断する直接量子ステガノグラフィーのための新しいスキームを開発した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:10:15 GMT)
Benchmarking Classical, Deep, and Generative Models for Human Activity Recognition [1.0] 本稿では,古典的機械学習,ディープラーニングアーキテクチャ,ボルツマンマシン(RBM)の3つのカテゴリのモデルの性能を評価する。
我々は、決定木、ランダムフォレスト、コナールニューラルネットワーク(CNN)、ディープリーフネットワーク(DBN)など、さまざまなモデルを評価する。
その結果、CNNモデルは、特にバークレーMHADにおいて、すべてのデータセットで優れたパフォーマンスを提供することが示された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:36:11 GMT)
Cognitive Assessment and Training in Extended Reality: Multimodal Systems, Clinical Utility, and Current Challenges [1.0] 拡張現実(XR)技術は、現実世界のタスクをシミュレートする没入的でインタラクティブな環境を提供することによって、認知評価とトレーニングを変革している。
XRは、ガルバニック皮膚反応(GSR)、脳波(EEG)、眼球追跡(ET)、手追跡、身体追跡などのツールを通じて、リアルタイムのマルチモーダルデータ収集を可能にしながら、生態学的妥当性を高める。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:22:36 GMT)
Data-driven system identification using quadratic embeddings of nonlinear dynamics [1.0] 我々はQENDy(Quadratic Embedding of Dynamics)と呼ばれる新しいデータ駆動手法を提案する。
このアプローチは、力学が二次となる高次元の特徴空間へのシステムの埋め込みに基づいている。
本稿では,様々なベンチマーク問題の助けを借りてQENDyの有効性と精度を説明し,その性能をSINDyや2次埋め込みを同定するためのディープラーニング手法と比較する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:37:03 GMT)
Interfacing superconducting nanowire single photon detectors with cryogenic opto-electronics for quantum photonic applications [0.9] アクティブフォトニック成分を持つ対向単光子検出器は、グラインドストーンフォトニック量子技術である。
本稿では, 商用超伝導ナノワイヤ単光子検出器の出力信号を用いて, レーザーや電気光学変調器などの光化学成分を駆動する方法について述べる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:01:55 GMT)
Agent-Centric Projection of Prompting Techniques and Implications for Synthetic Training Data for Large Language Models [0.9] 本稿では,Large Language Models(LLMs)における線形コンテキスト(連続的な相互作用の連続配列)と非線形コンテキスト(分岐やマルチパス)の概念を紹介し,解説する。
これらの概念は、プロンプト戦略とマルチエージェントシステムとの深い関係を明らかにするフレームワークであるプロンプトテクニックのエージェント中心のプロジェクションの開発を可能にする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:26:43 GMT)
A Multi-way Parallel Named Entity Annotated Corpus for English, Tamil and Sinhala [0.9] 本報告では, 名前付きエンティティ (NE) を付加した英語-タミル・シンハラコーパスについて述べる。
事前訓練された多言語言語モデル(mLM)を用いて、シンハラとタミルのデータセット上で、新しいベンチマークNER(Named Entity Recognition)結果を確立する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:02:56 GMT)
RoHan: Robust Hand Detection in Operation Room [0.8] 露伴(ろはん)は手術室における手探りの新しい手法である。
ハンドウェア用手袋の合成画像を用いて,一般公開されているハンドデータセットを増強する手法であるArtificial Glovesを用いている。
術中切開再建術と静脈グラフト採取術の2つのデータセットを用いて本法の評価を行った。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:46:07 GMT)
Shadow Pauli Flow: Characterising Determinism in MBQCs involving Pauli Measurements [0.8] 測定ベース量子コンピューティング(MBQC)における決定性の新しい特徴付けについて紹介する。
片方向モデルは、グラフで表される大きな絡み合った状態に対して局所的な測定を行う。
全体的な決定論的計算を行うには、各測定の非決定性のために補正戦略が必要である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:28:07 GMT)
Modular Compilation for Quantum Chiplet Architectures [0.8] チップレットベースの量子コンピュータに最適化された完全並列化コンパイルパイプラインSEQCを提案する。
SEQCは回路忠実度が最大36%向上し、実行時間が最大1.92倍になった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:41:29 GMT)
Formalising lexical and syntactic diversity for data sampling in French [0.8] ランダムサンプリングに対する多様性は著しく増大する。
様々な種類の多様性(語彙と構文の多様性)が、高価な構文の多様性をサンプリングする目的と相関しているかどうかを考察する。
これは、任意に選択された測度が、データセットの多様性に関連する特性を捉えていないことを示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:47:33 GMT)
A Feature-Level Ensemble Model for COVID-19 Identification in CXR Images using Choquet Integral and Differential Evolution Optimization [0.8] 新型コロナウイルスのパンデミックを緩和するための効果的な戦略は、感染した個人を特定するための検査を統合することである。
RT-PCRは、新型コロナウイルスの診断における金の基準と考えられているが、偽陰性のリスクなどいくつかの制限がある。
本稿では,事前学習したディープ・コーン・ニューラル・ニューラルネットワーク(DCNN)をアンサンブル学習フレームワークに統合した新しいディープラーニング診断システムを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:28:02 GMT)
Predicting Performance of Object Detection Models in Electron Microscopy Using Random Forests [0.7] 本研究では,透過電子顕微鏡(TEM)画像の欠陥を定量化するための深層学習に基づく物体検出モデルの性能評価手法を提案する。
本研究では,対象対象を正確に特定・分類する能力を評価するための指標として,対象検出F1スコアを予測するランダム森林回帰モデルを開発した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:23:11 GMT)
Large Language Model Interface for Home Energy Management Systems [0.7] 家庭用エネルギー管理システム(HMS)は、電力価格などの電力系統信号に基づいて家庭の電力使用量を調整する。
HEMSは、エネルギー資源、住宅、およびユーザニーズの特徴を反映した、よく整形されたパラメータ化を必要とする。
本稿では,ユーザと対話して,不適切な回答の理解とパラメータ化を行うインタフェースを提案し,その上で,HEMSを実装するためのパラメータを適切に出力する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:10:43 GMT)
Head Motion Degrades Machine Learning Classification of Alzheimer's Disease from Positron Emission Tomography [0.7] データ取得時の頭部の動きは画質を劣化させる。
PET画像のみに基づくバイナリ分類アルゴリズムを提案する。
動作補正画像の認知正規化やAD化の精度が高いことが判明した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:07:29 GMT)
Polynomial Threshold Functions of Bounded Tree-Width: Some Explainability and Complexity Aspects [0.7] 多変量体のツリー幅は、ハイパーグラフのツリー幅であり、その項に対応するハイパーエッジを持つ。
有界木幅の符号としてのブール関数の表現はしきい値表現と呼ばれる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:28:08 GMT)
Potential and Perils of Large Language Models as Judges of Unstructured Textual Data [0.6] 本研究は, 他のLCMが生成した要約の主題的アライメントを評価するために, 審査モデルとしてのLCMの有効性について検討する。
審査員としてのLSMは、人間のラッカーに匹敵するスケーラブルなソリューションを提供する一方で、人間は微妙で文脈固有のニュアンスを検出するのに優れています。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:49:14 GMT)
A Multi-Modal Approach for Face Anti-Spoofing in Non-Calibrated Systems using Disparity Maps [0.6] 顔認識技術は、顔の偽造攻撃に対して脆弱である。
ステレオ深度カメラはこのような攻撃を効果的に検出できるが、その高いコストで採用が制限される。
本稿では,顔の特徴を利用して異質情報を導き出すことにより,この課題を克服する手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:03:42 GMT)
Playing Devil's Advocate: Unmasking Toxicity and Vulnerabilities in Large Vision-Language Models [0.5] 大きなビジョンランゲージモデルは、特に潜在的に有害または安全でない応答を発生させる脆弱性を示す。
悪意のあるアクターは、これらの脆弱性を利用して、有害なコンテンツを自動(または半)で伝播することができる。
本研究では,LLaVA,InstructBLIP,Fuyu,QwenなどのオープンソースのLVLMの脆弱性を系統的に検討する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:27:40 GMT)
Less is More: The Influence of Pruning on the Explainability of CNNs [0.5] ディープラーニングモデルは数百万のパラメータを持ち、2つの大きな課題を提示します。
本稿では,この技術的複雑性の低減が説明可能性の認知に有効かどうかを考察する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:53:24 GMT)
Zero-shot 3D Segmentation of Abdominal Organs in CT Scans Using Segment Anything Model 2: Adapting Video Tracking Capabilities for 3D Medical Imaging [0.4] 我々は,8施設のTotalSegmentator CTデータセットのサブセットを用いて,SAM2の腹腔内臓器の分画能力を評価した。
The Dice similarity coefficient (DSC) and " negative prompts" were analyzed。
肝 0.821 pm 0.192,右腎 0.862 pm 0.212,左腎 0.870 pm 0.154,脾 0.891 pm 0.131。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:27:36 GMT)
Thermal Annealing and Radiation Effects on Structural and Electrical Properties of NbN/GaN Superconductor/Semiconductor Junctions [0.4] 窒化ニオブ(NbN)超伝導体は、量子コンピューティングにおいて重要な構成要素である。
本研究では,GaN上に作製したNbN薄膜の構造と超伝導特性に及ぼす高温アニールおよび高線量ガンマ照射の影響について検討した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:37:21 GMT)
Spiking Neural Network Accelerator Architecture for Differential-Time Representation using Learned Encoding [0.4] スパイキングニューラルネットワーク(SNN)はエネルギー効率の向上により近年注目を集めている。
SNNを実装する際の2つの重要な疑問は、既存のデータをスパイクトレインにエンコードする方法と、スパイクトレインをハードウェアで効率的に処理する方法である。
本稿では,これらの問題に,学習プロセスにエンコーディングを組み込むことで対処し,ネットワークが重みとともにスパイクエンコーディングを学習できるようにする。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:09:08 GMT)
Automated Detection and Analysis of Minor Deformations in Flat Walls Due to Railway Vibrations Using LiDAR and Machine Learning [0.3] 本研究では, 沿線線路の振動による平坦な壁面の微小変形を自動的に同定する手法を提案する。
高密度の地上レーザースキャナ(TLS)のLiDARサーベイとAI/ML技術を活用してデータの収集と分析を行う。
解析は平坦な壁に沿って断面を同定し,その変形を地盤の向きに対して推定することに焦点を当てた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:58:26 GMT)
Large Language Models For Text Classification: Case Study And Comprehensive Review [0.3] 各種言語モデル(LLM)の性能を,最先端のディープラーニングモデルや機械学習モデルと比較して評価する。
本研究は,提案手法に基づくモデル応答の有意な変動を明らかにした。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:02:38 GMT)
Union: A Trust-minimized Bridge for Rootstock [0.3] 我々は、Bitcoinとセカンダリブロックチェーン間のBTCのセキュアな転送を可能にする、信頼最小化ブリッジプロトコルであるUnionを提示する。
Unionは、Bitcoin上で楽観的な証明システムBitVMXのマルチパーティ版を使用して、少なくとも1人の参加者が正直なままであるという前提の下で安全に動作するブリッジを作成している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:04:40 GMT)
Optimal Scaling for the Proximal Langevin Algorithm in High Dimensions [0.3] MALAは、ターゲット密度の対数勾配をその分布に組み込んだサンプリングアルゴリズムである。
本稿では, 2 倍の微分可能なターゲット密度の広いクラスにおいて, 近位MALAは高次元のMALAと同じ最適スケーリングを享受していることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:01:45 GMT)
Transformers and Large Language Models for Efficient Intrusion Detection Systems: A Comprehensive Survey [0.3] 本稿では,サイバー脅威検出システムにおけるトランスフォーマーとLCMの利用状況について,包括的分析を行った。
様々なサイバー攻撃の背景情報や、この分野でよく使われるデータセットなど、トランスフォーマーの基本について論じる。
コンピュータネットワーク、IoTデバイス、重要なインフラストラクチャ保護、クラウドコンピューティング、SDN、自動運転車など、TransformerとLLMベースのIDSが実装されているさまざまな環境とアプリケーションについて検討している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:52:15 GMT)
Optimal trace-distance bounds for free-fermionic states: Testing and improved tomography [0.3] 相関行列の推定における誤差が状態のトレース距離誤差にどのように影響するかを示す。
我々は,自由フェルミオン状態の物性試験とトモグラフィーの大幅な進歩を導出した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:17:22 GMT)
Governing AI Agents [0.3] 生成AIツールの開発を開拓した企業は、現在AIエージェントを構築している。
本条は、AIエージェントから生じる問題を識別し、特徴付けるために、機関法と理論を用いる。
包括性、可視性、責任のガバナンス原則をサポートするためには、新しい技術的および法的基盤が必要である、と氏は主張する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:55:18 GMT)
Multigenre AI-powered Story Composition [0.3] コメディ、ロマンス、悲劇、風刺、ミステリーという5つの基本的なジャンルの存在を論じる。
パターンを構成するには、まずジャンルの特徴と一致する例を検索し、次に例のグループに最も具体的な一般化の形式を適用する。
どちらの段階でも、AIエージェントは道具であり、私たちのPatternTellerプロトタイプはストーリーコンポジションプロセスを操作するために呼び出されます。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:58:42 GMT)
Pseudo-Automation: How Labor-Offsetting Technologies Reconfigure Roles and Relationships in Frontline Retail Work [0.2] セルフサービスマシンは擬似自動化の一種であり、タスクを実際に自動化するのではなく、無給の顧客にオフセットする。
セルフサービスはしばしば、カスタマーサービスの悪化と小売業者の損失と盗難の増加で批判されている。
セルフチェックアウトの結果,キャッシュ処理作業に3つの変更が加えられた。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:39:33 GMT)
Deep Learning and Natural Language Processing in the Field of Construction [0.1] まず,建築分野における技術仕様の収集から用語を抽出するコーパス解析手法について述べる。
次に、言語パターンとインターネットクエリを用いてプルーニングのステップを実行し、最終用語の質を向上させる。
次に,各単語の埋め込みモデルと組み合わせをベースとした機械学習手法を提案し,抽出した用語からハイパーネムを検出する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:53:44 GMT)
"Wait, did you mean the doctor?": Collecting a Dialogue Corpus for Topical Analysis [0.1] 本稿では,話題分析に適したコーパスの構築を目的とした対話収集実験について述べる。
私たちは開発したメッセージングツールでコレクションを実行します。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:00:45 GMT)
Sparse Blossom: correcting a million errors per core second with minimum-weight matching [0.0] 本稿では,MWPMデコーダの高速実装について述べる。
我々のアルゴリズムはスパース・フラワーと呼ばれ、量子誤り訂正に関連する復号問題を直接解決するフラワー・アルゴリズムの変種である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:46:22 GMT)
deepTerra -- AI Land Classification Made Easy [0.0] DeepTerraは、機械学習と衛星画像を用いた陸面特徴の分類を容易にするために設計された総合的なプラットフォームである。
本稿では,DeepTerraの能力について概説し,様々な研究領域にどのように応用されたのか,今後の方向性について論じる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:55:20 GMT)
Zero-temperature phase-flip rate in a biased parametric oscillator [0.0] 変調周波数の半分の余剰ドライブは、状態対称性を持ち上げる効果的なバイアスを与える。
状態から「シャロウ」状態へ切り替える確率は異常に小さくなる。
結果は、非相互量子イジングシステムを実装するための道を開く。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:50:06 GMT)
Weight Averaging for Out-of-Distribution Generalization and Few-Shot Domain Adaptation [0.0] コンピュータビジョンにおけるアウト・オブ・ディストリビューションの一般化に対処する2つの手法が開発されている。
本稿では、損失正則化器として勾配類似性によってWAのモデル多様性を高めることを提案する。
また、WAとSAMを組み合わせることで、少数ショット領域適応の問題を解決することを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:04:05 GMT)
Using Deep Learning to Design High Aspect Ratio Fusion Devices [0.0] 我々は機械学習モデルをトレーニングし、良好な閉じ込め特性を持つ構成を構築する。
この方法で最適化された構成を確実に生成できることが示されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:45:16 GMT)
Unsupervised Feature Construction for Anomaly Detection in Time Series -- An Evaluation [0.0] 本稿では,初期時空間表現から検出器を構築すべきか,あるいは既存の自動変数構築ライブラリを用いて新しい(タブラリ)表現を計算すべきかを検討する。
5つの異なるデータセットに対して得られた結果は、tsfreshライブラリを使用して計算された新しい表現によって、分離フォレストのパフォーマンスが大幅に改善されたことを示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:41:46 GMT)
Tutorial: VAE as an inference paradigm for neuroimaging [0.0] このチュートリアルは、VAEの理論的基礎を概説し、収束問題や過剰適合といった実践的な課題に対処する。
我々はまた、神経イメージングにおけるVAEのキーとなる応用を強調し、意味のあるパターンを明らかにする可能性を実証した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:54:36 GMT)
TriMod Fusion for Multimodal Named Entity Recognition in Social Media [0.0] 本稿では, テキスト, ビジュアル, ハッシュタグ機能(TriMod)を統合した新しい手法を提案する。
我々は,既存の最先端手法よりもアプローチの優位性を実証し,精度,リコール,F1スコアの大幅な向上を実現した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:29:41 GMT)
TrIM, Triangular Input Movement Systolic Array for Convolutional Neural Networks: Architecture and Hardware Implementation [0.0] TrIMは、入力の三角移動に基づく革新的なデータフローである。
TrIMは、最先端のシストリックアレイと比較して1桁のメモリアクセス数を削減できる。
アーキテクチャは、毎秒453.6ギガオペレーションのピークスループットを達成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:23:05 GMT)
Time series forecasting for multidimensional telemetry data using GAN and BiLSTM in a Digital Twin [0.0] 近年,デジタル双生児に関する研究が増えている。
物理語をデジタルにミラーする以外に、収集・転送されたデータに関連するサービスを提供する必要がある。
これらのサービスの1つは、物理的部分の将来の振る舞いを予測することであり、有害なイベントを防止したり、より良いパフォーマンスを得るために改善を設計したりといったアプリケーションに繋がる可能性がある。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:20:55 GMT)
The Klein-Gordon equation with relativistic mass: a relativistic Schrödinger equation [0.0] クライン=ゴルドン方程式はローレンツ不変であるため、スピンレス粒子の波状挙動を記述する。
これは非相対論的極限におけるシュル・オーディンガー方程式となる。
このクライン=ゴルドン方程式は、ある種の相対論的シュル「オーディンガー方程式」であると主張することができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:43:43 GMT)
The Clifford hierarchy for one qubit or qudit [0.0] クリフォード階層は、ゲートテレポーテーションを用いてフォールトトレラントに実行できる量子ゲートの集合のネスト配列である。
我々はこれらの階層ゲートを3つの単純なゲートの積として一意に表現し、すべてのレベルの大きさの式も生成する。
クリフォードゲートを3つの基本クリフォードゲートのユニークな積として分解することは、広く適用可能である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:48:43 GMT)
Surface and Bulk Two-Level System Losses in Lithium Niobate Acoustic Resonators [0.0] ニオブ酸リチウム(英: Lithium niobate、LN)は、量子応用に用いられる音響共振器を構築するための有望な材料である。
我々の研究は、LNの表面TLS損失とバルクTLS損失の両方に定量的な境界を定めている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:12:53 GMT)
Stochastic Fluctuations and Brownian Motion Detection of Gravitons [0.0] グラビトン数$N_g$は、それらが生成する重力ノイズが物理系の巨大な試験粒子を変位させるのに十分な大きさである。
重力子を検出する実験は、多数の重力子による集団的変動を伴って提案されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 00:05:57 GMT)
Statistical Properties of Deep Neural Networks with Dependent Data [0.0] 本稿では, ディープニューラルネットワーク (DNN) 推定器の統計特性について, 従属データに基づく検討を行った。
このフレームワークは、他のDNNアーキテクチャや時系列アプリケーションの研究の可能性も提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:50:37 GMT)
State-of-the-Art Transformer Models for Image Super-Resolution: Techniques, Challenges, and Applications [0.0] Image Super-Resolutionは、解像度の低い画像から高解像度の画像を復元することを目的としている。
近年のトランス方式の進歩により画像の超解像化が進んでいる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:43:59 GMT)
Self-Instruct Few-Shot Jailbreaking: Decompose the Attack into Pattern and Behavior Learning [0.0] デモレベルの欲求探索を容易にするセルフインストラクトファウショットジェイルブレイク(Self-Instruct-FSJ)を提案する。
このフレームワークはFSJ攻撃をパターンと行動学習に分解し、より一般化された効率的な方法でモデルの脆弱性を利用する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:23:30 GMT)
Self-Attention as a Parametric Endofunctor: A Categorical Framework for Transformer Architectures [0.0] 我々は,自己意識の線形成分に着目したカテゴリー理論フレームワークを開発した。
クエリ、キー、値マップは自然に2-圏 $mathbfPara(Vect)$ のパラメトリック 1-同型を定義することを示す。
複数の自己アテンション層を積み重ねると、このエンドファウンタ上の自由モナドが構築される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:01:41 GMT)
Scientific Map of Artificial Intelligence in Communication (2004-2024) [0.0] 最も関連するテーマは、データフィケーション、AIとソーシャルメディアとデジタルジャーナリズムのリンクである。
生成AIの新たな領域は、ChatGPTのような新しいAIモデルと関連付けられている。
コミュニケーションにおけるAIの影響にもかかわらず、この分野はまだ構造化の過程にあり、統合されたトピックはほとんどない。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 10:18:40 GMT)
Role of Quantum Coherence in Kinetic Uncertainty Relations [0.0] 動力学的不確実性関係(KUR)は、単位時間当たりの遷移数の観点から電流の信号-雑音比を境界とする。
KUR違反と量子コヒーレンスとの正確な関係はいまだ解明されていない。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:24:54 GMT)
Revolutionizing Communication with Deep Learning and XAI for Enhanced Arabic Sign Language Recognition [0.0] 本研究では、MobileNetV3、ResNet50、EfficientNet-B2といった最先端のディープラーニングモデルを用いて、アラビア手話(ArSL)を認識するための統合的なアプローチを提案する。
提案システムは、認識精度の新たなベンチマークを設定するだけでなく、解釈可能性も重視し、医療、教育、包括的コミュニケーション技術への応用に適している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:49:49 GMT)
Retrieving Lost Atomic Information: Monte Carlo-based Parameter Reconstruction of an Optical Quantum System [0.0] 低信号強度のレジームでは、標準的なデータ解析手法はシステム特性を正確に見積もることができないことが多い。
そこで本研究ではモンテカルロシミュレーションを用いて,大規模なアンダーサンプルデータからのロバストパラメータ推定を効果的に復元する手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:06:46 GMT)
Relational Quantum Mechanics and Contextuality [0.0] 一貫性のあるヒストリー形式で量子論理にどのようにアプローチするかを検討することで、異なる観測者間でシステムに関する情報を共有することができるのかを明らかにすることができる。
現代史の数学的枠組みをRQMに組み込むとともに,その相違点を明確にするとともに,両者の解釈的相違点を明確にすることを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:41:41 GMT)
Quantum vortices leave a macroscopic signature in the normal fluid [0.0] それぞれの渦線は, 渦線間の平均距離よりも大きい, 通常の流体中のマクロなウェイクを生じさせることを示す。
超流動渦コアの微細な大きさからすると、これは驚くべきことだ。
ランダウが提唱した熱励起における流体の独立した構造の最初の証拠は、最近の実験的な発見の根底にあるかもしれない。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:49:16 GMT)
Quantum dimer models with Rydberg gadgets [0.0] Rydbergブロック機構は、中性原子配列に基づく量子シミュレーターにおいて重要な要素である。
本稿では,基礎となるRydbergブロックをより一般的な制約に変換する手法を提案する。
これらの状態は高忠実度で動的に生成可能であることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:56:12 GMT)
Quantum algorithm for copula-based risk aggregation using orthogonal series density estimation [0.0] 量子モンテカルロ積分 (Quantum Monte Carlo integration, QMCI) は、古典的なものよりも2次的なスピードアップを提供する。
本稿では、金融リスク管理における最も重要な数値課題の一つであるリスクアグリゲーションへの適用について考察する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:24:19 GMT)
Quantum Noise Suppression in Non-Hermitian Resonators at Exceptional Point [0.0] 例外点(EP)における非エルミート共振器に対する量子ノイズの影響について検討する。
システムの可逆マルコフ力学はリンドブラッドマスター方程式を用いてモデル化される。
しかし、$mathcalPmathcalT$-symmetric regimeのうち、システムは特定のパラメトリック領域内での安定性を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:13:10 GMT)
Quantum Machine Learning for Digital Health? A Systematic Review [0.0] 量子機械学習(QML)がデジタルヘルスデータ処理に経験的な優位性をもたらすかどうか、まだ明らかでない。
デジタル電子健康医療記録(EH/MR)と、EH/MRの適切なプロキシであると考えられるデータを含める。
デジタルヘルスにおけるQMLの応用は、主に医療サービス提供や公衆衛生ではなく、臨床上の意思決定支援に焦点を当てている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:45:05 GMT)
Primer on quantum weirdness [0.0] 基本量子力学の知識を仮定する。
我々は、射影子、密度作用素、ベルの不等式、絡み合い、リンドブラッド方程式としてアイデアを説明できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:43:22 GMT)
Poincare invariant interaction between two Dirac particles [0.0] スピン電子-電子相互作用は、2つの古典的相互作用によって古典的な用語で記述される。
ポアンカーの不変相互作用は同期記述における作用-反応原理を満たさない。
ポアンカーの不変相互作用は相対論的に不変であるため、高エネルギー散乱過程の解析に使用できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:30:41 GMT)
Physics-Informed Machine Learning for Microscale Drying of Plant-Based Foods: A Systematic Review of Computational Models and Experimental Insights [0.0] 植物由来食品材料の乾燥過程における微細な細胞変化に関する研究の現状を概観する。
データ駆動型モデルの出現とそのマイクロスケール細胞の挙動予測における限界に特に注意が払われる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:35:23 GMT)
Physics-Informed Latent Neural Operator for Real-time Predictions of Complex Physical Systems [0.0] ディープオペレータネットワーク(DeepONet)は、偏微分方程式(PDE)によって支配される系の代理モデルとして大きな可能性を示している。
この研究は、制限を克服する物理インフォームされた潜在演算子学習フレームワークPI-Latent-NOを導入している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:38:30 GMT)
Phase time and Ehrenfest's theorem in relativistic quantum mechanics and quantum gravity [0.0] 宇宙の波動関数の位相とともに構成空間の幾何が正定二乗ノルムの定義につながるかを示す。
通常の量子力学の定理に類似したエレンフェストの定理のバージョンを得る。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:02:49 GMT)
Phase of Flight Classification in Aviation Safety using LSTM, GRU, and BiLSTM: A Case Study with ASN Dataset [0.0] 本研究の目的は,NLP技術を用いて,事故後の出来事の物語から飛行の段階を推定できるかどうかを判断することである。
各種深層学習モデルの分類性能を評価した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:26:58 GMT)
Path Loss Prediction Using Machine Learning with Extended Features [0.0] 無線通信は経路損失モデリングに依存しており、伝搬環境の物理的詳細を含む場合に最も効果的である。
このような詳細へのアクセスにより、伝搬モデルはより正確にカバレッジを予測し、無線デプロイメントにおける干渉を最小限にすることができる。
予測精度を向上する機能群を導入し,その中でも重要なのが,広範囲な環境におけるモデル一般化の維持である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:44:35 GMT)
Optimizing Language Models for Grammatical Acceptability: A Comparative Study of Fine-Tuning Techniques [0.0] 本研究では,Open Pre-trained Transformer (OPT-125M) の微細チューニング(FT)について,CoLAデータセットを用いて検討した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:41:09 GMT)
Optimal spatial searches with long-range tunneling [0.0] グラバーの最適スケーリングは、長距離相互作用粒子の格子上に低次元で到達可能であることを示す。
我々の研究は、長距離システムの臨界度と短距離システムの臨界度を正確に関連付けている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:25:02 GMT)
On the use of Statistical Learning Theory for model selection in Structural Health Monitoring [0.0] 本稿では、構造健康モニタリング(SHM)におけるモデルがいかに一般化できるかに焦点を当てる。
回帰問題にドメイン知識を組み込むことで、保証されたリスクが低くなり、一般化が促進されることが示されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:56:05 GMT)
Observation of Jones-Roberts solitons in a paraxial quantum fluid of ligh [0.0] 熱ルビジウム蒸気を伝播する同軸近共振レーザビームを用いて超流動光を生成する。
我々は超流動層に有界渦対渦双極子を励起し、希薄パルスと後方への遷移を観察する。
量子流体の非圧縮性から圧縮性へのコヒーレンス移動を観察し,超流動速度相関を解析および実験的に検討した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 19:00:05 GMT)
New Quantum Algorithm for Principal Component Analysis [0.0] 量子主成分分析(QPCA)により、量子機械学習アルゴリズムへの新たな発展がもたらされた。
量子アルゴリズムの最近の進歩に触発されて、主成分分析を行うための代替的な量子フレームワークを提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:13:23 GMT)
Neutrino many-body flavor evolution: the full Hamiltonian [0.0] フルニュートリノ-ニュートリノハミルトニアンを用いた量子多体アプローチにおけるニュートリノフレーバーの進化について検討した。
本研究では,Loschmidtエコーの経時変化,片身の風味,運動可観測物,片身の絡み合いエントロピーについて論じる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:02:55 GMT)
Monotone Curve Estimation via Convex Duality [0.0] 主曲線は、滑らかな表現を通して基礎となるデータ構造を明らかにする強力なツールとして機能する。
本稿では、厳密な理論的正当化を伴う単調性に制約された新しい主曲線の枠組みを紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:48:13 GMT)
Monetary Evolution: How Societies Shaped Money from Antiquity to Cryptocurrencies [0.0] 多くの金融・ビジネスの専門家は、暗号通貨の領域で生み出された価値は薄い空気からの通貨の生成に似ていると主張している。
この研究は、これらの歴史的洞察を現代にまで拡張し、持続的な金融概念が再び金に対する理解を再定義していることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 07:36:01 GMT)
Modeling Entanglement-Based Quantum Key Distribution for the NASA Quantum Communications Analysis Suite [0.0] 遠距離での絡み合い分布の進展は、航空学や宇宙通信における新しい応用を可能にする可能性がある。
既存のNASA Quantum Communications Analysis Suite (NQCAS) ソフトウェアはそのようなアプリケーションであるが、モデルの理論的な結果を検証するために限られた実験データが存在する。
本稿では,NQCASの入力パラメータを用いたモンテカルロのQKDモデルを用いて,NQCASの検証のための推定QKDリンク予算を生成する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:39:47 GMT)
Mitigating Algorithmic Bias in Multiclass CNN Classifications Using Causal Modeling [0.0] 本研究では,分類問題におけるアルゴリズムバイアスの検出と緩和のために因果モデリングを適用した手法について述べる。
データセットはFairFaceデータセットから派生したもので、DeepFace事前トレーニングモデルによって生成された感情的なラベルが補足されている。
その結果、偏見のある分類は、すべてのクラスで男女の公平性を向上させ、無視できる影響、あるいは全体的な正確性においてわずかに改善した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:51:27 GMT)
Megastable quantization in generalized pilot-wave hydrodynamics [0.0] 調和ポテンシャルの古典粒子は連続エネルギースペクトルを生じさせ、対応する量子粒子は数え切れないほど無限の量子化されたエネルギーレベルを示す。
近年、歩行液滴として生成する古典的非マルコフ波動粒子は、様々な流体力学的量子アナログを示すことが示されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:40:24 GMT)
MD-Syn: Synergistic drug combination prediction based on the multidimensional feature fusion method and attention mechanisms [0.0] 薬物併用療法は、複雑な疾患に対して有望な治療効果を示し、薬剤耐性を低下させる可能性を示している。
薬物の組み合わせの可能性は非常に多いため、従来の実験ではそれらを全てスクリーニングすることは困難である。
本研究では,多次元特徴融合法とマルチヘッドアテンション機構に基づく計算フレームワークMD-Synを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:50:56 GMT)
Low-Temperature Gibbs States with Tensor Networks [0.0] 本稿では,量子多体系の温度平衡状態を低温で近似するテンソルネットワーク手法を提案する。
木テンソルネットワークアンサッツ内でのアプローチを実証するが、他のテンソルネットワークにも拡張できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:29:20 GMT)
Logical Error Rates for a [[4,2,2]]-Encoded Variational Quantum Eigensolver Ansatz [0.0] 本研究では,短期雑音,中間規模量子コンピューティング装置の計算精度を推定する枠組みを開発する。
結果は、現在の量子コンピュータが化学応用に有用な結果をもたらす誤差率を達成できることを示唆している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 05:43:14 GMT)
Keras Sig: Efficient Path Signature Computation on GPU in Keras 3 [0.0] Keras Sigは、ディープラーニングアプリケーションのためのパスシグネチャを計算するために設計された高性能なピソニックライブラリである。
Keras 3で新たに構築された textitKeras Sig は PyTorch や JAX,GPU など,広く使用されているディープラーニングバックエンドとのシームレスな統合を活用している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:00:01 GMT)
KAN KAN Buff Signed Graph Neural Networks? [0.0] グラフニューラルネットワーク(GNN)は、複雑なグラフ関係をモデル化するためにニューラルネットワークを使用する。
Kolmogorov-Arnold Neural Network (KAN)は、最近Multi-Layer Perceptron (MLP)の代替として登場した。
本稿では, Kans を Signed Graph Convolutional Networks (SGCNs) に統合する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 09:05:54 GMT)
Jochre 3 and the Yiddish OCR corpus [0.0] オープンソースのOCRツールスイートであるJochre 3を記述し、評価する。
現在のYiddish OCRコーパスには、658ページ、186Kトークン、840Kグリフが含まれている。
我々は6億6000万語をJochre 3 OCRで分析し、新しいOCRはYiddish Book Center OCR検索エンジンで検索できる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:21:39 GMT)
Is genuine nonlocality in the triangle network exclusive to pure states? [0.0] 遺伝的ネットワーク非局所性(英: Genuine network non-locality、GNN)とは、ローカルモデルでは説明できない独立したソースを持つネットワークにおける相関の存在を指す。
我々は、GNNが全てのソースに対して、リソースとして共同測定を伴う純粋な状態を送信する必要があることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:45:47 GMT)
Is Stochastic Gradient Descent Effective? A PDE Perspective on Machine Learning processes [0.0] 我々は、教師あり学習において広く使われている勾配降下法(SGD)を解析する。
双対性法はエントロピーとダイナミックスという2つの異なる方法を利用する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:33:30 GMT)
In-situ graph reasoning and knowledge expansion using Graph-PReFLexOR [0.0] グラフ推論とシンボリック抽象化を組み合わせてドメイン知識を動的に拡張するフレームワークであるGraph-PReFLexORを提案する。
強化学習に触発されて、推論は構造化されたマッピングとして定義され、タスクが知識グラフ、抽象パターン、そして最終的には最終回答を生み出す。
その結果、より優れた推論深度と適応性を示し、透明で多分野のAI駆動型発見の可能性を示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:52:41 GMT)
Improving Student Self-Efficacy in Quantum Computing with the Qubit Touchdown Board Game [0.0] Qubit Touchdown(クビットタッチダウン)は、量子コンピューティングに学生を紹介するために開発された2人プレイのボードゲームである。
量子コンピュータは、量子物理学の法則に基づく新しいタイプのコンピュータであり、異なるルールのセットに従うため、通常のコンピュータよりも早く特定の問題を解くことができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:19:59 GMT)
ImagiNet: A Multi-Content Benchmark for Synthetic Image Detection [0.0] 私たちは、写真、絵画、顔、雑多な4つのカテゴリにまたがる200万のサンプルのデータセットであるImagiNetを紹介します。
ImagiNetの合成画像はオープンソースとプロプライエタリの両方のジェネレータで作成され、各コンテントタイプの実際の画像はパブリックデータセットから収集される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:31:48 GMT)
Guiding the classification of hepatocellular carcinoma on 3D CT-scans using deep and handcrafted radiological features [0.0] 我々は,CT画像から組織学的に発現するHCCを自動予測し,放射線技師間の多様性を低下させる手法を提案する。
まず,問題となるデータベース上でCTスキャンからHCCを正確に予測できないことを示し,LI-RADSシステムにインスパイアされた2段階のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:10:29 GMT)
Frequency Fluctuations in Nanomechanical Resonators due to Quantum Defects [0.0] 2レベル系(TLS)欠陥はミリケルビン温度での消散を制御している。
フォノン結晶ナノメカニカル共振器の高速周波数変動を観測した。
周波数ノイズは、熱的に励起されたり、熱ゆらぎに強く結合された個々の遠方共振TLSと機械的結合によってよく説明される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:10:29 GMT)
FragPT2: Multi-Fragment Wavefunction Embedding with Perturbative Interactions [0.0] FragPT2は、複数の相互作用するアクティブフラグメントに対処する新しい埋め込みフレームワークである。
我々のフレームワークは、フラッグメント間相互作用項の徹底的な分類を提供する。
本手法は, 結合を切断することによって定義した破片に対しても有効であることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:50:08 GMT)
Fast, Scale-Adaptive, and Uncertainty-Aware Downscaling of Earth System Model Fields with Generative Machine Learning [0.0] 高分解能地球モデル(ESM)シミュレーションは、人為的気候変動の生態学的および社会経済的影響を評価するために不可欠である。
最近の機械学習アプローチは、ESMシミュレーションのダウンスケールにおいて有望な結果を示し、最先端の統計手法よりも優れている。
ゼロショット方式で再トレーニングすることなく、任意のESMシミュレーションを効率的に正確にダウンスケールする一貫性モデル(CM)を学習することで、これらの欠点に対処する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:14:57 GMT)
FARE: A Deep Learning-Based Framework for Radar-based Face Recognition and Out-of-distribution Detection [0.0] 短距離FMCWレーダを用いた顔認識とアウト・オブ・ディストリビューション検出のための新しいパイプラインを提案する。
提案システムは、レンジドップラーとマイクロレンジドップラー画像を利用する。
本手法は99.30%のID分類精度と96.91%のOOD検出AUROCを実現する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 21:08:08 GMT)
Extracting Error Thresholds through the Framework of Approximate Quantum Error Correction Condition [0.0] 物理ノイズに対する量子メモリのロバスト性は 2つの方法によって測定される。
正確で近似的な量子誤差補正(QEC)条件。
論理エラー率がシステムサイズで減少するかどうかを評価するデコーダ依存エラーしきい値。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 01:20:54 GMT)
Exploring Narrative Clustering in Large Language Models: A Layerwise Analysis of BERT [0.0] 本研究では,変圧器を用いた大規模言語モデルであるBERTの内部メカニズムについて検討する。
GPT-4を介して開発された物語のデータセットを用いて、BERTの階層的活性化を分析し、局所的なニューラル処理のパターンを明らかにする。
BERTは,後期層における物語コンテンツに基づく強力なクラスタリングを,段階的にコンパクトかつ異なるクラスタで実現していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:01:54 GMT)
Exploring Aviation Incident Narratives Using Topic Modeling and Clustering Techniques [0.0] 本研究は,国立運輸安全委員会(NTSB)データセットに高度自然言語処理(NLP)技術を適用した。
主な目的は、潜在テーマの識別、意味的関係の探索、確率的関係の評価、共有特性に基づくクラスタインシデントである。
比較分析の結果, LDAのコヒーレンス値は0.597, pLSAは0.583, LSAは0.542, NMFは0.437であった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:23:15 GMT)
Exact amplitudes of parametric processes in driven Josephson circuits [0.0] ジョセフソン回路における任意のパラメトリック過程を1次自由度近似で解析するための一般的な手法を提案する。
我々は、駆動SNAILおよびSQUIDベースの回路に対して、これらのパラメトリックプロセスの正確な振幅(超係数)を得る。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:03:19 GMT)
Evaluating Computational Accuracy of Large Language Models in Numerical Reasoning Tasks for Healthcare Applications [0.0] 医療分野で大きな言語モデル(LLM)が変革的なツールとして登場した。
数値推論の習熟度、特に臨床応用のような高い評価の領域では、未解明のままである。
本研究では,医療現場における数値推論作業におけるLCMの計算精度について検討した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:29:43 GMT)
Equivalence between exponential concentration in quantum machine learning kernels and barren plateaus in variational algorithms [0.0] 本研究では,変分量子アルゴリズムにおけるバレンプラトー(BP)間の厳密な接続と,機械学習のための量子カーネルの指数集中を定式化する。
この結果から,BPフリーな量子回路を構築するための提案手法が,機械学習に有用な量子カーネルの構築に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 06:37:15 GMT)
Entanglement Transition due to particle losses in a monitored fermionic chain [0.0] 量子エンタングルメントジャンプにおけるエントロピースケーリングのダイナミクスについて検討する。
システムパラメータをチューニングすることにより、絡み合いのエントロピーが対数から領域法則に変化する場合、測定誘起遷移が生じることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:19:50 GMT)
Enhancing the De-identification of Personally Identifiable Information in Educational Data [0.0] PIIは、学生や教師のプライバシーを保護し、信頼を維持するための重要な要件である。
本研究では,GPT-4o-miniモデルをPII検出タスクの費用対効果と効率的な解として検討した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:53:38 GMT)
Engineering LLM Powered Multi-agent Framework for Autonomous CloudOps [0.0] 我々はGenAIを活用して、既存のMontyCloudシステムのための自律的なCloudOpsのためのGenAIベースのソリューションを開発しました。
自律性と人的制御のバランスをとるマルチエージェントフレームワークMOYAを開発した。
このフレームワークは、さまざまな内部および外部システムを統合し、タスクオーケストレーション、セキュリティ、エラー軽減などの要因に最適化されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:30:10 GMT)
Empowering Persian LLMs for Instruction Following: A Novel Dataset and Training Approach [0.0] FarsInstructは,大規模言語モデルの命令追従能力を高めるために設計されたデータセットである。
FarsInstructは21の異なるデータセットにわたる197のテンプレートで構成されています。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:07:53 GMT)
Empirical Analysis of Pull Requests for Google Summer of Code [0.0] Google Summer of Code(GSoC)は、学生や新しいコントリビュータと経験豊富なメンターとをマッチングして、オープンソースプロジェクトに取り組むグローバルイニシアチブである。
本研究では,GSoCプログラム中にインターンが生成したプルリクエストの実証分析を行った。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:55:03 GMT)
EmoNeXt: an Adapted ConvNeXt for Facial Emotion Recognition [0.0] EmoNeXtは、適応型ConvNeXtアーキテクチャネットワークに基づく、表情認識のための新しいディープラーニングフレームワークである。
我々は、感情分類精度に関するFER2013データセット上で、既存の最先端ディープラーニングモデルよりもモデルの方が優れていることを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:23:36 GMT)
Electricity Price Prediction Using Multi-Kernel Gaussian Process Regression Combined with Kernel-Based Support Vector Regression [0.0] 本稿では,ドイツの電力価格を予測するためのハイブリッドモデルを提案する。
このアルゴリズムはガウス過程回帰(GPR)とサポート回帰ベクトル(SVR)を組み合わせたものである。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:01:36 GMT)
Dynamics of Quantum-Classical Systems in Nonequilibrium Environments [0.0] 量子系の力学は古典的な環境と結合し、平衡からそれを追い出す制約を受ける。
作用素や変数の集合の非平衡平均値に対する正確な運動方程式を導出する。
非平衡定常状態は、そのような状態を特徴づける反応速度と拡散相関関数とともに議論される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:45:23 GMT)
Dispersive nodal fermions along grain boundaries in Floquet topological crystals [0.0] Floquetゾーンの中心と/または境界付近に位置する非散逸的なギャップレスモードによって、動的バルク境界対応を符号化できることを示す。
二次元駆動時間反転対称性破壊絶縁体に対するこれらの一般的な結果を示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:28:37 GMT)
Developing Enhanced Conversational Agents for Social Virtual Worlds [0.0] この提案は、人工知能、自然言語処理、Affective Computing、ユーザーモデリングに関連するさまざまな技術を組み合わせている。
本提案は,Second Life ソーシャルバーチャルワールドに展開されている会話エージェントの具体的開発に成功して評価されている。
実験の結果,エージェントの対話行動は,そのような環境で対話するユーザの特定の特性に順応することがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:15:16 GMT)
Decomposition of unitary matrix into quantum gates [0.0] 任意のユニタリ行列を$X$ゲートの列に変換するアルゴリズムを提案する。
このアルゴリズムは任意のユニタリ行列に対するQ#の実装を生成するために使われる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:05:38 GMT)
Decoherence time of the ground state spin of $V_{B}$ centers in hexagonal boron nitride [0.0] 量子ビットの重要な特徴はデコヒーレンス時間であり、その持続時間と制御性は量子技術における実践的応用において重要である。
本研究では,hBN格子における負電荷のホウ素空孔,$V_B$中心の電子スピン脱コヒーレンス時間について検討する。
双極子超微粒子相互作用の存在下では、V_B$電子スピンのハーン・エチョコヒーレンス時間は、室温で約30:mathrmmu s$である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:10:49 GMT)
Decoding Quantum LDPC Codes using Collaborative Check Node Removal [0.0] 協調的な手法を用いて反復デコーダの性能を向上させるための戦略を提案する。
我々は、ビット分離の概念を使い、それをqubit分離に一般化する。
これにより、QLDPC符号の有害な構成に対してデコーダの性能を分析し改善する指標が得られる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:41:45 GMT)
DNN-Powered MLOps Pipeline Optimization for Large Language Models: A Framework for Automated Deployment and Resource Management [0.0] 本研究では、Deep Neural Networks(DNN)を活用してMLOpsパイプラインをLarge Language Models(LLM)に最適化する新しいフレームワークを提案する。
当社のアプローチでは,最適なパフォーマンスとコスト効率を維持しつつ,デプロイメント決定やリソース割り当て,パイプライン最適化を自動化するインテリジェントシステムを導入しています。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:15:32 GMT)
CuAsmRL: Optimizing GPU SASS Schedules via Deep Reinforcement Learning [0.0] 本研究では,GPU SASSスケジュールの最適化に自動アプローチを採用する。
自動最適化の鍵となるのは、RLエージェントを訓練して、人間の専門家がどのように手動でスケジューリングを行うかを模倣することだ。
実験の結果、CuAsmRLは既存のカーネルのパフォーマンスをさらに26%以上向上し、平均で9%以上向上できることがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 12:36:18 GMT)
Cost-Effective Robotic Handwriting System with AI Integration [0.0] このシステムは、ユーザから供給されたテキストをリアルなストローク軌跡に変換する。
システム全体のハードウェアコストは約56ドルであり、商業的な代替品を著しく減らしている。
この研究は、パーソナライズされた手書き文字技術への障壁を低くし、より広い読者に利用できるようにすることを目指している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:16:01 GMT)
Convergence of the denoising diffusion probabilistic models [0.0] 我々は,Ho,J.,Jain,A.,Abbeelで提示された拡散確率モデル(DDPM)の原版を解析した。
我々の主定理は、元のDDPMサンプリングアルゴリズムによって構築されたシーケンスは、時間ステップの回数が無限大になるにつれて、与えられたデータ分布に弱収束することを示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:11:38 GMT)
Convergence Analysis of Real-time Recurrent Learning (RTRL) for a class of Recurrent Neural Networks [0.0] Real-time Recurrent Learning (RTRL) はオンライン最適化アルゴリズムである。
これは、データシーケンス上の真の勾配損失を、シーケンスタイムステップの数として追従する。
RTRLの潜在的な応用分野の1つは、財務データの分析である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:46:36 GMT)
Comparative Analysis of Efficient Adapter-Based Fine-Tuning of State-of-the-Art Transformer Models [0.0] アダプタは、トレーニング時間のごく一部で微調整と比較して、同等またはより優れたパフォーマンスを達成することができる。
本研究は,多様な自然言語処理(NLP)アプリケーションにおいて,アダプタの選択と実装のための貴重な洞察とガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:37:40 GMT)
Charting the space of ground states with tensor networks [0.0] 1つの空間次元における状態の族に焦点をあて、各状態は有限結合次元の射影MPSとして表すことができる。
X$ 以上のパラメータ化された族に対して、ゼロ次元の族における基底状態のラインバンドルを一般化する gerbe を関連付ける。
ガーベが非自明な場合には,MPSテンソルを至る所で連続する基底状態の族を表現することが阻害されることが示される。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:59:00 GMT)
Can AI Help with Your Personal Finances? [0.0] 大規模言語モデル(LLM)は人工知能(AI)の変革的発展として登場した。
本稿では、米国を中心に、個人金融における重要な課題にLLMが取り組む可能性について考察する。
OpenAIのChatGPT、GoogleのGemini、AnthropicのClaude、MetaのLlamaなど、主要なLLMを評価し、正確な財務アドバイスを提供することの有効性を評価する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 02:28:28 GMT)
COOL: Efficient and Reliable Chain-Oriented Objective Logic with Neural Networks Feedback Control for Program Synthesis [0.0] Logicのチェーン(CoL)は、合成プロセスをアクティビティフローに編成し、プロセスを導くための制御を提供する。
我々のアプローチは、合成をモジュール化し、ニューラルネットワークの誤予測の影響を軽減します。
リレーショナルおよびシンボリック合成タスクの実験は、CoLがDSLプログラム合成の効率と信頼性を著しく向上させることを示している。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:42:23 GMT)
CG-MER: A Card Game-based Multimodal dataset for Emotion Recognition [0.0] 本稿では,感情認識に特化して設計された,包括的なフランス語マルチモーダルデータセットを提案する。
データセットには、表情、スピーチ、ジェスチャーの3つの主要なモダリティが含まれており、感情の全体像を提供する。
このデータセットには、自然言語処理(NLP)のような追加のモダリティが組み込まれ、感情認識研究の範囲を広げる可能性がある。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:08:56 GMT)
Breaking barriers in two-party quantum cryptography via stochastic semidefinite programming [0.0] 私たちは、ビットコミットメント、弱いコインフリップ、および不愉快な転送プロトコルを切り替えて、セキュリティを改善する方法を見つけました。
我々はまた、ゴミを宝にするために選択を使用することで、ラビンの排他的移動のための最初の量子プロトコルを産み出す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:40:57 GMT)
Benchmarking Multimodal Models for Fine-Grained Image Analysis: A Comparative Study Across Diverse Visual Features [0.0] ベンチマークでは、メインオブジェクト、追加オブジェクト、バックグラウンド、詳細、支配的な色、スタイル、視点の7つの重要な視覚的側面に焦点を当てている。
多様なテキストプロンプトから生成された14,580の画像のデータセットを使用して、7つの主要なマルチモーダルモデルの性能を評価した。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 14:50:57 GMT)
Balanced Neural ODEs: nonlinear model order reduction and Koopman operator approximations [0.0] 変分オートエンコーダ (VAEs) は次元の減少の潜在表現を学習するための強力なフレームワークである。
ニューラルネットワークは過渡系力学の学習において優れている。
標準ラテントODEは時変入力を持つシステムにおいて次元還元に苦しむことを示す。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 13:11:05 GMT)
Avoiding subtraction and division of stochastic signals using normalizing flows: NFdeconvolve [0.0] フローの正規化が確率分布の近似を$b$で生成することを示す。
この方法は当社のソフトウェアパッケージであるNFdeconvolveに実装されており、GitHubで公開されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:08:52 GMT)
Aviation Safety Enhancement via NLP & Deep Learning: Classifying Flight Phases in ATSB Safety Reports [0.0] 本研究では, LSTM, CNN, Bidirectional LSTM(BLSTM), Simple Recurrent Neural Networks(sRNN)を含む自然言語処理(NLP)とディープラーニングモデルを用いて, オーストラリア運輸安全局(ATSB)の安全レポートの飛行相を分類する。
LSTMは87%,88%,87%,88%であった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 08:18:41 GMT)
Automating Credit Card Limit Adjustments Using Machine Learning [0.0] ベネズエラの銀行は歴史的に、委員会を通じて手動でクレジットカード制限の調整を行った。
経済改善は今後数カ月でベネズエラのクレジットカード保有者を増やすと予想されている。
クレジットカードのリミットを配る作業を自動化するために,コスト依存型学習を用いた機械学習モデルを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:22:57 GMT)
Assessing AI Adoption and Digitalization in SMEs: A Framework for Implementation [0.0] 中小企業と大企業の間には、AIの利用において大きなギャップがある。
本研究は、インテリジェントトランスフォーメーションを実現するための重要な要因と障害を特定する。
主要な課題に対処し、実行可能なガイドラインを提供するためのフレームワークモデルを提案する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:10:25 GMT)
An AI-driven framework for rapid and localized optimizations of urban open spaces [0.0] オープンスペースは、サステナビリティ・ウェルビーングの強化における役割について、ますます認識されている。
本研究では,スカイビューファクタ(SVF)と可視性(可視性)を最適化するAI駆動型フレームワークを導入する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 11:19:52 GMT)
ASTRID -- An Automated and Scalable TRIaD for the Evaluation of RAG-based Clinical Question Answering Systems [0.0] 大言語モデル (LLMs) は, 臨床質問応答において有意な潜在性を示した。
RAGは、モデル応答の事実的正確性を保証するための主要なアプローチとして現れています。
現在のRAG自動測定は、臨床および会話のユースケースでは不十分である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:46:39 GMT)
AI Driven Water Segmentation with deep learning models for Enhanced Flood Monitoring [0.0] 洪水は大きな自然災害であり、毎年重大な死者と経済的な損失をもたらし、気候変動によって頻度が増している。
本研究では,UNet,ResNet,DeepLabv3の3種類の深層学習モデルの性能を比較する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 17:26:02 GMT)
A molecular dynamics framework coupled with smoothed particle hydrodynamics for quantum plasma simulations [0.0] 本稿では, 熱密物質状態下での量子プラズマのモデリングを, ハイブリッドスムーズ粒子流体力学-分子動力学処理により行う新しい手法を提案する。
この処理は、部分退化流体に対するボームの量子力学の解釈に基づいている。
ボルン=オッペンハイマー近似は適用せず、計算的に計算可能である。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 16:21:09 GMT)
A modular quantum gas platform [0.0] 本稿では,原子型量子ガスを用いたプログラマブル量子シミュレーションのためのモジュラプラットフォームの開発について報告する。
各モジュールのパフォーマンスは他のモジュールと切り離され、個々の検証とアウトプットのメンテナンスが可能になる。
この標準化されたハードウェア設計フレームワークは、Heidelberg Quantum Architectureと呼ばれ、オンデマンドで高度に適応可能な新しい世代の量子シミュレーション実験への道を開く。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 15:52:29 GMT)
A Survey on Pedophile Attribution Techniques for Online Platforms [0.0] ソーシャルメディアプラットフォームで使用されるペドフィラ属性の手法について概説する。
被疑者集合の大きさとテキストの長さが帰属タスクに及ぼす影響について検討した。
オンラインの性的捕食者のリスクを軽減するためのツールが提案されている研究はほとんどないことがわかった。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 18:25:07 GMT)
A Parameter-Efficient Quantum Anomaly Detection Method on a Superconducting Quantum Processor [0.0] 量子支援ベクトルデータ記述(QSVDD)と呼ばれる新しい量子機械学習手法を提案する。
QSVDDは従来のモデルと比較してパラメータ効率と精度の両方を達成することを目的としている。
超伝導量子プロセッサ上での一般画像データセットに対する量子異常検出法の最初の実装を実証する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 22:01:02 GMT)
A Near Quantum Limited Sub-GHz TiN Kinetic Inductance Traveling Wave Parametric Amplifier Operating in a Frequency Translating Mode [0.0] サブGHz周波数用動インダクタンス進行波パラメトリック増幅器(KI-TWPA)
非線形素子としてTiNを使用することで、NbTiNに対して約1桁のオーダーで必要なポンプ電力を削減できる。
増幅器は、広範囲のアプリケーションにおいて、高感度で高速な測定を可能にする可能性がある。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:35:17 GMT)
A Driver Advisory System Based on Large Language Model for High-speed Train [0.0] 大規模言語モデル(LLM)に基づくIDASフレームワークであるIDAS-LLMが導入された。
LLMのドメイン・ファイン・チューニングは、構築された鉄道知識問合せデータセットを用いて行われる。
RAGアーキテクチャは、生成した応答の説明可能性を高めるために、システム設計のために追求されている。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 04:41:03 GMT)
A Constant Velocity Latent Dynamics Approach for Accelerating Simulation of Stiff Nonlinear Systems [0.0] 厳密な常微分方程式(StODE)を解くには洗練された数値解法が必要であるが、しばしば計算コストがかかる。
本研究では,StODEの潜在力学を学習し,数値積分を完全に回避する手法を提案する。
言い換えれば、元の力学の解は一連の直線に符号化され、それを復号して実際の解を必要な時に取り出すことができる。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 20:32:31 GMT)
A Cascaded Dilated Convolution Approach for Mpox Lesion Classification [0.0] Mpoxウイルスは、他の皮膚疾患と視覚的に類似しているため、重要な診断上の課題を呈する。
深層学習に基づく皮膚病変分類のアプローチは、有望な代替手段を提供する。
本稿では,これらの課題に対処するためのCascaded Atrous Group Attentionフレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 14 Jan 2025 03:43:02 GMT)