MaxMin-RLHF: Alignment with Diverse Human Preferences [101.6] Reinforcement Learning from Human Feedback (RLHF) は、言語モデルと人間の嗜好を一致させる。
予測最大化アルゴリズムを用いて嗜好分布の混合を学習し、人間の嗜好をよりよく表現する。
従来のRLHFアルゴリズムよりも16%以上の勝利率向上を実現している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 00:15:20 GMT)
CLIP-GS: Unifying Vision-Language Representation with 3D Gaussian Splatting [88.2] 3DGSを基盤とした新しいマルチモーダル表現学習フレームワークであるCLIP-GSを提案する。
我々は,3DGS,画像,テキストの三重項を生成する効率的な方法を開発し,CLIP-GSによるマルチモーダル表現の学習を容易にする。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:54:25 GMT)
DiffPatch: Generating Customizable Adversarial Patches using Diffusion Model [88.1] DiffPatchと呼ばれる新しい拡散型カスタマイズ可能なパッチ生成フレームワークを提案する。
提案手法により,ランダムノイズから始めるのではなく,参照画像をソースとして利用することが可能になる。
我々は, YOLOv5sを対象とする物理逆TシャツデータセットAdvPatch-1Kを開発した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:47:08 GMT)
Dual-Decoupling Learning and Metric-Adaptive Thresholding for Semi-Supervised Multi-Label Learning [81.8] 半教師付きマルチラベル学習(SSMLL)は、正確なマルチラベルアノテーションを収集するコストを削減するために、ラベルのないデータを活用する強力なフレームワークである。
半教師付き学習とは異なり、インスタンスに含まれる複数のセマンティクスのため、SSMLLの擬似ラベルとして最も確率の高いラベルを選択することはできない。
本稿では,高品質な擬似ラベルを生成するための二重パースペクティブ手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:12:16 GMT)
LMFusion: Adapting Pretrained Language Models for Multimodal Generation [81.8] LMFusionは、事前訓練されたテキストのみの大規模言語モデル(LLM)をマルチモーダル生成機能で強化するフレームワークである。
複数モーダル生成モデルをスクラッチから事前訓練する手法と比較して, LMFusionは画像理解を20%改善し, 画像生成を3.6%改善し, FLOPの50%しか利用できないことを示した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:56:18 GMT)
Dynamic Skill Adaptation for Large Language Models [78.3] 動的スキル適応(Dynamic Skill Adaptation, DSA)は, 言語モデル(LLM)に新しい複雑なスキルを適応させる適応的かつ動的フレームワークである。
各スキルに対して,学習前スキルの詳細な記述を含む教科書的データと,学習前スキルの具体的活用を目標とした演習的データの両方を生成する。
LLAMA や Mistral のような大規模言語モデルを用いた実験は,提案手法が数学推論スキルや社会学習スキルに適応する上で有効であることを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 22:04:23 GMT)
Diffusion Model Based Visual Compensation Guidance and Visual Difference Analysis for No-Reference Image Quality Assessment [78.2] 本稿では, 複雑な関係をモデル化する能力を示す, 最先端(SOTA)生成モデルを提案する。
生成した拡張画像とノイズを含む画像を利用する新しい拡散復元ネットワークを考案する。
2つの視覚評価枝は、得られた高レベル特徴情報を包括的に解析するように設計されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:29:23 GMT)
The Mamba in the Llama: Distilling and Accelerating Hybrid Models [76.6] 注目層からの線形射影重みを学術的なGPU資源で再利用することにより,大規模な変換器を線形RNNに蒸留する方法を示す。
結果として得られたハイブリッドモデルは、チャットベンチマークのオリジナルのTransformerに匹敵するパフォーマンスを達成する。
また,Mambaとハイブリッドモデルの推論速度を高速化するハードウェア対応投機的復号アルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:27:51 GMT)
Mask Factory: Towards High-quality Synthetic Data Generation for Dichotomous Image Segmentation [71.0] Dichotomous Image (DIS) タスクは高度に正確なアノテーションを必要とする。
現在の生成モデルとテクニックは、シーンのずれ、ノイズによるエラー、限られたトレーニングサンプルの変動といった問題に苦慮している。
多様な正確なデータセットを生成するためのスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:37:25 GMT)
Concept Discovery in Deep Neural Networks for Explainable Face Anti-Spoofing [70.7] 最近の偽造防止モデルでは、「この顔は偽物だ」としか言えないが、「なぜ偽物なのか」と答える説明が欠けている。
提案するSPED(SPoofing Evidence Discovery)は,スプーフ概念を探索し,発見概念に基づいて信頼性の高い説明を提供するX-FAS法である。
実験の結果,SPEDは信頼性のある説明を生成できることがわかった。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:48:36 GMT)
Multi-Attribute Constraint Satisfaction via Language Model Rewriting [67.6] マルチ属性制約満足度(英: Multi-Attribute Constraint Satisfaction, MACS)は、言語モデルを微調整して、複数の外部実値属性に対するユーザ指定制約を満たす手法である。
我々の研究は、NLPやバイオインフォマティクスにまたがる多様な応用に影響を及ぼす、一般化および実値多属性制御のための新しい道を開く。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:36:39 GMT)
LLMs for Knowledge Graph Construction and Reasoning: Recent Capabilities and Future Opportunities [66.4] 知識グラフ(KG)の構築と推論のための大規模言語モデル(LLM)の評価。
我々は,LLMと外部ソースを用いたマルチエージェントベースのアプローチであるAutoKGを提案し,KGの構築と推論を行う。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:54:53 GMT)
PearSAN: A Machine Learning Method for Inverse Design using Pearson Correlated Surrogate Annealing [66.3] PearSANは、大きな設計空間を持つ逆設計問題に適用可能な機械学習支援最適化アルゴリズムである。
ピアソン相関代理モデルを用いて、真の設計計量のメリットの図形を予測する。
最先端の最大設計効率は97%で、少なくとも以前の方法よりも桁違いに高速である。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:02:19 GMT)
Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos [66.2] 鍵となる仮説は、個々のビューがより正確にビューに依存しないテキストの要約を予測できるほど、それがより情報的になるということである。
本稿では,ビュー依存キャプション予測の相対的精度を,擬似ラベルを最もよく見るためのプロキシとして利用するフレームワークを提案する。
推論中、我々のモデルは多視点ビデオ(言語やカメラのポーズなし)のみを入力として、各タイミングで見るのに最適な視点を返します。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 15:49:20 GMT)
Promptable Anomaly Segmentation with SAM Through Self-Perception Tuning [63.6] 異常セグメンテーションのための textbfSelf-textbfPerceptinon textbfTuning (textbfSPT) 法を提案する。
SPT法は, 自己描画型チューニング戦略を取り入れ, 異常マスクの初期粗いドラフトを生成し, 精製処理を行う。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:51:52 GMT)
Large Language Model as a Catalyst: A Paradigm Shift in Base Station Siting Optimization [62.2] 大規模言語モデル(LLM)とその関連技術は、特に迅速な工学とエージェント工学の領域において進歩している。
提案するフレームワークは、検索拡張生成(RAG)を組み込んで、ドメイン固有の知識を取得してソリューションを生成するシステムの能力を高める。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:14:28 GMT)
"I've Heard of You!": Generate Spoken Named Entity Recognition Data for Unseen Entities [59.2] 名前付きエンティティ認識(NER)は、名前付きエンティティを音声から識別することを目的としている。
しかし、新しい名前のエンティティが毎日現れ、Spoken NERデータに注釈をつけるのはコストがかかる。
そこで本稿では,NEDに基づく音声NERデータ生成手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:43:18 GMT)
SubjectDrive: Scaling Generative Data in Autonomous Driving via Subject Control [59.2] 我々は、自動走行アプリケーションの改善を継続的に行う方法で、生成データ生産を拡大することが証明された最初のモデルであるSubjectDriveを提案する。
本研究では, 多様なデータを生成するために, 多様な外部データソースを活用可能な, 主観制御機構を備えた新しいモデルを開発する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:33:31 GMT)
Enhancing Audiovisual Speech Recognition through Bifocal Preference Optimization [59.1] 実世界のビデオの音声認識精度を向上させるために、選好最適化手法を提案する。
まず、AV-ASRで発生した一般的なエラーを2つの焦点からシミュレーションすることで、嗜好データを生成する。
次に,AV-ASRモデルを改善するために,入力側と出力側の両方を優先してBPO-AVASRを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 00:26:45 GMT)
Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment [58.9] タスク選好最適化(TPO)は、典型的なきめ細かい視覚的タスクから派生した微分可能なタスク選好を利用する新しい手法である。
トレーニング中にリッチなビジュアルラベルを活用することで、TPOはMLLMのマルチモーダル能力とタスク固有のパフォーマンスを大幅に向上させる。
VideoChatとLLaVAによるこのアプローチのインスタンス化は、ベースラインモデルと比較して、総合的に14.6%のマルチモーダル性能の向上を示している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:56:05 GMT)
Generating Editable Head Avatars with 3D Gaussian GANs [57.5] 従来の3D-Aware Generative Adversarial Network (GAN) は、フォトリアリスティックでビューに一貫性のある3Dヘッド合成を実現する。
本稿では,3次元ガウススプラッティング(3DGS)を明示的な3次元表現として取り入れることで,3次元ヘッドアバターの編集性とアニメーション制御を向上する手法を提案する。
提案手法は,最先端の制御性を備えた高品質な3D認識合成を実現する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:10:03 GMT)
FineVQ: Fine-Grained User Generated Content Video Quality Assessment [57.5] 我々は,ファインVDと呼ばれる,複数の次元にまたがる詳細な品質スコアと記述を有する6104の動画からなる,最初の大規模ビデオ品質評価データベースを構築した。
本研究では,画質評価,品質評価,品質属性など,映像のきめ細かい品質を学習するための細粒度映像品質評価モデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:44:47 GMT)
A theory of appropriateness with applications to generative artificial intelligence [56.2] 我々は、AIによる意思決定を適切に評価し、改善するために、人間の意思決定がいかに適切かを理解する必要がある。
本稿では,人間の社会でどのように機能するか,脳でどのように実装されるのか,生成AI技術の展開に責任があるのか,という,適切性の理論について述べる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 00:54:03 GMT)
On the Expressiveness and Length Generalization of Selective State-Space Models on Regular Languages [56.2] SSM(Selective State-space Model)はTransformerの代替品である。
正規言語タスクにおける表現性や長さの一般化性能を解析する。
本稿では,Selective Dense State-Space Model (SD-SSM)を紹介する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 20:53:04 GMT)
Reversed in Time: A Novel Temporal-Emphasized Benchmark for Cross-Modal Video-Text Retrieval [56.1] クロスモーダル検索(例えば、画像テキスト、ビデオテキスト)は、情報検索およびマルチモーダル視覚言語理解分野において重要なタスクである。
本稿では,新しい時間強調ビデオテキスト検索データセットRTimeを紹介する。
私たちのRTimeデータセットは、現在1ビデオにつき10キャプションの21Kビデオで構成されており、合計で約122時間です。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:32:00 GMT)
Benchmarking Multi-dimensional AIGC Video Quality Assessment: A Dataset and Unified Model [56.0] 主観的・客観的な品質評価の観点からAIGC-VQA問題を考察する。
主観的観点からは,2,808本のAIGCビデオからなる大規模映像品質評価(LGVQ)データセットを構築した。
我々は,AIGCビデオの知覚的品質を,空間的品質,時間的品質,テキスト・ビデオアライメントの3つの重要な次元から評価した。
本稿では,AIGCビデオの多次元品質を正確に評価するUnify Generated Video Quality Assessment (UGVQ)モデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:21:00 GMT)
LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [55.0] Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:03:30 GMT)
TableRAG: Million-Token Table Understanding with Language Models [53.0] TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:58:31 GMT)
Biology Instructions: A Dataset and Benchmark for Multi-Omics Sequence Understanding Capability of Large Language Models [51.3] 本稿では,生物配列関連命令チューニングデータセットであるBiology-Instructionsを紹介する。
このデータセットは、大きな言語モデル(LLM)と複雑な生物学的シーケンスに関連するタスクのギャップを埋めることができます。
また、新たな3段階トレーニングパイプラインを備えたChatMultiOmicsという強力なベースラインも開発しています。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:12:23 GMT)
Adaptive Conformal Inference by Betting [51.3] データ生成プロセスについて仮定することなく適応型共形推論の問題を考察する。
適応型共形推論のための既存のアプローチは、オンライン勾配勾配の変種を用いたピンボール損失の最適化に基づいている。
本稿では,パラメータフリーなオンライン凸最適化手法を利用した適応型共形推論手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:42:08 GMT)
Perceive, Query & Reason: Enhancing Video QA with Question-Guided Temporal Queries [50.5] Video Question Answering (ビデオQA)は、ビデオ全体を理解するためにモデルを必要とする、難しいビデオ理解タスクである。
近年のMLLM(Multimodal Large Language Models)の進歩は,ビデオQAに特有なコモンセンス推論機能を活用して変化している。
本稿では,フレーム単位の視覚知覚とLCMの推論能力の間に疑問を導いた時間的ブリッジを生成する,新しい時間的モデリング手法であるT-Formerを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:53:14 GMT)
The Evolution of Quantum Secure Direct Communication: On the Road to the Qinternet [49.8] 量子セキュア直接通信(QSDC)は、確実に安全であり、量子コンピューティングの脅威を克服する。
関連するポイントツーポイント通信プロトコルについて詳述し、情報の保護と送信方法を示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:57:57 GMT)
Scratching Visual Transformer's Back with Uniform Attention [49.3] 本稿では,ViTモデルにおける注目度密度の役割について検討する。
必要な密接な相互作用を提供するために、VTモデルの各層に均一な注意を手動で挿入する。
CBの包含は、本来の注目マップにおける密度の程度を減少させ、ViTモデルのキャパシティと一般化可能性の両方を増大させる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:16:35 GMT)
Emptiness Instanton in Quantum Polytropic Gas [49.2] この問題は、気体の基底状態における空の間隔の自然発生の確率を決定することである。
虚空時間における流体力学方程式の解法により、空のインスタントンの解析形式を導出する。
この解は、等角体論における相関関数に類似した積分表現として表される。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:23:37 GMT)
SUTrack: Towards Simple and Unified Single Object Tracking [48.8] 我々はSUTrackと呼ばれる単純な統一された単一オブジェクト追跡(SOT)フレームワークを提案する。
5つのSOTタスクを単一のセッションでトレーニングされた統一モデルに統合する。
実験によると、SUTrackは5つのSOTタスクにまたがる11のデータセットで、以前のタスク固有のタスクよりも優れていた。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:41:36 GMT)
Improving GFlowNets for Text-to-Image Diffusion Alignment [48.4] 報酬を直接最大化するのではなく,比較的高い確率で高解像度画像を生成する手法を探索する。
提案手法は,大規模テキスト・画像拡散モデルと報酬情報とを効果的に一致させることができる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:30:48 GMT)
Simplified and Generalized Masked Diffusion for Discrete Data [47.7] 離散データの生成モデリングのための自己回帰モデルの代替として、マスケッド拡散(または吸収拡散)が積極的に研究されている。
本研究の目的は,マスク拡散モデルの潜在能力を最大限に活用する,シンプルで汎用的なフレームワークを提供することである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 22:33:58 GMT)
CSCPR: Cross-Source-Context Indoor RGB-D Place Recognition [47.1] 本稿では,RGB-D屋内位置認識のための新しいアルゴリズムであるCSCPRを提案する。
位置認識のためのRGBドメインに主にフォーカスする従来のアプローチとは異なり、CSCPRはRGB-Dデータを扱うように設計されている。
クロスソースおよびクロススケールなRGB-Dポイントクラウドを扱うためにCoCを適用し、再ランク付けのための2つの新しいモジュールを導入します。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:48:57 GMT)
Stochastic normalizing flows for Effective String Theory [45.0] 実効ストリング理論(EST)は純粋ゲージ理論の閉じ込めを研究するための強力なツールである。
格子上に正規化されるESTの効率的な数値計算法として,フローベースサンプリングが応用されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:58:09 GMT)
Revisiting Monocular 3D Object Detection from Scene-Level Depth Retargeting to Instance-Level Spatial Refinement [44.5] モノクロ3Dオブジェクト検出は、正確な深さの欠如により困難である。
既存の深度支援ソリューションは依然として性能が劣っている。
深度適応型モノクル3次元物体検出ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:51:50 GMT)
Virtual Nodes Can Help: Tackling Distribution Shifts in Federated Graph Learning [43.9] Federated Graph Learning (FGL)は、複数のクライアントが強力なグラフ学習モデルを共同でトレーニングすることを可能にする。
実世界では、グラフデータはクライアント間で大きな分散シフトに悩まされる可能性がある。
本稿では,FedVNという新しいFGLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:16:15 GMT)
Federated Hybrid Training and Self-Adversarial Distillation: Towards Robust Edge Networks [43.7] Federated Learning(FL)は、モバイルエッジネットワークにおけるデータのプライバシを高める分散トレーニング技術である。
We propose Federated hyBrid Adversarial Training and self-adversarial distillation (FedBAT)。
FedBATは、ハイブリッド逆行訓練と自己逆行蒸留を従来のFLフレームワークに統合する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 21:32:08 GMT)
Solving High-dimensional Inverse Problems Using Amortized Likelihood-free Inference with Noisy and Incomplete Data [43.4] 本研究では,高次元逆問題に対する正規化フローに基づく確率論的逆転法を提案する。
提案手法は,データ圧縮のための要約ネットワークとパラメータ推定のための推論ネットワークの2つの補完ネットワークで構成されている。
提案手法を地下水水文学における逆問題に適用し,空間的に疎らな時系列観測に基づく対流電界の後方分布を推定する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 21:57:29 GMT)
Decomposed Prototype Learning for Few-Shot Scene Graph Generation [42.7] シーングラフ生成のためのDPL(Decomposed Prototype Learning)モデルを提案する。
まず,表現対象や対象の多様な意味や視覚的パターンを捉えるために,分解可能なプロトタイプ空間を構築した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:01:10 GMT)
Transferring vibrational states of trapped atoms via a Rydberg electron [41.9] 理論上は、閉じ込められた中性原子間の振動励起をマイクロメートル間を移動させることが可能であることを示す。
我々は、ライドベルクの寿命と比較して振動励起の移動がほぼ完璧で速い「甘い点」があることを発見した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:40:10 GMT)
Automatic and effective discovery of quantum kernels [41.6] 量子コンピューティングは、カーネルマシンが量子カーネルを利用してデータ間の類似度を表現できるようにすることで、機械学習モデルを強化することができる。
本稿では,ニューラルアーキテクチャ検索やAutoMLと同じような最適化手法を用いて,この問題に対するアプローチを提案する。
その結果、高エネルギー物理問題に対する我々のアプローチを検証した結果、最良のシナリオでは、手動設計のアプローチに関して、テストの精度を一致または改善できることが示された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:43:26 GMT)
Towards Better Spherical Sliced-Wasserstein Distance Learning with Data-Adaptive Discriminative Projection Direction [41.1] 元々の球スライテッド=ワッサーシュタインでは、全ての射影方向は等しく扱われる。
本稿では,新しいデータ適応型球面スライス・ワッサースタイン距離を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:23:37 GMT)
Context-Aware Deep Learning for Multi Modal Depression Detection [41.0] マルチモーダル機械学習(ML)を用いた臨床面接からうつ病を自動的に検出するアプローチに焦点をあてる。
本研究では,(1)テキストデータに対するトピックモデリングに基づくデータ拡張と,(2)音響特徴モデリングのための深部1次元畳み込みニューラルネットワーク(CNN)を組み合わせた新しい手法を提案する。
我々のディープ1D CNNとトランスフォーマーモデルはそれぞれ、オーディオとテキストのモダリティの最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:19:26 GMT)
SeaMo: A Multi-Seasonal and Multimodal Remote Sensing Foundation Model [39.4] RS分野におけるマルチシーズン情報とマルチモーダル情報を統合する先駆的視覚基盤モデルSeaMoを提案する。
SeaMoはRSデータの多次元特性を明示的にモデル化し、モデルをより包括的で、堅牢で、多用途にする。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:40:38 GMT)
Self-supervised visual learning in the low-data regime: a comparative evaluation [38.3] 自己監視学習(SSL)は、現代のディープニューラルネットワーク(DNN)のための価値ある、堅牢なトレーニング手法である
大量のラベルのないトレーニングデータから効率的な表現学習を可能にする。
非常に大きな事前学習データセットの収集や利用が常に可能であるとは限らない。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:17:40 GMT)
NADER: Neural Architecture Design via Multi-Agent Collaboration [37.5] ニューラルアーキテクチャ設計(NAD)を多エージェント協調問題として定式化する新しいフレームワークであるNADERを紹介する。
本稿では,即時フィードバックと長期経験から効果的に学習するリフレクタを提案する。
ニューラルアーキテクチャを表現するためにコードを使った従来のLCMベースの手法とは異なり、グラフベースの表現を用いる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:07:03 GMT)
AutoMMLab: Automatically Generating Deployable Models from Language Instructions for Computer Vision Tasks [37.5] コンピュータビジョンのためのエンドツーエンドモデルプロダクションワークフロー全体を自動化するAutoMLシステムはありません。
本稿では、ユーザの自然言語要求を理解し、プロダクション対応モデルを生成するワークフロー全体を実行することを含む、新しいリクエスト・ツー・モデルタスクを提案する。
これにより、専門家でない個人が、ユーザフレンドリーな言語インターフェースを通じて、タスク固有のモデルを簡単に構築できるようになる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:14:16 GMT)
Progressive Compression with Universally Quantized Diffusion Models [35.2] プログレッシブコーディングのための拡散モデルの可能性を探り、インクリメンタルに伝送および復号化が可能なビット列を導出する。
ガウス拡散モデルや条件付き拡散モデルに基づく先行研究とは異なり、前処理における一様雑音を伴う新しい拡散モデルを提案する。
画像圧縮において有望な第一結果が得られ、単一のモデルで幅広いビットレートで競合速度歪みとレートリアリズムが達成される。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 21:12:31 GMT)
Extended Cross-Modality United Learning for Unsupervised Visible-Infrared Person Re-identification [34.9] 教師なし学習は、ラベルなしのモダリティデータセットからモダリティ不変の特徴を学習することを目的としている。
既存の手法では、クロスモダリティクラスタリングが欠如し、クラスタレベルの関連性を過度に追求する。
拡張Modality-Camera Clustering (EMCC) と Two-Step Memory Updating Strategy (TSMem) を併用した拡張Modality-Camera Clustering (EMCC) フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:30:26 GMT)
FFCG: Effective and Fast Family Column Generation for Solving Large-Scale Linear Program [34.6] カラム生成(CG)は大規模線形プログラム(LP)を効果的かつ反復的に解くアルゴリズムである
CGに対する従来の機械学習ベースのアプローチは、状態空間の爆発問題のために、イテレーション毎に一定量の列を追加するだけである。
提案するFast Family Column Generation (FFCG) は,反復で必要となる列数を選択する,強化学習に基づく新しいCGである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:35:48 GMT)
Improving Generative Pre-Training: An In-depth Study of Masked Image Modeling and Denoising Models [34.0] 本研究では,付加音が事前学習深層ネットワークに与える影響について検討する。
エンコーダ内での破損と復元,特徴空間におけるノイズの導入,ノイズとマスクによるトークンの明示的な乱れ,の3つの重要な条件が明らかになった。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:47:20 GMT)
ETTA: Elucidating the Design Space of Text-to-Audio Models [33.8] 対象ベンチマークに対するデータ,モデルアーキテクチャ,目標関数のトレーニング,およびサンプリング戦略の効果について検討する。
Eucidated Text-To-Audio (ETTA) と呼ばれる最良のモデルを提案する。
ETTAは、公開データでトレーニングされたベースラインよりも改善され、プロプライエタリデータでトレーニングされたモデルと競合する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 21:13:12 GMT)
Robust Offline Imitation Learning from Diverse Auxiliary Data [33.1] オフラインの模倣学習は、専門家による一連のデモンストレーションからのみポリシーを学ぶことができる。
最近の研究には、専門家データとともに多数の補助的なデモンストレーションが組み込まれている。
逆補助データ(ROIDA)からのロバストオフライン模倣を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:30:56 GMT)
A Probabilistic Fluctuation based Membership Inference Attack for Diffusion Models [31.1] メンバーシップ推論攻撃(MIA)は、機械学習モデルのトレーニングセットに、モデルをクエリすることでレコードが存在するかどうかを特定する。
PFAMI(Probabilistic Fluctuation Assessing Membership Inference Attack)を提案する。
PFAMIは最高のベースラインと比較して攻撃成功率(ASR)を約27.9%向上させることができる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:57:48 GMT)
Referencing Where to Focus: Improving VisualGrounding with Referential Query [30.3] 本稿ではRefFormerと呼ばれる新しい視覚的接地手法を提案する。
これはクエリ適応モジュールで構成されており、CLIPにシームレスに統合できる。
提案するクエリ適応モジュールはアダプタとしても機能し,バックボーンネットワークのパラメータをチューニングすることなく,CLIP内の豊富な知識を保存できる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:19:20 GMT)
Graph Mixture of Experts and Memory-augmented Routers for Multivariate Time Series Anomaly Detection [28.6] 本稿では,多変量時系列異常検出のためのGraph Mixture of Experts (Graph-MoE)ネットワークを提案する。
我々のGraph-MoEは、プラグイン・アンド・プレイ方式で任意のGNNベースのMSS異常検出手法に統合できる。
さらに,MTSのグローバルな歴史的特徴から時間的相関情報を捉えるために,メモリ拡張ルータを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:49:51 GMT)
AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation [28.0] 大きな言語モデル(LLM)は、モバイルUIエージェントにエキサイティングな新しい進歩をもたらした。
必要なモデルサイズを減らす方法の1つは、小さなドメイン固有のモデルをカスタマイズすることです。
本稿では,UIタスクの自動化問題をコード生成問題に変換することを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:52:48 GMT)
Rapid and Power-Aware Learned Optimization for Modular Receive Beamforming [27.1] マルチインプット・マルチアウトプット(MIMO)システムは無線通信技術において重要な役割を果たす。
モジュールハイブリッドシステムにおけるビームフォーミングのための電力指向最適化アルゴリズムを提案する。
低分解能位相シフトによる計算の高速化を通じて、学習者によって効率の良いビームフォーミングがいかに促進されるかを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:21:50 GMT)
MDD-5k: A New Diagnostic Conversation Dataset for Mental Disorders Synthesized via Neuro-Symbolic LLM Agents [26.0] 我々は、精神疾患の診断会話を合成するための神経象徴的マルチエージェントフレームワークを設計する。
中国最大の精神障害診断データセットMDD-5kを開発した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:39:38 GMT)
Deep Common Feature Mining for Efficient Video Semantic Segmentation [25.9] ビデオセマンティックセグメンテーションのためのDeep Common Feature Mining(DCFM)を提案する。
DCFMは、機能を2つの補完的なコンポーネントに明示的に分解する。
自己教師付き損失関数を組み込んで,クラス内特徴の類似性を強化し,時間的整合性を高める。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:10:00 GMT)
CS-Eval: A Comprehensive Large Language Model Benchmark for CyberSecurity [25.1] CS-Evalは、サイバーセキュリティにおける大規模言語モデル(LLM)のベンチマークである。
学界から研究ホットスポットを合成し、産業から実用化する。
高品質な質問を3つの認知レベル(知識、能力、応用)に分類する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 04:46:58 GMT)
How Panel Layouts Define Manga: Insights from Visual Ablation Experiments [24.4] 本稿では,マンガ作品の視覚的特徴を,特にパネルレイアウトの特徴に着目して分析することを目的とする。
研究手法として,マンガのページイメージを入力として,マンガタイトル予測のための深層学習モデルをトレーニングした。
具体的には,ページイメージ情報をパネルフレームに限定してアブレーション研究を行い,パネルレイアウトの特性を解析した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:53:37 GMT)
Read, Watch and Scream! Sound Generation from Text and Video [24.0] ビデオはテキスト音声生成モデルの条件制御として機能する。
我々は、ビデオ制御の統合のために、良好なパフォーマンスのテキスト・トゥ・オーディオ・モデルを用いる。
本手法は, 品質, 制御性, 訓練効率の面で優位性を示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 15:23:36 GMT)
CAPER: Enhancing Career Trajectory Prediction using Temporal Knowledge Graph and Ternary Relationship [23.8] 本稿では,高度な時間的知識グラフ(TKG)モデリングによる課題を解決する新しい解法であるCAPERを提案する。
グラフ構造化知識ベースを豊かな表現力で活用し、仕事の動きパターンの変化を効果的に保存する。
実世界のキャリアトラジェクトリデータセットの実験では、CAPERが一貫して、4つのベースラインをはるかに上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:45:03 GMT)
Decentralized Sparse Linear Regression via Gradient-Tracking: Linear Convergence and Statistical Guarantees [23.3] エージェントネットワーク上の疎線形回帰を非指向グラフとしてモデル化し,サーバノードを持たない。
分布予測勾配追跡に基づくアルゴリズムの収束率と統計的保証を解析する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:00:25 GMT)
Self Model for Embodied Intelligence: Modeling Full-Body Human Musculoskeletal System and Locomotion Control with Hierarchical Low-Dimensional Representation [22.9] 筋骨格モデル(MS-Human-700)を90個の体節,206個の関節,700個の筋腱ユニットで構築した。
低次元表現と階層的深部強化学習を用いた新しいアルゴリズムを開発し、最先端のフルボディ制御を実現する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:05:53 GMT)
MEDEC: A Benchmark for Medical Error Detection and Correction in Clinical Notes [22.4] MEDECは医学的誤りの検出と修正のための最初の公開ベンチマークである。
MEDECは3,848の臨床的テキストで構成されており、3つの病院システムから488の臨床ノートが含まれている。
医学的知識と推論能力の両方を必要とする医療ミスの検出・修正タスクについて,最近のLCMを評価した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 15:54:10 GMT)
Manga Generation via Layout-controllable Diffusion [21.1] 本稿では,マンガ生成タスクを提示し,プレーンテキストからのみマンガ生成を研究するためのマンガ109Storyデータセットを構築する。
マンガ生成過程におけるパネル内およびパネル間情報相互作用を容易にするためのマンガ拡散法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:52:19 GMT)
CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only [21.1] 本稿では,スクリーンショット画像のみを通して環境を知覚するエージェントを提案する。
大規模言語モデルの推論能力を活用することで,大規模人間の実演データの必要性を解消する。
AgentはMiniWoB++の平均成功率は94.5%、WebShopの平均タスクスコアは62.3である。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:02:28 GMT)
Learning Monocular Depth from Events via Egomotion Compensation [20.4] イベントカメラはニューロモルフィックにインスパイアされたセンサーで、明るさの変化をわずかに、非同期に報告する。
本研究では,様々な深度仮説の確率を運動補償の効果で明確に決定する,解釈可能な単眼深度推定フレームワークを提案する。
提案手法は, 絶対相対誤差距離において, 最先端手法を最大10%向上させる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:41:18 GMT)
Repository Structure-Aware Training Makes SLMs Better Issue Resolver [20.1] ReSAT(Repository Structure-Aware Training)を導入し,レポジトリ構造と課題解決能力の理解を深める。
本研究では,(1)ローカライゼーション学習データ,(2)コード理解とローカライゼーション能力を改善する多段階プログレッシブなローカライゼーションデータ,(2)コンテキストベースのコード編集機能を改善するコード編集トレーニングデータという2種類のトレーニングデータを構築した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:01:32 GMT)
Provably Efficient Exploration in Reward Machines with Low Regret [20.1] 非マルコフ報酬による意思決定過程の強化学習について検討する。
我々の主な貢献は確率的報酬機を含む意思決定プロセスのためのモデルベースRLアルゴリズムである。
我々は、その後悔に対する高い確率と非漸近的な境界を導き、既存のアルゴリズムに対する後悔の点から、その利益を実証する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:25:04 GMT)
AskChart: Universal Chart Understanding through Textual Enhancement [20.1] 最先端のアプローチは、主にチャートイメージからの視覚的手がかりに焦点を当て、チャート内に埋め込まれたリッチテキスト情報を明示的に組み込むことができない。
AskChartは、Mixture of Experts (MoE)アーキテクチャを用いて、チャートからテキストと視覚の両方のキューを明示的に統合するユニバーサルモデルである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:59:43 GMT)
3D Learnable Supertoken Transformer for LiDAR Point Cloud Scene Segmentation [19.9] 本稿では, 3D Learnable Supertoken Transformer (3DLST) という新しい3Dトランスフレームワークを提案する。
3DLSTは、一般的なU-net設計ではなく、新しいW-netアーキテクチャを備えている。
アルゴリズムの効率は従来の最高の性能の手法よりも最大5倍高速である。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:06:08 GMT)
Completion as Enhancement: A Degradation-Aware Selective Image Guided Network for Depth Completion [19.5] 本稿では,新しい劣化認識フレームワークであるSigNetを紹介する。
SigNetは、ディープコンプリートを初めてディープエンハンスメントに変換する。
我々は、NYUv2、DIML、SUN RGBD、TOFDCデータセットに関する広範な実験を行い、SigNetの最先端(SOTA)性能を実証した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:05:01 GMT)
DAPoinTr: Domain Adaptive Point Transformer for Point Cloud Completion [19.0] 本稿では,ポイントクラウド補完のためのDAPoinTr(Domain Adaptive Point Transformer)フレームワークを提案する。
DAPoinTrは、DQFA(Domain Query-based Feature Alignment)、PTFA(Point Token-wise Feature alignment)、VPC(Votted Prediction Consistency)の3つの主要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:16:54 GMT)
Patch-Mix Contrastive Learning with Audio Spectrogram Transformer on Respiratory Sound Classification [18.6] 本稿では,潜在空間における混合表現を識別するために,新規かつ効果的なパッチ・ミクス・コントラスト学習を提案する。
提案手法はICBHIデータセット上での最先端性能を実現し,4.08%の改善により先行先行スコアを上回った。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:17:49 GMT)
VectorPainter: Advanced Stylized Vector Graphics Synthesis Using Stroke-Style Priors [18.5] 本稿では,VectorPainterについて紹介する。
提案手法は,まず参照画像の画素を一連のベクトルストロークに変換し,入力されたテキスト記述に基づいてベクトルグラフを生成する。
生成過程を通してストロークのスタイルを保存するために,スタイル保存損失関数を導入する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:39:26 GMT)
PrivacyRestore: Privacy-Preserving Inference in Large Language Models via Privacy Removal and Restoration [18.1] PrivacyRestoreは、推論中のユーザの入力のプライバシを保護するためのプラグイン・アンド・プレイ方式である。
プライバシストアの有効性を評価するために、医療ドメインと法律ドメインをカバーする3つのデータセットを作成します。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:49:34 GMT)
Performance Control in Early Exiting to Deploy Large Models at the Same Cost of Smaller Ones [17.8] Early Exiting(EE)は,計算資源をデータポイントに適応的に割り当てることによって推論を高速化する,有望な技術である。
私たちはまず、EEアプローチに関する新しい視点を示し、EEでデプロイされたより大きなモデルは、より小さなモデルよりも高いパフォーマンスを達成することができることを示した。
本稿では,データポイントの信頼度ではなく,サンプルの平均精度に基づいて精度閾値を決定する手法であるPCEE(Performance Control Early Exiting)を紹介する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:54:32 GMT)
Semi-Supervised Learning from Small Annotated Data and Large Unlabeled Data for Fine-grained PICO Entity Recognition [17.8] 既存のアプローチはPICOエンティティの属性を区別しない。
本研究の目的は,細粒度PICOエンティティを抽出する名前付きエンティティ認識モデルを開発することである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 20:24:35 GMT)
RecLM: Recommendation Instruction Tuning [17.8] 本稿では,大規模言語モデルと協調フィルタリングをシームレスに統合するモデル非依存の指導訓練パラダイムを提案する。
提案したRecommendation Language Model (RecLM) は、慎重に設計された強化学習報酬関数により、ユーザの好みの多様性を捕捉する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:51:54 GMT)
Tint Your Models Task-wise for Improved Multi-task Model Merging [17.5] 本稿では,各タスクに1つのタスク固有のレイヤをトレーニング可能な調整として導入するテストタイムアプローチであるModel Tintingを提案する。
提案手法は, 統合係数とタスク固有層を併用することにより, タスク競合を最小限のコストで効果的に軽減する。
本手法は,コンピュータビジョンと自然言語処理の両方において,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:42:06 GMT)
Improved Operator Learning by Orthogonal Attention [17.4] 我々は、カーネル積分作用素の固有分解と固有関数のニューラル近似に基づいて注意を喚起する。
我々の手法は、競合するベースラインを十分なマージンで上回ることができる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:56:34 GMT)
World-to-Words: Grounded Open Vocabulary Acquisition through Fast Mapping in Vision-Language Models [17.1] 我々は,オープンワールド言語学習における接地とブートストラップを検討するために,GOVA(Grounded Open Vocabulary Acquisition)を導入した。
目的としてグラウンドを強調表示する画像テキストペアを事前学習することで、新しい視覚的グラウンド言語モデルであるオブジェクト指向BERT(OctoBERT)を提案する。
我々は,OctoBERTがよりコヒーレントで高速な接地単語学習者であり,事前学習中に得られた接地能力が,未知語をより迅速かつ堅牢に学習する上で有効であることを実証した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 19:50:42 GMT)
UniAvatar: Taming Lifelike Audio-Driven Talking Head Generation with Comprehensive Motion and Lighting Control [17.0] 広範囲の運動と照明条件を広範囲に制御するUniAvatarを導入する。
具体的には、FLAMEモデルを用いて、すべてのモーション情報を単一の画像にレンダリングし、3Dモーションの詳細の整合性を維持する。
我々は3次元動作と照明の両方を管理するために独立モジュールを設計し、分離制御と組み合わせ制御を可能にした。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:39:08 GMT)
CL-attack: Textual Backdoor Attacks via Cross-Lingual Triggers [16.4] CLアタックは、複数の言語を含む特定の構造を持つテキストを使用することでバックドアを注入する。
CL攻撃は, 分類タスクと生成タスクの両方において, 毒性率の低い攻撃成功率をほぼ100%達成できることを示す。
我々はさらに、CL攻撃の影響を部分的に軽減できるTranslateDefenseと呼ばれる新しい防衛装置を開発する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:13:03 GMT)
Effective Random Test Generation for Deep Learning Compilers [16.1] Israはドメイン固有の制約解決ツールで、バックトラックなしでセマンティック仕様から制約を解決する。
我々は、TVM、Glow、およびSophGoという商用コンパイラを含む3つの人気のある現実世界のディープラーニングコンパイラに対して、我々のアプローチを実装し、適用する。
Israは、最先端のアプローチや、コンパイラーバグ検出のための有効なテストインプットを構築するためのベースラインアプローチよりも効果的である。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:34:35 GMT)
Improving Generalization for AI-Synthesized Voice Detection [15.9] 本稿では,ボコーダに関連するドメインに依存しないアーティファクト特徴の抽出を目的とした,革新的なアンタングル化フレームワークを提案する。
我々は、平らなロスランドスケープにおけるモデル学習を強化し、最適化された解から逃れ、一般化を改善する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:45:20 GMT)
Assessing Pre-trained Models for Transfer Learning through Distribution of Spectral Components [15.7] 本稿では、スペクトル成分分布(DISCO)を用いた事前学習モデル評価のための新しい視点を提案する。
異なるスペクトル成分について検討し, 異なる透過性を有することを観察し, 微調整性能に多彩に寄与する。
提案手法は柔軟であり, 分類タスクと回帰タスクの両方に適用できる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:54:22 GMT)
Personalized Dynamic Music Emotion Recognition with Dual-Scale Attention-Based Meta-Learning [15.5] 動的音楽感情認識(DMER)のためのDSAML(Dual-Scale Attention-Based Meta-Learning)手法を提案する。
提案手法は,2次元特徴抽出器の機能を融合し,短期および長期の依存関係をキャプチャする。
本手法は従来のDMERとPDMERの両方で最先端の性能を実現することができることを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:47:35 GMT)
PhotoBot: Reference-Guided Interactive Photography via Natural Language [15.5] PhotoBotは、ハイレベルな人間の言語指導とロボット写真家との相互作用に基づく、完全な自動写真取得のためのフレームワークである。
視覚言語モデル(VLM)とオブジェクトマニピュレータを用いて参照画像の特徴付けを行う。
また、ユーザの言語クエリに基づいて、関連する参照画像を取得するために、LLM(Big Language Model)も使用しています。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:38:10 GMT)
GFG -- Gender-Fair Generation: A CALAMITA Challenge [15.4] ジェンダーフェア言語は、すべてのアイデンティティを含む用語と表現を使用することで、男女平等を促進することを目的としている。
ジェンダー・フェア・ジェネレーションの課題は、書面コミュニケーションにおけるジェンダー・フェア言語へのシフトを支援することである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:58:40 GMT)
Human-centric Reward Optimization for Reinforcement Learning-based Automated Driving using Large Language Models [15.1] 現在の強化学習(RL)ベースの自動運転(AD)エージェントにおける重要な課題の1つは、柔軟で正確で人間らしい振る舞いをコスト効率よく達成することである。
本稿では,大規模言語モデル(LLM)を用いて,人間中心の方法でRL報酬関数を直感的かつ効果的に最適化する革新的な手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:55:16 GMT)
Relation-aware Hierarchical Prompt for Open-vocabulary Scene Graph Generation [14.8] Open-vocabulary Scene Graph Generation (OV-SGG)は、視覚的関係表現とオープンな語彙的テキスト表現を整合させることにより、クローズドセットの仮定の限界を克服する。
既存のOV-SGG法は、固定されたテキスト表現によって制約され、画像テキストアライメントの多様性と精度が制限される。
本稿では,対象物と地域固有の関係情報を統合することでテキスト表現を向上させるRAHP(Relation-Aware Hierarchical Prompting)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:12:37 GMT)
Uni-Renderer: Unifying Rendering and Inverse Rendering Via Dual Stream Diffusion [14.8] レンダリングと逆レンダリングはコンピュータビジョンとグラフィックスにおいて重要なタスクである。
本稿では、2つの条件生成タスクとしてレンダリングと逆レンダリングを共同でモデル化するデータ駆動手法を提案する。
トレーニングと推論のコードをオープンソースとして公開し、この分野のさらなる研究と開発を後押しします。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:57:52 GMT)
KunServe: Elastic and Efficient Large Language Model Serving with Parameter-centric Memory Management [14.8] 大きな言語モデル(LLM)は、ロードバーストまたは長期要求下で、貴重なGPUメモリを簡単に絞り込むことができる。
KVCache中心のアプローチは、KVCacheのドロップ、マイグレーション、スワップによってロードスパイクを処理する。
本稿では,レプリケートされたパラメータを選択的に削除して,要求に貴重なメモリを残すパラメータ中心のアプローチを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:28:03 GMT)
Reviving Life on the Edge: Joint Score-Based Graph Generation of Rich Edge Attributes [14.7] 本稿では,全てのグラフ成分を考慮したグラフ生成のためのノードとエッジの連成スコアベースモデルを提案する。
textbf(1)ノードとエッジ属性をアテンションモジュールに結合し,その2つの成分に基づいてサンプルを生成する。
我々は,エッジ特徴が重要となる実世界のデータセットと合成データセットを含む,挑戦的なベンチマークについて評価する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:57:25 GMT)
A Microservice Graph Generator with Production Characteristics [14.5] データハンドラとグラフジェネレータを組み合わせたサービス依存グラフジェネレータ(DGG)を提案する。
DGGはトレースからプロダクションレベルの特性を含むベンチマークのサービス依存性グラフを生成する。
ケーススタディでは、DGGが生成したグラフはトポロジーの点で実トレースに類似していることが示されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:51:35 GMT)
Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents [14.2] 治療過程全体をシミュレートした,エージェント病院という病院のシミュラムを紹介した。
すべての患者、看護師、医師は、大規模言語モデル(LLM)を利用した自律型エージェントである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:02:38 GMT)
PoTable: Programming Standardly on Table-based Reasoning Like a Human Analyst [13.8] 本稿では,人間アナリストをシミュレートするテーブルベースの推論手法として,PoTableを提案する。
PoTableは、人間のような論理的なステージを分割し、操作プールをオープンワールド空間に拡張する。
PoTableは標準的な推論プロセス全体を完了し、優れた推論結果を生成する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:24:52 GMT)
BeSplat -- Gaussian Splatting from a Single Blurry Image and Event Stream [13.6] 3D Gaussian Splatting (3DGS)は、長いトレーニング時間や遅いレンダリング速度といった重要な課題に効果的に対処している。
本研究では,1つの動きブル画像とそれに対応するイベントストリームから,シャープな放射場(ガウススプラッツ)の回復を実証する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 22:35:29 GMT)
Towards A Holistic Landscape of Situated Theory of Mind in Large Language Models [13.3] 大言語モデル(LLM)は、心の理論(ToM)の出現の可能性について、かなりの関心と議論を巻き起こしている。
最近のいくつかの調査では、これらのモデルに堅牢なToMが欠如していることが判明し、新しいベンチマークの開発に対する需要が高まっている。
マシンToMを7つのメンタルステートカテゴリに分類し、既存のベンチマークをデライン化して、探索されていないToMの側面を特定します。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 20:04:21 GMT)
Adaptivity can help exponentially for shadow tomography [13.2] シャドウトモグラフィーの基本課題として、適応的に選択された2コピー計測を使用するプロトコルは、非適応的な2コピー計測を使用するどのプロトコルよりも指数関数的にサンプリング効率が高いことを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:13:04 GMT)
A Cross-Font Image Retrieval Network for Recognizing Undeciphered Oracle Bone Inscriptions [12.7] Oracle Bone Inscription (OBI)は中国最古の成熟した書記システムである。
OBI文字を解読するクロスファント画像検索ネットワーク(CFIRN)を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:32:19 GMT)
Working Backwards: Learning to Place by Picking [12.6] 我々は,課題の家族に対して,実世界の実演を自律的に収集する手法であるピッキング・バイ・ピッキング(PvP)を提案する。
対象の配置位置にある対象物の一連の把握シーケンスから実演を行う。
我々のシステムは、人間の介入なしに、接触制限された環境で何百ものデモを収集できる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:44:08 GMT)
Let the Rule Speak: Enhancing In-context Learning Debiasing with Interpretability [12.3] In-context Learningは、多クラステキスト分類において、クラスごとの予測精度が不均衡であることが判明した。
本稿ではファジィルール最適化に基づくデバイアス法であるFuRudを提案する。
FuRudは、ペア級精度バイアス(COBias)を半分以上(56%)削減し、相対的に21%の精度を達成する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:56:42 GMT)
Humans as a Calibration Pattern: Dynamic 3D Scene Reconstruction from Unsynchronized and Uncalibrated Videos [12.2] 動的ニューラルネットワークの最近のセットアップは、既知のポーズを持つマルチビュービデオからの入力を前提としている。
ビデオのキャプチャが安定すれば、未知のポーズを持つアンチロナイズドビデオが動的ニューラルネットワークを生成できることを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:04:20 GMT)
Explaining Decisions of Agents in Mixed-Motive Games [11.8] 近年,エージェントは自然言語でシームレスにコミュニケーションできるようになっている。
本研究では,エージェント間の競合,安価なトーク,行動による暗黙的なコミュニケーションに対処するための説明手法を設計する。
2つの混合動機ゲームにおいて,人間に対する手法の有効性と有用性を示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:22:07 GMT)
SketchFill: Sketch-Guided Code Generation for Imputing Derived Missing Values [11.7] 価値計算の欠如は、ドメイン知識に大きく依存するため、長年にわたる問題である。
スケッチフィル(SketchFill)は、LCMをガイドして正確な式を生成し、欠落した数値を暗示する新しいスケッチベースの手法である。
実験の結果,SketchFillは最先端の手法を著しく上回り,CoT法より56.2%,MetaGPTより78.8%高い精度を示した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:13:34 GMT)
Modality-Projection Universal Model for Comprehensive Full-Body Medical Imaging Segmentation [11.4] 本研究では,MPUM(Modality Projection Universal Model)を導入し,評価する。
MPUMは新たなモダリティ投影戦略を採用しており、パラメータを動的に調整し、異なる画像モードで性能を最適化することができる。
MPUMのユニークなコントローラベースの畳み込みレイヤは、すべてのネットワーク層にわたる唾液マップの可視化を可能にし、モデルの解釈可能性を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:23:27 GMT)
Object-Centric Open-Vocabulary Image-Retrieval with Aggregated Features [11.1] 本稿では,オブジェクト中心のオープン語彙画像検索に対して,シンプルながら効果的なアプローチを提案する。
提案手法は,CLIPから抽出した濃密な埋め込みをコンパクトな表現に集約する。
3つのデータセットのグローバルな特徴的アプローチよりもはるかに優れた結果を得ることで,タスクに対する提案手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:22:22 GMT)
Differential privacy enables fair and accurate AI-based analysis of speech disorders while protecting patient data [10.6] 本研究は,ディファレンシャルプライバシ(DP)が病的音声データに与える影響を初めて調べたものである。
プライバシーレベルの高いDPのトレーニングでは,最大3.85%の精度低下が観察された。
言語や障害にまたがる知見を一般化するため,スペイン語を話すパーキンソン病患者のデータセットに対するアプローチを検証した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:56:59 GMT)
Cohort-Individual Cooperative Learning for Multimodal Cancer Survival Analysis [10.6] がんの生存率分析を促進するためのCohort-individual Cooperative Learningフレームワークを提案する。
知識分解とコホート指導手法の協調により,頑健なマルチモーダルサバイバル分析モデルを構築した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:21:13 GMT)
RTify: Aligning Deep Neural Networks with Human Behavioral Decisions [10.5] 霊長類視覚の現在のニューラルネットワークモデルは、行動精度の全体的なレベルを複製することに焦点を当てている。
我々は、リカレントニューラルネットワークの時間的ダイナミクスを人間の反応時間(RT)に合わせることを学ぶことによって、人間の行動選択のダイナミクスをモデル化する新しい計算フレームワークを導入する。
本稿では,この近似を用いて「理想オブザーバ」RNNモデルを最適化し,人間データなしで速度と精度の最適なトレードオフを実現できることを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:11:08 GMT)
Reconstruction Target Matters in Masked Image Modeling for Cross-Domain Few-Shot Learning [10.4] クロスドメインのFew-Shot Learningは、データ固有のソースドメインからデータ中心のターゲットドメインに知識を転送するモデルを必要とする。
Masked Autoencoder (MAE)は、ラベルのないデータを効果的に利用し、画像のグローバル構造を学習する。
本稿ではドメイン非依存型マスケ画像モデリング(DAMIM)を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:43:01 GMT)
The light-matter correlation energy functional of the cavity-coupled two-dimensional electron gas via quantum Monte Carlo simulations [10.3] 弱結合理論の修正版は大きなパラメータ領域に対して極めて正確であることを示す。
結果は、QED密度汎関数理論の発展のための数値的基礎を提供する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:03:03 GMT)
FACEMUG: A Multimodal Generative and Fusion Framework for Local Facial Editing [10.1] グローバル一貫性のある局所顔編集(FACEMUG)のための新しい枠組みを提案する。
幅広い入力モダリティを処理でき、未編集の部分をそのまま残しながら細粒度で意味的な操作を可能にする。
顔の特徴の整合性を改善するために,新しい自己教師付き潜時整合アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 00:53:54 GMT)
MVS-GS: High-Quality 3D Gaussian Splatting Mapping via Online Multi-View Stereo [9.7] オンライン多視点ステレオ手法を用いた高品質な3DGSモデリングのための新しいフレームワークを提案する。
本手法は,局所時間窓から逐次フレームを用いてMVS深度を推定し,包括的深度改善手法を適用した。
実験の結果,本手法は最先端の高密度SLAM法より優れていた。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:20:04 GMT)
Do Language Models Understand the Cognitive Tasks Given to Them? Investigations with the N-Back Paradigm [9.6] GPT 3.5の2-backタスクと3-backタスクのパフォーマンス低下は、人間のように動作するメモリ容量の限界を反映している、と我々は主張する。
これらのタスクにおける様々なパフォーマンスレベルのオープンソース言語モデルを解析することにより、タスク理解とタスクセットのメンテナンスの制限を反映していることを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:31:53 GMT)
Regularized Adaptive Momentum Dual Averaging with an Efficient Inexact Subproblem Solver for Training Structured Neural Network [9.5] 本稿では、構造化ニューラルネットワークのトレーニングのための正規化適応モーメントデュアル平均化(RAMDA)を提案する。
定常収束点における正則化器によって誘導される理想構造が得られることを示す。
この構造は収束点付近で局所的に最適であるため、RAMDAは可能な限り最高の構造が得られることが保証される。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:10:00 GMT)
LLMsAgainstHate @ NLU of Devanagari Script Languages 2025: Hate Speech Detection and Target Identification in Devanagari Languages via Parameter Efficient Fine-Tuning of LLMs [9.2] 本稿では,ヘイトスピーチ検出とターゲット識別のためのPEFT(Efficient Fine tuning)に基づくソリューションを提案する。
我々は,Devanagariデータセットを用いた複数のLCMの評価を行った(Thapa et al., 2025)。
以上の結果から,Devanagari-scriptedコンテンツに対するアプローチの有効性が示された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:43:37 GMT)
MoPD: Mixture-of-Prompts Distillation for Vision-Language Models [9.2] 我々はMixture-of-Prompts Distillation(MOPD)というソフトプロンプト学習手法を提案する。
MoPDは、手作りのハードプロンプト(例えば教師のプロンプト)から学習可能なソフトプロンプト(例えば学生のプロンプト)へ有用な知識を効果的に伝達することができる。
広汎な実験により,提案手法は特に目に見えないクラスにおいて,最先端のベースラインよりも優れていた。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:57:04 GMT)
Localized exploration in contextual dynamic pricing achieves dimension-free regret [9.1] 線形需要モデルを用いてコンテキスト動的価格の問題を考察する。
そこで本研究では,新しい局所探索アルゴリズムを提案する。
地平線が限られているとき、探索と搾取のバランスをとる方法を示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 15:29:58 GMT)
An End-to-End Depth-Based Pipeline for Selfie Image Rectification [9.1] 近距離から撮影したポートレイトやセルフィー画像は、一般的に視線歪みに悩まされる。
本稿では,視点歪みの影響を軽減するために,エンド・ツー・エンドの深層学習に基づく修正パイプラインを提案する。
我々のパイプラインは、260倍以上高速な3D GANベースの手法で、同等の結果が得られます。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:57:54 GMT)
Information scrambling and entanglement in quantum approximate optimization algorithm circuits [9.1] 変分量子アルゴリズムは、ノイズのある中間スケール量子(NISQ)時代に量子アドバンテージを示すことを約束している。
本稿では,QAOA回路における情報スクランブルと絡み合いについて検討し,より難しい問題に対して,より多くの量子資源が必要であることを明らかにする。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:36:45 GMT)
SpectralKD: Understanding and Optimizing Vision Transformer Distillation through Spectral Analysis [8.6] 本研究では,CaiTモデルが第1層と第2層に情報を集中し,特徴写像蒸留のための最適層選択を行うことを示す。
本稿では, 蒸留を最適化するための新しいスペクトル分析法とガイドラインを提案し, 知識伝達プロセスの解釈性を高めた。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 04:45:05 GMT)
Indonesian-English Code-Switching Speech Synthesizer Utilizing Multilingual STEN-TTS and Bert LID [8.5] 本研究は、STEN-TTSにおけるインドネシア英語のコードスイッチングに対処する。
主な変更点は、テキストから音素への変換に言語識別コンポーネントを追加することである。
実験結果から, コードスイッチングモデルにより, 自然性が向上し, 音声の明瞭度が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:37:40 GMT)
Active Reinforcement Learning Strategies for Offline Policy Improvement [8.3] 本稿では,既存のオフラインデータを拡張可能なトラジェクトリを収集できる能動的強化学習手法を提案する。
提案手法は,競争基準よりも環境とのオンラインインタラクションを最大75%削減できることを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:15:54 GMT)
Spectral Enhancement and Pseudo-Anchor Guidance for Infrared-Visible Person Re-Identification [8.1] 本稿では,SEPG-Net という名前の簡易かつ効果的なスペクトル拡張と擬似アンカー誘導ネットワークを提案する。
周波数領域情報とグレースケール空間に基づくより均一なスペクトル強調手法を提案する。
2つの公開ベンチマークデータセットの実験結果は、SEPG-Netの他の最先端手法よりも優れた性能を示している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:03:53 GMT)
xSRL: Safety-Aware Explainable Reinforcement Learning -- Safety as a Product of Explainability [8.0] 我々は、RLエージェントの振る舞いを包括的に理解するために、ローカルとグローバルの両方の説明を統合するフレームワークであるxSRLを提案する。
xSRLはまた、敵攻撃を通じてポリシーの脆弱性を識別し、再トレーニングせずにエージェントのデバッグとパッチを行うツールを提供する。
我々の実験とユーザスタディは、RLシステムの安全性を高めるためのxSRLの有効性を実証し、現実のデプロイメントにおいてより信頼性と信頼性を高めた。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:19:04 GMT)
Energy stable neural network for gradient flow equations [7.9] 勾配流方程式を解くためのエネルギー安定ネットワーク(EStable-Net)を提案する。
EStable-Netは、勾配流方程式の特性と整合したニューラルネットワークに沿った離散エネルギーの減少を可能にする。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:25:57 GMT)
Cross-Demographic Portability of Deep NLP-Based Depression Models [7.6] ディープラーニングモデルは、行動健康における現実世界の応用への関心が急速に高まっている。
現在の文献における重要なギャップは、そのようなモデルがいかに異なる人口に対して一般化されるかである。
自然言語処理(NLP)に基づくモデルを用いて,2つの異なるコーパス間の可搬性について検討した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:54:24 GMT)
Falcon: Faster and Parallel Inference of Large Language Models through Enhanced Semi-Autoregressive Drafting and Custom-Designed Decoding Tree [7.4] Falconは、ドラフト作成者の並列性と出力品質の両方を増強するために設計された革新的な投機的復号化フレームワークである。
FalconにはCoupled Sequential Glancing Distillation(英語版)技術が組み込まれている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:20:21 GMT)
Imperceptible Adversarial Attacks on Point Clouds Guided by Point-to-Surface Field [7.3] ポイントクラウドに対する敵対的攻撃は、3次元ディープラーニングモデルの敵対的堅牢性の評価と改善に不可欠である。
従来の解法は攻撃時の点変位を厳密に制限し、非受容性と敵の有効性のバランスをとるのが困難である。
そこで我々は,P2Sフィールドを新たに導入し,対向方向の摂動方向を調整する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:36:35 GMT)
Achieving Margin Maximization Exponentially Fast via Progressive Norm Rescaling [6.8] 線形分離可能なデータの分類における勾配に基づくアルゴリズムによるマージン最大化バイアスについて検討する。
我々は、プログレッシブ・リスケーリング・グラディエント(PRGD)と呼ばれる新しいアルゴリズムを提案し、PRGDがエム指数率でマージンを最大化できることを示す。
PRGDはまた、線形に分離できないデータセットやディープニューラルネットワークに適用する際の一般化性能の向上を約束している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:42:11 GMT)
Harnessing high-dimensional symmetric and anti-symmetric Bell states through quantum interference [6.5] 完全高次元対称および反対称ベル基底に対する一般化された定式化を提案する。
また、4次元の軌道角運動量ベル状態(英語版)を実験的に準備し、よく定義された対称性や反対称性を与える。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:05:01 GMT)
LiHi-GS: LiDAR-Supervised Gaussian Splatting for Highway Driving Scene Reconstruction [6.4] Gaussian Splatting (GS)は、シーンの3Dガウス表現を明示してリアルタイムレンダリングを容易にする。
GSは暗黙のニューラルレイディアンスフィールド(NeRF)よりも高速な処理と直感的なシーン編集を提供する
動的シーン合成と編集のための新しいGS法を提案し,LiDARの監督とLiDARレンダリングのサポートを通じてシーン再構成を改善した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:37:43 GMT)
Mask Approximation Net: Merging Feature Extraction and Distribution Learning for Remote Sensing Change Captioning [6.4] 本稿では,拡散モデルを統合したリモートセンシング画像変化検出と記述のための新しいアプローチを提案する。
拡散過程において高周波ノイズを処理するために,周波数誘導型複素フィルタモジュールを導入する。
いくつかのリモートセンシング変化検出記述データセットに対する提案手法の有効性を検証した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:35:57 GMT)
DynSyn: Dynamical Synergistic Representation for Efficient Learning and Control in Overactuated Embodied Systems [6.2] 制御機構の研究は、高次元の過度なシステムの制御に関する洞察を与える。
神経力学における筋シナジーとして知られるアクチュエータの協調は、運動指令の生成を単純化する予備的なメカニズムであると考えられている。
この理論を動機として,動的シナジスティック表現(DynSyn)アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:10:34 GMT)
SRLM: Human-in-Loop Interactive Social Robot Navigation with Large Language Model and Deep Reinforcement Learning [6.2] SRLM(Social Robot Planner)と呼ばれる新しいハイブリッドアプローチを提案する。
LLM(Large Language Models)とDRL(Deep Reinforcement Learning)を統合し、人間に満たされた公共空間をナビゲートする。
SRLMは、リアルタイムでヒューマン・イン・ループ・コマンドからグローバル・プランニングを推測し、LLMベースの大型ナビゲーション・モデルに社会情報をエンコードする。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:00:51 GMT)
Effective and secure federated online learning to rank [5.9] Online Learning to Rankは、クリックのような暗黙のユーザーフィードバックを使ってランキングモデルを最適化する。
これは、人間のアノテーションの高コスト、ユーザの好みと人間の判断の間の潜在的なミスアライメント、ユーザクエリインテントの急速な変更など、いくつかの欠点に対処する。
この論文は、フェデレートされたオンライン学習をランク付けするための総合的な研究であり、その有効性、堅牢性、セキュリティ、未学習の能力に対処している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:53:10 GMT)
Quantum-Inspired Weight-Constrained Neural Network: Reducing Variable Numbers by 100x Compared to Standard Neural Networks [5.7] 我々は、量子に着想を得た洞察に基づいて重みを生成する古典的な重み制約ニューラルネットワークを開発した。
このアプローチは、学習可能性を維持しながら、古典的ニューラルネットワークの変数数を135倍に減らすことができる。
さらに,敵攻撃の影響を受けやすい量子機械学習モデルのロバスト性を高めるためのドロップアウト手法を開発した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 21:35:12 GMT)
Dynamic Bayesian Learning for Spatiotemporal Mechanistic Models [5.7] 我々は、力学力学モデルのベイズ学習のためのアプローチを開発する。
このような学習は、任意の入力からシステムの出力を効率的に補間できる力学系の統計的エミュレーションで構成されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:40:43 GMT)
Applying the maximum entropy principle to multi-species neural networks improves species distribution models [5.7] 我々は、ニューラルネットワークを利用して種間の共有機能を自動的に学習するDeepMaxentを提案する。
我々は、その空間的サンプリングバイアスで知られるベンチマークデータセットでDeepMaxentを評価する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:47:04 GMT)
Deep Smart Contract Intent Detection [5.6] textscSmartIntentNNは、スマートコントラクトにおける開発意図を自動的に検出するように設計されたディープラーニングモデルである。
我々は4万以上の現実世界のスマートコントラクトを含むデータセットでtextscSmartIntentNNをトレーニングし、評価した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:10:25 GMT)
Relative Quantum Resource Theory and Operational Applications in Subchannel Discrimination [5.6] 量子資源理論における中心的な問題は、特定の物理的タスクにおいて明確な利点をもたらす量子資源に運用上の意味を与えることである。
資源状態の特定の凸集合に対して資源の相対的優越性を定義することにより、この基本原理を拡張することを提案する。
また、最大資源状態のセットと比較して、物理タスクにおける与えられた状態の不足を定義するための新しいフレームワークも提供します。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:21:41 GMT)
To Predict or Not To Predict? Proportionally Masked Autoencoders for Tabular Data Imputation [5.5] マスク付きオートエンコーダ(MAE)の比例マスキング戦略を提案する。
具体的には、まず、観測されたデータセットの比率に基づいて、欠落の統計を計算する。
そして、これらの統計値に一致したマスクを生成し、マスキング後に欠落の分布を確実に保持する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:12:08 GMT)
PlanLLM: Video Procedure Planning with Refinable Large Language Models [5.4] ビデオプロシージャ計画、すなわち、開始とゴール状態のビデオフレームが与えられた一連のアクションステップを計画することは、AIを具現化する上で不可欠な能力である。
最近の研究は、Large Language Models (LLMs) を用いて、リッチなアクションステップ記述テキストを生成し、アクションステップのデコーディングをガイドしている。
ビデオプロシージャ計画のためのLLMを用いたクロスモーダル共同学習フレームワークPlanLLMを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:51:05 GMT)
Quantum Algorithm for Vector Set Orthogonal Normalization and Matrix QR Decomposition with Polynomial Speedup [4.9] グラムシュミット過程はベクトル集合正規化と行列QR分解を解くために広く用いられている。
既存の方法には、システム次元の$N$で$O(N3)$をスケーリングする、高い複雑性の問題がある。
本稿では,グラマーシュミット過程と量子位相推定のアイデアに基づいて,これらの2つの問題を解く量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:04:34 GMT)
Hierarchical Multi-agent Meta-Reinforcement Learning for Cross-channel Bidding [4.7] リアルタイム入札(RTB)はオンライン広告エコシステムにおいて重要な役割を担っている。
従来の手法では、動的な予算配分問題を効果的に管理することはできない。
マルチチャネル入札最適化のための階層型マルチエージェント強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:26:30 GMT)
Semantic Residual for Multimodal Unified Discrete Representation [4.3] SRCID(Semantic Residual Cross-modal Information Disentanglement)という,Residual Vector Quantization(RVQ)に固有の数値的残差概念に着想を得た新しいフレームワークを導入する。
SRCIDは、多モーダルデータに対して意味的残差に基づく情報分散を用いて、異なるモーダル間の固有の不一致をうまく処理する。
本手法は,統合マルチモーダル表現の能力を向上し,クロスモーダル一般化とクロスモーダルゼロショット検索における例外的な性能を示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:08:52 GMT)
EMWaveNet: Physically Explainable Neural Network Based on Electromagnetic Propagation for SAR Target Recognition [4.3] 本研究では,複雑なSAR画像認識のための物理的に説明可能なフレームワークを提案する。
ネットワークアーキテクチャは完全にパラメータ化されており、すべての学習可能なパラメータには明確な物理的意味がある。
提案手法は, 強力な物理決定論理, 高い物理説明性, 堅牢性, および優れた de-aliasing 機能を有する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:22:06 GMT)
Towards Popularity-Aware Recommendation: A Multi-Behavior Enhanced Framework with Orthogonality Constraint [4.1] Top-K$レコメンデーションは、潜伏したユーザの好みを推測し、パーソナライズされたレコメンデーションを生成する。
マルチビヘイビアのtextbfSide textbfInformation を統合した textbfPopularity-aware top-$K$レコメンデーションアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:06:49 GMT)
Explanatory Debiasing: Involving Domain Experts in the Data Generation Process to Mitigate Representation Bias in AI Systems [4.0] 表現バイアス(Representation bias)は、人工知能(AI)システムにおける最も一般的なバイアスの1つである。
本稿では,表現障害にドメインエキスパートを効果的に巻き込むための汎用設計ガイドラインを紹介する。
この結果から,モデル精度を損なうことなく,ドメインエキスパートの関与による表現バイアスの低減が可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:14:48 GMT)
Resolving the Ambiguity of Complete-to-Partial Point Cloud Registration for Image-Guided Liver Surgery with Patches-to-Partial Matching [3.7] 画像ガイド下肝外科では,術前データと術中データとの整合が重要となる。
あいまいさを解決するために,プラグ・アンド・プレイモジュールとしてパッチ・ツー・パーティルマッチング戦略を提案する。
術中視認性に乏しい症例に対して, 登録成績の向上に有効かつ効果的であることが証明された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:58:29 GMT)
BDA: Bangla Text Data Augmentation Framework [3.6] 高品質なデータが不足しているリソース制限フィールドでは、トレーニングデータの量を増やす上で、拡張が重要な役割を果たす。
本稿では、事前学習されたモデルとルールベースの手法の両方を用いて、テキストの新しい変種を生成するBangla Text Data Augmentation Frameworkを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:50:10 GMT)
Learning Cross-Domain Representations for Transferable Drug Perturbations on Single-Cell Transcriptional Responses [3.6] フェノタイプドラッグの発見は、生物活性分子を同定する可能性から、広く注目を集めている。
本稿では,特徴分離と伝達可能な表現学習のための新しい生成フレームワークであるXTransferCDRを提案する。
実験結果から,XTransferCDRは現在の最先端手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:09:16 GMT)
Optimal finite-dimensional probe states for quantum phase estimation [3.4] 完全な位相推定スキームは、通常最適なプローブ状態と測定を含む。
フォック基底の有限次元状態に対して、N00N状態は、平均粒子数が固定されているが状態次元がマイナス1に等しいとき、最適に停止する。
ここでは、この疑問に答える定理をいくつか提示し、実際の最終的な精度限界を実現するための完全な最適スキームを提供する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:28:25 GMT)
When SAM2 Meets Video Shadow and Mirror Detection [3.4] 本研究では,3つのビデオセグメンテーションにおけるセグメンテーションモデル2(SAM2)の有効性を評価する。
具体的には、地上の真理点またはマスクプロンプトを用いて、最初のフレームを初期化し、その後のフレームに対応するマスクを予測する。
実験の結果,特にポイントプロンプトを用いた場合,SAM2の性能は最適以下であることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:35:20 GMT)
Maximizing Information in Neuron Populations for Neuromorphic Spike Encoding [3.4] ニューロモルフィックの応用は、時間変化のアナログ刺激の代わりにスパイクを入力として使用することで、脳が行う処理をエミュレートする。
この損失を軽減するために、ある研究は1つのニューロンではなく、ニューロンの集団を用いてより多くの情報を符号化する集団符号化戦略を使用している。
本研究は,ニューロンの個体群における信号とスパイクの相互情報の最大化に基づくアプローチを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 00:15:47 GMT)
Large Language Models for Market Research: A Data-augmentation Approach [3.3] 大規模言語モデル(LLM)は、複雑な自然言語処理タスクに優れ、人工知能を変革した。
近年の研究では、LLMが生成するデータと人間のデータの間に大きなギャップが見られ、両者を置換する際にバイアスが発生している。
コンジョイント解析において,LLM生成データと実データとを効率的に統合する新しい統計データ拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 22:06:29 GMT)
Implementation of Magic State Injection within Heavy-Hexagon Architecture [3.2] ヘキサゴナル構造のマジック状態注入プロセスとフラッグ量子ビットとフラッグ量子ビットのない格子構造とを実装・比較する。
分析の結果,フラグ量子ビットの包含はマジック状態注入プロセスに異なる特徴をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 04:19:49 GMT)
Phys4DGen: A Physics-Driven Framework for Controllable and Efficient 4D Content Generation from a Single Image [3.1] 既存の方法は、4Dコンテンツのダイナミクスを導くために、事前訓練されたビデオ拡散モデルに大きく依存している。
物理対応の4Dコンテンツを生成する新しいフレームワークであるPhys4DGenを提案する。
物理的特性を視覚的に推測する人間の能力に触発され,物理知覚モジュールが導入された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:38:30 GMT)
When SparseMoE Meets Noisy Interactions: An Ensemble View on Denoising Recommendation [3.1] 本稿では,適応アンサンブル学習(Adaptive Ensemble Learning, AEL)を提案する。
AELはスパースゲーティングネットワークを脳として採用し、適切な認知能力の合成に適した専門家を選択する。
モデル複雑性のアンサンブル学習の欠点を解決するために,コンポーネントを積み重ねてサブレコメンダを作成する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:20:17 GMT)
RAG with Differential Privacy [3.0] Retrieval-Augmented Generation (RAG) は、新鮮で関連するコンテキストを持つ大規模言語モデルを提供する主要な技術として登場した。
外部文書を生成プロセスに統合することは、重大なプライバシー上の懸念を引き起こす。
本稿では,個人データから一般知識を抽出する手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:34:26 GMT)
Large Language Models Meet Graph Neural Networks: A Perspective of Graph Mining [2.9] 本稿では,この学際分野の研究のための新しい分類法を提案する。GNN-driving-LLM,GNN-driving-GNN,GNN-LLM-drivingの3つの主要なカテゴリを含む。
大規模言語モデルはグラフ構造化データを扱う大きな可能性を示しているが、高い計算要求と複雑さは依然として課題である。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:21:09 GMT)
Dynamical Characterization of Quantum Coherence [2.8] コヒーレンス(コヒーレンス)は 量子力学の重ね合わせの性質に根ざしている
我々はコヒーレンスとハミルトンの固有値が即時進化速度をどのように決定するかを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:28:56 GMT)
Revealing the Self: Brainwave-Based Human Trait Identification [2.7] 本稿では,脳波データを用いて人間の特徴をリアルタイムで識別する新しい手法を提案する。
我々の分析は、いくつかの新しい洞察を明らかにし、多様な人間の特性を特定するための画期的な統一アプローチへと繋がった。
我々は,脳波データを用いたリアルタイムな特徴識別ソリューションを開発した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:27:34 GMT)
Zero-shot Text-guided Infinite Image Synthesis with LLM guidance [2.5] 解像度とコンテキストの多様性を備えたテキストイメージのペアデータセットが不足している。
テキストに基づく画像の拡張には、グローバルコヒーレンスとリッチなローカルコンテキスト理解が必要である。
本稿では,大域的コヒーレンスと局所的文脈理解の両面において,Large Language Models (LLM) を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:49:20 GMT)
CALICO: Part-Focused Semantic Co-Segmentation with Large Vision-Language Models [2.3] 本稿では,画像間の共通部分と一意部分の識別と分割を目的とした,部分中心のセマンティック・セマンティック・セマンティック・セグメンテーションの新たな課題を紹介する。
画像間で複数のマスクを分割・推論できる最初のLVLMであるCALICOについて述べる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:59:37 GMT)
An experimental proposal certification for any three-qubit generalized Greenberger-Horne-Zeilinger states based on the fine-grained steering inequality [2.3] マルチパーティの量子ステアリングは、量子情報理論と量子力学において重要な概念である。
ここでは、光子系における一般化グリーンベルガー・ホルン・ザイリンガー状態(GGHZ)を準備するための実験的提案を行う。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:36:05 GMT)
Game-Theoretically Secure Distributed Protocols for Fair Allocation in Coalitional Games [2.2] 我々は,Shapley値に近似して乗算誤差を小さくする連立ゲームに対して,ゲーム理論的にセキュアなプロトコルを検討する。
ゲーム理論上のマクシミン・セキュリティの概念は、たとえ他の全てのプレイヤーが敵に感受性があるとしても、正直なプレイヤーの報酬を保証するために提案されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:13:21 GMT)
Characterizing resources for multiparameter estimation of SU(2) and SU(1,1) unitaries [1.9] 閉代数を形成する非可換ハミルトニアンを用いたユニタリ進化によって生成される多重パラメータの推定について検討する。
我々は,全粒子数などの典型的資源の観点から,精度の理想的なスケーリングを解析する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:36:38 GMT)
Advanced Knowledge Transfer: Refined Feature Distillation for Zero-Shot Quantization in Edge Computing [1.8] AKT(Advanced Knowledge Transfer)は、低ビット量子化(Q)モデルのトレーニング能力を高める新しい手法である。
低ビットQモデルの基本勾配爆発問題に対処する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:52:27 GMT)
Minimal Batch Adaptive Learning Policy Engine for Real-Time Mid-Price Forecasting in High-Frequency Trading [1.8] 本研究では,NASDAQのレベル1制限順序帳(LOB)データを用いた中間価格予測手法を提案する。
本稿では、バッチフリーで即時価格予測が可能な強化学習(RL)ベースのエージェントである適応学習ポリシーエンジン(ALPE)を紹介する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 22:49:53 GMT)
Clustering Algorithms and RAG Enhancing Semi-Supervised Text Classification with Large LLMs [1.7] 本稿では,セミスーパービジョンテキスト分類タスクの性能向上を目的としたクラスタリング,ラベル付け,拡張フレームワークを提案する。
従来のSSTCアプローチとは異なり、このフレームワークはクラスタリングを使用してラベリングの代表的な"ランドマーク"を選択する。
実験の結果,100以上のカテゴリを含む複雑な文書分類シナリオにおいても,Reutersデータセットでは95.41%,Web of Scienceデータセットでは82.43%の最先端の精度を達成した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 02:47:15 GMT)
Projected random forests and conformal prediction of circular data [1.6] 我々は、任意の線形応答回帰モデルを円形応答に適した形式に変換する一般的なプロジェクション手順を解析する。
合成および実データに対して、結果として生じるランダムな森林モデルは、より効率的なアウト・オブ・バグの共形予測セットを生成する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 04:11:19 GMT)
A Comprehensive Augmentation Framework for Anomaly Detection [1.6] 本稿では,再構成ネットワークのトレーニングに寄与するシミュレーション異常の重要な特徴を解析する。
我々は、このフレームワークを再構築ベースのアプローチと統合し、同時に分割トレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:19:12 GMT)
Sim911: Towards Effective and Equitable 9-1-1 Dispatcher Training with an LLM-Enabled Simulation [1.6] 大規模言語モデル(LLM)を用いた9-1-1ディスパッチの最初の訓練シミュレーションであるSim911を紹介する。
Sim911は,(1)実世界のシナリオを忠実に反映したシミュレーションを生成するために,アーカイブされたコールデータを利用する知識構築,(2)動的プロンプトとベクトルベースを利用するコンテキスト認識制御生成,(3)低品質応答をフィルタリングしてシステム性能を洗練するループ補正による検証,という3つの技術革新を通じて,トレーニングを強化する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 04:41:11 GMT)
Leveraging Self-Training and Variational Autoencoder for Agitation Detection in People with Dementia Using Wearable Sensors [1.5] 不安と攻撃性 (Agitation and Aression, AA) は、認知症(PwD)の長期治療や病院における症状の一つである。
AAは不快感を引き起こすだけでなく、患者や他の患者を危険に晒す。
人工知能(AI)と統合されたさまざまなウェアラブルセンサーを利用する既存の監視ソリューションは、タイムリーかつ適切な医療介入を行うのに十分な早期のAAを検出する手段を提供する。
本研究では,Empatica E4リストバンドの生理的データを用いて,PwD中のAAを検出するための包括的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 15:34:25 GMT)
Mobile Robots through Task-Based Human Instructions using Incremental Curriculum Learning [1.4] 本稿では,インクリメンタルカリキュラム学習(ICL)と深層強化学習(DRL)の統合について検討する。
人間の学習で直面する進歩的な複雑さを反映したカリキュラムを採用することで、我々のアプローチは、時間とともにロボットの複雑な命令の解釈と実行能力を体系的に強化する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:38:40 GMT)
Dual Channel Multi-Attention in ViT for Biometric Authentication using Forehead Subcutaneous Vein Pattern and Periocular Pattern [1.3] 本稿では,生体認証のための新しい2チャネルマルチアテンション・ビジョン・トランスフォーマ(ViT)フレームワークを提案する。
提案するフレームワークは、2つの異なる生体特性を扱うために設計された2チャンネルのViTアーキテクチャを利用する。
提案アルゴリズムの性能は,前頭下皮下静脈パターンと近視バイオメトリックパターンデータベースを用いて厳格に評価した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:40:15 GMT)
Multi-view Fake News Detection Model Based on Dynamic Hypergraph [1.2] 動的ハイパーグラフに基づくマルチビューフェイクニュース検出モデル(DHy-MFND)を提案する。
複数のニュース作品間の複雑な高次関係をモデル化するためにハイパーグラフ構造を用いる。
また、異なる視点にまたがる真正性関連埋め込みを捉えるために、対照的な学習を導入する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:05:51 GMT)
GAIS: A Novel Approach to Instance Selection with Graph Attention Networks [1.1] 本稿では,グラフアテンションに基づくインスタンス選択(GAIS)と呼ばれる新しい手法を提案する。
13の多様なデータセットの実験により、GAISは従来のIS手法よりも有効性において一貫して優れていたことが示されている。
GAISは計算コストが若干高いが、トレーニングデータを大幅に削減した精度を維持する上での優れた性能は、グラフベースのデータ選択に有望なアプローチである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:51:14 GMT)
Task Success Prediction and Open-Vocabulary Object Manipulation [1.1] 本研究では,オープンボキャブラリオブジェクト操作の今後の成功や失敗を予測するタスクについて述べる。
このタスクでは、自然言語命令、操作前の自我中心のビューイメージ、与えられたエンドエフェクタ・トラジェクトリに基づいて予測を行う必要がある。
本稿では,与えられた軌跡や画像と自然言語の指示を一致させることで,成功や失敗を予測できる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:11:41 GMT)
VQE for Ising Model \& A Comparative Analysis of Classical and Quantum Optimization Methods [1.0] 本稿では,新しい量子最適化手法QN-SPSA+PSRを提案する。
QN-SPSA計算効率とPSRの正確な勾配を統合し、安定性と収束速度の両方を改善している。
また、IsingモデルとNISQで最もよく動作するものを見つけるために、量子回路アンサッツ構造を詳細に研究する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:25:30 GMT)
New-type geometric gates in atomic arrays without Rydberg blockade [1.0] 本稿では,Rydbergブロックなしで制御相ゲートを実現するための新しい手法を提案する。
提案したゲートは、実際には非断熱的なホロノミック制御と非伝統的な幾何学的制御を同時に統合する新しいタイプの幾何学的ゲートである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:24:36 GMT)
Universal dimensions of visual representation [0.9] 我々は、様々な構成の視覚ニューラルネットワークから数十万の表現次元の普遍性を特徴づけた。
様々なアーキテクチャを持つネットワークは、潜在次元の共有集合を用いて自然画像を表現することを学習する。
ニューラルネットワークにおける最も脳に整合した表現は、普遍的で、ネットワークの特定の特性に依存しない表現である。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 00:08:33 GMT)
Teapot: Efficiently Uncovering Spectre Gadgets in COTS Binaries [0.8] 本稿では,COTSバイナリで動作する最初のSpectreガジェットスキャナであるTeapotについて述べる。
そこで本研究では,通常の実行と投機シミュレーションのバイナリコードを分離して,実行時の効率を改善する新しい手法であるSpeculation Shadowsを紹介する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:44:10 GMT)
Frequency shifts induced by light scalar fields [0.8] 我々は,プローブスカラー粒子を物質波干渉法における原子の粗い近似とみなす。
本稿では,カメレオンとシンメトロンの2つのスクリーニングされたスカラー場モデルのいずれかからなる環境との相互作用によって生じる周波数シフトについて論じる。
シンメトロンの場合、誘導周波数シフトはパラメータ空間の未到達部分を厳格に拘束する可能性がある。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:17:57 GMT)
Deep learning and whole-brain networks for biomarker discovery: modeling the dynamics of brain fluctuations in resting-state and cognitive tasks [0.7] 本研究は、安静状態およびタスクベース認知状態に関連する脳状態を識別するためのバイオマーカーとして、全脳ネットワークモデルからの分岐パラメータを評価する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:58:38 GMT)
Enhancing Long-Range Dependency with State Space Model and Kolmogorov-Arnold Networks for Aspect-Based Sentiment Analysis [0.7] ABSA(MambaForGCN)におけるアスペクトと意見語間の長距離依存性を高める新しいアプローチを提案する。
3つのベンチマークデータセットの実験結果は、MambaForGCNの有効性を示し、最先端(SOTA)ベースラインモデルを上回っている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:47:56 GMT)
Advancing LLM detection in the ALTA 2024 Shared Task: Techniques and Analysis [0.6] 本研究では,ハイブリッド記事中の文レベルの評価を通じて,AI生成テキストを識別する手法について検討する。
ChatGPT-3.5 Turboは、一貫したドメイン内検出を可能にする、異なる反復的な確率パターンを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:23:53 GMT)
Transformer-Based Wireless Capsule Endoscopy Bleeding Tissue Detection and Classification [0.6] 我々は出血フレームと非出血フレームの自動検出と分類のためのエンドツーエンドのトレーニング可能なモデルを設計する。
DETRモデルに基づいて,特徴抽出にはResnet50,出血および非出血領域検出にはトランスフォーマーエンコーダデコーダ,分類にはフィードフォワードニューラルネットワークを用いた。
自動WCEBleedGenバージョン1チャレンジトレーニングセットのエンドツーエンドアプローチでトレーニングされた本モデルでは,検出タスクと分類タスクの両方を単一ユニットとして実行する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:49:39 GMT)
Impact of color and mixing proportion of synthetic point clouds on semantic segmentation [0.5] 本研究では,合成点雲の色と混合比がセマンティックセグメンテーションにどのように影響するかを系統的に検討した。
実験の結果、合成色はモデル性能に大きく影響し、純粋なRealSPCでトレーニングされたモデルの一般的なコンポーネントのパフォーマンスは、実際のデータを持つモデルに匹敵することがわかった。
床、天井、壁といった大きな平らな要素では、SPCはモデル性能を損なうことなく、実点雲を置き換えることができる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:58:04 GMT)
Implementing a Robot Intrusion Prevention System (RIPS) for ROS 2 [0.5] RIPSは,ROS 2.0に基づくロボットアプリケーションに適した侵入防止システムである。
この原稿は、問題を包括的に説明し、ROS2アプリケーションのセキュリティ面と、ロボット環境のために開発した脅威モデルの重要なポイントを提供します。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:25:34 GMT)
A blueprint for large-scale quantum-network deployments [0.4] この記事では、MadQCI(Madrid Quantum Communication Infrastructure)テストベッドにデプロイされ、評価された上記の問題に対するソリューションの詳細な説明を紹介する。
このネットワークは、複数のプロバイダから量子キー配信モジュールをインストールすることで、通信エコシステムに量子通信を統合するように設計されている。
テストは、既存の古典的ネットワークのレガシートラフィックを保護する厳格なサービスレベルの合意に従って実施された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 23:28:03 GMT)
Brain Ageing Prediction using Isolation Forest Technique and Residual Neural Network (ResNet) [0.3] 本稿では,Residual Neural Network 101 Version 2 (ResNet101V2) モデルを用いた新しいディープラーニング手法を提案する。
提案したモデルをトレーニングし、検証し、テストするために、ICBM(International Consortium for Brain Mapping)からランダムに選択された2102画像の大規模なデータセットを使用した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:49:21 GMT)
Evaluating Convolutional Neural Networks for COVID-19 classification in chest X-ray images [0.3] 感染患者の効果的なスクリーニングは、新型コロナウイルスと闘うための重要なステップである。
胸部X線画像を用いた最近の研究は、新型コロナウイルスに関する関連情報が含まれていることを示唆している。
本稿では,4つの畳み込みニューラルネットワークを用いた胸部X線画像を用いた新型コロナウイルス自動検出手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 22:05:30 GMT)
Evaluating Self-Supervised Learning in Medical Imaging: A Benchmark for Robustness, Generalizability, and Multi-Domain Impact [0.3] 本稿では,医療領域内における自己教師あり学習(SSL)手法の総合評価について述べる。
MedMNISTデータセットコレクションを標準ベンチマークとして、11の異なる医療データセットにわたる8つの主要なSSLメソッドを評価した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:51:56 GMT)
Policy Gradients for Optimal Parallel Tempering MCMC [0.3] 並列テンパリング(英: Parallel tempering)は、マルコフ・チェイン・モンテカルロ(Markov Chain Monte Carlo)のメタアルゴリズムである。
本稿では,政策勾配法を用いてサンプリング中の温度を動的に調整する適応温度選択アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:17:52 GMT)
Scaling the Variational Quantum Eigensolver for Dynamic Portfolio Optimization [0.3] 本研究は,100kbitのユーティリティフロンティアを超える動的ポートフォリオ最適化問題の解法における変分量子固有解法の可能性について検討する。
我々は、アンサッツと実際の量子処理ユニットの異なる組み合わせをテストすることによって、この戦略を6から112キュービットまで、複雑さとサイズでスケールする方法を分析する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:11:22 GMT)
Pointwise-in-Time Explanation for Linear Temporal Logic Rules [0.2] ルールステータスアセスメント(RSA)という新しい枠組みを提案する。
RSAは、個々の時間ステップにおける軌道進行を記述するために、直感的なステータスを任意のルールに割り当てる。
我々は、RSAがポストホック診断として有用であることに気付き、ユーザーはルールの集合に関してエージェントの振る舞いを体系的に追跡できる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 20:28:12 GMT)
Optimizing Fantasy Sports Team Selection with Deep Reinforcement Learning [0.2] 我々は,チームの潜在的なパフォーマンスを最大化するために,プレイヤーを適応的に選択できるモデルを開発する。
我々の手法は、過去のプレイヤーデータを利用してRLアルゴリズムを訓練し、将来のパフォーマンスを予測し、チーム構成を最適化する。
以上の結果から,RLベースの戦略が,ファンタジースポーツにおける選手選択に有意義な洞察をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:36:18 GMT)
CAVE-Net: Classifying Abnormalities in Video Capsule Endoscopy [0.2] 複雑な画像データセットを解析する際の診断精度を向上させるために,アンサンブルに基づくアプローチを提案する。
各モデルのユニークな特徴抽出機能を活用し、全体的な精度を向上させる。
これらの手法を用いることで、提案フレームワークであるCAVE-Netは、ロバストな特徴識別と、より優れた分類結果を提供する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:24:43 GMT)
From MTEB to MTOB: Retrieval-Augmented Classification for Descriptive Grammars [0.2] モデルが言語文法からどのように情報を抽出し、分類できるかを評価するためのベンチマークのセットを紹介する。
ベンチマークは、WALSとGrambankの類型的特徴に焦点を当てた、言語家族間で248の言語に関する言語記述を含んでいる。
このベンチマークは、言語モデルの言語的特徴を正確に解釈し抽出するコンテキスト内能力を、初めて包括的に評価するものである。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:54:25 GMT)
VINEVI: A Virtualized Network Vision Architecture for Smart Monitoring of Heterogeneous Applications and Infrastructures [0.2] 本研究では、不均一なインフラストラクチャやアプリケーションのシームレスな監視を行うために、VINEVI(Vitualized NEtwork VIsion Architecture)を提案する。
VINEVIアーキテクチャは,インフラストラクチャをシームレスに監視するノード組込みトラフィック分類エージェントによって,最先端の技術の進歩を図っている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:05:14 GMT)
Improving the network traffic classification using the Packet Vision approach [0.2] Packet Visionは、ヘッダとペイロードの両方を考慮して、パケットの生データからイメージを構築することができる方法である。
当社のアプローチは、生データパケットを画像に変換することにより、セキュリティとプライバシを提供することにより、最先端技術に見いだされるものを抜粋する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 21:56:03 GMT)
Battery-free, stretchable, and autonomous smart packaging [0.1] 現在の食品包装は一般的に受動的であり、リアルタイムで食品環境の変化に適応できない。
我々は、クローズドループセンシングと活性化合物の放出を駆動する、バッテリーレスで自律的なスマートパッケージングシステムを開発した。
本システムは,リアルタイム食品監視のためのガスセンサ,近場通信(NFC)アンテナ,および活性化合物の放出を制御する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:40:29 GMT)
From Coin to Data: The Impact of Object Detection on Digital Numismatics [0.0] 画像記述とテキスト記述の両方を用いて、特定のコインの特徴を識別・分類するための柔軟なフレームワークを開発する。
以上の結果から,より大規模なCLIPモデルの複雑な画像検出における優れた性能が示された。
低品質データセットにおける類似度スコアの信頼性を高めるための統計的キャリブレーション機構を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:05:53 GMT)
Using a Feedback-Based Quantum Algorithm to Analyze the Critical Properties of the ANNNI Model Without Classical Optimization [0.0] フィードバック型量子アルゴリズム(FQA)を用いたANNNIモデル(Anisotropic Next-Nearest-Neighbor Ising)の臨界特性について検討する。
アルゴリズムの対称性を活用することで、ターゲットとする初期状態が収束を高め、励起状態の研究を促進することを示す。
この結果から、FQAが量子系を研究するための汎用的なツールとしての可能性を強調し、量子相転移と複雑なスピンモデルの磁気的性質に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 20:15:28 GMT)
Transverse orbital angular momentum and polarization entangled spatiotemporal structured light [0.0] システム内の絡み合いは、同じシステム内の非分離モード間で起こる。
我々は, 新規な t-OAM と絡み合った偏光構造光を創出し, 特徴付ける方法を開発した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:43:15 GMT)
Time Series Foundational Models: Their Role in Anomaly Detection and Prediction [0.0] 時系列基礎モデル (TSFM) は時系列予測において注目されている。
本稿では,異常検出および予測タスクにおけるTSFMの有効性を批判的に評価する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:15:30 GMT)
Thermal quantum correlations of a single electron in a double quantum dot with transverse magnetic field [0.0] 半導体二重量子ドット系の熱量子相関について検討する。
量子相関生成における熱絡み合いと相関コヒーレンスの役割を強調した。
これは、相関コヒーレンスのみに基づく量子アルゴリズムは、絡み合いに依存するアルゴリズムよりも弾力性が高いことを示唆している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:43:36 GMT)
The Quantum and Stochastic Toolbox: xSPDE4.2 [0.0] xSPDEは、生物学、化学、工学、医学、物理学、量子技術に応用された偏微分方程式と常微分方程式を解く。
時間ステップやサンプリングエラー推定を含む統計平均を計算する。
ツールボックスにはグラフィカルな出力と$chi2$統計、重み付け、投影、フォワードバックの方程式がある。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:06:21 GMT)
The Internet of Value: Integrating Blockchain and Lightning Network Micropayments for Knowledge Markets [0.0] 本研究では、Lightning Networkベースのマイクロペイメント戦略をQ&Aプラットフォームに統合する。
最低限の支払い障壁のない知識市場を作ることを目指している。
発見によると、ポンド0.01のような最小限の支払いさえも、より高い品質とレスポンスの努力を大いに促進している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 23:57:54 GMT)
Statistical Taylor Expansion [0.0] 統計的テイラー展開は、従来のテイラー展開における入力された正確な変数を、既知の分布を持つ確率変数に置き換え、結果平均と偏差を計算する。
本稿では、分散算術と呼ばれる統計テイラー展開の実装と分散算術に関する試験について述べる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:27:23 GMT)
Squeezing in conditional measurement setup with coherent input [0.0] 線形光学素子と光子検出を併用した条件測定方式は、非古典的状態発生のための肥大地盤である。
設定に関わるパラメータをチューニングすることで、設定から最適なスクイーズを実現できることを示す。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:49:16 GMT)
SoK: Liquid Staking Tokens (LSTs) and Emerging Trends in Restaking [0.0] 分散ファイナンス(DeFi)における最近のイノベーションを振り返って
Liquid Stake Tokens(LST)は、Proof-of-Stake(PoS)ブロックチェーン上のステンドトークンのトークン化表現である。
Restakeはこのコンセプトに基づいて、ステンドトークンやLST、あるいはネイティブのBitcoinトークンが追加のプロトコルやPoSチェーンを保護し、追加的な報酬を得られるようにしている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:59:40 GMT)
Sentiment trading with large language models [0.0] OPTは感情予測の精度が最も高く、74.4%の精度を示している。
BERTとFINBERTは、より少ない範囲で予測的関連性を示す。
Loughran-McDonald辞書モデルのスコアとストックリターンとの間に有意な関係はみられない。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 15:01:24 GMT)
Robust Speech and Natural Language Processing Models for Depression Screening [0.0] うつ病は世界的な健康上の問題であり、患者スクリーニングの強化が不可欠である。
この目的のために開発された2つのディープラーニングモデルについて述べる。
1つのモデルは音響に基づいており、もう1つは自然言語処理に基づいている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:05:52 GMT)
Reflection on Purpose Changes Students' Academic Interests: A Scalable Intervention in an Online Course Catalog [0.0] この介入は、学生の興味を説明する上での認知的関与を増大させたが、探索活動は減少した。
学生は創造的な芸術や社会の変化に関するコースに興味を持つようになったが、コンピュータやデータサイエンスには興味を示さなかった。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 03:12:50 GMT)
Protecting Cryptographic Libraries against Side-Channel and Code-Reuse Attacks [0.0] 本稿では,実装するセキュリティ対策の観点から,一般的な暗号ライブラリについて検討し,セキュリティ上の脆弱性を指摘し,開発プロセスにおけるセキュリティ改善を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:17:44 GMT)
Predictive Pattern Recognition Techniques Towards Spatiotemporal Representation of Plant Growth in Simulated and Controlled Environments: A Comprehensive Review [0.0] 本稿では,最先端の予測パターン認識技術について概説する。
植物形質の確率論的モデリングと動的環境相互作用の統合に着目した。
主なトピックは、予測タスクのための回帰とニューラルネットワークベースの表現モデルだ。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 00:11:40 GMT)
Perturbative Framework for Engineering Arbitrary Floquet Hamiltonian [0.0] フロケット位相空間における任意の対象ハミルトニアンを設計するための体系的摂動フレームワークを開発する。
工学的なフロケ・ハミルトンの高次誤差は、高次駆動電位を摂動的に付加することによって緩和される。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:22:22 GMT)
Optimizing Multi-Stage Language Models for Effective Text Retrieval [0.0] 本稿では,日本語の法的データセットに最適化された2相テキスト検索パイプラインを提案する。
提案手法は,高度な言語モデルを用いて最先端の性能を実現する。
堅牢性と適応性をさらに向上するため,複数の検索戦略を統合するアンサンブルモデルを組み込んだ。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:05:19 GMT)
Note on rotational properties of position operators of massless particles [0.0] この作用の線型化は、必ずしも非可換成分を持つプレイス作用素につながることが示されている。
この問題は、Callan, Coleman, Wess, Zumino 法による幾何学的観点からも解析される。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:53:22 GMT)
Master Stability Functions in Complex Networks [0.0] Master Stability Function (MSF) は同期状態の安定性を特徴付ける強力なツールである。
本稿では,拡散対結合力学系におけるMSFの解析について再検討する。
多層動的ネットワークと単層結合系に対するMSFの導出には、高次相互作用とペアの相互作用を併用する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:47:00 GMT)
Local Short-Time Acceleration induced Spectral Line Broadening and Possible Implications in Cosmology [0.0] この効果は、ウンルー効果の局所的および非一様一般化と見なすことができる。
距離-赤方偏移関係を適合させることにより宇宙膨張の加速を測定することは、基本的に線幅または赤方偏移拡大の測定である。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 12:19:27 GMT)
Latenrgy: Model Agnostic Latency and Energy Consumption Prediction for Binary Classifiers [0.0] 機械学習システムは、科学分野や産業のイノベーションをますます加速させる。
しかし、特に推論の間、計算オーバーヘッドにおける課題はスケーラビリティと持続可能性を制限する。
この研究は、主に遅延とエネルギー消費に関する一般化予測技術が欠如していることから、文学における重要なギャップに対処する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:51:24 GMT)
Jasper and Stella: distillation of SOTA embedding models [0.0] 埋め込みモデルを正確に評価するために、テキスト埋め込みベンチマークが確立されている。
これらのベンチマークにより、SOTAモデルを使用できるが、業界におけるこれらのモデルの展開と適用は、その大きなベクトル次元によって妨げられた。
より小規模な学生モデルで良好な性能が得られる蒸留技術を提案する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 04:05:28 GMT)
Investigating the Temporal Dynamics of Cyber Threat Intelligence [0.0] 近年のCVEに関するサイバー脅威インテリジェンス(CTI)のタイムラインと包括性を分析する。
我々の分析は、脅威の性質、進化の軌跡、時間の経過とともに観測される可能性など様々な要因が、IoCの発行速度にどのように影響するかを考察している。
感染モデルに類似した再発パターンを呈し, 脆弱性の公表後初回, 急激な急激な急上昇, その後, IoCの公表率の低下とともに, 経過観察を行った。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 06:54:27 GMT)
Integrating Artificial Open Generative Artificial Intelligence into Software Supply Chain Security [0.0] 我々は,有望なオープン言語モデル(LLM)の実験を,ソースコード言語エラーと非推奨コードという,2つの主要なソフトウェアセキュリティ課題に分けて実施する。
以上の結果から,LSMは予期せぬ結果を示すが,特にメモリの複雑化や,新しいデータパターンや不慣れなデータパターンの管理において,大きな制約が生じることが示唆された。
これらの課題にもかかわらず、LLMの積極的な適用は、広範なセキュリティデータベースや継続的更新と相まって、新たな脅威に対してソフトウェアサプライチェーンプロセスを強化できる可能性を秘めている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 07:03:55 GMT)
Informational analysis of the confinement of an electron in an asymmetric double quantum dot [0.0] 準一次元の1電子二重量子ドットはシャノン情報エントロピーの枠組みの中で研究されている。
本研究ではシャノン情報エントロピーを電子閉じ込めの変化を調査するためのツールとして利用する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:03:22 GMT)
How Do Artificial Intelligences Think? The Three Mathematico-Cognitive Factors of Categorical Segmentation Operated by Synthetic Neurons [0.0] 言語モデルにおける合成ニューロンは、どのようにして情報環境をセグメント化し分析する「思考」カテゴリを作成するのか?
本研究は, プライミング, 注意, カテゴリー的思考という概念を通してこれらの概念を探求する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:26:00 GMT)
High order schemes for solving partial differential equations on a quantum computer [0.0] より高階法は、古典的な場合と同様、離散化に必要な量子ビットの数を削減できることを示す。
この結果は、ハミルトニアン進化に基づく量子アルゴリズムの実践的な応用に重要な結果をもたらす。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:21:59 GMT)
Harmonic generation with topological edge states and electron-electron interaction [0.0] Su-Schrieffer-Heeger(SSH)モデルにおけるトポロジカルエッジ状態の存在は、高調波発生スペクトルに大きな影響を及ぼす。
我々は,多体基底状態と少数の励起多体状態のみを用いて,自明な位相と位相相の調和収率の大きな差を少数レベルのモデルで再現できることを示した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:11:01 GMT)
Handwriting Anomalies and Learning Disabilities through Recurrent Neural Networks and Geometric Pattern Analysis [0.0] 本研究では、高度な幾何学的パターンとリカレントニューラルネットワーク(RNN)を用いて、失読と失読を示す手書き異常を同定する。
書き起こしはまず標準化され、次にベースラインのずれ、文字の接続性、ストロークの厚さ、その他の異常に焦点を当てた特徴抽出が続く。
最初の結果は、このRNNモデルが、ジストレキシーとジストニアを併用して、最先端の性能を達成する能力を示した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 05:28:54 GMT)
From Interets to Insights: An LLM Approach to Course Recommendations Using Natural Language Queries [0.0] 本稿では,新しいLarge Language Model (LLM) コースレコメンデーションシステムについて述べる。
コース記述のコーパスにRAG(Retrieval Augmented Generation)法を適用する。
システムはまず、ユーザのクエリに基づいて「理想」のコース記述を生成する。
この記述は埋め込みを用いて検索ベクトルに変換され、類似したコンテンツを持つ実際のコースを見つけるのに使用される。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:19:53 GMT)
Experimental demonstration and modeling of near-infrared nonlinear third-order triple-photon generation stimulated over one mode [0.0] トリプル光子生成(英: Triple Photon Generation、TPG)は、光子が3つの低エネルギー光子に分裂する3次の非線形光学相互作用である。
本研究では,三重項の1つのモードで刺激されたTPGの初回実験を行った。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 20:42:17 GMT)
Exact Solution of Bipartite Fluctuations in One-Dimensional Fermions [0.0] 量子多体系における流体力学の出現は、近年、関心が高まっている。
理論的には、一次元非相互作用フェルミオン力学における二部構造揺らぎのばらつきを理論的に研究する。
ここでの正確な解と数値的な発見は、量子多体力学における二部格子のゆらぎを増大させる基盤となる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:11:51 GMT)
Entanglement of a chiral scalar on the torus [0.0] 任意の温度で円上のカイラルスカラーの間隔の絡み合いエントロピーを計算する。
我々は、ある作用素のリゾルダーの観点からエントロピーを表現することを含むリゾルダー法を用いる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 19:00:11 GMT)
Discrete vs. Continuous Trade-offs for Generative Models [0.0] 本研究は拡散確率モデル(DDPM)の理論的および実践的基礎を探求する。
プロセスとブラウン運動を利用して複雑なデータ分布をモデル化するDDPMとスコアベース生成モデル。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 08:14:27 GMT)
Developing Explainable Machine Learning Model using Augmented Concept Activation Vector [0.0] 本稿では,機械学習モデルによる高レベルの概念と意思決定の相関性を測定する手法を提案する。
提案手法は,与えられたハイレベルな概念の影響を分離し,定量的に測定することができる。
本研究では、不均衡なデータセットで頻繁に発生する機械学習モデルにおける頻繁なパターンの頻度を決定することを目的とする。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 13:18:16 GMT)
Degrees of Entanglement in Systems of Three Indistinguishable Bosons: Revisiting the GHZ State [0.0] 本研究では, 識別不能なボソン系における真の三部構造絡みの検出問題について検討する。
特に、標準的なGHZ状態と類似性を持つ区別不能なボソンの状態を導入する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 15:02:37 GMT)
Deep Bayes Factors [0.0] 本稿では,2つの競合モデルのシミュレーションデータに基づいてベイズ係数のディープラーニング推定手法を提案する。
我々の推定器は要約統計を欠き、ABCモデル選択の難しさのいくつかを排除している。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:41:00 GMT)
Cryptomite: A versatile and user-friendly library of randomness extractors [0.0] ランダム性抽出実装のPythonライブラリであるCryptomiteを提示する。
このライブラリは、パラメータ計算モジュールとともに、2つのソース、シード、決定論的ランダムネス抽出器を提供する。
抽出器の実装は、実際は効率的であり、最大240>1012$ビットの入力サイズを許容する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 23:57:57 GMT)
Constructive approximate transport maps with normalizing flows [0.0] 連続性方程式の近似制御可能性問題とその正規化フローを用いた輸送マップ構築への応用について検討する。
ベクトル場 $w(atop x + b)_+$ における時間依存制御 $theta=(w, a, b)$ を、既知の基底密度をおよそ輸送するために構築する。
我々の主な結果は、$rho_*$ と $rho_mathrmB$ の相対テール崩壊の仮定に依存し、相対エントロピーにおける連続方程式の到達可能な空間を特徴づけるヒントを提供する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 22:09:33 GMT)
Comprehensive explanation of ZZ coupling in superconducting qubits [0.0] 超伝導量子コンピュータのスケールアップにおける大きな課題は、量子ビット間の不要な結合である。
本稿では,図式理論と状態割り当てアルゴリズムを含む解析的および数値的手法を紹介する。
本稿では,フラックス可変トランスモンカップラで接続された2つの固定周波数トランスモンキュービットからなるシステムについて紹介する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:09:38 GMT)
Comparative Study of Quantum Transpilers: Evaluating the Performance of qiskit-braket-provider, qBraid-SDK, and Pytket Extensions [0.0] QiskitからBraketへの特殊なトランスパイラであるKeiskit-Braket-providerは、0.2%という驚くほど低い失敗率を達成した。
複数のSDKにまたがって汎用的なトランスパイルを提供するqBraid-SDKは、堅牢だが遅い性能を示した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 01:33:49 GMT)
Beyond Questionnaires: Video Analysis for Social Anxiety Detection [0.0] 社会的不安障害(英語版) (SAD) は個人の日常生活や関係に大きな影響を及ぼす。
SAD検出の従来の方法には、身体的相談や自己報告のアンケートが含まれる。
本稿では,早期SAD検出法としてビデオ解析を導入する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 10:04:31 GMT)
Are Two Hidden Layers Still Enough for the Physics-Informed Neural Networks? [0.0] 本稿では,ニューラルネットワークを単一の隠蔽層で初期化し,訓練するための様々な手法と手法の開発について論じる。
提案手法は、分離可能な物理インフォームドニューラルネットワークアプローチを用いて、2次元問題に拡張されている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 14:30:54 GMT)
Anvendelse av kunstig intelligens (KI) i Norge i norsk offentlig sektor 2024 [0.0] ノルウェーにおけるAIの利用には大きな期待がある。
一方、ノルウェーにおけるAIの採用は、民間と公共の両方で予想されるよりも遅いことが報告されている。
この記事では、地方(自治体)と政府機関に焦点をあてて、AIの報告と計画された使用について考察する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 16:28:49 GMT)
Analog quantum simulation of small-polaron physics in arrays of neutral atoms with Rydberg-dressed resonant dipole-dipole interaction [0.0] 近年、強い運動量依存相互作用を持つ系における鋭い極性遷移への関心が高まっている。
本研究は、アナログ量子シミュレータの枠組み内で、そのような現象を制御可能な方法で研究するためのスキームを提案する。
想定されたアナログシミュレータは、ピエルスと呼吸モード型の励起-フォノン相互作用の豊かな相互作用を研究することができる。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 17:54:57 GMT)
A novel framework for MCDM based on Z numbers and soft likelihood function [0.0] 本稿では,ファジィメンバーシップと信頼性尺度の情報量に基づいて,ソフトな可能性関数の枠組みを考案する。
提案フレームワークの有効性と妥当性を検証するためのアプリケーションを提供する。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 18:47:19 GMT)
A Rhetorical Relations-Based Framework for Tailored Multimedia Document Summarization [0.0] 本稿では,マルチメディア文書要約のための新しいフレームワークを提案する。
このフレームワークは文書の固有の構造を利用して、一貫性と簡潔な要約を作成できる。
重み付けアルゴリズムを用いて文書単位に重み付けを行い、関連コンテンツの効果的なランク付けと選択を可能にする。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 09:29:59 GMT)
A Reinforcement Learning-Based Task Mapping Method to Improve the Reliability of Clustered Manycores [0.0] 本稿では,マルチコアシステムの信頼性向上を目的とした強化学習(RL)に基づくタスクマッピング手法を提案する。
この方法は、binパッキング、Task-to-binマッピング、Task-to-coreマッピングを含む3つのステップから構成される。
提案手法の有効性をSPLASH2およびPARSECベンチマークスイートアプリケーションを用いて16,32,64コアシステムで評価した。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 20:08:10 GMT)
A No-Go Theorem for ψ-ontic Models? Yes! Response to Criticisms [0.0] このエッセイはそのような反対に反応し、また再び論文で証明された定理が正し、従ってガオの主張に反して真であることを示すことを目的としている。
論文参考訳(メタデータ) (Thu, 26 Dec 2024 11:41:13 GMT)