International Scientific Report on the Safety of Advanced AI (Interim Report) [178.0] この報告書は、AIの安全性に関する第1回国際科学報告書の暫定的な発表である。
このレポートには、30カ国、EU、国連から指名された国際専門家諮問委員会を含む、75人のAI専門家の多種多様なグループが貢献した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:47:23 GMT)
GenXD: Generating Any 3D and 4D Scenes [137.5] 本稿では,日常的によく見られるカメラと物体の動きを利用して,一般的な3Dと4Dの生成を共同で調査することを提案する。
すべての3Dおよび4Dデータを活用することで、我々は、あらゆる3Dまたは4Dシーンを生成できるフレームワークであるGenXDを開発した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:08:43 GMT)
LiVOS: Light Video Object Segmentation with Gated Linear Matching [116.6] LiVOSはリニアアテンションによるリニアマッチングを利用する軽量メモリネットワークである。
長くて高解像度のビデオでは、STMベースのメソッドと53%のGPUメモリで一致し、32Gの消費者向けGPU上で4096pの推論をサポートする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:36:17 GMT)
Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.7] SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:52:39 GMT)
On the loss of context-awareness in general instruction fine-tuning [101.0] 命令応答対における教師付き微調整(SFT)のようなポストトレーニング手法は、事前トレーニング中に学習した既存の能力を損なう可能性がある。
そこで本研究では,ユーザプロンプトに配慮したポストホックアテンション・ステアリングと,コンテキスト依存度指標を用いた条件付きインストラクションの微調整という,インストラクションモデルにおけるコンテキスト認識の損失を軽減する2つの方法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:16:01 GMT)
Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent [94.8] マルチモーダル大規模言語モデル(MLLM)に固有の「ハロシン化」問題を緩和する上で,mRAG(Multimodal Retrieval Augmented Generation)が重要な役割を果たしている。
マルチモーダル検索のための自己適応型計画エージェントOmniSearchを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:27:21 GMT)
Benchmarking Vision Language Model Unlearning via Fictitious Facial Identity Dataset [94.1] 我々は、未学習アルゴリズムの有効性を頑健に評価するために設計された新しいVLMアンラーニングベンチマークであるFacial Identity Unlearning Benchmark (FIUBench)を紹介する。
情報ソースとその露出レベルを正確に制御する2段階評価パイプラインを適用した。
FIUBench 内の 4 つのベースライン VLM アンラーニングアルゴリズムの評価により,すべての手法がアンラーニング性能に制限されていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:26:10 GMT)
ShieldLM: Empowering LLMs as Aligned, Customizable and Explainable Safety Detectors [90.7] ShieldLMは、LLM(Large Language Models)の安全性検出装置で、一般的な安全基準に準拠している。
ShieldLMは4つのテストセットにまたがる強力なベースラインを超えており、優れたカスタマイズ性と説明可能性を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:13:59 GMT)
Safe Unlearning: A Surprisingly Effective and Generalizable Solution to Defend Against Jailbreak Attacks [89.5] 我々は、LLMの有害な知識を直接解き放つことは、脱獄攻撃から守るためのより効果的な方法になり得ると推測する。
Vicuna-7Bの攻撃成功率(ASR)は82.6%から7.7%に低下した。
Llama2-7B-Chatは、約0.1Mの安全アライメントサンプルで微調整されているが、追加の安全システムプロンプトの下でも21.9%のASRを持つ。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:30:56 GMT)
Self-Exploring Language Models: Active Preference Elicitation for Online Alignment [88.6] 本研究では, 分布域外領域を積極的に探索するために, 潜在的に高次応答に対して楽観的に偏りを呈する2段階的客観性を提案する。
実験の結果,Zephyr-7B-SFTとLlama-3-8B-Instructモデルで微調整した場合,SELM(Self-Exploring Language Models)は命令追従ベンチマークの性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:21:18 GMT)
Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent [83.4] Hunyuan-Largeは、オープンソースのTransformerベースのエキスパートモデルのミックスである。
我々は,Hunyuan-Largeの優れた性能を,様々なベンチマークで徹底的に評価する。
Hunyuan-Largeの主な実践は、以前の文献より大きい大規模合成データである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:14:25 GMT)
Textual Aesthetics in Large Language Models [80.1] 美学研磨のためのパイプラインを導入し,テキスト美学データセットTexAesの構築を支援する。
そこで本研究では,TAPOと呼ばれる直接選好最適化に基づくテキスト美学を利用した微調整手法を提案する。
本実験は,テキスト美学データとTAPOファインチューニング法を用いて,美学のスコアを改善するだけでなく,一般的な評価データセットの性能を向上させることを実証した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:22:08 GMT)
Multi-Programming Language Sandbox for LLMs [79.0] 大規模言語モデル(LLM)用のコンパイラと分析ツールから統一的で包括的なフィードバックを提供するように設計された、アウト・オブ・ザ・ボックスのマルチプログラミング言語サンドボックス
コードのプログラミング言語を自動的に識別し、独立したサブサンドボックス内でコンパイルして実行することで、安全性と安定性を確保することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:26:07 GMT)
Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.5] 位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:20:14 GMT)
Limits of Transformer Language Models on Learning to Compose Algorithms [77.2] 我々は,LLaMAモデルのトレーニングと,複数の個別サブタスクの合成学習を必要とする4つのタスクにおけるGPT-4とGeminiの促進について検討した。
その結果,現在最先端のTransformer言語モデルにおける構成学習は,非常に非効率なサンプルであることが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:32:38 GMT)
Predictor-Corrector Enhanced Transformers with Exponential Moving Average Coefficient Learning [73.7] トラクションエラーを最小限に抑えるための予測-相関学習フレームワークを提案する。
また、高次予測器を強化するために、指数関数的移動平均ベース係数学習法を提案する。
我々のモデルは3.8BのDeepNetを平均2.9のSacreBLEUで上回り、1/3のパラメータしか使用していない。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:26:25 GMT)
Dynamic Typography: Bringing Text to Life via Video Diffusion Prior [73.7] 動的タイポグラフィー(Dynamic Typography)と呼ばれる自動テキストアニメーション方式を提案する。
意味的意味を伝えるために文字を変形させ、ユーザプロンプトに基づいて活気ある動きを注入する。
本手法は,ベクトルグラフィックス表現とエンドツーエンド最適化に基づくフレームワークを利用する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:16:54 GMT)
Large Language Models Orchestrating Structured Reasoning Achieve Kaggle Grandmaster Level [73.1] 我々は、エンドツーエンドの自律データサイエンスエージェントであるAgent K v1.0を紹介する。
経験から学ぶことによって、データサイエンスのライフサイクル全体を管理する。
キー情報を選択的に保存して検索することで、長期記憶と短期記憶を最適化する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:55:23 GMT)
Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner [72.2] 医療の安全性と有効性を理解するためには,観測データから因果量の推定が重要である。
医療従事者は、平均因果量の推定だけでなく、治療効果のランダム性をランダムな変数として理解する必要がある。
このランダム性はアレタリック不確実性と呼ばれ、治療効果の利益や量子化の確率を理解するために必要である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:14:49 GMT)
DA-MoE: Addressing Depth-Sensitivity in Graph-Level Analysis through Mixture of Experts [70.2] グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理することで人気を集めている。
既存のメソッドは通常、固定数のGNNレイヤを使用して、すべてのグラフの表現を生成する。
本稿では,GNNに2つの改良を加えたDA-MoE法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:46:27 GMT)
Domain Expansion and Boundary Growth for Open-Set Single-Source Domain Generalization [70.0] オープンソースの単一ソースドメインの一般化は、単一のソースドメインを使用して、未知のターゲットドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
本稿では,領域拡大と境界成長に基づく新しい学習手法を提案する。
提案手法は,いくつかの領域横断画像分類データセットにおいて,大幅な改善と最先端性能を実現することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:08:46 GMT)
Provably Efficient Reinforcement Learning with Multinomial Logit Function Approximation [67.8] 本稿では,MNL関数近似を用いたMDPの新しいクラスについて検討し,状態空間上の確率分布の正当性を保証する。
非線型関数の導入は、計算効率と統計効率の両方において大きな課題を提起する。
我々は,$mathcalO(1)$$コストで同じ後悔を実現するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:29:25 GMT)
UniVST: A Unified Framework for Training-free Localized Video Style Transfer [66.7] ローカライズドビデオスタイル転送のための統一フレームワークUniVSTを提案する。
トレーニングは不要で、ビデオ全体にわたってスタイルを転送する既存の方法に対して、明確なアドバンテージを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:52:50 GMT)
Near-Optimal Dynamic Regret for Adversarial Linear Mixture MDPs [63.5] 本研究は,完全情報フィードバックの下で,相変わらずの相変わらずの線形混合MDPについて検討した。
本稿では,占領率に基づく手法と政策に基づく手法の利点を組み合わせた新しいアルゴリズムを提案する。
我々のアルゴリズムは$widetildemathcalO(d sqrtH3 K + sqrtHK(H + barP_K$)$ dynamic regret, ここで$d$は特徴次元である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:55:52 GMT)
Causal Responsibility Attribution for Human-AI Collaboration [62.5] 本稿では,人間のAIシステムにおける責任を体系的に評価するために,構造因果モデル(SCM)を用いた因果的枠組みを提案する。
2つのケーススタディは、多様な人間とAIのコラボレーションシナリオにおけるフレームワークの適応性を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:17:45 GMT)
HtmlRAG: HTML is Better Than Plain Text for Modeling Retrieved Knowledge in RAG Systems [62.4] Retrieval-Augmented Generation (RAG) は知識能力の向上を目的としている。
RAGは、検索された知識のフォーマットとして、平易なテキストの代わりにHTMLを使用する。
我々は,情報の損失を最小限に抑えつつ,HTMLの短縮化を図るため,HTMLのクリーニング,圧縮,プルーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:58:36 GMT)
Unified Human-Scene Interaction via Prompted Chain-of-Contacts [61.9] HSI(Human-Scene Interaction)は、AIや仮想現実といった分野において重要なコンポーネントである。
本稿では,言語コマンドによる多様なインタラクションの統一制御を支援する統一型HSIフレームワークUniHSIを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:17:22 GMT)
Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey [61.4] 世界モデルとビデオ生成は、自動運転の領域において重要な技術である。
本稿では,この2つの技術の関係について検討する。
映像生成モデルと世界モデルとの相互作用を分析することにより,重要な課題と今後の研究方向性を明らかにする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:58:35 GMT)
Improving Domain Generalization in Self-supervised Monocular Depth Estimation via Stabilized Adversarial Training [61.4] 我々は、SCAT(stabilized Conflict-Optimization Adversarial Training)という、汎用的な敵訓練フレームワークを提案する。
SCATは、安定性と一般化のバランスを達成するために、敵データ拡張を自己教師付きMDE手法に統合する。
5つのベンチマーク実験により、SCATは最先端の性能を達成でき、既存の自己監督型MDE法の一般化能力を大幅に向上できることが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:41:28 GMT)
Specialized Foundation Models Struggle to Beat Supervised Baselines [60.2] ゲノミクス、衛星画像、時系列の3つのモードを最近のFMで調べ、それらを標準的な教師付き学習ワークフローと比較する。
最新のファンデーションモデルにマッチしたり、性能を上回るような、シンプルな教師付きモデルのトレーニングが一貫して可能であることが分かりました。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:10:59 GMT)
CoVR-2: Automatic Data Construction for Composed Video Retrieval [59.9] Composed Image Retrieval (CoIR) はテキストと画像のクエリを一緒に考えるタスクとして最近人気を集めている。
本稿では,ビデオキャプションペアのトリプレットを生成する,スケーラブルな自動データセット作成手法を提案する。
また、コンポジションビデオ検索(CoVR)を含むタスクの範囲を広げる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:51:22 GMT)
Usefulness of LLMs as an Author Checklist Assistant for Scientific Papers: NeurIPS'24 Experiment [59.1] 大規模言語モデル(LLM)は、科学的ピアレビューを支援する上で有望だが議論の余地のあるツールである。
本研究は,論文提出を提出基準に適合させるツールとして,会議環境におけるLCMの有用性を評価する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:58:00 GMT)
MT-Bench-101: A Fine-Grained Benchmark for Evaluating Large Language Models in Multi-Turn Dialogues [58.3] MT-Bench-101は,マルチターン対話におけるLarge Language Models (LLMs) の細粒度化能力を評価するために設計された。
1388のタスクで4208のターンが1388のマルチターン対話にまたがる3階層の階層的能力分類を構築した。
次に,MT-Bench-101に基づく21のLLMを評価し,能力とタスクの観点から総合的な分析を行った。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:40:21 GMT)
GraphReader: Building Graph-based Agent to Enhance Long-Context Abilities of Large Language Models [58.1] 大規模言語モデル(LLM)では、複雑なロングコンテクストのタスクに対処するためには、ロングコンテクストの能力が不可欠である。
グラフをグラフに構造化し、エージェントを使ってグラフを自律的に探索することで、長いテキストを扱うように設計されたグラフベースのエージェントシステムであるGraphReaderを紹介する。
LV-Evalデータセットの実験結果によると、GraphReaderは4kコンテキストウィンドウを使用して、16kから256kまでのコンテキスト長で一貫してGPT-4-128kを上回っている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:51:40 GMT)
PaCE: Parsimonious Concept Engineering for Large Language Models [57.7] Parsimonious Concept Engineering (PaCE)は、アライメントのための新しいアクティベーションエンジニアリングフレームワークである。
アクティベーション空間において,各原子が意味論的概念に対応する大規模概念辞書を構築する。
本研究では,PaCEが言語能力を維持しつつ,最先端のアライメント性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:43:18 GMT)
DFA-GNN: Forward Learning of Graph Neural Networks by Direct Feedback Alignment [57.6] グラフニューラルネットワークは、様々なアプリケーションにまたがる強力なパフォーマンスで認識されている。
BPには、その生物学的妥当性に挑戦する制限があり、グラフベースのタスクのためのトレーニングニューラルネットワークの効率、スケーラビリティ、並列性に影響を与える。
半教師付き学習のケーススタディを用いて,GNNに適した新しい前方学習フレームワークであるDFA-GNNを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:00:37 GMT)
MuPT: A Generative Symbolic Music Pretrained Transformer [56.1] 音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:40:25 GMT)
Decoupling Fine Detail and Global Geometry for Compressed Depth Map Super-Resolution [56.0] ビット深度圧縮は、微妙な変化のある領域で均一な深度表現を生成し、詳細情報の回復を妨げる。
密集したランダムノイズは、シーンのグローバルな幾何学的構造を推定する精度を低下させる。
圧縮深度マップ超解像のための新しいフレームワークGDNetを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:37:30 GMT)
Fine-Grained Spatial and Verbal Losses for 3D Visual Grounding [54.5] 3Dビジュアルグラウンドリングは、付随する言語記述によって参照される3Dシーンのインスタンスを識別する。
ほとんどの手法は、予測された候補インスタンス上の分布に対する基本的な教師付きクロスエントロピー損失に依存している。
本稿では,3次元視覚的接地における2つの新たな損失について紹介する。各インスタンスから接地構造参照インスタンスへの回帰ベクトルオフセットに対する視覚レベルオフセットの損失と,参照インスタンスの単語レベルスパンの予測における言語関連スパンの損失である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:39:25 GMT)
Inference Optimal VLMs Need Only One Visual Token but Larger Models [54.0] 視覚言語モデル(VLM)は、様々な視覚的理解と推論タスクにまたがる強力な能力を示している。
VLMは、大量の入力トークンを処理するのに必要な計算量が多いため、推論中に高いレイテンシで制約されることが多い。
高いトークン圧縮設定に適したアプローチを構築するために、最初のステップを踏み出します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:54:21 GMT)
Memory Augmented Cross-encoders for Controllable Personalized Search [53.7] 制御可能なパーソナライズされた検索のためのアプローチを提案する。
我々のモデルであるCtrlCEは,ユーザの履歴項目から編集可能なメモリを付加した,新しいクロスエンコーダモデルを提案する。
我々は、CtrlCEを効果的にパーソナライズし、制御可能なパーソナライズ検索の様々な重要な目標を達成できることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:55:25 GMT)
The Cramér-Rao approach and global quantum estimation of bosonic states [52.5] Cram'er-Rao アプローチが局所的推定ではなく大域的推定に当てはまるかどうかは不明である。
クラムエル・ラオ法が成立し、非IID条件下でのボゾン状態の族を含む量子状態推定問題に有効でない状況を見つける。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 09:24:41 GMT)
The Cramér-Rao approach and global quantum estimation of bosonic states [52.5] Cram'er-Rao アプローチが局所的推定ではなく大域的推定に当てはまるかどうかは不明である。
クラムエル・ラオ法が成立し、非IID条件下でのボゾン状態の族を含む量子状態推定問題に有効でない状況を見つける。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 09:24:41 GMT)
The Cramér-Rao approach and global quantum estimation of bosonic states [52.5] Cram'er-Rao アプローチが局所的推定ではなく大域的推定に当てはまるかどうかは不明である。
クラムエル・ラオ法が成立し、非IID条件下でのボゾン状態の族を含む量子状態推定問題に有効でない状況を見つける。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 09:24:41 GMT)
RT-Affordance: Affordances are Versatile Intermediate Representations for Robot Manipulation [52.1] 本稿では,タスクの重要段階においてロボットのポーズを捉えた割安条件の条件付けについて提案する。
RT-Affordanceという手法は階層モデルであり,まずタスク言語が与えられた割当計画を提案する。
RT-Affordanceが既存手法の性能を50%以上上回る新しいタスク群を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:02:51 GMT)
FEDLAD: Federated Evaluation of Deep Leakage Attacks and Defenses [50.9] フェデレーテッド・ラーニング(Federated Learning)は、分散型機械学習パラダイムをプライバシ保護するものだ。
近年の研究では、Deep Leakageと呼ばれる勾配技術によって、民間の真実データを復元できることが判明している。
本稿では、Deep Leakage攻撃と防御を評価するための総合的なベンチマークであるFEDLAD Framework(Federated Evaluation of Deep Leakage Attacks and Defenses)を紹介する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:42:26 GMT)
Scaling Laws for Reward Model Overoptimization in Direct Alignment Algorithms [50.8] Direct Preference Optimizationのようなダイレクトアライメントアルゴリズム(DDA)は、古典的なRLHFパイプラインの代替として登場した。
この研究は、DAAに対する過度な最適化やハッキングの問題を定式化し、その成果を目標、訓練体制、モデルスケールにわたって探求する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:44:14 GMT)
On the Comparison between Multi-modal and Single-modal Contrastive Learning [50.7] マルチモーダルとシングルモーダルのコントラスト学習の違いを理解するための理論的基盤を導入する。
マルチモーダル・シングルモーダル・コントラッシブ・ラーニングの下流タスクにおける一般化に影響を及ぼす臨界因子,すなわち信号対雑音比(SNR)を同定する。
我々の分析は、単一モードと多モードのコントラスト学習の最適化と一般化を特徴付ける統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:21:17 GMT)
Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.3] 本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:45:30 GMT)
Parallelizing Linear Transformers with the Delta Rule over Sequence Length [49.9] この研究は、デルタ則で線形変圧器を訓練するためのハードウェア効率の良いアルゴリズムについて述べる。
我々は100Bトークンに対して1.3Bモデルをトレーニングし、最近の線形時間ベースラインよりも優れていることを発見した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:48:53 GMT)
TopoTxR: A topology-guided deep convolutional network for breast parenchyma learning on DCE-MRIs [49.7] そこで本研究では,乳房側葉構造をよりよく近似するために,マルチスケールのトポロジ構造を明示的に抽出する新しいトポロジカルアプローチを提案する。
VICTREファントム乳房データセットを用いてemphTopoTxRを実験的に検証した。
本研究の質的および定量的分析は,乳房組織における画像診断におけるトポロジカルな挙動を示唆するものである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:35:10 GMT)
The Differentiable Feasibility Pump [49.6] 本稿では,従来の実現可能性ポンプとその追随点の多くを,特定のパラメータを持つ勾配差アルゴリズムとみなすことができることを示す。
この再解釈の中心的な側面は、伝統的なアルゴリズムがそのコストに関して線形緩和の解を区別することを観察することである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:26:51 GMT)
In-Context LoRA for Diffusion Transformers [49.3] テキスト・ツー・イメージのDiTは、チューニングなしでテキスト内生成を効果的に行うことができることを示す。
我々は、我々のモデル In-Context LoRA (IC-LoRA) を命名する。
我々のパイプラインは、プロンプトにより忠実な高忠実度画像セットを生成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:41:27 GMT)
In-Context Former: Lightning-fast Compressing Context for Large Language Model [48.8] 本稿では,Transformer-based large language model (LLM) の長期入力コンテキストを圧縮する手法を提案する。
我々は,単語の埋め込みから情報を集めるために,クロスアテンション機構と少数の学習可能なダイジェストトークンを使用する。
実験の結果, 圧縮時のベースライン浮動小数点演算の1/32しか必要とせず, 処理速度を68倍から112倍に向上することがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:17:56 GMT)
Neurons for Neutrons: A Transformer Model for Computation Load Estimation on Domain-Decomposed Neutron Transport Problems [48.4] 本稿では, 独自の3次元入力埋め込みを持つトランスフォーマーモデルと, 領域分解中性子輸送問題のための入力表現を提案する。
本研究では,ドメイン分割型小型モジュールリアクタ(SMR)シミュレーションでトレーニングしたモデルが98.2%の精度を実現し,小型シミュレーションのステップを完全にスキップできることを実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:17:51 GMT)
VHM: Versatile and Honest Vision Language Model for Remote Sensing Image Analysis [48.1] 本稿では,リモートセンシング画像解析のためのVersatile and Honest Vision Language Model (VHM) を提案する。
VHMは、リッチコンテンツキャプション(VersaD)を備えた大規模リモートセンシング画像テキストデータセットと、事実と偽造的質問(HnstD)の両方からなる正直な命令データセット上に構築されている。
実験では,VHMはシーン分類,視覚的質問応答,視覚的接地といった共通タスクにおいて,様々な視覚言語モデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:21:57 GMT)
Constrained Human-AI Cooperation: An Inclusive Embodied Social Intelligence Challenge [47.7] CHAICは、インボディードエージェントの社会的知覚と協力をテストするために設計された包括的インボディード・ソーシャル・インテリジェンス・チャレンジである。
CHAICの目標は、身体的制約の下で活動している可能性がある人間を支援するために、自我中心の観察装置を備えたエンボディエージェントである。
我々は,この課題に対する計画ベースラインと学習ベースラインのベンチマークを行い,大規模言語モデルと行動モデリングを活用した新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:28:38 GMT)
Towards efficient and secure quantum-classical communication networks [47.3] 量子鍵分散(QKD)とポスト量子暗号(PQC)の2つの主要なアプローチがある。
これらのプロトコルの長所と短所を紹介し、それらを組み合わせて、より高いレベルのセキュリティと/またはキー配布の性能向上を実現する方法について検討する。
我々は,量子古典通信ネットワークのためのハイブリッド暗号プロトコルの設計について,さらなる研究を希望する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:23:30 GMT)
Not Just Object, But State: Compositional Incremental Learning without Forgetting [47.0] コンポジションインクリメンタルラーニング(composition-IL)という新しい課題を提案する。
これにより、段階的な学習方法で状態オブジェクトの合成全体を認識できる。
そこで我々は,不明瞭な構成境界問題を克服するために,プロンプトベースのコンポジションインクリメンタルラーナ (Compiler) を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:23:00 GMT)
Extrapolating Prospective Glaucoma Fundus Images through Diffusion Model in Irregular Longitudinal Sequences [46.8] 緑内障進行予測のための経時的データセットの利用は、早期治療の介入を支援するための説得力のあるアプローチを提供する。
本研究では, 既往の経時的底面像を外挿し, 将来像を予測できる新しい拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:22:35 GMT)
Re-assembling the past: The RePAIR dataset and benchmark for real world 2D and 3D puzzle solving [46.1] 我々のデータセットには、現在の2Dおよび3Dパズル解決のベンチマークに共通するユニークな特性がある。
破片と骨折は、第二次世界大戦中にポンペイ考古学公園で爆破されたフレスコの崩壊によって引き起こされた現実的なものである。
データセットは、特徴的な画像要素を持つ高解像度画像を提供するマルチモーダルである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:16:29 GMT)
Passive Non-Line-of-Sight Imaging with Light Transport Modulation [46.0] 一つのネットワークで複数の光輸送条件を効果的に処理する新しい受動NLOSイメージング法であるNLOS-LTMを提案する。
我々は、投影画像から潜在光輸送表現を推測し、この表現を用いて、投影画像から隠されたイメージを再構成するネットワークを変調する。
大規模受動的NLOSデータセットの実験により,提案手法の優位性を実証した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:13:07 GMT)
A Symmetric Dynamic Learning Framework for Diffeomorphic Medical Image Registration [46.0] 本研究では,動的に進化し,対称的な登録経路を学習する学習フレームワークであるDCCNN-LSTM-Regを紹介する。
本手法は,定量評価と定性評価の両方において既存手法より優れている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:02:44 GMT)
Dynamic Multimodal Evaluation with Flexible Complexity by Vision-Language Bootstrapping [45.6] LVLM(Large Vision-Language Models)は、マルチモーダルタスクにまたがる顕著な機能を示す。
VLB(Vision-Language Bootstrapping)と呼ばれる動的マルチモーダル評価プロトコルを導入する。
VLBは、データ汚染の低減と柔軟性のある複雑さを伴うLVLMの堅牢で包括的な評価を提供する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 03:56:21 GMT)
Energy Price Modelling: A Comparative Evaluation of four Generations of Forecasting Methods [45.3] エネルギー価格予測は様々なレベルで意思決定を支援する上で重要な役割を果たしている。
予測技術の進化の展望を考えると、この文献は徹底的な経験的比較を欠いている。
本稿では,予測モデリングフレームワークの進化を詳細に概観する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:45:00 GMT)
AutoKaggle: A Multi-Agent Framework for Autonomous Data Science Competitions [45.0] AutoKaggleは、コード実行と単体テストを組み合わせた反復的な開発プロセスを実装し、コードの正しさとロジックの整合性を保証する。
データクリーニング、特徴工学、モデリングのための検証済み機能を含む汎用データサイエンスツールキットは、このソリューションの基礎を形成します。
AutoKaggleは、一般的なデータサイエンスパイプラインにおけるバリデーションレート0.85と総合スコア0.82を達成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:46:38 GMT)
AI-Driven approach for sustainable extraction of earth's subsurface renewable energy while minimizing seismic activity [45.0] 地球の地殻に流体を注入すると、地震を誘発または引き起こすことがある。
本研究では,人間による震度制御のための強化学習に基づく新しい手法を提案する。
本研究では,強化学習アルゴリズムが頑健な制御器と効率的に対話可能であることを示す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 15:27:04 GMT)
Practical hybrid PQC-QKD protocols with enhanced security and performance [44.9] 我々は,量子古典ネットワーク内でQKDとPQCが相互運用するハイブリッドプロトコルを開発した。
特に、それぞれのアプローチの個々の性能に対して、スピードと/またはセキュリティを向上する可能性のある、異なるハイブリッド設計について検討する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:13:49 GMT)
DiT4Edit: Diffusion Transformer for Image Editing [44.5] Diffusion Transformerベースの画像編集フレームワークであるDiT4Editを提案する。
DiT4Editは、DPM-r逆変換アルゴリズムを使用して、反転潜伏子を取得し、UNetベースのフレームワークで一般的に使用されるDDIMアルゴリズムと比較してステップ数を減らした。
我々の設計は、特に高解像度で任意のサイズの画像において、画像編集においてUNet構造を超えることができるように、DiTの利点を活用している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:35:41 GMT)
PPLLaVA: Varied Video Sequence Understanding With Prompt Guidance [44.1] トークン圧縮と命令対応の視覚的特徴集約を同時に実現する新しいプーリング戦略を提案する。
我々のモデルはPPLLaVA(Prompt-guided Pooling LLaVA)と呼ばれる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:43:59 GMT)
FoldMark: Protecting Protein Generative Models with Watermarking [44.0] 著作権保護と有害なコンテンツ生成は、タンパク質生成モデルの広範な実装に課題をもたらす。
本稿では,タンパク質生成モデルに透かしを埋め込むことが可能であるか検討する。
タンパク質生成モデルの一般的な透かし戦略としての2段階FoldMarkを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:18:06 GMT)
Enhancing Adversarial Robustness via Uncertainty-Aware Distributional Adversarial Training [43.8] そこで本研究では,不確実性を考慮した分散対向学習手法を提案する。
提案手法は, 最先端の対向性を実現し, 自然性能を維持できる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:26:24 GMT)
Efficient and Effective Adaptation of Multimodal Foundation Models in Sequential Recommendation [43.5] IISAN は対称的 MFM と同一のテキストと画像エンコーダに限られており、最先端の大規模言語モデルの使用を妨げていた。
We developed IISAN-Versa, a simpletile plug-and-play architecture with symmetrical and asymmetrical MFMs。
IISAN-Versaは、大文字エンコーダを効果的に適用し、大文字エンコーダが通常より良く機能するスケーリング効果を更に同定する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:53:25 GMT)
MS-DETR: Multispectral Pedestrian Detection Transformer with Loosely Coupled Fusion and Modality-Balanced Optimization [43.0] ミスアライメントとモダリティの不均衡は 多スペクトル歩行者検出において 最も重要な問題です
MS-DETRは2つのモダリティ固有のバックボーンとトランスフォーマーエンコーダで構成され、その後マルチモーダルトランスフォーマーデコーダが続く。
我々のエンドツーエンドのMS-DETRは、挑戦的なKAIST、CVC-14、LLVIPベンチマークデータセットよりも優れた性能を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:44:33 GMT)
Hidden Persuaders: LLMs' Political Leaning and Their Influence on Voters [42.8] 我々はまず、共和党候補よりも民主党候補を優先する18のオープン・クローズド・ウェイト LLM の政治的好意を示す。
教育訓練モデルでは、民主党候補への傾きがより顕著になることを示す。
さらに、米国登録有権者935名を対象に、LLMが有権者選択に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:14:48 GMT)
MME-Finance: A Multimodal Finance Benchmark for Expert-level Understanding and Reasoning [42.8] 本稿では,VQA(Visual Question Answering)ベンチマークであるMME-Financeを提案する。
このベンチマークの特徴は財務と専門知識であり、実際のユーザのニーズを反映したチャートの構築を含む。
また,中国語の文脈下でのMLLMの性能比較を支援する中国語版を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:59:51 GMT)
Speech Separation with Pretrained Frontend to Minimize Domain Mismatch [42.6] 音声分離は、個々の音声信号を音声混合物から分離しようとする。
ほとんどの分離モデルは、現実のパーティーシナリオでターゲット参照が利用できないため、合成データに基づいて訓練されている。
対象参照音声を必要とせずに混合データに露呈する自己教師付きドメイン不変プレトレーニング(DIP)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:30:27 GMT)
Losing momentum in continuous-time stochastic optimisation [42.6] 運動量に基づく最適化アルゴリズムは 特に広まりました
本研究では、運動量を伴う勾配降下の連続時間モデルを解析する。
また、画像分類問題において畳み込みニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:09:15 GMT)
TDDBench: A Benchmark for Training data detection [42.5] トレーニングデータ検出(TDD)は、特定のデータインスタンスを使用して機械学習モデルをトレーニングするかどうかを決定するためのタスクである。
TDDメソッドの有効性を徹底的に評価する包括的なベンチマークはありません。
4つの検出パラダイムで21のTDDメソッドをベンチマークし、そのパフォーマンスを5つの観点から評価します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:48:48 GMT)
Beyond Complete Shapes: A quantitative Evaluation of 3D Shape Matching Algorithms [42.0] 3次元形状の対応を見つけることは、コンピュータビジョン、グラフィックスなどにおいて重要な問題である。
我々は、挑戦的な部分的な形状マッチングシナリオの手続き生成のための汎用的で柔軟なフレームワークを提供する。
手動で7つの既存の(完全な幾何学)形状マッチングデータセット間のクロスデータセット対応を作成し、合計2543個の形状を生成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:08:19 GMT)
Online Data Collection for Efficient Semiparametric Inference [41.5] 提案する2つのオンラインデータ収集ポリシーであるExplore-then-CommitとExplore-then-Greedyは、パラメータ推定を所定の時間で使用して、将来のステップで残りの予算を最適に割り当てる。
両政策がオラクル政策に対してゼロ後悔(MSEによる評価)を達成することを実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:40:53 GMT)
NEOviz: Uncertainty-Driven Visual Analysis of Asteroid Trajectories [41.5] 我々は、地球近傍の天体の視覚分析において、惑星防衛の専門家を支援するために設計された対話型可視化システムNEOvizを紹介する。
特に,小惑星が移動する3次元不確実領域を可視化するための新しいアプローチを提案する。
潜在的な影響者に対しては、3D視覚化と不確実性を認識したインパクトマップを組み合わせることで、人間の集団に対する潜在的なリスクを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:04:12 GMT)
Membership Inference Attacks against Large Vision-Language Models [41.0] 大規模視覚言語モデル(VLLM)は、様々なアプリケーションシナリオにわたるマルチモーダルタスクを処理するための有望な能力を示す。
彼らの出現は、プライベート写真や医療記録などの機密情報を含む可能性があることを考えると、重要なデータセキュリティ上の懸念も引き起こす。
VLLMで不適切な使用データを検出することは、致命的かつ未解決な問題である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:35:08 GMT)
Accelerating Matroid Optimization through Fast Imprecise Oracles [40.9] 汚いオラクルの品質について,クリーンなクエリをほとんど使用しない実用的なアルゴリズムを解析する。
特に、我々のアルゴリズムは、多くの点で、最も有益であることを示す。
我々は、他のマトロイドオラクルタイプ、非自由な汚いオークル、その他のマトロイド問題への拡張を概説する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:34:46 GMT)
Seeing the Image: Prioritizing Visual Correlation by Contrastive Alignment [40.6] 視覚言語モデル(VLM)における既存の画像-テキストのモダリティアライメントは、各テキストトークンを自己回帰的に等しく扱う。
我々は、その視覚的相関に基づいて、各テキストトークンに対して異なるコントリビューションを割り当てることを提唱する。
コントラストアライメント(Contrastive ALignment, CAL)は、視覚的に相関したトークンのトレーニングを優先する、シンプルで効果的な再重み付け戦略である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:26:51 GMT)
ACE: All-round Creator and Editor Following Instructions via Diffusion Transformer [40.3] 視覚生成タスクのための全ラウンドクリエータとエディタであるACEを提案する。
まず、Long-Context Condition Unit (LCU)と呼ばれる統一条件形式を導入する。
次に,LCUを入力として使用するトランスフォーマーに基づく新しい拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 12:25:32 GMT)
Efficient Feature Aggregation and Scale-Aware Regression for Monocular 3D Object Detection [40.1] MonoASRHは、効率的なハイブリッド特徴集約モジュール(EH-FAM)と適応スケール対応3D回帰ヘッド(ASRH)で構成される新しいモノクル3D検出フレームワークである。
EH-FAMは、小規模オブジェクトのセマンティックな特徴を抽出するために、グローバルな受容領域を持つマルチヘッドアテンションを用いる。
ASRHは2次元境界ボックス次元を符号化し、EH-FAMで集約された意味的特徴とスケール特徴を融合する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:33:25 GMT)
On Evaluating Explanation Utility for Human-AI Decision Making in NLP [39.6] アプリケーショングラウンド評価に適した既存の指標について検討する。
我々は,人間-AIチームの形成と研究のために,芸術の状態を再評価することの重要性を実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:38:45 GMT)
Evaluating Machine Learning Models against Clinical Protocols for Enhanced Interpretability and Continuity of Care [39.6] 臨床実践において、意思決定は確立されたプロトコルに大きく依存し、しばしば規則として定式化される。
機械学習アプリケーションの増加にもかかわらず、臨床実践への導入は依然として限られている。
確立されたプロトコルに関して,MLモデルの精度を評価する指標を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:50:09 GMT)
Diversity-Driven Synthesis: Enhancing Dataset Distillation through Directed Weight Adjustment [39.1] 多様性の向上は、データセットを合成するための並列化可能であるが孤立したアプローチを改善することができる、と我々は主張する。
本稿では,動的かつ指向的な重み調整技術を用いて合成過程を変調する新しい手法を提案する。
提案手法は,合成データの各バッチが,元のデータセットの大規模かつ多様なサブセットの特徴を反映していることを保証する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:47:37 GMT)
EchoSight: Advancing Visual-Language Models with Wiki Knowledge [39.0] 知識に基づく視覚質問応答のための新しいフレームワークであるEchoSightを紹介する。
ハイパフォーマンスな検索のために、EchoSightはまずビジュアルのみの情報を用いてwikiの記事を検索する。
The Encyclopedic VQA and InfoSeek datasets on our experimental results on the Encyclopedic VQA and InfoSeek shows that EchoSight establishs new-of-the-art results in knowledge-based VQA。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 07:24:15 GMT)
EchoSight: Advancing Visual-Language Models with Wiki Knowledge [39.0] 知識に基づく視覚質問応答のための新しいフレームワークであるEchoSightを紹介する。
ハイパフォーマンスな検索のために、EchoSightはまずビジュアルのみの情報を用いてwikiの記事を検索する。
The Encyclopedic VQA and InfoSeek datasets on our experimental results on the Encyclopedic VQA and InfoSeek shows that EchoSight establishs new-of-the-art results in knowledge-based VQA。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 07:24:15 GMT)
DiffLM: Controllable Synthetic Data Generation via Diffusion Language Models [38.6] 可変オートエンコーダ(VAE)に基づく制御可能なデータ合成フレームワークDiffLMを紹介する。
我々は,DiffLMが高品質なデータを生成し,ダウンストリームタスクの性能が実データよりも27%向上していることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:47:53 GMT)
Two-Stage Pretraining for Molecular Property Prediction in the Wild [38.3] 野生の様々な分子特性予測のために設計された多目的事前学習モデルであるMoleVersを紹介する。
MoleVersは、マスクされた原子予測と動的復調を通じて、大きなラベルのないデータセットから表現を学習する。
第2段階では、MoleVersはさらに安価な計算手法で得られた補助ラベルを用いて事前訓練される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:36:17 GMT)
Optimal Matrix Sketching over Sliding Windows [38.1] マトリックススケッチは、mathbbRNtimes d$で行列 $boldsymbolAを近似することを目的としており、長さ$N$のベクトルストリームとmathbbRelltimes d, ell ll N$で小さなスケッチマトリックス $boldsymbolBで構成されている。
Oleftfracdvarepsilonright)$ space bound for matrix sketching over row-normalized, sequence-based sliding windows。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:58:50 GMT)
Predicting the Temperature-Dependent CMC of Surfactant Mixtures with Graph Neural Networks [36.8] 界面活性剤は、様々な産業で発泡および浄化の鍵となる材料である。
実際には、界面活性剤の混合物は通常、性能、環境、コストの理由から使用される。
本研究では,CMCの温度依存性を予測するため,界面活性剤混合物のグラフニューラルネットワークフレームワークを開発した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:12:42 GMT)
Dissecting the Failure of Invariant Learning on Graphs [36.1] 本研究では、2つの顕著な不変学習法の性能を理論的に判別する構造因果モデル(SCM)を開発した。
我々は,同じクラスに設定されたクロス環境表現をアライメントすることで,突発的特徴を明示的に排除する,クロス環境内アライメント(CIA)を提案する。
さらに、隣接ラベルの分布を利用してノード表現を選択的に整列させるCIA-LRA(Localized Reweighting Alignment)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:36:48 GMT)
A Convex Relaxation Approach to Generalization Analysis for Parallel Positively Homogeneous Networks [35.9] 入力出力マップが等質写像の和であるニューラルネットワークのクラスを研究する。
このようなネットワークに対する線形境界に対する一般的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:24:34 GMT)
An Investigation of Warning Erroneous Chat Translations in Cross-lingual Communication [35.7] 機械翻訳モデルは、翻訳ソフトウェアやプラグインアプリケーションの人気にもかかわらず、チャットの翻訳には相変わらず不適切である。
欠陥のない翻訳システムを追求する代わりに、より実践的なアプローチは、混乱を減らすために、潜在的な誤訳に関する警告メッセージを発行することである。
本稿では,この問題に対処し,チャット翻訳システムを効果的にするための警告メッセージの貢献を実証する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 04:13:55 GMT)
User Centric Semantic Communications [35.2] 本稿では,ユーザ中心のセマンティック通信システムについて,送信開始時にユーザが希望するセマンティック情報に対する要求を送信者に送信する。
重要な課題は、送信者がユーザーのセマンティック情報に対する要求を理解し、必要なセマンティック情報を合理的でロバストな方法で抽出する方法である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:18:09 GMT)
MicroAdam: Accurate Adaptive Optimization with Low Space Overhead and Provable Convergence [35.2] 我々は,理論収束保証を維持しつつ,メモリオーバーヘッドを特に最小化するAdamの新たな変種を提案する。
分散最適化から古典的エラーフィードバック機構の新たなインスタンスを用いて圧縮誤差を制御した。
提案手法は, AMSGradと競合することを保証するとともに, 実用性も良好であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:15:13 GMT)
Learning Formal Mathematics From Intrinsic Motivation [35.0] ミニモ(Minimo)は、自分自身に問題を起こし、それを解決することを学ぶエージェント(理論実証)である。
制約付き復号法と型指向合成法を組み合わせて、言語モデルから有効な予想をサンプリングする。
我々のエージェントは、ハードだが証明可能な予想を生成することを目標としています。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:40:45 GMT)
Alpha and Prejudice: Improving $α$-sized Worst-case Fairness via Intrinsic Reweighting [35.0] 既成人口集団との最悪のフェアネスは、最悪の集団のモデルユーティリティを最大化することで、同等性を達成する。
近年の進歩は、最小分割比の低い境界を導入することで、この学習問題を再構築している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:04:05 GMT)
Graph-DPEP: Decomposed Plug and Ensemble Play for Few-Shot Document Relation Extraction with Graph-of-Thoughts Reasoning [34.9] Graph-DPEPフレームワークは、自然言語で提示された三重項の説明思想の背景にある。
我々は,サブグラフに埋め込まれた推論的思考を活用することで,型リスト全体の「アンサンブルプレイ」生成を開発する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:12:36 GMT)
FilterNet: Harnessing Frequency Filters for Time Series Forecasting [34.8] FilterNetは、時系列信号の特定の成分を選択的に通過または減衰させることにより、重要な情報的時間パターンを抽出するために、我々の提案した学習可能な周波数フィルタ上に構築されている。
2つのフィルタを備えることで、FilterNetは、時系列文学で広く採用されている線形およびアテンションマッピングを概ねサロゲートすることができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:07:39 GMT)
Sparse Orthogonal Parameters Tuning for Continual Learning [34.5] 事前学習モデル(PTM)に基づく連続学習手法が近年注目されている。
本稿では,SoTU(Sparse Orthogonal Parameters TUning)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:19:09 GMT)
Pre-trained Visual Dynamics Representations for Efficient Policy Learning [33.6] 本稿では,ビデオと下流タスク間の領域ギャップを埋めて効率的なポリシー学習を実現するために,事前学習型ビジュアルダイナミクス表現(PVDR)を提案する。
事前訓練された視覚力学表現は、ビデオの知識以前の視覚力学をキャプチャする。
この抽象的な事前知識は、ダウンストリームタスクに容易に適応でき、オンライン適応を通じて実行可能なアクションと整合することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:18:02 GMT)
Contextual Knowledge Pursuit for Faithful Visual Synthesis [33.2] 大きな言語モデル(LLM)では、幻覚を減らすための一般的な戦略は、外部データベースから事実知識を取得することである。
本稿では,外部知識とパラメトリック知識の相補的強みを利用して,生成元が信頼できる視覚コンテンツを生成できるようにするフレームワークであるコンパラメトリック知識探索法(CKPT)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:31:24 GMT)
An Application-Agnostic Automatic Target Recognition System Using Vision Language Models [32.9] オープン語彙オブジェクト検出と分類モデルを用いた新しい自動ターゲット認識(ATR)システムを提案する。
このアプローチの主な利点は、非技術的エンドユーザーによって実行直前にターゲットクラスを定義することができることである。
所望のターゲットのナンスを自然言語で表現することは、トレーニングデータをほとんどあるいは全く持たないユニークなターゲットに役立ちます。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:16:15 GMT)
Decoding Matters: Addressing Amplification Bias and Homogeneity Issue for LLM-based Recommendation [32.9] Debiasing-Diversifying Decoding (D3) という新しいデコード手法を導入する。
D3はゴーストトークンの長さ正規化を無効にして増幅バイアスを軽減する。
実世界のデータセットの実験では、この手法の有効性が示されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:52:30 GMT)
Cross-Domain Pre-training with Language Models for Transferable Time Series Representations [32.8] CrossTimeNetは、さまざまなドメインから転送可能な知識を学ぶための、新しいクロスドメインSSL学習フレームワークである。
CrossTimeNetの重要な特徴の1つは、新しく設計された時系列トークン化モジュールである。
我々は、様々な時系列分類領域にわたる実世界のシナリオにおいて広範な実験を行う。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:13:08 GMT)
Do Mice Grok? Glimpses of Hidden Progress During Overtraining in Sensory Cortex [32.8] マウスにおけるこのような学習の証拠は, 動作がほぼ順調に保たれた後, タスクの継続訓練後に見つかる(オーバートレーニング)。
オーバートレーニングの開始時に誤って分類された例は,その間は行動が変化しなかったものの,後から即座に分類できることが実証された。
このモデルが,動物学習における逆転を過剰に学習する経験的パズルについて,どのように説明するかを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:42:49 GMT)
RelationBooth: Towards Relation-Aware Customized Object Generation [32.8] リレーショナルブース(RelationBooth)は、よく計算されたデータセットを通じて、アイデンティティとリレーショナルラーニングをアンハングリングするフレームワークである。
トレーニングデータには,関係固有画像,アイデンティティ情報を含む独立オブジェクト画像,関係生成をガイドするテキストプロンプトが含まれている。
まず,関係に密接に結びついたオブジェクトのポーズを調整する際に,効果的にモデルを導くキーポイントマッチング損失を導入する。
第二に、画像のプロンプトから局所的な特徴を取り入れて、オブジェクトの区別をより良くし、重複するケースの混同を防ぐ。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:28:46 GMT)
Centerness-based Instance-aware Knowledge Distillation with Task-wise Mutual Lifting for Object Detection on Drone Imagery [32.6] 本稿では,ドローン画像の物体検出に知識蒸留(KD)を適用した最初の試みについて述べる。
本稿では,Centerness-based Instance-aware Distillation (CID) 戦略を用いたタスクワイド・ミューチュアル・リフティング (Light-ML) モジュールを提案する。
VisDrone、UAVDT、COCOベンチマークの実験では、提案手法が既存のKD法と同等な計算条件の精度を高めることが示されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:09:27 GMT)
Growing a Tail: Increasing Output Diversity in Large Language Models [32.3] そこで本研究では,様々なモデルに対する質問に対する回答の多様性について検討し,それらと人間の回答を比較した。
この結果から, モデル出力は人間に比べて狭く, 主流の「世界観」を反映し, 高度に集中していることが示唆された。
文化多様性の保全を目指すAI政策におけるこれらの知見の意義について論じる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:52:20 GMT)
Stable-Pose: Leveraging Transformers for Pose-Guided Text-to-Image Generation [32.2] Stable-Poseは、粗い注目マスキング戦略を視覚変換器に導入する新しいアダプタモデルである。
我々は、ViTのクエリキー自己保持機構を利用して、人間のポーズスケルトンにおける異なる解剖学的部分間の相互接続を探索する。
Stable-PoseはLAION-HumanデータセットのAPスコア57.1を達成し、確立したControlNetよりも約13%改善した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:46:45 GMT)
Real-Time Text Detection with Similar Mask in Traffic, Industrial, and Natural Scenes [31.2] 有効なテキスト表現類似マスク(SM)と特徴補正モジュール(FCM)を含む,効率的なマルチシーンテキスト検出手法を提案する。
SM-Netの状況を検証するため,交通,産業,自然シーンのデータセットについて実験を行った。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:08:59 GMT)
Evaluation and Improvement of Fault Detection for Large Language Models [30.8] 本稿では,大規模言語モデル(LLM)における既存の故障検出手法の有効性について検討する。
既存の手法の故障検出能力を高めるために, textbfMutation による予測を行う textbfConfidence textbfSmoothing フレームワーク textbfMuCS を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:43:30 GMT)
Global Convergence Guarantees for Federated Policy Gradient Methods with Adversaries [30.8] Federated Reinforcement Learning (FRL)は、複数のエージェントが生の軌跡を共有することなく、協調して意思決定ポリシーを構築することを可能にする。
本稿では,サーバに任意の値を送信可能な敵エージェントに対して堅牢なポリシー勾配に基づくアプローチを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:15:33 GMT)
Interaction2Code: How Far Are We From Automatic Interactive Webpage Generation? [30.5] 本稿では,対話型Webページを生成する上で,MLLM(Multi-modal large language model)を初めて体系的に検討する。
具体的には、まずInteraction-to-Codeタスクを定式化し、Interaction2Codeベンチマークを構築します。
次に、自動計測と人的評価の両方を用いて、3つの最先端(SOTA)MLLMの総合的な実験を行う。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:40:03 GMT)
Teaching Models to Improve on Tape [30.3] 大きな言語モデル(LLM)は、特定の制約の下でコンテンツを生成するよう促されたときにしばしば苦労する。
最近の研究は、LLMがそのような是正的フィードバックの恩恵を受けることを示している」。
本稿では,そのような報酬をモデルに教えるためのRLフレームワークを紹介し,その制約を満たす能力に応じてモデルに報酬を与える。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:55:51 GMT)
Kun: Answer Polishment for Chinese Self-Alignment with Instruction Back-Translation [30.1] Kunは、手動のアノテーションに頼ることなく、大きな言語モデル(LLM)のための高品質な命令チューニングデータセットを作成するための新しいアプローチである。
我々は、Wudao、Wanjuan、SkyPileなど、さまざまな情報源から収集された不正なデータを活用して、100万以上の中国語の命令データポイントの実質的なデータセットを生成します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:02:21 GMT)
R^3AG: First Workshop on Refined and Reliable Retrieval Augmented Generation [30.0] 情報検索から外部知識を付加した生成モデルを改善するための鍵となる要素として,検索拡張生成(RAG)が注目されている。
このワークショップは、下流のAIタスクに対して洗練された信頼性の高いRAGを実行する方法について、深く調査することを目的としている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:15:03 GMT)
An Empirical Study of LLM-as-a-Judge for LLM Evaluation: Fine-tuned Judge Model is not a General Substitute for GPT-4 [29.9] 微調整の審査モデルは、GPT-4と同等の評価能力を発揮すると主張されている。
本稿では,GPT-4を利用して,制約を補償し,微調整による判断を改善する手法を提案する。
実験の結果,APIコストの50%に過ぎず,GPT-4と同等の精度が得られた。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:07:22 GMT)
Long Context RAG Performance of Large Language Models [29.8] 大規模言語モデル(LLM)の精度を高める重要な手法として、検索拡張生成(RAG)が登場している。
本稿では, コンテクスト長の増大が, 20のオープンソースおよび商用LLMにおけるRAG性能に与える影響について検討する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:37:43 GMT)
Game Plot Design with an LLM-powered Assistant: An Empirical Study with Game Designers [29.5] ゲームデザイナーがターンベースのゲームのために没入的な物語を制作するのを支援する。
14人のゲームデザイナによるユーザスタディでは、生成されたゲームプロットに対する満足度と、物語に対するオーナシップの両面から高いレベルの満足度が示されています。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:26:35 GMT)
Multi-Agent Coordination via Multi-Level Communication [29.4] シークエンシャル・コミュニケーション(SeqComm)という新しいマルチレベル通信方式を提案する。
本稿では,新しいマルチレベル通信方式であるSeqCommを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:05:38 GMT)
Automated, LLM enabled extraction of synthesis details for reticular materials from scientific literature [29.1] LLMを用いた段落分類と情報抽出を自動化した知識抽出パイプライン(KEP)を提案する。
LLMは、微調整や訓練を必要とせず、PDF文書から化学情報を検索できることを実証する。
これらの結果は,人間のアノテーションやデータキュレーションの取り組みを減らすKEPアプローチの可能性を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:08:23 GMT)
Self-Compositional Data Augmentation for Scientific Keyphrase Generation [28.9] 本稿では,キーフレーズ生成のための自己合成データ拡張手法を提案する。
共有キーフレーズに基づく学習用文書の関連性を測定し,類似した文書を組み合わせて合成サンプルを生成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:22:51 GMT)
POINTS: Improving Your Vision-language Model with Affordable Strategies [28.6] 視覚言語モデルの最新の進歩を利用して、ロバストなベースラインモデルを訓練する。
我々は、パープレキシティーを用いて事前学習データをフィルタリングし、トレーニングのための最も低いパープレキシティーデータを選択する。
視覚的なインストラクションチューニングでは、さまざまなデータセットでモデルスープを使用して、より多くのデータセットを追加することで、限界的な改善を実現しました。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 02:32:06 GMT)
Ocean-omni: To Understand the World with Omni-modality [28.3] Ocean-omniは、最初のオープンソース 7B Multimodal Large Language Model (MLLM) である。
世界初のオープンソース7Bマルチモーダル大言語モデル(MLLM)であるOcean-omniを紹介する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 11:29:59 GMT)
Aligning to Thousands of Preferences via System Message Generalization [27.9] 現在の大言語モデル (LLM) のアライメント手法は、LLMを一般大衆の好みに合わせることが最適であると仮定している。
本稿では,ユーザがシステムメッセージ内で最も価値の高いものを指定できる新しいパラダイムを提案する。
私たちはJanusと呼ばれる7B LLMをトレーニングし、ユーザの好みを反映したさまざまな未知のシステムメッセージを追加することで、921プロンプトでそれをテストします。
JanusはMistral 7B Instruct v0.2, GPT-3.5 Turbo, GPT-4に対して75.2%, 72.4%, 66.4%のタイ+ウィン率を達成した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:37:22 GMT)
A unifying framework for quantum simulation algorithms for time-dependent Hamiltonian dynamics [27.8] 我々は、Sambe-Howlandの時計が時間依存ハミルトニアン力学をシミュレートするための統一的なフレームワークとして機能することを示す。
また、このフレームワークが時間に依存しない手法と組み合わせることで、時間に依存したダイナミクスをシミュレートする効率的なアルゴリズムの開発が容易になることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:26:44 GMT)
Transformers as Transducers [27.5] 変換器のシーケンス・ツー・シーケンスマッピング能力について有限変換器に関連付けることにより検討する。
既存のブール変種であるB-RASPをシーケンス・ツー・シーケンス関数に拡張し、一階有理関数を正確に計算することを示す。
マスク付き平均的注意変換器はS-RASPをシミュレートできることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:27:28 GMT)
On Improved Conditioning Mechanisms and Pre-training Strategies for Diffusion Models [27.4] 最高の潜伏拡散モデル (LDMs) トレーニングレシピの鍵となる要素は、しばしば研究コミュニティでは利用できない。
我々は,モデルの性能とトレーニング効率に着目したLCMトレーニングレシピの詳細な研究を行う。
本稿では,セマンティクスと制御メタデータの条件付けを両立させる新しい条件付け機構を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:22:26 GMT)
Adapting Language Models via Token Translation [27.3] Sparse Sinkhorn Token Translation (S2T2)はターゲットドメイン用に調整されたトークンをトレーニングし、ターゲットとソースのトークン間の変換を学ぶ。
微調整された英語モデルを用いた実験では、S2T2はドメイン外のタンパク質配列のパープレキシティと圧縮の両方を改善している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:35:39 GMT)
How much is a noisy image worth? Data Scaling Laws for Ambient Diffusion [26.9] Ambient Diffusionと関連するフレームワークは、単に破損したデータで拡散モデルをトレーニングする。
汚職レベルが異なるデータに対して80ドル以上のモデルをトレーニングすることで、この現象を大規模に研究する。
これらのサンプルサイズでは、ノイズの多いデータのみをトレーニングする場合、クリーンなデータでトレーニングされたモデルの性能と一致させることは不可能である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:45:17 GMT)
Music Foundation Model as Generic Booster for Music Downstream Tasks [26.1] 対象の音楽サンプルから階層的特徴を抽出する音楽基礎モデル(MFM)であるSoniDoを紹介する。
階層的な中間機能を活用することで、SoniDoは情報の粒度を制限し、さまざまな下流タスクのパフォーマンスを改善する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:51:44 GMT)
VERITAS: A Unified Approach to Reliability Evaluation [26.1] 大規模言語モデル(LLM)は、しばしばコンテキストから情報を合成して正確な応答を生成するのに失敗する。
VERITASは様々な文脈で柔軟に動作するように設計された幻覚検出モデルのファミリーである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:53:25 GMT)
Online Analytic Exemplar-Free Continual Learning with Large Models for Imbalanced Autonomous Driving Task [25.4] AEF-OCL (Analytic Exemplar-Free Online Continual Learning Algorithm) を提案する。
AEF-OCLは解析的連続学習原理を活用し、大きなバックボーンネットワークによって抽出された特徴の分類器としてリッジ回帰を用いる。
実験結果から, 自動走行SODA10Mデータセットにおいて, 提案手法は, 既往の戦略であるにもかかわらず, 様々な手法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:56:14 GMT)
Adversarial multi-task underwater acoustic target recognition: towards robustness against various influential factors [25.2] 受動的ソナーに基づく水中音響目標認識は、実用的海洋用途において多くの課題に直面している。
主な課題の1つは、様々な環境条件に対する信号特性の受容性である。
水中音響目標認識の分野では、流線型因子は無視されることが多い。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:42:51 GMT)
Advancing Robust Underwater Acoustic Target Recognition through Multi-task Learning and Multi-Gate Mixture-of-Experts [25.2] 本研究では,モデルが頑健なパターンを捕捉する能力を高めるため,M3と呼ばれる認識フレームワークを提案する。
本フレームワークでは,ターゲットサイズを推定するなど,ターゲット特性に着目した補助タスクを設計する。
M3にはマルチエキスパートとマルチゲート機構が組み込まれており、異なるパラメータ空間を様々な水中信号に割り当てることができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:52:36 GMT)
Mitigating Metric Bias in Minimum Bayes Risk Decoding [25.0] COMETやMetricXのようなメトリクスを使用した最小ベイズリスク(MBR)復号法は、greedyやビームサーチといった従来の復号法よりも優れている。
MBRデコーディングは、特定のユーティリティメトリックに従って高いスコアの翻訳を生成することを目的としている。
これにより、デコードと評価の両方に同じメトリックを使用することが不可能になる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:01:27 GMT)
Self-Calibrated Tuning of Vision-Language Models for Out-of-Distribution Detection [24.6] オープンソースアプリケーションに信頼性の高い機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
近年のCLIPによるOOD検出の進歩は,IDデータから抽出したOOD特徴に即時調整を施すことによって有望な結果を示した。
提案手法は,SCT(Self-Calibrated Tuning)と呼ばれる新しいフレームワークで,与えられた数ショットのIDデータのみを用いて効果的なOOD検出を行う。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:29:16 GMT)
Multi-modal NeRF Self-Supervision for LiDAR Semantic Segmentation [24.5] LiDARセマンティックは、各LiDARポイントをセマンティックラベルに関連付けることで、自律運転知覚の基本的なタスクである。
本稿では,カメラ画像からの知識の抽出とともに,ラベルのないLiDAR点雲を利用するセミ・スーパーバイザード・ラーニング・セットアップを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:13:23 GMT)
DC-Gaussian: Improving 3D Gaussian Splatting for Reflective Dash Cam Videos [24.0] 本稿では,車載ダッシュカムビデオから新しいビューを生成する手法であるDC-Gaussianを提案する。
本手法は,新規なビュー合成における最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:02:53 GMT)
Beyond App Markets: Demystifying Underground Mobile App Distribution Via Telegram [23.6] この研究は、Telegramの地下モバイルアプリエコシステムを包括的に調査した初めてのものである。
調査の結果,Telegramのユーザベースの1%に相当するサブスクリプションユーザ数の合計で,これらのアプリがTelegram上で著しく普及していることが判明した。
私たちの分析では、アプリの配布におけるiOS機能の誤用や、これらのアプリの悪意ある動作の頻度も明らかにしています。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:59:49 GMT)
Beyond App Markets: Demystifying Underground Mobile App Distribution Via Telegram [23.6] この研究は、Telegramの地下モバイルアプリエコシステムを包括的に調査した初めてのものである。
調査の結果,Telegramのユーザベースの1%に相当するサブスクリプションユーザ数の合計で,これらのアプリがTelegram上で著しく普及していることが判明した。
私たちの分析では、アプリの配布におけるiOS機能の誤用や、これらのアプリの悪意ある動作の頻度も明らかにしています。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:59:49 GMT)
HFGaussian: Learning Generalizable Gaussian Human with Integrated Human Features [23.3] HFGaussianと呼ばれる新しいアプローチでは、25FPSでスパルス入力画像から3Dスケルトン、3Dキーポイント、高密度ポーズなどの新しいビューや人間の特徴をリアルタイムで推定できる。
我々は,HFGaussの手法をヒトガウススプラッティングにおける最新の最先端技術に対して徹底的に評価し,そのリアルタイム,最先端性能を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:31:04 GMT)
TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selection [23.2] TokenSelectは、モデルに依存しない、訓練のない、効率的で正確な長文推論手法である。
TokenSelectの総合評価では、注意点の最大23.84倍、エンドツーエンドのレイテンシの最大2.28倍の高速化が示されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:56:24 GMT)
CAD-NeRF: Learning NeRFs from Uncalibrated Few-view Images by CAD Model Retrieval [23.1] 多視点画像からの再構成は3次元視覚における長年の問題である。
CAD-NeRF(CAD-NeRF)を提案する。
CAD-NeRFは, 得られたCADモデルから大きな変形を伴って, 精度の高い密度の学習に成功していることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:41:45 GMT)
Theoretically Guaranteed Distribution Adaptable Learning [23.1] 分散適応学習(DAL)と呼ばれる新しいフレームワークを提案する。
DALは、進化するデータ分散を効果的に追跡することを可能にする。
進化する分布を調節する上で、DALの再利用性と進化性を高めることができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:10:39 GMT)
Tree-Averaging Algorithms for Ensemble-Based Unsupervised Discontinuous Constituency Parsing [23.1] 予測木を平均化することにより,既存の不連続な動作の異なるアンサンブルを構築することを提案する。
次に、タスクに取り組むための効率的な正確なアルゴリズムを開発し、全てのサンプルに対して妥当な時間で実行します。
3つのデータセットの結果は、我々のメソッドがすべてのメトリクスですべてのベースラインを上回っていることを示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:04:23 GMT)
Birdie: Advancing State Space Models with Reward-Driven Objectives and Curricula [23.1] 状態空間モデル(SSM)はトランスフォーマーよりも利点があるが、長期のコンテキスト内検索のようなテキストコピー、連想リコール、質問応答を必要とするタスクに苦労する。
本研究では,SSMのコンテキスト内検索能力を大幅に向上する新たな学習手法であるBirdieを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:35:33 GMT)
Navigating Distribution Shifts in Medical Image Analysis: A Survey [23.0] 本稿では,分散シフトの影響を受け,深層学習手法をMedIAシステムに適用するアプローチを体系的にレビューする。
既存の作業は、共同トレーニング、フェデレートラーニング、ファインチューニング、ドメインジェネリゼーションに分類する。
これらのトピックを深く掘り下げることで、今後の研究の道筋が浮かび上がる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:01:16 GMT)
DeBaRA: Denoising-Based 3D Room Arrangement Generation [23.0] 有界環境における正確で制御可能で柔軟なアレンジメント生成に適したスコアベースモデルであるDeBaRAを紹介する。
本研究では,オブジェクトの空間特性に着目して,シーン合成や完了,再配置など,複数のダウンストリームアプリケーションを実行するために,単一トレーニングされたDeBaRAモデルをテスト時に活用できることを実証する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 16:30:30 GMT)
TIP-I2V: A Million-Scale Real Text and Image Prompt Dataset for Image-to-Video Generation [22.8] TIP-I2Vは、ユーザが提供するテキストと画像プロンプトの大規模なデータセットとしては初めてである。
我々は、5つの最先端画像からビデオまでのモデルから、対応する生成されたビデオを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:52:43 GMT)
Tencent Hunyuan3D-1.0: A Unified Framework for Text-to-3D and Image-to-3D Generation [22.7] Hunyuan3D-1.0はテキストおよび画像条件生成をサポートする2段階のアプローチである。
最初の段階では、約4秒で効率よくマルチビューRGBを生成するマルチビュー拡散モデルを用いる。
第2段階では、3Dアセットを迅速かつ忠実に再構築するフィードフォワード再構築モデルを導入する。
我々のフレームワークは、Hunyuan-DiTというテキスト・ツー・イメージ・モデルで、テキスト・コンディショニングとイメージ・コンディショニングの両方をサポートする統一的なフレームワークである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:33:41 GMT)
Towards Interoperability Testing of Smart Energy Systems -- An Overview and Discussion of Possibilities [22.6] スマートエネルギーシステムでは、相互運用性は異なるアプローチと技術を統合することによる課題に直面します。
本研究は,既存の相互運用テストの概念,アイデンティティ・フィー・イネーブラー,およびプロシージャの調和の可能性について分析する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:42:44 GMT)
Unveiling the Potential of LLM-Based ASR on Chinese Open-Source Datasets [22.3] LLM(Large Language Models)は、様々なNLPタスクにおいて非並列の有効性を示す。
本研究の目的は,音声エンコーダ,LLM,プロジェクタモジュールの様々な構成の影響を評価することである。
本研究では,3段階の学習手法を導入し,モデルが聴覚情報とテキスト情報を整合させる能力を高めることを目的とした。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:29:41 GMT)
DEMONet: Underwater Acoustic Target Recognition based on Multi-Expert Network and Cross-Temporal Variational Autoencoder [22.3] 複雑な水中環境のため、実世界のシナリオで堅牢な水中音響認識システムを構築することは困難である。
ノイズの封筒変調(DEMON)を検出することで,ターゲットのシャフト周波数やブレード数に対するロバストな洞察を提供するDEMONetを提案する。
DEMON特徴量におけるノイズとスプリアス変調スペクトルを緩和するために、時間的アライメント戦略を導入し、ノイズ耐性のDEMONスペクトルを再構成して生のDEMON特徴量を置き換えるために可変オートエンコーダ(VAE)を用いる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:04:51 GMT)
Bias in the Mirror: Are LLMs opinions robust to their own adversarial attacks ? [22.0] 大規模言語モデル(LLM)は、トレーニングデータとアライメントプロセスからバイアスを受け継ぎ、微妙な方法で応答に影響を与える。
LLMの2つのインスタンスが自己議論を行う新しいアプローチを導入し、反対の視点でモデルの中立バージョンを説得する。
我々は、モデルがどのようにしっかりとバイアスを保ち、誤った情報を強化するか、有害な視点に移行するかを評価する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:08:28 GMT)
FlexCAD: Unified and Versatile Controllable CAD Generation with Fine-tuned Large Language Models [22.0] ユーザ意図に基づいてコンピュータ支援デザイン(CAD)モデルを作成することへの関心が高まっている。
既存の作業は限定的な制御性を提供し、異なるタイプの制御のための別々のモデルが必要です。
大規模言語モデルを微調整した統合モデルFlexCADを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:45:26 GMT)
Compositional simulation-based inference for time series [22.0] シミュレータは、時間とともに何千もの単一状態遷移を通して現実世界のダイナミクスをエミュレートする。
本研究では,個々の状態遷移に整合したパラメータを局所的に同定することで,マルコフシミュレータを活用可能なSBIフレームワークを提案する。
次に、これらの局所的な結果を合成して、時系列の観測全体と一致した後続のオーバーパラメータを求める。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:55:07 GMT)
GarVerseLOD: High-Fidelity 3D Garment Reconstruction from a Single In-the-Wild Image using a Dataset with Levels of Details [22.0] GarVerseLODは、1枚の制約のない画像から高忠実度3D衣服を復元する際、前例のない堅牢性を達成することを目的としている。
GarVerseLODは、プロのアーティストが手作業で作った精密な幾何学的な細部を持つ、高品質な布のモデル6000を収集する。
条件付き拡散モデルに基づく新しいラベリングパラダイムを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:30:07 GMT)
Adversarial Markov Games: On Adaptive Decision-Based Attacks and Defenses [21.8] 攻撃だけでなく、防御も、相互作用を通じてお互いから学び合うことによって、どのような恩恵を受けるかを示します。
我々は、システムがどのように反応するかを制御するアクティブディフェンスが、意思決定ベースの攻撃に直面した際のモデルの強化に必須の補完であることを示した。
実世界で展開されるMLベースのシステムの堅牢性を確保するための効果的な戦略を策定する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:22:30 GMT)
Artificial Intelligence-Enhanced Couinaud Segmentation for Precision Liver Cancer Therapy [21.7] 本研究では,新しいCouinaudセグメンテーションモデルであるLiverFormerを紹介する。
LiverFormerはグローバルコンテキストと3DハイブリッドCNN-Transformerアーキテクチャに基づく低レベルのローカル機能を統合する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:27:03 GMT)
Theory-inspired Label Shift Adaptation via Aligned Distribution Mixture [21.5] ADM(Aligned Distribution Mixture)という名称の革新的なラベルシフトフレームワークを提案する。
本フレームワークでは,分類器学習プロセスに修正を加えることで,4つの典型的なラベルシフト手法を改良する。
提案手法の特異性を考慮し,効率的な二段階最適化戦略を開発する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:09:29 GMT)
Seeing Eye to AI: Comparing Human Gaze and Model Attention in Video Memorability [21.4] 我々は,ビデオの暗記性予測において,時間的注意をTASo(State-of-the-art)のパフォーマンスに合わせることなく特徴を解析できる,シンプルなCNN+Transformerアーキテクチャを採用する。
本研究は,ヒトが記憶課題を遂行する視線追跡研究を通じて,人間の定着に対するモデル注意度を比較した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:25:05 GMT)
ADOPT: Modified Adam Can Converge with Any $β_2$ with the Optimal Rate [21.4] 本稿では,ADOPTという新しい適応勾配法を提案する。これは,有界雑音の仮定に依存することなく,$mathcalOの最適収束率を実現する。
ADOPTは、画像分類、生成モデル、自然言語処理、深層強化学習など、幅広いタスクにおいて、Adamとその変種と比較して優れた結果が得られる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:57:47 GMT)
Gradient-Guided Conditional Diffusion Models for Private Image Reconstruction: Analyzing Adversarial Impacts of Differential Privacy and Denoising [21.3] 現在の勾配に基づく再構成手法は、計算複雑性と事前知識の要求により、高解像度画像に苦慮している。
本稿では,拡散モデルの生成過程に最小限の変更を必要とする2つの新しい手法を提案し,事前知識の必要性を排除した。
我々は,差分プライバシーノイズが再構成画像の品質に与える影響を総合的に理論的に分析し,雑音の大きさ,攻撃モデルのアーキテクチャ,攻撃者の復元能力との関係を明らかにする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:39:21 GMT)
Harnessing Multimodal Large Language Models for Multimodal Sequential Recommendation [21.3] 本稿では,MLLM-MSRモデルを提案する。
動的ユーザの嗜好を捉えるために,2段階のユーザ選好要約法を設計する。
次に、ユーザ嗜好の動的変化を捉えるために、繰り返しユーザー嗜好要約生成パラダイムを用いる。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 03:32:31 GMT)
Harnessing Multimodal Large Language Models for Multimodal Sequential Recommendation [21.3] 本稿では,MLLM-MSRモデルを提案する。
動的ユーザの嗜好を捉えるために,2段階のユーザ選好要約法を設計する。
次に、ユーザ嗜好の動的変化を捉えるために、繰り返しユーザー嗜好要約生成パラダイムを用いる。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 03:32:31 GMT)
V-DPO: Mitigating Hallucination in Large Vision Language Models via Vision-Guided Direct Preference Optimization [21.2] トレーニング時の視覚的コンテキスト学習を改善するために,視覚誘導直接選択最適化(V-DPO)を提案する。
分析の結果,V-DPOは画像コントラストの嗜好データからの学習に優れており,視覚的文脈のニュアンスを抽出し理解する能力に優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:24:37 GMT)
Quantum machine learning for multiclass classification beyond kernel methods [21.2] 本稿では,実世界の応用において,量子カーネル法がマルチクラス分類の効率を高めることを示す量子アルゴリズムを提案する。
量子シミュレーションの結果、量子アルゴリズムは6つの現実世界の分類問題に対処する点で古典的よりも優れていたことが判明した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:58:30 GMT)
ODGEN: Domain-specific Object Detection Data Generation with Diffusion Models [21.2] 本稿では,境界ボックスに条件付き高品質な画像を生成する新しい方法であるODGENを提案する。
まず, 収穫した前景オブジェクトと画像全体を対象分布に合わせるために, 事前学習した拡散モデルを微調整する。
次に,空間的制約とオブジェクト指向のテキスト記述を伴って合成された視覚的ロバスト性プロンプトを用いて拡散モデルを制御することを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:40:01 GMT)
Pearl: Personalizing Large Language Model Writing Assistants with Generation-Calibrated Retrievers [20.9] そこで本論文では,パーソナライズのための世代分類を訓練したレトリバーにパーソナライズされた筆記アシスタントであるPearlを提案する。
一連の総合評価において、ソーシャルメディアデータセット上での長文生成におけるパールの有効性を実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:34:10 GMT)
Stable Matching with Ties: Approximation Ratios and Learning [20.8] 我々は、市場の一方が他方の会員に対して厳格な嗜好を必ずしも持たないような、市場と結びつきのある市場との整合性の問題について検討する。
我々は,各作業員が最良で安定したマッチングにおいて,ユーティリティから最大のシェアを確保できるようにすることを目標としている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:14:46 GMT)
Learning Algorithms for Verification of Markov Decision Processes [20.6] マルコフ決定過程(MDP)の検証に学習アルゴリズムを適用するための一般的な枠組みを提案する。
提案するフレームワークは,検証における中核的な問題である確率的到達性に重点を置いている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:51:16 GMT)
RIAV-MVS: Recurrent-Indexing an Asymmetric Volume for Multi-View Stereo [20.5] 「学習から最適化」パラダイムは、平面スウィーピングコストボリュームを反復的にインデックス化し、畳み込みGated Recurrent Unit(GRU)を介して深度マップを回帰する。
実世界のMVSデータセットについて広範な実験を行い、本手法が内部データセット評価とクロスデータセット一般化の両方の観点から最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:38:29 GMT)
Enriching Tabular Data with Contextual LLM Embeddings: A Comprehensive Ablation Study for Ensemble Classifiers [20.5] 本研究では,大規模言語モデルの埋め込みから派生した特徴を持つデータセットを豊かにするための体系的アプローチを提案する。
我々はRoBERTaとGPT-2の埋め込みがランダムフォレスト、XGBoost、CatBoostなどのアンサンブル分類器に与える影響を評価する。
その結果,埋め込みと従来の数値的特徴とカテゴリー的特徴を統合することで,予測性能が向上することが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:02:11 GMT)
Revisiting CNNs for Trajectory Similarity Learning [20.3] ConvTrajを導入し、1Dと2Dの畳み込みを併用して、トラジェクトリの逐次的および地理的分布の特徴を捉える。
軌道類似度探索において,ConvTrajが最先端の精度を実現することを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:25:17 GMT)
Sliding Gaussian ball adaptive growth (SlingBAG): point cloud-based iterative algorithm for large-scale 3D photoacoustic imaging [20.3] 本稿では,数桁の命令でメモリ消費を削減できるポイントクラウド型反復再構成アルゴリズムを提案する。
この手法はスライディングガウス球適応成長(SlingBAG)アルゴリズムと呼ばれ、高速反復とメモリ使用量の極端に少ない高速な3次元PA再構成を実現する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 03:43:07 GMT)
Sliding Gaussian ball adaptive growth (SlingBAG): point cloud-based iterative algorithm for large-scale 3D photoacoustic imaging [20.3] 本稿では,数桁の命令でメモリ消費を削減できるポイントクラウドベースの反復アルゴリズムを提案する。
SlingBAGアルゴリズムは、高速反復とメモリ使用量の極めて少ない高品質な3D大規模PA再構成を可能にする。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 03:43:07 GMT)
LASER: Attention with Exponential Transformation [20.2] 注意機構のソフトマックス操作により逆伝播する勾配を解析し、これらの勾配が小さい場合が多いことを観察する。
我々は、より大きな勾配信号を受け入れることを解析的に示すLASERと呼ばれる新しい注意機構を導入する。
既存のアテンション実装に小さな変更を加えることで、LASERアテンションを実装できることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:18:28 GMT)
Gradient Descent Finds Over-Parameterized Neural Networks with Sharp Generalization for Nonparametric Regression: A Distribution-Free Analysis [20.0] ニューラルネットワークが早期停止でGDによってトレーニングされている場合、トレーニングされたネットワークは、非パラメトリック回帰リスクが$cO(eps_n2)$のシャープレートを示す。
本研究の結果は,トレーニングデータに分布的な仮定を必要としないことが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:43:54 GMT)
FASTER: A Font-Agnostic Scene Text Editing and Rendering Framework [19.6] STE(Scene Text Editing)は、画像中の既存のテキストの変更を主な目的とする、難しい研究課題である。
既存のスタイル変換ベースのアプローチでは、複雑な画像背景、多様なフォント属性、テキスト内の様々な単語長によるサブパー編集性能が示されている。
フォントに依存しない新しいシーンテキスト編集・レンダリングフレームワークであるFASTERを提案し,任意のスタイルや場所のテキストを同時に生成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:51:30 GMT)
Understanding Contrastive Learning via Gaussian Mixture Models [19.5] コントラスト学習(特にInfoNCE損失)を自然な文脈で分析する。
ガウス群が等方的でない場合でも、バニラInfoNCEが最適の下次元部分空間を見つけることができることを示す。
この設定では、対照的な学習が漁師最適部分空間のサブセットを学習し、学習した表現から全てのノイズを効果的に除去することを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:43:05 GMT)
Gradient Methods with Online Scaling [19.2] オンライン学習による勾配に基づく手法の収束を加速する枠組みを提案する。
広範に使用される過勾配降下は勾配降下の収束により改善されることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:16:44 GMT)
TransUNext: towards a more advanced U-shaped framework for automatic vessel segmentation in the fundus image [19.2] 本稿では,ハイブリッドトランスフォーマーとCNN: TransUNextのための,より高度なU字型アーキテクチャを提案する。
Global Multi-Scale Fusion (GMSF)モジュールはさらに、スキップ接続のアップグレード、高レベルセマンティクスと低レベル詳細情報の融合、高レベルセマンティクスと低レベルセマンティクスの相違を取り除くために導入された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:44:22 GMT)
Layer-wise Importance Matters: Less Memory for Better Performance in Parameter-efficient Fine-tuning of Large Language Models [19.2] Importance-Aware Sparse Tuning (IST) は、様々なPEFTメソッドと互換性があり、層ごとに動作する。
ISTはPEFTモジュールで選択したレイヤを動的に更新し、メモリ要求を減らした。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:13:00 GMT)
Change Is the Only Constant: Dynamic LLM Slicing based on Layer Redundancy [19.1] 本稿では,Large Language Models (LLMs) における動的層特異的プルーニングによる新しいモデル圧縮手法を提案する。
定数から動的スライシングへの移行により,新たに提案したレイヤ冗長性(LR)スコアを活用する。
我々の動的スライシングアプローチは維持されるだけでなく、多くの場合、定常スライシング法によって確立されたベースラインと比較してモデル性能を向上させる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:19:49 GMT)
Mixtures of In-Context Learners [18.9] 本稿では,実験のサブセットを専門家として扱う新しい手法を提案し,その出力分布をマージする重み付け関数を学習する。
実験では,強いベースラインのセットと比較して,7つの分類データセットのうち5つの性能改善を示す。
MoICLはドメイン外(最大+11%)、不均衡(最大+49%)、ノイズの多いデモ(最大+38%)、あるいはデータセットからこれらをフィルタリングすることができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:02:41 GMT)
Compute-Update Federated Learning: A Lattice Coding Approach Over-the-Air [18.9] 本稿では,デジタル通信によるオーバー・ザ・エア計算を実現するための統合学習フレームワークを提案する。
本稿では,量子化モデルパラメータの整数結合を確実に復号化するための新しい受信構造を提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 21:17:46 GMT)
On the Detection of Non-Cooperative RISs: Scan B-Testing via Deep Support Vector Data Description [18.8] 1つ以上の再構成可能なインテリジェントサーフェス(RIS)から非協調的活動の存在を迅速に検出する問題について検討する。
RISがサードパーティシステムの下で動作可能であることを考慮し、非協調的なRISの位相構成の分布を意識しない新しいRISアクティビティ検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:36:51 GMT)
Discovering Data Structures: Nearest Neighbor Search and Beyond [18.8] データ構造をエンド・ツー・エンドで学習するための一般的なフレームワークを提案する。
我々のフレームワークは、基礎となるデータ分布に適応し、クエリと空間の複雑さをきめ細やかな制御を提供する。
まず、この枠組みを近接探索問題に適用する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:50:54 GMT)
Reward Machines for Deep RL in Noisy and Uncertain Environments [18.4] 雑音および不確実な環境下での深部RLに対するReward Machinesの使用について検討した。
ドメイン固有語彙の不確定な解釈の下でタスク構造を利用するRLアルゴリズムの組を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:50:49 GMT)
Stochastic-thermodynamics approach to the Ericsson nano engine -- Efficiency from equilibrium results [18.3] 準定常状態におけるサイクルの効率を数値計算する。
システムバス結合強度を増大させることで,サイクルの効率を向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:12:23 GMT)
Proxy-informed Bayesian transfer learning with unknown sources [18.3] 確率的伝達学習(PROMPT)のためのプロキシインフォームドロバスト手法を提案する。
PROMPTは、学習者が目標タスクから結果情報にアクセスすることなしに、対象タスクの構造に合わせた後続予測推定を提供する。
本稿では, この再重み付けが負転移のリスクに及ぼす影響を理論的に評価し, 2つの合成条件におけるPROMPTの適用を実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:02:29 GMT)
Efficient preparation of Dicke states [18.0] そこで我々は,Dicke状態に多数のアンシラと多対数深さを施したアルゴリズムを提案する。
提案アルゴリズムは,グローバル・ミッド・サーキット・プロジェクティブ・計測と適応的グローバル・ローテーションのみを用いる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:01 GMT)
Automatic Generation of Question Hints for Mathematics Problems using Large Language Models in Educational Technology [17.9] 本研究は,Lumge Language Models (LLMs) を教師として用いて,LLMを通してシミュレーションした学生の効果的なヒントを生成することを目的とする。
その結果, モデル誤差は温度設定の上昇とともに増加することがわかった。
興味深いことに、教師としてのLlama-3-8B-インストラクションはGPT-4oよりも全体的なパフォーマンスが良かった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:18:53 GMT)
The Effects of Multi-Task Learning on ReLU Neural Network Functions [17.8] 多数の多様なタスクを持つニューラルネットワーク学習問題は、最適ニューロンによって決定される固定されたカーネル上の$ell2$(ヒルベルト空間)問題とほぼ同値であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:03:21 GMT)
GemNet: Menu-Based, Strategy-Proof Multi-Bidder Auctions Through Deep Learning [17.7] 微分経済学は、深層学習を用いてメカニズム設計を学ぶAMDの一形態である。
GEneral Menu-based NETwork (GemNet) を導入し,マルチバイダ,汎用,完全戦略保護 (SP) オークションを学習する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:37:19 GMT)
Understanding Mobile App Reviews to Guide Misuse Audits [17.7] アプリレビューを活用して、悪用可能なアプリとその誤用を可能にする機能を特定します。
虐待者や被害者の物語は、主に過去の誤用に焦点を当てているのに対し、第三者の物語は、主に誤用の可能性を示す物語を識別している。
合計156個の悪用可能なアプリが誤用を助長していることを確認した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:56:45 GMT)
On the Global Convergence of Risk-Averse Policy Gradient Methods with Expected Conditional Risk Measures [17.7] リスクに敏感な強化学習(RL)は、不確実な結果のリスクを制御する一般的なツールとなっている。
政策グラディエント(PG)法がリスクニュートラルな場合と同じグローバル収束を保証するかどうかは不明だ。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:31:28 GMT)
DenoiseRep: Denoising Model for Representation Learning [17.6] 本稿では,特徴抽出とデノナイジングによる特徴識別を改善するために,表現学習のための新しいDenoising Model(DenoiseRep)を提案する。
DenoiseRepは、インクリメンタルに機能を改善するが、利用可能であればラベルを補完するラベルフリーのアルゴリズムである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:37:33 GMT)
SurfGNN: A robust surface-based prediction model with interpretability for coactivation maps of spatial and cortical features [17.5] 現在の脳表面に基づく予測モデルは、皮質の特徴レベルでの地域属性の変動性を見落としていることが多い。
本研究では,大脳皮質表面メッシュをスパースグラフとみなし,解釈可能な予測モデル-サーフェスグラフニューラルネットワーク(SurfGNN)を提案する。
SurfGNNは、トポロジサンプリング学習(TSL)と地域固有の学習(RSL)構造を用いて、表面メッシュの低スケールと高スケールの両方で個々の皮質の特徴を管理する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:39:53 GMT)
Exploring Large Language Models for Specialist-level Oncology Care [17.3] 乳腺腫瘍治療のサブスペシャリスト領域における対話型診断AIシステムAMIEの性能について検討した。
当科では, 治療・治療・難治性症例の50種類の合成乳がんビグネットを切除した。
症例要約の質, ケア計画の安全性, 化学療法, 放射線療法, 手術, ホルモン療法の勧告など, 管理計画を評価するための詳細な臨床用ルーリックを開発した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:30:13 GMT)
Can Transformers Smell Like Humans? [17.1] 一般的な化学構造に事前訓練されたトランスフォーマーから符号化された表現は、人間の嗅覚と高度に一致していることを示す。
また, このアライメントが嗅覚復号に関連があることが知られている臭気の物理化学的特徴とどのように関連しているかを評価する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:19:39 GMT)
Blind Image Restoration via Fast Diffusion Inversion [17.1] Blind Image Restoration via fast Diffusion (BIRD) は、劣化モデルパラメータと復元画像の協調最適化を行うブラインド赤外線法である。
提案手法の鍵となる考え方は、初期ノイズがサンプリングされると、逆サンプリングを変更すること、すなわち、中間潜水剤を全て変更しないことである。
画像復元作業におけるBIRDの有効性を実験的に検証し,それらすべてに対して,その成果が得られたことを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:21:24 GMT)
Object and Contact Point Tracking in Demonstrations Using 3D Gaussian Splatting [17.0] 本稿では,インタラクティブ・イミテーション・ラーニング(Interactive Imitation Learning, IIL)の手法を提案する。
このアプローチは現在のIILシステムを拡張し、ロボットにオブジェクトとの対話方法、特にドアや引き出しのような複雑な操作方法に関する詳細な知識を提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:28:57 GMT)
STEER: Flexible Robotic Manipulation via Dense Language Grounding [17.0] STEERは、高精度でフレキシブルな低レベル制御で高レベルの常識推論をブリッジする、ロボット学習フレームワークである。
本手法は, 複雑な状況認識を, 厳密なアノテーションによる言語基盤ポリシーの訓練を通じて, 行動可能な低レベル行動に変換する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:48:12 GMT)
Recursive PAC-Bayes: A Frequentist Approach to Sequential Prior Updates with No Information Loss [16.8] PAC-Bayesian分析は、事前知識を学習に組み込むための頻繁なフレームワークである。
我々は,情報損失のない逐次的事前更新を可能にする,驚くほどシンプルで強力なPAC-Bayesianプロシージャを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:34:30 GMT)
From Pixels to Prose: Advancing Multi-Modal Language Models for Remote Sensing [16.8] 本稿では,リモートセンシングにおけるマルチモーダル言語モデル(MLLM)の開発と応用について検討する。
我々は、自然言語を用いて衛星画像の解釈と記述を行う能力に焦点をあてる。
シーン記述、オブジェクト検出、変更検出、テキスト・ツー・イメージ検索、画像・ツー・テキスト生成、視覚的質問応答などの重要な応用について論じる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:14:22 GMT)
FakeShield: Explainable Image Forgery Detection and Localization via Multi-modal Large Language Models [16.7] 本稿では,FakeShieldの設計とIFDLタスクを提案する。
FakeShieldは、画像の信頼性を評価し、改ざんされた領域マスクを生成し、画素レベルおよび画像レベルの改ざんヒントに基づいた判断ベースを提供するマルチモーダルフレームワークである。
実験では、FakeShieldは様々な改ざん手法を効果的に検出し、ローカライズし、従来のIFDL法と比較して説明可能で優れた解を提供する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 13:14:23 GMT)
Better, Not Just More: Data-Centric Machine Learning for Earth Observation [16.7] モデル中心の視点から補完的なデータ中心の視点へのシフトは、より正確性、一般化能力、そしてエンドユーザーアプリケーションへの影響を高めるために必要である。
本研究は、地理空間データに対する自動データ中心学習手法の正確な分類と概要と、その定義を提示する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:12:40 GMT)
GitChameleon: Unmasking the Version-Switching Capabilities of Code Generation Models [16.7] textbfGitChameleonは、116のPythonコード補完問題からなる、手動でキュレートされた新しいデータセットである。
GitChameleonは、バージョン固有のコードを生成するためのモダンな大規模言語モデルの性能を厳格に評価するように設計されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:34:06 GMT)
Point processes with event time uncertainty [16.6] ネットワーク上での時間不確実なポイントプロセスのモデル化のためのフレームワークを導入する。
提案手法は,シミュレーションおよび実データに基づく従来のジェネラル線形モデル(GLM)のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:46:09 GMT)
Stochastic Monkeys at Play: Random Augmentations Cheaply Break LLM Safety Alignment [16.6] 本稿では,入力に対する単純なランダムな拡張が,最先端のLCMにおける安全アライメントの有効性にどのように影響するかを検討する。
低リソース・無知な攻撃者は1プロンプト当たり25のランダムな拡張でアライメントを回避できる可能性を大幅に改善できることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:51:13 GMT)
When Your AIs Deceive You: Challenges of Partial Observability in Reinforcement Learning from Human Feedback [16.5] 人間のフィードバックが部分的な観察にのみ基づく場合、それは誤認的なインフレーションと過度な調整をもたらす可能性があることを示す。
人間のフィードバックは加法定数まで一意的に戻り関数を決定することがあるが、他の現実的な場合、あいまいさは不可避である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:46:01 GMT)
Exploring Response Uncertainty in MLLMs: An Empirical Evaluation under Misleading Scenarios [16.5] 既存のベンチマークでは,不確実性を評価するために,サンプル毎に5~15回の応答試行が必要になる。
まず、誤解を招くことなくMLLMの応答を収集し、特定の誤解を招く命令によって誤解を招く応答を収集する。
実験の結果,すべてのオープンソースおよびオープンソースMLLMは誤解を招く命令に非常に敏感であり,平均ミスリード率は86%を超えていることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:11:28 GMT)
Estimating Ego-Body Pose from Doubly Sparse Egocentric Video Data [16.4] エゴボディポーズ推定の現在の手法は、時間的に密度の高いセンサデータに依存している。
本研究では,問題を時間的完備化と空間的完備化に分解する2段階のアプローチを開発する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:53:19 GMT)
SageFormer: Series-Aware Framework for Long-term Multivariate Time Series Forecasting [16.4] 本稿では,シリーズ間の依存関係の重要性を強調するために,新たなシリーズアウェアフレームワークを提案する。
グラフ強化トランスフォーマーモデルとして、SageFormerはグラフ構造を用いて、シリーズ間の複雑な関係を巧みに識別し、モデル化する。
特に、シリーズ対応フレームワークは既存のTransformerベースのモデルとシームレスに統合され、シリーズ間の関係を理解する能力が強化されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:56:33 GMT)
OLAF: A Plug-and-Play Framework for Enhanced Multi-object Multi-part Scene Parsing [16.3] 多目的多部分シーンセグメンテーションは、複雑さが部分的な粒度とシーンオブジェクトの数とともに指数関数的にスケールする難題である。
この課題に対処するために,OLAFと呼ばれるプラグアンドプレイ方式を提案する。
本稿では, 正規(RGB)事前学習モデルを用いて, 最適化時に, 拡張(5チャネル)入力を安定的に処理できる重み適応手法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:02:25 GMT)
Building on Efficient Foundations: Effectively Training LLMs with Structured Feedforward Layers [16.3] 大規模言語モデル(LLM)における最先端の結果は、しばしばスケールに依存し、計算コストがかかる。
本研究は,計算集約型フィードフォワードネットワーク(FFN)を対象とするトランスフォーマーベースLLMに着目した。
広範かつ構造化されたネットワークは、最適なトレードオフにおいて、パラメータが少なく、高密度モデルよりも損失が少ないFLOPをより効率的に活用できることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:34:29 GMT)
LADDER: Language Driven Slice Discovery and Error Rectification [16.1] LADDER: 言語駆動スライスディスカバリとエラー修正。
本稿では,Large Language Modelの推論機能を利用して,複雑なエラーパターンを分析し,検証可能な仮説を生成する。
私たちのメソッド全体は、明示的にも外部タグ付けモデルを通しても、属性アノテーションを一切必要としません。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 23:50:14 GMT)
LADDER: Language Driven Slice Discovery and Error Rectification [16.1] LADDER: 言語駆動スライスディスカバリとエラー修正。
本稿では,Large Language Modelの推論機能を利用して,複雑なエラーパターンを分析し,検証可能な仮説を生成する。
本手法をtextbffive 画像分類データセットを用いて検証する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 23:50:14 GMT)
ATM: Improving Model Merging by Alternating Tuning and Merging [16.1] タスクベクトルをマルチタスク勾配にリンクすることで、タスクベクトルの有効性を動機付ける。
単一エポックなシナリオでは、タスクベクトルは、マルチタスク設定において勾配降下によって得られる勾配と数学的に等価である。
タスクベクトルは等式が維持されたときに最適に動作し、その有効性は最初のエポック勾配によって大きく駆動される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:42:42 GMT)
Learning Transferable Time Series Classifier with Cross-Domain Pre-training from Language Model [16.1] CrossTimeNetは、さまざまなドメインから転送可能な知識を学ぶための、新しいクロスドメインSSL学習フレームワークである。
CrossTimeNetの重要な特徴の1つは、新しく設計された時系列トークン化モジュールである。
我々は、様々な時系列分類領域にわたる実世界のシナリオにおいて広範な実験を行う。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 04:13:08 GMT)
Interpretable Lightweight Transformer via Unrolling of Learned Graph Smoothness Priors [16.0] 我々は反復最適化アルゴリズムをアンロールすることで、解釈可能で軽量なトランスフォーマーのようなニューラルネットワークを構築する。
正規化信号依存グラフ学習モジュールは、従来の変圧器の基本自己保持機構の変種に相当する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:51:06 GMT)
DroidSpeak: Enhancing Cross-LLM Communication [15.9] 我々は,このクロスLLM通信をターゲットとする新しいフレームワークであるDroidSpeakを紹介する。
我々は、同じ基礎モデルの微調整されたバージョンに対して、コンテキスト全体を再処理する必要性を効率的に回避する。
我々の発見は、より効率的でスケーラブルなマルチエージェントシステムを構築する可能性を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:41:41 GMT)
FewViewGS: Gaussian Splatting with Few View Matching and Multi-stage Training [15.6] スパース入力画像を用いた3次元ガウス型新規ビュー合成法を提案する。
本稿では,新しい視点に課せられる整合性制約を考慮した多段階学習手法を提案する。
これは、利用可能なトレーニング画像のマッチングを使用して、新しいビューの生成を監督することで達成される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:06:16 GMT)
AI Metropolis: Scaling Large Language Model-based Multi-Agent Simulation with Out-of-order Execution [15.6] AI Metropolisは、注文外実行スケジューリングを導入することで、LLMエージェントシミュレーションの効率を改善するシミュレーションエンジンである。
我々の評価では,グローバル同期を用いた標準並列シミュレーションにより,AI Metropolisは1.3倍から4.15倍の高速化を実現している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:54:14 GMT)
Differentially Private Graph Diffusion with Applications in Personalized PageRanks [15.5] 本研究は,雑音拡散イテレートを用いてエッジレベルの差分プライバシーを保証する新しいグラフ拡散フレームワークを提案する。
このアルゴリズムは拡散当たりのラプラスノイズを注入し、低次ノードによって誘導される高感度を緩和する度合いベースの閾値関数を採用する。
私たちのプライバシー損失分析は、PABI(Privacy Amplification by Iteration)に基づいています。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:25:16 GMT)
Conditional Vendi Score: An Information-Theoretic Approach to Diversity Evaluation of Prompt-based Generative Models [15.4] モデルの内部の多様性を定量化するために,$H(X|T)$に基づく条件付きVendiスコアを導入する。
テキスト条件付き生成モデルの条件-ベンダースコアと内部の多様性との相関を示すために,いくつかの数値実験を行った。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:30:39 GMT)
Heteroscedastic Temporal Variational Autoencoder For Irregular Time Series [15.4] HeTVAE(Heteroscedastic Temporal Variational Autoencoder)と呼ばれる不規則サンプル時系列のための新しいディープラーニングフレームワークを提案する。
HeTVAEは、入力観察間隔に関する情報を符号化する新しい入力層と、入力間隔による不確かさを伝播する時間的VAEアーキテクチャと、変数による出力の不確実性を可能にするヘテロセダスティック出力層とを含む。
提案したアーキテクチャは,近年提案された潜時変動モデルと同様に,時間スパースおよび不規則サンプリングによる変動不確かさを,ベースラインや従来のモデルよりもよく反映できることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:22:12 GMT)
CIT: Rethinking Class-incremental Semantic Segmentation with a Class Independent Transformation [15.3] クラスインクリメンタルセマンティックセマンティクス(CSS)では、モデルが以前のセマンティクスを忘れずに新しいクラスセマンティクスを学ぶ必要がある。
本稿では,既存のセマンティックセグメンテーションモデルの出力をクラス独立形式に変換する,シンプルで効果的なクラス独立変換(CIT)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:27:25 GMT)
Latent Representation Matters: Human-like Sketches in One-shot Drawing Tasks [15.3] 我々は、異なる誘導バイアスが潜在拡散モデル(LDM)の潜時空間をどのように形成するかを研究する。
冗長性の低減とプロトタイプベース正規化によるLCDが, ほぼ人間に近い図形を生成することを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:07:21 GMT)
LifelongMemory: Leveraging LLMs for Answering Queries in Long-form Egocentric Videos [15.1] LifelongMemoryは、自然言語による質問応答と検索を通じて、長い形式のエゴシックなビデオメモリにアクセスするための新しいフレームワークである。
Ego4D の自然言語クエリ (NLQ) の課題に対して,本手法は質問応答のためのベンチマークの最先端性能を実現し,高い競争力を発揮する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:08:14 GMT)
DEM: Distribution Edited Model for Training with Mixed Data Distributions [15.1] 本稿では,各データソース上で個別に訓練されたモデルと基本モデルとを,基本要素のベクトル演算を用いて組み合わせることで,データソースの最適化を容易かつ効率的に行う方法を提案する。
結果として得られたモデル、すなわちDistributed Edited Model (DEM)は、標準データミキシングよりも11倍安く、様々なベンチマークで強いベースラインを上回ります。
単一のデータソースを変更する場合、DEMは完全な再トレーニングを必要としないため、さまざまなデータソースでトレーニングするために非常に柔軟でスケーラブルである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:40:05 GMT)
Generative AI Enables EEG Super-Resolution via Spatio-Temporal Adaptive Diffusion Learning [15.0] HDデバイスは頭皮により多くの電極を配置することで脳波の空間分解能を向上させる。
この技術は、高い取得コストや限られた利用シナリオといった課題に直面している。
本稿では,適応拡散モデル(STAD)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:13:56 GMT)
An Exponential Separation Between Quantum and Quantum-Inspired Classical Algorithms for Machine Learning [15.0] 証明可能な指数的量子スピードアップは、線形系を解くためのセミナルHHL量子アルゴリズム以来、中心的な研究目標となっている。
量子と量子に着想を得た古典的アルゴリズム間で、このような証明可能な指数的分離を初めて提示する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:52:41 GMT)
PACE: Pacing Operator Learning to Accurate Optical Field Simulation for Complicated Photonic Devices [14.7] 既存のSOTAアプローチであるNeurOLightは、現実世界の複雑なフォトニックデバイスに対する高忠実度フィールドの予測に苦労している。
長距離モデリング能力の強いクロス軸分解型PACE演算子を提案する。
人間の学習に触発されて、非常に難しいケースのシミュレーションタスクを、段階的に簡単な2つのタスクに分解する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:03:14 GMT)
Skill-aware Mutual Information Optimisation for Generalisation in Reinforcement Learning [14.6] Skill-aware Mutual Information (SaMI) は,スキルに応じたコンテキスト埋め込みの識別を支援する最適化目的である。
そこで我々は,SaMIの目的を最適化するための$K$sample推定器であるSkill-aware Noise Contrastive Estimation (SaNCE)を提案する。
SMIを最大化することで学習するRLエージェントが、目に見えないタスクに対して、ゼロショットの一般化を大幅に改善できることを実証的に見出した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:02:25 GMT)
Proposals for 3D self-correcting quantum memory [14.5] 自己補正量子メモリ(Self-correcting quantum memory)は、冷却によって受動的にエラーを修正する量子エラー訂正コードの一種である。
本稿では,3次元自己補正量子メモリのための2つの候補構成を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:04:07 GMT)
BrainBits: How Much of the Brain are Generative Reconstruction Methods Using? [14.1] 高い忠実度で再建を行うには、驚くほど少ない情報が脳から得られることが示されています。
方法の生成モデルの先行は、非常に強力であることは明らかであり、それらがデコードした神経信号をはるかに超える出力を生成する。
本稿では,メソッド固有のランダムベースライン,リコンストラクション天井,およびボトルネックサイズの関数としての性能曲線を報告する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:48:25 GMT)
SMoA: Improving Multi-agent Large Language Models with Sparse Mixture-of-Agents [14.1] マルチエージェントLLMの効率と多様性を向上させるために,スパース混合エージェント(SMoA)フレームワークを提案する。
SMoAは、個々のLSMエージェント間で情報の流れを分散させる新しい応答選択と早期停止機構を導入している。
推論、アライメント、公平性ベンチマークの実験は、SMoAが従来の混合エージェントアプローチに匹敵するパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:33:39 GMT)
When to Localize? A Risk-Constrained Reinforcement Learning Approach [13.9] いくつかのシナリオでは、ロボットは観測に費用がかかるときに選択的にローカライズする必要がある。
RiskRLは制約付き強化学習フレームワークで、これらの制限を克服します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:54:00 GMT)
Safety through feedback in Constrained RL [13.7] 安全クリティカルなRL設定では、エージェントの安全な振る舞いを保証するために報酬関数を変更するよりも、追加のコスト関数を含めることが好まれる。
より複雑なドメインにスケールし、状態レベルのフィードバックを超えて拡張するアプローチを導入します。
安全体育館環境と現実的な自動運転シナリオのベンチマーク実験により,本手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:38:31 GMT)
A Mamba Foundation Model for Time Series Forecasting [13.6] 本稿では,マンバアーキテクチャ上に構築された時系列予測のための線形複雑基盤モデルであるTSMambaを紹介する。
このモデルは、前方および後方のMambaエンコーダを通して時間的依存関係をキャプチャし、高い予測精度を達成する。
また、タスク固有の予測モデルと比較して、競争力や優れたフルショットパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:34:05 GMT)
Rethinking Misalignment in Vision-Language Model Adaptation from a Causal Perspective [13.6] 本稿では,タスク非関連知識の干渉を軽減するために,因果性誘導セマンティックデカップリングと分類を提案する。
多様な意味論によって生成される各予測の不確実性を評価するために、Dempster-Shaferエビデンス理論を用いる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:27:30 GMT)
Architectures for Heterogeneous Quantum Error Correction Codes [13.5] 不均一なアーキテクチャは、普遍論理計算への明確な経路を提供する。
本研究では,アシラバスを用いてコード間データ移動のためのサーフェスコードとグロスコードを統合することを提案する。
アルゴリズムを特定の論理誤差率で実行する場合、物理量子ビットの最大6.42倍の減少を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:49:02 GMT)
Poseidon: Efficient Foundation Models for PDEs [13.4] PoseidonはPDEのソリューション演算子を学ぶための基礎モデルである。
流体力学の制御方程式のデータセット上で事前訓練される。
その後、ダウンストリームタスクに挑戦する15のスイートで評価される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:32:43 GMT)
Recurrent neural networks: vanishing and exploding gradients are not the end of the story [13.4] リカレントニューラルネットワーク(RNN)は長期記憶の学習に苦慮している。
状態空間モデル(SSM)の最近の成功は、我々の理論的理解を困難にしている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:28:21 GMT)
Topological Feature Search Method for Multichannel EEG: Application in ADHD classification [13.4] トポロジカルデータ分析はADHD分類の新しい視点を提供する。
本稿では,ADHDにおけるマルチチャネル脳波に適用可能な拡張型TDA手法を提案する。
その結果、精度、感度、特異性はそれぞれ78.27%、80.62%、75.63%に達した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:37:22 GMT)
Transferable polychromatic optical encoder for neural networks [13.3] 本稿では,画像キャプチャ中に3つの色チャネルで同時に畳み込みを行う光学エンコーダを実演する。
このような光学符号化は計算処理を24,000倍に削減し、自由空間光学系における最先端の分類精度(73.2%)が得られる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:49:47 GMT)
Towards Efficient Transferable Preemptive Adversarial Defense [13.3] 深層学習技術は摂動に敏感なため、信頼できないものになっている。
我々は、第三者に攻撃される前に、メディアを「攻撃」するための積極的な戦略を考案した。
この戦略はファスト・プリエンプションと呼ばれ、効率的な転送可能なプリエンプティブ・ディフェンスを提供する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:36:14 GMT)
RepLiQA: A Question-Answering Dataset for Benchmarking LLMs on Unseen Reference Content [13.2] 大規模言語モデル(LLM)は大量のデータに基づいて訓練されており、そのほとんどは自動的にインターネットから取り除かれる。
トレーニングセットに漏れたかもしれない テストスプリットのモデルを評価する 結論を誤解させる傾向がある
本稿では,質問応答とトピック検索タスクに適したRepLiQAという新しいテストデータセットを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:47:43 GMT)
Gaussian Process Boosting [13.2] ガウス過程と混合効果モデルを組み合わせた新しい手法を提案する。
シミュレーションおよび実世界のデータセットに対する既存手法と比較して予測精度が向上する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:23:09 GMT)
SAUCE: Synchronous and Asynchronous User-Customizable Environment for Multi-Agent LLM Interaction [12.9] グループシミュレーションのためのカスタマイズ可能なPythonプラットフォームであるSAUCEを紹介する。
我々のプラットフォームは、モデルをインスタンス化し、レスポンスをスケジューリングし、議論履歴を管理し、包括的なアウトプットログを生成する。
SAUCEの新機能は非同期通信機能です。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:31:06 GMT)
Exploring the Potentials and Challenges of Using Large Language Models for the Analysis of Transcriptional Regulation of Long Non-coding RNAs [12.8] 長鎖非コードRNA(lncRNA)は遺伝子制御と疾患機構において重要な役割を担っている。
lncRNA配列の複雑さと多様性、およびその機能機構の限られた知識と発現の調節は、lncRNA研究に重大な課題をもたらす。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:57:38 GMT)
Shape2.5D: A Dataset of Texture-less Surfaces for Depth and Normals Estimation [12.8] シェープ2.5Dは、このギャップに対処するために設計された、新しい大規模データセットである。
提案するデータセットは、3Dモデリングソフトウェアでレンダリングされた合成画像を含む。
また、深度カメラで撮影される4,672フレームからなる現実世界のサブセットも含まれている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:56:56 GMT)
CollaMamba: Efficient Collaborative Perception with Cross-Agent Spatial-Temporal State Space Model [12.5] マルチエージェント協調認識は環境のより深い理解を促進する。
協調知覚の最近の研究は、主にCNNやトランスフォーマーを用いて空間次元における特徴表現と融合を学習している。
資源効率の良い時間空間協調状態空間モデルCollaMambaを提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 02:59:08 GMT)
CollaMamba: Efficient Collaborative Perception with Cross-Agent Spatial-Temporal State Space Model [12.5] マルチエージェント協調認識は環境のより深い理解を促進する。
協調知覚の最近の研究は、主にCNNやトランスフォーマーを用いて空間次元における特徴表現と融合を学習している。
資源効率の良い時間空間協調状態空間モデルCollaMambaを提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 02:59:08 GMT)
HyperAgent: Generalist Software Engineering Agents to Solve Coding Tasks at Scale [12.2] 大規模言語モデル(LLM)がソフトウェア工学(SE)に革命をもたらした
最近の進歩にもかかわらず、これらのシステムは一般的に特定のSE関数用に設計されている。
我々は,多種多様なSEタスクに対処するために設計された,革新的な汎用マルチエージェントシステムHyperAgentを紹介する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 17:22:10 GMT)
Multimodal Commonsense Knowledge Distillation for Visual Question Answering [12.0] 本稿では,教師の学習環境に追従したグラフ畳み込みネットワーク(GCN)を通して,共通知識,視覚オブジェクト,質問に対する統一的なグラフを構築する,新しいグラフベースのマルチモーダルコモンセンス知識蒸留フレームワークを提案する。
提案するフレームワークは,教師モデルや学生モデルに対して,さらなる微調整を行なわずに柔軟であり,ScienceQAデータセット上での競争性能を達成している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:37:16 GMT)
FUSE: Fast Unified Simulation and Estimation for PDEs [12.0] 同じフレームワーク内で両方の問題を解決することは、正確性と堅牢性において一貫した利益をもたらす可能性がある、と私たちは主張する。
本研究は,本手法の全身血行動態シミュレーションにおける連続的および離散的バイオマーカーの予測能力について述べる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:31:12 GMT)
Taming the Long Tail in Human Mobility Prediction [11.8] 移動予測のためのLong-Tail Adjusted Next POI Prediction (LoTNext) フレームワークを提案する。
2つの実世界の軌道データセットによる実験により、LoTNextが既存の最先端の作業を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:21:26 GMT)
AtlasSeg: Atlas Prior Guided Dual-U-Net for Cortical Segmentation in Fetal Brain MRI [11.8] 我々は、妊娠年齢(GA)固有の情報をガイダンスとして組み込んだ二重U字型畳み込みネットワークであるAtlasSegを紹介する。
対応するGAにセグメンテーションラベルを付けた公用胎児脳性アトラスを提供することで、アトラス枝の年齢特異的パターンの文脈的特徴を効果的に抽出した。
AtlasSegは、内部の胎児脳MRIデータセットと外部のFeTAデータセットの両方において、よく知られたセグメンテーションネットワークを6つ上回った。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:16:32 GMT)
Flashy Backdoor: Real-world Environment Backdoor Attack on SNNs with DVS Cameras [11.7] スパイキングニューラルネットワーク(SNN)を用いた実環境におけるバックドアアタックの初評価について述べる。
本稿では,SNNに新たな3つのバックドア攻撃手法,すなわちFramed,Strobing,F Flashy Backdoorを提案する。
本研究は, バックドア攻撃に対するSNNベースのシステムのセキュリティと, 現実のシナリオにおける安全性を確保するために, さらなる研究が必要であることを示すものである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:44:54 GMT)
DDFAV: Remote Sensing Large Vision Language Models Dataset and Evaluation Benchmark [11.6] 本稿では,データ拡張とデータ混合戦略を用いて,高品質なリモートセンシングLVLMデータセットDDFAVを提案する。
次に、提案したデータセットから選択した高品質なリモートセンシング画像に基づいて、トレーニング命令セットを生成する。
最後に、提案したデータセットに基づいて、リモートセンシングによるLVLMの幻覚評価手法RSPOPEを開発し、異なるLVLMのゼロショット機能を評価する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:03:12 GMT)
Attention-based Class-Conditioned Alignment for Multi-Source Domain Adaptation of Object Detectors [11.6] オブジェクト検出(OD)のドメイン適応手法は、ソースドメインとターゲットドメイン間の特徴調整を促進することによって、分散シフトの影響を軽減する。
ODのための最先端MSDA手法の多くは、クラスに依存しない方法で特徴アライメントを実行する。
ドメイン間で各オブジェクトカテゴリのインスタンスをアライメントするMSDAのための注目型クラス条件アライメント手法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:37:00 GMT)
Dimension-free deterministic equivalents and scaling laws for random feature regression [11.6] テスト誤差は特徴写像固有値のみに依存する閉形式式によってよく近似されていることを示す。
特に、近似保証は非漸近的で乗法的であり、特徴写像次元とは独立である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:19:55 GMT)
Detecting critical treatment effect bias in small subgroups [11.4] 本研究では, 平均治療効果以上の観察研究をベンチマークするための新しい手法を提案する。
まず, 2つの研究から推定される治療効果が, 関連する特徴のセットに基づいて, ある程度の許容範囲で異なるという, ヌル仮説の統計的試験を設計する。
次に,観測研究における任意の部分群に対して,最大バイアス強度に対する有意な下限を推定する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:45:52 GMT)
Confidential Computing on nVIDIA Hopper GPUs: A Performance Benchmark Study [11.3] 様々な大言語モデル(LLM)推論タスクにTEEモードで導入されたオーバーヘッドをベンチマークする。
以上の結果から,GPUには計算オーバーヘッドが最小限に抑えられているものの,データ転送による性能上のペナルティが主な原因であることが示唆された。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 16:57:26 GMT)
Confidential Computing on NVIDIA Hopper GPUs: A Performance Benchmark Study [11.3] 様々な大言語モデル(LLM)推論タスクにTEEモードで導入されたオーバーヘッドをベンチマークする。
以上の結果から,GPUには計算オーバーヘッドが最小限に抑えられているものの,データ転送による性能上のペナルティが主な原因であることが示唆された。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 16:57:26 GMT)
Region-Guided Attack on the Segment Anything Model (SAM) [11.3] SAM(Segment Anything Model)に特化して設計されたRegional-Guided Attack(RGA)を紹介する。
RGAはセグメント化された領域を操作し、大きなセグメントを断片化し、より小さな領域を拡大するターゲットの摂動を可能にし、SAMからの誤った出力をもたらす。
実験により,RGAはホワイトボックスとブラックボックスの両方のシナリオで高い成功率を達成することが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:21:21 GMT)
An Open API Architecture to Discover the Trustworthy Explanation of Cloud AI Services [11.2] この記事では、クラウドAIサービスのための機能コントリビューション説明を提供するために、オープンAPIベースの説明可能なAI(XAI)サービスの設計について説明する。
我々は、XAI操作をクラウドAIサービスアセスメントに統合するために、XAI操作がオープンAPIとしてアクセス可能であることを論じる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:52:22 GMT)
Self-supervised Hierarchical Representation for Medication Recommendation [11.1] 医薬推奨者は、患者の健康履歴に基づいて適切な薬剤の組み合わせを提案することである。
既存の著作物は、一つのホットエンコーディングで明確に分離された異なる診断/調達を表現している。
本稿では,階層的に診断と手順を表現する階層型エンコーダHIERを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:33:50 GMT)
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation [10.9] AIoT技術は現代の養鶏経営において重要なトレンドとなり、農業作業の最適化と人的ワークロード削減の可能性を秘めている。
本稿では,エッジAI機能付きCMOSセンサを備えた軽量でインテリジェントなカメラを用いて,ニワトリとその健康状態を特定するための,リアルタイムかつコンパクトなエッジAI対応検出器を提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:35:52 GMT)
Edge AI-Enabled Chicken Health Detection Based on Enhanced FCOS-Lite and Knowledge Distillation [10.9] AIoT技術は現代の養鶏経営において重要なトレンドとなり、農業作業の最適化と人的ワークロード削減の可能性を秘めている。
本稿では,エッジAI機能付きCMOSセンサを備えた軽量でインテリジェントなカメラを用いて,ニワトリとその健康状態を特定するための,リアルタイムかつコンパクトなエッジAI対応検出器を提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:35:52 GMT)
Uncertainty Quantification for Clinical Outcome Predictions with (Large) Language Models [10.9] ホワイトボックスおよびブラックボックス設定におけるEMHタスクに対するLMの不確実性定量化について検討する。
EHRにおけるマルチタスクとアンサンブル手法を用いることで,モデル不確実性を効果的に低減できることを示す。
6,000名以上の患者から得られた縦断的臨床データを10種類の臨床予測タスクで検証した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:20:15 GMT)
Generative Text Steganography with Large Language Model [10.6] LLM-Stegaと呼ばれる大規模言語モデルのユーザインタフェースに基づくブラックボックス生成テキストステガノグラフィー手法。
まず、キーワードセットを構築し、秘密メッセージを埋め込むための新しい暗号化されたステガノグラフマッピングを設計する。
総合的な実験により、LLM-Stegaは現在の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:18:31 GMT)
Towards Next-Level Post-Training Quantization of Hyper-Scale Transformers [10.6] ポストトレーニング量子化(PTQ)は、モバイルやテレビなどのエッジデバイスにハイパースケールモデルをデプロイするための有望なソリューションとして登場した。
本稿では,精度と効率のバランスをとる新しいPTQアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:04:28 GMT)
Blind Estimation of Sub-band Acoustic Parameters from Ambisonics Recordings using Spectro-Spatial Covariance Features [10.5] 10個の周波数帯域にわたる残響時間(T60)、直接残響率(DRR)、明瞭度(C50)を盲目的に推定する統合フレームワークを提案する。
提案フレームワークは, 時間, スペクトル, およびFOA信号の空間情報を効率的に表現する, Spectro-Spatial Co Vector (SSCV) と呼ばれる新しい特徴を利用する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:20:23 GMT)
OxonFair: A Flexible Toolkit for Algorithmic Fairness [10.2] OxonFairはバイナリ分類における公平性を強化するオープンソースツールキットである。
sklearn、Autogluon、PyTorchなど、標準的なMLツールキットと互換性がある。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 13:59:31 GMT)
Breaking the Metric Voting Distortion Barrier [10.1] 社会選択における計量歪みの問題を考察する。
歪み3-epsilon$を保証するランダム化ルールを見つけることは、計算社会選択において大きな課題である。
歪みを2.753ドル未満で保証する規則を与えます。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:55:06 GMT)
Oblivious Defense in ML Models: Backdoor Removal without Detection [10.1] 最近の結果は、敵が検出不能なバックドアを機械学習モデルに植え付けることができることを示している。
本稿では,MLモデルにおけるバックドアの防御戦略について述べる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:20:53 GMT)
3DGS.zip: A survey on 3D Gaussian Splatting Compression Methods [10.1] 3次元ガウス散乱(3DGS)は実時間放射場レンダリングの最先端技術として登場している。
レンダリング速度と画像の忠実さの利点にもかかわらず、3DGSはその大きなストレージとメモリ要求によって制限されている。
本調査では3DGSをより効率的にするために開発された圧縮・圧縮技術について詳細に検討する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 11:41:40 GMT)
Error Interference in Quantum Simulation [10.1] 本稿では,複数セグメントの時間的アルゴリズム誤差を直接推定する新しい手法を提案する。
我々は、厳密な誤差干渉のための十分かつ必要な条件を特定し、近似誤差干渉の概念を導入する。
我々の研究は、以前のものよりも大幅に改善され、量子シミュレーションにおけるエラー解析のための新たな道を開く。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:53:22 GMT)
Macroscopic quantum teleportation with ensembles of qubits [10.0] 本研究では、未知状態の全スピン変数の量子テレポーテーションを行う方法を開発した。
2つのプロトコルを導入し、平均的に、スピンコヒーレント状態のスピン変数をテレポートすることに成功した。
このスキームの潜在的な物理的実装は、原子アンサンブルと光で実行される量子非分解測定である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:12:25 GMT)
SambaNova SN40L: Scaling the AI Memory Wall with Dataflow and Composition of Experts [9.9] GPT-4のようなモノリシックな大規模言語モデル(LLM)は、近代的な生成AIアプリケーションへの道を開いた。
現代のAIアクセラレーターの計算-メモリ比の不均等な増加は、メモリウォールを生み出した。
コンポジション・オブ・エキスパート(CoE)は、トレーニングと提供のコストと複雑さを下げる代替のモジュラーアプローチである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:53:00 GMT)
Enhancing Content Moderation with Culturally-Aware Models [9.9] この研究は、文化的な知識で基礎言語モデルを強化する柔軟なフレームワークを導入します。
この枠組みを,様々な領域にまたがるコンテンツを備えたオンラインポッドキャストプラットフォームを事例として評価した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:33:52 GMT)
LiveMind: Low-latency Large Language Models with Simultaneous Inference [9.8] 大規模言語モデル(LLM)推論のための新しい低レイテンシ推論フレームワークであるLiveMindを紹介する。
計算処理を入力フェーズに再配置することで、レイテンシを大幅に削減できる。
このフレームワークは、モデルに対するストリーミングインプットの可視性を管理し、不完全なユーザインプットから推論したり、追加コンテンツを待つことができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:43:57 GMT)
Model Reconstruction Using Counterfactual Explanations: A Perspective From Polytope Theory [9.8] 本研究は, 対物モデルを用いたモデル再構成を改良する方法について分析する。
我々の主な貢献は、モデル再構成における誤差と対実的なクエリの数の間の新しい理論的関係を導出することである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:14:03 GMT)
Not All Frequencies Are Created Equal:Towards a Dynamic Fusion of Frequencies in Time-Series Forecasting [9.6] 時系列予測手法は、異なるシナリオに適用する場合、柔軟であるべきです。
本稿では、各フーリエ成分を個別に予測し、異なる周波数の出力を動的に融合する周波数動的融合(FreDF)を提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 07:12:30 GMT)
Mind Your Step (by Step): Chain-of-Thought can Reduce Performance on Tasks where Thinking Makes Humans Worse [9.5] CoT(Chain-of-Thought)は、大規模言語やマルチモーダルモデルを扱う上で広く使われている戦略である。
認知心理学からインスピレーションを得て,CoTが性能を低下させるタスクの特徴を同定する。
予測時間推論を用いた場合,多種多様な最先端モデル群が性能低下を示すことが判明した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:47:25 GMT)
CRT-Fusion: Camera, Radar, Temporal Fusion Using Motion Information for 3D Object Detection [9.5] 本稿では,レーダカメラ融合に時間情報を統合する新しいフレームワークであるCRT-Fusionを紹介する。
CRT-Fusionはレーダーカメラによる3Dオブジェクト検出のための最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:25:19 GMT)
Data Quality Awareness: A Journey from Traditional Data Management to Data Science Systems [9.5] 本稿では、従来のデータ管理システムから現代のデータ駆動型AIシステムへのデータ品質意識の進化についてレビューする。
データサイエンスシステムは幅広い活動をサポートするため、本論文の焦点は機械学習によって引き起こされる分析的側面に特化している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:12:25 GMT)
Improving LLM Reasoning with Multi-Agent Tree-of-Thought Validator Agent [9.4] Tree of Thoughts (ToT) 法は複雑な質問応答タスクの推論を改善する可能性を示している。
マルチエージェント推論における重要な制限は、'Reasoner'エージェントによる推論経路の浅い探索である。
ToTをベースとしたReasonerエージェントとThought Validatorエージェントを組み合わせた新しいアプローチを提案する。
提案手法は,GSM8Kデータセットを用いた場合,既存の手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 01:34:26 GMT)
Fix the Tests: Augmenting LLMs to Repair Test Cases with Static Collector and Neural Reranker [9.4] 本稿では, TROCtxsの精密かつ高精度な構築により, 旧来の検査ケースを自動的に修復する新しい手法であるSynTERを提案する。
構築されたTROCtxの増強により、幻覚は57.1%減少する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:20:54 GMT)
Towards a Scalable Reference-Free Evaluation of Generative Models [9.3] 本稿では、VENDIとRKEのエントロピースコアを推定するためのカーネルエントロピー近似(FKEA)法を提案する。
我々は、FKEAの数値性能を、標準画像、テキスト、ビデオデータセットに適用して広範囲に評価する。
実験結果から,大規模生成モデルに適用する手法のスケーラビリティと解釈可能性を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:16:21 GMT)
Scaling Is All You Need: Autonomous Driving with JAX-Accelerated Reinforcement Learning [9.3] 強化学習は、ビデオゲームのような複雑な領域で最高の人間よりも優れていることが実証されている。
自律運転のための大規模強化学習実験を行っている。
我々の最高の実行方針は、最先端の機械学習による自律運転のポリシーと比較して、運転進捗率を25%向上させながら、失敗率を64%削減します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:58:32 GMT)
Temporal Smoothness Regularisers for Neural Link Predictors [9.0] TNTComplExのような単純な手法は、最先端の手法よりもはるかに正確な結果が得られることを示す。
また,2つの時間的リンク予測モデルに対する幅広い時間的平滑化正規化の影響についても検討した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:26:50 GMT)
SpiDR: A Reconfigurable Digital Compute-in-Memory Spiking Neural Network Accelerator for Event-based Perception [9.0] スパイキングニューラルネットワーク(SNN)は、ダイナミックビジョンセンサー(DVS)によって生成された非同期時間データを効率的に処理する方法を提供する。
既存のSNNアクセラレータは、多様なニューロンモデル、ビット精度、ネットワークサイズへの適応性の制限に悩まされている。
本稿では,CIM (Citical Compute-in-Memory) SNNアクセラレーターを,拡張性および再構成性を備えたチップ名として提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:59:02 GMT)
Precise Drive with VLM: First Prize Solution for PRCV 2024 Drive LM challenge [8.9] 本報告ではPRCVチャレンジの方法論について概説する。
シナリオの認知と意思決定に重点を置いています。
我々のモデルは0.6064のスコアを獲得し、競技の最終結果の最初の賞を確保した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:00:55 GMT)
Community detection with the Bethe-Hessian [8.9] スパースブロックモデル(SBM)におけるベーテ・ヘッセン分光法の最初の厳密な分析法を提供する。
ベーテ・ヘッセン行列の負の外れ値の数は、ケステン・スティグムしきい値より上のブロックの数を一貫して推定できることが示される。
また、その外周負固有値の位置の濃度を定め、ベーテ・ヘッセン行列に基づくスペクトル法により、弱い整合性を実現することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:18:37 GMT)
GlobalDoc: A Cross-Modal Vision-Language Framework for Real-World Document Image Retrieval and Classification [8.9] 我々は、自己教師型で事前訓練されたクロスモーダルトランスフォーマーベースのアーキテクチャであるGlobalDocを紹介する。
GlobalDocは、言語と視覚表現を統合することによって、よりリッチなセマンティックな概念の学習を改善する。
適切な評価のために,Few-Shot Document Image Classification (DIC)とContent-based Document Image Retrieval (DIR)の2つの新しい文書レベル下流VDUタスクを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:18:15 GMT)
Almost Linear Decoder for Optimal Geometrically Local Quantum Codes [8.8] 距離と寸法の両方を最大化する幾何学的局所符号と、符号のエネルギー障壁を実現する方法を示す。
これにより、最適な3D幾何学的局所コードのための最初のデコーダが提供される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:15:06 GMT)
Enhanced Real-Time Threat Detection in 5G Networks: A Self-Attention RNN Autoencoder Approach for Spectral Intrusion Analysis [8.8] 本稿では,自己認識機構とリカレントニューラルネットワーク(RNN)に基づくオートエンコーダを統合する実験モデルを提案する。
本手法は, 時系列解析, プロセス・イン・フェイズ, および二次(I/Q)サンプルを用いて, ジャミング攻撃の可能性を示す不規則性を同定する。
モデルアーキテクチャは自己アテンション層で拡張され、RNNオートエンコーダの機能を拡張する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:01:15 GMT)
Quantum Communication Advantage in TFNP [8.8] 本稿では、量子SMP(同時メッセージパッシング)モデルにおける通信複雑性が古典的な双方向ランダム化モデルよりも指数関数的に小さい全探索問題を示す。
通信プロトコルを解析するために,構造-vs-ランダム性パラダイムを用いて古典的な下界を証明した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:47:11 GMT)
Blockchain-Based Multi-Path Mobile Access Point Selection for Secure 5G VANETs [8.5] このレターは、セキュアな5G車載アドホックネットワーク(VANET)のためのブロックチェーンベースのマルチパスモバイルアクセスポイント(MAP)選択戦略を提示する。
提案手法は,分散化,透過化,セキュアなMAP選択のためのブロックチェーン技術を活用し,マルチパス伝送戦略はネットワーク信頼性を高め,通信遅延を低減する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:42:24 GMT)
Adaptive Genetic Selection based Pinning Control with Asymmetric Coupling for Multi-Network Heterogeneous Vehicular Systems [8.5] 本稿では,異種マルチネットワーク車載アドホックネットワーク(VANET)のためのピンニング制御手法を提案する。
まず、単一および複数ネットワーク条件下でのピンニング制御戦略の安定性を証明し、厳密な理論基盤を確立する。
本理論に基づいて,最適ピンニングノードの選択に適した適応型遺伝的アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:49:26 GMT)
Three-dimensional fracton topological orders with boundary Toeplitz braiding [8.2] 熱力学限界におけるエキゾチック境界現象を示す3次元非流動状態のクラスについて検討する。
本稿では,(z)方向に沿って2次元ツイスト(mathbbZ_N)層を積み重ねることで形成される3次元フラクトントポロジカルオーダーのクラスに着目した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:44:03 GMT)
Improving LLM-based Unit test generation via Template-based Repair [8.2] 単体テストは個々のプログラムユニットのバグを検出するのに不可欠だが、時間と労力を消費する。
大規模言語モデル(LLM)は、顕著な推論と生成能力を示している。
本稿では,新しい単体テスト生成法であるTestARTを提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 12:57:35 GMT)
Assured Automatic Programming via Large Language Models [8.0] 我々は,その意図に適合するコードを生成しつつ,プログラマの意図を発見することを目的としている。
本研究の目的は,ユーザ意図の理解を深めることによって,プログラム,仕様,テスト間の一貫性を実現することである。
提案手法によって発見された曖昧な意図が,検証可能な自動生成プログラムの割合をいかに高めるかを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:38:39 GMT)
Facilitating Interdisciplinary Knowledge Transfer with Research Paper Recommender Systems [8.0] 我々は、科学者に新しく多様な研究論文レコメンデーションを提供することの重要性を論じる。
このアプローチは、サイロ化読解を減らし、フィルターバブルを分解し、学際的な研究を促進することを目的としている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:09:18 GMT)
AGILE: A Novel Reinforcement Learning Framework of LLM Agents [8.0] 本稿では,ユーザとの複雑な対話処理を実現するために,LLMエージェントの強化学習フレームワークを提案する。
エージェントは、リフレクション、ツールの使用、専門家の相談など、会話以外の能力を持っている。
実験の結果, PPOで訓練した7Bおよび13B LLMをベースとしたAGILEは, GPT-4エージェントより優れていた。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:42:40 GMT)
Envisioning Diversity and Inclusion for Quantum Software Engineering [7.8] 本稿では,量子ソフトウェア工学における倫理的役割,特に多様性と包摂性(D&I)について考察する。
我々は、量子技術においてより透明で公平で説明可能な未来のために、D&IをQSEに統合するという私たちのビジョンについて議論する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:17:50 GMT)
A Survey of Generative AI for Intelligent Transportation Systems: Road Transportation Perspective [7.8] 我々は、異なる生成AI技術の原則を紹介する。
我々は,ITSにおけるタスクを,交通認識,交通予測,交通シミュレーション,交通意思決定の4つのタイプに分類する。
これらの4種類のタスクにおいて、生成的AI技術が重要な問題にどのように対処するかを説明する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:07:23 GMT)
Excluding the Irrelevant: Focusing Reinforcement Learning through Continuous Action Masking [7.6] 本稿では,アクション空間を関連するアクションの状態依存集合にマッピングする3つの連続的なアクションマスキング手法を提案する。
本手法は,RLエージェントの予測可能性を高め,安全クリティカルなアプリケーションでの使用を可能にする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:06:59 GMT)
SimpleFSDP: Simpler Fully Sharded Data Parallel with torch.compile [7.5] SimpleFSDPは、PyTorchネイティブコンパイラベースのFully Sharded Data Parallel (FSDP)フレームワークである。
メンテナンスと計算性のためのシンプルな実装を持ち、完全なコンポコミュニケーショングラフトレースを可能にし、コンパイラのバックエンド最適化によるパフォーマンス向上を実現している。
また、効率的な計算通信オーバーラップのために、TorchInductorバックエンドでバケットと並べ替えを行うIRノードも備えている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:36:14 GMT)
Climate AI for Corporate Decarbonization Metrics Extraction [7.5] コーポレートデカーボライズメトリックス抽出(CAI)モデルとパイプラインについて紹介する。
本研究では, 企業公開情報からのデータキュレーション, 検証, 評価を自動化することにより, データの収集効率と精度を向上させることを実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:37:51 GMT)
Elliptical Wishart distributions: information geometry, maximum likelihood estimator, performance analysis and statistical learning [7.5] 確率推定器(MLE)を演算する2つのアルゴリズムを提案する。
The $t$-Wishart distribution, the MLE and statistics learning algorithm are evaluation。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:52:27 GMT)
MA^2: A Self-Supervised and Motion Augmenting Autoencoder for Gait-Based Automatic Disease Detection [7.5] グラウンド・リアクション・フォース(英語: Ground reaction force、GRF)は、グラウンドが物体に接触して働く力である。
GRFをベースとした自動疾患検出(ADD)が,新たな診断方法となった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:21:01 GMT)
Self-supervised Auxiliary Learning for Texture and Model-based Hybrid Robust and Fair Featuring in Face Analysis [7.5] 我々は、テクスチャベースのローカル記述子を特徴モデリングにブレンドし、効率的な顔分析を行うための補助的なタスクとして、自己教師あり学習(SSL)を探求する。
マスクオートエンコーダ(MAE)のSSLタスクを,局所パターンなどのテクスチャの特徴を再構築する補助タスクとして使用した。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 05:39:33 GMT)
Grounding Natural Language to SQL Translation with Data-Based Self-Explanations [7.5] Cycleは、エンドツーエンドの翻訳モデルのために設計されたフレームワークで、自己評価を通じて最適な出力を自律的に生成する。
主な考え方は、データ基底のNL説明を自己提供のフィードバックとして導入し、そのフィードバックを使って翻訳の正確性を検証することである。
その結果、1) サイクルで導入されたフィードバックループは既存のモデルの性能を一貫して改善することができ、特にRESDにCycleを適用することで、検証セットで82.0%(+2.6%)、テストセットベンチマークで81.6%(+3.2%)の翻訳精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:44:53 GMT)
MSTA3D: Multi-scale Twin-attention for 3D Instance Segmentation [7.4] MSTA3Dはスーパーポイントベースの3Dインスタンスセグメンテーションのための新しいフレームワークである。
マルチスケールの特徴表現を利用し、それらを効果的にキャプチャするためのツインアテンション機構を導入している。
我々の手法は最先端の3Dインスタンスセグメンテーション手法を超越している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:55:19 GMT)
Watson: A Cognitive Observability Framework for the Reasoning of Foundation Model-Powered Agents [7.4] ファウンデーションモデル(FM)は、FMベースのエージェントソフトウェア(エージェントウェア)のような複雑なソフトウェアシステムにおいて、ますます顕著な役割を担っている。
従来のソフトウェアとは異なり、エージェントは不透明なデータと暗黙の推論を使用して自律的に操作する。
このような革新的なシステムに現れた新しいタイプの要求可観測性として,認知可観測性を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:13:22 GMT)
Observation of quantum-classical transition behavior of LGI in a dissipative quantum gas [7.3] 我々は,超低温フェルミガスの非エルミート系に対して,レゲット-ガルグ不等式(LGI)を適用した。
特定の散逸しきい値を超えると、LGI違反は弱まり、量子-古典遷移(QCT)を示す。
この研究は、多体オープン量子系におけるQCTの探索にLGIを使用する上で重要なステップストーンを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:52:42 GMT)
Label Critic: Design Data Before Models [7.1] ペア比較によりラベル品質を評価できるラベル批判という自動ツールを開発した。
Best-AIラベルが十分に正確であれば(ボディ構造によって81%)、データセットのゴールドスタンダードアノテーションとして直接採用されます。
Label Criticは、1つのAIラベルのラベル品質を71.8%の精度でチェックできる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:50:47 GMT)
Explain Like I'm Five: Using LLMs to Improve PDE Surrogate Models with Text [7.1] 事前訓練されたLarge Language Models (LLM) を用いて、PDE学習に様々な既知のシステム情報を統合する。
我々のアプローチは、次のステップ予測と自動ロールアウトパフォーマンスの両方において、ベースラインモデルであるFactFormerよりも大幅に優れています。
さらなる分析により、事前学習されたLLMは、テキストを通して提供されるシステム情報量と一致した高度に構造化された潜在空間を提供することが示された。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 19:47:03 GMT)
Oja's Algorithm for Streaming Sparse PCA [7.1] Oja's Algorithm for Streaming principal Component Analysis (PCA) for $n$ data-points in a $d$ dimensional space achieves the same sin-squared error $O(r_mathsfeff/n)$ as the offline algorithm in $O(d)$ space and $O(nd)$ time。
Ojaのアルゴリズムの出力をしきい値にする単純なシングルパス手順は、$O(d)$ space と $O(nd)$ time の正則性条件下での最小誤差を達成できることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:12:37 GMT)
Low-Overhead Entangling Gates from Generalised Dehn Twists [7.1] トポロジカル符号からハイパーグラフおよび循環符号の平衡積へのデーンツイストによる論理量子ゲートの実装を一般化する。
これらの一般化されたDehnツイストは、追加のqubitオーバーヘッドと$mathcalO(d)$ Timeオーバーヘッドのない論理エンタングリングゲートを実装している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:55:46 GMT)
Multi-modal Preference Alignment Remedies Degradation of Visual Instruction Tuning on Language Models [7.1] MLLM(Multi-modal large language model)は、実運用における画像とテキストの相互変換のマルチターンクエリをサポートすることが期待されている。
現在のMLLMは、視覚的な問合せのデータセットで訓練されており、劣化に悩まされる可能性がある。
そこで本研究では,MLLMの言語能力の回復と向上を図った,細粒度アノテーションを用いた蒸留法に基づくマルチモーダルアライメントモデルを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:13:13 GMT)
An Improved Empirical Fisher Approximation for Natural Gradient Descent [7.0] 本稿では,EFの逆スケールプロジェクション問題について検討する。
損失低減の観点から,NGD法をモチベーションとした改良型経験的フィッシャー法 (iEF) を提案する。
実験により、正確な iEF をオプティマイザとして直接適用することは、強い収束と一般化をもたらすことが示されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:26:58 GMT)
Formal Logic-guided Robust Federated Learning against Poisoning Attacks [7.0] 本稿では,時系列タスクにおけるフェデレートラーニングにおける中毒攻撃の軽減を目的とした防御機構を提案する。
提案手法では,クライアントから論理的推論特性を抽出し,グローバルなプロパティを階層的に推論し,クライアントの更新を検証する。
特に、第2ベットベースラインと比較して、ベストケースシナリオでは予測誤差を93.27%削減した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:23:19 GMT)
Anatomical Foundation Models for Brain MRIs [7.0] AnatCLは、弱い対照的な学習アプローチで解剖情報を活用する脳MRIのための解剖基盤モデルである。
アプローチを検証するために,診断分類のための12の下流タスクと10の異なる臨床評価スコアの予測について検討した。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 19:44:03 GMT)
Self-supervised cross-modality learning for uncertainty-aware object detection and recognition in applications which lack pre-labelled training data [6.9] 我々は、不確実性を認識したディープニューラルネットワークが2次元RGB画像中の物体を検出し、認識し、ローカライズするためにどのように訓練されるかを示す。
本手法は,ラベル付きデータセットが一般に利用できない,多くの重要な産業タスクに適用可能である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:26:31 GMT)
SLVideo: A Sign Language Video Moment Retrieval Framework [6.8] SLVideoは手話ビデオのためのビデオモーメント検索システムである。
ビデオフレームから手と顔のサインの埋め込み表現を抽出し、その全体像をキャプチャする。
データセットには、注釈付きポルトガル手話ビデオの8時間のコレクションが使用されている。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 18:38:08 GMT)
Quantum surface effects on quantum emitters coupled to surface plasmon polariton [6.8] 金属の量子表面効果(QSE)は、表面プラズモン偏光子(SPP)に付加的な損失源をもたらす
本稿では,QSEの存在下での共通SPPに結合した量子エミッタの非マルコフ動力学について検討する。
我々は、QSEによって好まれるQE-SPP境界状態が形成される限り、QE間の散逸のない絡み合いが生成されることを発見した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:53:00 GMT)
A Machine Learning Approach for the Efficient Estimation of Ground-Level Air Temperature in Urban Areas [6.7] 都市で発生する都市ヒートアイランド(UHI)現象は、その熱応力を増大させ、より持続可能な都市を実現するための障害の1つである。
本研究では,都市域の空間的・気象的変数と街路レベルの空気温度を関連付けるために,イメージ・ツー・イメージ・ディープ・ニューラル・ネットワーク(DNN)の有用性を検討する。
街路レベルでの空気温度は、特定のユースケースに対して空間的にも時間的にも推定され、既存のよく確立された数値モデルと比較される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:05:23 GMT)
EVA-S3PC: Efficient, Verifiable, Accurate Secure Matrix Multiplication Protocol Assembly and Its Application in Regression [6.7] EVA-S3PCはFloat64計算において最大14桁の精度を達成する。
EVA-S3PCを垂直分割データに用いてトレーニングした3次元回帰モデルは、平文学習とほぼ同一の精度を実現する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:38:44 GMT)
NutriBench: A Dataset for Evaluating Large Language Models in Carbohydrate Estimation from Meal Descriptions [6.7] NutriBenchは、初めて公開された自然言語による食事記述栄養ベンチマークである。
世界の食事摂取データから生成された11,857件の食事記述から成っている。
データは人間によって検証され、炭水化物、タンパク質、脂肪、カロリーを含むマクロ栄養ラベルで注釈付けされている。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 23:15:46 GMT)
Brewing Vodka: Distilling Pure Knowledge for Lightweight Threat Detection in Audit Logs [6.6] 先進的持続脅威(APTs)は、そのステルスネスと持続性を活用して、現状の侵入検知システム(IDS)に圧力をかける、継続的な進化を続けている。
本稿では,知識蒸留フレームワーク上に構築された軽量脅威検出システムであるVodkaを提案する。
Vodkaはすべてのシナリオにおいて優れた検出精度を達成し、検出時間は現在の最先端手法よりも1.4~5.2倍高速であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:38:16 GMT)
Target Detection of Safety Protective Gear Using the Improved YOLOv5 [6.5] 本稿では, 背骨の畳み込み層にECAを組み込むことにより, 安全対策検出を向上する革新的モデルであるYOLO-EAを提案する。
YOLO-EAの有効性は、実際の鉄道建設現場の監視映像から得られたデータセットを用いて実証的に実証された。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 11:30:40 GMT)
Target Detection of Safety Protective Gear Using the Improved YOLOv5 [6.5] 本稿では, 背骨の畳み込み層にECAを組み込むことにより, 安全対策検出を向上する革新的モデルであるYOLO-EAを提案する。
YOLO-EAの有効性は、実際の鉄道建設現場の監視映像から得られたデータセットを用いて実証的に実証された。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 11:30:40 GMT)
Deterministic Exploration via Stationary Bellman Error Maximization [6.5] 探索は強化学習(RL)の重要かつ特異な側面である
本稿では,後者を安定させ,決定論的探索政策に到達するための3つの修正点を紹介する。
実験結果から,本手法は高密度かつスパースな報酬設定において,$varepsilon$-greedyよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:52:13 GMT)
Alternate Loss Functions for Classification and Robust Regression Can Improve the Accuracy of Artificial Neural Networks [6.5] 本稿では,ニューラルネットワークのトレーニング速度と最終的な精度が,ニューラルネットワークのトレーニングに使用する損失関数に大きく依存することを示す。
様々なベンチマークタスクの性能を著しく向上させる2つの新しい分類損失関数を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:03:51 GMT)
AutoSafeCoder: A Multi-Agent Framework for Securing LLM Code Generation through Static Analysis and Fuzz Testing [6.3] 既存のアプローチは、セキュアで脆弱性のないコードを生成するのに苦労するコード生成に、単一のエージェントに依存することが多い。
コード生成,脆弱性解析,セキュリティ強化にLLM駆動エージェントを活用するマルチエージェントフレームワークであるAutoSafeCoderを提案する。
私たちのコントリビューションは、コード生成中に反復的なプロセスで動的および静的なテストを統合することで、マルチエージェントコード生成の安全性を確保することに焦点を当てています。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 03:00:38 GMT)
Jailbreaking Large Language Models with Symbolic Mathematics [6.3] AI安全性の最近の進歩は、安全でないコンテンツ生成を緩和するために、大規模な言語モデル(LLM)のトレーニングと再チームの強化につながっている。
本稿では, シンボル数学におけるLLMの高度な能力を利用して, 安全機構を回避した新しいジェイルブレイク手法であるMathPromptを紹介する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 08:46:01 GMT)
SynCo: Synthetic Hard Negatives in Contrastive Learning for Better Unsupervised Visual Representations [6.2] 表現空間上で合成ハードネガティブを生成することによってモデル性能を向上させる新しい手法であるSynCoを導入する。
MoCoフレームワーク上に構築されたSynCoは,計算オーバーヘッドを最小限に抑えた,さまざまな合成ハードネガをオンザフライで生成するための6つの戦略を導入している。
我々の合成ハード・ネガティブ・ジェネレーション・アプローチは、自己教師付きコントラスト学習を通じて学習した視覚的表現を著しく向上させる。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 14:38:30 GMT)
NutriBench: A Dataset for Evaluating Large Language Models in Carbohydrate Estimation from Meal Descriptions [6.2] NutriBenchは、初めて公開された自然言語による食事記述栄養ベンチマークである。
世界の食事摂取データから生成された11,857件の食事記述から成っている。
データは人間によって検証され、炭水化物、タンパク質、脂肪、カロリーを含むマクロ栄養ラベルで注釈付けされている。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 23:15:46 GMT)
Scalable multipartite entanglement criteria for continuous variables [6.2] 本稿では,マルチモード連続変数系のあらゆる種類のマルチパーティ・エンタングルメントに対して,非常に一般的なエンタングルメント検出法を提案する。
我々の基準は、絡み合い、真の絡み合い、および他の種類の分離性をほぼ同義に検出することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:27:19 GMT)
Self Supervised Networks for Learning Latent Space Representations of Human Body Scans and Motions [6.2] 本稿では,3次元人体解析・処理の分野におけるいくつかの基本的な問題に対処するために,自己教師型ニューラルネットワークモデルを提案する。
身体形状とポーズの潜在空間表現を検索するための新しいアーキテクチャであるVariShaPEを提案する。
第二に、潜時空間の幾何学を学習するフレームワークであるMoGeNで潜時符号の推定を補完する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:59:40 GMT)
Enhancing Weakly Supervised Semantic Segmentation for Fibrosis via Controllable Image Generation [6.1] 線維性肺疾患(英: Fibrotic Lung Disease, FLD)は、肺の硬直と傷跡を特徴とする重症疾患である。
高分解能CT(HRCT)はFLDの診断とモニタリングに重要であるが、線維化は不規則で拡散パターンであり、境界が不明確である。
DiffSegは、画像レベルのアノテーションを用いてピクセルレベルの線維化セグメンテーションを生成する、新しい教師付きセマンティックセグメンテーション(WSSS)手法である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:11:26 GMT)
Evaluation of Active Feature Acquisition Methods for Time-varying Feature Settings [6.1] 機械学習の手法は、入力機能が無償で利用できると仮定することが多い。
機能性の獲得が有害な分野である医療のような領域では、機能の獲得と予測的肯定性とのバランスをとる必要がある。
能動的特徴獲得性能評価(AFAPE)の問題点について述べる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:55:11 GMT)
Mirror-Yolo: A Novel Attention Focus, Instance Segmentation and Mirror Detection Model [6.0] YOLOv4は物体検出精度と速度の点で驚くべき結果を得るが、それでもミラーの検出には失敗する。
本稿では,ミラー検出を対象とするミラー・ヨロを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:29:58 GMT)
D3: Data Diversity Design for Systematic Generalization in Visual Question Answering [6.0] 単純なタスクの多様性が、体系的な一般化を達成する上で重要な役割を担っていることを示す。
これは、多種多様な複雑なタスクを収集することは必須ではないかもしれないことを意味しており、これは入手するのにコストがかかる可能性がある。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:10:54 GMT)
DeepContext: A Context-aware, Cross-platform, and Cross-framework Tool for Performance Profiling and Analysis of Deep Learning Workloads [6.0] 本稿では,高レベルのPythonコード,ディープラーニングフレームワーク,C/C++で記述された基盤ライブラリ,GPU上で実行されるデバイスコードなど,プログラムコンテキストをリンクする新しいプロファイラであるDeepContextを紹介する。
DeepContextには、PyTorchやJAXといった主要なディープラーニングフレームワークのための粗いパフォーマンスメトリクスときめ細かいパフォーマンスメトリクスの両方が組み込まれています。
さらにDeepContextは、ユーザがホットスポットを素早く識別できる新しいGUIと、パフォーマンスメトリクスとプログラムコンテキストに基づいた潜在的な最適化をユーザに提案する革新的な自動パフォーマンスアナライザを統合している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:15:26 GMT)
Double Whammy: Stealthy Data Manipulation aided Reconstruction Attack on Graph Federated Learning [6.0] 我々はDMan4Recと呼ばれるGFLに対する最初のデータ操作支援リコンストラクション攻撃を提案する。
悪意のあるクライアントは、ローカルに収集したデータを操作して、良質なデータからグラフを盗むプライバシーを強化するために生まれました。
4つの実際のデータセットと3つのGNNモデルの実験により、DMan4RecがSOTA(State-of-the-art)攻撃性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:12:50 GMT)
A Nonparametric Approach with Marginals for Modeling Consumer Choice [5.8] 限界分布モデル(MDM)は、ランダムユーティリティモデル(RUM)における同様の特徴付けの有用性に着想を得たものである。
我々は,MDMがRUMやパラメトリックモデルと比較して,競争力と予測性能を示すことを示した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:12:52 GMT)
Corner Charge Fluctuations and Many-Body Quantum Geometry [5.8] U(1)大域対称性を持つ多体系では、部分領域の電荷ゆらぎは絡みや他の大域的性質に関する重要な洞察を示す。
この単純な式は、複合フェルミ液体を含む電荷絶縁体には不十分であることを示す。
我々は、未投射パートン状態や複合フェルミ波動関数を含む広い種類の量子ホール波動関数が境界を飽和させることを発見した。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 23:43:42 GMT)
Query-Efficient Adversarial Attack Against Vertical Federated Graph Learning [5.8] クエリ効率のよいハイブリッド逆攻撃フレームワークを提案する。
操作されたデータに基づいてシャドーモデルを確立し、サーバモデルの振る舞いをシミュレートする。
5つの実世界のベンチマーク実験により、NA2はVFGLに対する中央集権攻撃の性能を改善することが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:52:20 GMT)
A scalable generative model for dynamical system reconstruction from neuroimaging data [5.8] データ駆動推論は、観測された時系列の集合に基づく生成力学の推論であり、機械学習への関心が高まっている。
動的システム再構成(DSR)に特化した状態空間モデル(SSM)のトレーニング技術における最近の進歩は、基礎となるシステムの回復を可能にする。
本稿では,この問題を解く新しいアルゴリズムを提案し,モデル次元とフィルタ長とを比較検討する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:45:57 GMT)
Neural Networks and (Virtual) Extended Formulations [5.8] ニューラルネットワークのサイズに対する低い境界を、その代表的能力を拡張複雑性(mathrmxc(P)$)の概念にリンクすることで証明する。
通常の拡張複雑性の強力な結果は、モノトーンニューラルネットワークの下位境界に変換可能であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:12:11 GMT)
Advances in Photoacoustic Imaging Reconstruction and Quantitative Analysis for Biomedical Applications [5.8] 光音響イメージング(PAI)は、光学分解能と音響透過深さの利点を生かし、安全性の向上を図った革新的なバイオメディカルイメージングのモダリティである。
本稿では,光音響CT(PACT),光音響顕微鏡(PAM),光音響内視鏡(PAE)の3つの主要な実装を中心に,PAIの基礎原理を考察する。
PACT, PAM, PAEをまたいだ画像再構成・アーティファクト緩和のための従来の, あるいは深層学習(DL)手法の利用に関する最近の進歩を概説し, 画像品質の向上と画像プロセスの高速化に有意義な可能性を示唆している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:31:48 GMT)
Nonparametric Evaluation of Noisy ICA Solutions [5.7] ブラインドソース分離(BSS)モデルとして独立成分分析(ICA)が1980年代に導入された。
任意のガウス雑音を持つICAの正しいアルゴリズムを適応的に選択する非パラメトリックスコアを開発する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:38:30 GMT)
HyperAgent: Generalist Software Engineering Agents to Solve Coding Tasks at Scale [5.6] ソフトウェア工学(SE)タスクの幅広い領域に対処するために設計された,新しい汎用マルチエージェントシステムであるHyperAgentを紹介する。
Planner、Navigator、Code Editor、Executorの4つの特別なエージェントで構成され、HyperAgentはSEタスクのライフサイクル全体を管理する。
広範な評価を通じて、HyperAgentは様々なSEタスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 17:22:10 GMT)
Diversifying Deep Ensembles: A Saliency Map Approach for Enhanced OOD Detection, Calibration, and Accuracy [5.6] Saliency Diversified Deep Ensemble (SDDE)は、Saliency Mapを活用することで、アンサンブルメンバー間の多様性を促進する新しいアプローチである。
特に,提案手法は,CIFAR10/100や大規模画像Netデータセットを含む複数のベンチマークにおいて,最先端のOOD検出品質,キャリブレーション,精度を実現する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:41:42 GMT)
SeTAR: Out-of-Distribution Detection with Selective Low-Rank Approximation [5.6] ニューラルネットワークの安全なデプロイには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
トレーニング不要なOOD検出手法であるSeTARを提案する。
SeTARは、単純なグリーディ探索アルゴリズムを用いて、モデルの重量行列のポストホックな修正によるOOD検出を強化する。
私たちの研究は、OOD検出のためのスケーラブルで効率的なソリューションを提供し、この分野で新しい最先端を設定します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:34:40 GMT)
Testing Bell inequalities and probing quantum entanglement at CEPC [5.5] 円電子陽電子衝突型加速器(CEPC)におけるベル型不平等の量子絡み合いとテスト違反に関する研究
本研究は, ヒッグス粒子が250ドルGeVで崩壊した際のZ$ボソン対生成の高速シミュレーションに基づく。
量子絡み合いの存在は、2$sigma$信頼レベル以上で探索される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:08:09 GMT)
Exploring the Benefits of Domain-Pretraining of Generative Large Language Models for Chemistry [5.5] 我々は、科学分野におけるオフ・ザ・シェルフとより標的となる基礎モデルを活用することのトレードオフについて検討する。
本研究は, ある科学領域, 化学領域に対するドメイン内事前学習の利点を考察し, ゼロショットおよび少数ショットプロンプトを用いたオープンソースオフザシェルフモデルと比較する。
その結果、ドメイン内ベースモデルではゼロショット設定でドメイン内タスクを合理的に実行することができるだけでなく、命令の微調整によるさらなる適応は、化学固有のタスクに顕著なパフォーマンスをもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:45:10 GMT)
GD doesn't make the cut: Three ways that non-differentiability affects neural network training [5.4] 応用非微分可能関数(NGDM)と古典勾配降下関数(GD)の区別について検討する。
正規化の増加は、NGDMにおける最適解の$L_1$ノルムの増加につながることを示す。
また、ネットワークプルーニングに広く採用されている$L_1$ization-based techniqueは、期待された結果を得られないことを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:57:19 GMT)
Advantages of Neural Population Coding for Deep Learning [5.4] ニューラルネットワークの出力層に集団コードを使用する利点を示す。
まず,集団符号が入力雑音に対する頑健性を向上する合成データを用いて理論的および実験を行った。
第2に、対称オブジェクトのポーズのようなあいまいな出力を符号化するために集団符号を使用する利点を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:22:24 GMT)
Conformal Alignment: Knowing When to Trust Foundation Models with Guarantees [5.3] 放射線学レポート生成では、ビジョン言語モデルによって生成された報告は、医学的意思決定に使用する前に人間の評価と一致しなければならない。
本稿では、出力がアライメント基準を満たす単位を識別する一般的なフレームワークであるConformal Alignmentを提案する。
基本モデルやデータ分布にかかわらず、選択された単位の所定の割合がアライメント基準を満たすことが保証される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:55:24 GMT)
Density Ratio Estimation-based Bayesian Optimization with Semi-Supervised Learning [5.3] この課題を解決するために,半教師付き学習を用いた密度比推定に基づくベイズ最適化を提案する。
本手法の実証的な結果といくつかの基本手法を,未ラベルの点サンプリングと固定サイズのプールを持つ2つの異なるシナリオで示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:14:28 GMT)
Improving semi-device-independent randomness certification by entropy accumulation [5.3] 本研究では,いわゆるエントロピー累積定理を用いて,証明可能なランダム性の量を大幅に改善できることを示す。
非信頼測定による半デバイス非依存ランダムネス認証におけるこの改善を実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:58:05 GMT)
Navigating Extremes: Dynamic Sparsity in Large Output Space [5.2] 動的スパーストレーニング(DST)は、効率的なモデルを生成するための訓練後プルーニングの代替として登場した。
我々は、半構造化スパース訓練の最近の進歩を活用し、大きな出力空間を持つ分類領域にDSTを適用した。
スパース分類器から高密度テキストエンコーダへの勾配流は、優れた入力表現の学習を困難にしている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:19:29 GMT)
Pre-trained Mixed Integer Optimization through Multi-variable Cardinality Branching [5.2] オンライン混合整数プログラム(MIP)をオフラインデータセットと機械学習モデルで高速化する事前学習混合最適化フレームワーク(PreMIO)を提案する。
本手法は, 濃度不等式から選択した超平面を用いて, 実現可能な領域を分割するデータ駆動型多変量基数分岐法に基づく。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:46:50 GMT)
Practical, optimal preparation of general quantum state with exponentially improved robustness [5.1] 本研究では,従来の手法をバケット・ブリガド方式で克服する。
本手法は,線形Clifford$+T$回路深さ,ゲート数数,時空間割り当てを同時に実現した最初の手法である。
これらの進歩は、短期的およびフォールトトレラントな量子デバイスの両方でビッグデータを処理する機会を提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:48:00 GMT)
ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities [5.0] ForecastBenchは、機械学習システムの精度を評価するためのベンチマークである。
ForecastBenchは、既知の回答がない将来のイベントに関する質問のみで構成されている。
私たちはwww.forecastbench.orgの公開リーダーボードにシステムと人間のスコアを表示します。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 12:10:51 GMT)
Evaluating the Ability of Large Language Models to Generate Verifiable Specifications in VeriFast [5.0] 大規模言語モデル(LLM)は、多くのソフトウェアエンジニアリング活動において有望であることを示している。
本稿では,分離論理に基づく仕様生成におけるOpenAIのGPTモデルの有効性について検討する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:13:13 GMT)
Leveraging generative models to characterize the failure conditions of image classifiers [5.0] 我々は、ジェネレーティブ・ディバイサル・ネットワーク(StyleGAN2)が利用できる高品質画像データの制御可能な分布を生成する能力を活用する。
フェール条件は、生成モデル潜在空間における強い性能劣化の方向として表現される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:09:12 GMT)
Explaining an image classifier with a generative model conditioned by uncertainty [5.0] 本稿では,画像分類器の不確実性により生成モデルを条件付け,その振る舞いを解析・説明するために提案する。
合成データに関する予備的な実験と、MNISTデータセットの破損したバージョンは、このアイデアを示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:07:14 GMT)
Confidence Calibration of Classifiers with Many Classes [5.0] ニューラルネットワークに基づく分類モデルでは、最大クラス確率が信頼スコアとしてしばしば使用される。
このスコアは正しい予測を行う確率を十分に予測することは滅多になく、後処理のキャリブレーションステップを必要とする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:51:01 GMT)
Digi2Real: Bridging the Realism Gap in Synthetic Data Face Recognition via Foundation Models [4.9] 本稿では,合成顔画像のリアリズム向上を目的とした,リアリズム伝達のための新しいフレームワークを提案する。
グラフィクスパイプラインの制御可能な側面とリアリズム強化技術を統合することで、我々は大量のリアルなバリエーションを生成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:09:54 GMT)
Back to the Continuous Attractor [4.9] 連続誘引器は、連続値変数を無限に長い時間間隔の連続系状態に保存するためのユニークな解のクラスを提供する。
残念なことに、連続引力は一般に深刻な構造不安定に悩まされ、それらを定義する力学則のほとんど無限小の変化によって破壊される。
理論神経科学モデルにおける連続的誘引子からの分岐は、様々な構造的に安定な形態を示す。
持続多様体理論に基づいて、連続的誘引子の分岐と近似との共通性を説明する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 08:42:03 GMT)
Understanding Transformers via N-gram Statistics [4.7] トランスフォーマーをベースとした大言語モデル(LLM)は言語に非常に熟練しているが、その動作の正確な理解はいまだに解明されていない。
本稿では, 単純なN-gram統計値から得られる関数の族を考えることにより, この方向への第一歩を踏み出す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 10:24:42 GMT)
Novelty-focused R&D landscaping using transformer and local outlier factor [4.7] 本研究では,R&Dランドスケープの構築とナビゲートのための体系的なアプローチを提案する。
研究提案の意味は、さらに訓練されたトランスフォーマーで捉えられる。
韓国のエネルギー資源セクターにおける研究提案を事例として考察する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:12:22 GMT)
Aligning Model Properties via Conformal Risk Control [4.7] トレーニング後のアライメントは、人間のフィードバックによって約束されるが、しばしば生成AI設定に限定される。
数値的あるいは分類的な出力を持つ従来の非生成的設定では、単一サンプル出力による誤調整を検出することは依然として困難である。
プロパティテストを通じてモデルアライメントを解釈し、アライメントモデル $f$ を関数のサブセット $mathcalP$ に属するものとして定義する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:17:54 GMT)
Lost in Context: The Influence of Context on Feature Attribution Methods for Object Recognition [4.7] 本研究では,文脈操作がモデル精度と特徴属性の両方にどのように影響するかを検討する。
我々は、オブジェクト認識タスクにおけるコンテキストに基づくディープニューラルネットワークの信頼度を解明するために、様々な特徴属性技術を用いている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:13:01 GMT)
Multimodal Super-Resolution: Discovering hidden physics and its application to fusion plasmas [4.6] 多空間物理スケールと多時間物理スケールが支配する非線形システムは、単一の診断では完全には理解できない。
この問題に対処するための機械学習手法を導入する。
我々は、他の診断技術を用いて超解像データを生成し、これまで観測できなかった摂動に対する詳細な構造変化と応答を捉える。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:17:06 GMT)
The Unreasonable Effectiveness of LLMs for Query Optimization [4.5] クエリテキストの埋め込みには,クエリ最適化に有用な意味情報が含まれていることを示す。
少数の組込みクエリベクタで訓練された代替クエリプラン間の単純なバイナリが既存のシステムより優れていることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:10:00 GMT)
PersianRAG: A Retrieval-Augmented Generation System for Persian Language [4.5] Retrieval augmented generation (RAG) モデルは、大規模な事前訓練された生成モデルと外部検索機構を統合している。
これらの課題は、主に前処理、埋め込み、検索、迅速な構築、言語モデリング、システムの応答評価を含む。
これらの障害を克服する新しい解決策を提案し、ペルシャのベンチマークデータセットを用いて我々のアプローチを評価する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:11:17 GMT)
Enhancing Maritime Situational Awareness through End-to-End Onboard Raw Data Analysis [4.4] 本研究は、小型衛星の厳密な帯域幅、エネルギー、遅延制約に対処する枠組みを提案する。
衛星画像からの船舶の直接検出・分類における深層学習手法の適用について検討した。
本手法は,車載処理チェーンの簡素化により,キャリブレーションや整形などの計算集約的なステップを必要とせず,直接解析を容易にする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:38:42 GMT)
Reinforcement Learning with Lie Group Orientations for Robotics [4.3] 配向のリー群構造に固執するネットワークの入力と出力の簡単な修正を提案する。
その結果,既存の学習ライブラリで直接使用可能な,簡単かつ効率的な実装が得られた。
ロボット工学におけるオリエンテーションのためのLie理論を簡潔に紹介し、我々のアプローチを動機づけ、概説する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 14:23:27 GMT)
Deep Priors for Video Quality Prediction [4.3] 本研究では,1枚の歪みビデオと1枚の参照ビデオを用いて,先行した深度ビデオの学習を行った。
歪んだビデオから元の映像を復元する前、深層ビデオの学習能力を測定し、ビデオの歪みを定量化する。
我々のアルゴリズムは単一のビデオペアを使って訓練されており、ラベル付きデータを必要としない。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:21:26 GMT)
The Future of Intelligent Healthcare: A Systematic Analysis and Discussion on the Integration and Impact of Robots Using Large Language Models for Healthcare [4.3] 医療ロボティクスにおける大規模言語モデル(LLM)は、高齢化と医療専門家の不足に対する医療システムに対する大きな需要に対応するのに役立つ。
我々は、人間ロボットのインタラクション(HRI)、意味推論、タスクプランニングによるマルチモーダルコミュニケーションの観点から、健康的なLLMベースのロボットを設計するために必要なシステム要件を特定した。
さらに,この新興イノベーション分野の倫理的問題,オープン課題,今後の研究方向性についても論じる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:36:32 GMT)
Privacy-Preserving Graph-Based Machine Learning with Fully Homomorphic Encryption for Collaborative Anti-Money Laundering [4.2] 本研究では、協調機械学習のための新しいプライバシー保護手法を提案する。
プライバシと規制の遵守を維持しながら、機関や国境を越えたセキュアなデータ共有を容易にする。
この研究は2つの重要なプライバシー保護パイプラインに貢献している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:13:53 GMT)
AutoCheck: Automatically Identifying Variables for Checkpointing by Data Dependency Analysis [4.2] C/Rのチェックポイントに重要な変数を自動的に識別できる解析モデルとツール(AutoCheck)を提案する。
AutoCheckを使うと、プログラマは重要な変数を数分間で素早くチェックポイントできる。
我々はAutoCheckを14の代表的なHPCベンチマークで評価し、チェックポイントに対する正確なクリティカル変数を効率的に識別できることを実証した。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 08:57:11 GMT)
Foundation AI Model for Medical Image Segmentation [4.1] ファウンデーションモデルは万能、一対一、一対一のソリューションを提供する。
医療画像のセグメンテーションでは、これら1対多または1対全の基礎モデルの必要性が高まっている。
医用画像セグメンテーションの基礎モデルを実現するための2つの経路について論じる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:31:49 GMT)
Obelia: Scaling DAG-Based Blockchains to Hundreds of Validators [4.1] ObeliaはDAGベースのコンセンサスプロトコルを改良し、エビデンス・オブ・テイクシステムで使用される。
我々はObeliaがオリジナルのプロトコルに比べて可視的オーバーヘッドを導入していないことを示す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 20:19:48 GMT)
Learning to Unify Audio, Visual and Text for Audio-Enhanced Multilingual Visual Answer Localization [4.1] MVAL(Multilingual Visual Answer Localization)の目的は、与えられた多言語質問に答えるビデオセグメントを見つけることである。
既存の手法は、視覚的モダリティのみに焦点を当てるか、視覚的モダリティとサブタイトルのモダリティを統合する。
本稿では,音声モダリティを組み込んで視覚的・テキスト的表現を増強するAVTSL法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:49:14 GMT)
Pedestrian Volume Prediction Using a Diffusion Convolutional Gated Recurrent Unit Model [4.1] 本研究では,Deffusion Convolutional Grated Recurrent Unit(DCGRU)の拡張として,Deffusion Convolutional Grated Recurrent Unit(DCGRU)の拡張モデルを提案する。
提案手法は,従来のベクトル自己回帰モデルと元のDCGRUとを,複数のモデル精度指標で比較した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:40:43 GMT)
GeMID: Generalizable Models for IoT Device Identification [4.0] デバイス識別(DI)は、そのトラフィックパターンに基づいてIoTデバイスを識別する。
機械学習モデルを構築する既存のDIアプローチは、様々なネットワーク環境におけるモデル一般化可能性の課題を見落としていることが多い。
本稿では,この制限に対処する新しいフレームワークを提案し,異なるネットワーク環境において収集されたデータセット間のDIモデルの一般化性を評価する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:09:43 GMT)
Unleashing the power of novel conditional generative approaches for new materials discovery [4.0] 結晶構造設計問題に対する2つの生成的アプローチを提案する。
1つは条件付き構造変化であり、最もエネルギー的に好ましい構造と全てのより安定なポリモルフィックの間のエネルギー差を利用する。
もう1つは条件付き構造の生成であり、最もエネルギー的に好ましい構造と、その全てのより安定したポリモルフィックの間のエネルギー差を利用する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:58:31 GMT)
Convergence of Decentralized Actor-Critic Algorithm in General-sum Markov Games [3.9] 一般的なマルコフゲームにおける学習アルゴリズムの特性について検討する。
特に,各エージェントがアクター批判学習を動的に採用する分散アルゴリズムに着目した。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:18:37 GMT)
P-MOSS: Learned Scheduling For Indexes Over NUMA Servers Using Low-Level Hardware Statistics [3.7] 本稿では,クエリ実行を論理コアにスケジュールする空間スケジューリングフレームワークであるP-MOSSを紹介する。
P-MOSSはクエリスループットの点で従来のスケジュールよりも最大6倍改善されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:23:27 GMT)
HumanVLM: Foundation for Human-Scene Vision-Language Model [3.6] ヒューマンシーンの視覚言語タスクは、多様な社会アプリケーションでますます普及している。
本研究では,HumanVLM(HumanVLM)というドメイン固有な大規模視覚言語モデルを提案する。
実験では, 様々な下流タスクにまたがってヒューマンVLMを評価し, 総合的な性能が向上することを示した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:14:57 GMT)
ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal [3.6] 本稿では境界領域選択走査と呼ばれる新しい選択的走査法を提案する。
私たちのモデルであるShadowMambaは、シャドウ除去のための最初のMambaベースのモデルです。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:59:06 GMT)
Establishing Causal Relationship Between Whole Slide Image Predictions and Diagnostic Evidence Subregions in Deep Learning [3.6] Causal Inference Multiple Instance Learning (CI-MIL)は、サブイメージの認識の混乱を軽減するために配布外一般化を利用する。
CI-MILは、その選択された領域が基底真理アノテーションと高い一貫性を示すため、優れた解釈可能性を示す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 02:57:31 GMT)
Testing Generalizability in Causal Inference [3.5] 機械学習アルゴリズムの一般化性を統計的に評価するための公式な手続きは存在しない。
本稿では,因果推論設定におけるモデル一般化可能性を評価するための体系的かつ定量的なフレームワークを提案する。
実データに基づくシミュレーションにより,本手法はより現実的な評価を確実にする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:44:00 GMT)
Kernel Approximation using Analog In-Memory Computing [3.5] カーネル関数は、いくつかの機械学習アルゴリズムの重要な要素であるが、しばしば大きなメモリと計算コストを発生させる。
本稿では,混合信号アナログメモリ・コンピューティング(AIMC)アーキテクチャに適した機械学習アルゴリズムにおけるカーネル近似手法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:18:47 GMT)
JEL: Applying End-to-End Neural Entity Linking in JPMorgan Chase [3.4] 本稿では、最小限のコンテキスト情報とマージン損失を利用してエンティティ埋め込みを生成する、新しいエンドツーエンドニューラルネットワークリンクモデル(JEL)を提案する。
我々は、JELが金融ニュースの企業名と知識グラフのエンティティをリンクすることで、最先端のパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:46:25 GMT)
Expressivity of deterministic quantum computation with one qubit [3.4] 量子機械学習モデルとしてパラメータ化DQC1を導入する。
DQC1は普遍計算に基づく量子ニューラルネットワークと同じくらい強力であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:46:27 GMT)
DM4Steal: Diffusion Model For Link Stealing Attack On Graph Neural Networks [3.3] これまでの研究によると、悪意のあるユーザは補助的な知識を利用して、ターゲットグラフのセンシティブなリンクデータを抽出することができた。
これはレコメンデーションシステムで使用されるデータの完全性と機密性に重大なリスクをもたらす。
本稿では,拡散モデルに基づくリンク盗難攻撃,DM4Stealを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:54:38 GMT)
Solving stochastic partial differential equations using neural networks in the Wiener chaos expansion [3.3] 我々は,対応する解のウィナーカオス展開における(おそらくランダムな)ニューラルネットワークを用いて,偏微分方程式(SPDE)を数値的に解く。
加法雑音および/または乗法雑音によるSPDEの解を学習するための近似レートを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:11:25 GMT)
Personal Data Protection in AI-Native 6G Systems [3.3] 我々は,AI駆動型6Gネットワークに関連する主要なデータ保護リスクについて検討し,複雑なデータフローと処理活動に注目した。
本研究は,6G標準の開発において,プライバシ・バイ・デザインとプライバシ・バイ・デフォルトの原則を組み込むことの必要性を強調した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:35:04 GMT)
SPINEX_ Symbolic Regression: Similarity-based Symbolic Regression with Explainable Neighbors Exploration [3.2] 本稿では,SPINEX(Similarity-based Predictions with Explainable Neighbors Exploration)ファミリに基づく新しいシンボリック回帰アルゴリズムを提案する。
精度と構造的類似度を満足する高マート表現を識別するために、類似性に基づくアプローチを採用する。
一貫してパフォーマンスが良く、場合によってはリードアルゴリズムよりも優れています。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:09:29 GMT)
Rethinking Decoders for Transformer-based Semantic Segmentation: Compression is All You Need [3.2] セマンティックセグメンテーションと圧縮の間には根本的な関係があることを論じる。
PrIncipled SemantiC SegemenTation(DEPICT)のためのホワイトボックス完全注意型Decoderを考案した。
ADE20Kで行った実験では、DEPICTはブラックボックスであるSegmenterよりも一貫して優れていた。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:10:02 GMT)
Asynchronous Perception Machine For Efficient Test-Time-Training [3.2] テスト時間トレーニング(TTT)のための計算効率の良いアーキテクチャである非同期知覚機械(APM)を提案する。
APMは、任意の順序で画像のパッチを一度に処理でき、ネット内のセマンティック・アウェアネスをコード化することができる。
我々は、データセット固有の事前トレーニング、拡張、あるいは任意のプレテキストタスクなしで、APMが配布外画像を認識する能力を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:18:23 GMT)
Transformer-Based Fault-Tolerant Control for Fixed-Wing UAVs Using Knowledge Distillation and In-Context Adaptation [3.1] 本研究では, 固定翼無人航空機(UAV)の耐故障性制御のための変圧器を用いたアプローチを提案する。
提案手法は,変換器の学習機構と注意機構を用いて,外部ループ参照値を制御コマンドに直接マッピングする。
実験結果から, トランスフォーマーをベースとした制御器は, 業界標準SFSおよび最先端強化学習法(RL)よりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:24:45 GMT)
Distributed Quantum Advantage for Local Problems [3.1] 分散コンピューティングの古典的ランダム化LOCALモデルと,その量子的モデルとの超コンスタントな分離を示す。
本稿では,局所的制約のみを用いて定義した反復GHZ問題を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:38:49 GMT)
Robust self-testing for nonlocal games with robust game algebras [3.1] 量子相関 p がロバストな自己テストであることは、すべての(抽象的な)状態の中で p を達成する唯一のものであることを示している。
自己検定は、関連するゲーム代数上の有限次元の軌跡状態の特異性と同値であることを示す。
この自己検定を並列反復に応用することにより、同期ゲームが完全量子戦略の自己検定であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:55:39 GMT)
Generalization and Risk Bounds for Recurrent Neural Networks [3.1] 我々は,バニラRNNに対する新しい一般化誤差を確立する。
我々は、様々な損失関数に適用可能なRademacher複雑性を計算する統一的なフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:49:06 GMT)
Quantum Optimal Control Theory for the Shaping of Flying Qubits [3.1] 我々は、フライングキュービットの整形に量子最適制御理論を導入する。
数値シミュレーションにより、最適化された制御は、望ましくないレベルと光子漏れを効果的に軽減できることを示した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:53:18 GMT)
Utilizing Precise and Complete Code Context to Guide LLM in Automatic False Positive Mitigation [3.1] アプリケーションセキュリティテスト(SAST)ツールは、早期のバグ検出とコード品質には不可欠だが、しばしば開発を遅くする偽陽性を生成する。
自然言語とコードの理解に長けている大規模言語モデルは、SASTツールの正確性とユーザビリティを改善するための有望な方法を提供する。
我々の研究は、正確なコードコンテキストと完全なコードコンテキストの重大な影響を強調し、プログラム分析とLLMを組み合わせる可能性を強調します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:24:56 GMT)
Trainability Enhancement of Parameterized Quantum Circuits via Reduced-Domain Parameter Initialization [3.0] 回路深さの平方根に比例する各パラメータの初期領域を減少させることで、コスト勾配の最大値は、キュービット数と回路深さにほぼ逆向きに減衰することを示す。
この戦略は、特定の量子ニューラルネットワークを指数関数的に多くの局所的なミニマから保護することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:38:51 GMT)
Correlating Variational Autoencoders Natively For Multi-View Imputation [3.0] 同一ソースからのマルチビューデータは、しばしば相関を示す。
これは、各データビューで訓練された別々の変分オートエンコーダ(VAE)の潜時空間間の相関で反映される。
VAEの潜在空間間の非ゼロ相関構造に先行する関節を組み込んだ多視点VAE手法が提案されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:43:37 GMT)
Efficient Hamiltonian, structure and trace distance learning of Gaussian states [2.9] 同様の設定とサンプルの複雑さで、基礎となる相互作用グラフを学習できることが示される。
その結果、連続変数系に対する量子ハミルトン学習問題の状況は、より高度な状態にあることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:07:20 GMT)
Privacy Risks of Speculative Decoding in Large Language Models [2.9] 大規模言語モデル(LLM)における投機的復号化は、投機的に複数のトークンを安価に予測し、それらを並列に検証することでトークン生成を加速する。
正誤予測の入力依存パターンを逆監視トークン生成時間とパケットサイズに漏洩させることが観察された。
悪意のある相手が3つの異なる投機的復号法で、指紋検索やプライベートユーザ入力を90%以上の精度で学習できることが示される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:03:45 GMT)
Mixed-State Topological Order under Coherent Noises [2.8] 量子ビットのY$軸付近に軸を持つランダム回転雑音下での混合状態トポロジカル秩序の顕著な安定性を見出した。
固有誤差閾値の上限はこれらの位相境界によって決定され、量子誤差補正は不可能となる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:06 GMT)
Time-Causal VAE: Robust Financial Time Series Generator [2.8] 金融時系列データのロバストな生成のための時空間変分自動エンコーダ(TC-VAE)を構築した。
提案手法では,エンコーダとデコーダネットワークに因果制約を課し,実市場時系列から偽生成時系列への因果輸送を確保する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:44:15 GMT)
JPEC: A Novel Graph Neural Network for Competitor Retrieval in Financial Knowledge Graphs [2.8] 本研究では,財務知識グラフから競合相手を識別するためのグラフ埋め込みの応用について検討する。
グラフニューラルネットワークを用いた新しいグラフ埋め込みモデルJPEC(JPMorgan Proximity Embedding for Competitor Detection)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:39:22 GMT)
Federated Unlearning: A Survey on Methods, Design Guidelines, and Evaluation Metrics [2.7] フェデレートアンラーニング(FU)アルゴリズムは、完全なモデルの再トレーニングなしに、クライアントのコントリビューションを効率的に除去する。
本稿では、背景概念、実証的証拠、効率的なFUスキームの設計・実装に関する実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:47:50 GMT)
Kernel Orthogonality does not necessarily imply a Decrease in Feature Map Redundancy in CNNs: Convolutional Similarity Minimization [2.7] 畳み込みニューラルネットワーク(CNN)は、ディープラーニングで広く使われている。
CNNは特徴マップの冗長性に悩まされ、非効率なキャパシティ利用に繋がる。
CNNの入力とは無関係に特徴マップの類似性を低減させる効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:18:57 GMT)
Out-of-Distribution Recovery with Object-Centric Keypoint Inverse Policy For Visuomotor Imitation Learning [2.7] 本稿では,ビジュモータ政策学習におけるアウト・オブ・ディストリビューションシナリオの課題を解決するために,オブジェクト中心のリカバリポリシフレームワークを提案する。
シミュレーションおよび実ロボット実験において,本フレームワークの有効性を実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:41:14 GMT)
Rational Extension of Anisotropic Harmonic Oscillator Potentials in Higher Dimensions [2.6] 本稿では,量子異方性振動子(QAHO)の多次元における一階超対称有理的拡張について述べる。
厳密な解は例外的であり、合理的に拡張されたポテンシャルは従来のQAHOと等射的である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:53:57 GMT)
Quantum Cryptography and Meta-Complexity [2.6] 古典暗号では、ワンウェイ関数(OWF)は最小の仮定であるが、量子暗号ではそうではない。
片方向パズル(OWPuzzs)がGapKが弱量子平均ハードである場合にのみ存在することを示す。
また、量子PRGが存在する場合、GapKは量子平均ハードであることを示す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 11:43:32 GMT)
Synthetic SQL Column Descriptions and Their Impact on Text-to-SQL Performance [2.6] 本稿では,データベース列の詳細な自然言語記述を自動的に生成する大規模言語モデル(LLM)について検討する。
BIRD-Benchベンチマークに基づいて列記述のデータセットを作成し、その列記述を手作業で修正し、列の難易度を分類する。
このような列記述を組み込むことで、特に大規模モデルではテキストと混合モデルの性能が向上する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 10:32:36 GMT)
Synthetic SQL Column Descriptions and Their Impact on Text-to-SQL Performance [2.6] 大規模言語モデル(LLM)はデータベース列の詳細な自然言語記述を自動的に生成する。
BIRD-Benchベンチマークに基づく記述のデータセットを作成し、列記述を手作業で修正し、列の難易度を分類する。
モデルは、固有のあいまいさを持つ列と苦労し、手動のエキスパートインプットの必要性を強調します。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 10:32:36 GMT)
SPACE: SPAtial-aware Consistency rEgularization for anomaly detection in Industrial applications [2.5] 本研究では,特徴量(FE)を学生教師法の構造に組み込んだ新しい異常検出手法を提案する。
提案手法は空間整合正則化損失(SCL)と特徴変換モジュール(FM)の2つの重要な要素を有する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:35:46 GMT)
Privacy of the last iterate in cyclically-sampled DP-SGD on nonconvex composite losses [2.5] 微分プライベート勾配(DP-SGD)は、微分プライベートモデルパラメータの列を生成するために反復する反復機械学習アルゴリズムのファミリーである。
最終段階の会計は困難であり、既存の作業はほとんどの実装で満たされていない強い仮定を必要とする。
損失関数の小さなステップサイズとリプシッツ滑らかさの現実的な仮定の下で、最後のイテレーションに対して新しいRenyi差分プライバシー(R)上限を提供する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 15:00:24 GMT)
Your copula is a classifier in disguise: classification-based copula density estimation [2.5] 本稿では,コプラ密度推定を識別タスクとして再解釈する。
我々は、よく知られたコプラクラスと、我々の解釈に自然に生じる分類問題との同値性を導出する。
推定器が最大推定値に類似した理論的保証を達成することを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:25:34 GMT)
Scaling Laws with Hidden Structure [2.5] 近年の進歩は、テキストと画像データがそのような隠された構造を含んでいることを示唆しており、次元の呪いを和らげるのに役立つ。
本稿では,ニューラルネットワークが実際にそのような隠された因子構造を活用できるかどうかを検証するための制御された実験枠組みを提案する。
これらの潜在パターンを利用して離散分布をより効率的に学習し、モデルサイズ、隠れ分解、精度をリンクするスケーリング法則を導出することを発見した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:57:44 GMT)
Domain Adaptation for Offline Reinforcement Learning with Limited Samples [2.4] オフライン強化学習は、静的ターゲットデータセットから効果的なポリシーを学ぶ。
最先端(SOTA)のオフラインRLアルゴリズムが有望であるにもかかわらず、ターゲットデータセットの品質に強く依存している。
本稿では,各データセットに割り当てられた重みがオフラインRLの性能に与える影響を理論的・実験的に検討した最初のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 21:28:34 GMT)
BOston Neonatal Brain Injury Data for Hypoxic Ischemic Encephalopathy (BONBID-HIE): II. 2-year Neurocognitive Outcome and NICU Outcome [2.3] 本稿では、低酸素性虚血性脳症(BONBID-HIE)に対するボストン新生児脳損傷データセットの第2版について紹介する。
BONBID-HIEはオープンソースで総合的なMRIおよび臨床データセットであり、NICUの結果やマサチューセッツ総合病院とボストン小児病院の2年間の神経認知結果を含む237人の患者を対象とする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:17:38 GMT)
Predictive Analytics of Varieties of Potatoes [2.3] 本研究では, 育種試験におけるサツマイモクローンの選択プロセスの向上を目的とした, 機械学習アルゴリズムの適用について検討する。
本研究は, 高収率, 耐病性, 耐気候性ポテト品種を効率的に同定することの課題に対処する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:02:31 GMT)
Analyzing Poverty through Intra-Annual Time-Series: A Wavelet Transform Approach [2.3] ランドサット画像と夜間光データを用いて,年内EOデータを用いたEO-ML手法の評価を行った。
以上の結果から, 特定のNDVI特徴とマルチスペクトルデータの統合は, 貧困分析に有意義な洞察をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:59:05 GMT)
TaCOS: Task-Specific Camera Optimization with Simulation [2.3] 本稿では,特定の視覚タスクでカメラを協調設計するエンド・ツー・エンドの最適化手法を提案する。
仮想環境におけるカメラをシミュレートするために,コンピュータグラフィックス技術と物理カメラ特性を利用する。
実験により,本手法は市販の市販品よりも優れたカメラを設計できることが実証された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:21:42 GMT)
LDPM: Towards undersampled MRI reconstruction with MR-VAE and Latent Diffusion Prior [2.3] The Latent Diffusion Prior based undersampled MRI reconstruction (LDPM) method was proposed。
スケジューラモジュールを用いて、再構成したMR画像の品質と忠実度を適切に制御し、バランスをとる。
MRIタスク(MR-VAE)に適応したVAEを探索し、将来のMR関連タスクのバックボーンとして機能する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:51:59 GMT)
TRANSPOSE: Transitional Approaches for Spatially-Aware LFI Resilient FSM Encoding [2.2] 有限状態マシン(FSM)は、機密情報や特権CPU状態へのアクセスを含むシーケンシャル回路を規制する。
レーザベースのフォールトインジェクション(LFI)は、個々のフリップフロップ(FF)値を変更することで、敵がチップのセキュリティを脅かすことができるようになってきている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:18:47 GMT)
ShadowGPT: Learning to Solve Quantum Many-Body Problems from Randomized Measurements [2.2] 本稿では,量子実験から収集したランダム化測定データから学習することで,量子多体問題を解く新しい手法であるShadowGPTを提案する。
このモデルは量子ハミルトニアンの基底状態のシミュレーションされた古典的影データに基づいて訓練された生成前訓練変圧器(GPT)である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:34:03 GMT)
Exploring PCA-based feature representations of image pixels via CNN to enhance food image segmentation [2.2] 本稿では、畳み込みニューラルネットワーク(CNN)を用いて、PCAに基づく画像画素の特徴表現を探索し、セグメンテーションを強化する手法を提案する。
シルエットスコアに基づく内部クラスタリング指標を定義し,様々な画素レベルの特徴表現のクラスタリング品質を評価する。
提案手法は食材ラベル付きデータセットFoodSeg103で良好に動作し、平均mIoUスコアが0.5423である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:59:41 GMT)
Revisiting holographic codes with fractal-like boundary erasures [2.2] より高次元において,$AdS_d+1/CFT_d$における無限ストリップの復元ウェッジについて検討し,それらの符号特性における「ストレート」と「無限」の役割を明らかにする。
最後に,複雑性伝達とワンショットホログラフィの観点から,ウレホログラフィーについて述べる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:53:06 GMT)
Personalized Video Summarization by Multimodal Video Understanding [2.1] 本稿では,ビデオ要約のためのVSL (Video Summarization with Language) というパイプラインを提案する。
VSLは、トレーニング済みのビジュアル言語モデル(VLM)に基づいて、大規模なトレーニングデータセット上でビデオ要約システムをトレーニングする必要がない。
提案手法は,教師付きクエリに基づくビデオ要約モデルと比較して,異なるデータセットに対してより適応可能であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:14:35 GMT)
MetRex: A Benchmark for Verilog Code Metric Reasoning Using LLMs [2.1] 大規模言語モデル(LLM)は、Verilogコード生成、EDAツールスクリプティング、RTLバグ修正など、様々なハードウェア設計タスクに適用されている。
本稿では,LLMがVerilog設計の合成後メトリクスを推論する能力を評価する。
MetRexは25,868のVerilog HDL設計とそれに対応する合成後測定値(面積,遅延,静的パワー)からなる大規模データセットである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:52:58 GMT)
Carbon price fluctuation prediction using blockchain information A new hybrid machine learning approach [2.0] 本研究では,DILated Convolutional Neural Networks (CNN) とLong Short-Term Memory (LSTM) ニューラルネットワークアルゴリズムを統合する。
正規化としての標準罰として、L2正則化としてのリッジ回帰(RR)は、価格予測におけるL1正則化としてSCAD(Smoothly Clipped Absolute Deviation Penalty)よりも優れている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:12:17 GMT)
Mapping Africa Settlements: High Resolution Urban and Rural Map by Deep Learning and Satellite Imagery [2.0] 本研究では, 深層学習と衛星画像を用いた高分解能都市域マップの構築について述べる。
我々は、Landsat-8とESRI LULCデータセットの衛星画像に基づいて、DeepLabV3アーキテクチャに基づくディープラーニングモデルを開発した。
我々は,2016年から2022年にかけての大陸広域都市農村地図を公表した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:24:59 GMT)
DAAL: Density-Aware Adaptive Line Margin Loss for Multi-Modal Deep Metric Learning [1.9] 本稿では,DAAL(Dedentity-Aware Adaptive Margin Loss)と呼ばれる新しい損失関数を提案する。
DAALは、各クラス内の適応サブクラスタの形成を奨励しながら、埋め込みの密度分布を保存する。
ベンチマークによるきめ細かいデータセットの実験は、DAALの優れた性能を示している。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 18:44:55 GMT)
ChatGPT in Research and Education: Exploring Benefits and Threats [1.9] ChatGPTはOpenAIが開発した強力な言語モデルである。
パーソナライズされたフィードバックを提供し、アクセシビリティを高め、対話的な会話を可能にし、授業の準備と評価を支援し、複雑な科目を教えるための新しい方法を導入する。
ChatGPTは従来の教育や研究システムにも挑戦している。
これらの課題には、オンライン試験の不正行為のリスク、学術的完全性を損なう可能性のある人間のようなテキストの生成、AIによって生成された情報の信頼性を評価することの難しさなどが含まれる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:29:00 GMT)
Evaluating Fine-Tuning Efficiency of Human-Inspired Learning Strategies in Medical Question Answering [1.9] 本研究では,4つの言語モデル,3つのデータセット,および人間とLLMを併用したデータを用いた5つの人為的戦略の微調整効率を評価する。
ストラテジーは、データセット全体で1.81%、平均1.02%の精度向上を達成する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 11:07:19 GMT)
PDQMA = DQMA = NEXP: QMA With Hidden Variables and Non-collapsing Measurements [1.9] 我々は、アーサーが複数の非折り畳み測定を行えるQMA(Quantum Merlin Arthur)の変種について研究する。
隠れ変数の全履歴を検査できるQMAはNEXPに等しいことを示す。
また、量子アドバイスと隠れ変数の履歴を検査する能力によって拡張された量子コンピュータが、時間内の任意の決定問題を解くことができることを観察する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:58:51 GMT)
NinjaDoH: A Censorship-Resistant Moving Target DoH Server Using Hyperscalers and IPNS [1.9] 我々は、IPNS(InterPlanetary Name System)を利用した、HTTPS(DoH)プロトコル上の新しいDNSであるNinjaDoHを紹介する。
NinjaDoHは、IPアドレスやドメインによってDoHサーバをブロックする従来の検閲方法を回避するように設計されている。
本稿では、DNSクエリのレイテンシと、このプロトコルの実装をサービスとして実行する際の費用を定量的に分析する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:34:51 GMT)
Generalizing the matching decoder for the Chamon code [1.8] チャモン符号として知られる3次元,非CSS,低密度のパリティチェックコードに対して,マッチングデコーダを実装した。
一般化された整合デコーダは、整合前に信念伝播ステップによって拡張され、偏極雑音に対するしきい値が10.5%となる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:12 GMT)
Pathway-Guided Optimization of Deep Generative Molecular Design Models for Cancer Therapy [1.8] ジャンクションツリー変動オートエンコーダ (JTVAE) は効率的な生成モデルであることが示されている。
薬物様小分子の治療効果を評価する薬理力学モデルが, 有効潜時空間最適化にどのように組み込まれているかを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:20:30 GMT)
A variational quantum algorithm for tackling multi-dimensional Poisson equations with inhomogeneous boundary conditions [1.8] 混合境界条件を持つ多次元ポアソン方程式を解くための変分量子アルゴリズムを設計する。
提案アルゴリズムを用いて半導体系における電界のバイアス依存性の空間分布を計算する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:15:05 GMT)
Language Models and Cycle Consistency for Self-Reflective Machine Translation [1.8] 我々は、ソース言語Aからターゲット言語Bへの複数の翻訳候補を生成し、その後、これらの候補を元の言語Aに翻訳する。
トークンレベルの精度や精度などの指標を用いて、原文と裏文の周期一貫性を評価することにより、言語Bの翻訳品質を暗黙的に推定する。
各原文に対して、翻訳候補を、原文と最適なサイクル整合性で同定し、最終回答とする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:01:41 GMT)
Towards Deep Active Learning in Avian Bioacoustics [1.8] アクティブラーニング(AL)は、アノテーションのコストを削減し、ラベル付けに最も有用なインスタンスをクエリすることで、さまざまなシナリオへの適応を高速化する。
本稿では、ALのアプローチを概説し、重要な課題を紹介し、小規模のパイロットスタディを実施している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:31:46 GMT)
[Vision Paper] PRObot: Enhancing Patient-Reported Outcome Measures for Diabetic Retinopathy using Chatbots and Generative AI [1.7] 糖尿病網膜症に対する患者報告結果尺度(PROM)の文脈における第1大言語モデル(LLM)の応用について概説する。
患者は、インタラクティブなアプリケーションを通じて、生活の質や治療の進捗に関するフィードバックを提供することができる。
この応用の目的は、医療システムと治療の順守を改善し、その結果、その後の視力障害のケースを減らすことである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:18:53 GMT)
Introducing Perturb-ability Score (PS) to Enhance Robustness Against Evasion Adversarial Attacks on ML-NIDS [1.7] Perturb-ability Score (PS) メトリクスは、攻撃者による問題空間での操作に影響を受けやすいNIDSの特徴を特定する。
NIDSの強化におけるPS誘導型特徴選択防御の有効性を実証する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 17:40:13 GMT)
Hierarchical Orchestra of Policies [1.7] HOPは、現在の観察と、成功したタスクでこれまで遭遇した観察との類似度基準に基づいて、ポリシーの階層を動的に形成する。
HOPはタスクラベリングを必要としないため、タスク間のバウンダリがあいまいな環境でのロバストな適応を可能にする。
本実験は,複数のタスクにまたがってプロシージャ的に生成した環境下で実施し,HOPがタスク間の知識を維持する上で,ベースライン法を著しく上回っていることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:13:09 GMT)
Accelerating Task Generalisation with Multi-Level Hierarchical Options [1.7] フラクチャクラスタオプション(FraCOs)は、難解な一般化タスクにおける最先端のパフォーマンスを達成する階層的な強化学習手法である。
いくつかの複雑な手続き的に生成された環境で、最先端の深層強化学習アルゴリズムに対してFraCOを評価した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:00:09 GMT)
Knowledge Graphs of Driving Scenes to Empower the Emerging Capabilities of Neurosymbolic AI [1.6] ニューロシンボリックAIは、知覚から認知に至るまでのタスクに対する強力なアプローチとして浮上している。
ニューロシンボリックAIタスクに適した、広く利用可能な実世界のベンチマークデータセットがない。
私たちはDSceneKGを紹介します。これは、オープンな自律運転データセットから構築された実世界の高品質なシーンから構築された、運転シーンの知識グラフのスイートです。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:15:33 GMT)
Deep learning-based modularized loading protocol for parameter estimation of Bouc-Wen class models [1.6] 本研究では,Bouc-Wenクラスモデルの最適パラメータ推定のためのモジュール化深層学習に基づくロードプロトコルを提案する。
このプロトコルは、最適なロード履歴構築とCNNに基づくラピッドパラメータ推定という、2つの重要なコンポーネントから構成される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:41:03 GMT)
CE-CoLLM: Efficient and Adaptive Large Language Models Through Cloud-Edge Collaboration [1.6] 大規模言語モデル(LLM)は、エンドユーザに人間のような知性を提供することで、驚くべき成功を収めた。
LLMは高い計算資源を必要としており、様々な性能目標を満たすためにそれらをデプロイすることは困難である。
CE-CoLLMは,エッジのエンドユーザに対して,効率的かつ適応的なLLM推論をサポートする,新しいクラウドエッジコラボレーションフレームワークである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:00:27 GMT)
Initialisation and Network Effects in Decentralised Federated Learning [1.6] 分散フェデレーション学習は、通信デバイスの分散ネットワーク上で、個々の機械学習モデルの協調トレーニングを可能にする。
このアプローチは、集中的な調整を避け、データのプライバシを高め、単一障害点のリスクを取り除く。
本稿では,基盤となる通信ネットワークの固有ベクトル集中度分布に基づく,ニューラルネットワークの非協調初期化戦略を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:27:11 GMT)
Layer-Adaptive State Pruning for Deep State Space Models [1.6] SSMのための構造化プルーニング法、Layer-Adaptive STate pruning (LAST) を提供する。
最後のスコアは、各状態のサブシステムの$mathcalH_infty$ノルムと層単位のエネルギー正規化を用いて評価される。
平均的な33%の州は、再学習せずに、0.52%の精度で性能を保ち、マルチインプットのマルチアウトプットSSMでは精度が低下することを示した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 05:50:51 GMT)
ABBA-VSM: Time Series Classification using Symbolic Representation on the Edge [1.6] 時系列分類のための適応的ブラウンブリッジを用いたアグリゲーションベクトル空間モデル(ABBA-VSM)を提案する。
ABBA-VSMは、Edge上のリソース効率の良いTSCサービスの開発において、IoTとEdgeデバイス間の通信データとシンボリックサイクルを削減する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 09:43:49 GMT)
Embedding Safety into RL: A New Take on Trust Region Methods [1.6] 強化学習(RL)エージェントは、様々なタスクを解くことができるが、安全でない振る舞いをする傾向がある。
本稿では,安全制約に基づいて政策空間の幾何学を変更する新しいアプローチとして,制約付きトラスト地域政策最適化(C-TRPO)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:55:50 GMT)
Learning to Write Rationally: How Information Is Distributed in Non-Native Speakers' Essays [1.5] 第二言語学習者によるエッセイと様々な母国語(L1)の背景を比較検討し,非母国語(L2)生産における情報の配布方法を検討した。
エントロピーレートの予備的・連続性の分析から,L2能力の高い作家は,情報的内容の伝達を継続しながら,言語生産の不確実性を低下させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 23:09:37 GMT)
Optimizing Negative Prompts for Enhanced Aesthetics and Fidelity in Text-To-Image Generation [1.4] 我々は、画像生成の高速化に向けて、負のプロンプト生成を最適化する新しい方法であるNegOptを提案する。
その結果,他の手法と比較して,インセプションスコアの25%が大幅に増加した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:11:08 GMT)
Boosting thermalization of classical and quantum many-body systems [1.4] 与えられた多体ハミルトニアンの効率的な熱状態生成は、ジャンプ作用素によって定義されるリンドブラディアンのスペクトルに依存する。
最適リンドブラディアンを構築できる体系的な枠組みを提供することにより、ハミルトニアンに対する高速な熱状態の準備が可能になる。
我々は,運動イジングモデルとリプキン・メシュコフ・グリックモデルを用いて,我々のフレームワークと最適化の可能性を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:59:29 GMT)
Solving Trojan Detection Competitions with Linear Weight Classification [1.2] 既存のデータセットやドメインの多くで驚くほどうまく機能する検出器を導入します。
我々はこのアルゴリズムを、トロイの木馬検出ベンチマークとドメインの多種多様なセットで評価する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:34 GMT)
Multiple-basis representation of quantum states [1.2] 量子状態のハイブリッドで効率的な量子古典的表現、多重基底表現について検討する。
この表現は、ある与えられた基底と異なる基底でスパースな状態の線形結合で構成され、量子回路によって規定される。
この表現が利用できる場合、すなわち、基底状態の近似、浅い回路で基底を指定してより深い計算をシミュレーションすること、および状態を多重基底表現として記述するためのトモグラフィープロトコルを見つける。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:57:57 GMT)
Equivariance and partial observations in Koopman operator theory for partial differential equations [1.1] システム力学の対称性はクープマン作用素に受け継がれることを示す。
我々は、完全な状態を測定することができない非常に関連性の高いケースに対処する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:39:38 GMT)
Leveraging Transfer Learning and Multiple Instance Learning for HER2 Automatic Scoring of H\&E Whole Slide Images [1.1] 本研究は, (i) IHC 画像, (ii) H&E 画像, (iii) 非医学的画像に基づいて事前学習した深層学習モデルの性能について, 伝達学習の可能性を検討することである。
H&E画像に予めトレーニングされた埋め込みモデルは、他のモデルよりも一貫して優れており、平均的なAUCROC値は4つのHER2スコアで0.622ドルであった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:44:48 GMT)
Interpretable Predictive Models for Healthcare via Rational Logistic Regression [1.1] 本稿では,論理ロジスティック回帰(RLR)と呼ばれる,標準ロジスティック回帰(LR)を特別に用いた新しいモデルを開発する。
RLRは理論的基盤として有理級数を持ち、時系列データに取り組み、解釈可能なパターンを学ぶ。
実世界の臨床的タスクに関する実証的な比較は、RLRの有効性を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:15:25 GMT)
Axioms for Quantum Yang-Mills Theories -- 1. Euclidean Axioms (incomplete) [1.1] 本稿では、シュウィンガー関数の概念を量子ヤン・ミルズ理論に拡張する。
ゲージ不変な共配置シュウィンガー函数の存在を仮定し、それらにのみ反射陽性を課す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:02:34 GMT)
Pseudorandom Function-like States from Common Haar Unitary [1.0] 古典的にアクセス可能な適応型セキュアPRFSGを量子ハール乱数オラクル(QHRO)モデルで構築する。
我々のPRFSG構造は、単一の置換に基づく古典的な EvenMansour 暗号に似ており、無制限のクエリに対して安全である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:48:27 GMT)
Cognitive Planning for Object Goal Navigation using Generative AI Models [1.0] 本稿では,効率的な探索戦略を生成するオブジェクトゴールナビゲーション問題を解決するための新しいフレームワークを提案する。
我々のアプローチは,Large Language Models (LLMs) とLarge Vision-Language Models (LVLMs) を活用することで,ロボットが慣れない環境をナビゲートすることを可能にする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:51:36 GMT)
The Impact of Medicaid Expansion on Medicare Quality Measures [1.0] 医療保険法は2010年に法律に署名され、メディケイドを拡大し、何百万人もの低所得アメリカ人のケアへのアクセスを改善した。
病院財政の改善は,メディケイドの拡大を選択した州において,品質対策の大幅な改善につながったという仮説を立てた。
我々の知る限り、メディケイドの拡大がメディケアの人口に与える影響は調査されていない。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:31:20 GMT)
A Natural Language Processing Approach to Support Biomedical Data Harmonization: Leveraging Large Language Models [1.0] 医学的な研究は、偏見のない結果を生み出すために、多種多様なサンプルを必要とする。
我々は,大規模言語モデル(LLM)とアンサンブル学習を活用する新しい手法を開発した。
自動変数マッチングにおけるエラーの主な原因の1つは、データ辞書内のあいまいな変数定義である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:58:31 GMT)
Automatic doubly robust inference for linear functionals via calibrated debiased machine learning [1.0] 本稿では2つの頑健な推論のためのバイアス付き機械学習推定器を提案する。
C-DML推定器は、結果回帰または線形汎函数のリース表現器が十分に推定されたときに線形性を維持する。
我々の理論的および実証的な結果は、ニュアンス関数の不一致または遅い推定によるバイアスを軽減するためにC-DMLの使用を支持する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:32:30 GMT)
An information-matching approach to optimal experimental design and active learning [0.9] 候補プールから最も情報に富むトレーニングデータを選択するために,フィッシャー情報行列に基づく情報マッチング基準を導入する。
本稿では,電力系統や水中音響など,様々な科学分野におけるモデリング問題に対するこのアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:16:23 GMT)
Benign landscape for Burer-Monteiro factorizations of MaxCut-type semidefinite programs [0.9] 低階解を持つMaxCut数値半定プログラム(SDP)を考える。
低階仮説を活用するために、標準的なアルゴリズム的アプローチはブラー・モンテイロ化係数である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:47:07 GMT)
Data needs and challenges for quantum dot devices automation [0.9] ゲート定義量子ドットはスケーラブルで結合した量子ビットシステムを実現するための有望なシステムである。
しかし、現在の量子ドットデバイスは、考慮しなければならない不完全性に悩まされている。
我々は、自動化活動に投資した研究者にガイダンスとインスピレーションを提供することを目指している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:18:45 GMT)
Exploiting the Segment Anything Model (SAM) for Lung Segmentation in Chest X-ray Images [0.8] Segment Anything Model (SAM) は、ある画像内の個々のオブジェクトを意味論的解釈によって識別し、分離するために設計された野心的なツールである。
何人かの研究者が、この領域のパフォーマンスを評価するために、このモデルを医療画像上でテストし始めた。
本研究は胸部X線画像の評価と研究にこの新技術を用いることを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:54:01 GMT)
Capturing research literature attitude towards Sustainable Development Goals: an LLM-based topic modeling approach [0.8] 持続可能な開発目標は2015年に国連によって策定され、2030年までにこれらの世界的な課題に対処した。
自然言語処理技術は、研究文献の中のSDGに関する議論を明らかにするのに役立つ。
我々は,Scopusデータベースからコンテンツを取り出し,SDGの5つのグループ専用のデータセットを作成する,完全に自動化されたパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:37:23 GMT)
Decision-focused predictions via pessimistic bilevel optimization: a computational study [0.7] 最適化パラメータの不確かさは、重要かつ長年にわたる課題である。
予測モデルを構築して,それを用いた意思決定の文言的指標を測定します。
トラクタビリティを実現するために,様々な計算手法を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:15:07 GMT)
Controlling for Unobserved Confounding with Large Language Model Classification of Patient Smoking Status [0.7] 因果理解はエビデンスベースの医療の基本的な目標である。
それまでの研究では、機械学習との未観測の相違に対処することを提案した。
本稿では,患者の喫煙状況を予測するために,臨床ノートで訓練した大規模言語モデルを用いて,この方法論を拡張した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:05:53 GMT)
Two-doublon Bloch oscillations in the mass-imbalanced extended Fermi-Hubbard model [0.7] 質量不均衡拡張Fermi-Hubbardモデルにおいて, 近接相互作用がマルチダビロンBOに与える影響について検討した。
ダビロンに対して有効なハミルトニアンを導出し、$V$のわずかな変化がそれらの動的挙動を質的に変化させることができることを示す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 06:32:03 GMT)
Investigating Student Reasoning in Method-Level Code Refactoring: A Think-Aloud Study [0.7] コードとコード品質は、ソフトウェア工学教育における中核的なトピックである。
学生は、しばしば持続的な品質問題のあるコードを生成する。
学生は大抵の場合、コード品質の問題を取り除くことができた。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:29:23 GMT)
Vulnerable Road User Detection and Safety Enhancement: A Comprehensive Survey [0.7] 脆弱な道路利用者(VRU)を含む交通事故は、世界的な道路事故のかなりの割合を占める。
高度な信号処理と機械学習技術を組み合わせた交通通信エコシステムの進歩は、多様なセンサーからのデータの活用を促進している。
本稿では,VRUの安全性を高めるための最先端技術と方法論を包括的に調査する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:24:50 GMT)
Enhancing Transformer Training Efficiency with Dynamic Dropout [0.7] 本稿では,トランスフォーマーモデルのトレーニング効率を向上させるために,新しい正規化手法であるDynamic Dropoutを紹介する。
本手法では,GPTモデルを可変ドロップアウト率を受け入れるように修正し,トレーニング中にドロップアウト層を更新する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:36:07 GMT)
Spectral Density Modulation and Universal Markovian Closure of Fermionic Environments [0.7] スペクトル密度を熱化学的に調節することで、元のフェルミオン環境をよりシンプルに、より単純なものに置き換えることができることを示す。
次に、減衰したフェルミオンモードの小さな集合からなるフェルミオンマルコフ閉包構造を導出する。
特に、マルコフ閉包を用いることで、連鎖マッピングに基づくアルゴリズムの時間的複雑さを減少させる方法について述べる。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 23:58:31 GMT)
Analysis of Internet of Things Implementation Barriers in the Cold Supply Chain: An Integrated ISM-MICMAC and DEMATEL Approach [0.7] コールドサプライチェーンにおけるIoT実装に対する重要な障壁が特定される。
IoT採用戦略の主要な要因は、“規則順守”と“コールドチェーンネットワーク”である。
この調査の結果は、業界関係者、政府、組織にIoT採用の大きな推進力を与え、これらの障壁を克服する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:23:16 GMT)
Insights into Lunar Mineralogy: An Unsupervised Approach for Clustering of the Moon Mineral Mapper (M3) spectral data [0.7] この方法は、畳み込み変分オートエンコーダを用いて、スペクトルデータの寸法を小さくする。
k平均アルゴリズムは、潜在変数を5つの異なるグループにクラスタリングし、支配的なスペクトル特徴に対応する。
結果として得られたグローバルなスペクトルクラスタマップは、月上の5つの星団の分布を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:31:16 GMT)
Fast Unconditional Reset and Leakage Reduction of a Tunable Superconducting Qubit via an Engineered Dissipative Bath [0.7] 複数の励起状態を同時にリセットする周波数可変トランスモン量子ビットの無条件リセットを示す。
88ns以内のトランスモンの第1(第2)励起状態におけるリセット誤差は0.13% (0.16%) 以下であった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:50:26 GMT)
Utilizing RNN for Real-time Cryptocurrency Price Prediction and Trading Strategy Optimization [0.6] 本研究では、リアルタイム暗号通貨価格予測と最適化取引戦略におけるリカレントニューラルネットワーク(RNN)の利用について検討する。
時系列データにおける長期パターンをキャプチャするRNNの機能を活用することにより,価格予測の精度向上と効果的な取引戦略の確立を目指す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:44:52 GMT)
SUDS: A Strategy for Unsupervised Drift Sampling [0.5] 監視された機械学習は、データ分散が時間とともに変化するコンセプトドリフトに遭遇し、パフォーマンスが低下する。
本稿では,既存のドリフト検出アルゴリズムを用いて,同種サンプルを選択する新しい手法であるドリフトサンプリング戦略(SUDS)を提案する。
本研究は, 動的環境におけるラベル付きデータ利用の最適化におけるSUDSの有効性を示すものである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:55:29 GMT)
ERUP-YOLO: Enhancing Object Detection Robustness for Adverse Weather Condition by Unified Image-Adaptive Processing [0.5] 霧や低照度などの悪天候に対する画像適応型物体検出法を提案する。
本フレームワークでは, 後段物体検出に適した画像強調を行うために, 可変プリプロセッシングフィルタを用いる。
我々は,統一画像処理(ERUP)-YOLOによる拡張ロバストネス(Enhanced Robustness)と呼ばれる提案手法をYOLOv3検出器に適用することにより評価した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:20:06 GMT)
Sampling Strategies in Bayesian Inversion: A Study of RTO and Langevin Methods [0.5] 本稿では,逆問題に対する2種類のサンプリング手法について検討する。
本稿では,2つのアプローチの主な概念的,理論的相違点を強調し,実践的な観点から比較する。
サンプリング手法の選択が再現の質に重大な影響を及ぼし,RTO法がパラメータの選択に対してより堅牢であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:53:56 GMT)
Software Design Pattern Model and Data Structure Algorithm Abilities on Microservices Architecture Design in High-tech Enterprises [0.5] 本研究では,ソフトウェア設計モデル能力とデータ構造アルゴリズム能力が企業内におけるアーキテクチャ設計に与える影響について検討する。
その結果、堅牢な設計モデルと効率的なアルゴリズムを強調した組織が、アーキテクチャにおける優れたスケーラビリティ、パフォーマンス、柔軟性を実現することが明らかになった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:26:53 GMT)
A Comparative Study on the Impact of Test-Driven Development (TDD) and Behavior-Driven Development (BDD) on Enterprise Software Delivery Effectiveness [0.5] この記事では、テスト駆動開発(TDD)と振る舞い駆動開発(BDD)が、エンタープライズ環境におけるソフトウェアデリバリの有効性に与える影響を比較します。
この結果から、各モデルがデリバリ速度、ソフトウェア品質、チームコラボレーションに与える影響が明らかになりました。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:47:11 GMT)
Shortcuts to adiabatic state transfer in time-modulated two-level non-Hermitian systems [0.4] 非エルミート系の非スペクトル的性質は、エルミート系に相反しない興味深い効果をもたらす。
時間変調された2レベル非エルミタン系において,ロバストかつ高速な断熱状態伝達を実現するためのスキームを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:23:27 GMT)
Evaluation of handwriting kinematics and pressure for differential diagnosis of Parkinson's disease [0.4] PaHaW Parkinson病手書きデータベースには、パーキンソン病(PD)患者の手書きサンプルと健康管理が含まれている。
PDの鑑別診断には手書きのキネマティックな特徴と圧力的特徴が有用である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:27:24 GMT)
First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models [0.3] 本研究では,フローチャートに関連するタスクに対して,MLLMを様々な次元にわたって評価する最初の包括的手法であるFlowCEを提案する。
GPT4oモデルでさえ56.63のスコアしか得られないことがわかった。
オープンソースモデルの中で、Phi-3-Visionは49.97という最高スコアを獲得した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:40:34 GMT)
AI Horizon Scanning -- White Paper p3395, IEEE-SA. Part III: Technology Watch: a selection of key developments, emerging technologies, and industry trends in Artificial Intelligence [0.3] 生成人工知能(AI)技術は、Chat-GPTの画期的なリリースに続く前例のない急速な開発段階にある。
AI製品の展開が幾何学的に増加するにつれて、AI技術が提供する脅威と機会にかなりの注意が向けられている。
この写本は、IEEE-SA の p3995 It Standard for implementation of Safeguards, Controls, and Preventive Techniques for Artificial Intelligence Models の開発を知らせる一連の白書の3番目のものである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:04:42 GMT)
Parameter uncertainties for imperfect surrogate models in the low-noise regime [0.3] 我々は、不特定、ほぼ決定論的シュロゲートモデルの一般化誤差を解析する。
遅れた一般化誤差を避けるために、後続分布が全ての訓練点をカバーする必要があることを示す。
これは、原子論的機械学習における1000次元データセットに適用する前に、モデル問題で実証される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:54:14 GMT)
Enhancing EmoBot: An In-Depth Analysis of User Satisfaction and Faults in an Emotion-Aware Chatbot [0.2] 研究コミュニティは伝統的に感情モデリングに強い関心を示しており、検出の側面に顕著な重点を置いている。
この研究は、現在最先端の感情的チャットボットであるEmoBotを、汎用的な会話で感情を生成するように設計されている。
この調査には、ユーザビリティ、正確性、全体的なユーザ満足度など、EmoBotの熟練度を評価する調査を含む、包括的な調査が含まれている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:03:55 GMT)
Near-Optimal and Tractable Estimation under Shift-Invariance [0.2] そのような信号のクラスは、非常にリッチである:$mathbbCn$ 上のすべての指数振動を含み、合計$s$ である。
このクラスの統計複雑性は、$(delta)$-confidence $ell$-ballの半径2乗最小マックス周波数によって測定されるが、$s$-sparse信号のクラス、すなわち$Oleft(slog(en) + log(delta-1)right) cdot log(en/s)とほぼ同じであることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:11:23 GMT)
Exploring Seasonal Variability in the Context of Neural Radiance Fields for 3D Reconstruction on Satellite Imagery [0.2] この研究は、コンピュータービジョンの新たなアプローチであるSat-NeRFが、月々の季節変動を予測するためにどのように機能するかを探求する。
そこで我々は,Sat-NeRFの拡張であるPlanet-NeRFを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:16:14 GMT)
Leveraging Large Language Models in Code Question Answering: Baselines and Issues [0.2] 本稿では,Pythonのソースコードに対する質問応答のために,大規模言語モデルを用いた研究について述べる。
提案手法は,Pythonコードの問合せと解答の統一データセット上で,大規模言語モデルを微調整することを含む。
手動エラー解析の結果とともに,BLEU-4,BERTScore F1,BLEURT,Exact Matchの測定値について報告する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 11:25:12 GMT)
Enhancement of an Unruh-DeWitt battery performance through quadratic environmental coupling [0.1] 我々は、コヒーレントな古典パルスによって駆動されるUnruh-DeWitt検出器を量子電池とみなす。
二次スカラー場結合はコヒーレンスと安定性を高めることを示す。
我々は, 脱コヒーレンスを著しく軽減し, 電池の容量と効率を著しく向上させることを観察した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:43:41 GMT)
Green Recommender Systems: Optimizing Dataset Size for Energy-Efficient Algorithm Performance [0.1] 本稿では,データセットサイズを最適化することで,エネルギー効率の高いアルゴリズムの性能向上の可能性について検討する。
MovieLens 100K, 1M, 10M, Amazon Toys and Gamesデータセットで実験を行った。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 03:45:24 GMT)
SynthSet: Generative Diffusion Model for Semantic Segmentation in Precision Agriculture [0.1] 本研究では,人間の介入なしに現実的な農業データを合成するための二重拡散モデルアーキテクチャを提案する。
合成画像の表現特性とそれに対応する生成マスクとのコヒーレンスを高めるために超解像を用いる。
その結果,セマンティックセグメンテーションタスクにおけるデータ不足に対処する手法の有効性が示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:42:23 GMT)
Correlation of Object Detection Performance with Visual Saliency and Depth Estimation [0.1] 本稿では,物体検出精度と,深度予測と視覚塩分率予測の2つの基本的な視覚的課題の相関について検討する。
分析の結果,これらの相関は対象のカテゴリ間で有意な変化を示し,相関値がより小さいオブジェクトの最大3倍も大きいことが判明した。
これらの結果から, 物体検出アーキテクチャに視覚的サリエンシ機能を組み込むことは, 深度情報よりも有益であることが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:34:19 GMT)
Aloof electron probing of in-plane SPV charge distributions on GaAs surfaces [0.1] 633nmレーザーで照射した未ドープGaAs表面によるアルーフ電子の強い偏向を報告する。
表面の太陽電池電荷からの偏向電界は、真空に100mも伸びる。
本研究は,半導体表面の2次元電荷パターンを走査レーザビームで記述する可能性を示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:29:39 GMT)
Quantum Error Mitigation via Linear-Depth Verifier Circuits [0.0] 低次元行列積演算子(MPO)によって正確に表現される量子回路の検証回路を構築する方法を提案する。
回路を2次元の量子ビット配列にトランスパイルすることにより、検証回路が回路自体よりも浅いクロスオーバー点を推定し、量子エラー軽減(QEM)に有用である。
提案手法は、コヒーレントノイズに対処するために量子サブ回路の校正に有用であるが、現在のデバイスに存在する非コヒーレントノイズを補正することができない。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:44:18 GMT)
Quantum One-Time Protection of any Randomized Algorithm [0.0] 量子ワンタイムトークン(quantum one-time token)は、あるプログラムを正確に1度評価できる量子状態である。
生成AIモデルを含む任意のランダム化された古典的プログラムに対して量子ワンタイムトークンを構築する手法を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:00:29 GMT)
Windstorm Economic Impacts on the Spanish Resilience: A Machine Learning Real-Data Approach [0.0] 本研究では,スペイン地域の風雨に関する公開データを分析し,災害の回復力を高めるためのML分類モデルを提案する。
このアプローチは、意思決定者が準備と緩和行動に関する情報的な決定を下すのに役立つ。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:26:05 GMT)
WASHtsApp -- A RAG-powered WhatsApp Chatbot for supporting rural African clean water access, sanitation and hygiene [0.0] 本稿では、クリーンウォーターアクセス、衛生、衛生(WASH)の原則に基づいて、農村アフリカのコミュニティを教育するためのWhatsAppベースのボットであるWASHtsAppを紹介する。
本論文は,デザインサイエンス研究方法論を用いた開発プロセスについて詳述する。
ローカル言語やユーザデータ分析を対象とする介入に組み込むなど、さらなる開発の可能性について議論する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:44:15 GMT)
Using Assurance Cases to Guide Verification and Validation of Research Software [0.0] 胸部画像から大動脈の3次元分画を自動的に抽出するソフトウェアをケーススタディとして,ACがVnV活性を誘導する方法を解説する。
ケーススタディでは、信頼を構築するための唯一の関心事ではなく、ソフトウェアとユーザの責任を明確に区別することが有用であることを強調している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:39:32 GMT)
Towards Entropic Constraints on Quantum Speedups [0.0] いくつかの量子アルゴリズムは「量子スピードアップ(quantum speedups)」を持ち、同じタスクを解くための最もよく知られた古典的アルゴリズムと比較して、時間複雑性を改善している。
エントロピーの観点から、これらのスピードアップに何をもたらすのか理解できますか?
情報理論は、アルゴリズムを実行する量子コンピュータの振る舞いを「量子」がいかに根本的に測定するかを測定するために、私たちが選択できる様々な指標を与えてくれる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:04 GMT)
Topological and nontopological degeneracies in generalized string-net models [0.0] 任意のユニタリ融合圏に付随する一般化文字列-ネットハミルトンのエネルギー準退化を計算する。
非可換圏に対して、これらの内積は余分な非位相退化をもたらす。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:22:04 GMT)
Three-Dimensional and Selective Displacement Sensing of a Levitated Nanoparticle via Spatial Mode Decomposition [0.0] 技術は、浮遊物体によって散乱された光の空間モード分解に依存する。
eta_mathrmtot_x, eta_mathrmtot_y, eta_mathrmtot_z) = (0.14, 0.16, 0.32)$ $> 1/9 の測定効率は、レビテーションされた光学系の3次元運動量子基底状態を可能にする。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 07:13:49 GMT)
There and Back Again: Quantum Radiation from Round-trip Flying Mirrors [0.0] ブラックホールを消去すると時空が平らになるので、星が形成される前に光が領域を通り抜ける。
ブラックホールの蒸発の後に、最初の出発点に戻るフライングミラーのように、時間がかかりません。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:55:54 GMT)
The cost of solving linear differential equations on a quantum computer: fast-forwarding to explicit resource counts [0.0] 一般線型常微分方程式に対する解を量子状態に符号化するコストの非漸近計算を初めて与える。
古典力学の大規模クラスの安定性がそれらの高速なフォワードを可能にすることを示す。
ヒストリー状態は常に任意の安定線型系に対して複雑性$O(T1/2)$で出力できる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:51:28 GMT)
The Translation of Circumlocution in Arabic Short Stories into English [0.0] この研究は、採用される翻訳戦略の適切性を評価するための枠組みとして、ニダの翻訳理論(1964年)を採用している。
その結果,アラビア割礼カテゴリーと英語のメタディスコースカテゴリーとの間に有意な類似性が認められた。
この研究は、翻訳者が周知のニュアンスを正確に伝達する困難に遭遇した事例も強調している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:59:22 GMT)
The Impact of Generative Artificial Intelligence on Ideation and the performance of Innovation Teams (Preprint) [0.0] この研究は、知識の流出、ジェネレーション、応用に対するAIの効果を理解するために、知識スパイルオーバー理論を応用している。
その結果,GenAIは神経回路の知識スパイルオーバー理論の重要な要素に肯定的な影響を与えることが明らかとなった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:59:18 GMT)
The Evolution of RWKV: Advancements in Efficient Language Modeling [0.0] 本稿では,Receptance Weighted Key Value アーキテクチャの開発をレビューし,効率的な言語モデリングの進歩を強調した。
我々は、その中核となる革新、様々な領域への適応、そして従来のモデルよりもパフォーマンス上の優位性について検討する。
深層学習における多目的アーキテクチャとしてのRWKVの課題と今後の方向性についても論じる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:10:05 GMT)
The Effect of Funding on Student Achievement: Evidence from District of Columbia, Virginia, and Maryland [0.0] 公的資金は限られているので、学生の成果を改善する最善の方法を探さなければならない。
これまでの研究では、社会経済的地位が学生の達成の最良の予測要因であることを示唆している。
施設ごとの支出と学生の業績との間に有意な関係は見つからない。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:44:28 GMT)
Synchronous manipulation of nuclear spins via boron vacancy centers in hexagonal boron nitride [0.0] 我々は、六方晶窒化ホウ素(hBN)の負電荷のホウ素空孔点欠陥を取り巻く核スピンの操作を絡める方法を開発した。
背景磁場の存在下では、$hatU_z$ と $hatU_x$ の回転で核の状態を操作することができる。
我々の研究は、将来の量子技術応用においてhBNの核スピンを利用するための基盤となる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:00:20 GMT)
Strongly interacting fermions are non-trivial yet non-glassy [0.0] 我々は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な位相に属することを示した。
この結果は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な相に属することを示唆している。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 04:09:15 GMT)
Strongly interacting fermions are non-trivial yet non-glassy [0.0] 我々は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な位相に属することを示した。
この結果は、スピンとは異なり、低温で強く相互作用するフェルミオンが古典的に非自明で量子的に容易な相に属することを示唆している。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 04:09:15 GMT)
Strong coupling of a superconducting flux qubit to single bismuth donors [0.0] 単一のビスマスドナーは、量子情報を超伝導束量子ビットにコヒーレントに転送することができる。
この超伝導装置は、そのコヒーレントな振る舞いにほとんど影響を与えずに、遠くのスピンをオンデマンドで接続することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:54:09 GMT)
Statistical Properties of Deep Neural Networks with Dependent Data [0.0] 本稿では, ディープニューラルネットワーク (DNN) 推定器の統計特性について, 従属データに基づく検討を行った。
このフレームワークは、他のDNNアーキテクチャや時系列アプリケーションの研究の可能性も提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:26:53 GMT)
State-dependent control of the motional modes of trapped ions using an integrated optical lattice [0.0] 我々は1つのイオンを用いて、定常波場の多くの期間の光ポテンシャル景観をマッピングする。
我々は、電子基底状態に対する2pitimes 76.8(5)$ kHzの素の光学ポテンシャルに対応する、2pitimes 3.33(4)$ kHzの状態依存性のトラップ周波数シフトを観測した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:55:35 GMT)
State preparation by shallow circuits using feed forward [0.0] 我々は,この4ステップ方式を用いて,フォールトトレラントな計算を行わず,短い,一定の深さの量子回路を強化する。
LAQCC回路は、一定の深さの量子回路では達成できない長距離相互作用を創出できることを示す。
我々は、任意の数の状態に対する一様重ね合わせのための3つの新しい状態準備プロトコルを作成する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:29:32 GMT)
Spontaneous Emergence of Agent Individuality through Social Interactions in LLM-Based Communities [0.0] 本稿では,Large Language Model (LLM) ベースのエージェントを用いて,ゼロからエージェントが出現することを検討する。
このマルチエージェントシミュレーションを解析することにより、社会的規範、協力、性格特性が自然に出現する方法について、貴重な新しい知見を報告する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:49:33 GMT)
Speaker Emotion Recognition: Leveraging Self-Supervised Models for Feature Extraction Using Wav2Vec2 and HuBERT [0.0] 本研究では, 自己教師型トランスフォーマーモデルであるWav2Vec2とHuBERTを用いて, 話者の感情を音声から判断する。
提案手法は、RAVDESS、SHEMO、SAVEE、AESDD、Emo-DBを含む計算可能なデータセットに基づいて評価される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:06:40 GMT)
Sparse Reconstruction of Wavefronts using an Over-Complete Phase Dictionary [0.0] 本稿では、オーバーコンプリート位相辞書を用いた新しいウェーブフロント再構成手法を提案する。
我々は、より柔軟で効率的なウェーブフロント表現を可能にします。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:47:13 GMT)
Solution of the v-representability problem on a one-dimensional torus [0.0] 環領域上の非相対論的量子多粒子系に対する v-表現可能性問題の解を提供する。
重要なことに、これは十分に定義されたコーン=シャムの手続きを可能にするが、一方で、ホヘンベルク=コーンの定理の通常の証明を無効にする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:25:04 GMT)
Single photon emitters in thin GaAsN nanowire tubes grown on Si [0.0] III-Vナノワイヤのヘテロ構造は、単一の光子と絡み合った光子の源として作用する。
シリコン(111)基板上にモノリシックに集積した薄いGaAs/GaAsN/GaAsコア多殻ナノワイヤのプラズマ支援分子線エピタキシー成長を報告する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:29:42 GMT)
Scattering wave packets of hadrons in gauge theories: Preparation on a quantum computer [0.0] 本研究では,断熱進化を回避すべく,相互作用理論におけるウェーブ・パケット生成演算子を直接構築する。
本稿では,デジタル量子アルゴリズムを用いて,相互作用するメソニック波のパケットを効率的に,正確に作成可能であることを示す。
これらの忠実度は、単純な対称性に基づくノイズ緩和手法を採用した後、古典的なベンチマーク計算とよく一致する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:20:56 GMT)
Relating Quantum Tamper-Evident Encryption to Other Cryptographic Notions [0.0] 量子タンパー・エビデント暗号スキーム(quantum tamper-evident encryption scheme)は、古典的なメッセージを量子暗号文にマッピングする非相互作用対称鍵暗号スキームである。
この量子暗号プリミティブは2003年にゴッテスマンによって初めて導入された。
我々は、情報理論的な設定で、他の暗号プリミティブと正式に関連付けることで、タンパーの明解な暗号化の理解を深める。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:20:29 GMT)
Realization of a fast triple-magic all-optical qutrit in strontium-88 [0.0] アルカリ土とアルカリ土のような原子の光学時計状態は、最先端の光学原子時計の基礎である。
特別に選択したマジックアングルにおいて、80ドルSrで2つのクロック遷移に対する同時マジックトラップを実演する。
我々の研究は、光学遷移に関する量子メトロジーや、880Srの微細構造量子ビット上の高忠実度および高コヒーレンスな操作など、いくつかの新しい方向を開拓している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:22:10 GMT)
Rainfall regression from C-band Synthetic Aperture Radar using Multi-Task Generative Adversarial Networks [0.0] 本稿では,SAR(Synthetic Aperture Radar)から1ピクセルあたり200mの空間分解能で降水速度を推定するデータ駆動手法を提案する。
完全なNEXRADアーカイブを利用して、Sentinel-1データとのコロケーションを検索する。
その結果,降雨量の推定精度が向上し,最大15m/sのシナリオに性能を拡張できることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:06:50 GMT)
Quantum optimization for Nonlinear Model Predictive Control [0.0] NMPC最適化問題の解に対する量子コンピューティング手法を提案する。
このアプローチは計算時間を著しく削減し、ソリューションの品質を向上する可能性がある。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:40:54 GMT)
Quantum many-body simulations with PauliStrings.jl [0.0] We present the Julia package PauliStrings for quantum many-body Simulations。
パウリ群上の高速な演算は、パウリ弦をバイナリで符号化することで行う。
この表現は任意の幾何を容易に符号化できることを示す。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 19:00:32 GMT)
Quantum channels that destroy negative conditional entropy [0.0] 本稿では、負条件エントロピー破壊チャネル(NCEB)を強調し、負条件エントロピー消滅チャネル(NCEA)を導入する量子チャネルを深く掘り下げる。
我々はこれらのチャネルをトポロジカルと情報理論の両方の観点から特徴付け、直列とNCEBを並列に組み合わせた際の特性について検討する。
我々は、条件エントロピーの負性性を損なわないチャネルを検知し、この量子資源の保存を保証するために処方薬を配置する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:26:08 GMT)
Photon-number moments and cumulants of Gaussian states [0.0] 光子数に基づいてガウス状態のモーメントと累積表現を開発する。
我々は光子数モーメントと累積の計算が#Pハードであることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:38:44 GMT)
Parametric instability in a magnomechanical system [0.0] 量子揺らぎは臨界速度閾値より上のスピン電流を発生させるが、低温ではこの閾値以下でスピン電流は発生しない。
この強化された振る舞いは、マグノンベースの量子技術において、高感度の測定と効率的なスピン電流発生をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:44:09 GMT)
PV-faultNet: Optimized CNN Architecture to detect defects resulting efficient PV production [0.0] 本研究では,太陽光発電(PV)セルの高効率かつリアルタイムな欠陥検出に最適化された,軽量な畳み込みニューラルネットワーク(CNN)アーキテクチャであるPV-faultNetを提案する。
このモデルにはわずか292万のパラメータが含まれており、精度を犠牲にすることなく処理要求を大幅に削減している。
91%の精度、89%のリコール、90%のF1スコアを達成し、PV生産におけるスケーラブルな品質管理の有効性を実証した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:58:37 GMT)
Orientation-Dependent Enhanced Ionization in Acetylene Revealed by Ultrafast Cross-Polarized Pulse Pairs [0.0] 強い6-fsのパルス対を持つアセチレンの分子動力学を探索する。
どちらも多重イオン化収率の増大に寄与する2つの異なる経路を見いだす。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:15:08 GMT)
Optimizing quantum measurements by partitioning multisets of observables [0.0] 測定回数を最小化するために、必要な繰り返しを考慮して観測可能量の多重集合を考える必要があることを示す。
マルチセットトモグラフィーは2次的改善が期待できるが,実現可能である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:35:41 GMT)
One-Stage-TFS: Thai One-Stage Fingerspelling Dataset for Fingerspelling Recognition Frameworks [0.0] タイのワンステージフィンガースペルデータセットは、手ジェスチャー認識の研究を進めるために設計された総合的なリソースである。
このデータセットは、タイのラジャバト・マハ・サラカム大学(英語版)の大学生が行った15の1段子音のジェスチャーを7,200枚の画像から成っている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:26:26 GMT)
On the Complexity of Pure-State Consistency of Local Density Matrices [0.0] 局所密度行列(mathsfPureCLDM$)および純$N$-representability(mathsfPure$-$N$-$mathsfRepresentability$)問題の純粋整合性について検討する。
この新しいクラスには$mathsfPure$-$N$-$mathsfRepresentability$と$mathsfPureCLDM$の両方が完了していることを証明します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:43:21 GMT)
On computing quantum waves and spin from classical and relativistic action [0.0] 量子物理学のシュレーディンガー方程式は、古典的ハミルトン・ヤコビ最小作用方程式の一般化形式を用いて解けることを示す。
結果は相対論的設定にまで拡張され、2つの発展の上に構築される。
彼らは、ハミルトン・ヤコビ形式主義が一般相対性理論にまで拡張され、スケールにわたる物理学間の滑らかな遷移を示唆している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:48:13 GMT)
On computing quantum waves and spin from classical and relativistic action [0.0] 量子物理学のシュレーディンガー方程式は、古典的ハミルトン・ヤコビ最小作用方程式の一般化形式を用いて解けることを示す。
結果は相対論的設定にまで拡張され、2つの発展の上に構築される。
彼らは、ハミルトン・ヤコビ形式主義が一般相対性理論にまで拡張され、スケールにわたる物理学間の滑らかな遷移を示唆している。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 19:48:13 GMT)
New random projections for isotropic kernels using stable spectral distributions [0.0] スペクトルカーネル分布を$alpha$-stableランダムベクトルのスケール混合として分解する。
結果は、サポートベクターマシン、カーネルリッジレグレッション、その他のカーネルベースの機械学習技術に広く応用されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:28:01 GMT)
Momentum dependent quantum Ruelle-Pollicott resonances in translationally invariant many-body systems [0.0] 変換不変な量子多体格子系におけるルエル・ポリコット共鳴について検討する。
モーメント依存は相関関数の崩壊に関する洞察を与える。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 16:37:20 GMT)
Modulation of spin-orbit coupled Bose-Einstein condensates: analytical characterization of acceleration-induced transitions between energy bands [0.0] スピン軌道結合ボース-アインシュタイン凝縮体の変調効果を解析的に研究した。
結合振幅の正弦波駆動はエネルギーバンドと関連するスピン-モーメントロックに大きな変化をもたらすことが示されている。
実験結果の理解に対するLandau-Zener (LZ) モデルの適用性は厳密に追跡されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:53:18 GMT)
Mode entanglement and isospin pairing in two-nucleon systems [0.0] アイソスピン形式を用いた2核子系の絡み合いと相関について検討する。
我々は,1モードエントロピーと2モードエントロピー,相互情報,およびワンボディエンタングルメントエントロピーとして知られる基底非依存特性を分析した。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 13:21:04 GMT)
Mobility-based Traffic Forecasting in a Multimodal Transport System [0.0] 本研究は,各ノード間の移動量に基づく人口動態の分析を行い,その移動量に応じて交通の影響を観測,測定,予測するものである。
本研究では,人口移動データからマルチモーダル交通ネットワークのトラフィックを予測する機械学習手法について検討する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:58:30 GMT)
Mitigating Non-Markovian and Coherent Errors Using Quantum Process Tomography of Proxy States [0.0] 我々は、CLY、二項鉄道、二重鉄道という、最も一般的なボソニックな誤り訂正符号を3つ検討する。
デュアルレール符号が最高の性能を示すことが分かりました。
また、量子制御における誤り軽減のための新しい手法を開発した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:18:30 GMT)
Mini-Omni: Language Models Can Hear, Talk While Thinking in Streaming [0.0] ミニオムニ(Mini-Omni)は、リアルタイム音声対話が可能な音声ベースのエンドツーエンド会話モデルである。
そこで本研究では,テキストによる音声生成手法と,推論中のバッチ並列戦略を併用して,性能を向上させる手法を提案する。
また、最適化音声出力のための微調整モデルにVoiceAssistant-400Kデータセットを導入する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 02:24:18 GMT)
Mini-Omni2: Towards Open-source GPT-4o with Vision, Speech and Duplex Capabilities [0.0] Mini-Omni2はヴィソインとオーディオクエリにリアルタイム、エンドツーエンドの音声応答を提供するビジュアルオーディオアシスタントである。
限られたデータセットでトレーニングした後、言語モデルでマルチモーダル入力と出力を処理できる3段階のトレーニングプロセスを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:27:57 GMT)
Metaheuristics for the Template Design Problem: Encoding, Symmetry and Hybridisation [0.0] テンプレート設計問題(TDP)は、多くの対称性を持つ難しい問題であり、それをより複雑にしている。
本稿では,テンプレート設計の適合性を評価することを目的として,多種多様なメタヒューリスティクスを探索し,解析する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:29:12 GMT)
Matrix Product States in Quantum Spin Chains [0.0] 準局所代数の枠組みにおける行列積状態(MPS)の新たな表現を提案する。
有限MPSの無限体積状態への拡張を可能にし、複雑で高次元の量子システムに対する新たな洞察を提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:05:03 GMT)
Local Lesion Generation is Effective for Capsule Endoscopy Image Data Augmentation in a Limited Data Setting [0.0] そこで我々は, 局所病変生成手法を2つ提案し, 小型医用画像データセットの増大に対処する。
最初のアプローチでは、古典的な画像処理技術であるPoisson Image Editingアルゴリズムを使用して、リアルな画像合成を生成する。
第2のアプローチでは、微調整されたイメージインペインティングGANを利用して、現実的な病変を合成する新しい生成手法を導入している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:44:25 GMT)
Leveraging Vision-Language Models for Manufacturing Feature Recognition in CAD Designs [0.0] 本研究では、CAD設計における幅広い製造特徴の認識を自動化する視覚言語モデル(VLM)について検討する。
認識を可能にするために、マルチビュークエリイメージ、少数ショット学習、シーケンシャル推論、チェーン・オブ・プリートといったプロンプトエンジニアリング技術が適用される。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 04:57:55 GMT)
LLMs and the Madness of Crowds [0.0] 本研究では,大規模言語モデル(LLM)が生成する誤答のパターンを,評価中に解析する。
その結果, 誤応答はランダムに分布せず, モデル間で系統的に相関していることがわかった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:20:10 GMT)
LLM Generated Distribution-Based Prediction of US Electoral Results, Part I [0.0] 本稿では,Large Language Models (LLM) を予測ツールとして利用するための新しいアプローチである分布ベース予測を紹介する。
我々は、近年のアメリカ合衆国大統領選挙の文脈において、分布に基づく予測の使用を実演する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:10:25 GMT)
Judge Like a Real Doctor: Dual Teacher Sample Consistency Framework for Semi-supervised Medical Image Classification [0.0] 半教師付き学習(SSL)は、医用画像分類における高いアノテーションコストを軽減するための一般的なソリューションである。
本稿では,ALcを組み込んだサンプル一貫性平均教師(SCMT)を提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:24:28 GMT)
Investigation of the Bell-CHSH inequality in diamond regions [0.0] ミンコフスキー時空における因果ダイヤモンドのベル-CHSH不等式に関する数値設定について述べる。
ダイヤモンドで支持された試験関数の適切なセットを選択した後,真空状態における実スカラー大磁場のワイル作用素の相関関数について,有意な違反を報告した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:09:21 GMT)
Investigating the Applicability of a Snapshot Computed Tomography Imaging Spectrometer for the Prediction of Brix and pH of Grapes [0.0] CTISシステムの性能は、最先端のラインスキャンHSIシステムと比較される。
CTISカメラの利点は、低コスト、ポータビリティ、モーションエラーに対する感受性の低下などであり、将来有望な現場での応用の可能性を強調している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:03:36 GMT)
Influence of field mass and acceleration on entanglement generation [0.0] 検出器間の最大絡み合いは検出器加速に厳密な単調な依存を示さないことがわかった。
また,3+1次元の大規模スカラー場に強い反ウンルー効果がないことが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:54:01 GMT)
Infinitely fast critical dynamics: Teleportation through temporal rare regions in monitored quantum circuits [0.0] 測定レートの空間的相関変動は、低測定レートのボリュームロー位相を乱す。
臨界測定速度では、それらは「超高速」ダイナミクスで絡み合う相転移を引き起こす。
我々はこれらの位相の物理的解釈を提供し、安定化回路における情報伝播と絡み合いのダイナミクスの広範な数値シミュレーションでそれを支援する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:11 GMT)
Industrial Machines Health Prognosis using a Transformer-based Framework [0.0] 本稿では、Transformer Quantile Regression Neural Networks(TQRNN)を紹介する。
TQRNNは、製造コンテキストにおけるリアルタイムマシン障害予測のための、新しいデータ駆動ソリューションである。
その結果,機械故障の予測に1時間リード時間を用い,精度が70.84%となるモデルの有効性が示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:47:05 GMT)
Improved Circuit Lower Bounds and Quantum-Classical Separations [0.0] 我々は,GC0が指数サイズのTC0回路を必要とする場合でも,パラメータが失われることなく,AC0がGC0へ持ち上げることを示す。
応用として、Majorityは2Omega(n1/2(d-1))$の深さd GC0[p]回路を必要とすることを証明し、AC0[p]の最先端の下位境界と一致する。
また、ENPは指数サイズ0回路を必要とする(全 m に対して GCC0[m] の結合)。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 00:28:42 GMT)
IMUDiffusion: A Diffusion Model for Multivariate Time Series Synthetisation for Inertial Motion Capturing Systems [0.0] 本稿では,時系列生成に特化して設計された確率的拡散モデルIMUDiffusionを提案する。
提案手法は,人間の活動のダイナミクスを正確に捉えた高品質な時系列列の生成を可能にする。
一部のケースでは、マクロF1スコアを約30%改善することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:53:52 GMT)
Hierarchy of degenerate stationary states in a boundary-driven dipole-conserving spin chain [0.0] 動的に制約されたスピン鎖は、孤立量子系における構造化エルゴディディディティの破れのプロトタイプとして機能する。
このような系は、非コヒーレントポンプと境界における損失によって駆動されるとき、退化定常状態の階層を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:03:02 GMT)
Genuine tripartite entanglement in graviton-matter interactions [0.0] 量子重力系における真の三部構造非ガウス交絡の存在を示す。
我々は、ここで分析された重力-物質相互作用によく適合する新しい絡み合いの証人を紹介した。
証人は、システムが基底状態から始まるとき、ハミルトニアンによって生成される3つのモード状態に対してゼロではないことを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:40:11 GMT)
Generally covariant evolution equations from a cognitive treatment of time [0.0] 相対性理論における時間の扱いは、量子論においてそれと一致しない。
$t$の役割は、時空におけるイベント間の距離を定量化することである。
対応する進化方程式は、1941年にシュテッケルベルクが提唱したのと同じ対称形式に達する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:56:22 GMT)
Gauge-Fixing Quantum Density Operators At Scale [0.0] 非平衡量子系の理論、アルゴリズム、シミュレーションを提供する。
量子密度演算子の表現に関連する仮想自由度を解析的および数値的に検討する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:56:13 GMT)
GIS Copilot: Towards an Autonomous GIS Agent for Spatial Analysis [0.0] GIS Copilot" はGISユーザが自然言語コマンドを使ってQGISと対話して空間分析を行うことを可能にする。
評価の結果,GISコパイロットはGIS操作の自動化に強い可能性を示し,ツールの選択やコード生成において高い成功率を示した。
本研究は,非専門家が地理空間分析を最小限の専門知識で行うための経路を提供する,自律型GISの新たなビジョンに寄与する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:53:59 GMT)
Full Field Digital Mammography Dataset from a Population Screening Program [0.0] 集団検診プログラムは定期的なマンモグラフィーの撮影を予定し、早期発見を促進する。
現在、このようなスクリーニングプログラムは手作業による読影を必要としており、読影過程における偽陽性の誤りは、必要以上に、追跡と患者への不安を招きかねない。
NL-Breast-Screeningは、人口スクリーニングプログラムを特に対象とし、カナダの地方検定プログラムのデータセットである。
このデータセットは5997個のマンモグラフィー検査からなり、それぞれが4つの標準ビューを持ち、生検で確認されている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:13:34 GMT)
Frequency locking: a distinctive feature of the coherent population trapping and the stationarity effect [0.0] 本研究では,コヒーレント集団トラップ法において,最大誤差信号勾配は変調周波数の増大とともに一定水準に維持されていることを示す。
低周波変調機構の研究により, 定常効果が明らかとなった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:34:47 GMT)
Fourier Analysis of Variational Quantum Circuits for Supervised Learning [0.0] VQCはフーリエ解析のレンズを通して理解することができる。
また, 回路の符号化ゲートによって, トラッピングされたフーリエ和のスペクトルが完全に決定されないことを示す。
与えられた選択リストのうち、どのglsVQCがデータに最も合うかを予測できることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:07:26 GMT)
Forecasting Outside the Box: Application-Driven Optimal Pointwise Forecasts for Stochastic Optimization [0.0] 本稿では,未知の状況の最適近似を導出する統合学習と最適化手法を提案する。
文献の在庫問題と実データを用いた自転車共有問題から得られた数値結果から,提案手法が有効であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:54:50 GMT)
Fermionic Independent Set and Laplacian of an independence complex are QMA-hard [0.0] 摂動ガジェットを用いた$k$-粒子部分空間における最適化問題はQMAハードであることが証明された。
自然位相データ解析問題 QMA-hard の最初の例を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:21:48 GMT)
FedBlock: A Blockchain Approach to Federated Learning against Backdoor Attacks [0.0] Federated Learning (FL) は、分散マシンにローカルに保存されたプライベートデータを、中央学習のために一箇所に集めることなくトレーニングする機械学習手法である。
その約束にもかかわらず、FLは重大なセキュリティリスクを負う傾向にある。
この2つのセキュリティリスクに対処するブロックチェーンベースの新しいFLフレームワークであるFedBlockを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:34:53 GMT)
Fast Empirical Scenarios [0.0] サンプルモーメントと整合した大規模パネルデータから代表シナリオを抽出する。
2つの新しいアルゴリズムのうち、最初に観測されていないシナリオを識別する。
第2の提案は、すでに実現した世界の状態から重要なデータポイントを選択する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:23:12 GMT)
Exploring the properties of quantum scars in a toy model [0.0] エルゴード性の概念を導入し、孤立量子系における量子不足に起因する偏差を探求する。
元々は、カオス系の特定の波動関数における古典的に不安定な軌道の痕跡として同定された量子傷は、最近、非エルゴード力学におけるそれらの役割に対する関心を取り戻した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:31:08 GMT)
Exploring the Cybersecurity-Resilience Gap: An Analysis of Student Attitudes and Behaviors in Higher Education [0.0] 本研究では,行動理論を理論的枠組みとして用い,そのギャップを解消する。
情報セキュリティアンケートの人的側面を修正し, 大学生と大学院生の有効回答266件を収集した。
パスワード管理、電子メールの使用、ソーシャルメディアの実践、モバイルデバイスのセキュリティなど、サイバーセキュリティの意識と行動に関する重要な側面を評価した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:09:37 GMT)
Estimating the Effect of Crosstalk Error on Circuit Fidelity Using Noisy Intermediate-Scale Quantum Devices [0.0] 並列命令間のクロストークは量子状態を破損させ、不正なプログラム実行を引き起こす。
NISQ装置におけるクロストーク誤り効果の解析を行う。
実験では,3種類のIBM量子デバイスのクロストーク誤差モデルについて実験を行った。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:23:47 GMT)
Epistemic Boundaries and Quantum Uncertainty: What Local Observers Can (Not) Predict [0.0] 我々は、量子後理論は平均的にボルン則に従う一方で予測上の優位性を与えることができると論じる。
異なるオブザーバー間の信頼性のある相互対象性の仮定が違反された場合、主観的予測的優位性は原則として存在する。
この発見は、自然の予測可能性の限界の側面として、量子不確実性に我々を和解させる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:06:25 GMT)
Entanglement, loss, and quantumness: When balanced beam splitters are best [0.0] 反射と透過確率が等しいビームスプリッタは、真空に干渉された状態に対して最も絡み合っていることを示す。
我々は、光子損失を受ける状態の単調性、凸性、エントロピー性を明らかにすることによって、ユビキタスな絡み合いモノトンに対するこの予想を証明した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:00 GMT)
Entanglement and pairing in two-nucleon systems [0.0] アイソスピン形式を用いた2核子系の絡み合いと相関について検討する。
本研究では,1モードエントロピーと2モードエントロピー,相互情報,およびワンボディエンタングルメントエントロピーとして知られる基底非依存特性を解析する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 13:21:04 GMT)
Enhancing LLM Evaluations: The Garbling Trick [0.0] 大規模言語モデル(LLM)はますます強力になり、パフォーマンスに基づいたモデルの区別が困難になる。
本稿では,既存のLCM評価を,段階的に困難なタスクに変換する一般的な手法を提案する。
結果から,これらのモデルの比較推論能力,特に OpenAI の o1-preview と Google の gemini-pro-1.5 の区別が明らかになった。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:17:34 GMT)
Enaction for QBists [0.0] QB主義(QBism)は、エージェントとの相互作用を通じて世界がどのように創造され、再生されるかの理論である。
アクション(英: Enaction)とは、エージェントが世界との相互作用によってどのように生成され、再現されるかの理論である。
これらのノートは、QBist物理学と活動的認知科学を統一することを目的としたより大きなプロジェクトへと進化した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:51:27 GMT)
Efficient Quantum Lattice Gas Automata [0.0] このアルゴリズムは、衝突、マッピング、伝播の3つの主要なステップで構成されている。
ノイズの影響にもかかわらず、現在のノイズのあるデバイスでは、正確なシミュレーションがすでに達成されていることが示唆された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:22:46 GMT)
Efficient Numerical Wave Propagation Enhanced By An End-to-End Deep Learning Model [0.0] 本稿では,数値解法とディープラーニングコンポーネントをエンドツーエンドのフレームワークに統合する,新しい統合システムを提案する。
安定かつ高速な解法により、高周波波成分を補正する並列時間アルゴリズムであるPararealが利用可能となる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:27:42 GMT)
Efficient Detection of Strong-To-Weak Spontaneous Symmetry Breaking via the Rényi-1 Correlator [0.0] 強弱自然対称性の破れ (SW SSB) は、近年、物質の量子混合状態の普遍的な特徴として現れている。
本稿では,SW SSB を混合状態で観測可能な R'enyi-1 相関器を提案する。
具体的には、与えられた混合状態の正準浄化(CP)を確実に作成することができれば、混合状態のSW SSBは、CP状態の通常の2点相関関数を介して検出することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 22:12:00 GMT)
Efficacy of Various Large Language Models in Generating Smart Contracts [0.0] 本研究では,Immutable上のSolidityスマートコントラクト作成におけるコード生成型大規模言語モデルの適用性について分析する。
我々はまた、新しい戦略を促すことによって、スマートコントラクトを生成する新しい方法を発見した。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 16:21:55 GMT)
Effects of position-dependent mass (PDM) on the bound-state solutions of a massive spin-0 particle subjected to the Yukawa potential [0.0] ユカワ型ポテンシャルを持つクライン・ゴルドン方程式の固有関数と固有エネルギーについて論じる。
PDMは正(E+$)および負(E−$)の溶液状態の低いエネルギーでの等価性をもたらすと結論づける。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:31:06 GMT)
EcoCropsAID: Economic Crops Aerial Image Dataset for Land Use Classification [0.0] EcoCropsAIDデータセットは、2014年から2018年の間にGoogle Earthアプリケーションを使って撮影された5,400枚の空中画像の包括的なコレクションである。
このデータセットは、タイの5つの主要な経済作物、米、サトウキビ、キャッサバ、ゴム、ロングランに焦点を当てている。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:14:36 GMT)
Easing Maintenance of Academic Static Analyzers [0.0] Mopsaは、音を出すことを目的とした静的分析プラットフォームである。
この記事では、2017年以来のMopsaのメンテナンスを簡素化するために、私たちが作り出したツールとテクニックについて説明する。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 14:11:58 GMT)
Does connected wedge imply distillable entanglement? [0.0] リュウタカヤナギ式は, 2つの空間的に分離された境界系が, 絡み合いのくさびがバルク内で連結されている場合, 相互に大きな情報を持つことができることを予測している。
ここでは, ホログラム混合状態に対して, 1/G_N$ の順に LO 蒸留可能な絡み目が存在しないことを示唆し, バイパルタイト絡み目の欠如を示唆する。
また、蒸留可能なエンタングルメントと形成のエンタングルメントのホログラム的モノガミー関係を定め、その双対を$EW$とする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 19:00:00 GMT)
Differentiability and Approximation of Probability Functions under Gaussian Mixture Models: A Bayesian Approach [0.0] ガウス混合モデルに関連する確率関数について検討する。
条件付き確率分布を用いて確率関数をユークリッド球面上の積分として表現する。
パラメータ空間とユークリッド球面上のランダムサンプリングを用いて確率関数を近似する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 01:36:27 GMT)
Design-Reality Gap Analysis of Health Information Systems Failure [0.0] 本研究では,南アフリカの公立病院における健康情報システムの障害要因について検討した。
発見は、システムキャパシティの制約、ITリスク管理の不十分、重要なスキルギャップなど、HISの失敗に寄与するいくつかの要因を浮き彫りにする。
本研究は、公共医療におけるHISの成果を改善するために、デザインと現実のギャップに対処することの重要性を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 15:31:40 GMT)
Deep Learning Based Amharic Chatbot for FAQs in Universities [0.0] 本稿では,アムハラ語の質問(FAQ)に頻繁に答えるモデルを提案する。
提案プログラムでは, トークン化, 停止語除去, ステーミングを用いて, アムハラ語入力文の分析と分類を行う。
このモデルはFacebook Messengerに統合され、Herokuサーバに24時間のアクセシビリティとしてデプロイされた。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:45:22 GMT)
Data-Driven Socio-Economic Deprivation Prediction via Dimensionality Reduction: The Power of Diffusion Maps [0.0] 本研究は, 人口統計データを用いて, 市内で最も被害の少ない地域の位置を推定するモデルを提案する。
拡散マップアルゴリズムを用いて次元の減少とパターンの発見を行う。
このモデルは、プロジェクト領域における将来の損失を予測する上で、強いパフォーマンスを示します。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:37:24 GMT)
Convergence of the denoising diffusion probabilistic models [0.0] 我々は,Ho,J.,Jain,A.,Abbeelで提示された拡散確率モデル(DDPM)の原版を解析した。
我々の主定理は、元のDDPMサンプリングアルゴリズムによって構築されたシーケンスは、時間ステップの回数が無限大になるにつれて、与えられたデータ分布に弱収束することを示している。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 06:11:25 GMT)
Consistency of EFT illuminated via relative entropy: A case study in scalar field theory [0.0] 相対エントロピーの非負性は摂動計算に反する可能性があることを示す。
単体インフレーションのFTを再検討し、その非線形パラメータ$f_rm NL$とEDT記述の一貫性条件の関係を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 10:48:31 GMT)
Classification Done Right for Vision-Language Pre-Training [0.0] 画像テキストデータに基づく視覚言語事前学習のための超単純な分類法であるSuperClassを紹介する。
SuperClassは、トークン化された生テキストを、追加のテキストフィルタリングや選択を必要とせずに、教師付き分類ラベルとして直接利用する。
SuperClassは、古典的なコンピュータビジョンベンチマークやビジョン言語ダウンストリームタスクなど、さまざまなダウンストリームタスクで優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:58:15 GMT)
Character-level Tokenizations as Powerful Inductive Biases for RNA Foundational Models [0.0] RNAの挙動を理解し予測することは、RNAの構造と相互作用の複雑さのために困難である。
現在のRNAモデルは、タンパク質ドメインで観測された性能とはまだ一致していない。
ChaRNABERTは、確立されたベンチマークでいくつかのタスクで最先端のパフォーマンスに到達することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 21:56:16 GMT)
Channel-State duality with centers [0.0] 直和構造を持つヒルベルト空間の場合に対して、通常のチャネル状態双対性に起因する写像の拡張について検討する。
この設定は中心を持つ代数の表現に現れ、これは一般に制約と結びついている。
量子多体理論からホログラフィーや量子重力への多くの物理応用がある。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 00:55:03 GMT)
Blending Ensemble for Classification with Genetic-algorithm generated Alpha factors and Sentiments (GAS) [0.0] 本稿では,Bitcoin市場の動向を予測するために特別に設計された,革新的な遺伝的アルゴリズム生成型アルファセンチメント(GAS)ブレンディングアンサンブルモデルを紹介する。
このモデルは、高度なアンサンブル学習法、特徴選択アルゴリズム、奥行きの感情分析を統合している。
実験の結果,GASモデルは日々のBitcoinトレンド予測において競争力を発揮することが示された。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 12:15:01 GMT)
Arrhythmia Classification Using Graph Neural Networks Based on Correlation Matrix [0.0] 抽出した特徴の相関行列を用いて隣接行列を生成し,不整脈の分類にグラフニューラルネットワークを適用した。
その結果,不整脈分類の精度は50%以上であり,不整脈分類のアプローチである可能性が示唆された。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 17:00:25 GMT)
Arithmetical Binary Decision Tree Traversals [0.0] 本稿では,新しい表現行列を利用して二分木構造を平坦化する二分木トラバーサルアルゴリズムを提案する。
当社のアプローチは、内部製品検索の最大化に基礎を置いており、意思決定ツリーに関する新たな洞察を与えています。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:42:08 GMT)
AraTrust: An Evaluation of Trustworthiness for LLMs in Arabic [0.0] AraTrustはアラビア語でLarge Language Models(LLMs)の総合的信頼性ベンチマークである。
GPT-4は最も信頼できるLCMであり、特にAceGPT 7BやJais 13Bといったオープンソースモデルはベンチマークで60%のスコアを得るのに苦労しました。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:19:26 GMT)
Analysis of Discrete Modern Hopfield Networks in Open Quantum System [0.0] 現代のホップフィールドネットワークは、クロトフとホップフィールドによって提案され、ホップフィールドネットワークの数学的一般化である。
本研究では、オープン量子ホップフィールドネットワークを一般化する離散的現代ホップフィールドネットワークのためのオープン量子モデルを提案する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:52:59 GMT)
An Open-source Sim2Real Approach for Sensor-independent Robot Navigation in a Grid [0.0] シミュレーション環境で訓練されたエージェントと、同様の環境でロボットをナビゲートする実際の実装とのギャップを橋渡しする。
具体的には、Gymnasium Frozen Lakeにインスパイアされた現実世界のグリッドのような環境で四足歩行ロボットをナビゲートすることに焦点を当てる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 20:18:29 GMT)
An Interpretable Generalization Mechanism for Accurately Detecting Anomaly and Identifying Networking Intrusion Techniques [0.0] 解釈可能な一般化メカニズム(IG)は、コヒーレントパターンを識別し、正常なネットワークトラフィックと異常なネットワークトラフィックを区別する。
実世界のデータセットによる実験により、IGはトレーニングとテストの比率が低い場合でも正確である。
IGは、多様なデータセットとトレーニングとテストの比率を一貫して比較することで、優れた一般化を示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:14:25 GMT)
All three-angle variants of Tsirelson's precession protocol, and improved bounds for wedge integrals of Wigner functions [0.0] ツィレルソンのプレセッションプロトコルは、離散変数系と連続変数系の両方に対して定義できる非古典的な証人である。
この研究は、ティレルソンの元々のプロトコルの範囲を広げ、多くの他の状態の非古典性や絡み合いを検出することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:24:34 GMT)
Advancing Recycling Efficiency: A Comparative Analysis of Deep Learning Models in Waste Classification [0.0] 本研究は, 各種深層学習モデルの解析により, リサイクルにおける廃棄物分類の押し付け問題に取り組む。
以上の結果から, 複雑な廃棄物カテゴリの精度が著しく向上することが示唆された。
この研究は, 多カテゴリー廃棄物リサイクルの今後の発展への道を開くものである。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 03:44:54 GMT)
Advancements and limitations of LLMs in replicating human color-word associations [0.0] 大規模言語モデル(LLM)が広く普及し、自然な会話スキルを持つ様々なベンチマークでインテリジェントな振る舞いを実証している。
日本人1万人以上の参加者から収集したデータを用いて,複数世代にわたるLLMと人間の色覚関連性を比較検討した。
本研究は,LLM能力の発達と持続的限界を両立させ,色覚関連性を表現する上での人間とLLMのセマンティックメモリ構造の違いを示唆する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 08:35:14 GMT)
AI Multi-Agent Interoperability Extension for Managing Multiparty Conversations [0.0] 本稿では,Open Voice Initiative の既存の Multi-Agent 仕様の新たな拡張について述べる。
Convener Agent、Floor-Shared Conversational Space、Floor Manager、Multi-Conversant Support、InterruptionsやUninvited Agentsなどの新しい概念を導入している。
これらの進歩は、複数のAIエージェントが協力し、議論し、議論に貢献する必要があるシナリオにおいて、スムーズで、効率的で、セキュアな相互作用を保証するために不可欠である。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:11:55 GMT)
AI Ethics by Design: Implementing Customizable Guardrails for Responsible AI Development [0.0] 我々は、ルール、ポリシー、AIアシスタントを統合して、責任あるAI行動を保証する構造を提案する。
われわれのアプローチは倫理的多元主義に対応し、AIガバナンスの進化の展望に柔軟で適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 18:38:30 GMT)
A simple gravitational self-decoherence model [0.0] 本稿では,単純な重力自己脱コヒーレンス機構を提案する。
自由量子粒子の純度損失を評価した結果, 素粒子の純度損失は極めて非効率であることが判明した。
その背景にある物理的な特徴は、コヒーレンスが十分に重い粒子から時空の量子自由度へと容易に漏れることである。
論文参考訳(メタデータ) (Tue, 5 Nov 2024 18:33:27 GMT)
A new family of ladder operators for macroscopic systems, with applications [0.0] 巨視的領域におけるボソニックおよびフェルミオンラグ演算子の役割について検討した。
また,いくつかのはしご演算子に基づく代替手法を提案するが,解析解を特別な困難を伴わずに導出できる場合が多い。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 07:41:08 GMT)
A Theory of Stabilization by Skull Carving [0.0] 顔の動きの正確な安定化は、3Dゲーム、仮想現実、映画、トレーニングデータ収集のためのフォトリアルアバター構築への応用に不可欠である。
安定化スキャンの交差面として安定な船体の概念を導入し, シルエット形状の視覚的船体と空間彫刻の光的船体とを類似させた。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 17:54:05 GMT)
A Post-Training Enhanced Optimization Approach for Small Language Models [0.0] 本稿では,小言語モデルに対する連続的な学習後アライメントデータ構築法を提案する。
本手法のコアは大規模モデルのデータガイダンスに基づいて,アライメントデータの多様性と精度を最適化する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 09:32:26 GMT)
A Personal data Value at Risk Approach [0.0] 本稿では,データコントローラの観点から,データ保護リスクベースのコンプライアンスに対する定量的アプローチを提案する。
データ保護分析、量的リスク分析、専門家の意見を校正することで、データ保護の影響評価を改善することができる。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 16:09:28 GMT)
A Natural Language Processing-Based Classification and Mode-Based Ranking of Musculoskeletal Disorder Risk Factors [0.0] 本研究は,NLP(Natural Language Processing)とモードベースランキングを併用して,筋骨格障害(MSD)のリスク要因を解明する。
目的は、集中した予防と治療のための理解、分類、優先順位付けを洗練することである。
8つのNLPモデルを評価し、事前訓練されたトランスフォーマー、コサイン類似性、距離メトリクスを組み合わせて、因子を個人、生体力学、職場、心理学、組織クラスに分類する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 13:21:08 GMT)
A Framework for Real-Time Volcano-Seismic Event Recognition Based on Multi-Station Seismograms and Semantic Segmentation Models [0.0] 火山モニタリングでは、火山活動を理解し、タイムリーに警告を発する上で、地震事象の効果的な認識が不可欠である。
本研究では, セマンティックモデルを用いて, 多チャンネル1次元信号の2次元表現へのストレートフォワード変換を適用することで, 地震イベント認識を自動化する手法を提案する。
本フレームワークは,5つの地震イベントクラスに対して,検出と分類を同時に行うため,最小限の事前処理でマルチステーション地震データを統合する。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 14:13:56 GMT)
A Bayesian explanation of machine learning models based on modes and functional ANOVA [0.0] 観測されたラベル値に条件付けられた true' の機能を回復するために、ベイズフレームワークを使用します。
提案手法は平均値に基づく手法よりも人間の直感的で頑健であることを示す。
論文参考訳(メタデータ) (Tue, 05 Nov 2024 02:32:26 GMT)