Informative Scene Graph Generation via Debiasing [124.7] シーングラフ生成は、視覚的関係三重項(オブジェクト、述語、オブジェクト)を検出することを目的としている
データのバイアスのため、現在のモデルは一般的な述語を予測する傾向がある。
本稿では,DB-SGGを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:35:55 GMT)
VBench++: Comprehensive and Versatile Benchmark Suite for Video Generative Models [111.6] VBenchは、"ビデオ生成品質"を特定の、階層的、そして非絡み合ったディメンションに分解するベンチマークスイートである。
我々は、人間の知覚とベンチマークの整合性を検証するために、人間の嗜好アノテーションのデータセットを提供する。
VBench++は、テキスト・トゥ・ビデオと画像・トゥ・ビデオの評価をサポートする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:54:41 GMT)
REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents [110.4] 大規模アプリケーションにとって重要な障害のひとつは、高価なトレーニングと推論コストである。
本稿では,ビデオには画像よりもはるかに冗長な情報が含まれており,非常に少ない動きの潜伏者によってエンコード可能であることを論じる。
我々は、合計3.2Kのトレーニング時間でReduceio-DiTをトレーニングし、1つのA100 GPUで15.5秒以内に16フレームの1024*1024ビデオクリップを生成する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:59:52 GMT)
3D-Aware Instance Segmentation and Tracking in Egocentric Videos [107.1] エゴセントリックなビデオは、3Dシーンの理解にユニークな課題を提示する。
本稿では,一対一のビデオにおけるインスタンスのセグメンテーションとトラッキングに対する新しいアプローチを提案する。
空間的および時間的手がかりを取り入れることで、最先端の2D手法と比較して優れた性能が得られる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:51:25 GMT)
DAGSM: Disentangled Avatar Generation with GS-enhanced Mesh [102.8] DAGSMは、与えられたテキストプロンプトから歪んだ人体と衣服を生成する新しいパイプラインである。
まず着ていない体を作り、次に体に基づいて個々の布を生成します。
実験では、DAGSMは高品質なアンタングルアバターを生成し、衣服の交換とリアルなアニメーションをサポートし、視覚的品質においてベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:00:48 GMT)
Disentangling Memory and Reasoning Ability in Large Language Models [97.3] 本稿では、複雑な推論プロセスを2つの異なる明確なアクションに分解する新しい推論パラダイムを提案する。
実験の結果, この分解によりモデル性能が向上し, 推論プロセスの解釈可能性も向上することがわかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:55:38 GMT)
"It was 80% me, 20% AI": Seeking Authenticity in Co-Writing with Large Language Models [97.2] 我々は、AIツールと共同で書き込む際に、著者が自分の真正な声を保存したいかどうか、どのように検討する。
本研究は,人間とAIの共創における真正性の概念を解明するものである。
読者の反応は、人間とAIの共著に対する関心が低かった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:42:32 GMT)
Stochastic Approximation Approaches to Group Distributionally Robust Optimization and Beyond [89.7] 本稿では,グループ分散ロバスト最適化 (GDRO) を,$m$以上の異なる分布をうまく処理するモデルを学習する目的で検討する。
各ラウンドのサンプル数を$m$から1に抑えるため、GDROを2人でプレイするゲームとして、一方のプレイヤーが実行し、他方のプレイヤーが非公開のマルチアームバンディットのオンラインアルゴリズムを実行する。
第2のシナリオでは、最大リスクではなく、平均的最上位k$リスクを最適化し、分散の影響を軽減することを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:58:10 GMT)
DATAP-SfM: Dynamic-Aware Tracking Any Point for Robust Structure from Motion in the Wild [85.0] 本稿では,スムーズなカメラ軌跡を推定し,野生のカジュアルビデオのための高密度点雲を得るための,簡潔でエレガントでロバストなパイプラインを提案する。
提案手法は,複雑な動的課題シーンにおいても,カメラポーズ推定による最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:01:16 GMT)
Video-RAG: Visually-aligned Retrieval-Augmented Long Video Comprehension [83.0] Video-RAGはトレーニング不要で費用対効果の高いパイプラインで、視覚的に整列した補助テキストを使って、モダリティ間のアライメントを促進する。
72Bモデルを用いた場合,Gemini-1.5-Pro や GPT-4o などのプロプライエタリモデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:44:34 GMT)
DGTR: Distributed Gaussian Turbo-Reconstruction for Sparse-View Vast Scenes [81.6] 新規ビュー合成(NVS)アプローチは、広大なシーン再構築において重要な役割を担っている。
大規模な環境下では、復元の質が悪くなる場合が少なくない。
本稿では,スパース・ビュー・ワイド・シーンのための効率的なガウス再構成のための分散フレームワークであるDGTRを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:18:36 GMT)
Transforming the Hybrid Cloud for Emerging AI Workloads [81.2] このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:57:43 GMT)
Delta-CoMe: Training-Free Delta-Compression with Mixed-Precision for Large Language Models [79.5] 多様なアプリケーションへの微調整された大規模言語モデル(LLM)は、複雑な要求を満たすために不可欠である。
近年の研究では、微調整LDMをベースモデルと対応するデルタウェイトに分解し、低ランクまたは低ビットのアプローチで圧縮してコストを削減することが示唆されている。
本研究では,従来の低ランク圧縮法と低ビット圧縮法がタスク固有の微調整LDMのモデル性能を著しく損なうことを観察する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:42:38 GMT)
Reference Trustable Decoding: A Training-Free Augmentation Paradigm for Large Language Models [79.4] 大規模言語モデル(LLM)は急速に進歩し、印象的な機能を示している。
In-Context Learning (ICL) など。
効率的なファインチューニング(PEFT)は、現在2つの主要な拡張方法である。
下流タスクへのLLM。
我々は、モデルが微調整なしで新しいタスクに迅速に適応できるパラダイムである参照信頼復号(RTD)を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:10:16 GMT)
SpecTool: A Benchmark for Characterizing Errors in Tool-Use LLMs [77.8] SpecToolは、ツール使用タスクのLLM出力のエラーパターンを特定するための新しいベンチマークである。
もっとも顕著なLCMでも,これらの誤りパターンが出力に現れることを示す。
SPECTOOLの分析と洞察を使って、エラー軽減戦略をガイドすることができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:56:22 GMT)
Large Language Models on Graphs: A Comprehensive Survey [77.2] グラフ上の大規模言語モデルに関連するシナリオとテクニックを体系的にレビューする。
まず,LLMをグラフに適用する可能性シナリオを,純グラフ,テキスト分散グラフ,テキストペアグラフの3つのカテゴリにまとめる。
本稿では,そのような手法の現実的な応用について論じ,オープンソースコードとベンチマークデータセットを要約する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:24:10 GMT)
A Collaborative Ensemble Framework for CTR Prediction [73.6] 我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。
ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。
当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:38:56 GMT)
XMask3D: Cross-modal Mask Reasoning for Open Vocabulary 3D Semantic Segmentation [72.1] 本稿では,3次元特徴量と2次元テキスト埋め込み空間とのより精巧なマスクレベルのアライメントを,クロスモーダルマスク推論フレームワークであるXMask3Dを用いて提案する。
我々は、3Dグローバルな特徴を暗黙の条件として、事前訓練された2D denoising UNetに統合し、セグメンテーションマスクの生成を可能にする。
生成した2Dマスクを用いて、マスクレベルの3D表現を視覚言語の特徴空間と整合させ、3D幾何埋め込みの開語彙能力を増大させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:02:12 GMT)
MagicDrive3D: Controllable 3D Generation for Any-View Rendering in Street Scenes [72.0] 制御可能な3Dストリートシーン生成のための新しいパイプラインであるMagicDrive3Dを紹介する。
生成モデルをトレーニングする前に再構築する従来の方法とは異なり、MagicDrive3Dはまずビデオ生成モデルをトレーニングし、生成したデータから再構成する。
本研究の結果は, 自律運転シミュレーション等の可能性を示すとともに, フレームワークの優れた性能を示すものである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:43:51 GMT)
Labeled Datasets for Research on Information Operations [71.3] ソーシャルメディアプラットフォームによって検証されたIOポストと、同様のトピックを同じ時間フレーム(制御データ)で議論した303kアカウントによる1300万以上の投稿の両方を含む、26のキャンペーンに関するラベル付きデータセットを新たに提示する。
データセットは、さまざまなキャンペーンや国で調整されたアカウントによって使用される物語、ネットワークインタラクション、エンゲージメント戦略の研究を促進する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:10:26 GMT)
MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation [70.8] MMTryonはマルチモーダルなマルチ参照VIrtual Try-ONフレームワークである。
テキスト命令と複数の衣料品画像を入力として、高品質な合成試行結果を生成することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:40:14 GMT)
Generating 3D-Consistent Videos from Unposed Internet Photos [68.9] カメラパラメータなどの3Dアノテーションを使わずに,スケーラブルな3D対応ビデオモデルをトレーニングする。
その結果,映像やマルチビューインターネット写真などの2次元データのみを用いて,シーンレベルの3D学習をスケールアップできることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:58:31 GMT)
Reflections from the 2024 Large Language Model (LLM) Hackathon for Applications in Materials Science and Chemistry [68.7] 材料科学・化学分野における応用のための第二大言語モデル(LLM)ハッカソンの結果について述べる。
このイベントは、グローバルなハイブリッドな場所を巡って参加者が参加し、34チームが応募した。
提出は7つの主要なアプリケーション領域にまたがって行われ、アプリケーションのためのLLMの多種多様な実用性を実証した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:08:01 GMT)
Delegating Data Collection in Decentralized Machine Learning [67.1] 分散機械学習(ML)エコシステムの出現に動機付けられ,データ収集のデリゲートについて検討する。
我々は、2つの基本的な情報非対称性を扱う最適でほぼ最適な契約を設計する。
最適効用の1-1/e分を達成できるような単純な線形契約により、主成分がそのような非対称性に対処できることが示される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:26:03 GMT)
Keep the Cost Down: A Review on Methods to Optimize LLM' s KV-Cache Consumption [67.0] 大規模言語モデル(LLM)は、先進的な言語理解によって様々な産業に革命をもたらした。
しかし、その効率性はTransformerアーキテクチャが長いテキストを扱うのに苦労していることに疑問を投げかけられている。
KVキャッシュは、トークン生成の時間的複雑さを2次から線形に変換する、重要なソリューションとして登場した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:04:10 GMT)
GhostRNN: Reducing State Redundancy in RNN with Cheap Operations [66.1] 本稿では,効率的なRNNアーキテクチャであるGhostRNNを提案する。
KWSとSEタスクの実験により、提案されたGhostRNNはメモリ使用量(40%)と計算コストを大幅に削減し、性能は類似している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:37:14 GMT)
Hymba: A Hybrid-head Architecture for Small Language Models [65.9] Hymbaは、ハイブリッドヘッド並列アーキテクチャを特徴とする、小さな言語モデルのファミリーである。
重要な情報を保持するプロンプトに先立って,学習可能なメタトークンを導入する。
このモデルは、層間鍵値共有と部分的スライディングウィンドウアテンションを組み込むことにより、さらに最適化される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:51:25 GMT)
Hints of Prompt: Enhancing Visual Representation for Multimodal LLMs in Autonomous Driving [65.0] 一般的なMLLMとCLIPの組み合わせは、駆動固有のシナリオを正確に表現するのに苦労することが多い。
Hints of Prompt (HoP) フレームワークを提案する。
これらのヒントはHint Fusionモジュールを通じて融合され、視覚的表現が強化され、マルチモーダル推論が強化される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:58:33 GMT)
Adversarial Score identity Distillation: Rapidly Surpassing the Teacher in One Step [64.5] アイデンティティ蒸留(SiD)は、事前訓練された拡散モデルのみを活用することにより、画像生成におけるSOTA性能を達成したデータフリー手法である。
我々は,SiDA (SiD with Adversarial Loss)を導入し, 生成品質の向上だけでなく, 実画像と逆損失を取り入れて蒸留効率を向上させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:20:00 GMT)
Fact-Level Confidence Calibration and Self-Correction [64.4] 本稿では,事実レベルでの信頼度と妥当性の重み付けを校正するFact-Levelフレームワークを提案する。
また,信頼度の高い自己補正(textbfConFix$)も開発した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:15:18 GMT)
From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models [63.2] この調査は、推論中に計算をスケールするメリットに焦点を当てている。
我々はトークンレベルの生成アルゴリズム、メタジェネレーションアルゴリズム、効率的な生成という3つの領域を統一的な数学的定式化の下で探索する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:57:26 GMT)
Probably Approximately Precision and Recall Learning [62.9] 精度とリコールは機械学習の基本的な指標である。
一方的なフィードバック – トレーニング中にのみ肯定的な例が観察される – は,多くの実践的な問題に固有のものだ。
PAC学習フレームワークでは,各仮説をグラフで表現し,エッジは肯定的な相互作用を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:21:07 GMT)
PatentEdits: Framing Patent Novelty as Textual Entailment [62.9] このデータセットには105万例の修正が成功している。
我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。
引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:23:40 GMT)
LIMBA: An Open-Source Framework for the Preservation and Valorization of Low-Resource Languages using Generative Models [62.5] この白書は低リソース言語のための言語ツールを生成するためのフレームワークを提案する。
このような言語に対するインテリジェントな応用を妨げるデータ不足に対処することにより、言語多様性の促進に寄与する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:59:41 GMT)
Rotation Equivariant Proximal Operator for Deep Unfolding Methods in Image Restoration [62.4] 本稿では, 回転対称性を組み込んだ高精度な回転同変近位ネットワークを提案する。
本研究は, 回転対称性の先行を深く展開する枠組みに効果的に組み込む, 高精度な回転同変近位ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:44:06 GMT)
Epidemiology-informed Network for Robust Rumor Detection [59.9] 本稿では, 疫学知識を統合し, 性能を高めるための新しい疫学情報ネットワーク(EIN)を提案する。
疫学理論をうわさ検出に適応させるため,各利用者が情報源情報に対する姿勢を付加することが期待されている。
実験結果から,提案したEINは実世界のデータセット上で最先端の手法より優れるだけでなく,樹木の深度にまたがる堅牢性も向上することが示された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:43:32 GMT)
Benchmarking PtO and PnO Methods in the Predictive Combinatorial Optimization Regime [59.3] 予測最適化(英: Predictive optimization)は、エネルギーコストを意識したスケジューリングや広告予算配分など、多くの現実世界のアプリケーションの正確なモデリングである。
我々は,広告のための新しい産業データセットを含む8つの問題に対して,既存のPtO/PnOメソッド11をベンチマークするモジュラーフレームワークを開発した。
本研究は,8ベンチマーク中7ベンチマークにおいて,PnOアプローチがPtOよりも優れていることを示すが,PnOの設計選択に銀の弾丸は見つからない。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:20:45 GMT)
Click; Single Object Tracking; Video Object Segmentation; Real-time Interaction [58.5] リアルタイムシナリオにおけるクリックインタラクションを用いた新しいパラダイムであるClickTrackを提案する。
特定のシナリオにおける曖昧さに対処するために、ポイントとオプションのテキスト情報を入力として受け入れるガイド・クリック・リファイナ(GCR)を設計した。
LaSOTとGOT-10kベンチマークの実験により、GCRと組み合わせたトラッカーがリアルタイムの対話シナリオで安定したパフォーマンスを実現することが示された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:30:33 GMT)
On the Consistency of Video Large Language Models in Temporal Comprehension [58.0] ビデオ大言語モデル(Video-LLMs)は、時間的に言語クエリを解析し、ビデオモーメントを検索することができる。
予測整合性 - 時間的根拠の堅牢性と信頼性を示す重要な指標である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:47:17 GMT)
Semantic Equitable Clustering: A Simple and Effective Strategy for Clustering Vision Tokens [57.4] textbfSemantic textbfEquitable textbfClustering (SEC) という,高速かつバランスの取れたクラスタリング手法を導入する。
SECは、グローバルなセマンティックな関連性に基づいてトークンを効率的かつ直接的な方法でクラスタ化する。
視覚言語コネクタとして機能する汎用視覚バックボーンであるSECViTを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:17:51 GMT)
Teaching VLMs to Localize Specific Objects from In-context Examples [56.8] VLM(Vision-Language Models)は、様々な視覚タスクにまたがる顕著な能力を示す。
現在のVLMには基本的な認知能力がなく、コンテキストを考慮し、シーン内のオブジェクトをローカライズすることを学ぶ。
この研究は、VLMのパーソナライズされた数ショットのローカライゼーションを探索し、ベンチマークした初めてのものである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:34:22 GMT)
DSTC: Direct Preference Learning with Only Self-Generated Tests and Code to Improve Code LMs [56.5] UnderlinetextbfDirect Preference Learning with only underlinetextbfSelf-Generated underlinetextbfTests and underlinetextbfCode (DSTC)を紹介する。
DSTCは自己生成コードスニペットとテストのみを使用して信頼性の高い選好ペアを構築する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:03:16 GMT)
Quantum-state texture and gate identification [55.2] 任意の量子状態のテクスチャは、計算が容易なモノトンによって適切に記述されることを示す。
テクスチャは、普遍回路層における未知の量子ゲートのキャラクタリゼーションに有用であることが示されている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:39:26 GMT)
On lower bounds of the density of planar periodic sets without unit distances [55.2] 平面トーラスから構築したグラフ上での最大独立集合(MIS)問題として問題を再構成することにより、$m_1(mathbbR2)$を推定する新しいアプローチを導入する。
提案手法の理論的正当性によって支持された実験結果は,十分に広い範囲のパラメータに対して,この手法が既知の下界を改善できないことを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:07:19 GMT)
WHALES: A Multi-agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving [54.4] 我々は、駆動シーケンス当たり平均8.4エージェントのデータセットを提示する。
自律運転データセットの中で最大のエージェントと視点を提供するだけでなく、WHALESはエージェントの振る舞いを記録する。
エージェントスケジューリングタスクにおいて,エゴエージェントが複数の候補エージェントの1つを選択して協調する実験を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:12:34 GMT)
Procurement Auctions via Approximately Optimal Submodular Optimization [53.9] 競売業者がプライベートコストで戦略的売り手からサービスを取得しようとする競売について検討する。
我々の目標は、取得したサービスの品質と販売者の総コストとの差を最大化する計算効率の良いオークションを設計することである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:06:55 GMT)
TAPT: Test-Time Adversarial Prompt Tuning for Robust Inference in Vision-Language Models [53.9] 視覚的対人攻撃に対するCLIPの推論ロバスト性を高めるため, TAPT(Test-Time Adversarial Prompt Tuning)と呼ばれる新しい防御手法を提案する。
TAPTは、CLIPの推論プロセスを堅牢化するために、防御的バイモーダル(テキストと視覚)のプロンプトを学習するテストタイムディフェンス手法である。
我々は、ImageNetなど10のゼロショットデータセットを含む11のベンチマークデータセットに対するTAPTの有効性を評価する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:58:59 GMT)
4Real: Towards Photorealistic 4D Scene Generation via Video Diffusion Models [53.9] テキストから4Dシーン生成のための新しいパイプラインを提案する。
提案手法は,ビデオ生成モデルを用いて参照ビデオを生成することから始まる。
次に、凍結時間ビデオを用いて、ビデオの標準的な3D表現を学習する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:32:48 GMT)
FengWu-W2S: A deep learning model for seamless weather-to-subseasonal forecast of global atmosphere [53.2] 本研究では,FengWuグローバル気象予報モデルに基づくFengWu-Weather to Subseasonal (FengWu-W2S)を提案する。
我々は,FengWu-W2Sが大気環境を3~6週間先まで確実に予測し,マデン・ジュリア振動 (MJO) や北大西洋振動 (NAO) などの地球表面温度, 降水量, 地磁気高度, 季節内信号の予測能力を向上させることを実証した。
日時から季節時の予測誤差成長に関するアブレーション実験
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:10:15 GMT)
Efficient Masked AutoEncoder for Video Object Counting and A Large-Scale Benchmark [52.3] 前景の動的不均衡は、ビデオオブジェクトのカウントにおいて大きな課題である。
本稿では,密度埋め込み型効率的なマスドオートエンコーダカウント(E-MAC)フレームワークを提案する。
また,高効率化のための密度マップから導出した空間適応マスクを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:08:21 GMT)
Data Watermarking for Sequential Recommender Systems [52.2] 本稿では,シーケンシャルレコメンデータシステムにおけるデータ透かしの問題について検討する。
データセットの透かしはデータセット全体のオーナシップを保護し、ユーザ透かしは個々のユーザのデータを保護する。
提案手法では,不人気な項目をランダムに選択して透かしシーケンスを生成し,通常のユーザのインタラクションシーケンスに挿入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:34:21 GMT)
When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training [51.2] コンテキストウィンドウサイズの拡張により、大きな言語モデルでは、より長いシーケンスを処理し、より複雑なタスクを処理できる。
我々は,RoPEをBFloat16フォーマットで使用すると,数値的な問題が発生し,目的とする相対的位置エンコーディングから逸脱してしまうことを観察した。
我々は,BFloat16による数値問題を軽減するプラグイン・アンド・プレイアテンション法であるAnchorAttentionを開発した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:22:31 GMT)
Erasing Undesirable Influence in Diffusion Models [51.2] 拡散モデルは高品質な画像を生成するのに非常に効果的であるが、NSFW(職場では安全ではない)コンテンツの意図しない生成のようなリスクを引き起こす。
本研究では,データに関連付けられた不要な情報を取り除き,保存データに対する拡散モデルの実用性を維持するために設計されたアルゴリズムであるEraseDiffを紹介する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:31:15 GMT)
Beyond Gaussians: Fast and High-Fidelity 3D Splatting with Linear Kernels [51.1] 本稿では,ガウスカーネルを線形カーネルに置き換えて,よりシャープで高精度な結果を得る3Dリニアスティング(DLS)を提案する。
3DLSは、最先端の忠実さと正確さを示し、ベースライン3DGSよりも30%のFPS改善を実現している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:27:10 GMT)
Demystifying Large Language Models for Medicine: A Primer [50.8] 大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。
本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:04:33 GMT)
A Unified Analysis for Finite Weight Averaging [50.8] Gradient Descent(SGD)の平均イテレーションは、SWA(Weight Averaging)、EMA(Exponential moving Average)、LAWA(Latest Weight Averaging)といったディープラーニングモデルのトレーニングにおいて、経験的な成功を収めている。
本稿では、LAWAを有限重み平均化(FWA)として一般化し、最適化と一般化の観点からSGDと比較して、それらの利点を説明する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:08:22 GMT)
On the Constant Depth Implementation of Pauli Exponentials [49.5] 任意の指数を$mathcalO(n)$ ancillae と 2体 XX と ZZ の相互作用を用いて一定深さの回路に分解する。
クビットリサイクルの恩恵を受ける回路の書き直し規則を導入し,本手法の正しさを実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:32:22 GMT)
Information scrambling and entanglement dynamics in Floquet Time Crystals [49.2] 本研究では, 乱れたシステムにおける情報伝達の指標として, 時間外相関器(OTOC)のダイナミクスとエントロピーの絡み合いについて検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:18:42 GMT)
Branches, Assemble! Multi-Branch Cooperation Network for Large-Scale Click-Through Rate Prediction at Taobao [49.1] MBCnet(Multi-Branch Cooperation Network)を紹介する。
MBCnetは、Expert-based Feature Grouping and Crossing (EFGC)、低ランククロスネットブランチ、Deepブランチの3つのブランチで構成されている。
大規模産業データセットとオンラインA/Bテストの実験では、MBCnetのパフォーマンスが向上し、CTRが0.09ポイント、取引が1.49%、GMVが1.62%向上した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:10:06 GMT)
Hard-Synth: Synthesizing Diverse Hard Samples for ASR using Zero-Shot TTS and LLM [48.7] テキスト音声合成(TTS)モデルは自動音声認識(ASR)システムを強化するために広く採用されている。
我々は,大規模言語モデル(LLM)と高度なゼロショットTSを利用する新しいASRデータ拡張手法であるHard-Synthを提案する。
我々のアプローチでは、追加のテキストデータに頼ることなく、書き直しによる多様なドメイン内テキストを生成するためにLLMを用いる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:49:37 GMT)
Long Term Memory: The Foundation of AI Self-Evolution [48.5] GPTのような大規模な言語モデル(LLM)は、膨大なデータセットに基づいてトレーニングされており、言語理解、推論、計画において印象的な能力を示している。
ほとんどの研究は、より強力な基盤モデルを構築するために、より大規模なデータセットをトレーニングすることで、これらのモデルを強化することに重点を置いている。
大規模なトレーニングとは異なり、推論中にモデルを進化させることは、AIの自己進化(self-evolution)と呼ばれるプロセスと同等に重要である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:08:14 GMT)
Mono-InternVL: Pushing the Boundaries of Monolithic Multimodal Large Language Models with Endogenous Visual Pre-training [48.5] マルチモーダル・ミックス・オブ・エキスパート構造を用いて視覚専門家の集合をシームレスに統合するモノリシックMLLMであるMono-InternVLを提案する。
特に、EViPは、ノイズの多いデータから高品質なデータへの視覚的知識を完全に活用することを目的とした、視覚専門家のための進歩的な学習プロセスとして設計されている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:15:08 GMT)
Verifying Machine Unlearning with Explainable AI [46.8] 港の前面監視における機械学習(MU)の検証における説明可能なAI(XAI)の有効性について検討する。
私たちの概念実証は、従来のメトリクスを超えて拡張されたMUの革新的な検証ステップとして属性機能を導入しています。
本稿では,これらの手法の有効性を評価するために,熱マップカバレッジ(HC)とアテンションシフト(AS)の2つの新しいXAI指標を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:57:32 GMT)
A Multi-scale Information Integration Framework for Infrared and Visible Image Fusion [46.5] 赤外線および可視画像融合は、ソース画像の強度と詳細情報を含む融合画像を生成することを目的としている。
既存の手法は主に損失関数の単純な重みを採用し、各モードの情報保持を決定する。
近赤外・可視画像融合のためのマルチスケールデュアルアテンション(MDA)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:27:42 GMT)
Existential Unforgeability in Quantum Authentication From Quantum Physical Unclonable Functions Based on Random von Neumann Measurement [45.4] 物理的非閉包関数(PUF)は、固有の非閉包不可能な物理的ランダム性を利用して、ユニークな入出力ペアを生成する。
量子PUF(Quantum PUFs)は、量子状態を入出力ペアとして使用することによって、この概念を拡張している。
ランダムなユニタリQPUFは、量子多項式時間に対する実存的非偽造性を達成できないことを示す。
本稿では,QPUFが非単体量子チャネルとして機能する2番目のモデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:29:41 GMT)
Non-equilibrium dynamics of charged dual-unitary circuits [45.0] 平衡外量子系における対称性と絡み合いの相互作用は、現在、激しい多分野研究の中心にある。
一般二重ユニタリ回路を拡張した可解状態のクラスを導入することができることを示す。
無限の温度状態に緩和する既知の可解状態のクラスとは対照的に、これらの状態は非自明な一般化されたギブスアンサンブルの族に緩和する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:51:02 GMT)
VAST: Vivify Your Talking Avatar via Zero-Shot Expressive Facial Style Transfer [44.4] 本稿では、中立な光リアルアバターを再生するための教師なし変動型転送モデル(VAST)を提案する。
本モデルは,映像のプロンプトから表情表現を抽出するスタイルエンコーダと,正確な音声関連動作をモデル化するハイブリッド表情デコーダの3つの重要な構成要素から構成される。
顔のスタイル学習に欠かせない設計で、任意のビデオプロンプトから表現スタイルを柔軟に捉え、ゼロショットでパーソナライズされた画像に転送することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:23:20 GMT)
SynFER: Towards Boosting Facial Expression Recognition with Synthetic Data [44.3] ハイレベルなテキスト記述に基づく表情画像データの合成のための新しいフレームワークであるSynFERを紹介する。
本稿では,表情ラベルの修正を支援するために,生成プロセスと擬似ラベル生成手法を提案する。
提案手法は,AffectNetトレーニングセットサイズに相当する合成データのみを用いてトレーニングを行う場合,AffectNetの67.23%の分類精度を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:38:20 GMT)
BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games [44.2] 本稿では,大規模言語モデル(LLM)と視覚言語モデル(VLM)のエージェント能力を評価する新しいベンチマークであるBALROGを紹介する。
私たちのベンチマークでは、熟練していない人間が数秒で解決できるタスクや、習得に何年もかかるような極めて困難なタスクなど、さまざまな難易度を持つ既存の強化学習環境を取り入れています。
より簡単なゲームでは,現行のモデルが部分的には成功しているが,より困難なタスクに苦しむことが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:54:32 GMT)
Unlocking Historical Clinical Trial Data with ALIGN: A Compositional Large Language Model System for Medical Coding [44.0] 自動ゼロショット医療符号化のための新しい合成LLMシステムであるALIGNを紹介する。
我々は、ALIGNを解剖学的治療化学(ATC)と医学史用語に調和させ、MedDRA(Medicical Dictionary for Regulatory Activity)コードに評価した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:59:12 GMT)
MemoryFormer: Minimize Transformer Computation by Removing Fully-Connected Layers [43.4] 本稿では,新しい視点から計算複雑性(FLOP)を大幅に低減する,新しいトランスフォーマーアーキテクチャであるMemoryFormerを提案する。
これは、完全連結層の線形射影を置き換えるために、特徴変換の代替手法を利用することで実現される。
提案手法の有効性を示すため,様々なベンチマーク実験を行った。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:41:53 GMT)
On-device Content-based Recommendation with Single-shot Embedding Pruning: A Cooperative Game Perspective [42.7] コンテンツベースのレコメンダシステム(CRS)は、eコマース、オンライン広告、パーソナライズされたレコメンデーションにおいて、ユーザーエクスペリエンスを形成する上で重要な役割を果たす。
膨大な数のカテゴリ的特徴のため、CRSモデルで使用される埋め込みテーブルは、現実のデプロイメントにおいて重要なストレージボトルネックを生じさせる。
この問題に対する回答として,共有価値誘導型埋め込み還元(Shaver)を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:56:31 GMT)
CryptoFormalEval: Integrating LLMs and Formal Verification for Automated Cryptographic Protocol Vulnerability Detection [41.9] 我々は,新たな暗号プロトコルの脆弱性を自律的に識別する大規模言語モデルの能力を評価するためのベンチマークを導入する。
私たちは、新しい、欠陥のある通信プロトコルのデータセットを作成し、AIエージェントが発見した脆弱性を自動的に検証する方法を設計しました。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:16:55 GMT)
Ensuring Safety and Trust: Analyzing the Risks of Large Language Models in Medicine [41.7] 安全で信頼性の高い医療AIのための5つの重要な原則と10の特定の側面を提案します。
この包括的枠組みの下では、1000人の専門家に検証された質問を伴う新しいMedGuardベンチマークを導入する。
11個の LLM の評価結果から,現行の言語モデルは安全アライメント機構によらず,ベンチマークのほとんどにおいて性能が劣っていることが示唆された。
この研究は、人間の監視の必要性とAI安全ガードレールの実装を浮き彫りにして、重大な安全性のギャップを浮き彫りにした。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:34:32 GMT)
From Statistical Methods to Pre-Trained Models; A Survey on Automatic Speech Recognition for Resource Scarce Urdu Language [41.3] 本稿では,東南アジア諸国で広く話されている資源制約のあるウルドゥー語について述べる。
ウルドゥーASRにおける将来の研究の現在の研究動向、技術進歩、および潜在的方向性について概説する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:39:56 GMT)
Leveraging Hierarchical Taxonomies in Prompt-based Continual Learning [41.1] 深層学習モデルの学習において,情報の整理・接続という人間の習慣を適用することが効果的な戦略として有効であることがわかった。
本稿では,モデルがより挑戦的な知識領域に集中するように促す新たな正規化損失関数を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:59:23 GMT)
Incremental Label Distribution Learning with Scalable Graph Convolutional Networks [41.0] 本稿では,ILDL(Incrmental Label Distribution Learning)を導入し,トレーニングサンプルとラベル間関係に関する重要な課題を分析した。
具体的には、新しいラベルの学習を高速化し、ラベル間の関係をグラフとして表現する、新しいラベル対応のグラディエント補償損失を開発する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:49:51 GMT)
WaterPark: A Robustness Assessment of Language Model Watermarking [40.5] WaterParkは10の最先端の透かしと12の代表的な攻撃を統合した統合プラットフォームです。
我々は既存の透かしを総合的に評価し、様々な設計選択が攻撃の堅牢性に与える影響を明らかにする。
透かし固有の検出器と一緒にジェネリック検出器を使用することで、脆弱な透かしの安全性が向上する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:09:22 GMT)
Redefining <Creative> in Dictionary: Towards an Enhanced Semantic Understanding of Creative Generation [39.9] 現在の手法は、創造的な効果を達成するために参照プロンプトやイメージに大きく依存している。
CreTokを紹介します。これは、新しいトークンとして「創造性を再定義することで、拡散モデルにメタ創造性をもたらすものです。
CreTokは、多様なテキストペアを反復的にサンプリングすることで、そのような再定義を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:22:59 GMT)
TALoS: Enhancing Semantic Scene Completion via Test-time Adaptation on the Line of Sight [39.8] 本稿では,セマンティック・シーン・コンプリートのための新しいテスト時間適応手法であるTALoSを紹介する。
我々は、ある瞬間に行われた観察が、別の瞬間にシーン完了のためのグラウンド・トゥルース(GT)として機能することに焦点を当てる。
本稿では,将来の観測が実現するまで更新を遅らせるモデルを用いた2つの最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:58:02 GMT)
Unleashing the Power of Large Language Models for Group POI Recommendations [39.5] Group Point-of-Interest(POI)推奨は、あるグループのユーザの多様な嗜好を満たす次のPOIを予測することを目的としている。
グループPOIレコメンデーションの既存の方法は、チェックインデータからの単一のIDベースの機能に依存している。
文脈認識グループPOIレコメンデーションのためのLarge Language Model(LLM)のパワーを解放するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:02:14 GMT)
Quantum Attention for Vision Transformers in High Energy Physics [39.4] 量子直交ニューラルネットワーク(QONN)を取り入れた新しいハイブリッド量子古典型視覚変換器アーキテクチャを提案する。
この研究は、次世代粒子物理学実験の計算要求に対処する量子強化モデルの可能性を強調している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:11:17 GMT)
Schema-Driven Information Extraction from Heterogeneous Tables [37.5] 本稿では、機械学習論文、化学文献、材料科学雑誌、ウェブページの4つの分野のテーブルからなるベンチマークを示す。
我々の実験は、タスク固有のパイプラインやラベルを必要とせずに、驚くほど競争力のあるパフォーマンスが達成できることを示した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:13:31 GMT)
On Diffusion Models for Multi-Agent Partial Observability: Shared Attractors, Error Bounds, and Composite Flow [37.4] 拡散モデルを用いたDEC-POMDPにおける局所的な行動観測履歴からのグローバルな状態の再構築について検討する。
ディープラーニング近似誤差により、固定点が真の状態から逸脱することを発見した。
本論文では, 理論収束が真の状態に保証されるエージェントを反復する複合拡散過程を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:05:31 GMT)
Provable unlearning in topic modeling and downstream tasks [36.6] アンラーニングの保証は、しばしば教師付き学習設定に限られる。
我々は、事前学習と微調整のパラダイムにおいて、初となるアンラーニングの理論的保証を提供する。
我々は、特定のタスクに微調整されたモデルから事前学習データを容易に解放できることを示し、ベースモデルを変更することなく、このデータを解放できることを示した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:01:04 GMT)
NCAirFL: CSI-Free Over-the-Air Federated Learning Based on Non-Coherent Detection [36.5] オーバー・ザ・エア・フェデレーションド・ラーニング(Over-the-air Federated Learning, FL)は、複数のアクセスチャネル上でプリミティブな計算を利用する。
AirFLの長年の課題は、高価なチャネル推定とフィードバックに頼ることなく、コヒーレントな信号アライメントを実現することである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:53:04 GMT)
Principles of Visual Tokens for Efficient Video Understanding [36.1] ビデオ理解は近年大きく進歩し、トランスフォーマーアーキテクチャのパワーに大きく依存している。
これにより、トークンのマージやトークンの選択など、多くのクリエイティブなソリューションが生まれました。
ほとんどの手法はモデルのコスト削減と精度維持に成功しているが、興味深いパターンが生じる。
我々はLITEと呼ばれる軽量ビデオモデルを提案し、少数のトークンを効果的に選択し、GFLOP(State-of-the-art calculation)と精度に優れる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:09:47 GMT)
How Much Data is Enough? Optimization of Data Collection for Artifact Detection in EEG Recordings [35.7] 深層学習に基づくアーティファクト検出を用いたデータ指向データ収集設計のための最適化手法を提案する。
人工物タスクの数を12から3に減らし、等尺収縮タスクの繰り返しを10から3に減らし、時には1に減らした。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:38:55 GMT)
Watermark-based Attribution of AI-Generated Content [34.9] 我々は,AI生成コンテンツの透かしに基づくユーザレベルの属性に関する最初の体系的研究を行う。
私たちのキーとなるアイデアは、GenAIサービスの各ユーザにユニークな透かしを割り当て、この透かしを、そのユーザが作成したAI生成コンテンツに埋め込むことです。
次に、アトリビューションは、与えられたコンテンツから抽出したユーザとベストマッチしたユーザを特定して実行される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:17:53 GMT)
Demonstrating the Suitability of Neuromorphic, Event-Based, Dynamic Vision Sensors for In Process Monitoring of Metallic Additive Manufacturing and Welding [34.8] イベント駆動型イメージラは、約120dBの非常に高いダイナミックレンジを持つ。
従来の8ビットイメージ器は、48dB程度のダイナミックレンジしか持たない。
イベントベースのイメージアは、100 musの順序で、タイムスケールでデータをキャプチャすることができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:06:25 GMT)
Directly observing replica symmetry breaking in a vector quantum-optical spin glass [33.7] 本稿では, アクティブな量子ガス顕微鏡を用いて, 新規な駆動散逸型ベクトル形状のスピンガラスを実現する能力を示す。
ウルトラメトリシティは、進化、タンパク質の折り畳み、気候変動、無限範囲の平衡スピングラスのモデルで出現することが知られている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:51:57 GMT)
DRL-Based Optimization for AoI and Energy Consumption in C-V2X Enabled IoV [33.3] 本稿では,C-V2X車両通信システムにおけるマルチプライオリティキューとNOMAが情報時代に与える影響を解析する。
提案手法は,エネルギー消費とAoIの両面での進歩を示すものである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:59:35 GMT)
Unsupervised Homography Estimation on Multimodal Image Pair via Alternating Optimization [32.8] 2つの画像間のホモグラフィーを推定することは、中高レベルの視覚タスクに不可欠である。
マルチモーダル画像対におけるホモグラフィーを推定するための教師なし学習フレームワークAltOを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:56:19 GMT)
Neuron Patching: Semantic-based Neuron-level Language Model Repair for Code Generation [32.2] ulModel ulImprovement via ulNeuron ulTargeting (textscMINT)は、コード言語モデル(LM)を修復するための新しいアプローチである。
textscMINTは有効で効率的で信頼性が高く、最小数のニューロンにパッチを当てることで神経モデルを修正できる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:22:06 GMT)
Majority Kernels: An Approach to Leverage Big Model Dynamics for Efficient Small Model Training [32.2] 蒸留、圧縮、量子化といった手法は、高性能な大きなモデルを利用してより小さな性能のモデルを誘導するのに役立つ。
本稿では、単一トレーニングランが同時に、より大きなパフォーマンスモデルをトレーニングし、より小さなデプロイメントモデルを導出できるという仮説を考察する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:51:32 GMT)
Bimanual Dexterity for Complex Tasks [31.5] 極端にデキスタラスで低コストで,低レイテンシで,ポータブルな両用デキスタラス遠隔操作システムであるBidexを紹介した。
より複雑なタスクのために、より高速な速度で、より良い品質データを生成するために、Bidexを見つけます。
Bidexは、モバイルのバイマニュアルロボットを、野生のタスクで操作する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:53:35 GMT)
Can Reasons Help Improve Pedestrian Intent Estimation? A Cross-Modal Approach [31.5] 歩行者の意図の背後にある直感的な推論を探索する新たな問題設定を導入する。
また,MINDREADと呼ばれる新しいマルチタスク学習フレームワークについても紹介する。
本実験では,意図予測の課題に対して,精度が5.6%,精度が7%,F1スコアが有意に向上した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:15:04 GMT)
Robust Fair Clustering with Group Membership Uncertainty Sets [31.3] 本研究では,各集団の集団レベルでの表現に近づき,各集団が制約される正準公正クラスタリング問題について検討する。
簡単なノイズモデルを導入し、意思決定者によって与えられるパラメータを少数必要とします。
本稿では,不規則性保証を証明可能なフェアクラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:12:50 GMT)
Almost Sure Convergence Rates and Concentration of Stochastic Approximation and Reinforcement Learning with Markovian Noise [31.2] カウントベース学習率を使わずにMarkovianサンプルを用いてQ$-learningの収束率を示す。
また、マルコフサンプルを用いた非政治時間差学習のための第1の集中度も提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:09:09 GMT)
Deep-Learning-Aided Alternating Least Squares for Tensor CP Decomposition and Its Application to Massive MIMO Channel Estimation [31.1] 高精度かつ低レイテンシなチャネル推定を実現するために、良質かつ高速なCP分解アルゴリズムが望まれる。
CP最小二乗法 (CPALS) は、CDDを計算するためのワークホースアルゴリズムである。
本稿では,深層ニューラルネットワーク(DNN)を用いた深層学習支援CPALS(DL-CPALS)手法を提案する。
CPDとチャネル推定の高速化と精度の両面から,提案手法の有意な改善を示す実験結果が得られた。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:19:15 GMT)
CopyrightMeter: Revisiting Copyright Protection in Text-to-image Models [30.6] 我々は17の最先端保護と16の代表的な攻撃を組み込んだ統合評価フレームワークであるPiciceMeterを開発した。
分析の結果, (i) 大部分の保護(16/17) は攻撃に対する耐性がない, (ii) ベスト保護は目標の優先度によって異なる, (iii) より高度な攻撃は保護のアップグレードを著しく促進する,という結論が得られた。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:19:10 GMT)
Large Scale Transfer Learning for Tabular Data via Language Modeling [30.4] グラフ予測のための言語モデルであるTabuLa-8Bを提案する。
4百万を超えるユニークなテーブルから210億行を超えるデータセットを使用します。
その結果,TabuLa-8Bはランダムな推測よりも15ポイント以上高い未確認のテーブル上でゼロショット精度を持つことがわかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:20:08 GMT)
Hardware Scaling Trends and Diminishing Returns in Large-Scale Distributed Training [29.4] ハードウェア構成と並列化戦略の注意深い検討が,モデルサイズ,トレーニングデータ,総計算の効果的なスケーリングに重要であることを示す。
我々は、モデルサイズ、ハードウェア構成、分散並列化戦略における大規模LLMトレーニングワークロードの性能に関する広範な実証的研究を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:05:11 GMT)
ID-Patch: Robust ID Association for Group Photo Personalization [29.4] ID-Patchは、アイデンティティと2D位置の堅牢な関連を提供する新しい方法である。
アプローチでは,同じ顔の特徴からIDパッチとID埋め込みを生成する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:55:28 GMT)
Find Any Part in 3D [29.2] オープンワールドの部分セグメンテーションを3Dで研究する。
AIの最近の進歩は、2Dで効果的なオープンワールド認識能力を示している。
本稿では,3次元部分分割のためのオープンワールド直接予測モデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:59:01 GMT)
Federated Continual Learning for Edge-AI: A Comprehensive Survey [28.9] Edge-AIでは、連合型連続学習(FCL)が命令型フレームワークとして登場している。
FCLは、動的および分散環境での学習モデルの安定的で信頼性の高いパフォーマンスを保証することを目的としている。
連立クラス連続学習,連立ドメイン連続学習,連立タスク連続学習の3つのタスク特性に基づくFCL手法について検討した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:49:28 GMT)
BetterBench: Assessing AI Benchmarks, Uncovering Issues, and Establishing Best Practices [28.7] 我々は、AIベンチマークのライフサイクル全体で46のベストプラクティスを検討し、それに対して24のAIベンチマークを評価するアセスメントフレームワークを開発した。
私たちは、大きな品質差があり、よく使われるベンチマークが重大な問題に悩まされていることに気付きました。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:38:24 GMT)
Can CDT rationalise the ex ante optimal policy via modified anthropics? [28.3] 我々は、Newcombのような一般的な問題を考慮し、合理的な自己配置の信念を形成しようとする。
我々は、世界をエージェントの動作シミュレーションとしてモデル化するアプローチを検討する。
我々は、ある条件下では、これらが元最適ポリシーを含むことを証明している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:39:49 GMT)
A substitutional quantum defect in WS$_2$ discovered by high-throughput computational screening and fabricated by site-selective STM manipulation [28.2] バンドギャップの局所化レベルを示すWS$$内の有望な量子欠陥を探索する。
硫黄置換は、最も有望な量子欠陥を可能にすることがわかった。
我々の研究は、新しい量子欠陥を設計するために、HT計算スクリーニングと新しい欠陥経路を組み合わせる方法を示している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:24:07 GMT)
VideoAutoArena: An Automated Arena for Evaluating Large Multimodal Models in Video Analysis through User Simulation [27.8] VideoAutoArenaは、LMMのビデオ分析能力を自動評価するアリーナスタイルのベンチマークである。
VideoAutoArenaは、ユーザシミュレーションを利用して、ビデオ理解におけるモデルパフォーマンスを厳格に評価する、オープンエンドで適応的な質問を生成する。
我々は、より困難なビデオ分析シナリオに対処するためにモデルをプッシュするために、障害駆動型進化戦略を導入し、徐々に疑問の複雑さを増す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:48:34 GMT)
Superpixel Cost Volume Excitation for Stereo Matching [27.8] 本研究では,スーパーピクセルソフト制約を組み込んだステレオマッチングの本質的な局所的整合性に着目する。
提案手法は,隣接する画素が同一物体に属することが前提とされ,スーパーピクセルの確率体積内によく似た強度を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:59:55 GMT)
Scaling Laws for Online Advertisement Retrieval [27.3] スケーリング法則はニューラルネットワークモデルの顕著な特性であり、大きな言語モデルの開発を著しく推進している。
近年の研究では、スケーリング法則はNLPタスクやトランスフォーマーアーキテクチャに限らず、レコメンデーションなどの領域にも適用されることが示されている。
実験コストの低いオンライン広告検索シナリオにおいて,オンライン収益のスケーリング法則と機械コストを識別するための軽量なパラダイムを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:44:59 GMT)
HHAvatar: Gaussian Head Avatar with Dynamic Hairs [27.2] 動的ヘアモデリングを用いた高忠実度頭部アバターの3次元ガウスアン制御が可能なアバターを提案する。
提案手法は,2K解像度で超高忠実なレンダリング品質を実現するため,最先端のスパースビュー法よりも優れている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:32:13 GMT)
KAAE: Numerical Reasoning for Knowledge Graphs via Knowledge-aware Attributes Learning [26.6] 数値推論は自然言語処理やレコメンダシステムなど、さまざまな人工知能応用において重要である。
既存のアプローチは、セマンティックな関連性とセマンティックなあいまいさという、モデリングにおいて2つの重要な課題に直面する。
数値推論における知識グラフ埋め込みのための新しい知識認識属性埋め込みモデル(KAAE)を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:47:03 GMT)
DMQR-RAG: Diverse Multi-Query Rewriting for RAG [26.5] 大きな言語モデルは、しばしば静的な知識と幻覚による課題に遭遇し、その信頼性を損なう。
DMQR-RAG(Diverse Multi-Query Rewriting framework)を導入し、RAGにおける文書検索と最終応答の両方の性能を改善する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:43:30 GMT)
Towards Million-Scale Adversarial Robustness Evaluation With Stronger Individual Attacks [26.4] 本稿では,ロジット空間ではなく,確率空間における対角的マージン・アタック(Probability Margin Attack, PMA)を提案する。
我々は、百万スケールのデータセットCC1Mを作成し、それを用いて、敵に訓練されたImageNetモデルの最初の百万スケールの対角ロバスト性評価を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:41:23 GMT)
Word Alignment as Preference for Machine Translation [26.0] 機械翻訳における長年の問題である幻覚と省略は、大規模な言語モデル(LLM)がMTで使用されるとより顕著になる。
本研究では,LLMに基づくMTモデルにおいて,より優れた単語アライメントを導くことによって問題を緩和する。
幻覚と排便の緩和には期待できるが,言語方向のMTの全体的な性能は相変わらず混合している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:06:56 GMT)
Generalization on the Unseen, Logic Reasoning and Degree Curriculum [25.7] 本稿では,論理的(ブール的)関数の学習について,未確認(GOTU)設定の一般化に着目して考察する。
我々は,(S)GDで訓練されたネットワークアーキテクチャがGOTUの下でどのように機能するかを検討する。
具体的には、より高次基底要素に最小のフーリエ質量を持つトレーニングデータの補間子を意味する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:16:01 GMT)
A Foundation Model for Unified Urban Spatio-Temporal Flow Prediction [25.2] 都市インフラの最適化と交通災害対応管理には,都市時流予測が不可欠である。
従来のアプローチは、グリッドベースのデータまたはグラフベースのデータに合わせた、別々のモデルに依存してきた。
本稿では,グリッドベースのグラフベースデータを統一した一般都市流予測モデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:54:52 GMT)
KOPPA: Improving Prompt-based Continual Learning with Key-Query Orthogonal Projection and Prototype-based One-Versus-All [24.5] 本稿では,新しいキークエリ学習戦略を導入し,マッチング効率を向上し,機能変更の課題に対処する。
提案手法は,現在の最先端手法を最大20%の差で超えた結果を達成するためのモデルである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:14:07 GMT)
MAS-Attention: Memory-Aware Stream Processing for Attention Acceleration on Resource-Constrained Edge Devices [24.1] 本稿では,メモリ制約付きエッジアクセラレータ上での正確なアテンション推定高速化手法を提案する。
エッジコンピューティングのシナリオではFLAT (State-of-the-art attention fusion Method) と比較して,2.75倍のスピードアップと54%のエネルギー消費削減が見られた。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:44:26 GMT)
Chanel-Orderer: A Channel-Ordering Predictor for Tri-Channel Natural Images [23.9] Chanel-Ordererは3つのチャンネルのそれぞれを、オブジェクトセマンティクスの先行値でスコアすることを学ぶ。
私たちの研究は、Chanel-Ordererが私たちの自然界の人間の視覚的な着色を模倣していることを示唆している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:53:32 GMT)
Rethinking the Power of Timestamps for Robust Time Series Forecasting: A Global-Local Fusion Perspective [23.6] 時系列予測は、金融、交通、エネルギー、医療、気候など様々な産業で重要な役割を果たしてきた。
季節情報が豊富にあるため、タイムスタンプは予測技術に堅牢なグローバルガイダンスを提供する可能性を秘めている。
本稿では,これらの問題に対処する新しいフレームワークGLAFFを提案する。
このフレームワーク内では、タイムスタンプはグローバルな依存関係をキャプチャするために個別にモデル化される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:51:18 GMT)
ChaosBench: A Multi-Channel, Physics-Based Benchmark for Subseasonal-to-Seasonal Climate Prediction [23.1] 本稿では,データ駆動型気象エミュレータの予測可能性範囲をS2Sタイムスケールに拡張するChaosBenchを提案する。
ChaosBench は、海、氷、土地の再分析生成物を含む、典型的な大気圏 ERA5 以外の変数で構成されている。
我々は、4つの国家気象機関による物理ベースの予測を、我々のデータ駆動の予測のベースラインとして評価した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:57:16 GMT)
Crocodile: Cross Experts Covariance for Disentangled Learning in Multi-Domain Recommendation [23.0] 直交学習モデル(Crocodile)のためのクロスエキスパート共分散損失を提案する。
モデル内のほとんどのパラメータからなる埋め込みにおいて、モデルドメインを認識させるために、複数の埋め込みテーブルを使用する。
クロコダイルは主要な広告シナリオで0.72%のCTRリフトと0.73%のGMVリフトを達成する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:35:09 GMT)
ESARM: 3D Emotional Speech-to-Animation via Reward Model from Automatically-Ranked Demonstrations [22.9] 本稿では,既存のモデルの欠点に対処する新しい3次元音声アニメーション(STA)生成フレームワークを提案する。
本稿では、報酬モデルと結合した新しいSTAモデルを紹介し、この組み合わせにより、音声条件下での感情と内容の疎結合を可能にする。
ベンチマークデータセット上で大規模な実験を行い,提案手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:37:37 GMT)
Extended Neural Contractive Dynamical Systems: On Multiple Tasks and Riemannian Safety Regions [22.8] 我々は最近、安定性を保証するニューラルネットワークアーキテクチャであるNCDS(Neural Contractive Dynamical Systems)を提案した。
本稿では、より慎重な正規化、複数のタスクを扱うフレームワークの条件変種、遅延障害回避に対する不確実性駆動アプローチによりフレームワークを拡張した。
実験では、開発システムは、自律ロボット工学に必要な安定性を確保しながら、通常のニューラルネットワークの柔軟性があることを検証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:20:35 GMT)
TSINR: Capturing Temporal Continuity via Implicit Neural Representations for Time Series Anomaly Detection [22.4] 時系列異常検出は、データの異常なパターンや、システムの期待する振る舞いからの逸脱を特定することを目的としている。
このタスクでは、教師なし学習を通じてポイントワイド表現を学習するリコンストラクションベースの手法が主流である。
本稿では,暗黙的ニューラル表現(INR)再構成に基づく時系列異常検出手法TSINRを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:04:43 GMT)
Adapting Vision Foundation Models for Robust Cloud Segmentation in Remote Sensing Images [22.1] クラウドセグメンテーションはリモートセンシング画像解釈において重要な課題である。
本稿では,クラウドセグメンテーションの精度とロバスト性を高めるために,Cloud-Adapterと呼ばれるパラメータ効率適応手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:37:39 GMT)
Learning to Reason Iteratively and Parallelly for Complex Visual Reasoning Scenarios [21.8] 複雑なVQAシナリオに対処するために,完全神経的反復並列機構(IPRM)を導入する。
IPRMの「イテレーティブ」は、個々の操作を動的に計算、保存、リコールするシナリオに対して、構成的なステップバイステップ推論を促進する。
その"並列(parallel)"は、異なる推論経路の同時探索を可能にし、相互に独立なオペレーションの実行をより堅牢で効率的なものにする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:39:54 GMT)
Rich Semantic Knowledge Enhanced Large Language Models for Few-shot Chinese Spell Checking [21.8] 本稿では,RS-LLM (Rich Semantic based LLMs) というコンテキスト内学習手法を用いて,大規模言語モデル (LLM) を基礎モデルとして導入する。
少数の中国固有のリッチなセマンティック構造を導入することで、LCMは、数ショットのCSCタスクにおいてBERTベースのモデルよりも優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:00:39 GMT)
Attention to Quantum Complexity [21.8] 我々は,汎用的な古典的AIフレームワークQuantum Attention Network(QuAN)を紹介する。
QuANは、測定スナップショットをトークンとして扱い、置換不変性を尊重する。
われわれはQuANを3つの異なる量子シミュレーション設定で厳格にテストしている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:27:07 GMT)
Self-testing quantum randomness expansion on an integrated photonic chip [21.4] 自己検証型量子乱数生成器(QRNG)の開発と実装
この提案は、生産規模で小型のQRNGデバイスを実装する可能性を開く。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:14:53 GMT)
Safe Exploitative Play with Untrusted Type Beliefs [21.2] 本研究では,複数のエージェントからなるシステムにおいて,一つのエージェントを制御するという考え方について検討する。
この種の信念は、しばしば過去の行動から学び、誤りである可能性が高い。
リスクと機会のトレードオフを定義し、最適のペイオフに対して得られるペイオフを比較します。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:11:21 GMT)
Decompose and Leverage Preferences from Expert Models for Improving Trustworthiness of MLLMs [21.0] MLLM(Multimodal Large Language Models)は、人間の好みに合わせて信頼性を高める。
近年の研究では、MLLMの応答を評価するための評価モデルが採用されている。
DecompGenは、オープンソースのエキスパートモデルのアンサンブルを使用する、分解可能なフレームワークである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:28:04 GMT)
Explainable LLM-driven Multi-dimensional Distillation for E-Commerce Relevance Learning [20.6] 電子商取引関連学習のための説明可能なLCM駆動多次元蒸留フレームワークを提案する。
提案手法は,eコマース関連学習性能とユーザエクスペリエンスを大幅に向上させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:30:15 GMT)
Learning to Optimize for Mixed-Integer Non-linear Programming [20.5] 混合整数非NLPプログラム(MINLP)はエネルギーシステムや輸送など様々な領域で発生するが、解決は困難である。
機械学習の最近の進歩は、最適化のための学習として知られる領域において、顕著な成功をもたらしている。
勾配を保ちながら整数出力を生成する2つの異なる補正層を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:03:40 GMT)
Training Bilingual LMs with Data Constraints in the Targeted Language [20.3] 本研究では,データ制約対象言語における事前学習モデルの性能を向上させるために,高品質なデータを利用できる補助言語からデータを抽出する手法について検討する。
本研究では,データ豊富な補助言語におけるトレーニングとデータ間のパフォーマンスギャップを,対象言語のトレーニングと比較して定量化する。
以上の結果から,より強力な補助データセットは,モデルの変更や近接言語学習の目的を伴わずに,性能向上をもたらすことが示された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:27:40 GMT)
Demystifying RCE Vulnerabilities in LLM-Integrated Apps [20.0] LangChainのようなフレームワークはLLM統合アプリ開発を支援し、カスタムアクションのためのコード実行ユーティリティ/APIを提供する。
これらの機能は理論的にはリモートコード実行(RCE)脆弱性を導入し、プロンプトインジェクションによるリモートコード実行を可能にする。
以前の研究では、これらのフレームワークのRCE脆弱性や、アプリケーションやエクスプロイトの影響を体系的に調査することはなかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:01:23 GMT)
MERLOT: A Distilled LLM-based Mixture-of-Experts Framework for Scalable Encrypted Traffic Classification [19.5] 本稿では,暗号化されたトラフィック分類に最適化された蒸留大言語モデルのスケーラブルな混合実験(MoE)による改良について述べる。
10のデータセットの実験では、最先端モデルよりも優れた、あるいは競合的なパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:01:41 GMT)
Unification of Balti and trans-border sister dialects in the essence of LLMs and AI Technology [19.3] バルティ語はシナ・チベット語、特にチベット・ビルマン語族に属する。
インド、中国、パキスタン、ネパール、チベット、ビルマ、ブータンの人口は様々である。
文化・社会・政治・宗教・地理的影響の多様さを考えると、方言の統一を前進させることが重要である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:48:21 GMT)
Constraint Learning for Parametric Point Cloud [19.2] パラメトリック点雲はCAD形状から採取され、工業生産でますます普及している。
この問題に対処するために,制約の効果を分析し,その深層学習に優しい表現を提案した。
CstNetはCAD形状解析に適した制約に基づく最初の学習手法である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:56:33 GMT)
Video2BEV: Transforming Drone Videos to BEVs for Video-based Geo-localization [19.2] 我々は、新しいビデオベースドローンジオローカライズタスクを定式化し、Video2BEVパラダイムを提案する。
このパラダイムは、ビデオをバードアイビュー(Bird's Eye View, BEV)に変換することで、その後のマッチングプロセスを簡素化する。
提案手法を検証するために,新しいビデオベースジオローカライゼーションデータセットUniVを導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:52:49 GMT)
Differentially Private Learning Beyond the Classical Dimensionality Regime [19.0] 比例次元の体系における差分私的学習について研究する。
いくつかのよく研究された微分プライベートアルゴリズムの誤差を鋭く理論的に推定する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:56:12 GMT)
Delta-Influence: Unlearning Poisons via Influence Functions [19.0] 有害なトレーニングデータから異常なモデル行動を追跡する新しいアプローチである$Delta$-Influenceを導入する。
$Delta$-Influenceは、有毒なトレーニングデータと妥協したテストポイントとのリンクを回避したデータ変換を適用します。
Delta$-Influenceはすべての設定で最高のアンラーニングを実現しています。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:15:10 GMT)
AdaptAgent: Adapting Multimodal Web Agents with Few-Shot Learning from Human Demonstrations [18.8] MLLM(Multimodal Large Language Models)を利用する最先端のマルチモーダルWebエージェントは、多くのWebタスクを自律的に実行することができる。
Webエージェントを構築するための現在の戦略は、(i)基礎となるMLLMの一般化可能性と、(ii)Web関連タスクにおけるMLLMの大規模微調整によるその操縦性に依存している。
そこで我々はAdaptAgentフレームワークを導入し、プロプライエタリなマルチモーダルWebエージェントとオープンなマルチモーダルWebエージェントの両方が、人間のデモをほとんど使わずに新しいWebサイトやドメインに適応できるようにする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:54:15 GMT)
Prediction-Guided Active Experiments [18.5] 予測誘導能動実験(PGAE)のための新しいフレームワークについて紹介する。
PGAEは、既存の機械学習モデルからの予測を活用して、サンプリングと実験をガイドする。
我々は、PGAEが効率的であり続け、一定の正則性仮定の下で同じ半パラメトリック境界を得ることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:25:33 GMT)
Universal Photorealistic Style Transfer: A Lightweight and Adaptive Approach [18.5] フォトリアリスティックなスタイル転送は、入力コンテンツのリアリズムと構造を保ちながら、スタイリゼーションを適用することを目的としている。
本稿では,高解像度画像やビデオに高精度なフォトリアリスティックスタイル転送を実現するユニバーサルフォトリアリスティックスタイル転送フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:27:25 GMT)
Adaptive Process-Guided Learning: An Application in Predicting Lake DO Concentrations [18.5] 本稿では,リカレントニューラルネットワーク(RNN)と物理モデルを統合し,湖沼における溶存酸素濃度の予測を強化するフレームワークを提案する。
我々は米国中西部の広範囲の湖で本手法を試験し,限られた訓練データでもDO濃度を予測できることを実証した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:58:20 GMT)
Is Knowledge Power? On the (Im)possibility of Learning from Strategic Interactions [18.4] 主要な問題は、エージェントが自分の好みに対する不確実性を克服し、不確実性を欠く結果を達成するかどうかである。
プレイヤーの行動が学習アルゴリズムに基づいて決定される完全に戦略的な環境での反復的な相互作用について検討する。
1人のプレイヤーがゲームについて完全な知識を持っている場合、初期情報ギャップは持続することを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:35:07 GMT)
FAST-Splat: Fast, Ambiguity-Free Semantics Transfer in Gaussian Splatting [18.2] FAST-Splat for fast, ambiguity-free semantic Gaussian Splatting。
オープン・ボキャブラリ・セマンティック・プレーティングをオープン・ボキャブラリ・セマンティック・蒸留をオープン・ボキャブラリ・セッティングに拡張する問題として定式化する。
FAST-Splatは、ガウススティングシーン表現の明示的な形式を活用することで、ガウススティングの顕著なトレーニングとレンダリング速度を維持している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:36:46 GMT)
MambaDETR: Query-based Temporal Modeling using State Space Model for Multi-View 3D Object Detection [18.1] 本稿では,効率的な状態空間に時間融合を実装することを目的として,MambaDETRという新しい手法を提案する。
標準のnuScenesベンチマークでは,提案したMambaDETRは3Dオブジェクト検出タスクにおいて顕著な結果が得られる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:47:18 GMT)
Locally Adaptive One-Class Classifier Fusion with Dynamic $\ell$p-Norm Constraints for Robust Anomaly Detection [17.9] 局所的なデータ特性に基づいて,融合重みを動的に調整するフレームワークを提案する。
本手法は,計算効率を大幅に向上させる内部点最適化手法を取り入れたものである。
計算効率を維持しながらローカルなデータパターンに適応できるフレームワークの能力は、リアルタイムアプリケーションに特に有用である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:39:23 GMT)
Robust Planning with Compound LLM Architectures: An LLM-Modulo Approach [17.9] 以前の作業では、計画とスケジューリングタスクにおいて、LLM(Large Language Model)のパフォーマンスを向上しようと試みていた。
LLM-Modulo フレームワークを用いた複合 LLM アーキテクチャの技術的評価を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:04:09 GMT)
SONNET: Enhancing Time Delay Estimation by Leveraging Simulated Audio [17.8] 学習に基づく手法は、合成データにもとづいても、新しい実世界のデータに基づいてGCC-PHATを著しく上回り得ることを示す。
トレーニングされたモデルであるSONNETは、リアルタイムに実行可能で、多くの実データアプリケーションのために、最初から新しいデータに取り組んでいます。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:23:21 GMT)
Towards Data Valuation via Asymmetric Data Shapley [17.5] 従来のデータ共有フレームワークを非対称データ共有フレームワークに拡張します。
我々は、その正確な計算のために、効率的な$k$-nearestの隣り合うアルゴリズムを導入する。
我々は、機械学習タスクやデータ市場コンテキストにまたがって、我々のフレームワークの実践的適用性を実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:27:46 GMT)
GraphCL: Graph-based Clustering for Semi-Supervised Medical Image Segmentation [17.0] 本稿では,グラフデータ構造を統合深層モデルで共同モデル化し,半教師付き医用画像分割(GraphCL)のためのグラフベースのクラスタリングを提案する。
提案したGraphCLアルゴリズムは,最先端の半教師付き医用画像分割法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:24:46 GMT)
Derivatives of Stochastic Gradient Descent in parametric optimization [16.9] グラディエントDescent (SGD) の反復剤の誘導体の挙動について検討する。
元のSGDの収束によって摂動される異なる目的関数上の不正確なSGDによって駆動されることを示す。
具体的には、定常的なステップサイズでは、これらの導関数は解導関数を中心とするノイズボール内で安定化し、消滅したステップサイズでは$O(log(k)2 / k)$収束率を示すことを示した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:04:29 GMT)
Unlocking the Power of Gradient Guidance for Structure-Based Molecule Optimization [16.7] 構造に基づく分子最適化(SBMO)は、タンパク質標的に対して連続座標と離散型の両方で分子を最適化することを目的としている。
MolJOは、様々なモードのジョイントガイダンス信号を容易にする最初の勾配ベースのSBMOフレームワークである。
MolJOはCrossDocked 2020ベンチマークで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:48:29 GMT)
Scalable Multitask Learning Using Gradient-based Estimation of Task Affinity [16.6] Grad-TAGは、様々なタスクの組み合わせからデータを繰り返し訓練することなく、タスク親和性を推定できる。
既存のアプローチと比較して,Grad-TAGは優れたパフォーマンスと実行時のトレードオフを実現していることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:13:47 GMT)
FabuLight-ASD: Unveiling Speech Activity via Body Language [16.6] マルチモーダル環境におけるアクティブ話者検出(ASD)は、ビデオ会議から人間とロボットのインタラクションに至るまで、様々な用途に不可欠である。
本稿では,顔,音声,身体のポーズ情報を統合した高度なASDモデルであるFabuLight-ASDを紹介し,検出精度とロバスト性を向上させる。
Wilder Active Speaker Detection (WASD)データセットを用いて、実世界のシナリオでFabuLight-ASDの有効性を実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:45:54 GMT)
Self-Supervised Place Recognition by Refining Temporal and Featural Pseudo Labels from Panoramic Data [16.5] 本稿では,時間的近傍と学習可能な特徴近傍を用いて未知の空間近傍を探索するTF-VPRという新しいフレームワークを提案する。
本手法は,リコール率,ロバスト性,方向多様性において,自己監督ベースラインよりも優れる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:48:31 GMT)
Adversarial Diffusion Compression for Real-World Image Super-Resolution [16.5] 現実世界の超解像は、複雑なプロセスによって劣化した低解像度の入力から高解像度の画像を再構成することを目的としている。
OSEDiffやS3Diffのような一段階拡散ネットワークはこの問題を緩和するが、それでも高い計算コストがかかる。
本稿では,一段階拡散ネットワークOSEDiffを流線形拡散GANモデルに蒸留することにより,新しいリアルISR法AdcSRを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:13:36 GMT)
Neural Internal Model Control: Learning a Robust Control Policy via Predictive Error Feedback [16.5] 本稿では,モデルベース制御とRLベース制御を統合し,ロバスト性を高めるニューラル内部モデル制御を提案する。
我々のフレームワークは、剛体力学にニュートン・オイラー方程式を適用することで予測モデルを合理化し、複雑な高次元非線形性を捉える必要がなくなる。
本研究では,四足歩行ロボットと四足歩行ロボットにおけるフレームワークの有効性を実証し,最先端の手法と比較して優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:07:42 GMT)
Attentive Contextual Attention for Cloud Removal [16.3] 雲のカバーは、地球観測のためのリモートセンシング画像の使用を著しく妨げる可能性がある。
ディープラーニング戦略は、クラウドオブサークされた領域の復元において大きな可能性を示している。
注意的文脈注意(AC-Attention)という新しいアプローチを導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:16:31 GMT)
Evaluating LLMs Capabilities Towards Understanding Social Dynamics [16.2] LlamaやChatGPTといったジェネレーティブモデルは最近、ゼロショットの質問回答機能によって人気を博している。
この研究は、ジェネレーティブLLMの社会的文脈における言語と力学を理解する能力に関する批判的な分析を提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:16:07 GMT)
RobustFormer: Noise-Robust Pre-training for images and videos [16.1] 本稿では、画像とビデオの両方でノイズロスト事前学習を可能にするRobustFormerを提案する。
提案手法は,ビデオ入力とマスク付き事前学習に適合する最初のDWT方式である。
実験の結果,MAEをベースとした事前学習により,iDWTのステップを回避でき,計算処理を大幅に削減できることがわかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:10:48 GMT)
Self-Supervised Conditional Distribution Learning on Graphs [15.7] 本稿では,従来の特徴に対して,弱い特徴と強く拡張された特徴の条件分布を整列するエンドツーエンドグラフ表現学習モデルを提案する。
このアライメントは、グラフ構造化データ拡張による本質的な意味情報の破壊のリスクを効果的に低減する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:26:36 GMT)
BiTSA: Leveraging Time Series Foundation Model for Building Energy Analytics [15.5] 本稿では対話型可視化ツールBiTSAの設計について述べる。
このツールは、マネージャが複雑なエネルギーデータを素早く解釈し、リアルタイムの洞察に基づいて、即座にデータ駆動のアクションを取ることを可能にする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:49:06 GMT)
A Gap in Time: The Challenge of Processing Heterogeneous IoT Data in Digitalized Buildings [15.5] 本研究は, ビル内およびビル間におけるIoTデータの多様性について検討した。
その結果、マルチモーダルデータ統合、ドメインインフォームドモデリング、自動データエンジニアリングパイプラインの必要性が強調された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:50:50 GMT)
GazeGaussian: High-Fidelity Gaze Redirection with 3D Gaussian Splatting [15.5] 本稿では,2ストリーム3DGSモデルを用いて顔領域と眼領域を別々に表現する高忠実な視線リダイレクト手法であるGazeGaussianを提案する。
GazeGaussianは、レンダリング速度、視線リダイレクト精度、複数のデータセット間での顔合成において、既存の方法よりも優れています。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:15:23 GMT)
Smart Pressure e-Mat for Human Sleeping Posture and Dynamic Activity Recognition [15.5] 本稿では, 睡眠姿勢, スポーツ, ヨガの認識を含む, 人体監視用スマートプレッシャe-Mat (SPeM) システムを提案する。
ディープニューラルネットワーク(DNN)は、圧力画像ストリームに適合し、トレーニングし、対応する人間の行動を認識するために使用される。
SPeMシステムは両方のアプリケーションで高い精度を実現し、モデルの精度と一般化性を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:47:25 GMT)
Fast and Sample Efficient Multi-Task Representation Learning in Stochastic Contextual Bandits [15.3] 本研究では,表現学習が文脈的包帯問題の学習効率を向上させる方法について検討する。
本稿では,予測勾配勾配(GD)と最小化推定器に基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:52:50 GMT)
LightLLM: A Versatile Large Language Model for Predictive Light Sensing [15.3] LightLLMは、光ベースのセンシングタスクのための訓練済みの大規模言語モデル(LLM)を微調整するモデルである。
センサーデータエンコーダを統合して、重要な特徴を抽出し、環境情報を提供するためのコンテキストプロンプトと、これらの入力を統一された表現に結合する融合層を統合する。
光による局所化,屋外日射予測,室内日射推定の3つのタスクにLightLLMを実装した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:37:33 GMT)
Deep Learning-based Code Reviews: A Paradigm Shift or a Double-Edged Sword? [15.0] 私たちは、自動生成されたコードレビューのサポートなしで、異なるプログラムをレビューする29人の専門家による制御された実験を実行しました。
本研究は,LLMが自動認識する問題の大部分をレビュアが有効とみなし,自動化されたレビューを出発点として利用できることが,彼らの行動に強く影響していることを示す。
しかし、自動化されたレビューから始まったレビュアーは、完全な手作業のプロセスと比較して、より高重度な問題を特定できない一方で、より多くの低重度な問題を特定した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:44:18 GMT)
AIDBench: A benchmark for evaluating the authorship identification capability of large language models [14.9] 我々は、大きな言語モデル(LLM)が匿名テキストの作者を特定するのに役立つ、特定のプライバシーリスクに焦点を当てる。
AIDBenchは、メール、ブログ、レビュー、記事、研究論文など、いくつかの著者識別データセットを組み込んだ新しいベンチマークである。
AIDBenchによる我々の実験は、LLMがランダムな確率よりもはるかに高い確率で著者を推測できることを示し、これらの強力なモデルによって引き起こされる新たなプライバシーリスクを明らかにした。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:41:08 GMT)
SRA-MCTS: Self-driven Reasoning Augmentation with Monte Carlo Tree Search for Enhanced Code Generation [14.8] 大規模な言語モデルは、単純なコード生成タスクでは例外的なパフォーマンスを示しますが、複雑な問題に対処する上での課題に直面します。
本稿では,高品質な中間推論経路を自律的に生成するモデルであるSRA-MCTSを提案する。
我々の手法は、追加の監督を必要とせず、モデル自体を通して完全に機能する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:34:47 GMT)
ORID: Organ-Regional Information Driven Framework for Radiology Report Generation [14.5] 放射線学報告生成(RRG)の目的は、放射線画像に基づいて疾患のコヒーレントなテキスト解析を自動的に生成することである。
RRGの現在のAIベースの方法は、主にエンコーダ-デコーダモデルアーキテクチャの変更に焦点を当てている。
本稿では,マルチモーダル情報を有効に統合できるOrgan-Regional Information Driven (ORID)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:13:43 GMT)
TEG-DB: A Comprehensive Dataset and Benchmark of Textual-Edge Graphs [14.4] Text-Attributed Graphs (TAG)は、自然言語記述によるグラフ構造を強化し、データとその相互接続の詳細な描写を容易にする。
既存のTAGデータセットは、主にノードでのみテキスト情報を特徴付けており、エッジは通常、単なるバイナリまたはカテゴリ属性で表される。
このギャップに対処するため、ノードとエッジにリッチなテキスト記述を備えたTextual-Edge Graphsデータセットを導入しました。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:47:58 GMT)
Sampling with Adaptive Variance for Multimodal Distributions [14.1] 本研究では,有界領域に対する分布サンプリングアルゴリズムのクラスを提案し,解析する。
そこで,ギブズポテンシャルに関する情報を使わずに,導関数のないバージョンをサンプリングに利用できることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:05:47 GMT)
The Information Security Awareness of Large Language Models [14.1] 大規模言語モデル(LLM)は、様々な背景を持つ人々の生活の様々な側面を支援するために、ユビキタスになった。
情報セキュリティ意識(ISA)の観点からの行動調査は, 極めて不十分である。
現在最も人気のあるLCMのいくつかに固有のISAは様々であり、ほとんどのモデルでは、明確なセキュリティコンテキストでユーザープロンプトを必要とする。
これらのシナリオは、モバイル分類で定義されたすべての焦点領域に関して評価されたモデルをベンチマークする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:09:55 GMT)
Automatic marker-free registration based on similar tetrahedras for single-tree point clouds [14.0] 本稿では,類似のテトラヘドラに基づく単一ツリー点雲のマーカーフリー自動登録法を提案する。
提案手法はICPとNDTの両方の登録精度を著しく上回り、ICPとNDTの最大速度は593倍、NDTの最大速度は113倍である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:34:47 GMT)
Epinet for Content Cold Start [14.0] epinetsは、学習モデルが複雑なニューラルネットワークである場合でも、トンプソンサンプリングの効率的な近似を可能にする。
実験では,Facebook Reelsオンラインビデオプラットフォーム上でのユーザトラフィックとエンゲージメント効率の改善を実証した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:43:27 GMT)
Finite-Time Complexity of Online Primal-Dual Natural Actor-Critic Algorithm for Constrained Markov Decision Processes [13.9] そこで我々は,コストの抑えられたマルコフ決定プロセス問題を解決するために,オンライン・プリマル・デュアル・アクター・クリティカル法について検討した。
本稿では,CMDP問題の解法として,オンライン・プリマル・デュアル・アクター・クリティカル法の有限時間複雑性を初めて検討した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:59:39 GMT)
Vertical Validation: Evaluating Implicit Generative Models for Graphs on Thin Support Regions [13.9] 暗黙のグラフ生成モデルは、医薬品や材料設計のための新しい分子を設計または発見するために用いられる。
暗黙グラフ生成モデルの事前評価手法は、厚い支持から計算された統計の検証に重点を置いている。
Vertical Validation (VV) と呼ばれる新しい評価手法は, 試験分割処理中に薄い支持領域を生成し, 保持試験データと比較できるように, 生成したサンプルを再重み付けする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:29:59 GMT)
Multimodal large language model for wheat breeding: a new exploration of smart breeding [13.8] 繁殖の多分野的な性質は、知識採掘に技術的障壁と効率性の課題をもたらした。
本研究では、教師付き微調整(SFT)、検索強化生成(RAG)、人間フィードバック(RLHF)技術による強化学習を用いて、クロスドメイン知識をMLLMに注入した。
WBLMは、表現型推定、環境ストレスアセスメント、ターゲット胚細胞スクリーニング、栽培技術推奨、種価照会タスクのための専門的な意思決定支援回答を生成することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:47:42 GMT)
Exploring the Low-Pass Filtering Behavior in Image Super-Resolution [13.8] 本稿では,画像超解像におけるディープニューラルネットワークの挙動の解釈を試みる。
ISRタスクにおけるニューラルネットワークの動作を分析するために,Hybrid Response Analysis (HyRA) という手法を提案する。
最後に、注入された高周波情報を定量化するために、周波数スペクトル分布類似性(FSDS)と呼ばれる画像から画像へのタスクのメトリクスを導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:52:24 GMT)
Song Form-aware Full-Song Text-to-Lyrics Generation with Multi-Level Granularity Syllable Count Control [13.7] 単語,フレーズ,行,段落レベルで多段階の音節制御を可能にする歌詞生成フレームワークを提案する。
提案手法は,入力テキストと歌唱形式に条件付けされた完全な歌詞を生成し,特定の音節制約に適合することを保証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:57:58 GMT)
Cross-Camera Distracted Driver Classification through Feature Disentanglement and Contrastive Learning [13.6] 車両内のカメラ位置の変化に耐えられるような頑健なモデルを導入する。
我々のドライバ行動監視ネットワーク(DBMNet)は軽量なバックボーンに依存し、アンタングルメントモジュールを統合する。
100-Driverデータセットの夜間および夜間のサブセットで行った実験は、我々のアプローチの有効性を検証した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:27:12 GMT)
Real-Time Energy-Optimal Path Planning for Electric Vehicles [13.4] エネルギー計算にキーカーの動力学パラメータを組み込んだ正確なエネルギーモデルを構築した。
また、2つの新しいオンラインリウェイト機能を導入し、より高速で、前処理のないパスフィニングを可能にします。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:39:08 GMT)
Accurate Eye Tracking from Dense 3D Surface Reconstructions using Single-Shot Deflectometry [13.3] 単発位相計測-デフレクトメトリー(PMD)を用いた視線方向の高精度かつ高速な評価法を提案する。
本手法は,1枚のカメラフレーム(単一ショット)内でのみ,角膜および頭蓋骨の高密度な3次元表面情報を取得する。
実写モデル眼における視線誤差を0.12円以下で実験的に評価し,本手法の有効性を示した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:20:02 GMT)
No Representation, No Trust: Connecting Representation, Collapse, and Trust Issues in PPO [13.3] 本研究では,Atari環境とMuJoCo環境におけるPPOの表現動態について検討した。
これは、強い非定常性によって悪化し、最終的に俳優のパフォーマンスが崩壊することを示します。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:07:04 GMT)
DriveMLLM: A Benchmark for Spatial Understanding with Multimodal Large Language Models in Autonomous Driving [13.1] 自律運転におけるマルチモーダル大言語モデル(MLLM)の空間的理解能力を評価するためのベンチマークであるDriveMLLMを紹介する。
DriveMLLMには2,734個の前面カメライメージが含まれており、言語学的に多様な自然言語問題を伴う絶対的および相対的空間推論タスクが導入されている。
我々は,DriveMLLMにおける最先端MLLMの評価を行い,運転環境における複雑な空間的関係を理解する上での現在のモデルの限界を明らかにした。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:14:01 GMT)
Efficient Streaming Voice Steganalysis in Challenging Detection Scenarios [13.0] 本稿ではDVSF(Dual-View VoIP Steganalysis Framework)を紹介する。
このフレームワークは、VoIPストリームセグメント内のネイティブステガノグラフ記述子の一部をランダムに難読化する。
次に、VoIPのグローバル機能に基づいて、ステガノグラフィーに関連するきめ細かい局所的特徴をキャプチャする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:22:58 GMT)
On the Way to LLM Personalization: Learning to Remember User Conversations [13.0] 大規模言語モデル(LLM)は、すぐに様々なタスクの貴重なアシスタントとなりました。
しかし、その効果は、パーソナライズによる人間の好みや行動に対する反応を調整できる能力によって制限されている。
従来の会話の知識をLCMに注入し、冗長でパーソナライズドな会話に将来の作業を可能にすることを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:45:08 GMT)
X as Supervision: Contending with Depth Ambiguity in Unsupervised Monocular 3D Pose Estimation [12.8] マルチハイポテーシス検出と複数の調整済みプレテキストタスクを特徴とする教師なしフレームワークを提案する。
ローカルウィンドウ内のヒートマップから複数の仮説を抽出し、マルチソリューション問題を効果的に管理する。
プリテキストタスクは、SMPLモデルからの3D人間の事前情報を利用して、ポーズ推定の解空間を規則化し、それを3D人間の構造を経験的分布と整合させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:18:11 GMT)
Dist Loss: Enhancing Regression in Few-Shot Region through Distribution Distance Constraint [12.8] Dist Lossは、モデルとターゲットラベルの間の分布距離を最小限に抑えるために設計された損失関数である。
コンピュータビジョンとヘルスケアにまたがる3つのデータセットを対象に実験を行った。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:17:40 GMT)
Preferences Evolve And So Should Your Bandits: Bandits with Evolving States for Online Platforms [12.4] 本稿では,決定論的に進化し,観測不能な状態を考慮しながら,帯域幅フィードバックによる学習モデルを提案する。
我々のモデルにおけるワークホースの応用は、レコメンデーションシステムのための学習とオンライン広告のための学習である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:25:16 GMT)
Label Distribution Shift-Aware Prediction Refinement for Test-Time Adaptation [12.2] テスト時間適応(DART)のためのラベル分散シフト予測の改良について紹介する。
DARTは、クラスワイドの混乱パターンに着目して予測を洗練する新しいTTA手法である。
CIFAR-10Cではラベル分布シフトがない場合,CIFAR-10Cでは精度が5-18%向上する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:58:52 GMT)
Conditional Denoising Diffusion Probabilistic Models for Data Reconstruction Enhancement in Wireless Communications [12.2] 無線チャネル上でのデータ伝送と再構成を強化するために,条件付き拡散確率モデル(DDPM)を提案する。
これに触発された鍵となる考え方は、情報信号の「ノイズからクリーン」変換を学ぶ際に、拡散モデルの生成的先行性を活用することである。
提案手法は,情報内容の事前知識が利用可能な通信シナリオに有効である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:24:25 GMT)
Brainformer: Mimic Human Visual Brain Functions to Machine Vision Models via fMRI [12.2] 本稿では,人間の知覚システムにおけるfMRIパターンを解析するためのBrainformerという新しいフレームワークを紹介する。
この研究は、人間の知覚からニューラルネットワークに知識を移すための先進的なアプローチを導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:11:42 GMT)
Auxiliary MCMC and particle Gibbs samplers for parallelisable inference in latent dynamical systems [12.1] 本研究では,高次元(時間ステップ数と潜時空間次元)非線型非ガウス潜在力学モデルからサンプリングするための効率的なMCMCアルゴリズムの設計問題について検討する。
モデルに補助的な観測変数を導入することにより、大きな状態空間モデルに対して効率的にカルマンベースのサンプルを実装できることを示す。
我々は、これらの補助サンプルを時間次元に沿って並列化する方法を示し、その結果、時間ステップの数と対数的にスケールするアルゴリズムを生み出した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:39:28 GMT)
No Free Delivery Service: Epistemic limits of passive data collection in complex social systems [12.0] 複雑な社会システムにおいて広く考慮されている推論設定において、列車試験のパラダイムは正当化を欠いているだけでなく、リスク推定装置に対して実際に無効であることを示す。
私は、広く使われているMovieLensベンチマークを通じてこれらの結果を説明し、これらの結果が社会システムにおけるAIに与える影響について議論することで結論付けています。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:01:03 GMT)
Paying more attention to local contrast: improving infrared small target detection performance via prior knowledge [11.9] 本稿では,局所コントラスト注意向上型赤外小型目標検出ネットワーク(LCAE-Net)を提案する。
パラメータカウントと浮動小数点演算(FLOP)はそれぞれ1.945Mと4.862Gであり、エッジデバイスへの展開に適している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:21:30 GMT)
CPGA: Coding Priors-Guided Aggregation Network for Compressed Video Quality Enhancement [11.9] 符号化先行情報から時間的・空間的情報を利用するために,CPGA(Coding Priors-Guided Aggregation)ネットワークを開発した。
圧縮ビデオ品質向上(VQE)の研究を容易にするため,ビデオ符号化優先データセットを構築した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:58:25 GMT)
Causal and Counterfactual Views of Missing Data Models [11.7] 欠落したデータの識別仮定をグラフィカルモデルでエンコードする方法を示す。
欠落データと因果同定理論の類似点と相違点に注目する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:20:11 GMT)
Existential Conversations with Large Language Models: Content, Community, and Culture [11.6] 大規模な言語モデルは、哲学、スピリチュアリティ、宗教など、幅広いトピックにユーザを巻き込むことができる。
我々は、おそらく古代と近代の両方の、画像、神話、比喩、そして言語モデルが引き起こす概念的エソテリカの広範なレパートリーの源流を辿っている。
LLMとの関わりが社会に与える影響を考察する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:35:22 GMT)
A Survey on Human-Centric LLMs [11.5] 大型言語モデル(LLM)は人間の認知と行動をシミュレートすることができる。
この調査は個々のタスクと集合タスクの両方のパフォーマンスに焦点を当てている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:34:44 GMT)
LMM-driven Semantic Image-Text Coding for Ultra Low-bitrate Learned Image Compression [11.4] 本稿では,一つのモデルでキャプションを生成し,圧縮することが可能であることを実証する。
また,任意のlicネットワークに適用可能な,セマンティック・パーセプティブ指向の微調整手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:43:37 GMT)
DAOcc: 3D Object Detection Assisted Multi-Sensor Fusion for 3D Occupancy Prediction [11.3] マルチセンサー融合は3次元意味的占有予測の精度と堅牢性を著しく向上させる。
既存のアプローチのほとんどは、トップパフォーマンスを達成するために大きな画像解像度と複雑なネットワークに依存している。
本稿では,3次元物体検出監視を利用して優れた性能を実現する,新しいマルチモーダル占有予測フレームワークであるBEccを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:54:39 GMT)
TP-UNet: Temporal Prompt Guided UNet for Medical Image Segmentation [11.2] スキャン画像中の臓器の順序は、UNetに基づく現在の医用画像分割アプローチでは無視されている。
本稿では,臓器構成関係を含む時間的プロンプトを利用するTP-UNetを提案し,セグメンテーションUNetモデルを導出する。
我々のフレームワークは、時間的プロンプトと画像の特徴を効果的に組み合わせるために、教師なしのコントラスト学習に基づく横断的アライメントと意味的アライメントを備えている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:24:26 GMT)
Analysis and Synthesis Denoisers for Forward-Backward Plug-and-Play Algorithms [11.0] 本稿では,合成復号化問題を近接演算子とみなすことができることを示す。
FB-内の「1つのサブイット」戦略は、ウォーム・リスタート戦略を使用すると無限であると解釈できることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:43:40 GMT)
dc-GAN: Dual-Conditioned GAN for Face Demorphing From a Single Morph [10.9] そこで本研究では, モーフィック画像に条件付き新規なGANデモルフィック法であるdc-GANを提案する。
提案手法は, 形態の再現性を克服し, ボナフィド画像の高品質な再構成を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:24:30 GMT)
Versatile photonic frequency synthetic dimensions using a single Mach-Zehnder-interferometer-assisted device on thin-film lithium niobate [10.9] 我々はTFLNプラットフォーム上で2共振器の試作機を試作した。
強結合格子, トポロジカルホール・ラグ, クルーツ・ラグなどのよく知られたモデルを実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:56:55 GMT)
MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving [10.7] 視覚言語モデル(VLM)は、自律運転における汎用的なエンドツーエンドモデルとして機能する。
既存のほとんどの手法は計算コストのかかるビジュアルエンコーダと大言語モデル(LLM)に依存している。
提案するFE-MoE(Feature Engineering Mixture of Experts)モジュールとDI-Adapter(Dynamic Instruction Adapter)を組み込んだMiniDriveという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:34:21 GMT)
Towards Unbiased and Robust Spatio-Temporal Scene Graph Generation and Anticipation [10.7] Imparは、カリキュラム学習と損失マスキングを利用してバイアス発生と予測モデリングを緩和する新しいトレーニングフレームワークである。
本稿では,STSGモデルの分散シフトに対する堅牢性を評価するために,Robust Spatio-Temporal Scene Graph GenerationとRobust Scene Graph Precipationという2つの新しいタスクを導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:15:28 GMT)
RTSR: A Real-Time Super-Resolution Model for AV1 Compressed Content [10.6] 超解像度(SR)は、映像コンテンツの視覚的品質を改善するための重要な技術である。
リアルタイム再生をサポートするためには,高速SRモデルの実装が重要である。
本稿では,圧縮映像の視覚的品質を高めるために,低複雑さSR手法RTSRを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:36:06 GMT)
Generating Visual Stimuli from EEG Recordings using Transformer-encoder based EEG encoder and GAN [10.4] 脳波信号からの画像の合成を中心に、知覚脳復号の分野における近代的な研究課題に取り組む。
本研究の目的は、被験者が画像を見たときに得られる脳波記録を利用して、様々な対象カテゴリに属する画像を再現することである。
我々はTransformer-encoderベースのEEGエンコーダを用いて、GANネットワークのジェネレータコンポーネントへの入力としてEEGエンコーダを生成する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:35:03 GMT)
Shrinking POMCP: A Framework for Real-Time UAV Search and Rescue [10.4] 本稿では,UAVによる周辺地域の捜索救助活動の最適化に包括的アプローチを提案する。
経路計画問題は部分的に観測可能なマルコフ決定過程(POMDP)として定式化される
本稿では,時間制約に対処する新しいShrinking POMCP'アプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:41:29 GMT)
FASTNav: Fine-tuned Adaptive Small-language-models Trained for Multi-point Robot Navigation [10.4] 本稿では,ロボットナビゲーションのための軽量言語モデル(SLM)の強化手法であるFASTNavを提案する。
シミュレーションと実ロボットの両方でFASTNavを用いてモデルをトレーニングし、評価し、低コスト、高精度、低応答時間でデプロイできることを証明した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:28:13 GMT)
Scalable Deep Metric Learning on Attributed Graphs [10.1] 本研究では,深度測定と非偏差学習を併用したグラフ埋め込み手法を提案する。
マルチクラス損失関数に基づいて、半教師なし学習のためのDMTと教師なしケースのためのDMAT-iという2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:34:31 GMT)
Decomposition Pipeline for Large-Scale Portfolio Optimization with Applications to Near-Term Quantum Computing [10.0] ポートフォリオ最適化と制約付きの問題の再バランスは、しばしば難解か、正確に解くのが困難である。
我々のパイプラインは、実世界のポートフォリオ最適化問題を、約80%の削減でサブプロブレムに一貫して分解する。
大きな問題をいくつかの小さなサブプロブレムに分解することで、パイプラインは短期量子デバイスをソルバとして使用することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:04:54 GMT)
Globally Correlation-Aware Hard Negative Generation [10.0] 我々はGCA-HNG(Globally correlation-Aware Hard Negative Generation)フレームワークを提案する。
GCA-HNGはまず、グローバルな視点からサンプル相関を学習し、これらの相関を利用して、硬度適応的で多様な負を生成する。
実験の結果,提案したGCA-HNGは4つの画像検索ベンチマークデータセットの関連手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:19:12 GMT)
BIPro: Zero-shot Chinese Poem Generation via Block Inverse Prompting Constrained Generation Framework [10.0] 本稿では,Block Inverse Prompting (BIPro) 制約付き生成フレームワークを紹介する。
BIProは2つのブロック逆プロンプト手法を利用して、人間の文章の書き方を模倣する修正と書き直しを行う。
オープンドメインの漢詩生成の厳しい制約付き生成タスクにおいて、ゼロショット生成品質を著しく向上させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:56:56 GMT)
JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation [10.0] JoyVASAは、音声駆動型顔アニメーションにおける顔の動きと頭部の動きを生成する拡散法である。
本研究では,静的な3次元顔表現から動的表情を分離する分離された顔表現フレームワークを提案する。
第2段階では、拡散変圧器を訓練し、文字の同一性によらず、オーディオキューから直接動作シーケンスを生成する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:56:02 GMT)
Omnipredicting Single-Index Models with Multi-Index Models [9.8] 単調なリプシッツリンク関数によって引き起こされる任意の損失に対して、$varepsilon$-competitive であるオムニプレクタを出力する学習者を与える。
我々のアルゴリズムでは,$approx varepsilon-4$サンプルをほぼ線形時間で実行し,リンク関数がbi-Lipschitzであれば$approx varepsilon-2$に改善する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:20:49 GMT)
Practical Compact Deep Compressed Sensing [9.7] 汎用画像CSのためのPCNetという,実用的でコンパクトなネットワークを提案する。
PCNetでは、ディープ条件フィルタリングステップとデュアルブランチ高速サンプリングステップからなる新しい協調サンプリング演算子が設計されている。
我々のPCNetは、再構成のための改良された勾配降下アルゴリズム付きネットワークを備えている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:17:16 GMT)
AGLP: A Graph Learning Perspective for Semi-supervised Domain Adaptation [9.6] 半教師付きドメイン適応(SSDA)において、このモデルは、部分的にラベル付けされたターゲットドメインデータと大量のラベル付けされたソースドメインデータを活用することを目的としている。
本稿では,半教師付きドメイン適応のためのグラフ学習視点(AGLP)を提案する。
グラフ畳み込みネットワークをインスタンスグラフに適用することにより,重み付きグラフエッジに沿って構造情報を伝搬することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:41:41 GMT)
CRT-Fusion: Camera, Radar, Temporal Fusion Using Motion Information for 3D Object Detection [9.5] 本稿では,レーダカメラ融合に時間情報を統合する新しいフレームワークであるCRT-Fusionを紹介する。
CRT-Fusionはレーダーカメラによる3Dオブジェクト検出のための最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:24:53 GMT)
Robust SG-NeRF: Robust Scene Graph Aided Neural Surface Reconstruction [9.4] 既存のポーズ-NeRF共同最適化手法は、小さなノイズ(インレーシ)を持つポーズを効果的に扱うが、大きなノイズ(インレーシ)に苦慮する。
本研究は,外乱ポーズの影響を緩和することに焦点を当てる。
提案手法は,データ作成期間中に収集したシーングラフ情報を活用するため,不整合・不整合信頼度推定手法を統合する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:48:06 GMT)
Sensing atomic superfluid rotation beyond the standard quantum limit [9.2] リングトラップ内のボース・アインシュタイン凝縮体(BEC)を用いて形成された原子超流体は、超流動流体力学、量子センシング、物質波干渉計の文脈で研究されている。
近年の研究では、環BECを軌道角運動量を持つ光学キャビティモードに結合させることにより、縮合体の回転を最小限に破壊的に測定する手法が提案されている。
圧縮光とバックアクション回避技術を用いることで、凝縮体の角運動量が標準量子限界よりかなり低いノイズで感知できることを実証するために、詳細な理論的解析を行った。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:20:23 GMT)
Operator learning without the adjoint [9.1] 我々は、随伴を問うことなく、自己随伴でない無限次元コンパクト作用素の族を近似することができることを証明した。
我々は随伴のないサンプル複雑性を導出する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:38:29 GMT)
Sounds Good? Fast and Secure Contact Exchange in Groups [9.1] 我々は,技術の現状,SafeSlinger,新たに設計されたプロトコルであるPairSonicの2つのセキュアなコンタクト交換システムの有用性を評価した。
我々は、異なるプロトコルコンポーネントのユーザ認識について論じ、CSCWアプリケーションシナリオにおける残りのユーザビリティ障壁を特定する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:23:07 GMT)
Basic syntax from speech: Spontaneous concatenation in unsupervised deep neural networks [8.7] 私たちは構文の最もユビキタスで初歩的な部分操作の1つに焦点を合わせます。
本稿では,個々の単語の音響記録を訓練した畳み込みニューラルネットワーク(CNN)が出力を発生させる現象について紹介する。
また、結合性や構成性への神経経路を概説するディスインヒビション(disinhibition)と呼ばれる潜在的な神経機構を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:30:49 GMT)
Sampling and Integration of Logconcave Functions by Algorithmic Diffusion [8.7] 任意の対数凹関数のサンプリング,丸化,統合の複雑さについて検討する。
我々の新しいアプローチは、一般的なログコンケーブ関数に対して、20年近くで最初の複雑さの改善を提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:10:24 GMT)
Improving OOD Generalization of Pre-trained Encoders via Aligned Embedding-Space Ensembles [8.2] MNISTデータセットによる実験結果から,埋め込み空間のアンサンブル法は,単一エンコーダと比較して,分布内およびOODデータの事前学習による埋め込み品質を向上させることが示された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:50:50 GMT)
What You See Is What Matters: A Novel Visual and Physics-Based Metric for Evaluating Video Generation Quality [8.1] VAMPは、フレーム間の色、形状、テクスチャの整合性を評価する外観スコアと、物体の動きのリアリズムを評価する運動スコアの2つの主要コンポーネントで構成されている。
劣化映像評価では, 実ビデオに様々な汚職を導入し, 汚職重大度とVAMPスコアの相関を計測する。
生成されたビデオ評価では、最先端のモデルを用いて、慎重に設計されたプロンプトからビデオを生成し、VAMPのパフォーマンスと人間の評価者のランキングを比較する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:40:00 GMT)
S$^2$ALM: Sequence-Structure Pre-trained Large Language Model for Comprehensive Antibody Representation Learning [8.1] 抗体は、特定の抗原に正確かつ強力な結合を通じて健康を守り、新型コロナウイルスを含む多くの疾患の治療に有望な治療効果を示す。
バイオメディカル言語モデルの最近の進歩は、複雑な生物学的構造や機能を理解する大きな可能性を示している。
本稿では,1つの総合的抗体基盤モデルにおいて,包括的および構造的情報を組み合わせたシーケンス構造型多段階事前訓練抗体言語モデル(S$2$ALM)を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:24:26 GMT)
Engagement-Driven Content Generation with Large Language Models [8.0] 大規模言語モデル(LLM)は1対1の相互作用において重要な説得能力を示す。
本研究では,相互接続型ユーザにおけるLCMの社会的影響と複雑な意見力学について検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:40:08 GMT)
Quantum-Brain: Quantum-Inspired Neural Network Approach to Vision-Brain Understanding [7.9] 視覚脳理解は、人間の知覚から脳信号に関する意味情報を抽出することを目的としている。
本稿では、視覚脳理解問題に対処する量子インスパイアされたニューラルネットワークを提案する。
提案手法は,fMRIボクセル間の接続性を学習し,人間の知覚から得られる意味情報を強化する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:59:47 GMT)
Identity Preserving 3D Head Stylization with Multiview Score Distillation [7.8] 3Dヘッドスタイリングは、リアルな顔の特徴を芸術的な表現に変換し、ゲームやバーチャルリアリティーアプリケーションにおけるユーザーのエンゲージメントを高める。
本稿では,PanoHeadモデルを活用することで,360度の総合的な視点から画像を合成することで,これらの課題に対処する。
本稿では, 否定対数類似蒸留(LD)を利用した新しい枠組みを提案し, アイデンティティの保存とスタイリゼーション品質の向上を図る。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:37:58 GMT)
In-and-Out: Algorithmic Diffusion for Sampling Convex Bodies [7.7] 高次元凸体を一様にサンプリングするための新しいランダムウォークを提案する。
出力をより強力な保証で、最先端のランタイムの複雑さを実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:01:42 GMT)
Learning based Ge'ez character handwritten recognition [7.7] 文化的・歴史的に重要な古代エチオピア文字であるゲエズは、筆跡認識研究においてほとんど無視されてきた。
畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ネットワークを用いた手書き文字認識システムを開発した。
まず、CNNが個々の文字の認識を訓練し、LSTMに基づく単語認識システムのための特徴抽出器として機能する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:22:15 GMT)
Word-level Sign Language Recognition with Multi-stream Neural Networks Focusing on Local Regions and Skeletal Information [7.7] 単語レベル手話認識(WSLR)は,言語障害のある人と聞き取れる人のコミュニケーション障壁を克服することが期待されているため,注目されている。
動作認識のために設計された手法は最先端の精度を実現した。
本稿では,WSLR問題に特に有用な情報を考慮した新しいWSLR手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:16:16 GMT)
DexRay: A Simple, yet Effective Deep Learning Approach to Android Malware Detection based on Image Representation of Bytecode [7.6] 画像に基づくマルウェア検出のためのベースラインパイプラインを,簡単なステップで開発・評価する。
アプリケーションDEXファイルのバイトコードをグレースケールの「ベクター」画像に変換し、1次元畳み込みニューラルネットワークモデルにフィードするDexRayを提案する。
158k以上のアプリケーションで評価されたDexRayの性能は、単純ではあるが、我々のアプローチは高い検出率で有効であることを示している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:31:37 GMT)
On Targeted Manipulation and Deception when Optimizing LLMs for User Feedback [7.5] 人間のフィードバックを最大限にするためのトレーニングは、AIの逆インセンティブ構造を生み出します。
操作や騙しといった極端な形式の「フィードバックゲーム」が確実に学習されていることがわかった。
ユーザフィードバックなどゲーム可能なフィードバックソースをRLのターゲットとして使用するリスクを、私たちの結果が強調できることを願っています。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:50:01 GMT)
Multiview Scene Graph [7.5] 適切なシーン表現は、空間知性の追求の中心である。
未提示画像からマルチビューシーングラフ(MSG)を構築することを提案する。
MSGは、場所とオブジェクトノードを相互接続したシーンをトポロジ的に表現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:49:23 GMT)
Why Rectified Power Unit Networks Fail and How to Improve It: An Effective Theory Perspective [7.4] Rectified Power Unit (RePU) のアクティベーション機能は、ニューラルネットワークを構築する際に微分可能な関数であるという利点がある。
本稿では,RePUのアドバンテージを維持しつつ,その欠点を克服する新たなアクティベーション機能を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:00:31 GMT)
FORAY: Towards Effective Attack Synthesis against Deep Logical Vulnerabilities in DeFi Protocols [7.4] 我々は,DeFiプロトコルの深い論理的バグに対して,非常に効果的な攻撃合成フレームワークであるForayを紹介する。
DSLに基づいて、まず指定されたDeFiプロトコルをトークンフローグラフにコンパイルします。
そこで我々は,特定の攻撃目標に対する攻撃スケッチを合成する効率的なスケッチ生成手法を設計した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:15:42 GMT)
SimPhony: A Device-Circuit-Architecture Cross-Layer Modeling and Simulation Framework for Heterogeneous Electronic-Photonic AI System [7.4] 異種電子フォトニックAIシステムのための多層モデリングおよびシミュレーションフレームワークであるSimPhonyを提案する。
SimPhonyは、統一的で汎用的で高忠実なシミュレーションプラットフォームを提供することで、研究者が複数のドメインにわたるAIハードウェアを革新し、評価することを可能にする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:21:54 GMT)
PairSonic: Helping Groups Securely Exchange Contact Information [7.3] PairSonicは、物理的出会いからオンラインコミュニケーションへの信頼を拡張する、新しいグループペアリングプロトコルである。
我々のプロトコルは、コンピュータで支えられたコラボレーションのためにユーザーを繋ぐことを容易にするだけでなく、SignalやWhatsAppのようなエンドツーエンドの暗号化メッセンジャーで現在使われている認証手順に対して、よりユーザフレンドリでスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:19:41 GMT)
A Resource Efficient Fusion Network for Object Detection in Bird's-Eye View using Camera and Raw Radar Data [7.3] レーダデータの生のレンジ・ドップラースペクトルを用いてカメラ画像を処理する。
カメラエンコーダデコーダアーキテクチャを用いて,対応する特徴を抽出する。
得られた特徴写像はレンジ・アジマス特徴と融合し、RDスペクトルから復元して物体検出を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:26:13 GMT)
Predicting User Intents and Musical Attributes from Music Discovery Conversations [6.9] 音楽発見会話における意図的分類モデルについて検討する。
また,音楽的属性分類という,音楽的ニーズを分類するタスクも含んでいる。
提案手法はユーザ意図と音楽属性の分類においてF1スコアを大幅に改善する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:24:11 GMT)
Quantum versatility in PageRank [6.8] 任意の位相回転(APR)は、Szegedyの量子ウォークの量子ページランクアルゴリズムで導入された。
本稿では,APRがPageRankで果たす役割について検討し,量子性から得られる万能性を明らかにする。
本結果は,PageRankingの量子可能な視点を示し,実用的なPageRankアルゴリズムの設計と応用に光を当てた。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:14:27 GMT)
Enhancing Transportation Cyber-Physical Systems Security: A Shift to Post-Quantum Cryptography [6.7] 量子コンピューティングの台頭は、トランスポーテーションサイバー物理システム(TCPS)を保護する従来の暗号アルゴリズムを脅かす
本研究の目的は、これらのリスクを軽減するために、量子後暗号(PQC)への移行の緊急性を明らかにすることである。
我々は、従来の暗号の量子攻撃に対する脆弱性を分析し、TCPSにおけるNIST標準化PQCスキームの適用性を検討した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:11:33 GMT)
Are Large Language Models Memorizing Bug Benchmarks? [6.6] 大規模言語モデル(LLM)は、コード生成、バグ検出、修復など、様々なソフトウェアエンジニアリングタスクに不可欠なものになっている。
ソフトウェアエンジニアリングコミュニティの懸念は、ベンチマークがデータ漏洩のリスクのため、真のLLMパフォーマンスを確実に反映していないことだ。
一般的なLSMを系統的に評価し、広く使われているバグベンチマークからデータ漏洩に対する感受性を評価する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:46:04 GMT)
On adaptivity and minimax optimality of two-sided nearest neighbors [6.6] Nearest neighbor (NN)アルゴリズムは、レコメンダシステムやシーケンシャルな意思決定システムにおいて、欠落したデータ問題に広く使われている。
ここでは, NN を非滑らかな非線形関数で解析する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:40:53 GMT)
Reachability Analysis of the Domain Name System [6.5] DNSは、セキュリティと信頼性を確保するために、ユニークな課題を提起する。
DNS検証問題の最初の決定手順を提供し、その複雑性を$mathsf2ExpTime$として確立する。
我々は、DNS上で最も顕著な攻撃ベクトルである増幅攻撃とブラックホリングの書き直しを2つモデル化する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:27:16 GMT)
I Blame Apple in Part for My False Expectations: An Autoethnographic Study of Apple's Lockdown Mode in iOS [6.5] 本研究は,3ヶ月の自己エスノグラフィー研究に基づくロックダウンモードの学術的研究である。
ユーザエクスペリエンスの微妙な理解を得て、より大きなユーザグループに外挿できる問題を特定しました。
私たちは、Appleのロックダウンモードによる父性的なセキュリティアプローチが有害であると考えている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:08:08 GMT)
A Theory for Compressibility of Graph Transformers for Transductive Learning [6.3] グラフ上のトランスダクティブタスクは、典型的な教師付き機械学習タスクと根本的に異なる。
すべてのトレイン/テスト/バリデーションサンプルは、トレーニング中に存在しており、半教師付きタスクに似ています。
我々は、これらのネットワークの隠れた次元をどのように圧縮できるかという理論的な境界を定めている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:20:17 GMT)
Measurement-free code-switching for low overhead quantum computation using permutation invariant codes [6.3] 普遍量子計算のための無測定符号スイッチングプロトコルを提案する。
この符号スイッチングプロトコルによって実現された新しい非クリフォードゲートは、クリフォード$+T$ゲートセットよりも効率的なユニバーサルゲートセットの実装を可能にする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:16:07 GMT)
Breaking the Cycle of Recurring Failures: Applying Generative AI to Root Cause Analysis in Legacy Banking Systems [6.2] 銀行はレガシーシステムの制約と断片化された所有権のために、デジタルトランスフォーメーションにおいて重大な課題に直面しています。
最近の事例では、このような断片化はしばしば表面的なインシデント解決をもたらし、根が未修正で再発する原因となることが示されている。
本稿では,インシデント後分析に新たなアプローチを導入し,知識に基づくGenAIエージェントを"5つの理由"技術に統合し,問題記述の検証と要求データの変更を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:43:03 GMT)
Msmsfnet: a multi-stream and multi-scale fusion net for edge detection [6.2] エッジ検出は、コンピュータビジョンにおける長年の問題である。
最近のディープラーニングベースのアルゴリズムは、公開データセットで最先端のパフォーマンスを実現する。
しかし、それらのパフォーマンスは、ImageNetデータセット上のバックボーンネットワークのトレーニング済みの重みに大きく依存している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:32:23 GMT)
Jointly Modeling and Clustering Tensors in High Dimensions [6.1] テンソルの合同ベンチマークとクラスタリングの問題を考察する。
本稿では,統計的精度の高い近傍に幾何的に収束する効率的な高速最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:06:57 GMT)
Beyond Isolation: Multi-Agent Synergy for Improving Knowledge Graph Construction [6.0] CooperKGCは、知識グラフ構築(KGC)における大規模言語モデル(LLM)の従来の孤立的アプローチに挑戦する新しいフレームワークである。
CooperKGCはコラボレーティブな処理ネットワークを確立し、エンティティ、リレーション、イベント抽出タスクを同時に処理できるチームを組み立てる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:07:41 GMT)
Comprehensive Monitoring of Air Pollution Hotspots Using Sparse Sensor Networks [6.0] 2018年5月1日から2020年11月1日までの30ヶ月にわたって、New Delhiの既存のセンサネットワークを28の低コストセンサーで拡張し、PM2.5データを収集しました。
このデータに定式化されたホットスポットの定義を適用すると、公共ネットワークによって検出された660個のホットスポットの確認とは別に、189個の隠れホットスポットが存在することが判明した。
この結果から,データ駆動予測モデルと物理に基づく力学モデルを統合することの重要性が示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:55:02 GMT)
Promoting User Data Autonomy During the Dissolution of a Monopolistic Firm [5.9] 本稿では,Conscious Data Contributionのフレームワークが,解散中におけるユーザの自律性を実現する方法を示す。
我々は、微調整と「破滅的な忘れ」の現象が、機械の非学習の一種として実際にどのように有用であるかを探求する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:55:51 GMT)
Simultaneous Generation of Quantum Frequency Combs across Distinct Modal Families in a Single $Si_3 N_4$ Whispering Gallery Mode Resonator [5.8] 量子周波数コム(Quantum frequency combs, QFCs)は、クラスター状態のような多モードの絡み合いのための汎用的な資源である。
オンチップ・ウィスパーリング・ギャラリーモード共振器(WGMR)は、これらの状態を極低しきい値のパワーで生成することができる。
この研究は、単一オンチップ窒化ケイ素WGMRを用いた複数のQFCの同時生成を実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:50:52 GMT)
Bipartite reweight-annealing algorithm to extract large-scale data of entanglement entropy and its derivative in high precision [5.7] エンタングルメントエントロピー(EE)とその誘導体の大規模データを抽出できる量子モンテカルロ法を提案する。
相転移点の発見と新しい相の探索にEEとその誘導体を用いることの可能性を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:06:26 GMT)
Syndrome decoding by quantum approximate optimization [5.6] 我々は、量子近似最適化アルゴリズム(QAOA)を用いて、シンドローム復号問題に対処する。
本研究では,[7,4,3]ハミング符号のレベル4チェックベースのQAOAデコーディングを評価する。
退化量子符号のQAOA復号化について検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:29:26 GMT)
Conformal Prediction for Hierarchical Data [5.6] コンフォーマル予測と予測再構成を組み合わせた第1ステップを提案する。
予測セットの効率を向上しつつ,SCPが付与した妥当性が保たれていることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:26:26 GMT)
SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models [5.6] 我々は,新しいPEFT法であるSORSA(Singular Values and Orthonormal Regularized Singular Vectors Adaptation)を提案する。
各SORSAアダプタは、トレーニング可能な主特異重量$W_p = U_p textdiag(S_p) Vtop_p$と、凍結された残留重量$W_r = U_r textdiag(S_r) Vtop_r$の2つの主要部分からなる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:08:22 GMT)
Voxel-Mesh Hybrid Representation for Real-Time View Synthesis [5.5] 本稿では、ビュー合成のためのハイブリッドレンダリングにおいて、ボクセルとメッシュの両方のコンポーネントをシームレスに組み合わせたVoshというハイブリッド表現を提案する。
Voshはメッシュコンポーネントを通じて単純な幾何学とテクスチャを備えた高速なレンダリングシーンに優れており、同時にvoxelコンポーネントを活用することで複雑な領域における高品質なレンダリングを可能にしている。
Voshの柔軟性は、ハイブリッド比を調整する機能によって示され、フレキシブルな使用量に基づいて、レンダリング品質とスピードのバランスを制御できるようになる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:11:36 GMT)
Exploring Large Language Models for Climate Forecasting [5.3] 大規模言語モデル(LLM)は、複雑な気候データと一般大衆の間のギャップを埋めるための有望なアプローチを示す。
本研究は, 短期(15日) および長期(12カ月) の降雨予測におけるGPT-4の有効性について検討した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:58:19 GMT)
Entropy Bootstrapping for Weakly Supervised Nuclei Detection [5.1] エントロピー推定には点ラベルを用いて,基礎となるセルピクセルの分布を近似する。
この分布から全セルマスクを推定し,Mask-RCNNを用いてインスタンス分割出力を生成する。
本手法は,95%の画素ラベルの削減にもかかわらず,比較的良好な性能が得られることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:24:11 GMT)
Nonlinear Assimilation with Score-based Sequential Langevin Sampling [5.1] SSLSは同化プロセスを予測と更新の一連のステップに分解する。
テレビ距離におけるSSLSの収束は,一定の条件下で解析される。
SSLSは、推定状態に関連する不確実性を効果的に定量化し、エラー校正の可能性を強調している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:31:46 GMT)
Sensitivity Analysis on Policy-Augmented Graphical Hybrid Models with Shapley Value Estimation [5.1] 一般非線形ポリシ拡張グラフィカル(pKG)ハイブリッドモデルに対する総合感度解析フレームワークを提案する。
提案手法は, バイオマニュファクチャリングにおける効率的な解釈と安定なプロセス制御を支援する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:33:39 GMT)
Learning the Market: Sentiment-Based Ensemble Trading Agents [5.0] 株価取引のための感情分析と深層強化学習アンサンブルアルゴリズムの統合について検討する。
当社のアプローチは、利益があり、堅牢で、リスク最小限の戦略をもたらすことを示しています。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:59:55 GMT)
A complete continuous-variable quantum computation architecture based on the 2D spatiotemporal cluster state [5.0] 連続変数測定に基づく量子計算は、実用的な、スケーラブルで、普遍的で、フォールトトレラントな量子計算の候補である。
本研究では,クラスタ状態の準備,ゲート実装,エラー訂正を含む完全なアーキテクチャを実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:25:59 GMT)
Developing Normative Gait Cycle Parameters for Clinical Analysis Using Human Pose Estimation [5.0] コンピュータビジョンを用いた歩行分析はAIの新たな分野であり、臨床医に複雑な動きを分析するための客観的で多機能なアプローチを提供する。
本稿では,RGBビデオデータと2次元人間のポーズ推定を用いたデータ駆動手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:27:13 GMT)
Closing the Gap Between SGP4 and High-Precision Propagation via Differentiable Programming [4.9] 本研究では、PyTorchを用いて実装されたSGP4の新しい微分可能バージョンであるdSGP4を提案する。
SGP4を識別可能にすることで、dSGP4は宇宙船の軌道決定を含む様々な宇宙関連の応用を促進する。
本稿では,ニューラルネットを軌道伝搬器に統合した新しい軌道伝搬パラダイムML-dSGP4を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:34:06 GMT)
AssetHarvester: A Static Analysis Tool for Detecting Secret-Asset Pairs in Software Artifacts [4.8] AssetHarvesterは、リポジトリ内のシークレットとアセスメントのペアを検出する静的解析ツールです。
AssetHarvesterの性能を評価するため、188のパブリックリポジトリから抽出した4種類のデータベースの1,791のシークレットアセスメントペアのベンチマークをキュレートした。
以上の結果から,AssetHarvesterにおけるデータフロー解析は,0%の偽陽性を有するシークレット・アセスメント・ペアを検出し,シークレット検出ツールのリコールの改善に有効であることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:06:15 GMT)
Hierarchical Text Classification (HTC) vs. eXtreme Multilabel Classification (XML): Two Sides of the Same Medal [4.8] 階層的テキスト分類(HTC)は、セマンティックなラベル階層を伴う数百のエントリからなる小さなラベルプールを持つデータセットに焦点を当てている。
eXtreme Multi-Label Text Classification (XML)は、最大数百万のエントリを持つ非常に大きなラベルプールを、ラベルが特定の方法で配列されていないとみなしている。
ここでは、あるドメインの最先端モデルが、他のドメインのデータセット上でトレーニングおよびテストを行う際に、どのように機能するかを検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:07:25 GMT)
RAW-Diffusion: RGB-Guided Diffusion Models for High-Fidelity RAW Image Generation [4.6] RGB画像でガイドされたRAW画像を生成するための新しい拡散法を提案する。
このアプローチは高忠実度RAW画像を生成し、カメラ固有のRAWデータセットの作成を可能にする。
提案手法を拡張してBDD100K-RAWとCityscapes-RAWデータセットを作成し,RAW画像におけるオブジェクト検出の有効性を明らかにする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:40:12 GMT)
Mitigating Sycophancy in Decoder-Only Transformer Architectures: Synthetic Data Intervention [4.6] 本研究はデコーダのみのトランスアーキテクチャに合成データ介入技術を適用した。
以上の結果から,SDIトレーニングモデルでは,精度と薬効率の観点から,SDIトレーニングモデルがサポートできることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:52:09 GMT)
Separability criteria based on realignment [4.6] 両部状態の絡み目を検出するための分離性基準を新たに導入する。
提案した分離性基準は、以前の分離性基準よりもより絡み合うものを検出することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:27:25 GMT)
When Context Leads but Parametric Memory Follows in Large Language Models [4.6] 大規模言語モデル (LLM) は多様な知識源の活用において顕著な進歩を見せている。
本研究では,9つのLLMがオープンな質問に対して,局所的な文脈とグローバルなパラメータの知識を割り当てる方法について検討した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:41:38 GMT)
Optimized four-qubit quantum error correcting code for amplitude damping channel [4.5] 信頼性の高い情報処理に不可欠な量子絡み補正(QEC)。
特定のエラーチャネルをターゲットとすると、エンコーディングとリカバリの両方を、双方向のQECスキームで最適化することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:48:56 GMT)
SuPLE: Robot Learning with Lyapunov Rewards [4.4] 外部の仮定を加えることなく、ダイナミクスの特性を使ってシステムに適切な報酬を生み出す。
我々は,「正のリアプノフ指数」(SuPLE)が,そのような報酬の設計の有力な候補であることを示す。
これは、任意の状態で訓練軌道を開始する必要をなくし、補助探査としても知られる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:20:50 GMT)
Pushing the Limits of Sparsity: A Bag of Tricks for Extreme Pruning [4.4] ディープニューラルネットワークのプルーニングは、高密度ネットワークの性能の大部分を保ちながら、モデルサイズの削減に有効な手法である。
最近のスパース学習法では、95%や98%といった中等度の疎度レベルまで有望な性能を示している。
極端に間隔があっても精度が崩れることなくネットワークの連続的な学習を可能にする手法の集合を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:54:53 GMT)
Non-Bloch self-energy of dissipative interacting fermions [4.4] 非エルミート皮膚効果は、系の境界付近の単一粒子固有状態の指数的局在化現象を記述している。
オープン量子系における相互作用するフェルミオンを調べることにより、多体状態への一般化を探求する。
我々の定式化は、非エルミート皮膚効果による散発性相互作用性フェルミオンの定量化ツールを提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:08:24 GMT)
VADet: Multi-frame LiDAR 3D Object Detection using Variable Aggregation [4.3] 本稿では,変数アグリゲーションに対して,VADetと呼ぶ効率的な適応手法を提案する。
VADetは、速度や点密度など、オブジェクトの観察された特性によって決定されるフレーム数とともに、オブジェクトごとのアグリゲーションを実行する。
その利点を示すために、VADetを3つの一般的な単一ステージ検出器に適用し、データセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:36:41 GMT)
On Generalization Bounds for Neural Networks with Low Rank Layers [4.3] 深いネットワークにおける低ランク層がどのように階数や次元因子の蓄積を防げるかを解析するために、モーラーの鎖則をガウス複雑性に適用する。
この結果と,低ランク層を有するディープネットワークがフルランク層を有するディープネットワークよりも優れた一般化を実現できることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:20:47 GMT)
Improved fluxonium readout through dynamic flux pulsing [4.3] 本研究では,フラキソニウム量子ビットのフラックスパルスによる読み出し実験を行った。
我々は280 nsの積分時間で94.3%の割り当て忠実度を達成する。
その結果,フラキソニウム量子ビットの読み出し速度は最速となった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:25:44 GMT)
HouseLLM: LLM-Assisted Two-Phase Text-to-Floorplan Generation [4.2] 本稿では,Large Language Model (LLM) を誘導して初期レイアウトを生成する2段階のテキスト・ツー・フロアプラン生成手法を提案する。
我々は、ユーザテキスト仕様に基づいてLCMを誘導するためにChain-of-Thoughtアプローチを導入し、よりユーザフレンドリで直感的な住宅レイアウト設計を可能にした。
実験結果から,本手法は全指標の最先端性能を実現し,実用的ホームデザインにおける有効性を検証した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:05:48 GMT)
Select High-Level Features: Efficient Experts from a Hierarchical Classification Network [4.1] 本研究では,予測性能を損なうことなく,タスクと計算の複雑さを動的に低減する新しいエキスパート生成手法を提案する。
これは、一般的な低レベル特徴の逐次処理と並列性と高レベルの特徴のネスト処理を組み合わせた、新しい階層型分類ネットワークトポロジーに基づいている。
動的推論の観点では、我々の方法論は最大88.7.%のパラメータと73.4.%のギガ乗算(GMAC)演算を除外することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:42:04 GMT)
High-Level Parallelism and Nested Features for Dynamic Inference Cost and Top-Down Attention [4.1] 本稿では,動的推論コストとトップダウンアテンション機構をシームレスに統合する新しいネットワークトポロジーを提案する。
人間の知覚からインスピレーションを得るため、汎用的な低レベル特徴の逐次処理と並列性と高レベルの特徴のネスト処理を組み合わせる。
動的推論コストの面では、我々の方法論は最大7,3.48,%のパラメータと84.41,%のギガ乗算累積(GMAC)演算を除外することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:13:36 GMT)
SynEHRgy: Synthesizing Mixed-Type Structured Electronic Health Records using Decoder-Only Transformers [3.9] 構造化EHRデータに適した新しいトークン化戦略を提案する。
我々は、生成したデータの忠実度、実用性、プライバシを最先端のモデルと比較する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:11:20 GMT)
Cooperative quantum interface for noise mitigation in quantum networks [3.7] 本稿では,コラボレーティブ量子インタフェース(CQI)を提案する。
従来のカスケードシステムと比較して,提案方式はコンパクト性,挿入損失の低減,中間モードからのノイズの抑制など,いくつかの利点がある。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:49:04 GMT)
SoK: A Systems Perspective on Compound AI Threats and Countermeasures [3.5] 我々は、複合AIシステムに適用可能な、異なるソフトウェアとハードウェアの攻撃について議論する。
複数の攻撃機構を組み合わせることで、孤立攻撃に必要な脅威モデル仮定をいかに削減できるかを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:08:38 GMT)
Uni-Mlip: Unified Self-supervision for Medical Vision Language Pre-training [3.4] Uni-Mlipは、医療ビジョン言語による事前訓練を強化するために設計された統合されたセルフスーパービジョンフレームワークである。
Uni-Mlipは、データレベルと機能レベルにおいて、相互モダリティ、ユニモダリティ、融合モダリティの自己スーパービジョン技術をシームレスに統合する。
実験の結果,Uni-Mlipは3つの重要な下流タスクにおいて,現在の最先端手法を大幅に上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:43:26 GMT)
Classification of Buried Objects from Ground Penetrating Radar Images by using Second Order Deep Learning Models [3.3] 埋蔵物を分類するために,共分散行列に基づく新しい分類モデルを構築した。
提案手法はGPRデータ用に設計された浅層ネットワークよりも優れていることを示す。
また、異なる気象モードや考慮事項から、トレーニングデータとテストセットが得られた場合のモデルの関心についても説明する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:17:08 GMT)
M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction [3.2] M3Dは複雑なシーンのための新しい単一ビュー3D再構成フレームワークである。
グローバルな特徴と局所的な特徴の抽出のバランスを保ち、シーンの理解と表現精度を向上させる。
その結果,2重分岐特徴抽出による深度情報との融合により,幾何的整合性と忠実度が著しく向上することが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:54:52 GMT)
Comparative Analysis of Audio Feature Extraction for Real-Time Talking Portrait Synthesis [3.2] 我々は、従来のAFEモデルをOpen AIのWhisperに置き換える、完全に統合されたシステムを提案し、実装する。
我々はWhisperが処理を高速化するだけでなく、レンダリング品質の特定の側面を改善し、より現実的で応答性の高い対話型対話を実現することを示した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:18:05 GMT)
Metacognition for Unknown Situations and Environments (MUSE) [3.2] 未知の状況と環境(MUSE)フレームワークのメタ認知を提案する。
MUSEはメタ認知プロセス、特に自己認識と自己制御を自律エージェントに統合する。
エージェントは自己認識と自己制御の大幅な改善を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:41:03 GMT)
Mediating Modes of Thought: LLM's for design scripting [3.2] 大規模言語モデル(LLM)は、人間の文脈の一般的な理解を符号化し、幾何学的論理を生成する能力を示す。
このプロジェクトは、LLMがユーザの意図とアルゴリズムを効果的に仲介できれば、デザインにおけるスクリプト作成をより広く楽しくするための強力なツールになる、と推測している。
このようなシステムが、計算設計スクリプティングに関連する幾何学的操作を組み立てるための自然言語のプロンプトを解釈できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:49:18 GMT)
MindForge: Empowering Embodied Agents with Theory of Mind for Lifelong Collaborative Learning [3.2] Colllabvoyagerは、露骨な視点を取ることで、ボイジャーを生涯の協調学習で強化する新しいフレームワークである。
コラボボヤガーは、(1)知覚、信念、欲求、行動をリンクするマインド表現の理論、(2)エージェント間の自然言語コミュニケーション、(3)タスクと環境知識のセマンティックメモリの3つの重要なイノベーションを紹介している。
混合実験のMinecraft実験では、共同作業員はボイジャーのエージェントよりも優れており、作業完了率は6.6% (+39.4%) で1ブロックの土を集め、70.8% (+20.8%) で大幅に改善した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:10:44 GMT)
Retrieval-Augmented Generation for Domain-Specific Question Answering: A Case Study on Pittsburgh and CMU [3.2] 我々は、ドメイン固有の質問に答えるために、関連文書を含む大規模言語モデルを提供するために、検索型拡張生成システム(RAG)を設計した。
我々は,グリーディスクレーピング戦略を用いて1,800以上のサブページを抽出し,手動とMistralの生成した質問応答ペアを組み合わせたハイブリッドアノテーションプロセスを用いた。
我々のRAGフレームワークはBM25とFAISSレトリバーを統合し、文書検索精度を向上させるリランカで強化した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:10:43 GMT)
Advancing Heatwave Forecasting via Distribution Informed-Graph Neural Networks (DI-GNNs): Integrating Extreme Value Theory with GNNs [3.2] 極端な熱の長い期間である熱波は、気候変動による頻度と重大さを増している。
気象スケール(1~15日)での正確な熱波予測は、大気中のドライバ間の非線形相互作用と、これらの極端な事象の希少性により、依然として困難である。
本研究では、極値理論(EVT)の原理をグラフニューラルネットワークアーキテクチャに統合する新しいフレームワークであるDis Distribution-Informed Graph Neural Network (DI-GNN)を紹介する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:45:03 GMT)
Lifted Model Construction without Normalisation: A Vectorised Approach to Exploit Symmetries in Factor Graphs [3.1] パラメトリック係数グラフの形でリフト表現を構築するための現在の最先端アルゴリズムは、交換可能だがスケールの異なる因子間の対称性を見逃している。
本稿では、パラメトリック因子グラフを構築するための最先端カラーパスアルゴリズム(ACP)の一般化を提案する。
提案アルゴリズムは任意の因子のポテンシャルを任意に拡張することができ、元のACPアルゴリズムよりも効率的に対称性を検出できる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:01:18 GMT)
Knowledge Transfer for Cross-Domain Reinforcement Learning: A Systematic Review [2.9] 強化学習(RL)は、複雑な意思決定問題を解決するために、試行錯誤を通じてエージェントを訓練できるフレームワークを提供する。
異なるタスクから知識を再利用することにより、知識伝達手法はRLのトレーニング時間を短縮する代替手段を提供する。
本稿では,異なる領域間で知識を伝達することに焦点を当てた手法の統一分析を行う。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:02:48 GMT)
On the Statistical Significance with Relevance Assessments of Large Language Models [2.9] 我々は,文書の関連性をラベル付けするために大規模言語モデルを使用し,新しい検索テストコレクションを構築する。
以上の結果から, LLM判定は有意差の大部分を検出できる一方で, 許容数の偽陽性を維持していることが明らかとなった。
本研究は, LLM判定による統計的試験結果の評価における一歩である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:19:35 GMT)
Predicting Wall Thickness Changes in Cold Forging Processes: An Integrated FEM and Neural Network approach [2.8] まず、ノイズ処理と影響パラメータの徹底的な分析を行う。
次に、異なるプロセスパラメータの効果をよりよく分析するために、有限要素法シミュレーションをセットアップします。
本稿では,グラフニューラルネットワークを代理モデルとして設計した新しいモデリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:42:53 GMT)
Neon: News Entity-Interaction Extraction for Enhanced Question Answering [2.8] 本稿では,ニュース記事に記載されている新たなエンティティインタラクションの抽出を目的としたNEONフレームワークを提案する。
NEONは、そのようなインタラクションをキャプチャするエンティティ中心のタイムスタンプ知識グラフを構築する。
オープンな情報抽出(openIE)スタイルを大規模言語モデルに組み込むことによって,我々のフレームワークは革新的になる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:06:05 GMT)
LPLgrad: Optimizing Active Learning Through Gradient Norm Sample Selection and Auxiliary Model Training [2.8] LPLgrad(Loss Prediction Loss with Gradient Norm)は、モデルの不確実性を効果的に定量化し、画像分類タスクの精度を向上させる。
LPLgradは2つの異なるフェーズで動作する: (i) Em Training Phaseは、メインモデルと補助モデルとを併用して入力特徴の損失を予測することを目的としている。
この二重モデルアプローチは、複雑な入力特徴を抽出し、データから本質的なパターンを効果的に学習する能力を高める。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:12:59 GMT)
Retrieval with Learned Similarities [2.7] 最先端の検索アルゴリズムは、学習された類似点に移行した。
そこで本研究では,Mixture-of-Logits (MoL) を実証的に実現し,多様な検索シナリオにおいて優れた性能が得られることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:30:19 GMT)
QIANets: Quantum-Integrated Adaptive Networks for Reduced Latency and Improved Inference Times in CNN Models [2.7] 畳み込みニューラルネットワーク(CNN)はコンピュータビジョンタスクにおいて大きな進歩を遂げているが、その高い推論時間とレイテンシは現実の応用性を制限している。
従来のGoogLeNet、DenseNet、ResNet-18モデルアーキテクチャを再設計する新しいアプローチであるQIANetを紹介します。
実験の限界にもかかわらず, 提案手法を検証, 評価し, 推論時間の短縮を実証し, 有効精度の保存を行った。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:37:27 GMT)
Virtual Staining of Label-Free Tissue in Imaging Mass Spectrometry [2.6] 空間分解能を高め, 質量分析画像に細胞形態学的コントラストを導入する仮想組織染色法を提案する。
ヒト腎臓組織に対するブラインド試験では、ラベルのないサンプルの実質的に染色された画像は、その組織化学的に染色されたものと密に一致していることが示された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:30:11 GMT)
Training Physics-Driven Deep Learning Reconstruction without Raw Data Access for Equitable Fast MRI [2.5] 物理駆動型ディープラーニング(PD-DL)アプローチは、高速磁気共鳴画像(MRI)スキャンの再構築に人気がある。
PD-DLは、既存の高速MRI技術と比較して加速率が高いが、特定のMRIセンター以外での使用は限られている。
それらの展開の障害の1つは、トレーニングセットでよく表現されていない病理や集団への一般化の難しさである。
CUPIDは、生のk空間データアクセスを必要とするよく確立されたPD-DLトレーニング戦略と同じような品質を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:53:41 GMT)
BelHouse3D: A Benchmark Dataset for Assessing Occlusion Robustness in 3D Point Cloud Semantic Segmentation [2.4] 本稿では,3次元屋内シーンセマンティックセマンティックセグメンテーション用に設計された,新たな合成点クラウドデータセットであるBelHouse3Dデータセットを紹介する。
このデータセットは、ベルギーの32軒の家の実世界の参照を使って構築されており、合成データが実世界の状況と密接に一致していることを保証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:09:43 GMT)
On algebraic analysis of Baker-Campbell-Hausdorff formula for Quantum Control and Quantum Speed Limit [2.2] 我々は、ユニタリ間の距離を導入することができ、制御時間に対する低いバウンダリが得られることを示す。
比較できる限り、この制御時間の低い境界は、標準的な量子速度制限よりも厳密である(ベター)。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:45:09 GMT)
DATTA: Domain-Adversarial Test-Time Adaptation for Cross-Domain WiFi-Based Human Activity Recognition [2.1] クロスドメインの一般化はWiFiベースのセンシングにおいてオープンな問題である。
ドメイン・アドバイザリ・トレーニングとテスト時間適応を組み合わせた新しいフレームワークであるドメイン・アドバイザリ・テスト・タイム適応(DATTA)を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:52:36 GMT)
Optically-Trapped Nanodiamond-Relaxometry Detection of Nanomolar Paramagnetic Spins in Aqueous Environments [2.1] 蛍光ナノダイアモンド(FNDs)の窒素空洞は、ナノスケールで温度、pH、常磁性種を感知する良い候補として浮上している。
光学的に捕捉されたFNDは、常磁性イオンに対して高い再現性を持つナノモル感度を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:37:31 GMT)
LLMSteer: Improving Long-Context LLM Inference by Steering Attention on Reused Contexts [2.0] LLMSteerは,クエリに依存しないアテンションステアリングを通じて,大規模言語モデル(LLM)を強化する,微調整不要なフレームワークである。
LLMSteerは人気のあるLLMとデータセットでテストされ、ベースラインでパフォーマンスギャップを65.9%縮小し、実行時の遅延を4.8倍に削減した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:17:51 GMT)
Does Unlearning Truly Unlearn? A Black Box Evaluation of LLM Unlearning Methods [2.0] 大規模言語モデルアンラーニングは、LLMが悪意ある目的のために使用するのを防ぐために学んだ有害な情報を除去することを目的としている。
LMUとRMUは、LLMアンラーニングの2つの方法として提案され、アンラーニングベンチマークで印象的な結果を得た。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:23:11 GMT)
The Peripatetic Hater: Predicting Movement Among Hate Subreddits [1.8] 我々は、ヘイト・サブレディットとそれらが分離するアイデンティティを分類する新しい方法を開発した。
我々は, 人種差別的サブレディット, 異所性サブレディット, 異所性サブレディット, 異所性サブレディットなど, さまざまなアイデンティティを対象とするサブレディットの集団を同定した。
追加のヘイトグループサブレディットに参加するユーザ、特に異なるカテゴリーのユーザが、より広いヘイトグループレキシコンを開発することを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:02:19 GMT)
Transformer-Based Contextualized Language Models Joint with Neural Networks for Natural Language Inference in Vietnamese [1.7] 文脈型言語モデル(CLM)とニューラルネットワークの様々な組み合わせを用いて実験を行う。
CLMとニューラルネットワークのジョイントアプローチはシンプルだが,高品質な性能を実現することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:46:48 GMT)
Emergent disorder and sub-ballistic dynamics in quantum simulations of the Ising model using Rydberg atom arrays [1.7] Van der Waals相互作用を持つRydberg原子配列は、局所連結横フィールドイジングモデル(TFIM)をシミュレートするための制御可能な経路を提供する
我々は、TFIMの平衡から遠く離れた物理学を実験的に研究し、理論的な予測から重要な偏差を明らかにする。
TFIM限界におけるRydberg原子配列の多体ダイナミクスにおける原子運動の重要な役割を明らかにする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:00:01 GMT)
Urban Region Embeddings from Service-Specific Mobile Traffic Data [1.7] 本稿では,サービス固有のモバイルトラフィックデータから都市部埋め込みを作成する手法を提案する。
本手法が都市特性を効果的に把握できることを実証する。
全体として、この研究は、都市研究のためのサービス固有のモバイルトラフィックデータの可能性を強調している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:13:07 GMT)
Quantum Algorithm for Vibronic Dynamics: Case Study on Singlet Fission Solar Cell Design [1.6] 実空間における一般的なビブロンハミルトニアンの下での時間発展をシミュレーションするための量子アルゴリズムを提案する。
そこで本研究では,より効率的な一重項核分裂型有機太陽電池の設計のための材料発見パイプラインへのアルゴリズムの初歩的な統合の証明について概説する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:22:10 GMT)
Improving Low-Fidelity Models of Li-ion Batteries via Hybrid Sparse Identification of Nonlinear Dynamics [1.6] 本稿では,低次リチウムイオン電池モデルの忠実度向上のためのデータインスパイアされたアプローチを提案する。
提案手法は, 遺伝的アルゴリズムとGA-stridgeとを組み合わせて, 低忠実度モデル (LFM) と高忠実度モデル (HFM) の差分を識別・補償する。
物理に基づく手法とデータ駆動方式を組み合わせたハイブリッドモデルは、ベースラインFMと比較して電圧予測誤差を著しく低減できることを示すために、異なる駆動サイクルで試験される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:00:11 GMT)
SAGA: Synthetic Audit Log Generation for APT Campaigns [1.6] 本稿では,SAGA(Synthetic Audit log Generation for APT campaigns)を提案する。
SAGAは任意の期間監査ログを生成し、MITRE ATT&CKフレームワークに基づいて、通常の操作から良性ログと悪意のあるログを混ぜる。
合成監査ログの有用性を実証するため,各種の合成監査ログを用いたイベントベースのテクニックハンティングとAPTキャンペーン検出の確立したベースラインを実行した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:06:46 GMT)
Harpocrates: A Statically Typed Privacy Conscious Programming Framework [1.5] Harpocratesは、ポリシーで保護されたタイプの生データをアプリケーションから取り除き、保護された形でのみ存在することを保証します。
Harpocrasは、ポリシー膜内のアプリケーション全体にデータを自由に流すことができるが、データにアクセス、変更、非分類化、あるいはアプリケーション境界を通過する際にポリシーを強制する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:02:55 GMT)
A Systematic Literature Review on a Decade of Industrial TLA+ Practice [1.4] TLA+は、システムの設計、モデリング、文書化、検証に使用される正式な仕様言語である。
研究コミュニティから大きな関心が寄せられているが、実際にはTLA+エコシステムの利用に関する知識は乏しい。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:55:28 GMT)
Regional Ocean Forecasting with Hierarchical Graph Neural Networks [1.4] 我々は、高解像度の中距離海洋予測用に設計されたニューラルネットワークであるSeaCastを紹介する。
SeaCastはグラフベースのフレームワークを使用して、海洋グリッドの複雑な幾何学を処理し、地域の海洋環境に合わせて外部の強制データを統合する。
コペルニクス海洋局が提供した地中海の運用数値モデルを用いて,高空間分解能実験により本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:33:05 GMT)
Long-term Detection System for Six Kinds of Abnormal Behavior of the Elderly Living Alone [1.4] 本研究では,半寝たきり,家出し,忘れ,さまよう,立ちながら歩く,転倒する6つの典型的な異常をシミュレーターで検出するシステムを提案する。
検知システムは,部屋のレイアウト,センサの配置を忘れる配置,居住者の特性などをカスタマイズできる。
本稿では,センサデータの処理を標準化する手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:42:08 GMT)
Machine Learning for Arbitrary Single-Qubit Rotations on an Embedded Device [1.4] フィールドプログラマブル論理を用いた単一キュービットゲート合成に機械学習(ML)を用いる手法を提案する。
まず、ゲートの忠実度を測定するためのフルステートベクタにアクセス可能なシミュレーションに基づいて、モデルをブートストラップする。
次に,適応ランダム化ベンチマーク (ARB) というアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:59:38 GMT)
Closer Look at Efficient Inference Methods: A Survey of Speculative Decoding [1.3] 投機的復号化は、ドラフトと検証という2段階のフレームワークを導入することでボトルネックに対処する。
より小さく効率的なモデルが予備のドラフトを生成し、より大きくより洗練されたモデルによって洗練される。
本稿では、投機的復号法を包括的に調査し、それらをドラフト中心およびモデル中心のアプローチに分類する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:46:30 GMT)
Active Stabilization of Laser Diode Injection Using a Polarization-Spectroscopy Technique [1.3] 環境条件の変動は、注入ロックを失敗させる可能性がある。
本稿では,H"ansch-Couillaudスキームにインスパイアされたインジェクションロックに必要な条件をモニタリングし,積極的に安定化する手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:35:54 GMT)
Exact Hidden Markovian Dynamics in Quantum Circuits [1.3] 時間発展型グローバルシステムによる有限サブシステムへの影響を,逐次的,時間局所的な量子チャネルによって解析的に説明できることを示す。
正確な隠れマルコフ性の実現は、量子回路の基底となる2つのサイトゲート上の可解条件によって促進される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:08:54 GMT)
Robust Monocular Visual Odometry using Curriculum Learning [1.3] 本研究は,モノクロビジュアルオドメトリー(VO)推定の難解な幾何学的問題に対処するために,革新的なカリキュラム学習(CL)手法を適用した。
我々は、新しいCLアプローチを統合することにより、エンドツーエンドのDeep-Patch-Visual Odometryフレームワークを強化する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:26:51 GMT)
Self-Supervised Adversarial Diffusion Models for Fast MRI Reconstruction [1.2] 本稿では,自己教師付き深層学習圧縮拡散センシングMRI(DL)法を提案する。
対象はT1データセット(T1-w)50例であった。
ReconFormer TransformerとSS-MRIを比較し、正規化平均誤差(NMSE)、ピーク信号-雑音比(PSNR)、類似度指数(SSIM)を用いて性能を評価する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:54:31 GMT)
Efficient Brain Imaging Analysis for Alzheimer's and Dementia Detection Using Convolution-Derivative Operations [1.2] アルツハイマー病(英語版) (AD) は進行性神経変性を特徴とし、ヒト脳における有害な構造変化をもたらす。
VBM(Voxel-based morphometry)における空間正規化から導かれるジャコビアン写像は、ADに関連する体積変化の解釈に役立っている。
本研究では,計算効率の良い代替手段として,SKAD(Sobel kernel angle difference)を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:38:34 GMT)
Bounding-box Watermarking: Defense against Model Extraction Attacks on Object Detectors [1.2] この研究はオブジェクト検出(OD)モデルに焦点を当てている。
既存のODモデルに対するバックドア攻撃は、現実的な脅威モデルにおけるMEAに対する防御としてモデル透かしには適用できない。
提案手法では,OD機能を保ちながら,クエリで検出されたオブジェクトのバウンディングボックス(BB)を密かに修正することで,抽出したモデルにAPIを介してバックドアを挿入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:40:20 GMT)
Combining Autoregressive and Autoencoder Language Models for Text Classification [1.1] CAALM-TCは、自動回帰言語モデルと自動エンコーダ言語モデルを統合することで、テキスト分類を強化する新しい手法である。
4つのベンチマークデータセットの実験結果は、CAALMが既存の手法より一貫して優れていることを示している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:49:42 GMT)
Unbiased Scene Graph Generation by Type-Aware Message Passing on Heterogeneous and Dual Graphs [1.1] これらの問題に対処するために,非バイアスのシーングラフ生成(TA-HDG)を提案する。
対話型および非対話型関係をモデル化するために,対話型グラフ構築法を提案する。
Type-Aware Message Passingは、複雑なインタラクションの理解を強化する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:54:47 GMT)
Bilateral photon emission from a vibrating mirror and multiphoton entanglement generation [1.1] 量子対応デバイスの開発において、絡み合いは重要な役割を担っている。
本研究では,両面完全鏡を含む共振器について検討する。
両光子対放出法と光子対生成法について検討した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:57:13 GMT)
Explainable Finite-Memory Policies for Partially Observable Markov Decision Processes [1.0] 部分観測可能なマルコフ決定プロセス(POMDP)は、不確実性と部分観測可能性の下での意思決定の基本的なフレームワークである。
我々は、(i)解釈可能な形式主義と(ii)典型的にはより小さいサイズの両方において、そのようなポリシーの表現を提供し、より高い説明可能性をもたらす。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:42:23 GMT)
A Survey On Enhancing Reinforcement Learning in Complex Environments: Insights from Human and LLM Feedback [1.0] 本稿では、まず、人間やLSMの補助に焦点をあて、これらの実体が最適な行動の促進と学習の迅速化のためにRLエージェントと協調する方法について検討し、また、大きな観測空間によって特徴づけられる環境の複雑さに対処する研究論文を探索する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:52:03 GMT)
Quantum reservoir computing in atomic lattices [0.8] 量子貯水池計算は、量子システムの動的特性を利用して機械学習タスクを実行する。
故障したシステムに頼らずに,QRCの最適性能を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:39:15 GMT)
Guided Object-Oriented Development [0.8] このアプローチは、単一のクラスの構造と振舞いに集中する。
設計と仕様を含み、大規模なプログラミングの方法論と互換性がある。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:01:33 GMT)
Executable QR codes with Machine Learning for Industrial Applications [0.8] 実行可能QRコード(Executable QR codes)またはeQRコード(eQR codes)または単にsQRy(sQRy)は、スマートフォンなどのモバイルデバイスで動作するプログラムを埋め込む特別なQRコードである。
この技術の応用は多様体であり、スマートユーザガイドからアドバイザリシステムまで様々である。
eQRで利用可能な最初のプログラミング言語はQRtreeであり、複雑な機械の操作や保守、あるいは特定の場所に到達するための決定ツリーの実装を可能にする。
本研究では,産業向けに特別に考案されたQRindという,新たな言語を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:38:33 GMT)
Transformers with Sparse Attention for Granger Causality [0.8] トランスフォーマーのような深層学習に基づく手法は、単なる相関を超えた時間的ダイナミクスや因果関係を捉えるのにますます使われている。
近年の研究では、変圧器の自己注意重みが因果関係の指標として有用であることが示唆されている。
本稿では,時系列データの変数間の因果関係と遅延依存性の差異を関連付けるために,自己アテンションモジュールの新たな修正を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:34:06 GMT)
DIS-Mine: Instance Segmentation for Disaster-Awareness in Poor-Light Condition in Underground Mines [0.8] DIS-Mineは、低照度または低視認性条件下で地下鉱山内の災害被害地域を特定するように設計されている。
DIS-Mineは、高ノイズ、色歪み、コントラストの低減といった課題に対処することで、完全な暗黒でも画像中の物体を検出することができる。
それに加えて、実験的な地下鉱山から実世界の画像を収集し、ImageMineという新しいデータセットを導入しました。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:54:36 GMT)
Sequential Quantum Maximum Confidence Discrimination [0.8] 最大信頼度を有する量子状態判別の逐次シナリオについて検討する。
最大信頼度測定のための正の演算値測定要素が線形独立である場合にのみ、等しく高い信頼度を持つ逐次状態判別が実現できることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:32:16 GMT)
Sparse Input View Synthesis: 3D Representations and Reliable Priors [0.8] 新しいビュー合成はコンピュータビジョンとグラフィックスの基本的な問題である。
最近の3D表現は、新しい視点からレンダリングされた画像の品質を著しく向上させる。
静的シーンと動的シーンの両方に対するスパース入力新規ビュー合成問題に焦点をあてる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:45:46 GMT)
AI-powered Digital Framework for Personalized Economical Quality Learning at Scale [0.8] 本稿では,Deep Learning(DL)理論に基づくAIを活用したデジタル学習フレームワークを提案する。
我々は、DLベースのデジタル学習環境を実装するのに不可欠な、科学とAIから派生した8つの重要な原則を概説する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:44:29 GMT)
Eliminating Ratio Bias for Gradient-based Simulated Parameter Estimation [0.8] 本稿では、可能性関数が解析的に利用できないモデルにおけるパラメータキャリブレーションの課題に対処する。
本稿では,最大推定と後続密度推定の両問題において,比バイアスの問題に対処するマルチタイムスケールを応用した勾配に基づくシミュレーションパラメータ推定フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:46:15 GMT)
Multi-Agent Best Arm Identification in Stochastic Linear Bandits [0.8] 固定予算シナリオ下での線形包帯における協調的ベストアーム識別の問題について検討する。
学習モデルでは、複数のエージェントがスターネットワークまたはジェネリックネットワークを介して接続され、線形バンディットインスタンスと並列に相互作用すると考えられる。
我々は、スターネットワークとジェネリックネットワークのためのアルゴリズムMaLinBAI-StarとMaLinBAI-Genをそれぞれ考案した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:09:44 GMT)
Making Quantum Collision Models Exact [0.7] 量子衝突(Quantum collision)は、粗い粒度の環境との繰り返し相互作用を通して開かれた量子系を記述する。
システムオブザーバブルのシミュレーションに関する完全なエラー境界は確立されていない。
連鎖写像法を用いてマルコフ衝突モデルと非マルコフ衝突モデルを解析的に復元できることが示される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:01:10 GMT)
ODTE -- An ensemble of multi-class SVM-based oblique decision trees [0.7] ODTEは、斜め決定木をベース分類子として使用する新しいアンサンブルである。
斜め決定木を育成するための基本アルゴリズムSTreeを紹介する。
ODTEは一貫してライバルより上位に位置する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:58:32 GMT)
Comparative Analysis of Machine Learning and Deep Learning Models for Classifying Squamous Epithelial Cells of the Cervix [0.7] 現在のPapスミア分析法は、手動、時間的、労働集約的で、人的ミスの危険性が高い。
本研究では,パパスミア画像中の細胞を表層中間体,傍基底細胞,コア細胞,ジスケラトシス,メタ可塑性の5つのカテゴリに分類することを目的とした。
この分類には、Gradient Boosting、Random Forest、Support Vector Machine、k-Nearest Neighborといった機械学習アルゴリズムが使用されている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:37:01 GMT)
Blockchain-Enhanced Framework for Secure Third-Party Vendor Risk Management and Vigilant Security Controls [0.7] 本稿では,サードパーティベンダのリスクを管理するための,包括的なセキュアなフレームワークを提案する。
ブロックチェーンテクノロジを統合して、ベンダの評価やインタラクションにおける透明性、トレーサビリティ、不変性を保証します。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:42:14 GMT)
Investigating Graph Neural Networks and Classical Feature-Extraction Techniques in Activity-Cliff and Molecular Property Prediction [0.7] 分子の破滅は、分子データの数値的特徴ベクトルへの変換を指す。
分子グラフから直接識別可能な特徴を学習する新しい手法として、メッセージパッシンググラフニューラルネットワーク(GNN)が登場した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:07:48 GMT)
Exploiting Contextual Uncertainty of Visual Data for Efficient Training of Deep Models [0.7] アクティブラーニングCDALにおける文脈多様性の概念を導入する。
モデルバイアスを低減するために、文脈的に公正なデータをキュレートするデータ修復アルゴリズムを提案する。
我々は、野生生物カメラトラップ画像の画像検索システムと、質の悪い農村道路に対する信頼性の高い警告システムの開発に取り組んでいる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:35:37 GMT)
SalsaNext: Fast, Uncertainty-aware Semantic Segmentation of LiDAR Point Clouds for Autonomous Driving [0.6] 完全3次元LiDAR点雲の非確実性を考慮したセマンティックセマンティックセグメンテーションをリアルタイムに行うために,SalsaNextを紹介した。
SalsaNextはエンコーダ-デコーダアーキテクチャを持つSalsaNetの次期バージョンである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:47:25 GMT)
Enhancing Thermal MOT: A Novel Box Association Method Leveraging Thermal Identity and Motion Similarity [0.6] 熱画像における複数物体追跡(MOT)は、視覚的特徴の欠如と動きパターンの複雑さにより、ユニークな課題を呈している。
本稿では, 熱領域におけるMOT改善のための新しいボックスアソシエーション手法を提案する。
提案手法は熱的特徴空間と動的物体追跡を融合し,より正確でロバストなMOT性能を実現する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:27:01 GMT)
Leveraging Prior Experience: An Expandable Auxiliary Knowledge Base for Text-to-SQL [0.6] 大規模言語モデル(LLM)は多くのタスクにまたがる優れた問題解決スキルを示すが、テキスト・トゥ・コンテクストなど、下流の様々なアプリケーションでは人間に比較すると性能が劣っている。
LPE-Leveragingは,微調整を必要とせずに連続的な学習を可能にし,LLMを増強する新しいフレームワークである。
実験結果から,この連続学習手法が性能向上に寄与することが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:03:17 GMT)
Proceedings Sixth International Workshop on Formal Methods for Autonomous Systems [0.6] 第6回国際自律システム形式的方法ワークショップ(FMAS 2024)の論文を含む。
FMAS 2024は、マンチェスター大学の主催する統合形式的方法に関する第19回国際会議(iFM'24)と共同で開催された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:21:22 GMT)
When IoT Meet LLMs: Applications and Challenges [0.5] 大規模言語モデル(LLM)がIoT(Internet of Things)における高度な意思決定とコンテキスト理解をいかに促進するかを示す。
これは、エッジ、フォグ、クラウドシステム間のIoT-LLM統合に関する最初の包括的な研究である。
産業用IoTアプリケーションのための新しいシステムモデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:44:51 GMT)
Integration of Active Learning and MCMC Sampling for Efficient Bayesian Calibration of Mechanical Properties [0.5] 代理モデルの事前訓練では,低次元から中等次元においても後方推定に大きな誤差が生じることを示した。
本稿では,MCMCアルゴリズムの経路に基づくシンプルな能動学習戦略を提案する。
我々は,フォワードモデルをMCMCアルゴリズムではなく,推論プロセスのボトルネックとみなす。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:35:16 GMT)
Bosonic Pauli+: Efficient Simulation of Concatenated Gottesman-Kitaev-Preskill Codes [0.5] フォールトトレラントな量子誤り訂正への有望な経路は、Gottesman-Kitaev-Preskill符号とqubit符号との結合である。
このようなコードの開発には、多くのモードの力学をシミュレートしながら、現実的にノイズをモデル化するシミュレーションツールが必要である。
ここでは、ボソニック多モードヒルベルト空間のリッチダイナミクスを捕捉しながら、多数のモードで効率的にシミュレートできるボソニック・パウリ+モデル(BP+)を導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:44:05 GMT)
Securing Healthcare with Deep Learning: A CNN-Based Model for medical IoT Threat Detection [0.4] インターネット・オブ・メディカル・モノ(IoMT)の医療システムへの統合は、患者のケアを大幅に強化した。
本稿では、IoMT環境におけるサイバー攻撃を検出するために、畳み込みニューラルネットワーク(CNN)に基づく新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:11:56 GMT)
Time Step Generating: A Universal Synthesized Deepfake Image Detector [0.4] 汎用合成画像検出器 Time Step Generating (TSG) を提案する。
TSGは、事前訓練されたモデルの再構築能力、特定のデータセット、サンプリングアルゴリズムに依存していない。
我々は,提案したTSGを大規模GenImageベンチマークで検証し,精度と一般化性の両方において大幅な改善を実現した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:30:01 GMT)
Benchmarking Quantum Convolutional Neural Networks for Classification and Data Compression Tasks [0.4] 量子畳み込みニューラルネットワーク(QCNN)は、量子機械学習タスクの有望なモデルとして登場した。
本稿では,量子基底状態の位相を分類するハードウェア効率アンサッツ(HEA)と比較してQCNNの性能について検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:17:09 GMT)
Towards Specification-Driven LLM-Based Generation of Embedded Automotive Software [0.4] 本稿では,LLMによるコード生成と形式検証を組み合わせ,重要な組込みソフトウェアを作成する方法について検討する。
目標は、仕様のみから産業品質のコードを自動的に生成することだ。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:38:17 GMT)
Fundamental limits of free-space microwave-to-optical frequency conversion efficiency using Rydberg atoms [0.4] 効率的なマイクロ波-光周波数変換(MOC)は、ラジオメトリー、エレクトロメトリー、量子マイクロ波照明、量子ネットワークなどの応用に不可欠である。
Rydberg原子は、自由空間MOCを実現するためのユニークなプラットフォームを提供し、広帯域でスケーラブルで柔軟な量子インターフェースを約束する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:50:11 GMT)
Effective Analog ICs Floorplanning with Relational Graph Neural Networks and Reinforcement Learning [0.4] 本稿では,強化学習に基づく新しいフロアプランニングアルゴリズムを提案する。
回路特徴と位置制約を符号化するリレーショナルグラフ畳み込みニューラルネットワークモデルによって拡張される。
提案手法は, 既設フロアプランニング手法を, 速度, 面積, 半周波線長で上回った。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:11:12 GMT)
An Expressive Trace Logic for Recursive Programs [0.4] 本稿では, 2進状態述語, チョップ, 最小不動点に基づく, トレース式上の表現論理について述べる。
プログラムとトレース公式の両方に、直接的なスタイル、完全な構成的、意味論的意味論が備わっている。
我々の結果は、プログラミング構造と論理連結体との対応に光を当てた。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:35:29 GMT)
Quantum Kernel-Based Long Short-term Memory [0.3] 本稿では,Quantum Kernel-Based Long Short-Term Memory (QK-LSTM) ネットワークを導入する。
この量子化アーキテクチャは、効率的な収束、ロバストな損失最小化、モデルコンパクト性を示す。
ベンチマークの結果,QK-LSTMは従来のLSTMモデルと同等の性能を示すが,パラメータは少ない。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:39:30 GMT)
Quantized symbolic time series approximation [0.3] 本稿では,新しい量子化に基づくABBA記号近似手法,QABBAを提案する。
QABBAは、元の速度とシンボル再構成の精度を維持しながら、ストレージ効率を向上させる。
時系列回帰のための大規模言語モデル(LLM)を用いたQABBAの応用についても述べる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:32:22 GMT)
A community palm model [0.3] パーム油の生産は熱帯諸国の森林破壊の主要な要因の1つと認識されている。
サプライチェーンの目的を満たすため、商品生産者と他の利害関係者は、サプライチェーンにおける土地被覆動態のタイムリーな情報を必要としている。
ここでは、さまざまな利害関係者から得られたプールデータに基づいてトレーニングされた機械学習モデルである"コミュニティモデル"を紹介する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:10:28 GMT)
Ambiguous Resonances in Multipulse Quantum Sensing with Nitrogen Vacancy Centers [0.3] ダイヤモンド中の1つの窒素空孔中心に存在する3つの効果を実験的に評価した。
また、回転波近似を伴わない数値シミュレーションモデルを開発し、実験データに頑健な相関関係を示した。
窒素空孔中心と動的デカップリング配列に焦点が当てられているが、これらの結果と開発モデルは他の固体スピンや量子センシング技術にも適用できる可能性がある。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:58:48 GMT)
PDE-CNNs: Axiomatic Derivations and Applications [0.2] Group Convolutional Neural Networks (PDE-G-CNNs) は、G-CNNの従来のコンポーネントの代用として、PDEを解く。
本稿では, ユークリッド同変 PDE-G-CNN に焦点をあてる。
我々は、PDE-CNNがより少ないパラメータを提供し、精度を向上し、CNNと比較してデータ効率が良くなる小さなネットワークを確認した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:22:53 GMT)
Debias-CLR: A Contrastive Learning Based Debiasing Method for Algorithmic Fairness in Healthcare Applications [0.2] 異なる治療と戦うために,暗黙の処理内脱バイアス法を提案した。
心不全患者の臨床記録と診断基準,治療報告,生理的活力について検討した。
Debias-CLRは、性別や民族を嫌う場合に、SC-WEAT(Single-Category Word Embedding Association Test)の効果を減少させることができた。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:06:26 GMT)
Real-Time Scattering in Ising Field Theory using Matrix Product States [0.2] 行列積状態と時間依存性変動原理を用いたイジング場理論における散乱について研究する。
We found that the high energy behavior of the two-to-two Particle scattering probability in IFT is consistent with a conjecture of Zamolodchikov。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:00:01 GMT)
An $^{115}$In$^+$-$^{172}$Yb$^+$ Coulomb crystal clock with $2.5\times10^{-18}$ systematic uncertainty [0.2] 我々は15$In$+$の遷移に基づいて、スケーラブルな混合種Coulombクリスタルクロックを提示する。
これは不安定性を9.2times10-16/sqrttau/1;mathrms$.2times10-16/sqrttau/1;mathrms$に減少させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:40:48 GMT)
SNIP: Speculative Execution and Non-Interference Preservation for Compiler Transformations [0.2] 投機的意味論に基づくコンパイラ変換における非干渉保存の問題に対処する。
我々は,すべてのソースプログラムに対して一様に保存を保証できる検証方法を開発した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:23:46 GMT)
Test Security in Remote Testing Age: Perspectives from Process Data Analytics and AI [0.1] 新型コロナウイルス(COVID-19)のパンデミックは、遠隔操作による高リスク評価の導入と受け入れを加速させている。
クリックストリームプロセスデータに基づくデータ分析とAIメソッドは、テスト実行プロセスに関する深い洞察を得ることができます。
この章は現実世界の例を使って、これが事実であることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:38:34 GMT)
Beyond Visual Understanding: Introducing PARROT-360V for Vision Language Model Benchmarking [0.1] 2487の難解な視覚パズルを特徴とする新しい総合ベンチマークであるPARROT-360Vベンチマークを紹介する。
GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro の先行モデルの評価を行った。
最新モデルのスコアはベンチマークで28~56パーセンテージで、一般的なベンチマークでのパフォーマンスよりも大幅に低かった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:09:21 GMT)
Automatic EEG Independent Component Classification Using ICLabel in Python [0.1] ICLabelはEEGLABにおいて重要なプラグイン機能である。
EEGデータの自動処理に対する強力なアプローチは、データをICA(Independent Component Analysis)によって分解し、ICLabelを使って結果の独立コンポーネント(IC)を分類することである。
EEGパイプラインはオープンソースのOctopaveインタプリタを実行する高性能コンピューティングをサポートしているが、ICLabelプラグインはOctopaveと互換性がない。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:39:18 GMT)
ZNorm: Z-Score Gradient Normalization Accelerating Skip-Connected Network Training without Architectural Modification [0.0] Z-Score Normalization for Gradient Descent (ZNorm)は、ネットワークアーキテクチャを変更することなく勾配のみを調整し、トレーニングを加速し、モデル性能を向上させる革新的な技術である。
ZNormは、全体的な勾配を正規化し、レイヤ間の一貫性のある勾配スケーリングを提供し、グラデーションの消滅と爆発のリスクを効果的に低減し、優れたパフォーマンスを達成する。
医用画像の応用において、ZNormは腫瘍の予測とセグメンテーションの精度を大幅に向上させ、その実用性を強調している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:54:05 GMT)
YCB-LUMA: YCB Object Dataset with Luminance Keying for Object Localization [0.0] 画像中のターゲットオブジェクトのローカライズは、コンピュータビジョンにおいて重要な課題である。
我々は、YCBスーパーセットの残りのオブジェクトを記録することで、共通YCB-V集合に輝度キーを付加する以前の作業を拡張した。
追加のさまざまなオブジェクトは、輝度キー付けの有用性を示し、新しい2次元オブジェクト検出とセグメンテーションアルゴリズムに対するアプローチの適用性をテストするために使用される。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:32:22 GMT)
Writing Style Matters: An Examination of Bias and Fairness in Information Retrieval Systems [0.0] 本稿では,情報検索(IR)システム内の特定の文書やクエリ記述スタイルに対するテキスト埋め込みモデルの潜在的なバイアスについて検討する。
本研究により,異なる埋め込みモデルが文書作成スタイルの異なる好みを示すことが明らかとなった。
クエリ記述スタイルに関しては、多くの埋め込みモデルは、検索したドキュメントのスタイルとクエリのスタイルにマッチする傾向にあるが、特定のスタイルに対して一貫した好みを示すものもある。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:17:09 GMT)
ViSTa Dataset: Do vision-language models understand sequential tasks? [0.0] 強化学習における報酬モデルとして視覚言語モデル(VLM)を使用することは、コスト削減と安全性の向上を約束する。
逐次タスクの視覚的理解を評価するためのデータセットであるViSTaを紹介する。
ViSTaは4000本以上のビデオと、仮想ホーム、Minecraft、および現実世界の環境におけるステップバイステップの説明で構成されている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:19:22 GMT)
Verification and Validation of Autonomous Systems [0.0] 本稿では,自動運転車におけるソフトウェア欠陥の防止方法について述べる。
また、ソフトウェア製品開発フェーズにおいて、より高いレベルの保証を作成する方法についても説明している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:36:22 GMT)
Utilizing Large Language Models to Synthesize Product Desirability Datasets [0.0] 本研究は,大規模言語モデル(LLMs)を用いて,製品適合性ツールキット(PDT)テストのための合成データセットを生成することを目的とする。
3つの方法、Word+Review、Review+Word、Require-Wordが、それぞれ1000の製品レビューを合成するために使用された。
生成されたデータセットは、感情アライメント、テキストの多様性、データ生成コストとして評価された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:35:21 GMT)
Unsupervised Foundation Model-Agnostic Slide-Level Representation Learning [0.0] 本稿では,有用なスライド表現を生成する単一モダリティSSL法を提案する。
対照的な事前学習戦略はCOBRAと呼ばれ、複数のFMとMamba-2に基づくアーキテクチャを採用している。
COBRAは4種類のCPTACコホート上で、最先端のスライドエンコーダの性能を少なくとも3.8%上回っている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:12:43 GMT)
Ultraslow Growth of Number Entropy in an l-bit Model of Many-Body Localization [0.0] 我々は,N'eel状態から始まる数エントロピーの超低速成長を観測し,システムサイズとともに増大する値で飽和する。
これは、顕微鏡モデルにおけるそのような成長の観察は、多体局在を除外するのに十分ではないことを示唆している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:33:59 GMT)
Two-terminal transport in biased lattices: transition from ballistic to diffusive current [0.0] 格子内の弱い緩和/脱コヒーレンス過程の存在下での量子輸送に対する傾きの影響について検討する。
弱い傾き(化学ポテンシャル差が小さい)のランダウアー弾道輸送体制は、強い傾きのエサキ・ツス散逸する輸送体制に変化することが示されている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:32:01 GMT)
Towards Advanced Speech Signal Processing: A Statistical Perspective on Convolution-Based Architectures and its Applications [0.0] 本稿では、畳み込みニューラルネットワーク(CNN)、コンフォーマー、ResNet、および音声信号処理モデルとしてのCRNNを含む畳み込みモデルについて調査する。
各モデルの長所と短所を比較し、潜在的な誤りを特定し、さらなる研究の道筋を提案し、それが音声技術の進歩に果たす中心的な役割を強調した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:01:30 GMT)
Topological zero modes and bounded modes at smooth domain walls: Exact solutions and dualities [0.0] トポロジーは、トポロジカル絶縁体と超伝導体のトポロジ的非等価相の間の領域壁におけるソリトニックゼロエネルギーモードの存在を規定している。
ここでは、滑らかで指数関数的に定義されたドメインウォールを仮定して、これらの零モードの分析解を求める。
我々は、ゼロモードのバルク励起ギャップ、崩壊速度、振動運動量の間の普遍的な関係を確立する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:00:13 GMT)
Time-resolved diamond magnetic microscopy of superparamagnetic iron-oxide nanoparticles [0.0] 超常磁性酸化鉄ナノ粒子(SPION)は生体医用イメージングのための有望なプローブである。
ここでは、何百もの孤立した30nmのSPIONが生成する強磁場をワイドフィールドで撮像する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:28:42 GMT)
Time Evolution in Quantum Mechanics with a Minimal Time Scale [0.0] 最小測定可能な時間スケールを示す量子論を示す。
我々はPage-Wootters形式を用いて量子系の時間発展を記述する。
最小時間スケールでは、格子上の時間進化を記述する離散的なシュリンガー方程式を導入することもできる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:17:55 GMT)
Theory-independent monitoring of the decoherence of a superconducting qubit with generalized contextuality [0.0] 最小の仮定の下で量子システムの非古典性を特徴づけることは、量子基盤と技術にとって重要な課題である。
本稿では, 理論に依存しないプロセストモグラフィ法を導入し, 超伝導量子ビット上で行う。
一般確率論としてシステムをモデル化することで、量子理論を仮定したり、デバイスを信頼することなく、デコヒーレンスを実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:06:52 GMT)
The revised boomerang connectivity tables and their connection to the Difference Distribution Table [0.0] 近年では、拡張ボメラン接続テーブル(EBCT)、下ボメラン接続テーブル(LBCT)、上ボメラン接続テーブル(UBCT)の3つの新しいテーブルが導入されている。
本稿では,これらの新しいEBCT, LBCT, UBCTの概念を差分$delta$-uniform関数のためにDDTに接続することで, 文脈で述べる。
我々は以前公表されたいくつかの結果を簡単に得る。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:05:13 GMT)
The Role of Accuracy and Validation Effectiveness in Conversational Business Analytics [0.0] 本研究では,AIを利用した対話型ビジネス分析を用いて,エンドユーザが従来のセルフサービス分析を効果的に利用できない技術的能力ギャップに対処する手法について検討する。
この研究は、部分的または完全なサポートを通じて、会話ビジネス分析が人間の専門家への委譲よりも優れている状況を特定する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:46:13 GMT)
The Influence of Thermal Fluctuations on Bosonic Correlations and the AC Stark Effect in Two-Level Atoms: A Superstatistical Perspective [0.0] 熱ゆらぎがボゾン浴の2時間相関関数に及ぼす影響を超統計学的枠組みを用いて検討した。
また、これらの揺らぎが減衰した2レベル原子の量子マスター方程式に及ぼす影響を、平衡外放射浴と結合して解析する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:25:44 GMT)
The Impossible Test: A 2024 Unsolvable Dataset and A Chance for an AGI Quiz [0.0] 我々は、675の根本的な解決不可能な問題に対して不確実性を認識できる大規模言語モデル(LLM)の能力を評価する。
62-68%の精度で得られた最良のモデルは、生物学から哲学、数学まで様々な分野において未知であった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:12:29 GMT)
Temporal Bell inequalities in non-relativistic many-body physics [0.0] 2つのスピンの時間的クレーター-ホルン不等式は、2つの測定されたパーティがスピンチェーンで接続されている場合、測定間の非ゼロ時間間隔で違反することを示す。
我々の結果は、多体構成で予想されるように、リーブ・ロビンソン境界は情報の拡散の基本的な限界として光の速度を代用していることを示唆している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:15:23 GMT)
Suspected Undeclared Use of Artificial Intelligence in the Academic Literature: An Analysis of the Academ-AI Dataset [0.0] アカデミックAIは、学術文献における未宣言のAI使用の疑いのある事例を文書化している。
宣言されていないAIは、引用基準が高く、記事処理料金が高いジャーナルに現れるようだ。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 21:29:36 GMT)
Surface Flux Transport Modeling using Physics Informed Neural Networks [0.0] 表面フラックス輸送(SFT)モデリングは、太陽表面の磁束の輸送と進化をシミュレートし、解析するのに役立つ。
本研究では,磁束輸送の解法における機械学習の応用を実証し,その精度を検証した。
SFTを用いたバイポーラ磁気領域(BMR)の進化を研究するための新しい物理情報ニューラルネットワーク(PINN)モデルを開発した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:56:31 GMT)
Superclassical non-Markovian open quantum dynamics [0.0] 超古典的非マルコフ的開量子系力学は、その測定侵襲性の欠如によって定義される。
この対角非侵襲性は、測定結果のジョイント確率が古典的なコルモゴロフ整合条件を満たすことを保証している。
時間的に可逆な)単位系-環境結合に基づく非偏極力学のサブクラスが要求される性質を満たすことが示されている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:19:13 GMT)
Some mathematical issues regarding a new approach towards quantum foundation [0.0] 最も弱い可能性定理は、量子論のヒルベルト空間形式論の基礎を与えるものである。
必要な仮定は定式化され、数学は詳細に綴られる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:14:14 GMT)
Soda: An Object-Oriented Functional Language for Specifying Human-Centered Problems [0.0] ソーダ(Soda)は、自然に品質や量を扱うのに役立ち、その正確性をチェックする作業を大幅に単純化する言語である。
本稿では,コンピュータシステムにおける複雑な要件を符号化する記述型言語の設計を動機とした,言語の主要な特性について述べる。
我々は、問題をより透明でエラーの少ない方法で記述するのに役立つツールの概要を述べます。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:26:52 GMT)
SlideSpawn: An Automatic Slides Generation System for Research Publications [0.0] 本稿では,研究資料のPDFを入力とし,質の高いプレゼンテーションを生成する新しいシステムであるSlideSpwanを提案する。
PS5KデータセットとAminer 9.5K Insightsデータセットに基づいてトレーニングされた機械学習モデルを使用して、論文の各文のサリエンスを予測する。
650対の論文とスライドによるテストセットの実験により,本システムがより良い品質のプレゼンテーションを生成することを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:16:16 GMT)
Scattering phase shifts from a quantum computer [0.0] 量子コンピュータ上での2体散乱位相のシフトを、先進的な短距離実効場理論であるハミルトニアンを用いて計算する。
このアルゴリズムは変分量子固有解法と量子部分空間展開を組み合わせたものである。
ノイズがこれらの計算にどのように影響するかを考察し、より大規模な量子処理ユニットに作業を拡張するために必要なノイズ緩和について議論する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:21:09 GMT)
Scattering of TE and TM waves and quantum dynamics generated by non-Hermitian Hamiltonians [0.0] 本稿では, TEおよびTM波の散乱を動的に定式化し, 媒体の遷移行列を有効非単項量子系の進化演算子として与える方法を提案する。
本稿では、TE波やTM波を反射しない媒体を所定の波数と入射角で同定する上で、この観測の適用について論じる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:06:06 GMT)
Robust coherent dynamics of homogeneously limited anisotropic excitons in two-dimensional layered ReS2 [0.0] 二次元層状半導体における面内異方性励起は、最先端のナノフォトニクス応用を可能にする。
ここでは, プリシン層状r崩壊ジスルフィド(ReS2)における異方性励起子のコヒーレンス時間を直接測定する。
ReS2の励起コヒーレンスは、他の2次元半導体と比較して、光学密度と温度に対して例外的な堅牢性を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 20:24:41 GMT)
Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0] 本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 05:50:48 GMT)
Quantum uncertainty of optical coherence [0.0] 我々は、最も単純な光場、純粋な単色平面波の1次コヒーレンスに焦点をあてる。
我々は、任意の状態が、偏極状態と時空点に依存する不確実性関係の集合によって支配されるコヒーレンス揺らぎにつながることを確証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:00:27 GMT)
Quantum neural networks form Gaussian processes [0.0] 量子ニューラルネットワーク(QNN)の類似性を証明する。
ハールランダムユニタリあるいはディープQNNに基づくある種のモデルの出力は、大きなヒルベルト空間次元$d$の極限でガウス過程に収束することを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:12:04 GMT)
Quantum gravitational decoherence of a mechanical oscillator from spacetime fluctuations [0.0] 本稿では, ゆらぎ変形パラメータと変形可換関係による変動時空のシナリオ, あるいは揺らぎ計量テンソルについて考察する。
結果のダイナミクスを計算し、これらの変動を平均化することにより、システムは運動量ベースでデコヒーレンスを経験する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:19:07 GMT)
Quantum Friction near the Instability Threshold [0.0] 不安定なしきい値付近で、量子摩擦力は対数的に分散することを示す。
我々の発見は、量子的および古典的な状態における摩擦力学における不安定性、臨界ばらつき、温度の役割に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:40:38 GMT)
Qualitative equivalence between incompatibility and Bell nonlocality [0.0] 量子論における測定は、共同測定不可能である。
測定の不適合性は必要だが、ベルの不等式に違反するには不十分である。
非自明な関節測定構造はベル違反に必要であるだけでなく、十分である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:30:03 GMT)
Predictive Insights into LGBTQ+ Minority Stress: A Transductive Exploration of Social Media Discourse [0.0] LGBTQ+の人は異性愛者や性愛者よりも健康を害する傾向にある。
マイノリティのストレスは、ソーシャルメディアプラットフォーム上の投稿でしばしば表現される。
グラフニューラルネットワーク (GNN) と変換器 (BERT) からの双方向表現を用いたハイブリッドモデルを構築し, マイノリティストレス検出の分類性能を向上させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:35:41 GMT)
Population Dynamics of Schrödinger Cats [0.0] 我々は、$d$次元格子上で、原型的なシュラーオドニガー・キャットの個体群モデルについて検討する。
古典的な個体群動態と通常の量子相転移の両方で観察されるものとは異なっている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:25:26 GMT)
Patience Is The Key to Large Language Model Reasoning [0.0] そこで我々は,モデルに患者推論スタイルを採用することを奨励する簡単な方法を提案する。
我々は、肯定的な例として詳細な推論プロセス、否定的な例として単純な回答を生成し、その結果、その反応の完全性を支持するようにモデルを訓練する。
この結果から,軽量データセット上でのトレーニングにより,GSM8kのパフォーマンスは最大6.7%向上した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:20:48 GMT)
Optimizing Temperature Distributions for Training Neural Quantum States using Parallel Tempering [0.0] 温度最適化は変分アルゴリズムの成功率を大幅に向上させることができることを示す。
我々はこれを、制限されたボルツマンマシンとフィードフォワードネットワークという2つの異なるニューラルネットワークを用いて実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:28:21 GMT)
Optimizing EPR pulses for broadband excitation and refocusing [0.0] 我々は、ハーンエコー振幅を最大化するブロードバンドパルス形状を数値的に最適化する。
パルスはニューラルネットワーク(NN)、非線形振幅制限フーリエ級数(FS)、離散時系列(DT)としてパラメータ化される
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:15:11 GMT)
Optimization of two-photon absorption for three-level atom [0.0] 光の最適状態の分光時間形状は、原子状態の寿命によって決定される。
光の入力状態の絡み合いが質的に異なる2つの異なる相互作用機構を識別することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:42:47 GMT)
Open-system eigenstate thermalization in a noninteracting integrable model [0.0] 個別固有状態による孤立量子配置における可観測物の熱化問題について検討する。
熱化の要因は非可積分性だけではないことが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:39:19 GMT)
On the relationship between Koopman operator approximations and neural ordinary differential equations for data-driven time-evolution predictions [0.0] 辞書学習による拡張動的モード分解(EDMD-DL)は、状態空間上の非線形離散時間フローマップのニューラルネットワーク表現と等価であることを示す。
それぞれのモデル構造と訓練手順の異なる側面を組み合わせることで,数種類のニューラル常微分方程式(ODE)とEDMD-DLを実装した。
ロレンツ系におけるカオス力学の数値実験と乱流せん断流れの9モードモデルを用いてこれらの手法を評価する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:18:46 GMT)
On the application of the Rayleigh-Ritz method to a projected Hamiltonian [0.0] 有名なレイリー・リッツ法を、最近選択されたハミルトン作用素の射影に適用する。
おもちゃモデルを用いて、RRM固有値が、下から投影されたハミルトニアンの値に近づくことを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:04:20 GMT)
Non-equilibrium dynamics of symmetry-resolved entanglement and entanglement asymmetry: Exact asymptotics in Rule 54 [0.0] 本稿では,ルール54セルオートマトンにおける絡み合いと解消絡み合いの非平衡ダイナミクスについて論じる。
我々は、局所的な関係のシステムを用いて、宇宙空間で契約するテンソルネットワークの観点で表現する。
この状態において、電荷モーメントは立方体方程式の先頭解によって与えられる速度で指数関数的に崩壊する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:30:37 GMT)
Non-Abelian entanglement asymmetry in random states [0.0] 任意の対称性群に対して、平均エンタングルメント非対称性は、部分系がその補集合よりも小さいときに熱力学的極限において消滅する。
より大きいサブシステムサイズに対して、絡み合う非対称性は、群の次元によって固定係数で対数スケーリングを表示する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:11:07 GMT)
Noisy intermediate-scale quantum simulation of the one-dimensional wave equation [0.0] 本研究では,量子H1-1量子コンピュータ上での1次元波動方程式のシミュレーションのための量子回路の設計と実装を行う。
波動方程式をシミュレーションする手法は、異なる量子プロセッサ間で適切な状態準備アルゴリズムを用いて使用することができ、アプリケーション指向のベンチマークとして機能する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:41:08 GMT)
New Partial Trace Inequalities and Distillability of Werner States [0.0] この研究は、ヴェルナー状態の蒸留性条件を部分的トレース不等式に変換することで、この問題を解決するための新しい戦略を示す。
We obtain a new bound for the $2$-distillability of Werner states, which can not depend to the dimension of the system。
一方、2つ目の主な結果は、二部構造系に対する新しい部分的トレース不等式を提供し、そのいくつかはヴェルナー状態の分離性と結びついている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:07:39 GMT)
Multiplexed Processing of Quantum Information Across an Ultra-wide Optical Bandwidth [0.0] 現在の量子プロトコルは、標準測定装置の狭い電子帯域幅によって制限されている。
本稿では、周波数多重化量子チャネルの概念と、利用可能な光帯域にわたって量子情報を効率的に処理するための一連の方法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 07:12:50 GMT)
Multicomponent cat states with sub-Planck structures and their optomechanical analogues [0.0] 位相空間特性を拡張したコンパス状態の一般化版を導入する。
これらの望ましい位相空間特性は、少なくとも6つの異なるコヒーレント状態からなる重ね合わせにおいて維持されることを示す。
提案した量子状態を生成することができる光学系について検討し,ほぼ同じ位相空間構造を持つ光学系について検討した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:21:53 GMT)
Making molecules by mergoassociation: the role of center-of-mass motion [0.0] 結合では、分離した光トラップの2つの原子が結合し、トラップがマージされたときに分子を形成する。
本研究では,重心運動への結合を含む理論的手法を開発した。
トラップが異方性である場合の結合の役割と、量子論理ゲートを構築する上での移動可能なトラップの可能性を考える。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:28:33 GMT)
Machine learned reconstruction of tsunami dynamics from sparse observations [0.0] 本研究では, 津波波のフルフィールド表面高さ測定を行うために, スパースセンシング応用のためのトランスフォーマーニューラルネットワークを用いた。
我々は,USGSの過去の地震記録に対応する震源となる8つの津波シミュレーションからなるデータセット上でモデルを訓練する。
その結果, センサの少なくともいくつかが非ゼロ信号を得た場合, 真の磁場からの微細な位相と振幅特性の顕著な分解能が得られた。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:42:40 GMT)
M2oE: Multimodal Collaborative Expert Peptide Model [0.0] 本稿では,M2oE多モード協調専門家ペプチドモデルを提案する。
従来の研究に基づいて、シーケンスと空間構造情報を統合し、エキスパートモデルとクロスアテンションメカニズムを用いることで、モデルの能力は均衡し、改善される。
実験結果から,M2oEモデルは複雑なタスク予測に優れていたことが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:52:52 GMT)
Labeling eigenstates of qubit-cavity systems based on the continuity of qubit occupancy: Detecting resonances to higher excited qubit states [0.0] 本稿では, キュービット占有率の連続性に基づく, キュービットキャビティシステムの固有状態のラベル付け手法を提案する。
ラベル付き固有状態は、キャビティ駆動下での量子状態の進化を大まかに見積もっている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:18:52 GMT)
LaVida Drive: Vision-Text Interaction VLM for Autonomous Driving with Token Selection, Recovery and Enhancement [0.0] 本稿では,自律運転のための新しい,効率的なVQAフレームワークであるLaVida Driveを紹介する。
LaVida Driveは、詳細な視覚知覚のための高解像度入力を維持しながら、時間データをシームレスに統合する。
複雑な詳細のための高分解能データを保持し、時間解析のために低分解能入力を使用することで空間処理を最適化する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:14:07 GMT)
Insulator phases of Bose-Fermi mixtures induced by intraspecies next-neighbor interactions [0.0] ハードコア限界における2色フェルミオンとスカラーボソンの1次元混合について検討した。
我々は、非局所相互作用がよく知られた混合モットとスピン選択モット絶縁体を好ましくも害する可能性があることを観察した。
本研究は, 半導体ヘテロ構造中の準粒子に関する最近の報告から, 長距離相互作用を伴う冷間原子系の実験のインスピレーションあるいは理解に寄与することができる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:34:46 GMT)
Infinite series involving special functions obtained using simple one-dimensional quantum mechanical problems [0.0] 一般化された超幾何関数、関連するラゲール関数、ベッセル関数、ストルーブ関数などの特殊関数を含む無限和のある種のクラスを解析的に評価する。
この計算は、単純な量子力学モデルに適用された基本的な量子力学原理に基づいている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:13:00 GMT)
Image Harmonization using Robust Restricted CDF Matching [0.0] 曲線フィッティングに基づく累積分布関数(CDF)マッチングを用いた画像調和方式を提案する。
画像強度の変換は、他の既知のヒストグラムマッチングアルゴリズムと比較して、非線形であるが、まだ滑らかで弾力的である」。
我々はMRI画像の手法を実証するが、他の種類の画像データに適用できるほど汎用的である。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:12:47 GMT)
Hierarchical Information-sharing Convolutional Neural Network for the Prediction of Arctic Sea Ice Concentration and Velocity [0.0] 本研究では, 階層型情報共有U-net (HIS-Unet) と呼ばれる新しいマルチタスクネットワークアーキテクチャを提案し, 日々のSICとSIVを予測する。
私たちのHIS-Unetは、他の統計手法、海氷物理モデル、そしてそのような情報共有ユニットのないニューラルネットワークよりも優れています。
HIS-Unetの改善は、SICとWAMによるSIV間の情報共有が、SICとSIVの動的変化の学習に役立つことを示唆している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:28:28 GMT)
HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution [0.0] 我々は、ImageNetデータセット上で事前訓練された可逆ニューラルネットワーク(INN)を利用して、高周波の知覚損失を導入する。
トレーニング期間中,我々は超解像および基底真理(GT)画像の高周波特性の保存を強制する。
我々は、RealSR、RealSet65、DIV2K-Val、ImageNetデータセットで最先端のCLIPIQAスコアを得る。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:56:24 GMT)
Gravitational entanglement witness through Einstein ring image [0.0] 空間量子重ね合わせにおける質量源によって誘導される弱い重力場において、重力レンズとアインシュタイン環像を探索することにより、量子理論と重力の相互作用を探索する。
我々は、質量源と他の系の量子絡み合いを生成する最初の量子化ニュートン重力(QG)モデルと、絡み合いを生じないシュル・オーディンガー・ニュートン重力(SN)モデルという、2つの異なる重力モデルで伝播する量子化マスレススカラー場を解析する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:50:45 GMT)
Graph neural network framework for energy mapping of hybrid monte-carlo molecular dynamics simulations of Medium Entropy Alloys [0.0] 本研究では, 中エントロピー合金(MEAs)のモデリングのためのグラフベース表現を提案する。
ハイブリッドモンテカルロ分子動力学(MC/MD)シミュレーションは、MEAの様々な熱処理温度で熱的に安定な構造を実現するために用いられる。
これらのシミュレーションはダンプファイルとポテンシャルエネルギーラベルを生成し、原子配置のグラフ表現を構築するのに使用される。
これらのグラフは、システムのポテンシャルエネルギーを予測するためのグラフ畳み込みニューラルネットワーク(GCNN)ベースのMLモデルの入力として機能する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:22:40 GMT)
Graph convolutional network as a fast statistical emulator for numerical ice sheet modeling [0.0] 我々は、氷床および海面システムモデル(ISSM)の適応メッシュ構造を複製するために、グラフ畳み込みネットワーク(GCN)を用いる。
南極のパインアイランド氷河(PIG)の過渡シミュレーションに適用すると、GCNは約0.997の相関係数で氷の厚さと速度を再現することに成功した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:46:37 GMT)
Generation of synthetic gait data: application to multiple sclerosis patients' gait patterns [0.0] 多発性硬化症(Multiple sclerosis, MS)は、若年者における非外傷性障害の主要な原因であり、その頻度は世界中で増加している。
MSにおける歩行障害の変動は、定量的歩行評価のための非侵襲的で敏感で費用対効果の高いツールの開発を必要とする。
eGait運動センサは、股関節回転を表す単位四元数時系列(QTS)を通して人間の歩行を特徴付けるように設計されており、有望なアプローチである。
しかし、臨床研究に典型的な小さなサンプルサイズは、歩行データ解析ツールの安定性に課題をもたらす。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:05:40 GMT)
Gaze2AOI: Open Source Deep-learning Based System for Automatic Area of Interest Annotation with Eye Tracking Data [0.0] 本稿では,関心領域の自動アノテート・ラベリング(AOIs)によるビデオストリームの拡張により,ユーザの行動と注意の分析を強化する新しい手法を提案する。
このツールは、最初の修正までの時間、居住時間、AOIリビジットの頻度などの重要な機能を提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:17:23 GMT)
From {\tt Ferminet} to PINN. Connections between neural network-based algorithms for high-dimensional Schrödinger Hamiltonian [0.0] 特に,標準モンテカルロアルゴリズムの解に対応するデータに適合する問題として,PINNアルゴリズムを再構成する。
最適化アルゴリズムのレベルでの接続も確立されている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:54:12 GMT)
From Pixels to Planes: Minimum Ground Sample Distance for Aircraft [0.0] 本研究では,地中サンプル距離(GSD)が各種航空機の検出性能に及ぼす影響について検討した。
データセットは、120機の民間機、軍用機、博物館の航空機からなり、2年以上にわたって収集された複数の衛星/航空資源から成り立っている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 14:55:44 GMT)
Establishing Quantum-Secured Channels in Large-Scale Optical Networks [0.0] 量子鍵分配技術に基づく量子セキュアな光チャネルは、世界的に大きな関心を集めている。
このようなチャネルを長距離に配置することは技術的課題に直面している。
運用環境における大規模光ネットワークにおける量子セキュアチャネルの確立に関する業界展望について論じる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:56:12 GMT)
Entanglement teleportation along a regenerating hamster-wheel graph state [0.0] 我々は、量子ハムスターホイールの周りの2ビットグラフ状態の巡回的テレポーテーションを可能にする、効率よく再利用可能な量子テレポーテーションのアプローチを計画する。
リング上のキュービットは周期的に測定され再利用され、量子プロセッサで利用可能なキュービットの総数を超えるテレポーテーション深さを達成する。
ハンスターホイール周辺の3回の完全回転の後, テレポート状態の絡み合いの58%は, 測定された2ビットの負性率で維持されることを示した。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:15:29 GMT)
Entanglement growth in the dark intervals of a locally monitored free-fermion chain [0.0] 鎖の単一部位における粒子密度をモニタリングする自由フェルミオン鎖を考える。
エントロピーの体積法スケールを示す定常状態に向かって,エントロピーの絡み合いが時間とともに大きくなることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:20:33 GMT)
Encodings of the weighted MAX k-CUT on qubit systems [0.0] 本稿では,重み付きMAX k-CUT問題の量子ビットシステム上での符号化法について検討する。
各種符号化方式について検討し,これらの手法の有効性について検討する。
重み付きおよび非重み付きグラフインスタンスの数値シミュレーションは、これらの符号化方式の有効性を実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 12:00:55 GMT)
Electron conductance and many-body marker of a cavity-embedded topological 1D chain [0.0] 電子-光子絡み合いは平均場理論の予測に対して劇的な差異をもたらすことを示す。
有限サイズの鎖に対する空洞真空場によって輸送の量子化がどのように修正されるかを明らかにする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:09:25 GMT)
Dyson Brownian motion and random matrix dynamics of weight matrices during learning [0.0] まず、ダイソン・ブラウン運動を用いて、ダイナミクスを汎用的に記述できることを実証する。
レベルは学習率とミニバッチサイズに比例して示される。
次に,初期化時の固有値に対するマルテンコ・パストゥル分布から学習終了時の付加構造との組合せへの進化に続く変圧器の重み行列ダイナミクスについて検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:05:39 GMT)
DrugGen: Advancing Drug Discovery with Large Language Models and Reinforcement Learning Feedback [0.0] DrugGen は DrugGPT 構造に基づく拡張モデルである。
承認された薬物と標的の相互作用を微調整し、近似ポリシー最適化に最適化されている。
高品質の小さな分子を生産することで、薬学研究と薬物発見を進めるための高性能な媒体を提供する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 01:21:07 GMT)
Dissipation in quantum tunnel junctions [0.0] 固体接合における量子トンネル過程中に放出されるエネルギーについて検討する。
与えられたエネルギーに対して、この研究は137Kの温度で旋回点を示し、その後、より高い温度で散逸したエネルギーが増加し始める。
特に、この研究では、散逸パラメータであるガンマとアルファが137K以上で大きな変化を示し、線形的な減少を示し、高温でのさらなる研究の重要性を強調している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:50:33 GMT)
Designing Atomtronic Circuits via Superfluid Dynamics [0.0] 本稿では,Bose-Einstein Condensates (BECs) を用いた電子回路の設計について述べる。
古典場シミュレーションを用いて、論理ゲートの普遍的な集合を示し、それらを回路に組み立てる方法を示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:00:01 GMT)
Deriving Activation Functions via Integration [0.0] 活性化関数は、ディープニューラルネットワークに非線形性を導入する上で重要な役割を果たす。
そこで,本研究では,それらの勾配に着目し,統合によって対応する関数を導出することにより,活性化関数を設計する新しい手法を提案する。
本研究は,ELU活性化関数に適用したトレーニング可能なアフィン変換を統合することで導かれる,訓練可能な一方向活性化関数である指数線形ユニット(xIELU)の積分を導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:24:21 GMT)
Deep Learning Innovations for Underwater Waste Detection: An In-Depth Analysis [0.0] 本稿では, 埋立廃棄物処理とごみ処理の基盤となるため, 最先端のアーキテクチャと既存のデータセットを網羅的に検討する。
第一の目的は、高度な水中センサーと自律型水中車両によって活用される物体の局所化手法のベンチマークを確立することである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:23:40 GMT)
DT-LSD: Deformable Transformer-based Line Segment Detection [0.0] そこで我々は,Deformable Transformer-based Line Segment Detector (DT-LSD)を導入した。
DT-LSDは従来の変換器ベースモデル(LETR)よりも高速で精度が高く,CNNベースモデルよりも精度が高いことを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:02:51 GMT)
DINO-LG: A Task-Specific DINO Model for Coronary Calcium Scoring [0.0] 冠状動脈カルシウム(CAC)スコアは、冠動脈疾患を予防するためのリスクアセスメントの鍵となる。
本研究では、DINOの自己教師型学習(SSL)技術(ラベルなし自己蒸留)を取り入れることで、このアプローチを拡張した。
DINOモデルは、重要な特徴を効果的に捉え、強調する機能を生成することを目的として、ラベルを使用することで、石灰化領域に特に焦点を合わせるように訓練されている。
ラベル誘導DINO(DINO-LG)は,石灰化を含むCTスライスと石灰化しないスライスを区別し,標準DINOモデルよりも57%の精度で分類を向上する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 02:57:56 GMT)
Current noise in quantum dot thermoelectric engines [0.0] 理論的には、単層量子ドットに基づく熱電熱機関について検討する。
強い相互作用と次から次へのトンネルの効果について検討する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 15:47:09 GMT)
Coulomb impurities in graphene driven by fast ions [0.0] グラフェン単分子膜中の2次元(2次元)人工原子における電子遷移の理論モデルを提案する。
時間依存型2次元ディラック方程式の正確な解を用いて、対応する電子遷移の確率と断面積を計算する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:12:05 GMT)
Corn Yield Prediction Model with Deep Neural Networks for Smallholder Farmer Decision Support System [0.0] 作物の収量予測は、気象変数と土壌変数の相互作用がないという仮定に基づいてモデル化されている。
本稿では、相互作用の存在を論じ、Kendall相関係数を用いて微細にモデル化することができる。
提案したトウモロコシ収量モデルの目的は、小作農が賢く知的に養殖できるようにすることである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:55:04 GMT)
Contextuality, superlocality and nonclassicality of supernoncontextuality [0.0] 状態依存型の文脈性を示す5つの文脈からなるシナリオにおいて、2量子状態の量子系について検討する。
半デバイスに依存しない文脈性という,標準的な文脈性を超えた非古典性の概念を導入する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:23:20 GMT)
Conditional t-independent spectral gap for random quantum circuits and implications for t-design depths [0.0] N クォーディット上の1次元ブリックワークアーキテクチャの T 次モーメントのスペクトルギャップに新たな境界を確立する。
スペクトルギャップの改善は、既知の結果の定数因子に大きな改善をもたらす。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:46:10 GMT)
Compute Optimal Inference and Provable Amortisation Gap in Sparse Autoencoders [0.0] スパース符号化のレンズを用いて,SAEにおけるスパース推論と学習について検討した。
計算制限付きエンコーダを用いて,SAEがアモータイズされたスパース推論を行うことを示す。
より洗練されたスパース推論手法が従来のSAEエンコーダより優れている条件を実証的に探求する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:21:53 GMT)
Comprehensive Methodology for Sample Augmentation in EEG Biomarker Studies for Alzheimers Risk Classification [0.0] 主な型であるアルツハイマー病(AD)は70%の症例である。
脳波測定はADリスクを識別する可能性を示しているが、信頼性の高い比較のために大規模なサンプルを取得することは困難である。
本研究では,信号処理,調和化,統計的手法を統合し,サンプルサイズを向上し,ADリスク分類の信頼性を向上させる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:31:02 GMT)
Certain BCS wavefunctions are quantum many-body scars [0.0] フェルミオン格子モデルにおける多体散乱状態を構築する方法を提案する。
この状態は常に「ペアリングポテンシャル」のような相関を加えて基底状態にすることができる。
BCS基底状態とその上の励起は、ヒルベルト空間の他の部分から動的に切り離された多体傷であることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 19:00:08 GMT)
CLIP Unreasonable Potential in Single-Shot Face Recognition [0.0] 顔認識は、顔のパターンや特徴を分析して個人を識別し、認証するために設計されたコンピュータビジョンの中核的なタスクである。
近年,OpenAIによって開発されたCLIP(Contrastive Language Image Pretraining)モデルが注目されている。
CLIPは自然言語処理と視覚タスクを結びつけることで、モジュール間の一般化を可能にする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:31:17 GMT)
CAFE A Novel Code switching Dataset for Algerian Dialect French and English [0.0] アルジェリア方言、フランス語、英語の最初のコードスイッチングデータセット。
CBEは、異なる社会言語学的文脈の中で、アルジェリアの様々な部分から方言のバリエーションを捉えている。
CBEデータには、約37時間の音声が含まれており、サブセットであるCAFE-smallは、2時間36分で人手による注釈が付けられている。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 16:09:16 GMT)
Benchmarking a wide range of optimisers for solving the Fermi-Hubbard model using the variational quantum eigensolver [0.0] 我々は、Fermi-Hubbardシステムを解くために、変分量子固有解器の372のインスタンスに30のオプティマイザをベンチマークした。
最終エネルギーの達成や一定の許容レベルに達するために必要な関数呼び出しといった指標に関して、オプティマイザをランク付けする。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:54:23 GMT)
Automating Sonologists USG Commands with AI and Voice Interface [0.0] 本研究は, リアルタイム画像処理, 臓器追跡, 音声コマンドを組み込んだ, 高度なAIを用いた超音波イメージングシステムを提案する。
この革新的な解決策の目標は、ソノロジーにより予測可能で生産的な画像処理を提供することである。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:03:49 GMT)
Assessing Gender Bias in LLMs: Comparing LLM Outputs with Human Perceptions and Official Statistics [0.0] 本研究では,大言語モデル(LLM)における性別バイアスについて検討する。
我々は、その性別認識を、人間の回答者、米国労働統計局のデータ、および50%の非バイアスベンチマークと比較する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 22:43:18 GMT)
Anomalous dependence of sensitivity on observation time induced by time crystal order [0.0] リング共振器と相互作用する複合原子空洞系について考察する。
このような系では時間結晶状態が観察できる。
この状態は、摂動に対するシステムの感度に2次的な観測時間依存性をもたらす可能性があることを示す。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:28:41 GMT)
An Integrated Approach to Robotic Object Grasping and Manipulation [0.0] 本研究は、棚から特定のアイテムを効率的に選択することにより、シミュレーションされた順序を自律的に達成できる革新的なロボットシステムを開発する。
提案するロボットシステムの際立った特徴は、棚のそれぞれの箱内の不確実な物体の位置の挑戦をナビゲートする能力である。
このシステムは、そのアプローチを自律的に適応するよう設計されており、望まれるアイテムを効率的に見つけ、取り出すための戦略を採用している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 11:07:37 GMT)
An Evolutional Neural Network Framework for Classification of Microarray Data [0.0] 本研究の目的は,遺伝的アルゴリズムとニューラルネットワークのハイブリッドモデルを用いて,情報的遺伝子のサブセット選択において問題を克服することである。
実験の結果,提案手法は,他の機械学習アルゴリズムと比較して,高い精度と最小数の選択遺伝子が示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 13:48:40 GMT)
Advancing Complex Medical Communication in Arabic with Sporo AraSum: Surpassing Existing Large Language Models [0.0] 本症例では、アラビアのNLPモデルであるJAISに対して、アラビア語臨床文書に適した言語モデルであるスポロ・アラサムを評価した。
その結果,Sporo AraSumはAI中心の定量値とPDQI-9の修正版で測定された定性的属性において,JAISを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 18:10:19 GMT)
Ab-initio approach to Many-Body Quantum Spin Dynamics [0.0] ハイゼンベルクモデルの多体スピンダイナミクスをシミュレートするために,多層構成時間依存型Hartreeフレームワークを用いる。
ML-MCTDHは, 1次元格子と2次元格子の両方において, 1次元および2次元観測器の時間発展を正確に捉えていることを示す。
この結果から,ML-MCTDHの多層構造は汎用多体スピンシステムの力学を扱う上で有望な数値的枠組みであることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 10:42:35 GMT)
AMaze: An intuitive benchmark generator for fast prototyping of generalizable agents [0.0] AMazeは,任意の複雑度と誤認の視覚的兆候を解釈することで,エージェントが迷路をナビゲートしなければならない,新しいベンチマークジェネレータである。
概念実証として,認識性に制限のある単純かつ完全に離散的なケースにおいて,ジェネレータの能力を実証する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 06:47:29 GMT)
AI-Driven Agents with Prompts Designed for High Agreeableness Increase the Likelihood of Being Mistaken for a Human in the Turing Test [0.0] チューリング試験では, 適合性の異なるGPT剤を試験した。
混乱率は50%を超え、AIエージェントは60%を超えた。
この薬は、最も人間らしい特徴を示すものと認識された。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 23:12:49 GMT)
A universal framework for the quantum simulation of Yang-Mills theory [0.0] フォールトトレラントディジタル量子コンピュータにおけるSU(N) Yang-Mills理論の量子シミュレーションのための普遍的なフレームワークを提供する。
また、スカラー場理論やヤン・ミルズ行列モデルを含む単純なモデルも検討し、この定式化の普遍性を説明する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 09:51:10 GMT)
A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection [0.0] 大規模言語モデルは、ユーザーがこれらのモデルに意図した範囲を超えてタスクを実行するよう促すような、オフトピー的な誤用をしがちである。
現行のガードレールは、高い偽陽性率、限られた適応性、およびプレプロダクションでは利用できない実世界のデータを必要とする非現実性に悩まされている。
本稿では,これらの課題に対処するフレキシブルでデータフリーなガードレール開発手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 00:31:23 GMT)
A Deep Learning Approach to Predict the Fall [of Price] of Cryptocurrency Long Before its Actual Fall [0.0] 本研究の目的は、暗号通貨市場のリスクファクターの大きさを予測することである。
当社のアプローチは、経験した問題や困難を克服することで、暗号通貨市場に投資する人々を支援します。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 08:09:35 GMT)
A Comparison of Machine Learning Algorithms for Predicting Sea Surface Temperature in the Great Barrier Reef Region [0.0] グレートバリアリーフ(GBR)地域における海面温度(SST)の予測は,その脆弱な生態系を効果的に管理するために重要である。
我々は,尾根回帰,最大絶対収縮・選択演算子(SOLAS),ランダムフォレスト,エクストリームグラディエントブースティング(XGBoost)アルゴリズムの性能評価を行った。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 03:52:20 GMT)
$\mathscr{H}_2$ Model Reduction for Linear Quantum Systems [0.0] 標準ベースモデル還元法として$mathscrH$が提案され, 物理的に実現可能なモデルが得られる。
アクティブおよびパッシブ線形量子システムの例は,提案手法の有効性を検証している。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 04:53:10 GMT)
$H \to ZZ$ as a double-slit experiment [0.0] ZZ から 4ell$ への崩壊の $H = e,mu$ は、有名な二重スリットの実験と類似して量子干渉をテストするために用いられる。
論文参考訳(メタデータ) (Wed, 20 Nov 2024 17:12:40 GMT)