Unleashing the Emergent Cognitive Synergy in Large Language Models: A
Task-Solving Agent through Multi-Persona Self-Collaboration [123.0] Solo Performance Promptingは、複数のペルソナと多ターンの自己コラボレーションをすることで、単一のLCMを認知的シナジストに変換する。
認知シナジスト(英: Cognitive Synergist)は、複雑なタスクにおける問題解決を強化するために、複数の心の強みと知識を協調的に結合するインテリジェントエージェントである。
より詳細な分析により,LLMに複数の微粒なペルソナを割り当てることによって,単一あるいは固定数のペルソナに比べて問題解決能力が向上することが示された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:51:24 GMT)
Not all Minorities are Equal: Empty-Class-Aware Distillation for
Heterogeneous Federated Learning [120.4] FedEDは空級蒸留とロジット抑制を同時に統合する。
多数派に偏っている可能性のある少数派クラスの誤分類に対処する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:06:31 GMT)
R-MAE: Regions Meet Masked Autoencoders [113.7] 我々は、自己教師付き画像表現学習のための単語の潜在的な視覚的類似として領域を探索する。
生成前トレーニングベースラインであるMasked Autoencoding (MAE) に触発されて, 画素群や領域群から学習するためのマスク付き領域オートエンコーディングを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:31:50 GMT)
One Shot Learning as Instruction Data Prospector for Large Language
Models [111.1] Nuggetsは、ワンショット学習を用いて、拡張データセットから高品質な命令データを選択する手法である。
提案手法は,Nuggets が生成した例の上位1%による命令チューニングが,全データセットを使用する従来の手法よりも大幅に優れていたことを実証する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:00:11 GMT)
VASE: Object-Centric Appearance and Shape Manipulation of Real Videos [108.6] 本研究では,オブジェクトの外観と,特にオブジェクトの精密かつ明示的な構造的変更を実行するために設計された,オブジェクト中心のフレームワークを紹介する。
我々は,事前学習した画像条件拡散モデル上にフレームワークを構築し,時間次元を扱うためのレイヤを統合するとともに,形状制御を実現するためのトレーニング戦略とアーキテクチャ修正を提案する。
我々は,画像駆動映像編集タスクにおいて,最先端技術に類似した性能を示し,新しい形状編集機能を示す手法について検討した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:59:24 GMT)
Learning to Prompt with Text Only Supervision for Vision-Language Models [107.3] メソッドの1つのブランチは、視覚情報を使用してプロンプトを学習することでCLIPに適応する。
別のアプローチでは、大規模な言語モデルからクラス記述を生成することで、トレーニング不要の手法を利用する。
そこで本研究では,テキストデータのみを用いてプロンプトを学習することで,両ストリームの強みを組み合わせることを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:59:49 GMT)
Exploiting Spatial-Temporal Context for Interacting Hand Reconstruction
on Monocular RGB Video [104.7] モノラルなRGBデータからインタラクションハンドを再構築することは、多くの干渉要因が伴うため、難しい作業である。
これまでの作業は、物理的に妥当な関係をモデル化することなく、単一のRGBイメージからの情報のみを活用する。
本研究は, 空間的時間的情報を明示的に活用し, より優れた対話的手指再建を実現することを目的としている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:04:44 GMT)
Video Understanding with Large Language Models: A Survey [101.9] 本調査は,Large Language Models (LLMs) のパワーを活用した映像理解の最近の進歩を概観する。
LLMベースのビデオエージェント, Vid-LLMs Pretraining, Vid-LLMs Instruction Tuning, Hybrid Methods である。
さまざまなドメインにまたがるVid-LLMの広範な応用を探求し、実際のビデオ理解の課題において、その顕著なスケーラビリティと汎用性を強調している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:08:53 GMT)
Rewrite Caption Semantics: Bridging Semantic Gaps for
Language-Supervised Semantic Segmentation [100.8] 本研究では,事前学習データにおける視覚的意味論とテキスト的意味論のギャップを埋めるための概念キュレーション(CoCu)を提案する。
CoCuは、最高にゼロショット転送性能を達成し、言語教師ありセグメンテーションベースラインを大きなマージンで大幅に向上させる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:46:53 GMT)
Stochastic Approximation Approaches to Group Distributionally Robust
Optimization [96.3] 群分散ロバスト最適化(GDRO)
オンライン学習技術は、各ラウンドに必要なサンプル数をm$から1$に減らし、同じサンプルを保持する。
分布依存収束率を導出できる重み付きGDROの新規な定式化。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:42:11 GMT)
InternVid: A Large-scale Video-Text Dataset for Multimodal Understanding
and Generation [90.7] InternVidは大規模なビデオ中心のマルチモーダルデータセットで、強力で転送可能なビデオテキスト表現の学習を可能にする。
InternVidデータセットは700万本以上のビデオが760万時間近く持続し、合計4.1Bワードの詳細な記述を伴う234万本のビデオクリップが生成される。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:00:34 GMT)
Emotionally Numb or Empathetic? Evaluating How LLMs Feel Using
EmotionBench [87.0] 我々は,Large Language Models (LLM) の共感能力を評価することを提案する。
我々は、研究の中心となる8つの感情を引き出すのに有効な400以上の状況を含むデータセットを収集した。
我々は世界中の1200人以上の被験者を対象に人間による評価を行った。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:41:12 GMT)
Neural Operators for Accelerating Scientific Simulations and Design [85.9] Neural Operatorsとして知られるAIフレームワークは、継続的ドメインで定義された関数間のマッピングを学習するための原則的なフレームワークを提供する。
ニューラルオペレータは、計算流体力学、天気予報、物質モデリングなど、多くのアプリケーションで既存のシミュレータを拡張または置き換えることができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:38:03 GMT)
What You See is What You GAN: Rendering Every Pixel for High-Fidelity
Geometry in 3D GANs [82.4] 3D-aware Generative Adversarial Networks (GANs) は,マルチビュー一貫性画像と3Dジオメトリを生成する学習において,顕著な進歩を見せている。
しかし、ボリュームレンダリングにおける高密度サンプリングの大幅なメモリと計算コストにより、3D GANはパッチベースのトレーニングを採用するか、後処理の2Dスーパーレゾリューションで低解像度レンダリングを採用することを余儀なくされた。
ニューラルボリュームレンダリングをネイティブ2次元画像の高解像度化に拡張する手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:50:38 GMT)
Training Diffusion Models with Reinforcement Learning [82.3] 拡散モデルは、ログのような目的に近似して訓練される。
本稿では,下流目的のための拡散モデルを直接最適化するための強化学習手法について検討する。
本稿では,多段階決定問題としてデノベーションを行うことによって,ポリシー勾配アルゴリズムのクラスを実現する方法について述べる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:11:25 GMT)
Spikformer V2: Join the High Accuracy Club on ImageNet with an SNN
Ticket [81.9] スパイキングニューラルネットワーク(SNN)は、限られたパフォーマンスの課題に直面している。
高性能変圧器の基礎となる自己保持機構は,既存のSNNでは欠落している。
スパイキング自己注意(SSA)とスパイキングトランスフォーマー(Spikformer)を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:33:33 GMT)
VideoChat: Chat-Centric Video Understanding [80.6] 我々は、ビデオチャットと呼ばれるエンドツーエンドのチャット中心のビデオ理解システムを開発した。
学習可能なニューラルネットワークを通じて、ビデオファンデーションモデルと大きな言語モデルを統合する。
予備的な定性的実験は、幅広いビデオアプリケーションにまたがる我々のシステムの可能性を実証している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:06:07 GMT)
Controlling Moments with Kernel Stein Discrepancies [80.3] Kernel Steindisrepancies (KSD) は分布近似の品質を測定する。
まず、弱収束制御に使用される標準KSDがモーメント収束制御に失敗することを示す。
次に、代替拡散KSDがモーメントと弱収束の両方を制御できる十分な条件を提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:55:56 GMT)
Frequency Domain Modality-invariant Feature Learning for
Visible-infrared Person Re-Identification [79.9] 本稿では、周波数領域から見たモダリティの相違を低減するために、新しい周波数領域モダリティ不変特徴学習フレームワーク(FDMNet)を提案する。
我々のフレームワークでは、インスタンス適応振幅フィルタ(IAF)とPhrase-Preserving Normalization(PPNorm)という、2つの新しいモジュールを導入している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:23:04 GMT)
SGFormer: Simplifying and Empowering Transformers for Large-Graph
Representations [79.0] ノード特性予測ベンチマークにおいて,一層注意が驚くほど高い性能を示すことを示す。
提案手法をSGFormer (Simplified Graph Transformer) と呼ぶ。
提案手法は,大きなグラフ上にトランスフォーマーを構築する上で,独立性のある新たな技術パスを啓蒙するものである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:19:18 GMT)
DIALIGHT: Lightweight Multilingual Development and Evaluation of
Task-Oriented Dialogue Systems with Large Language Models [76.8] DIALIGHTは多言語タスク指向対話(ToD)システムの開発と評価のためのツールキットである。
ローカル発話レベルとグローバル対話レベルの両方において、人間のきめ細かい評価のためのセキュアでユーザフレンドリーなWebインターフェースを備えている。
評価の結果, PLMの微調整により精度とコヒーレンスが向上する一方, LLMベースのシステムは多様で類似した応答を生成するのに優れていた。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:27:48 GMT)
Frequency Domain Nuances Mining for Visible-Infrared Person
Re-identification [75.9] 可視赤外人物再識別(VIReID)の鍵は、可視画像と赤外線画像の偏差を最小限にする方法にある。
既存の手法は主に、識別周波数情報を無視しながら空間情報を利用する。
本稿では,周波数領域情報を対象とした周波数領域Nuances Mining(FDNM)手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:19:54 GMT)
Continual Learning: Forget-free Winning Subnetworks for Video
Representations [75.4] タスク性能の面でのサブネットワーク(WSN)の勝利は、様々な連続学習タスクに対して考慮される。
タスクインクリメンタルラーニング(TIL)のシナリオにおいて,既存のネットワークからの重みを有効活用し,効率的な学習を実現する。
ビデオインクリメンタルラーニング(VIL)におけるWSN内のフーリエサブニューラル演算子(FSO)の利用
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:26:36 GMT)
Learning the 3D Fauna of the Web [72.6] 3D-Faunaは,100種以上の動物種を対象に,パンカテゴリーで変形可能な3D動物モデルを共同で学習する手法である。
動物モデリングにおける重要なボトルネックの1つは、トレーニングデータの可用性の制限である。
従来のカテゴリー固有の試みは,訓練画像に制限のある希少種への一般化に失敗することを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:32:48 GMT)
Dynamically Masked Discriminator for Generative Adversarial Networks [71.3] GAN(Generative Adversarial Networks)のトレーニングは依然として難しい問題である。
識別器は、実際の/生成されたデータの分布を学習してジェネレータを訓練する。
本稿では,オンライン連続学習の観点から,GANの新たな手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:58:50 GMT)
BA-SAM: Scalable Bias-Mode Attention Mask for Segment Anything Model [69.9] 我々は,Segment Anything Model (SAM)における画像分解能変動の課題に対処する。
SAMはゼロショットの汎用性で知られており、さまざまな画像サイズを持つデータセットに直面するとパフォーマンスが低下する。
我々は、各トークンが隣り合う情報を優先順位付けできるバイアスモードのアテンションマスクを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:34:44 GMT)
T-Eval: Evaluating the Tool Utilization Capability Step by Step [69.6] 大規模言語モデル (LLM) は様々なNLPタスクにおいて顕著な性能を達成した。
LLMのツール活用能力の評価と分析方法はまだ未検討である。
ツール利用能力を段階的に評価するためにT-Evalを導入する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:11:22 GMT)
TEAL: Tokenize and Embed ALL for Multi-modal Large Language Models [69.5] TEALは任意のモダリティからの入力をトークンシーケンスとして扱うアプローチである。
トークンシーケンスを学習可能な埋め込み行列で結合埋め込み空間に埋め込む。
実験により、TEALはマルチモーダル理解を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:31:07 GMT)
Attacks in Adversarial Machine Learning: A Systematic Survey from the
Life-cycle Perspective [69.3] 敵対的機械学習(英: Adversarial Machine Learning、AML)は、機械学習の逆行現象を研究する。
機械学習システムの異なる段階で発生するこの敵対現象を探求するために、いくつかのパラダイムが最近開発された。
既存の攻撃パラダイムをカバーするための統一的な数学的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:43:16 GMT)
LLaMA Pro: Progressive LLaMA with Block Expansion [69.3] 本稿では,トランスフォーマーブロックを拡張したLarge Language Models (LLM) の事前学習手法を提案する。
我々は,新たなコーパスのみを用いて拡張ブロックをチューニングし,大惨な忘れをすることなく,モデル知識を効率的に,効果的に改善する。
本稿では,LLaMA2-7Bの多元的基礎モデルであるLLaMA Pro-8.3Bのコードと数学のコーパスについて実験する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:59:12 GMT)
Zero-Shot Video Editing Using Off-The-Shelf Image Diffusion Models [68.3] ビデオ編集の最近の試みは、トレーニングに大量のテキスト・ビデオデータと計算資源を必要とする。
我々は、ゼロショットビデオ編集のためのシンプルで効果的な方法であるvid2vid-zeroを提案する。
実験と分析は、現実世界のビデオの属性、主題、場所などの編集において有望な結果を示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:30:50 GMT)
UpFusion: Novel View Diffusion from Unposed Sparse View Observations [66.4] UpFusionは、参照画像のスパースセットが与えられたオブジェクトに対して、新しいビュー合成と3D表現を推論することができる。
本研究では,この機構により,付加された(未提示)画像の合成品質を向上しつつ,高忠実度な新規ビューを生成することができることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:59:04 GMT)
Marginal Debiased Network for Fair Visual Recognition [65.6] 本稿では,デバイアス表現を学習するための新しい限界脱バイアスネットワーク(MDN)を提案する。
より具体的には、マージンペナルティという概念をフェアネス問題に導入することにより、マージンのソフトマックスロス(MSL)を設計する。
我々のMDNは、表現不足のサンプルに対して顕著な性能を達成でき、従来の手法と比較して優れたデバイアス結果を得ることができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:57:09 GMT)
DiffAttack: Evasion Attacks Against Diffusion-Based Adversarial
Purification [63.7] 拡散に基づく浄化防御は拡散モデルを利用して、敵の例の人工摂動を除去する。
近年の研究では、先進的な攻撃でさえ、そのような防御を効果的に破壊できないことが示されている。
拡散型浄化防衛を効果的かつ効率的に行うための統合フレームワークDiffAttackを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:19:54 GMT)
WFTNet: Exploiting Global and Local Periodicity in Long-term Time Series
Forecasting [61.6] 本稿では,長期連続予測のためのWavelet-Fourier Transform Network (WFTNet)を提案する。
さまざまな時系列データセットのテストでは、WFTNetは他の最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:41:05 GMT)
Fast approximations in the homogeneous Ising model for use in scene
analysis [61.1] 我々は、推論に必要な量を数値計算できる正確な近似を提供する。
近似式はスケーラブルでマルコフランダム場の大きさに満足できないことを示す。
機能的磁気共鳴イメージングアクティベーション検出実験においてベイズ推論を行い, ピスタチオ樹収量の年次増加の空間パターンにおける異方性に対する確率比試験を行った。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 00:39:43 GMT)
Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost
Whole-Body Teleoperation [59.2] 本研究では,バイマン的かつ全身制御を必要とするモバイル操作タスクを模倣するシステムを開発した。
Mobile ALOHAは、データ収集のための低コストで全身的な遠隔操作システムである。
共同トレーニングは成功率を最大90%向上させ、モバイルALOHAが自律的に複雑なモバイル操作タスクを完了できるようにする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:55:53 GMT)
The BHL-BCL crossover: from nonlinear to linear quantum amplification [55.2] ブラックホールレーザー(英: black-hole laser、BHL)は、共振器として働く一対の水平線の間のホーキング放射の自己増幅である。
流動性原子凝縮体では、BHL効果は、ボゴリューボフ・チェレンコフ・ランダウ(BCL)放射が静摂動によって共鳴的に励起される有限超音速領域で生じる。
ここでは,両現象をあいまいに分離できる理想モデルを用いて,BHL-BCLクロスオーバーの理論的研究を行う。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:00:01 GMT)
ChartAssisstant: A Universal Chart Multimodal Language Model via
Chart-to-Table Pre-training and Multitask Instruction Tuning [54.9] ChartAssistantは、ユニバーサルチャートの理解と推論のためのビジョン言語モデルである。
タスク固有の微調整なしで、様々なチャートタスク間の競争性能を達成する。
その結果、OpenAIのGPT-4V(ision)を実世界のチャートデータで上回り、最先端のUniChart法よりも大きな性能向上を示した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:51:48 GMT)
Bayesian Intrinsic Groupwise Image Registration: Unsupervised
Disentanglement of Anatomy and Geometry [53.6] 本稿では,医用画像の集団登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から得られた4つのデータセットを含む,提案された枠組みを検証する実験を行った。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:46:39 GMT)
A Hybrid Neural Coding Approach for Pattern Recognition with Spiking
Neural Networks [53.3] 脳にインスパイアされたスパイクニューラルネットワーク(SNN)は、パターン認識タスクを解く上で有望な能力を示している。
これらのSNNは、情報表現に一様神経コーディングを利用する同質ニューロンに基づいている。
本研究では、SNNアーキテクチャは異種符号化方式を組み込むよう、均質に設計されるべきである、と論じる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:23:07 GMT)
Understanding LLMs: A Comprehensive Overview from Training to Inference [52.7] 大規模言語モデルの低コストなトレーニングと展開は、将来の開発トレンドを表している。
トレーニングに関する議論には、データ前処理、トレーニングアーキテクチャ、事前トレーニングタスク、並列トレーニング、モデル微調整に関連する関連コンテンツなど、さまざまな側面が含まれている。
推論の面では、モデル圧縮、並列計算、メモリスケジューリング、構造最適化などのトピックを取り上げている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:43:57 GMT)
Learning Discretized Neural Networks under Ricci Flow [51.4] 低精度重みとアクティベーションからなる離散ニューラルネットワーク(DNN)について検討する。
DNNは、訓練中に微分不可能な離散関数のために無限あるいはゼロの勾配に悩まされる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:18:56 GMT)
Improving Diffusion-Based Image Synthesis with Context Prediction [49.2] 既存の拡散モデルは、主に、劣化した画像から空間軸に沿って画素幅または特徴幅の制約で入力画像を再構成しようとする。
文脈予測を用いて拡散に基づく画像合成を改善するためのConPreDiffを提案する。
我々のConPreDiffは従来手法を一貫して上回り、ゼロショットFIDスコア6.21で、MS-COCO上で新たなSOTAテキスト・画像生成結果を達成する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:10:56 GMT)
Self-Contrast: Better Reflection Through Inconsistent Solving
Perspectives [48.2] 研究によると、外部からのフィードバックがなければ、Large Language Modelの本質的なリフレクションは不安定である。
我々の調査によると、重要なボトルネックは自己評価されたフィードバックの品質である。
要求に合わせて様々な解決の観点を適応的に探求し、相違点を対比し、これらの相違点を再検討し、相違点を排除するために使用できるチェックリストにまとめます。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 00:32:33 GMT)
Depth-Regularized Optimization for 3D Gaussian Splatting in Few-Shot
Images [47.1] オーバーフィッティングを緩和するための幾何ガイドとして,密集深度マップを導入する。
調整された深度は3Dガウススプラッティングのカラーベース最適化に有効である。
提案手法は,NeRF-LLFFデータセット上で,少ない画像数で検証する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:19:16 GMT)
Robot-Assisted Deep Venous Thrombosis Ultrasound Examination using
Virtual Fixture [46.0] 深部静脈血栓症(Deep Venous Thrombosis, DVT)は、深部静脈内に血栓がある一般的な血管疾患である。
超音波(US)画像を用いたDVTの典型的な試験は、腰部が完全に圧迫されるまで標的静脈を圧迫することである。
本研究では, 目標面にプローブを軟着陸させることにより, 位置と力の追跡精度を確保できる新しいハイブリッド力移動制御方式を備えたロボットUSシステムを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:02:39 GMT)
Federated Class-Incremental Learning with Prototype Guided Transformer [45.0] 現実の状況では、各クライアントは新しいクラスを動的に学習し、グローバルモデルが新しいクラスと古いクラスの区別能力を維持する必要がある。
低通信コスト下での破滅的忘れとデータ不均一性の効果を効果的に軽減するために,我々はPLoRAという簡易かつ効果的な手法を考案した。
本手法は, 様々なシナリオやデータの不均一性の程度において, 強靭性と優越性を示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:46:19 GMT)
MeTA: Multi-source Test Time Adaptation [44.2] テスト時間適応は、教師なしの方法で、テストデータの各バッチに事前訓練されたソースモデルを適用するプロセスである。
完全教師なしのマルチソーステスト時間適応フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:23:56 GMT)
PEFT for Speech: Unveiling Optimal Placement, Merging Strategies, and
Ensemble Techniques [43.6] 微分可能なアーキテクチャサーチ(DARTS)を用いた異なるPEFT法とそれらの層配置の比較を行った。
アンサンブル学習アプローチ、特に多数決を採用するアプローチは、優れたパフォーマンスを示している。
この変化は、アンサンブル学習による様々なPEFTメソッドの相乗的統合が、独自の学習能力をより効果的に活用できる理由を説明できるかもしれない。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:11:33 GMT)
Towards Optimization and Model Selection for Domain Generalization: A
Mixup-guided Solution [43.3] そこで本研究では,ドメイン一般化のためのMixupガイドによる最適化と選択手法を提案する。
最適化のために、好みの方向を導出するアウト・オブ・ディストリビューション・データセットを利用する。
モデル選択のために、ターゲット分布に近づいた検証データセットを生成する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:41:08 GMT)
Lookahead: An Inference Acceleration Framework for Large Language Model
with Lossless Generation Accuracy [42.3] 本稿では,推論処理を高速化する汎用フレームワークを提案し,RAGシステムの高速化とコスト削減を実現した。
我々は,複数のブランチを同時に生成できるtextitTrie-based Retrieval (TR) プロセスを提案する。
各ブランチに対して、最も長い正しいサブシーケンスを最終出力として識別するために、textitVerification and Accept(VA)プロセスが実行される。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:33:52 GMT)
3D Open-Vocabulary Panoptic Segmentation with 2D-3D Vision-Language
Distillation [41.6] 本稿では,3次元オープンボキャブラリパノプタセグメンテーションのための最初の手法を提案する。
我々のモデルは、学習可能なLiDAR機能と密集した凍結視覚CLIP機能との融合を利用する。
本稿では,オブジェクトレベルの蒸留損失とボクセルレベルの蒸留損失の2つの新しい損失関数を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:39:32 GMT)
Linguistic Profiling of Deepfakes: An Open Database for Next-Generation
Deepfake Detection [40.2] 本稿では,Deepfake データベース (DFLIP-3K) を提案する。
約3K生成モデルから約300Kの多様なディープフェイクサンプルが含まれており、この文献で最も多くのディープフェイクモデルがある。
この2つの特徴により、DFLIP-3Kはディープフェイクの言語プロファイリングの進歩を促進するベンチマークを開発することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:19:52 GMT)
A General Implicit Framework for Fast NeRF Composition and Rendering [40.1] 我々は、NeRFオブジェクトを高速に作成するための一般的な暗黙パイプラインを提案する。
我々の研究はニューラル深さ場(NeDF)と呼ばれる新しい表面表現を導入している。
交叉ニューラルネットワークを利用して、明示的な空間構造に依存するのではなく、NeRFをアクセラレーションにクエリする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:00:37 GMT)
t-DGR: A Trajectory-Based Deep Generative Replay Method for Continual
Learning in Decision Making [38.2] 本稿では,意思決定タスクにおける継続学習のための,シンプルでスケーラブルで非自己回帰的手法を提案する。
提案手法を連続世界ベンチマークで評価し,本手法が最先端の性能を実現することを確認した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 23:44:35 GMT)
Learning to Generate Training Datasets for Robust Semantic Segmentation [37.9] セマンティックセグメンテーション手法の堅牢性を改善するための新しい手法を提案する。
我々は,現実的で可視な摂動画像を生成するために,新しい条件付き生成対向ネットワークであるRobustaを設計した。
我々の結果は、このアプローチが安全クリティカルなアプリケーションに有用である可能性を示唆している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:06:19 GMT)
Sensitivity Analysis in the Presence of Intrinsic Stochasticity for
Discrete Fracture Network Simulations [37.7] 大規模離散破壊ネットワーク(DFN)シミュレーターは、粒子の地下輸送に関する研究の標準料金である。
興味の量(QoI)の推定 - 系の端に到達した粒子のブレークスルー時間など - は、2種類の不確実性に悩まされる。
本稿では,QoIで観測された不確実性は,各入力パラメータからの不確実性,およびアレタリック不確実性に直接関連付ける感性分析を行う。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:21:54 GMT)
An Open and Comprehensive Pipeline for Unified Object Grounding and
Detection [37.5] Grounding-DINOは最先端のオープンセット検出モデルである。
Open-Vocabulary Detection (OVD)、Phrase Grounding (PG)、Referring Expression (REC)など、複数の視覚タスクに取り組む。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:00:49 GMT)
GridFormer: Point-Grid Transformer for Surface Reconstruction [37.3] 我々はGridFormer(GridFormer)という名前のグリッドとポイントの特徴の間に新しい注意機構を導入する。
このメカニズムは、グリッドを空間と点雲を繋ぐ移動点として扱う。
また,差分二項クロスエントロピー損失と境界サンプリングを併用した境界最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:31:56 GMT)
FactoFormer: Factorized Hyperspectral Transformers with Self-Supervised
Pretraining [36.4] ハイパースペクトル画像(HSI)は、豊富なスペクトルと空間情報を含む。
現在の最先端ハイパースペクトル変換器は、入力されたHSIサンプルをスペクトル次元に沿ってトークン化するのみである。
本稿では、自己教師付き事前学習手順を取り入れた新しい分解スペクトル空間変換器を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:05:16 GMT)
ODIN: A Single Model for 2D and 3D Perception [36.1] ODINは、2D RGBイメージと3Dポイントクラウドのセグメンテーションとラベル付けを行うモデルである。
ScanNet200、Matterport3D、AI2THOR 3Dセグメンテーションベンチマーク上での最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:59:25 GMT)
Federated Optimization of Smooth Loss Functions [35.9] 本研究では,連合学習フレームワークにおける経験的リスク最小化(ERM)について検討する。
本稿では,FedLRGDアルゴリズムを提案する。
提案手法は,不正確な勾配勾配勾配を用いてサーバのERM問題を解く。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:46:17 GMT)
Joint Multi-Facts Reasoning Network For Complex Temporal Question
Answering Over Knowledge Graph [34.4] 時間的知識グラフ(TKG)は、時間範囲をアタッチすることで、通常の知識グラフの拡張である。
textbfunderlineMulti textbfunderlineFacts textbfunderlineReasoning textbfunderlineNetwork (JMFRN)を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:34:39 GMT)
Beyond Efficiency: A Systematic Survey of Resource-Efficient Large
Language Models [34.3] LLM(Large Language Models)は、計算、メモリ、エネルギー、金融資源の高消費に課題をもたらす。
本調査は, LLMの資源効率向上を目的とした多種多様な手法を概観することにより, これらの課題を体系的に解決することを目的としている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:49:50 GMT)
Let There Be Sound: Reconstructing High Quality Speech from Silent
Videos [34.3] この研究の目的は、唇の動きだけで高品質な音声を再構築することである。
音声合成システムにおける重要な課題は、一対多のマッピングである。
生成品質を大幅に向上させる新しい音声合成システムを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:10:57 GMT)
DeepTaster: Adversarial Perturbation-Based Fingerprinting to Identify
Proprietary Dataset Use in Deep Neural Networks [34.1] 我々は、被害者のデータを不正に使用して容疑者モデルを構築するシナリオに対処する、新しいフィンガープリント技術であるDeepTasterを紹介した。
これを実現するために、DeepTasterは摂動を伴う逆画像を生成し、それらをフーリエ周波数領域に変換し、これらの変換された画像を使用して被疑者モデルで使用されるデータセットを識別する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 00:16:22 GMT)
Nodule detection and generation on chest X-rays: NODE21 Challenge [34.0] 深層学習法は胸部X線による肺結節の検出において高い性能を発揮する。
我々は,胸部X線による肺結節の検出と発生を目的としたNODE21という公開研究課題を組織した。
本稿では,NODE21チャレンジの結果を要約し,合成学習画像が検出アルゴリズムの性能に与える影響について検討する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:54:05 GMT)
DHOT-GM: Robust Graph Matching Using A Differentiable Hierarchical
Optimal Transport Framework [33.8] 微分可能な階層的最適輸送フレームワークに基づく,新しい効率的なグラフマッチング手法を提案する。
本手法は,各グラフを,異なるモダリティの情報に対応する関係行列の集合として表現する。
様々なグラフマッチングタスクの実験は、最先端の手法と比較して、我々の手法の優越性と堅牢性を示している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:40:24 GMT)
Text2MDT: Extracting Medical Decision Trees from Medical Texts [33.6] 医療用テキストから医療用決定木(MDT)を自動的に抽出する新しいタスクであるText2MDTを提案する。
我々は、MDTの形式を標準化し、医学専門家の参加を得て、中国語で注釈付きテキスト・トゥ・MDTデータセットを作成する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:33:38 GMT)
Location Aware Modular Biencoder for Tourism Question Answering [33.6] 本稿では,QAタスクを高密度ベクトル探索問題として扱うことを提案する。
質問とPOIを別々にエンコードし、埋め込み空間の類似性を利用して最も関連性の高いPOIを検索する。
実世界の観光QAデータセットの実験は、我々のアプローチが従来の手法よりも効果的で、効率的で、優れたことを実証している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:39:58 GMT)
Handling Noisy Labels via One-Step Abductive Multi-Target Learning and
Its Application to Helicobacter Pylori Segmentation [32.6] 機械学習に一段階論理的推論を課す一段階帰納的多目的学習(OSAMTL)を提案する。
我々はOSAMTLにより、より合理的な予測を論理的に達成できることを示した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:17:42 GMT)
Interactive Text-to-SQL Generation via Editable Step-by-Step
Explanations [31.3] 本稿では,ユーザがクエリのステップバイステップ説明を直接編集してエラーを修正する,新たなインタラクションメカニズムを提案する。
複数のデータセットに対する我々の実験は、24人の参加者を持つユーザとともに、我々のアプローチが複数のSOTAアプローチより優れていることを実証している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 23:54:41 GMT)
Exploring Boundary of GPT-4V on Marine Analysis: A Preliminary Case
Study [31.2] 大規模言語モデル(LLM)は、汎用アシスタントとして様々なクエリに応答する強力な能力を示している。
連続的マルチモーダル大言語モデル(MLLM)は、視覚信号を知覚する能力を持つLLMに権限を与える。
GPT-4(Generative Pre-trained Transformers)のローンチは、研究コミュニティに大きな関心を集めている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:53:08 GMT)
From Function to Distribution Modeling: A PAC-Generative Approach to
Offline Optimization [30.7] 本稿では、オフラインデータ例の集合を除いて目的関数が不明なオフライン最適化の問題について考察する。
未知の目的関数を学習して最適化するのではなく、より直感的で直接的な視点で、最適化は生成モデルからサンプリングするプロセスと考えることができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:32:50 GMT)
Vision-Language Models can Identify Distracted Driver Behavior from
Naturalistic Videos [30.6] 本稿では,CLIPに基づく運転行動認識手法を提案する。
以上の結果から、このフレームワークは、ゼロショット転送における最先端のパフォーマンスと、2つの公開データセット上でドライバの状態を予測するためのビデオベースCLIPを提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:23:39 GMT)
eCIL-MU: Embedding based Class Incremental Learning and Machine
Unlearning [30.2] 本研究では,埋め込み技術に基づく非破壊的eCIL-MUフレームワークを提案し,データをベクトルにマッピングし,ベクトルデータベースに格納する。
実験は、未学習の有効性と、アクセラレーションの桁数($sim 278times$まで)を達成する能力を示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:18:32 GMT)
A Survey of Protocol Fuzzing [30.2] 通信プロトコルは相互接続された世界の基盤を形成していますが、その実装内の脆弱性は重大なセキュリティ上の脅威を引き起こします。
最近の研究は、これらの脆弱性を明らかにするためのファジングベースの研究が急増している。
本研究は,プロトコルファジィングにおける具体的な課題の詳細な概要と,既存の研究成果の体系的分類と概要を提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:20:52 GMT)
HEAP: Unsupervised Object Discovery and Localization with Contrastive
Grouping [29.7] 教師なしオブジェクトの発見と位置決めは、監督なしで画像内のオブジェクトを検出し、セグメント化することを目的としている。
近年の取り組みは、自己監督型トランスフォーマー機能を利用して、有能な前景物体を識別する顕著な可能性を実証している。
これらの問題に対処するために、Herarchical mErging framework via contrAstive grouPing (HEAP) を紹介する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:57:15 GMT)
Efficient Verification of Ground States of Frustration-Free Hamiltonians [28.0] 本研究では,局所測定に基づくフラストレーションフリーハミルトニアンの基底状態の検証法を提案する。
我々は、量子検出可能性補題と量子団結境界により、サンプル複雑性の厳密な境界を導出する。
我々の研究は、量子情報処理における多くのタスクだけでなく、多体物理学の研究にも関心がある。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:37:45 GMT)
Neural Collapse for Cross-entropy Class-Imbalanced Learning with
Unconstrained ReLU Feature Model [28.0] トレーニングデータセットがクラス不均衡である場合、いくつかのNeural Collapse(NC)プロパティはもはや真実ではない。
本稿では,制約のないReLU特徴量モデルの下で,NCを不均衡状態に一般化し,クロスエントロピー損失の低減を図る。
重みは,各クラスのトレーニングサンプル数によって異なるが,重みはスケールおよび集中型クラス平均値に一致していることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 04:53:31 GMT)
Efficient Cloud-edge Collaborative Inference for Object
Re-identification [28.0] 我々は、ReIDシステムのためのクラウド-エッジ協調推論フレームワークを開拓した。
本稿では,クラウドサーバに所望の画像を返すために,分散対応相関モデルネットワーク(DaCM)を提案する。
DaCMは、タイムスタンプに暗黙的に含まれている空間的時間的相関関係をグラフ構造に埋め込んで、アップロードウィンドウのサイズを調整するためにクラウドに適用することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:56:50 GMT)
Improved Zero-Shot Classification by Adapting VLMs with Text
Descriptions [27.6] 我々は,視覚言語モデル(VLM)を「バグレベル」の画像テキスト管理で訓練する手法を開発した。
我々は,大規模言語モデル(LLM)によって生成されたカテゴリと,豊富な,きめ細かい画像分類データセットを用いて記述する。
以上の結果から,地理的先行は視覚的外観と同等に有効である可能性が示唆された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:39:13 GMT)
Diffusion Models as Masked Audio-Video Learners [27.2] Masked Audio-Video Learningers (MAViL) は最先端のオーディオビデオ事前学習フレームワークとして登場した。
本稿では,拡散モデルとMAViLの相乗効果について検討する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:39:25 GMT)
View-based Explanations for Graph Neural Networks [27.2] 本稿では,表現のためのグラフビューを生成する新しいパラダイムであるGVEXを提案する。
このアルゴリズムは近似比が1/2であることを示す。
我々は,GVEXの有効性,効率,スケーラビリティを実験的に実証した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:20:24 GMT)
Enhancing RAW-to-sRGB with Decoupled Style Structure in Fourier Domain [27.2] 現在の方法では、携帯電話のRAW画像とDSLRカメラのRGB画像の違いを無視する。
本稿では、新しいNeural ISPフレームワーク、FourierISPを紹介する。
このアプローチは、画像を周波数領域内のスタイルと構造に分解し、独立した最適化を可能にする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:18:31 GMT)
GIT-Mol: A Multi-modal Large Language Model for Molecular Science with
Graph, Image, and Text [26.9] グラフ,画像,テキスト情報を統合したマルチモーダルな大規模言語モデルであるGIT-Molを紹介する。
特性予測の精度は5%-10%向上し、分子生成の妥当性は20.2%向上した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:22:07 GMT)
Shadow Generation with Decomposed Mask Prediction and Attentive Shadow
Filling [26.8] 我々は、合成画像をよりリアルにするために、挿入された前景オブジェクトに対して可塑性影を生成することに重点を置いている。
既存の小規模データセットを補完するために、レンダリング技術を備えたRdSOBAと呼ばれる大規模データセットを作成します。
我々は、マスク予測と注意影の埋め合わせを備えたDMASNetという2段階ネットワークを設計する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:00:11 GMT)
HawkRover: An Autonomous mmWave Vehicular Communication Testbed with
Multi-sensor Fusion and Deep Learning [26.1] 接続された自動走行車(CAV)は、私たちの日常生活を変えるための変革的な技術になっています。
現在、ミリ波(mmWave)バンドは有望なCAV接続ソリューションとして認識されている。
高いデータレートを提供できるが、その実現には、mWave信号の伝搬やモビリティ管理の際の高減衰など、多くの課題に直面している。
本研究は,mmWave信号と他のセンサデータを収集し,車載通信を容易にする自律的かつ低コストなテストベッドを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:28:02 GMT)
Coverage Goal Selector for Combining Multiple Criteria in Search-Based
Unit Test Generation [26.1] 単体テストは、プログラム内のプログラミングユニットの正しさを保証するために重要である。
検索ベースのソフトウェアテスト(SBST)は、テストケースを生成する自動化アプローチである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:58:13 GMT)
From 2D Images to 3D Model:Weakly Supervised Multi-View Face
Reconstruction with Deep Fusion [26.0] 我々はDeep Fusion MVR(DF-MVR)と呼ばれる新しいモデルを提案する。
スキップ接続による単一復号化フレームワークへのマルチビュー符号化を設計する。
我々は,多視点画像内の重要な共通顔領域を学習し,識別し,強調するために,顔解析ネットワークを開発した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:50:25 GMT)
Spiking NeRF: Representing the Real-World Geometry by a Discontinuous
Representation [25.8] 既存のNeRFベースの手法が成功した決定的な理由は、複数のパーセプトロン層(MLP)を介して幾何学表現のための神経密度場を構築することである。
本稿では、スパイキングニューロンとハイブリッドニューラルネットワーク(ANN)-スパイキングニューラルネットワーク(SNN)を用いて、忠実な幾何表現のための不連続密度場を構築するためのスパイキングNeRFを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:04:44 GMT)
CLAPP: Contrastive Language-Audio Pre-training in Passive Underwater
Vessel Classification [25.1] 本稿では,新しいモデルであるCLAPP(Contrastive Language-Audio Pre-Training in Underwater Vessel Classification)を紹介する。
我々の目標は、海洋データセットから得られた広範囲の血管オーディオと血管状態テキストペアを使用してニューラルネットワークをトレーニングすることである。
CLAPPは、生の血管オーディオデータから直接学習し、利用可能であれば、慎重にキュレートされたラベルから学習することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:11:16 GMT)
DeepPhysiNet: Bridging Deep Learning and Atmospheric Physics for
Accurate and Continuous Weather Modeling [24.8] 天気予報には、数値気象予報(WP)とディープラーニング予測(DLP)の2つのパラダイムがある。
WPは気象モデリングに大気物理学を利用するが、データ利用の低さと計算コストに悩まされている。
DLPは大量のデータから直接気象パターンを学習できるが、物理法則を組み込むのに苦労している。
我々はDeepPhysiNetフレームワークを導入し、物理法則をディープラーニングモデルに組み込んで、正確かつ連続的な気象システムモデリングを行う。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:05:16 GMT)
ICE-GRT: Instruction Context Enhancement by Generative Reinforcement
based Transformers [24.7] 近接政策最適化(PPO)に基づく人間フィードバック(RLHF)からの強化学習を活用したICE-GRTを導入する。
ICE-GRTの探索は、堅牢な回答を生成するだけでなく、その答えの背後にある理由を詳細に分析するための理解と推論能力を強調している。
ICE-GRTモデルは、ドメイン固有のタスクや12の汎用言語タスクにおいて、同等のサイズとさらに大きなLLMに対して、最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:47:41 GMT)
An Example of Evolutionary Computation + Large Language Model Beating
Human: Design of Efficient Guided Local Search [23.6] 本稿では,アルゴリズム設計のための大規模言語モデル(Large Language Model, AEL)フレームワークを用いた新しいアルゴリズム進化法を提案する。
AELは、大規模言語モデルのパワーと進化計算のパラダイムを組み合わせて、アルゴリズムを設計、組み合わせ、修正する。
AELが設計したローカルサーチ(GLS)は、最先端の人間設計のGLSを同じイテレーション予算で上回っていることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 04:11:59 GMT)
GUESS:GradUally Enriching SyntheSis for Text-Driven Human Motion
Generation [23.4] そこで本研究では,テキスト駆動型人体動作合成のためのケースケード拡散に基づく新しい生成フレームワークを提案する。
このフレームワークはGradUally Enriching SyntheSis(GUESS)という戦略を略語として利用している。
GUESSは、精度、現実性、多様性において、既存の最先端手法よりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:48:21 GMT)
Improving Natural Language Understanding with Computation-Efficient
Retrieval Representation Fusion [23.3] 検索に基づく拡張は、質問応答やテキスト生成など、様々な知識集約(KI)タスクにおいて大きな成功を収めている。
しかし,テキスト分類などの非知識集約型タスクにおける検索の統合は依然として困難である。
本稿では,ニューラルネットワークを用いた計算効率の高いtextbfRetrieval 表現 textbfFusion を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:39:26 GMT)
Spy-Watermark: Robust Invisible Watermarking for Backdoor Attack [23.2] バックドア攻撃は、悪質なデータのパフォーマンスを維持しながら、バックドアインスタンスに直面しているときに、被害者モデルを欺くことを目的としている。
現在のメソッドでは手動のパターンや特別な摂動をトリガーとして使用していますが、データ破損に対する堅牢性を見落としています。
本研究では,データ崩壊やバックドア防御に直面する場合にも有効であるSpy-Watermarkという新たなバックドア攻撃手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:15:09 GMT)
On the Prospects of Incorporating Large Language Models (LLMs) in
Automated Planning and Scheduling (APS) [23.0] 本稿では, LLMのユニークな応用に基づく8つのカテゴリを, 計画問題の諸側面に対処するために検討する。
我々のレビューから得られた重要な洞察は、LLMの真の可能性は、従来のシンボリックプランナーと統合されたときに広がります。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:22:09 GMT)
Data-Centric Foundation Models in Computational Healthcare: A Survey [22.5] AI技術の新たなスイートとしてのファンデーションモデル(FM)は、計算医療の波を巻き起こしている。
我々は、AIセキュリティ、アセスメント、および人間の価値との整合性における重要な視点について議論する。
本報告では,患者の予後と臨床ワークフローを向上するために,FMベースの分析を期待できる展望を提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:00:32 GMT)
Cross-target Stance Detection by Exploiting Target Analytical
Perspectives [22.3] 目標位置検出(CTSD)は,目標位置からのアノテートデータを利用することで,目標位置の姿勢を推定する重要なタスクである。
CTSDにおける重要なアプローチの1つは、複数のターゲット間の知識ギャップを埋めるために、ドメイン不変の特徴を抽出することである。
本稿では,解析的視点をブリッジとして用いたCTSDのためのMPPTモデルを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:30:36 GMT)
Frequency-Adaptive Pan-Sharpening with Mixture of Experts [22.3] パンシャーピングのための新しい周波数適応型エキスパート混合学習フレームワーク(FAME)を提案する。
本手法は他の最先端技術に対して最善を尽くし,現実のシーンに対して強力な一般化能力を有する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:58:25 GMT)
Siamese Residual Neural Network for Musical Shape Evaluation in Piano
Performance Assessment [21.6] 本稿では,人工知能(AI)を用いたモデルを用いて音楽の形状を同定する方法について検討する。
楽曲の形状評価を分類問題として考慮し,S-ResNN(S-ResNN)を用いて楽曲の形状を自動同定する手法を提案する。
実験の結果,S-ResNNは精度,リコール,F1スコアの点で,多くのベンチマーク手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:51:13 GMT)
Balancing Continual Learning and Fine-tuning for Human Activity
Recognition [21.4] ウェアラブルベースのヒューマンアクティビティ認識(HAR)は、人間中心の機械学習において重要なタスクである。
本研究は,継続的自己教師型学習モデルであるCaSSLeの採用と適応について検討する。
また、異なる損失項の重要性についても検討し、知識保持と新たな課題からの学習のトレードオフについて検討した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:11:43 GMT)
A Comprehensive Survey on Graph Summarization with Graph Neural Networks [21.3] 過去には、グラフの最も重要な部分を統計的に捉えるために、ほとんどのグラフ要約技術が試みられていた。
今日では、現代のグラフデータの高次元性と複雑さにより、ディープラーニング技術がより普及している。
我々の調査は、GNN、畳み込みGNN、グラフオートエンコーダ、グラフアテンションネットワークなど、現在の最先端アプローチのレビューを含む。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 00:22:41 GMT)
Source-Free Online Domain Adaptive Semantic Segmentation of Satellite
Images under Image Degradation [20.8] 我々は、衛星画像のソースフリーおよびオンラインドメイン適応、すなわちテスト時間適応(TTA)に対処する。
2つの効果的な戦略を含む新しいTTA手法を提案する。
まず、ターゲット分布のグローバルバッチ正規化統計を着信データストリームで段階的に推定する。
第2に,グローバルなクラスセンターを用いて予測マスクを精錬することにより,予測品質を向上させる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:49:32 GMT)
LLM in a flash: Efficient Large Language Model Inference with Limited
Memory [20.5] 大規模言語モデル(LLM)は現代の自然言語処理の中心であり、様々なタスクにおいて例外的なパフォーマンスを提供する。
本稿では,利用可能なDRAM容量を超えるLLMを効率的に動作させるという課題に対処する。
本手法は,フラッシュメモリの特性を考慮した推論コストモデルの構築を含む。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:28:37 GMT)
DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection [20.3] 本稿では,DiffusionEdgeと呼ばれる汎用エッジ検出タスクに対する最初の拡散モデルを提案する。
最終的な性能を維持しつつ、高価な計算資源を避けるため、遅延空間にDPMを適用し、古典的なクロスエントロピー損失を可能にする。
すべての技術的設計で、DiffusionEdgeは限られたリソースで安定的にトレーニングすることができ、より少ない拡張戦略で、鮮明で正確なエッジマップを予測できる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:20:54 GMT)
LLaVA-$\phi$: Efficient Multi-Modal Assistant with Small Language Model [20.2] 効率的なマルチモーダルアシスタントであるLLaVA-$phi$(LLaVA-Phi)を紹介する。
LLaVA-Phiは、最近進歩した小言語モデルPhi-2のパワーを利用する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:07:43 GMT)
Advanced Unstructured Data Processing for ESG Reports: A Methodology for
Structured Transformation and Enhanced Analysis [20.0] 本研究では,ESGレポートを構造化解析可能な形式に変換する革新的な手法を提案する。
提案手法は,高精度なテキストクリーニング,画像からのテキストの適切な識別と抽出,およびこれらのレポート内の表の標準化を実現する。
この研究は、産業生態学と企業持続可能性評価の分野に多大な貢献をしている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:26:59 GMT)
A Robust Quantile Huber Loss With Interpretable Parameter Adjustment In
Distributional Reinforcement Learning [19.9] 本稿では、ワッサーシュタイン距離(WD)計算から導かれる一般化量子ハマー損失関数を提案する。
古典的な量子ハマー損失と比較して、この革新的な損失関数は外れ値に対する堅牢性を高める。
分布RLの一般的な応用であるアタリゲームに対する実証実験により,提案した損失関数の有効性が検証された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:51:49 GMT)
Provably Powerful Graph Neural Networks for Directed Multigraphs [19.6] 本稿では、標準的なメッセージパッシンググラフニューラルネットワークを有向多重グラフニューラルネットワークに変換する単純な適応の集合を解析する。
適応には、マルチグラフポート番号、ego ID、リバースメッセージパッシングが含まれる。
これらの組み合わせが理論的に任意の有向部分グラフパターンの検出を可能にすることを証明している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:43:46 GMT)
Fit-NGP: Fitting Object Models to Neural Graphics Primitives [19.5] 本研究では, 高精度なポーズ推定法として, 最先端の高効率放射場再構成法によって生成された密度場が適していることを示す。
本稿では,手首にカメラを装着したロボットアームを用いた完全自動ポーズ推定システムを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:57:56 GMT)
Task Oriented Dialogue as a Catalyst for Self-Supervised Automatic
Speech Recognition [19.5] 本稿では,CLC: Contrastive Learning for Conversationsを紹介する。
我々は,音声タスク指向対話の大規模半合成メタデータセットであるOD3上でのASRモデルの性能向上をLCCファミリーで実証した。
これらの成果は実世界のシステムにもたらされ、CLCがベースラインを最大6.7%上回るパフォーマンス向上に有効であることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:59:31 GMT)
Path-based Explanation for Knowledge Graph Completion [18.8] GNNベースの知識グラフ補完モデルの結果に対する適切な説明は、モデルの透明性を高める。
KGCタスクを説明するための既存のプラクティスは、インスタンス/サブグラフベースのアプローチに依存している。
我々は、GNNベースのモデルを探索する最初のパスベースのKGC説明器であるPower-Linkを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:19:37 GMT)
Explore Human Parsing Modality for Action Recognition [17.6] 我々はEnsemble Human Parsing and Pose Network(EPP-Net)と呼ばれる新しいデュアルブランチフレームワークを提案する。
EPP-Netは、スケルトンと人間の解析モダリティの両方を行動認識に利用した最初の企業である。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:43:41 GMT)
Supervision by Denoising for Medical Image Segmentation [17.1] そこで我々は,自身のソフトラベルを用いてモデルを監督するフレームワークであるSUD(Superervision by Denoising)を提案する。
SUDは平均的および空間的デノナイジング技術をデノナイジングフレームワークで統合し、デノナイジングとモデルウェイト更新のステップを交互に行う。
応用例として,バイオメディカルイメージングによる2つの問題にSUDを適用した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:34:33 GMT)
A First Runtime Analysis of the NSGA-II on a Multimodal Problem [17.0] この研究は、NSGA-IIが少なくともグローバルSEMOアルゴリズムと同様にOneJumpZeroJump問題の局所最適化に対処していることを示している。
この研究は、NSGA-IIが少なくともグローバルSEMOアルゴリズムと同様にOneJumpZeroJump問題の局所最適化に対処していることを示している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:50:59 GMT)
CBD: A Certified Backdoor Detector Based on Local Dominant Probability [16.8] 本稿では,新しい整合予測手法に基づく最初の認証バックドア検出器(CBD)を提案する。
CBDは、(1)検出推測、(2)攻撃が検出可能であることを保証する条件、(3)偽陽性率の確率的上限を提供する。
CBDは最先端の検出器と同等またはそれ以上の精度で検出を行い、さらに検出認証を提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:11:14 GMT)
Training-free Content Injection using h-space in Diffusion Models [16.5] 本稿では,生成過程における特徴を組み合わせることで,ある画像の内容を他の画像に注入する手法を提案する。
カスタム拡散アプローチとは異なり、我々の手法は時間を要する最適化や微調整を必要としない。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:23:07 GMT)
SwitchTab: Switched Autoencoders Are Effective Tabular Learners [16.3] グラフデータに対する自己教師付き表現手法であるSwitchTabを紹介する。
SwitchTabは、データペア間の相互および正常な機能を分離することで、潜伏した依存関係をキャプチャする。
その結果、微調整によるエンドツーエンド予測タスクにおいて、優れた性能を示した。
そこで我々は,SwitchTabが相互に疎結合で有意な特徴を可視化することで,説明可能な表現を生成する能力を強調した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:05:45 GMT)
Probabilistic Modeling for Sequences of Sets in Continuous-Time [16.2] 設定値データを連続的にモデリングするための一般的なフレームワークを開発する。
また,そのようなモデルを用いて確率的クエリに答える推論手法も開発している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:12:44 GMT)
Prompt Decoupling for Text-to-Image Person Re-identification [15.3] TIReIDは、画像ギャラリーからテキスト記述クエリを通じてターゲット人物を検索することを目的としている。
最近のCLIPベースのTIReID手法は、TIReIDタスクにCLIPモデルを適用するために、ネットワーク全体を直接微調整することに依存している。
タスク適応からドメイン適応を遠ざけるための2段階の訓練手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:55:15 GMT)
Unified Diffusion-Based Rigid and Non-Rigid Editing with Text and Image
Guidance [15.1] 本稿では,厳密な編集と非厳密な編集の両方を実行できる多用途画像編集フレームワークを提案する。
我々は、多種多様な編集シナリオを扱うために、デュアルパスインジェクション方式を利用する。
外観と構造情報の融合のための統合自己認識機構を導入する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:21:30 GMT)
Towards Fully Decoupled End-to-End Person Search [15.1] エンド・ツー・エンドの人物探索は、原シーン画像中の対象人物を統一モデルで共同で検出し、再同定することを目的としている。
検出タスクは、re-idタスクが異なるアイデンティティを識別している間に、すべての人を統一する。
既存の手法は、部分的に分離されたモデルのため、サブタスクの1つまたは2つの部分最適である。
タスクインクリメンタルな人探索ネットワークを提案し, タスク検出とリIDサブタスクのためのエンド・ツー・エンド・モデルを構築した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:42:20 GMT)
Rethinking Response Evaluation from Interlocutor's Eye for Open-Domain
Dialogue Systems [15.0] 我々は,自動応答評価器に必要とされる機能について,対話者の視点から分析・検討した。
Hazumiデータセットの最初の実験では、自動応答評価をインターロケータの判断と相関させる上で、インターロケータ認識が重要な役割を担っていることが明らかとなった。
X(元Twitter)での大規模な会話を用いた2回目の実験では、対話継続性予測が人間からのフィードバックなしにインターロケータ対応評価器を訓練できることが確認された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:15:41 GMT)
Disentangle Estimation of Causal Effects from Cross-Silo Data [14.7] 本稿では,モデルパラメータのシームレスなクロスサイロ伝送を容易にするために設計された,革新的なアンタングルアーキテクチャを提案する。
種々の欠落領域におけるバイアスを効果的に緩和するために,グローバルな制約を方程式に導入する。
我々の手法は最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:05:37 GMT)
Strategic Bidding Wars in On-chain Auctions [14.6] 本稿では,MEV-Boostオークションのゲーム理論モデルを導入し,シミュレーションを用いて,実際に観察されたビルダーの入札戦略について検討する。
提案手法は,建設業者の戦略の有効性に対する遅延の重要性と,提案者の視点からの全体的なオークション結果を示すものである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:02:52 GMT)
Sample-efficient Reinforcement Learning in Robotic Table Tennis [14.6] 強化学習(Reinforcement Learning, RL)は、様々なコンピュータゲームやシミュレーションにおいて、近年顕著な成功を収めている。
本稿では,テーブルテニスロボットの例として,サンプル効率のよいRLアルゴリズムを提案する。
提案手法は,シミュレーションと実ロボットの両方において,いくつかの挑戦的なシナリオで競合的に機能する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:25:03 GMT)
Data Valuation for Vertical Federated Learning: A Model-free and
Privacy-preserving Method [14.5] FedValueは、VFL(Vertical Federated Learning)のためのプライバシ保護、タスク固有、モデルフリーなデータ評価手法である。
まず,機械学習モデルを実行する必要なく,予測分析タスクへのデータパーティの貢献を評価する。
次に、プライバシ保存方式で各データパーティのMShapley-CMI値を算出する革新的なフェデレーション手法を開発する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:19:17 GMT)
Mining Fine-Grained Image-Text Alignment for Zero-Shot Captioning via
Text-Only Training [14.3] そこで本研究では,モダリティギャップを低減するために,テキストのみのトレーニングを施したゼロショット画像キャプションフレームワークを提案する。
特に,地域情報を活用するためのサブリージョン機能アグリゲーションを導入する。
フレームワークを拡張してゼロショットのVQAパイプラインを構築し、その汎用性を実証します。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:43:46 GMT)
Correlated sensing with a solid-state quantum multi-sensor system for
atomic-scale structural analysis [14.3] 我々は,複数の量子センサ間の信号相関を利用した新しいセンシングパラダイムを開発した。
3つの窒素空孔中心を量子エレクトロメーター系として、このマルチセンサーのパラダイムを実証する。
我々は、個々の点欠陥のリアルタイム電荷ダイナミクスを取得し、そのダイナミクスがよく知られた光スペクトル拡散をいかに誘導するかを可視化する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:26:20 GMT)
InstructTA: Instruction-Tuned Targeted Attack for Large Vision-Language
Models [14.2] 大規模視覚言語モデル(LVLM)は、画像理解と応答生成において、その驚くべき能力を示した。
本稿では,被害者のLVLMの視覚的エンコーダにのみアクセス可能な,斬新で実用的なグレーボックス攻撃シナリオを定式化する。
本研究では,LVLMに対して高い伝達性を有する目標対向攻撃を実現するために,命令調整型目標攻撃(InstructTA)を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:48:15 GMT)
PokerGPT: An End-to-End Lightweight Solver for Multi-Player Texas
Hold'em via Large Language Model [14.1] ポーカーはテキサスホールディング(Texas Hold'em)としても知られており、不完全な情報ゲーム(IIG)における典型的な研究対象となっている。
我々はテキサスホールドエムを任意の数のプレイヤーでプレイし、高い勝利率を得るためのエンドツーエンドの解法であるポーカーGPTを紹介する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:27:50 GMT)
A Survey Analyzing Generalization in Deep Reinforcement Learning [14.1] 深い強化学習政策が、その堅牢性と一般化能力を制限する過度に適合する問題に直面する根本的な理由を概説する。
我々の研究は、深層強化学習における現在の進歩に対して、コンパクトな体系的統一分析を提供し、一般化能力の向上による堅牢な深部神経政策の構築を支援することができると信じている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:45:01 GMT)
Long-term Fairness For Real-time Decision Making: A Constrained Online
Optimization Approach [14.1] 本稿では,時間変動公正性制約を特徴とする動的意思決定システムにおける長期公正性の確保のための枠組みを提案する。
LoTFairと呼ばれる新しいオンラインアルゴリズムが提示され、"オンザフライ"という問題を解決する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:55:50 GMT)
ShapeAug: Occlusion Augmentation for Event Camera Data [13.6] ダイナミックビジョンセンサ(DVS)のための新しいイベントデータ拡張手法を提案する。
シーン内でランダムに動く物体の合成イベントを紹介する。
提案手法を複数のDVS分類データセットで検証した結果,トップ1精度が最大6.5%向上した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:49:45 GMT)
Human-in-the-Loop Policy Optimization for Preference-Based
Multi-Objective Reinforcement Learning [13.6] 好みに基づくMORLのためのHuman-in-the-loopポリシー最適化フレームワークを提案する。
本手法は,事前知識を必要とせずに,DMの暗黙の選好情報を積極的に学習する。
我々は従来の3つのMORLアルゴリズムと4つの最先端の選好に基づくMORLアルゴリズムに対するアプローチを評価する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:17:53 GMT)
A Survey and Benchmark of Automatic Surface Reconstruction from Point
Clouds [13.5] 点雲から表面を復元する従来の手法と学習法の両方を提示する。
従来のアプローチでは、入力点の雲または結果として生じる表面に手作りの先行を課すことで問題を単純化することが多い。
ディープラーニングモデルには、入力ポイントクラウドの特性を直接学習する能力がある。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:58:13 GMT)
ModuleGuard:Understanding and Detecting Module Conflicts in Python
Ecosystem [13.2] 本稿では,モジュール競合問題とそのPythonエコシステムへの影響を系統的に検討する。
InstSimulatorと呼ばれる新しい手法を提案する。これは,セマンティクスとインストールシミュレーションを利用して,高精度かつ効率的なモジュール抽出を実現する。
これに基づいて、Pythonエコシステムのモジュール競合を検出するModuleGuardというツールを実装しました。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:26:07 GMT)
Language-Assisted Deep Learning for Autistic Behaviors Recognition [13.2] 本稿では,視覚に基づく問題行動認識システムにおいて,従来の手法よりも高い精度で性能を向上できることを示す。
問題行動の種類毎に「自由利用」言語記述を取り入れた2分岐マルチモーダルディープラーニングフレームワークを提案する。
実験結果から,言語指導を付加することで,自閉症の行動認識タスクに明らかなパフォーマンス向上がもたらされることが示された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:05:15 GMT)
A Practical Survey on Emerging Threats from AI-driven Voice Attacks: How Vulnerable are Commercial Voice Control Systems? [13.1] AIによる音声攻撃により、音声制御システムに新たなセキュリティ脆弱性が明らかになった。
本研究は,悪意ある音声攻撃に対する商用音声制御システムのレジリエンスを評価するための試みである。
以上の結果から,商用音声制御システムは既存の脅威に対する耐性を高めることが示唆された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:27:50 GMT)
Energy based diffusion generator for efficient sampling of Boltzmann
distributions [13.0] 任意のターゲット分布から試料を生成するためのエネルギーベース拡散発生器という新しいサンプル装置を提案する。
サンプリングモデルは変分オートエンコーダに似た構造を用いており、デコーダを用いて遅延変数をターゲット分布を近似するランダム変数に変換する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:03:46 GMT)
Hierarchical Aligned Multimodal Learning for NER on Tweet Posts [12.6] マルチモーダルなエンティティ認識(MNER)が注目されている。
画像とテキストのシーケンスを動的に調整する新しい手法を提案する。
2つのオープンデータセットで実験を行い、その結果と詳細な分析により、我々のモデルの利点を実証した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:15:28 GMT)
Highly Efficient Creation and Detection of Ultracold Deeply-Bound
Molecules via Chainwise Stimulated Raman Shortcut-to-Adiabatic Passage [12.5] M型分子系におけるラマン断熱通路(C-STIRAP)は、超低温で深い結合を持つ分子を作る良い方法である。
本稿では,C-STIRAPの性能向上に,ショートカット・トゥ・アディバティック(STA)パスが適していることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:37:15 GMT)
Expressive Speech-driven Facial Animation with controllable emotions [12.2] 本稿では,音声から表情の表情を生成するための深層学習に基づく新しいアプローチを提案する。
広視野の表情を、制御可能な感情タイプと強度で表現することができる。
感情制御可能な顔アニメーションを可能にし、ターゲット表現を継続的に調整することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:20:15 GMT)
U-Mixer: An Unet-Mixer Architecture with Stationarity Correction for
Time Series Forecasting [11.6] 時系列予測における非定常性は、深い層を通しての安定した特徴伝達を阻害し、特徴分布を妨害し、学習データ分布の変化を複雑化する。
異なるパッチとチャネル間の局所的な時間的依存関係を別々にキャプチャするU-Mixerを提案する。
U-Mixerは最先端(SOTA)法よりも14.5%,7.7%改善している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:41:40 GMT)
Approximating the Shapley Value without Marginal Contributions [11.5] 協調ゲームにおいてプレイヤーに有意義な貢献価値を割り当てる最も一般的な手法であるShapley値は最近、説明可能な人工知能において集中的に使用されている。
本稿では,余剰寄与の概念から分離されたShapley値の表現に基づく2つのパラメータフリーおよびドメイン非依存近似アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:51:54 GMT)
Generalized Quadratic Embeddings for Nonlinear Dynamics using Deep
Learning [11.3] 本稿では非線形システムの力学をモデル化するためのデータ駆動手法を提案する。
本研究では,昇降原理に着想を得た2次系を共通構造として用いることを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:51:13 GMT)
Information retrieval from Hawking radiation in the non-isometric model
of black hole interior: theory and quantum simulations [11.1] ブラックホール内部の非等距離ホログラフィーモデルは、長年のブラックホール情報パズルの潜在的な解決法として際立っている。
修正されたHayden-Preskillプロトコルでは,吉田-キタエフ復号方式が適用可能であることを示す。
この研究は、量子プロセッサのブラックホール情報問題を探究するより多くの関心を喚起するであろう。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:33:59 GMT)
Are LLMs Robust for Spoken Dialogues? [10.9] 大規模な事前学習型言語モデルでは、さまざまな下流タスクで最先端のパフォーマンスが実証されている。
タスク指向対話に関する公開データセットとベンチマークのほとんどは、書かれた会話に重点を置いている。
DSTC11テストセットにおける音声タスク指向対話におけるLLMの性能評価を行った。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:36:38 GMT)
On Model Compression for Neural Networks: Framework, Algorithm, and
Convergence Guarantee [10.8] 本稿では,低ランク近似と重み近似の2つのモデル圧縮手法に焦点を当てた。
本稿では,非最適化の新たな視点から,モデル圧縮のための全体論的なフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:06:41 GMT)
Graph Neural Networks for Tabular Data Learning: A Survey with Taxonomy
and Directions [10.8] グラフニューラルネットワーク(GNN)を用いた語彙データ学習
GNNは、様々なタブラルデータ学習領域にまたがって、大きな関心を集め、応用している。
この調査は、研究者や実践者のリソースとして役立ち、TDLの革命におけるGNNの役割を深く理解している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:49:10 GMT)
Geo2SigMap: High-Fidelity RF Signal Mapping Using Geographic Databases [10.3] Geo2SigMapは、地理データベースを用いた効率的かつ高忠実なRF信号マッピングのためのMLベースのフレームワークである。
われわれはOpenStreetMap、Blender、Sionnaの3つのオープンソースツールをシームレスに統合する自動化フレームワークを開発した。
その結果,Geo2SigMapは平均根平均2乗誤差(RMSE)を6.04dBで達成し,UEにおける基準信号受信電力(RSRP)を予測する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:41:48 GMT)
Beyond Self-Promotion: How Software Engineering Research Is Discussed on
LinkedIn [10.2] 我々は、ソフトウェアエンジニアリング(SE)実践者と研究者がLinkedInの公開ディスカッションを通じてどのように互いにアプローチするかを検討する。
私たちは、SE研究に関するLinkedInの記事のかなりの部分は、論文執筆者ではない人々によって書かれたものであることに気付きました。
我々は、LinkedInの新たな研究成果をもっと実りあるものにするために、研究者や実践者に対して具体的なアドバイスを定式化します。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:38:51 GMT)
Multi-stages attention Breast cancer classification based on nonlinear
spiking neural P neurons with autapses [10.2] ディープネットワークにおけるダウンサンプリングは、情報の損失につながる可能性がある。
本稿では,アプタプを用いたNSNPニューロンに基づく多段階アテンションアーキテクチャを提案する。
全ての倍率ケースにおいて96.32%の分類精度を達成し、最先端の手法より優れている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:28:50 GMT)
STAS: Spatial-Temporal Return Decomposition for Multi-agent
Reinforcement Learning [10.1] 本研究では,時間次元と空間次元の両方でクレジット代入を学習する新しい手法を提案する。
提案手法は, 時間的信用を効果的に割り当て, 最先端のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:18:00 GMT)
SLP-Net:An efficient lightweight network for segmentation of skin
lesions [9.8] SLP-Netは、スパイキングニューラルP(SNP)システム型機構に基づく超軽量皮膚病変セグメンテーションネットワークである。
通常のエンコーダ・デコーダ構造を持たない軽量なマルチスケール特徴抽出器を設計する。
ISIC2018チャレンジの実験では、提案されたモデルが最先端の手法の中で最も高いAccとDSCを持つことを示した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:34:08 GMT)
Information scrambling and entanglement in quantum approximate
optimization algorithm circuits [9.7] 変分量子アルゴリズムは、ノイズのある中間スケール量子(NISQ)時代に量子アドバンテージを示すことを約束している。
本稿では,QAOA回路における情報スクランブルと絡み合いについて検討し,より難しい問題に対して,より多くの量子資源が必要であることを明らかにする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 04:05:48 GMT)
Few-shot Adaptation of Multi-modal Foundation Models: A Survey [9.6] CLIPのようなマルチモーダル(ヴィジュアル言語)モデルは、従来の教師付き事前訓練モデルを置き換える。
医療画像やリモートセンシングのような細かな領域では、マルチモーダル基盤モデルの性能が望まれることが多い。
マルチモーダルモデルのための数ショット適応法における研究の進歩を紹介し,分析する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:24:48 GMT)
TinyLlama: An Open-Source Small Language Model [9.4] TinyLlamaは、約3エポックの約1兆トークンで事前訓練された、コンパクトな1.1B言語モデルである。
これは、既存のオープンソース言語モデルと同等のサイズで大幅に上回っている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:54:59 GMT)
Sending-or-not-sending quantum key distribution with phase postselection [9.2] 著者はSNSプロトコルにフェーズポストセレクションを導入している。
送信距離は、アクティブな奇異ペアリング法により、かつ、不要に改善することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:52:29 GMT)
Underwater Acoustic Signal Recognition Based on Salient Feature [9.1] 本稿では,水中音響信号認識のためのニューラルネットワークを用いた手法を提案する。
提案手法は,水中音響信号の分類のためのスペクトルから抽出した特徴を連続的に学習することを含む。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:38:00 GMT)
Blending Is All You Need: Cheaper, Better Alternative to
Trillion-Parameters LLM [9.1] より小さなモデルの組み合わせは、特異な大きなモデルと比較して、同等または拡張されたパフォーマンスを協調的に達成できるだろうか?
我々は,複数のチャットAIを統合する上で,単純かつ効果的な手法である「ブレンディング」というアプローチを導入する。
例えば、中程度のサイズの3つのモデル(6B/13Bパラメータ)を統合することで、ChatGPT (175B+パラメータ)のようなかなり大きなモデルのパフォーマンス指標に匹敵したり、超えたりすることができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:45:49 GMT)
TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and
Highlight Detection [9.0] 自然言語クエリに基づくビデオモーメント検索(MR)とハイライト検出(HD)は、非常に関連性の高い2つのタスクである。
MRとHDを共同で解くために、DETRベースのネットワークの構築にいくつかの方法が注がれている。
MRとHDの相反性を探索するDETR(TR-DETR)に基づくタスク相互変換器を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:55:57 GMT)
MLN-net: A multi-source medical image segmentation method for clustered
microcalcifications using multiple layer normalization [9.0] 本稿では,MLN-netという新しいフレームワークを提案する。
本稿では,異なる領域のクラスタ化マイクロ石灰化セグメンテーションにおけるMLN-netの有効性を検証した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:08:36 GMT)
Nonreciprocal entanglement in cavity magnomechanics exploiting chiral
cavity-magnon coupling [8.9] キャビティ・マグノメカティカル・システムにおいて,非相互量子絡み合いを実現する方法を示す。
この研究は、非相互電気機械量子テレポーテーションやカイラルマグノン量子ネットワークにおいて有望な応用を見出すことができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:58:01 GMT)
Approximating Numerical Flux by Fourier Neural Operators for the
Hyperbolic Conservation Laws [8.8] 提案手法は,従来の手法と比較することにより,数値スキームとFNOの両方の利点を有することを示す。
提案手法は,特に,分布外サンプルの時間的連続予測と一般化能力を有する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:56:58 GMT)
PEGASUS: Physically Enhanced Gaussian Splatting Simulation System for
6DOF Object Pose Dataset Generation [8.4] 6DOFオブジェクトポーズデータセット生成のためのPhysically Enhanced Gaussian Splatting Simulation System (PEG)を導入する。
PEGは3Dガウススプラッティングに基づく汎用的なデータセットジェネレータである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:58:14 GMT)
Multi-Agent Context Learning Strategy for Interference-Aware Beam
Allocation in mmWave Vehicular Communications [8.3] 我々は,Multi-Agent Context Learning (MACOL) と呼ばれる新しい戦略を開発し,ネットワーク内の車両に対してmWaveビームを割り当てながら干渉を管理する。
提案手法は,近隣のビーム状態の知識を活用することで,機械学習エージェントが他の送信に干渉する可能性のある送信を識別・回避できることを実証する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:43:55 GMT)
Single-photon scattering and bound states in a one-dimensional waveguide
with topological giant atom [8.2] 共振器導波路(CRW)とトポロジカル・ジャイアント・アトム(TGA)を結合する結合型共振器導波路(CRW)の単一光子散乱と束縛状態について検討した。
TGAの位相位相を変調することにより、CRW内の入射光子を完全に反射または伝達することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:22:05 GMT)
Which Quantum Circuit Mutants Shall Be Used? An Empirical Evaluation of
Quantum Circuit Mutations [8.1] 実世界の382個の量子回路を変異させた700K以上の故障ベンチマーク(量子回路)を用いて,大規模な実験評価を行った。
この結果に基づいて、量子突然変異解析手法を体系的に定義する上で、研究者にとって貴重な知見を提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:57:12 GMT)
Unit Testing in ASP Revisited: Language and Test-Driven Development
Environment [8.1] ASPプログラム内でテストのインライン化を可能にする新しい単体テスト仕様言語を提案する。
テストケースの仕様は従来の評価には透過的だが、特定のテストツールで解釈できる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:04:54 GMT)
Travelers: A scalable fair ordering BFT system [7.9] 最も効率的なBFTコンセンサスは$O(nTL + n2T)$通信複雑性を必要とする。
本稿では,BFT公正注文プロトコルであるTravelersを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:14:18 GMT)
A Multi-Modal Contrastive Diffusion Model for Therapeutic Peptide
Generation [7.8] 本稿では,新しいペプチド配列と構造を共生成するために,拡散フレームワークにおける配列と構造の両方のモダリティを融合したマルチモーダルコントラスト拡散モデルを提案する。
MMCDは、抗菌性/抗がん性スコア、多様性、ペプチドドッキングなど、さまざまな指標で治療ペプチドを産生する、最先端のディープジェネレーション法よりも優れている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:32:33 GMT)
Better and Simpler Lower Bounds for Differentially Private Statistical
Estimation [7.7] 任意の$alpha le O(1)$に対して、ガウスの共分散をスペクトル誤差まで推定するには$tildeOmegaleft(fracd3/2alpha varepsilon + fracdalpha2right)$サンプルが必要である。
次に、有界な$k$thモーメントで重み付き分布の平均を推定するには$tildeOmegaleft(fracdalphak/(k-1) varepsilon +
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:36:29 GMT)
PosCUDA: Position based Convolution for Unlearnable Audio Datasets [7.5] PosCUDAは、学習不能なオーディオデータセットを作成するための位置ベースの畳み込みである。
実験により,PosCUDAは元の音声データセットの品質を維持しつつ,未学習性を達成できることを実証的に示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:39:49 GMT)
Using LLM to select the right SQL Query from candidates [7.5] 候補リストから適切なクエリを選択するリランク手法を提案する。
実験結果から,提案手法の適用により,最先端モデルの性能が3.6%向上することが示唆された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:50:24 GMT)
Improving PTM Site Prediction by Coupling of Multi-Granularity Structure
and Multi-Scale Sequence Representation [7.3] タンパク質翻訳後修飾(PTM)サイト予測はバイオインフォマティクスの基本的な課題である。
マルチグラニュラリティ構造とマルチスケールシーケンス表現の結合によるPTMサイト予測手法を提案する。
3つのデータセットに対する大規模な実験は、PTM-CMGMSが最先端の手法よりも優れていることを示している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:49:32 GMT)
CANAMRF: An Attention-Based Model for Multimodal Depression Detection [7.3] 適応型マルチモーダルリカレントフュージョン(CANAMRF)を用いたマルチモーダル抑うつ検出のためのクロスモーダルアテンションネットワークを提案する。
CANAMRFは、マルチモーダル特徴抽出器、アダプティブマルチモーダルリカレントフュージョンモジュール、ハイブリッドアテンションモジュールによって構成されている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:08:16 GMT)
Adversarial Data Poisoning for Fake News Detection: How to Make a Model
Misclassify a Target News without Modifying It [7.1] 我々は,攻撃者が本来のターゲットニュースを操作することなく,特定のニュースコンテンツに対するオンライン学習検出器の性能を損なうことができるかを分析する。
攻撃者がオンライン学習手法の動作を操作するために、トレーニングデータに毒データを導入する方法を示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:20:42 GMT)
REDriver: Runtime Enforcement for Autonomous Vehicles [7.0] 本稿では,自律運転システムの実行時適用に対する汎用的かつモジュール的なアプローチであるREDriverを提案する。
ReDriverは、STLの定量的セマンティクスに基づいて、ADSの計画された軌道を監視する。
仕様に違反する可能性がある場合に、勾配駆動のアルゴリズムを使って軌道を修復する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:08:38 GMT)
Evasive Hardware Trojan through Adversarial Power Trace [6.9] 我々は,HT検出をバイパスするためのHT難読化(HTO)手法を提案する。
HTOはASICとFPGA用の1つのトランジスタで実装できる。
適応攻撃者は、スペクトルノイズ予算で設計を制約することで、まだ回避可能なHTOを設計可能であることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:28:15 GMT)
Preserving Image Properties Through Initializations in Diffusion Models [6.8] 現在適用されている安定拡散法は,小売写真の要求を尊重しないことを示す。
非常にノイズの多い画像でデノイザーを訓練する通常の習慣は、推論中に一貫性のない画像を生成する。
均一な背景を持つ中央の小売商品画像で訓練されたネットワークは、不規則な背景を持つ画像を生成する。
本手法は,拡散法における制御可能性を高めるために,他の制御法と良好に相互作用することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:55:49 GMT)
A New Frontier of AI: On-Device AI Training and Personalization [6.8] メモリ効率の高いニューラルネットワークトレーニング技術を提供する軽量オンデバイストレーニングフレームワークNNTrainerを提案する。
評価の結果,NNTrainerはメモリ消費を1/20まで削減し,デバイス上でのインテリジェンスサービスを効果的にパーソナライズできることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 23:07:19 GMT)
Large Language Models for Social Networks: Applications, Challenges, and
Solutions [6.6] 大規模言語モデル(LLM)は、人々がコンテンツを作成し、探索し、関与する方法を変えています。
オンラインソーシャルネットワークにおけるLLMアプリケーションの開発方法について検討する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 23:37:48 GMT)
Analyzing Misinformation Claims During the 2022 Brazilian General
Election on WhatsApp, Twitter, and Kwai [6.6] この研究では、2022年のブラジル総選挙でWhatsApp、Twitter、Kwaiの誤情報を分析した。
選挙期間中の正確な情報の民主的重要性を考えると、複数のファクトチェック組織が協力してWhatsAppのチップによる誤情報を特定し、対応した。
我々の研究は、現状のクレームマッチングアルゴリズムが、このような違いのあるプラットフォーム間でクレームにマッチする限界を強調している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:18:32 GMT)
Anatomy-aware and acquisition-agnostic joint registration with
SynthMorph [6.5] アフィン画像の登録は医療画像解析の基盤となる。
ほとんどのアフィン法は解剖学とは無関係であり、アルゴリズムが画像の全ての構造を考慮すれば、登録は不正確なものになる。
われわれはこれらの欠点にSynthMorphを用いて対処する。これは脳画像の結合アフィン変形性登録のための使いやすいDLツールである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:59:56 GMT)
Towards an Adaptable and Generalizable Optimization Engine in Decision
and Control: A Meta Reinforcement Learning Approach [6.3] メタ強化学習(RL)に基づいてMPCコントローラを学習し、コントローラを更新する。
これは専門家によるデモンストレーションを必要とせず、目に見えないコントロールタスクにデプロイされた場合の迅速な適応を可能にする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:41:33 GMT)
ClassWise-SAM-Adapter: Parameter Efficient Fine-tuning Adapts Segment
Anything to SAR Domain for Semantic Segmentation [6.2] Segment Anything Model (SAM) は意味情報と一般化能力に依存する様々なセグメンテーションシナリオを抽出する。
The ClassWiseSAM-Adapter (CWSAM) is designed to adapt the high-performing SAM for landcover classification on Spaceborne Synthetic Aperture Radar (SAR) images。
CWSAMは、少ないコンピューティングリソースでパフォーマンスを向上する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:54:45 GMT)
Navigating the Complexity of Generative AI Adoption in Software
Engineering [6.2] ソフトウェア工学における生成人工知能(AI)ツールの採用パターンについて検討した。
個人レベル、技術レベル、社会的レベルの影響要因を分析した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:41:29 GMT)
OptFlow: Fast Optimization-based Scene Flow Estimation without
Supervision [6.2] 高速な最適化に基づくシーンフロー推定手法であるOpsFlowを提案する。
人気の高い自動運転ベンチマークにおけるシーンフロー推定のための最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:47:56 GMT)
A comprehensive survey of research towards AI-enabled unmanned aerial
systems in pre-, active-, and post-wildfire management [6.0] 森林火災は世界でも最も破壊的な自然災害の1つであり、人命と森林の野生生物に壊滅的な被害をもたらしている。
近年、無人航空機(UAV)とディープラーニングモデルの統合によって推進される山火事における人工知能(AI)の使用は、より効果的な山火事管理を実装し、開発するための前例のない勢いを生み出している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:09:35 GMT)
Multivariate trace estimation in constant quantum depth [5.9] 民間の信念では、深さ$Theta(m)$量子回路は密度行列のトレースを推定するために必要である。
我々は、この信念が、タスクのための定数量子深度回路を構築することで、過度に保守的であることを証明した。
我々は、GoogleのSycamoreプロセッサと同様のアーキテクチャ上で、我々の回路を高度に並列化された方法で実装する方法を示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 04:24:11 GMT)
Real-Time FJ/MAC PDE Solvers via Tensorized, Back-Propagation-Free
Optical PINN Training [5.8] 本稿では,物理インフォームドニューラルネットワーク(PINN)のためのオンチップトレーニングフレームワークを開発する。
これは、fJ/MACフォトニック電力消費と超低レイテンシで高次元PDEを解決することを目的としている。
これは、高次元PDEを解くために適用可能な、最初のリアルタイム光PINNトレーニングフレームワークである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:25:16 GMT)
Accurate Leukocyte Detection Based on Deformable-DETR and Multi-Level
Feature Fusion for Aiding Diagnosis of Blood Diseases [5.8] 本稿では,多レベル特徴融合と変形性自己注意型DETR(MFDS-DETR)という,新しい白血球検出法を提案する。
このモデルは、チャネルアテンションモジュールを介して低レベル特徴情報をフィルタリングするために、ハイレベル特徴を重みとして利用する。
マルチスケールの変形可能な自己保持モジュールをエンコーダに組み込むことにより、白血球機能不足の問題に対処する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:18:15 GMT)
HyperSense: Accelerating Hyper-Dimensional Computing for Intelligent
Sensor Data Processing [5.8] HyperSenseは、センサデータのオブジェクト存在予測に基づいて、ADCモジュールのデータ生成率を効率的に制御する。
HyperSense用に調整されたFPGAベースのドメイン固有アクセラレータは、NVIDIA Jetson OrinのYOLOv4と比較して5.6倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:12:33 GMT)
SPEER: Sentence-Level Planning of Long Clinical Summaries via Embedded
Entity Retrieval [5.7] 臨床医は、患者が退院するたびに、長い要約を書かなければならない。
要約が臨床的に有用であるためには、健全な実体を同定し、カバーすることが不可欠である。
我々は、そのタスクでオープンソースLLMを微調整し、不完全で不誠実な要約を生成することを発見した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:23:44 GMT)
Decentralized Multi-Task Online Convex Optimization Under Random Link
Failures [5.5] 我々は不均一な確率を持つランダムリンク障害に対する頑健な分散型サドルポイントアルゴリズムを開発した。
我々はアルゴリズムと分析を2点の帯域フィードバックシナリオに拡張する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 00:57:33 GMT)
Learning Homogenization for Elliptic Operators [5.2] マルチスケール偏微分方程式(PDE)は様々な応用で発生し、効率的な解法としていくつかのスキームが開発されている。
ホモジェナイゼーション理論(英語版)は、小さな依存を取り除く強力な方法論であり、結果として単純な方程式が引き起こされる。
本稿では, 楕円型作用素の複素数の存在下での同質化法則の学習可能性について検討する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 23:09:40 GMT)
DCR-Consistency: Divide-Conquer-Reasoning for Consistency Evaluation and
Improvement of Large Language Models [5.0] この研究は、LLM(Large Language Models)生成したテキストの一貫性を評価し改善する自動化フレームワークであるDCRを提案する。
本稿では,DCEからの出力を解釈可能な数値スコアに変換する自動計量変換器(AMC)を提案する。
また,本手法は出力不整合の90%近くを著しく低減し,効果的な幻覚緩和の可能性を示唆している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:34:16 GMT)
Comprehensive Exploration of Synthetic Data Generation: A Survey [4.5] この研究は、過去10年間で417のSynthetic Data Generationモデルを調査します。
その結果、ニューラルネットワークベースのアプローチが普及し、モデルのパフォーマンスと複雑性が向上したことが明らかになった。
コンピュータビジョンが支配的であり、GANが主要な生成モデルであり、拡散モデル、トランスフォーマー、RNNが競合する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:23:51 GMT)
TitanCFI: Toward Enforcing Control-Flow Integrity in the Root-of-Trust [4.4] TitanCFIは保護されたコアのコミットステージを変更して、制御フロー命令をRoTにストリームする。
カスタムIPの設計やコンパイルツールチェーンの変更を避ける。
RoTのタンパー保護ストレージと暗号アクセラレータを利用してメタデータをセキュアにする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:58:33 GMT)
Structured Matrix Learning under Arbitrary Entrywise Dependence and
Estimation of Markov Transition Kernel [4.4] 本稿では、ノイズの多い低ランク+スパース行列回復の一般的な枠組みについて考察する。
本稿では,不整合制約最小二乗推定器を提案し,その厳密性を決定論的下界とミニマックスリスクの整合性の両方で証明する。
次に、我々のフレームワークのいくつかの重要な統計機械学習問題への適用について紹介する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:13:23 GMT)
Uncertainty in GNN Learning Evaluations: A Comparison Between Measures
for Quantifying Randomness in GNN Community Detection [4.4] 実世界のベンチマークは、GNNの評価に影響を与える多くの決定により、混乱している。
W$ランダムネス係数は、ワッサーシュタイン距離に基づいて、ランダムネスの最も堅牢な評価を提供するものとして識別される。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:23:03 GMT)
Nonreciprocal photon blockade with Kerr magnons [4.3] 片方向信号の操作を可能にする非相互デバイスは、量子情報処理と量子ネットワークにとって不可欠である。
ケラ非線形性を持つマグノンを支持するイットリウム鉄ガーネット(YIG)球にマイクロ波空洞を結合した非線形空洞-マグノン系を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:03:32 GMT)
Preference as Reward, Maximum Preference Optimization with Importance
Sampling [4.2] 優先度学習は、言語モデルを人間の価値と整合させるための重要な技術である。
RLHFの処理は複雑で、時間がかかり、不安定である。
本稿では,重要サンプリングの観点から,シンプルで直感的な非政治的選好最適化アルゴリズムを設計する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:07:57 GMT)
The Brain Tumor Segmentation (BraTS) Challenge 2023: Focus on Pediatrics
(CBTN-CONNECT-DIPGR-ASNR-MICCAI BraTS-PEDs) [4.1] 中枢神経系の小児腫瘍は、小児におけるがん関連死の最も一般的な原因である。
小児の高次グリオーマの生存率は20%未満である。
BraTS-PEDs 2023チャレンジは、小児脳グリオーマのためのボリュームセグメンテーションアルゴリズムの開発に焦点を当てている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:10:34 GMT)
Detection and Discovery of Misinformation Sources using Attributed
Webgraphs [4.1] 本稿では、ラベル付きニュースドメインと、アウトリンクおよびバックリンクドメインへの接続を含む、新しい属性付きWebグラフデータセットを提案する。
本稿では,これらの属性付きWebグラフを用いたニュースサイトの信頼性検出におけるグラフニューラルネットワークの成功例を示す。
また、未知の誤報ニュースソースを発見するための新しいグラフベースのアルゴリズムを導入・評価する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:47:36 GMT)
Isotope engineering for spin defects in van der Waals materials [3.8] 六方晶窒化ホウ素(hBN)の等方的に精製した$mathrmh10mathrmB15mathrmN結晶を育成する
hBNの$mathrmV_mathrmB-$と、同位体の自然分布と比較すると、かなり狭く、より混み合った$mathrmV_mathrmB-$のスピン遷移が観察される。
量子センシングのためには、$mathrmh10mathrmB15mathrmの$mathrmB-$center
論文参考訳(メタデータ) (Thu, 4 Jan 2024 04:59:15 GMT)
Covert Channel Attack to Federated Learning Systems [3.7] フェデレーション・ラーニング(FL)は、エッジクライアント間でモデルトレーニングを分散することで、従来の集中型機械学習を越えている。
本稿では,ステルス通信インフラを実装するために,FLシステムを隠蔽チャネルにすることを目的とした,新たな攻撃モデルを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:57:06 GMT)
A Community Detection and Graph Neural Network Based Link Prediction
Approach for Scientific Literature [3.7] 本研究では,コミュニティ検出アルゴリズムをグラフニューラルネットワーク(GNN)モデルに統合し,科学的ネットワーク文学におけるリンク予測を強化する革新的な手法を提案する。
本稿では,これらのネットワーク内の潜在コミュニティ構造を明らかにするために,Louvainコミュニティ検出アルゴリズムの利用に着目する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:14:10 GMT)
A case study of Generative AI in MSX Sales Copilot: Improving seller
productivity with a real-time question-answering system for content
recommendation [3.7] 我々は、売り手が顧客とライブで共有したり、通話中に参照したりできる関連資料や文書を入手するための、特にターゲットとするリアルタイム質問応答システムを設計する。
本稿では, 地震資料リポジトリを, 多様な販売資料のデータセットの比較的大規模な例とみなす。
私たちは、文書や販売業者が利用できる豊富なメタ機能のセットを活かした、精巧な方法で、エンジニアリングのプロンプトによってこれを達成します。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:32:44 GMT)
Significance of Anatomical Constraints in Virtual Try-On [3.5] VTONシステムは、所定の衣服の人の試着アウトプットを予測するために、衣服のソースと人の画像を取得する。
既存の方法は、不正確な衣服の変形を発生させることで失敗する。
本稿では,服を個別にワープ可能な部品に分割し,個別にワープし,その後に組み合わせるパートベースのワープ手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:43:40 GMT)
Trajectory-Oriented Policy Optimization with Sparse Rewards [3.3] 本研究では,オンラインRLのスパース報酬設定において,オフラインのデモトラジェクトリを高速かつ効率的に活用する手法を開発した。
我々のキーとなる洞察は、オフラインのデモの軌跡をガイダンスとして扱うことで、それらを模倣するのではなく、ステートアクションのビジター分布がオフラインのデモと一致したポリシーを学習することである。
提案アルゴリズムは, 離散的かつ連続的なタスクに対して, まばらで偽りの報奨を伴って評価する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:21:01 GMT)
Evaluating Language-Model Agents on Realistic Autonomous Tasks [3.3] 本報告では,言語モデルエージェントが資源を取得し,自分自身のコピーを作成し,野生で遭遇する新たな課題に適応する能力について検討する。
ARAの能力は広範かつ予測しにくい結果をもたらす可能性があると我々は信じている。
システムがARAを使えるようになると、システムの能力にバウンダリを置くことがかなり難しくなります。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:46:39 GMT)
Lightweight Fish Classification Model for Sustainable Marine Management:
Indonesian Case [2.9] オーバーフィッシングは 持続可能な海洋開発における 主要な問題の一つです
本研究は,保護魚種の識別を支援する魚類分類技術の進歩について提案する。
インドネシア列島沖で発見された魚の37,462枚の画像のラベル付きデータセットを収集した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:56:54 GMT)
The Near-optimal Performance of Quantum Error Correction Codes [2.9] 任意の符号と雑音に対する簡潔で最適化のない計量である準最適チャネル忠実度を導出する。
従来の最適化手法と比較して、計算コストの削減により、以前はアクセス不能なサイズであったシステムをシミュレートすることができる。
熱力学符号とGottesman-Kitaev-Preskill (GKP)符号のほぼ最適性能を解析的に導出した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:44:53 GMT)
SuperEdge: Towards a Generalization Model for Self-Supervised Edge
Detection [2.9] 最先端のピクセルワイドアノテーションは労働集約的であり、手作業で取得すると矛盾する。
本稿では, マルチレベルのマルチホログラフィー技術を用いて, 合成データセットから実世界のデータセットへアノテーションを転送する, エッジ検出のための新しい自己教師型アプローチを提案する。
提案手法は,手動の注釈付きエッジラベルへの依存性を排除し,多様なデータセット間の一般化性を向上させる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:21:53 GMT)
DEM: A Method for Certifying Deep Neural Network Classifier Outputs in
Aerospace [2.9] 航空宇宙分野におけるソフトウェア開発は、厳格で高品質な標準に固執する必要がある。
深層学習革命の恩恵を航空宇宙システムに与える方法は不明である。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:01:24 GMT)
Sliced gradient-enhanced Kriging for high-dimensional function
approximation [2.8] Gradient-enhanced Kriging (GE-Kriging)は、高価な計算モデルを近似するために確立されたサロゲートモデリング技術である。
固有相関行列のサイズのため、高次元問題に対して実用的でない傾向にある。
SGE-Kriging (Sliced GE-Kriging, SGE-Kriging) と呼ばれる新しい手法を開発し, 相関行列のサイズを小さくする。
その結果,SGE-Krigingモデルでは,標準モデルに匹敵する精度と堅牢性を特徴とするが,トレーニングコストの低減が図られた。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:42:31 GMT)
Not Only Rewards But Also Constraints: Applications on Legged Robot
Locomotion [2.8] 本稿では,報酬と制約の両方からなる複雑なロボットシステムのためのニューラルネットワークコントローラをトレーニングするための,新しい強化学習フレームワークを提案する。
学習フレームワークは、異なる形態と物理的特性を持つ複数の脚を持つロボットのトレーニングコントローラに適用され、困難な地形を横断する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:22:36 GMT)
Moving-Horizon Estimators for Hyperbolic and Parabolic PDEs in 1-D [2.8] 観測者PDEの数値解の必要性をリアルタイムに除去するために,PDEの移動水平推定器を導入する。
我々は、双曲型PDEと放物型PDEの両方のクラスに対して、移動水平状態推定を明示的に生成するPDEバックステッピング法を用いてこれを実現する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:55:43 GMT)
Robust bilinear factor analysis based on the matrix-variate $t$
distribution [2.7] $t$ディストリビューション($t$fa)に基づく因子分析は、重み付きまたは汚染されたデータの一般的な要因を抽出するのに有用である。
本稿では,$t$分布(t$bfa)に基づく新しいロバストな因子分析モデルを提案する。
重み付き行列データや汚染された行列データに対して、行変数と列変数の両方の共通要素を同時に抽出することができる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:15:44 GMT)
Generalized Spectral Form Factor in Random Matrix Theory [2.5] スペクトル形成因子(SFF)は、複雑な系におけるエネルギー準位分布の統計的性質を明らかにする上で重要な役割を果たす。
本稿では,SFFの定義を高次相関を含むように拡張する。
GSFFはカオスシステムの力学に関するより包括的な知識を提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:58:47 GMT)
Multipartite entanglement measures based on geometric mean [2.4] 我々は、マルチパーティイトシステムにおけるすべての$k$-非分離状態を明示的に検出する$k$-GMコンカレンスと呼ばれる絡み合い対策を定義する。
厳密な具体化は、$k$-GM の収束が絡み合い測度のすべての条件を満たすことを示している。
私たちは$q$-$k$-GM Concurrence $(q>1, 2leq kleq n)$と$alpha$-$k$-GM Concurrence $(0leqalpha1, 2leq kleq n)$をパラメータ化します。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:44:30 GMT)
Learning to Generalize towards Unseen Domains via a Content-Aware Style
Invariant Model for Disease Detection from Chest X-rays [2.3] 分布不一致による性能劣化は、インテリジェントイメージングにおける長年にわたる課題である。
近年の研究では、CNNはコンテンツよりもスタイルに偏っていることが示されている。
我々は、画像(SRM-IL)と特徴(SRM-FL)の両方において、新しいオンザフライスタイルのランダム化モジュールを使用し、リッチなスタイルの摂動特徴を創出する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:35:21 GMT)
Lessons from Building StackSpot AI: A Contextualized AI Coding Assistant [2.3] 大規模言語モデル上に構築された新しいタイプのツールが登場しつつある。
これらのツールは、微調整やコンテキスト情報によるユーザプロンプトの強化といった手法を用いて、欠点を軽減することを目的としている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:06:30 GMT)
Perceptual Musical Features for Interpretable Audio Tagging [2.2] 本研究では,音楽の自動タグ付けにおける解釈可能性の関連性について検討する。
3つの異なる情報抽出手法を組み込んだワークフローを構築した。
MTG-JamendoデータセットとGTZANデータセットの2つのデータセットについて実験を行った。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:09:37 GMT)
CLASS-M: Adaptive stain separation-based contrastive learning with
pseudo-labeling for histopathological image classification [2.0] 広範にラベル付けされたデータセットを必要としない半教師付きパッチレベルの組織像分類モデルであるCLASS-Mを提案する。
2つの明確な細胞腎細胞癌データセットの他の最先端モデルと比較した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:21:26 GMT)
Dynamic programming by polymorphic semiring algebraic shortcut fusion [1.9] 動的プログラミング(動的プログラミング、英: Dynamic Programming、DP)は、難解問題の効率的かつ正確な解法のためのアルゴリズム設計パラダイムである。
本稿では,セミリングに基づくDPアルゴリズムを体系的に導出するための厳密な代数形式について述べる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:53:29 GMT)
Two-Stage Surrogate Modeling for Data-Driven Design Optimization with
Application to Composite Microstructure Generation [1.9] 本稿では,科学・工学分野における逆問題に対処する2段階の機械学習に基づく代理モデリングフレームワークを提案する。
最初の段階では、"Learner"と呼ばれる機械学習モデルは、予測出力が望ましい結果と密接に一致している入力デザイン空間内の候補の限られたセットを特定する。
第2段では、第1段で生成された縮小候補空間を評価するために、「評価器」として機能する別の代理モデルを用いる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 00:25:12 GMT)
Real-Time 2D Temperature Field Prediction in Metal Additive
Manufacturing Using Physics-Informed Neural Networks [1.9] 金属添加物製造プロセスの温度場を正確に予測することは、過熱の防止、プロセスパラメータの調整、プロセス安定性の確保に重要である。
本稿では,金属AMの温度場予測に特化して設計された物理インフォームドニューラルネットワークフレームワークを提案する。
提案手法を2つのシナリオで検証し, 薄肉のフルフィールド温度予測と円筒部と立方体部の2次元温度予測を行い, それぞれ3%, 1%未満の誤差を示した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:42:28 GMT)
Proven Distributed Memory Parallelization of Particle Methods [1.9] 本稿では,分散メモリコンピュータの並列化手法として,アルゴリズムのクラスを形式的に定義する。
特に、解析された並列化スキームはよく知られ、一般的に使われている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:22:26 GMT)
A Generalizable Physics-informed Learning Framework for Risk Probability
Estimation [1.9] 我々は,長期的リスクとその勾配の確率を評価するための効率的な手法を開発した。
提案手法は, 長期リスク確率が偏微分方程式を満たすという事実を利用する。
数値計算の結果,提案手法はサンプル効率が向上し,未確認領域への一般化が可能であり,パラメータを変化させたシステムに適応できることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:19:39 GMT)
Magnetic response of twisted bilayer graphene [1.7] 強磁場の極限における状態密度(DOS)の明示的な半古典的拡張を提供する。
DOSの明示的な拡張により、磁気振動などの磁気応答特性の研究が可能となる。
特に、DOSの研究における異なるタイプの層間トンネル(AAprime$/$BBprime$ vs.$ABprime$/$BAprime$)の役割を明らかにする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:55:45 GMT)
Graphical quantum Clifford-encoder compilers from the ZX calculus [1.6] 本稿では、クリフォードエンコーダをZX計算におけるユニークなグラフィカル表現にマッピングする量子コンパイルアルゴリズムを提案する。
具体的には、ZX計算の正準形式を開発し、任意のクリフォードエンコーダを正準形式に効率よく再現可能であることを証明する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:05:16 GMT)
Fusion of Single and Integral Multispectral Aerial Images [1.6] 従来の空中画像と統合的空中画像との最も重要な特徴を融合させる新しいハイブリッドアーキテクチャ(モデルと学習に基づく)が提案されている。
これは、環境の空間的参照と、通常、密集した植生によって隠される、隠蔽されていないターゲットの特徴を組み合わせる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:42:31 GMT)
Separability of Graph Laplacian Quantum States: Utilizing Unitary
Operators, Neighbourhood Sets and Equivalence Relation [1.6] この記事では、グラフラプラシアンで表される量子状態における内在的絡み合いと分離性の特徴について分析する。
グラフにおけるエッジの有無は、これらの状態の絡み合いや分離性を定義する上で重要な役割を果たすことを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:15:12 GMT)
Shayona@SMM4H23: COVID-19 Self diagnosis classification using BERT and
LightGBM models [1.6] 本稿では,Team Shayona による SMMH4-23 のタスク 1 と 4 の共有に対するアプローチと結果について述べる。
私たちのチームは、すべての参加者の中で、Task-1のf1スコア0.94を達成しました。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:13:18 GMT)
Interpretable Time Series Models for Wastewater Modeling in Combined
Sewer Overflows [1.5] 雨槽から流出した地下水の汚水汚染問題に特に対処する。
我々は, 最先端の解釈可能な時系列モデルが, どの程度の臨界水位を予測できるかを考察する。
その結果, 現代の時系列モデルでは, 下水道の排水管理や環境汚染防止に寄与することが示唆された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:48:27 GMT)
Local Environment Poisoning Attacks on Federated Reinforcement Learning [1.5] フェデレートラーニング(FL)は、従来の強化ラーニング(RL)タスクを解決する一般的なツールとなっている。
フェデレートされたメカニズムは、トレーニングされたポリシーを誤解させる可能性のある悪意のあるエージェントによる毒殺システムを公開する。
本稿では、FRL中毒を最適化問題として特徴付けるための一般的な枠組みを提案し、政策に基づくFRLに適用可能な中毒プロトコルを設計する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 23:44:12 GMT)
Quantifying Deep Learning Model Uncertainty in Conformal Prediction [1.5] コンフォーマル予測(Conformal Prediction)は、モデルの不確実性を表現するための有望なフレームワークである。
本稿では,最先端CP手法とその理論的基礎について考察する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:02:51 GMT)
Vulnerabilities Unveiled: Adversarially Attacking a Multimodal Vision
Langauge Model for Pathology Imaging [1.5] 本研究は,視覚言語基盤モデルPLIP(Pathology Language-Image Pretraining)の脆弱性を,標的とした対向条件下で調査する。
本研究は,意図的な誤分類を誘発するために,PGD (Projected Gradient Descent) を用いた。
この研究は、AIモデルの信頼性を確保するための堅牢な防御の必要性を強調している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:49:15 GMT)
On Augmenting Scenario-Based Modeling with Generative AI [1.5] モデリングプロセスの一環として,チャットボットのより安全で構造化された利用方法について概説する。
本稿では,モデルの自動解析を容易にするシナリオベースモデリング手法を提案する。
このアプローチの可能性を浮き彫りにした好適な予備結果について述べる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:58:25 GMT)
A Hamiltonian Approach to Barrier Option Pricing Under Vasicek Model [1.2] 量子論におけるハミルトン的アプローチは、オプション価格と利率の新しい考え方を提供する。
バリアオプションの場合、オプション価格変更プロセスは量子力学における無限高障壁散乱問題と似ている。
二重障壁オプションの場合、オプションの価格変更プロセスは無限の正方形ポテンシャル井戸内を移動する粒子に類似している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:54:31 GMT)
Continuous families of bipartite 2-unitary matrices: a Paradigm for
quantum convolution gates [1.2] 我々は、畳み込みとプーリングの量子アナログに注目し、置換テンソルのコヒーレンスとしてパラメタリザブルな量子畳み込みチャネルを構築する。
提案手法を用いて構築した畳み込みチャネルにおいて,最大エンタングル力を有するために必要となる条件を同定する。
新たに確立されたファミリーは、量子畳み込みニューラルネットワークにおけるトレーニング可能な畳み込み/プーリング層のプロトタイプとして機能する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:15:22 GMT)
Gain Scheduling with a Neural Operator for a Transport PDE with
Nonlinear Recirculation [1.1] ゲインスケジューリング(GS)非線形設計は、非線形フィードバックの設計において最も単純なアプローチである。
近年導入されたニューラル演算子(NO)は、各状態値に対して高速に利得関数を生成するように訓練することができる。
非線形再循環を伴う双曲型PDEの局所安定化を確立する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:45:27 GMT)
An AI-enabled Bias-Free Respiratory Disease Diagnosis Model using Cough
Audio: A Case Study for COVID-19 [1.1] トレーニングデータ配信における共同創設者の影響を軽減するため, Bias Free Network (RBFNet) を提案する。
RBFNetは正確なRD診断機能を保証し、COVID19データセットを組み込むことでその関連性を強調する。
条件付き生成Adrial Network (cGAN) を定式化するための分類スキームに新たなバイアス予測器が組み込まれている
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:09:45 GMT)
Mastery Guided Non-parametric Clustering to Scale-up Strategy Prediction [1.1] Node2Vecをベースとした表現を学び、熟達度やスキルレベルの対称性を符号化します。
我々は,MATHiaの大規模データセットから数学学習の戦略を学習するために,本モデルを適用した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:57:21 GMT)
Histopathology Slide Indexing and Search: Are We There Yet? [1.0] 固形腫瘍の3症例における3種類の病理組織学的スライドサーチエンジン(Yottixel,SISH,RetCCL)の臨床的準備について検討した。
3つの画像検索エンジンは、一貫して信頼性のある結果が得られず、悪性の粒度と微妙な特徴を捉えるのに困難であることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:54:18 GMT)
Leveraging SAM for Single-Source Domain Generalization in Medical Image
Segmentation [0.8] 単一ソースドメインの一般化は、単一のソースドメインのみをトレーニングする最も難しい設定である。
我々は、Segment Anything Model (SAM) をSDGに利用し、一般化の能力を大幅に改善する。
我々は,従来のDGデータセットを用いてモデルを評価し,他の最先端のDG手法と比較して競争力のある結果を得た。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:56:38 GMT)
A novel method to enhance pneumonia detection via a model-level
ensembling of CNN and vision transformer [0.7] 肺炎は世界中で致死率と死亡率の主要な原因である。
深層学習は胸部X線(CXR)画像から肺炎を検出する大きな可能性を示している。
我々は,モデルレベルのアンサンブルにより,畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマーネットワークを融合させる新しいモデルを開発した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:58:31 GMT)
Squashed quantum non-Markovianity: a measure of genuine quantum
non-Markovianity in states [0.7] 我々は、スクアッシュ量子非マルコフ性(sQNM)と呼ばれる真の量子起源の非マルコフ性に対する忠実な尺度を提案する。
これは量子条件の相互情報に基づいており、全ての非量子寄与を排除した後、左上非マルコビアン性によって定義される。
sQNMは単ガム性, 連続性, 凸性, テンソル積状態への添加性, 一般に超添加性を示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:17:01 GMT)
TSGAN: An Optical-to-SAR Dual Conditional GAN for Optical based SAR
Temporal Shifting [0.7] 本研究は,光学-SAR翻訳の領域を小さくする研究である。
本稿では,所望のタイムスタンプから光データを,異なる時間点からのSARデータとともに入力する,SAR時間シフトと呼ばれる新しい手法を提案する。
このモデルは、光学データで観測された変化に基づいてSARデータを修正し、所望のタイムスタンプに対してSARデータを生成する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:43:33 GMT)
The polygon relation and subadditivity of entropic measures for discrete
and continuous multipartite entanglement [0.7] エントロピーの多角形関係と部分付加率の関係について検討した。
我々の研究は多粒子状態の豊富な構造をよりよく理解する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:09:37 GMT)
Survey of 3D Human Body Pose and Shape Estimation Methods for
Contemporary Dance Applications [0.6] 現代舞踊と芸能の3次元体型とポーズ推定法を調査・比較した。
PHALPのようなマルチフレーム手法は、ダンサーが現代舞踊を踊っている場合のポーズ推定において、シングルフレーム法よりも優れた結果が得られることを示した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:51:44 GMT)
Robustly learning the Hamiltonian dynamics of a superconducting quantum
processor [0.6] 超伝導量子ビットアナログ量子シミュレータにおけるボソニック励起のフリーハミルトニアンパラメータを強く推定する。
この結果は、アナログ力学量子シミュレーションの完全で高精度な実装である。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:08:23 GMT)
The Compute Divide in Machine Learning: A Threat to Academic
Contribution and Scrutiny? [0.6] 計算の偏差は、計算集約的な研究トピックにおける学術のみの研究チームの表現の減少と一致していることを示す。
この傾向から生じる課題に対処するため、留意的に学術的な洞察を広めるためのアプローチを推奨する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:26:11 GMT)
Multi-Source Domain Adaptation with Transformer-based Feature Generation
for Subject-Independent EEG-based Emotion Recognition [0.5] 本稿では,複数の情報源からの情報を活用するために,トランスフォーマーベースの特徴生成器(MSDA-TF)を用いたマルチソース領域適応手法を提案する。
適応過程において、相関値に基づいてソース対象をグループ化し、ソース内だけでなく、対象対象のモーメントを各ソースと整合させることを目的としている。
MSDA-TFはSEEDデータセット上で検証され、有望な結果が得られた。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:38:47 GMT)
General framework of breeding protocols for entanglement distillation [0.5] Bennettらは、絡み合った蒸留のための一連のプロトコル、すなわちハッシュ、反復および繁殖プロトコルを提案した。
本稿では,安定器の量子誤り訂正符号を育種プロトコルに変換するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:33:57 GMT)
Migrating Birds Optimization-Based Feature Selection for Text
Classification [0.5] MBO-NBは、多数の特徴を持つテキスト分類における特徴選択問題に対処する新しいアプローチである。
本実験は,MBO-NBが既存技術に比べて機能低下に優れることを示した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:11:03 GMT)
Training Single-Layer Morphological Perceptron Using Convex-Concave
Programming [0.5] コンベックス・コンケーブ計画法(DCCP)を用いた単層型パーセプトロンの訓練について検討する。
リタロポロスとマラゴスによって提案された既存の単層型形態素パーセプトロン(SLMP)モデルを組み合わせたK-DDCCPを提案する。
実験により,K-DDCCPアルゴリズムによる二項分類問題の解法の有効性が確認された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:34:58 GMT)
L3Cube-IndicNews: News-based Short Text and Long Document Classification
Datasets in Indic Languages [0.4] L3Cube-IndicNewsは、インドの地域言語のための高品質なデータセットのキュレーションを目的とした多言語テキスト分類コーパスである。
私たちはヒンディー語、ベンガル語、マラティ語、テルグ語、タミル語、グジャラート語、カンナダ語、オディア語、マラヤラム語、パンジャービ語を含む10の著名なインド語を中心にしています。
これらのニュースデータセットはそれぞれ10以上のニュース記事のクラスで構成されている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:11:17 GMT)
Universal Approximation Theorem for Vector- and Hypercomplex-Valued
Neural Networks [0.4] 普遍近似定理(英: universal approximation theorem)は、1つの隠れた層を持つニューラルネットワークがコンパクト集合上の連続関数を近似できるという定理である。
これは、実数値ニューラルネットワークと超複素数値ニューラルネットワークに有効である。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:56:13 GMT)
LADRI: LeArning-based Dynamic Risk Indicator in Automated Driving System [0.4] 本稿では,自動運転システム(ADS)におけるリアルタイム動的リスクアセスメントのためのフレームワークを提案する。
提案手法はこれらの制限を超越し、ニューラルネットワーク(ANN)を用いてリスク次元を慎重に分析し分類する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:09:15 GMT)
Current Trends in Digital Twin Development, Maintenance, and Operation:
An Interview Study [0.3] デジタルツイン(DT)は、しばしば物理的実体と対応する仮想実体(VE)のペアリングとして定義される。
デジタル双生児の生活段階と密接に関連している産学専門職19名を対象に半構造化面接を行った。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:57:04 GMT)
Monitoring-Supported Value Generation for Managing Structures and
Infrastructure Systems [0.3] 構造的健康モニタリングと意思決定の相乗効果について考察する。
本稿では、SHMを意思決定プロセスに統合するために必要なモデルのクラスについて概説する。
我々はSHMによって生成された付加価値を定量化し、検証し、最大化するための適切な行動経路に関する視点を提供する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:14:10 GMT)
Uncertainty-Aware Deep Attention Recurrent Neural Network for
Heterogeneous Time Series Imputation [0.3] 欠落は多変量時系列においてユビキタスであり、信頼できる下流分析の障害となる。
本稿では、欠落した値とその関連不確かさを共同で推定するDeep Attention Recurrent Imputation (Imputation)を提案する。
実験の結果,実世界のデータセットを用いた多様な計算タスクにおいて,SOTAを上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:21:11 GMT)
Theory of Metastability in Discrete-Time Open Quantum Dynamics [0.2] 開系力学における準安定性は、安定状態に崩壊する前に長寿命の準安定状態への初期緩和現象を記述している。
本研究では,ターゲットシステムと純粋に強調される結合を持つアンシラ系によって誘導される,ターゲットシステム上の量子チャネルの一般クラスに着目した。
平均動力学を軌道に分解することで、興味深い準安定挙動を予測し、数値的に示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:21:00 GMT)
U-Trustworthy Models.Reliability, Competence, and Confidence in
Decision-Making [0.2] 信頼性の正確な数学的定義を$mathcalU$-trustworthinessと呼ぶ。
$mathcalU$-trustworthinessの文脈において、適切にランク付けされたモデルは本質的に$mathcalU$-trustworthyであることが証明される。
我々は、信頼度を優先する尺度として、AUCメートル法の採用を提唱する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 04:58:02 GMT)
Young's Double-Slit Interference Demonstration with Single Photons [0.0] 二重スリットを通過する単一光子の干渉は、光の波動と粒子の性質の説得力のある実証である。
本稿では,これらの課題を克服した学部教育実験室に適した卓上実験室構成を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:46:57 GMT)
Weak universality, quantum many-body scars and anomalous
infinite-temperature autocorrelations in a one-dimensional spin model with
duality [0.0] 3スピン相互作用を持つ1次元スピン-1/2$モデルと横磁場$h$について検討する。
臨界指数 $z$, $beta$, $gamma$, $nu$, そして中心電荷 $c$ を計算する。
周期境界条件を持つ系では、指数的に多くの正確な中スペクトルゼロエネルギー固有状態が存在する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:28:13 GMT)
Vietnamese Poem Generation & The Prospect Of Cross-Language Poem-To-Poem
Translation [0.0] 本研究では,大規模言語モデルを用いて,自然言語のプロンプトからベトナム語の詩を生成することを提案する。
GPT-3のバベッジ版は、ベトナム詩の「ルーク・バット」ジャンルに特化して0.8のカスタム評価スコアを達成している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:29:47 GMT)
UstanceBR: a multimodal language resource for stance prediction [0.0] この研究は、ターゲットベースの姿勢予測のためのブラジルのTwitterドメインのマルチモーダルコーパスであるUstanceBRを紹介する。
コーパスは、選択された対象トピックに対する86.8kのラベル付きスタンスと、これらのスタンスをソーシャルメディアで公開したユーザに関する広範なネットワーク情報で構成されている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:12:18 GMT)
Using Singular Value Decomposition in a Convolutional Neural Network to
Improve Brain Tumor Segmentation Accuracy [0.0] 我々は,MSVDアルゴリズムを用いて画像ノイズを低減し,深部ニューラルネットワークを用いて画像中の腫瘍を分割した。
提案手法の精度は元の画像と比較すると2.4%向上した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:57:25 GMT)
Uncertainty Relations in Pre- and Post-Selected Systems [0.0] 我々は、PPS(pre- and post-selected)システムにおける2つの非互換な可観測量に対する不確実性関係のようなRobertson-Heisenbergを導出する。
標準量子系とは異なり、PSS系は非可換可観測体のための急激な量子状態の準備を可能にする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:48:57 GMT)
Training iterated protocols for distillation of GHZ states with
variational quantum algorithms [0.0] グリーンバーガー・ホーネ・ザイリンガー状態(GHZ)を調製するための最適化蒸留方式を提案する。
GHZ状態への忠実度の増加は可能であるが、さらなる反復は忠実度を減少させる。
これらのスキームは、いくつかの種類のコヒーレントな純粋状態誤差を修正することもできる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:34:04 GMT)
Towards a Foundation Purchasing Model: Pretrained Generative
Autoregression on Transaction Sequences [0.0] 本稿では,金融取引の文脈的埋め込みを得るための生成事前学習手法を提案する。
さらに,510億の取引を含む180の発行銀行のデータコーパスを用いて,埋め込みモデルの大規模事前学習を行う。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:52:11 GMT)
Theory of Hallucinations based on Equivariance [0.0] 現代の大きな言語モデルにおける幻覚は、しばしば現実世界の社会関係の誤解に起因する。
ある種の同変言語モデルは、これらの関係を学習し理解するのに適していると提案する。
言語モデルのための幻覚尺度を作成するために,特殊なクロスエントロピー誤差関数を開発した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:49:21 GMT)
The complementary contributions of academia and industry to AI research [0.0] 過去25年間で、業界と学界が生み出したAIの影響と種類を特徴づける。
業界チームが発行する記事は注目されがちで、高い引用と引用が破壊的になる可能性が高くなる。
学術と産業のコラボレーションは、学術チームのノベルティを再現するのに苦労しており、業界チームと似ている傾向があります。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:08:13 GMT)
The Dirac Delta as a Singular Potential for the 2D Schrodinger Equation [0.0] 分布一般化量子論の枠組みにおいて、対象$Hpsi$は分布として定義される。
その重要性は数学的に厳密な方法であり、いかなる種類の正規化や正規化にも依存しない。
分布解釈は、波動関数が定義できない点で評価する必要性を解消する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:19:32 GMT)
The $k$-photon quantum Rabi model [0.0] 量子ラビモデルの一般化は、2レベル系と放射モードの間の線形(双極子)結合を置き換えることによって得られる。
各スピンフリップが$k$光子を含む場合、「$k$-光子」量子ラビモデルと呼ばれる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:25:50 GMT)
Taming the Beast: Fully Automated Unit Testing with Coyote C++ [0.0] Coyote C++は、CとC++用の完全に自動化されたホワイトボックスユニットテストツールである。
1時間に1万以上のステートメントのテスト速度で、ユニットテスト生成による高いカバレッジ結果を生成する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:27:23 GMT)
Sparse Quantum State Preparation for Strongly Correlated Systems [0.0] 原理として、指数関数的にスケールする多電子波関数を線形にスケールする量子ビットレジスタに符号化することは、従来の量子化学法の限界を克服するための有望な解決策を提供する。
基底状態量子アルゴリズムが実用的であるためには、量子ビットの初期化が要求される基底状態の高品質な近似に必須である。
量子状態準備(QSP)は、古典的な計算から得られる近似固有状態の生成を可能にするが、量子情報のオラクルとして頻繁に扱われる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:15:45 GMT)
Space-time generalization of mutual information [0.0] 本稿では,相互情報の自然特性を満足する空間的相互情報の一般化を提案する。
特に、Emphspace-time相互情報と呼ぶこの量は、すべての動的相関を束縛する。
本研究では,複数の環境における時空相互情報の挙動について検討し,多体ローカライズ・サーマル化システムにおいて,その長時間の挙動を対比する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:00:00 GMT)
Smoothing Methods for Automatic Differentiation Across Conditional
Branches [0.0] スムース解釈(SI)は、プログラムの出力とガウス核との畳み込みを近似し、原理的にその出力を滑らかにする。
SIと自動微分(AD)を組み合わせることで、スムーズなプログラムの勾配を効率的に計算する。
本稿では,ADとサンプリングを組み合わせたスムーズなプログラムの勾配を推定することにより,基礎となる仮定を回避する新しいモンテカルロ推定法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:17:30 GMT)
Simulation-Based Inference with Quantile Regression [0.0] 条件付き量子化回帰に基づく新しいシミュレーションベース推論(SBI)手法であるニューラル量子化推定(NQE)を提案する。
NQEは、各後次元の個々の1次元量子を自己回帰的に学習し、データとそれ以前の後次元に条件付けする。
提案手法は, 様々なベンチマーク問題に対して, 最先端性能を実現することを実証する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:53:50 GMT)
Recommendations for public action towards sustainable generative AI
systems [0.0] 本稿では,生成AIの環境フットプリントの構成要素について述べる。
これは、大規模な言語モデルのトレーニングに関連する大量のCO2排出量と水消費を強調します。
また, 環境負荷に影響を及ぼすモデルの特徴と要因についても検討した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:55:53 GMT)
Recent Developments in Quarkonium as an Open Quantum System in
Quark-Gluon Plasma [0.0] 我々は、クォークグルーオンプラズマ中のクォーコニウム力学をオープン量子系として理解する最近の進歩を概観する。
我々は、関連する輸送係数と一般化したグルーオン分布の定義と非摂動計算に焦点をあてる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:49:21 GMT)
Random Projection using Random Quantum Circuits [0.0] 大規模低ランクデータセットの次元化における局所乱数量子回路の短期的利用について検討する。
十分短い深さを持つ局所ランダム量子回路の行列表現が乱射影のよい候補であることを示す。
また、よく用いられる古典的ランダムプロジェクションに対して、量子ランダムプロジェクションの性能をベンチマークする。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:51:18 GMT)
Querying Triadic Concepts through Partial or Complete Matching of
Triples [0.0] Inverted index を用いて三重項の部分的あるいは完全マッチングを通じて三重項概念を問合せする新しい手法を提案する。
私たちのソリューションは優れた効率を示すが、スケーラビリティの向上も強調しており、ビッグデータのシナリオに適しています。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:44:12 GMT)
Quantum 2-SAT on low dimensional systems is $\mathsf{QMA}_1$-complete:
Direct embeddings and black-box simulation [0.0] 量子満足度問題は、各制約が$k$-dimensionalと$l$-dimensionalのquditペアに作用し、$(k,l)$-QSATと表される。
最初の結果は、qubits上のQSATが$mathsfQMA_1$-hardであり、$(2,5)$-QSATは$mathsfQMA_1$-completeであることを示している。
2つ目の結果はブラックボックス還元による:$d'$-dimensional qudits上の任意の1Dハミルトニアン$H$を与えられる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:19:44 GMT)
Quantitative Technology Forecasting: a Review of Trend Extrapolation
Methods [0.0] 我々は、トレンド外挿技術の適用に対処する文献の予測技術について、体系的なレビューを行う。
機械学習ベースのハイブリッドモデルのような新しい手法が近年出現している。
ハイブリッドモデルが従来の手法よりも優れているかどうかを判断するためには、より多くの努力と証拠が必要であるため、技術予測へのハイブリッドモデルの開発と適用の傾向が拡大すると予想している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:41:08 GMT)
Predicting Future States with Spatial Point Processes in Single Molecule
Resolution Spatial Transcriptomics [0.0] ショウジョウバエの胚発生過程において,前葉から後葉(AP)および背側から腹側へ(DV)軸に発現するSog-D遺伝子(活性細胞)が発現する細胞の将来の分布を予測するために,ランダムフォレスト回帰に基づくパイプラインを導入する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:37:56 GMT)
Physics-informed neural network for modeling dynamic linear elasticity [0.0] 本研究では,動的環境下での材料識別にPINNモデルを効果的に利用する方法を示す。
PINNモデルは正確で、堅牢で、計算的に効率的であることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:00:00 GMT)
Photocounting measurements with dead time and afterpulses in the
continuous-wave regime [0.0] 連続波検出は、所定の測定時間窓内のクリック型検出器からの光電流の計数パルスを仮定する。
対応する量子測光公式を導出し、その妥当性を実験的に検証する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:36:26 GMT)
Perceptions of Humanoid Robots in Caregiving: A Study of Skilled Nursing
Home and Long Term Care Administrators [0.0] 著者らは、施設内でのヒューマノイドロボットの使用に関する視点を理解するために、老人ホームの幹部を調査した。
その結果、幹部たちはロボティクスなどの他の治療の道を探ることに熱心だったことが判明した。
エンゲージメントの改善やスタッフサポートなどのメリットを認めながら、コスト、人間との相互作用への影響、ロボットの有効性への疑念は継続する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 07:26:52 GMT)
Packaged Cryogenic Photon Pair Source Using an Effective Packaging
Methodology for Cryogenic Integrated Optics [0.0] この方法は、あらゆる統合光学研究所で利用可能な機器と技術のみを必要とする。
次に, シリコンリング共振器を用いて低温下での単一光子対の測定を行った。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:27:56 GMT)
Novel End-to-End Production-Ready Machine Learning Flow for
Nanolithography Modeling and Correction [0.0] 最先端の研究は、ランタイムと計算能力を減らすために機械学習(ML)技術を模索した。
本稿では,ML-RETの修正が可能な,スケーラブルなエンドツーエンドフローを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:53:43 GMT)
MobileAgent: enhancing mobile control via human-machine interaction and
SOP integration [0.0] 大規模言語モデル(LLM)は、ユーザのためのモバイルデバイス操作を自動化できるようになった。
パーソナライズされたユーザデータに関するプライバシー上の懸念は、モバイル操作中に発生し、ユーザ確認が必要になる。
エージェントと人間間の対話的なタスクを設計し、機密情報を識別し、パーソナライズされたユーザニーズに合わせる。
提案手法は,複数ステップのタスクにまたがる30Kのユニークな命令を含む新しいデバイス制御ベンチマークであるAitWで評価される。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:44:42 GMT)
Memory, Consciousness and Large Language Model [0.0] 本稿では,大言語モデルとTulvingの記憶理論の双対性の存在を示唆する仮説を提案する。
検索におけるTulvingの相乗的エコフォリーモデル(SEM)と,LLMで観測された創発的能力の対応性について検討した。
意識はこの双対性に基づく創発的能力の一形態と考えられるかもしれないと推測する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 19:44:03 GMT)
Measurement-induced bistability in the excited states of a transmon [0.0] トランスモンの |g>, |e>, |f> 状態における高出力測定によるキャビティ応答について検討した。
すべての状態が特定の臨界値を超える光子遮断を示すが、これは以前にも理解されていた現象である。
測定誘起状態遷移(MIST)から高レベルのトランスモン状態への遷移は、安定性の1つとして期待される。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:25:05 GMT)
Measurement-Induced Quantum Synchronization and Multiplexing [0.0] 我々は、この量子現象が起こるための一般的な基準を定式化し、同期化現実化の数は、まったく制御できないことを実証する。
測定誘起同期は、量子重畳を利用する真の非古典的な同期形式として現れる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:31:21 GMT)
Maximizing the Purity and Heralding Efficiency of Down-Converted Photons
Using Beam Focal Parameters [0.0] 自発パラメトリックダウン変換は量子フォトニック状態の共通源である。
ポンプモードと信号とアイドラー収集モードのビーム幅を調整することで、音源特性を最適化できることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 15:39:28 GMT)
Matrix product state ansatz for the variational quantum solution of the
Heisenberg model on Kagome geometries [0.0] 本研究では密度行列再正規化グループ(DMRG)アルゴリズムにインスパイアされた量子回路アンサッツを開発する。
我々のDMRG-VQEハイブリッドアルゴリズムは、現実的な誤差率で、強い相関関係を持つシステムに対して良い結果をもたらす。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:53:47 GMT)
Liouvillian Dynamics of the Open Schwinger Model: String Breaking and
Kinetic Dissipation in a Thermal Medium [0.0] シュウィンガーモデル内の弦破れ力学を考察し, 熱媒体内部の変形について検討する。
我々はリンドブラッド方程式のリウヴィリアンギャップと系のフォン・ノイマンエントロピーの時間依存性を分析する。
オープンシュウィンガーモデルのリウヴィリア動力学が量子コンピュータ上でどのようにシミュレートできるかを論じる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 05:35:27 GMT)
Kernel Search approach to solve the Minimum Spanning Tree Problem with conflicting edge pairs [0.0] 本稿では,カーネルサーチ手法を用いて,最小スパンニング木問題と競合を解消する。
このアプローチの主な新規性は、アルゴリズム内でコンフリクトグラフの独立したセットを使用することである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:10:39 GMT)
Interspecies F\"orster resonances of Rb-Cs Rydberg $d$-states for
enhanced multi-qubit gate fidelities [0.0] ルビジウムとセシウムのRydberg $d$-state間の種間相互作用の解析を行った。
我々は、最も強い種間結合を提供するF"オースター共鳴チャネルを特定し、高忠実度2ビットおよび多ビットの$C_kZ$ゲートの実行可能性を示す。
以上の結果から、$d$状態軌道は、$s$状態と比較して種内結合の抑制を増強し、大規模な中性原子量子プロセッサでの使用に適していることが示された。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:55:44 GMT)
Integration of physics-informed operator learning and finite element
method for parametric learning of partial differential equations [0.0] 本稿では,偏微分方程式の解法として物理インフォームド・ディープラーニング手法を用いる手法を提案する。
その焦点は、相コントラストが顕著である不均一固体中の定常熱方程式である。
提案手法を標準有限要素法と比較し,正確かつ高速な予測法を示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:01:54 GMT)
Improving automatic detection of driver fatigue and distraction using
machine learning [0.0] 運転者の疲労と注意をそらした運転は交通事故の重要な要因である。
本稿では,視覚に基づくアプローチと機械学習に基づくアプローチを用いて,疲労と注意をそらした運転行動の同時検出手法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 06:33:46 GMT)
Image-based Deep Learning for Smart Digital Twins: a Review [0.0] スマートデジタルツイン(SDT)は、複雑な物理的システムの振る舞いを仮想的に再現し、予測するためにますます利用されている。
ディープラーニング(DL)モデルは、SDTの機能を大幅に強化した。
本稿では,画像ベースSDTの開発における様々なアプローチと課題について論じる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:17:25 GMT)
Identifying Risk Patterns in Brazilian Police Reports Preceding
Femicides: A Long Short Term Memory (LSTM) Based Analysis [0.0] フェミサイド(Femicide)は、親密なパートナーや家族によってしばしば強姦される女性の犠牲者を殺害することであり、また性による暴力とも関係している。
本研究では,殺人前のブラジル警察報告における行動パターンの同定にLSTM(Long Short Term Memory)を用いた。
最初の目的は、これらの報告の内容を、被害者が殺害されるリスクの低いか高いかを示すものとして分類し、精度を66%にすることであった。
第2のアプローチでは、パターン化されたイベントのシーケンス内で、被害者が次に経験する可能性のあるアクションを予測するモデルを開発した。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 23:05:39 GMT)
How do media talk about the Covid-19 pandemic? Metaphorical thematic
clustering in Italian online newspapers [0.0] このコントリビューションは、イタリアのオンライン新聞で新型コロナウイルス(COVID-19)危機の最初の数ヶ月の具体的言語に関する研究結果を示す。
我々は、2020年春のパンデミックに対する政府の対応の第1、第2段階でジャーナリストが使用する話題や比喩的な言葉を対比する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:32:06 GMT)
Generating synthetic data for neural operators [0.0] 本稿では,PDEを数値的に解く必要のない合成機能トレーニングデータを生成するための新しい手法を提案する。
アイデアは単純だが,古典的な数値解法に依存しないニューラルPDE解法の開発の可能性を広げることを期待している。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:31:21 GMT)
Fast Certification of Vision-Language Models Using Incremental
Randomized Smoothing [0.0] 私たちはCLIPのようなオープン語彙モデルの高速認証手法であるOpen Vocabulary Certification (OVC)を紹介した。
OVCは、新しいプロンプトを持つ分類器が、ベーストレーニングセット内の近くの分類器の摂動バージョンと見なせるという観察に依存している。
CIFAR-10およびImageNetテストデータセット上で、複数の視覚言語バックボーンを用いた実験評価により、OVCの有効性を実証する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:54:46 GMT)
Fast & Fair: Efficient Second-Order Robust Optimization for Fairness in
Machine Learning [0.0] 本研究は、より公平なディープニューラルネットワーク(DNN)を開発するための敵の訓練手法を探求する。
DNNは、人種や性別などのセンシティブな属性に対する偏見を継承する可能性があるため、人生を変える結果につながる可能性がある。
本稿では,複数のデータセットの公平性を向上できるロバストな最適化問題を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:02:55 GMT)
FairGridSearch: A Framework to Compare Fairness-Enhancing Models [0.0] 本稿では、二項分類に焦点を当て、公平性向上モデルを比較するための新しいフレームワークであるFairGridSearchを提案する。
この研究は、FairGridSearchを3つの一般的なデータセット(Adult, COMPAS, German Credit)に適用し、計量選択、基底推定器の選択、分類しきい値がモデルフェアネスに与える影響を分析する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 10:29:02 GMT)
Estimating the link budget of satellite-based Quantum Key Distribution
(QKD) for uplink transmission through the atmosphere [0.0] 本書は、インドにおける3つの異なる地上局を、アップリンクベースの量子通信に利用することの実用性について考察する。
インドの様々な地理的地域の大気条件をシミュレートし、各地域で専用のリンク予算分析を行う。
その結果,IAO Hanleサイトは他の2つのサイトと比較して,アップリンクベースのQCの方が適していることがわかった。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:47:58 GMT)
Entropy and the Kullback-Leibler Divergence for Bayesian Networks:
Computational Complexity and Efficient Implementation [0.0] 我々は、最も一般的な分布仮定の下で、シャノンのエントロピーと BN に対するクルバック・リーバーの発散を計算する方法を示す。
ガウス BN に対して、KL の計算複雑性を立方体から二次体に還元できることが示されている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:23:10 GMT)
Entanglement spectra of non-chiral topological (2+1)-dimensional phases
with strong time-reversal breaking, Li-Haldane state counting, and PEPS [0.0] 有限周長円筒上での低層交絡スペクトル(ES)について検討した。
一部のPEPS状態はキラルではない(すなわち、キラル中心電荷がゼロである)が、反射と同様に時間反転を強く損なう。
これは、左右に動くキラリティーの枝を持つESに繋がるが、非常に異なる速度を持つESに繋がる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:35:38 GMT)
Energy densities in quantum mechanics [0.0] まず、スピン=$frac12$粒子の基本的な相対論的記述から始める: ディラックの方程式。
局所保存された非相対論的エネルギー密度は、テレツキー・マルゲナウ・ヒル準確率によって定義される。
我々は、非相対論的極限において有限であり、残りのエネルギーから出現し、(別々に)局所的に保存される新しいスピン関連エネルギーの形式を見つける。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 13:56:38 GMT)
Does the Hamiltonian determine the tensor product structure and the 3d
space? [0.0] ヒルベルト空間のテンソル積構造がハミルトニアンスペクトルによって一意に決定されることが提案された。
任意の方法が無限に多くのテンソル積構造をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:32:25 GMT)
Dissipative Dynamics of Graph-State Stabilizers with Superconducting
Qubits [0.0] 本研究では,クラウドを介してアクセス可能な超伝導量子ビットデバイスに焦点をあてて,多粒子交絡状態の雑音的進化について検討する。
拡張マルコフ環境を用いたチャージパリティ分割のモデル化手法を提案する。
基礎となる多体力学は、量子誤差補正の文脈で広く用いられる安定化器の崩壊と復活を生じることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 14:54:04 GMT)
Dequantizing the Quantum Singular Value Transformation: Hardness and
Applications to Quantum Chemistry and the Quantum PCP Conjecture [0.0] 量子特異値変換は効率的に「等化」できることを示す。
逆多項式精度では、同じ問題がBQP完全となることを示す。
また、この分位化手法が中心量子PCPの進展にどう役立つかについても論じる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 01:25:30 GMT)
DISO: A Domain Ontology for Modeling Dislocations in Crystalline
Materials [0.0] 本稿では, 結晶材料の線形欠陥に関する概念と関係を定義した転位オントロジー(DISO)を紹介する。
DISOの2つの潜在的なユースケースは、転位ダイナミクス領域におけるその有用性を示すために提示される。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 21:06:28 GMT)
Creation of coherent superpositions of Raman qubits by using dissipation [0.0] 3つの状態のランダ量子系の基底状態の間に、中間状態が崩壊するコヒーレントな重ね合わせを作る方法を示す。
この考え方は、2つの基底状態によって形成される明るい状態の人口を、人口減少チャンネルを通じて減少させることである。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 20:52:14 GMT)
Correctness Comparison of ChatGPT-4, Bard, Claude-2, and Copilot for
Spatial Tasks [0.0] 本研究では、4つの著名なAIチャットボットに割り当てられた54の空間的タスクに対する応答の正しさを評価する。
ChatGPT-4は空間リテラシー、GIS理論、プログラミング言語と関数の解釈に優れていたが、マッピング、コード生成、コード翻訳の弱点が明らかになった。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 18:43:26 GMT)
Bridging Modalities: Knowledge Distillation and Masked Training for
Translating Multi-Modal Emotion Recognition to Uni-Modal, Speech-Only Emotion
Recognition [0.0] 本稿では、マルチモーダル感情認識モデルをより実践的なユニモーダルモデルに変換するという課題に対処する革新的なアプローチを提案する。
音声信号から感情を認識することは、人間とコンピュータの相互作用、感情コンピューティング、メンタルヘルスアセスメントにおける重要な課題である。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 22:42:14 GMT)
Beyond Extraction: Contextualising Tabular Data for Efficient
Summarisation by Language Models [0.0] Retrieval-Augmented Generation アーキテクチャの従来の利用は、様々な文書から情報を取得するのに有効であることが証明されている。
本研究では,RAGに基づくシステムにおいて,複雑なテーブルクエリの精度を高めるための革新的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 16:16:14 GMT)
Automated Test Production -- Systematic Literature Review [0.0] 本総説は,コンピュータプログラムの自動テスト生産に関する主な貢献を明らかにすることを目的としている。
その結果、包括的な分析と洞察によって、適用性を評価することが可能になる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 02:21:18 GMT)
Automated Test Production -- Complement to "Ad-hoc" Testing [0.0] 本稿では,テストの適用方法と手法について論じるとともに,産業界が学界で観察される進歩の採用を困難にしている理由について述べる。
ソリューションの探索において、私たちが従おうとするアプローチについて、簡単に指摘します。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:29:26 GMT)
Approximation of multipartite quantum states: revised version with new
applications [0.0] 有限エネルギーを持つ任意の多部状態に対して、$pi$-絡み合いの相対エントロピーの定義における無限小は有限エネルギーを持つ有限分解可能な$pi$-分離状態の集合に乗じることができることを示す。
また、有限エネルギーを持つ任意の多部状態に対して、$pi$-エンタングルメントの相対エントロピーの定義における無限小は有限エネルギーを持つ有限分解可能な$pi$-分離状態の集合に乗じることができることを示す。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:59:01 GMT)
Adaptive Differential Privacy in Federated Learning: A Priority-Based
Approach [0.0] フェデレートラーニング(FL)は、ローカルデータセットに直接アクセスせずにグローバルモデルを開発する。
DPはパラメータに一定のノイズを加えることで、プライバシーを保証するフレームワークを提供する。
本稿では,特徴量の相対的重要度に基づいて入射雑音の値を決定するFLの適応雑音付加法を提案する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 03:01:15 GMT)
ACP-ESM: A novel framework for classification of anticancer peptides
using protein-oriented transformer approach [0.0] 抗がんペプチド (ACP) は、がん研究や治療の分野で大きな注目を集めている分子である。
ACPはアミノ酸の短鎖であり、タンパク質の構成要素であり、がん細胞を選択的に標的にし、殺傷する能力を持っている。
ACPは癌治療の候補として検討されている。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 08:19:27 GMT)
A simple quantum picture of the relativistic Doppler effect [0.0] 相対論的ドップラー効果は、異なる慣性参照フレームの観測者が空間と時間が異なる経験をするという事実に由来する。
本稿では,相対論的ドップラー効果に対する局所的なアプローチについて述べる。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 09:57:21 GMT)
A noise-limiting quantum algorithm using mid-circuit measurements for
dynamical correlations at infinite temperature [0.0] 中間回路計測とフィードフォワードで構築した量子チャネルを導入する。
分極チャネルの存在下では、大きな深さ制限で意味のある非ゼロ信号を表示する。
本稿では,量子チャネルの耐雑音性について紹介する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 11:25:04 GMT)
A Unified Scheme of Central Symmetric Shape-Invariant Potentials [0.0] 角運動量(英: Angular momentum)は、中心力の下で粒子が動くときに遠心電位に現れる保存量である。
この研究は、$ell$が統一的な役割を果たす形式主義を導入し、中心ポテンシャルを超ポテンシャルに統合する。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 12:07:38 GMT)
A Semi-classical Spacetime Region with Maximum Entropy [0.0] 4次元球対称な静的時空領域を半古典的アインシュタイン方程式における量子の集まりと考える。
熱力学との局所的整合性を考慮したWKB法におけるエントロピーを推定し,その上界を求める。
論文参考訳(メタデータ) (Thu, 4 Jan 2024 17:02:40 GMT)