Gemini 1.5: Unlocking multimodal understanding across millions of tokens
of context [379.4] Gemini 1.5 Pro は計算効率の良いマルチモーダル・ミックス・オブ・エキスパート・モデルである。
モダリティ間の長文検索タスクにおいて、ほぼ完璧なリコールを実現する。
Gemini 1.0 Ultraの最先端のパフォーマンスは、幅広いベンチマークで一致または上回っている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:54:20 GMT)
A Survey on Data Selection for Language Models [151.6] データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。
ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。
広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:04:01 GMT)
Structured Video-Language Modeling with Temporal Grouping and Spatial
Grounding [117.2] 簡単なビデオ言語モデリングフレームワークであるS-ViLMを提案する。
これには、学習領域オブジェクトのアライメントと時間認識機能を促進するために、クリップ間の空間的接地と、クリップ内の時間的グループ化という、2つの新しい設計が含まれている。
S-ViLMは4つの下流タスクにおいて、最先端の手法を大幅に超えている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:06:52 GMT)
RLHF-V: Towards Trustworthy MLLMs via Behavior Alignment from
Fine-grained Correctional Human Feedback [103.1] RLHF-Vは、微粒な人間のフィードバックから行動アライメントを通じてMLLMの信頼性を高める。
自動評価と人的評価の両方で5つのベンチマーク実験を行った結果、RLHF-Vはより信頼性の高いMLLM動作を可能にすることがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:42:37 GMT)
A Survey on Knowledge Distillation of Large Language Models [102.8] 知識蒸留(KD)は、高度な能力をオープンソースモデルに転送するための重要な方法論である。
本稿では,大規模言語モデル(LLM)の領域におけるKDの役割を包括的に調査する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:29:03 GMT)
VideoElevator: Elevating Video Generation Quality with Versatile
Text-to-Image Diffusion Models [94.3] テキスト間拡散モデル(T2V)は、フレーム品質とテキストアライメントがまだ遅れている。
我々は,T2Iの優れた機能を利用して,T2Vの性能を向上させる,トレーニングフリーでプラグアンドプレイの手法であるVideoElevatorを紹介した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:44:54 GMT)
DPOT: Auto-Regressive Denoising Operator Transformer for Large-Scale PDE
Pre-Training [90.8] 我々は,PDEデータに対するより安定的で効率的な事前学習を可能にする,自己回帰型事前学習戦略を提案する。
我々は,100k以上の軌道を持つ10以上のPDEデータセットに対して,最大0.5BパラメータでPDEファンデーションモデルをトレーニングする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:24:00 GMT)
LoRAMoE: Alleviate World Knowledge Forgetting in Large Language Models
via MoE-Style Plugin [85.2] ルータネットワークを用いてローランクアダプタ(LoRA)を複数導入し,それらを統合する新しいフレームワークであるLoRAMoEを提案する。
バックボーンモデルを凍結し、LoRAの一部をダウンストリームタスクの解決に世界の知識を活用することに集中させます。
実験の結果、命令データが増加するにつれて、LoRAMoEは下流タスクの処理能力を大幅に改善できることがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:13:54 GMT)
Benchmarking and Defending Against Indirect Prompt Injection Attacks on
Large Language Models [83.0] 大規模な言語モデルと外部コンテンツの統合は、間接的にインジェクション攻撃を行うアプリケーションを公開する。
本稿では,BIPIAと呼ばれる間接的インジェクション攻撃のリスクを評価するための最初のベンチマークについて紹介する。
我々は,素早い学習に基づく2つのブラックボックス法と,逆行訓練による微調整に基づくホワイトボックス防御法を開発した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:58:48 GMT)
Bayesian Preference Elicitation with Language Models [82.6] 本稿では,BOEDを用いて情報的質問の選択を案内するフレームワークOPENと,特徴抽出のためのLMを紹介する。
ユーザスタディでは,OPEN が既存の LM- や BOED をベースとした選好手法よりも優れていることが判明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:57:52 GMT)
Unfamiliar Finetuning Examples Control How Language Models Hallucinate [80.5] 大規模言語モデル(LLM)は、可聴性に富むが、実際には正しくない応答を生成する傾向にある。
我々は,長期化タスクに対する幻覚をより確実に緩和するRLアプローチを開発した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:28:13 GMT)
Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.4] 教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:18:04 GMT)
CtlGAN: Few-shot Artistic Portraits Generation with Contrastive Transfer
Learning [77.3] CtlGANは、新しいコントラッシブ・トランスファー学習戦略を備えた、数発のアート・ポートレート生成モデルである。
ソースドメインで事前訓練したStyleGANを,対象の芸術領域に適応させる。
実面をZ+空間に埋め込んだ新しいエンコーダを提案し,適応型デコーダに対処するためのデュアルパストレーニング戦略を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:02:59 GMT)
The Computational Complexity of Learning Gaussian Single-Index Models [77.1] 単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:50:19 GMT)
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [76.2] 基本モデルの開発により、赤外線小目標検出(ISTD)は大きな進歩を遂げた。
効率的なISTDのためのMamba-in-Mamba (MiM-ISTD) 構造を調整する。
NUAA-SIRSTとIRSTD-1kを用いた実験により,本手法の精度と効率が向上した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:20:33 GMT)
Efficient Data Collection for Robotic Manipulation via Compositional
Generalization [75.9] 視覚模倣学習政策が環境要因を構成することができるかどうかを検討する。
ポリシーは構成を示すが、実際のロボットでは、事前のロボットデータセットを活用することが重要である。
本稿では,合成を生かしたデータ収集戦略を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:15:38 GMT)
Tell, Don't Show!: Language Guidance Eases Transfer Across Domains in
Images and Videos [75.7] ラベル付きソースから未ラベルのターゲットデータへの識別的知識の堅牢な移行をドメインシフトでガイドするフレームワークであるLaGTranを紹介する。
意味的にリッチなテキストモダリティがより好ましい転送特性を持つという我々の観察に触発された我々は、ソース学習されたテキスト分類器を用いて、ターゲットテキスト記述の予測を生成するための転送機構を考案した。
言語指導による私たちのアプローチは驚くほど簡単でシンプルですが、GeoNetやDomainNetといった挑戦的なデータセットに対する以前のアプローチよりもはるかに優れています。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:58:46 GMT)
Pix2Gif: Motion-Guided Diffusion for GIF Generation [70.6] 画像からGIF(ビデオ)生成のための移動誘導拡散モデルPix2Gifを提案する。
本研究では,2種類のプロンプトに条件付きソース画像の特徴を空間的に変換する動き誘導型ワープモジュールを提案する。
モデルトレーニングの準備として、TGIFビデオキャプチャデータセットからコヒーレントな画像フレームを抽出し、精巧にデータをキュレートした。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:28:28 GMT)
Language Generation from Brain Recordings [69.0] 本稿では,大言語モデルと意味脳デコーダの容量を利用した生成言語BCIを提案する。
提案モデルでは,視覚的・聴覚的言語刺激のセマンティック内容に整合したコヒーレントな言語系列を生成することができる。
本研究は,直接言語生成におけるBCIの活用の可能性と可能性を示すものである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:23:49 GMT)
LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models [67.6] LongLoRAは、トレーニング済みの大規模言語モデルのコンテキストサイズを拡張する、効率的な微調整アプローチである。
7B/13Bから70BまでのLlama2モデル上での各種タスクに対する実験結果が強かった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:26:38 GMT)
3D Small Object Detection with Dynamic Spatial Pruning [66.5] 本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。
空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。
ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:47:44 GMT)
Provable Multi-Party Reinforcement Learning with Diverse Human Feedback [63.8] RLHF(Reinforcement Learning with Human feedback)は、モデルと人間の好みを結びつける新しいパラダイムである。
一つの報酬関数を学習しても、複数の個人の好みを捉えバランスが取れないので、従来のRLHFアプローチが失敗する可能性があることを示す。
メタラーニングを取り入れて、複数の嗜好を学習し、異なる社会福祉機能を採用して、複数のパーティにまたがる嗜好を集約する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:05:11 GMT)
Consecutive Model Editing with Batch alongside HooK Layers [63.2] COMEBA-HK は連続およびバッチをサポートするモデル編集方法である。
重みを更新したいくつかのフック層を格納するためには、少量しか必要としないため、メモリフレンドリーである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:07:44 GMT)
Hide in Thicket: Generating Imperceptible and Rational Adversarial
Perturbations on 3D Point Clouds [62.9] 3Dポイントクラウド分類のための点操作に基づくアドリアック手法により、3Dモデルの脆弱性を明らかにした。
そこで本研究では,2段階の攻撃領域探索を行うHT-ADV法を提案する。
我々は,良性再サンプリングと良性剛性変換を用いることで,不受容性への犠牲がほとんどなく,身体的敵意の強さをさらに高めることができることを示唆する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:08:06 GMT)
Out-of-Distribution Generalized Dynamic Graph Neural Network with
Disentangled Intervention and Invariance Promotion [61.8] 動的グラフニューラルネットワーク(DyGNN)は、グラフと時間力学を利用して強力な予測能力を実証している。
既存のDyGNNは、動的グラフに自然に存在する分散シフトを処理できない。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:25:50 GMT)
Debiasing Large Visual Language Models [61.7] LVLM(Large Vision-Language Models)は、コンピュータビジョンや自然言語処理において欠かせないツールとなっている。
本研究は,入力画像に先行するLarge Language Models (LLM) の影響を主に受け,生成したコンテンツに有意なバイアスが生じることを示す。
これらのバイアスを是正し、視覚情報に対するモデルの焦点をリダイレクトするために、我々は2つの単純で訓練のない戦略を導入する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:35:07 GMT)
Can Large Language Models Play Games? A Case Study of A Self-Play
Approach [61.2] LLM(Large Language Models)は、インターネットからの広範なデータを利用して、幅広い事前知識を格納する。
Monte-Carlo Tree Search (MCTS)は、信頼性の高い意思決定ソリューションを提供する検索アルゴリズムである。
この研究は、ターンベースのゼロサムゲームを効率的に解決するために、MCTSセルフプレイでLLMを活性化させる革新的なアプローチを導入している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:16:29 GMT)
Alignment Studio: Aligning Large Language Models to Particular Contextual Regulations [61.1] アプリケーション開発者が、特定の価値、社会的規範、法律、その他の規則にモデルをチューニングできるようにするアプローチを提案する。
私たちは、アライメントスタジオアーキテクチャの主要な3つのコンポーネント、フレーム、インストラクタ、そしてオーディタをレイアウトしました。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:26:49 GMT)
LLM4DyG: Can Large Language Models Solve Spatial-Temporal Problems on
Dynamic Graphs? [60.2] 本稿では,大規模言語モデルの動的グラフ上での時空間理解能力を評価することを提案する。
我々は、異なるデータ生成装置、データ統計、プロンプト技術、LLMがモデル性能に与える影響を分析する実験を行う。
最後に, LLM の時空間理解能力を高めるために, 動的グラフ上の LLM に対する Disentangled Spatial-Temporal Thoughts (DST2) を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:03:10 GMT)
Towards Implicit Prompt For Text-To-Image Models [58.9] 本稿では,テキスト・トゥ・イメージ(T2I)モデルの現状を暗黙のプロンプトに向けて強調する。
我々は、ImplicitBenchというベンチマークを示し、暗黙のプロンプトのパフォーマンスと影響について調査する。
実験結果から,T2Iモデルは暗黙のプロンプトで示される様々なターゲットシンボルを正確に生成できることがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:03:44 GMT)
MamMIL: Multiple Instance Learning for Whole Slide Images with State
Space Models [58.4] がん診断のゴールドスタンダードである病理診断は、TransformerとMIL(Multiple Case Learning)フレームワークを併用して、全スライド画像(WSI)を用いて、優れたパフォーマンスを実現している。
選択的構造化状態空間モデル(Mamba)とMILとの協調によるWSI分類のためのMamMILフレームワークを提案する。
具体的には、マンバが一方向一次元(一次元)シーケンスモデリングしか行えないという問題を解決するため、双方向状態空間モデルと2次元コンテキスト認識ブロックを革新的に導入する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:02:13 GMT)
Unlocking the Potential of Multimodal Unified Discrete Representation
through Training-Free Codebook Optimization and Hierarchical Alignment [58.3] モデル性能を向上させるためのトレーニング不要なコードブック最適化(TOC)手法を提案する。
また,情報分離とアライメントを2段階に拡張する階層的デュアル・クロスモーダル・インフォメーション・ディスタングル(H-DCID)手法も導入する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:16:47 GMT)
Improving Diffusion Models for Virtual Try-on [57.9] 衣服の忠実度を改善し,仮想試行画像を生成する新しい拡散モデルを提案する。
IDM-VTONと呼ばれる本手法は,2つの異なるモジュールを用いて衣料画像の意味を符号化する。
本稿では,一対の人着画像を用いたカスタマイズ手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:12:18 GMT)
Large Language Models to Enhance Bayesian Optimization [57.5] 本稿では,大規模言語モデル(LLM)の能力をベイズ最適化に組み込む新しいアプローチであるLLAMBOを提案する。
高いレベルでは、自然言語のBO問題を枠組み化し、LLMが歴史的評価に照らした有望な解を反復的に提案し、評価することを可能にする。
以上の結果から,LLAMBOはゼロショットウォームスタートに有効であり,サロゲートモデリングや候補サンプリングの促進,特に観察が不十分な場合の探索の初期段階において有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:23:56 GMT)
Conservative DDPG -- Pessimistic RL without Ensemble [57.4] DDPGは過大評価バイアス問題によって妨げられている。
このバイアスに対する伝統的な解決策は、アンサンブルに基づく方法を含んでいる。
本稿では,Q$-targetと行動クローン(BC)損失ペナルティを組み込んだ簡単なソリューションを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:59:38 GMT)
Spectral Invariant Learning for Dynamic Graphs under Distribution Shifts [57.2] 動的グラフニューラルネットワーク(DyGNN)は現在、動的グラフ固有の分散シフトを扱うのに苦労している。
本稿では,スペクトル領域における動的グラフの分布変化を初めて研究する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:07:23 GMT)
Tuning-Free Accountable Intervention for LLM Deployment -- A
Metacognitive Approach [55.6] 大規模言語モデル(LLM)は、自然言語処理タスクの幅広い領域にわたる変換的進歩を触媒している。
我々は,自己認識型誤り識別と訂正機能を備えたLLMを実現するために,textbfCLEARと呼ばれる革新的なテキストメタ認知手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:18:53 GMT)
Unified Batch Normalization: Identifying and Alleviating the Feature
Condensation in Batch Normalization and a Unified Framework [55.2] バッチ正規化(BN)は、現代のニューラルネットワーク設計において欠かせない技術となっている。
UBN(Unified Batch Normalization)と呼ばれる2段階統合フレームワークを提案する。
UBNは異なる視覚バックボーンと異なる視覚タスクのパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:12:57 GMT)
Structured Entity Extraction Using Large Language Models [54.5] 大規模言語モデル(LLM)は、構造化されていないテキストから構造化された情報を抽出する上で重要な役割を果たす。
本稿では,構造化エンティティ抽出における現行手法の課題と限界について考察する。
本研究では,LLMのパワーを有効・効率的に活用する新しいモデルを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:03:27 GMT)
Spectral Meets Spatial: Harmonising 3D Shape Matching and Interpolation [54.0] 本稿では,3次元形状の対応と形状の両面を統一的に予測する枠組みを提案する。
我々は、スペクトル領域と空間領域の両方の形状を地図化するために、奥行き関数写像フレームワークと古典的な曲面変形モデルを組み合わせる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:51:29 GMT)
ERASE: Error-Resilient Representation Learning on Graphs for Label Noise
Tolerance [53.7] 本稿では, ERASE (Error-Resilient representation learning on graphs for lAbel noiSe tolerancE) という手法を提案する。
ERASEは、プロトタイプの擬似ラベルとプロパゲーションされた識別ラベルを組み合わせて、表現をエラーレジリエンスで更新する。
提案手法は, 広い雑音レベルにおいて, 複数のベースラインをクリアマージンで上回り, 高いスケーラビリティを享受できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:29:44 GMT)
SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.2] 単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:14:54 GMT)
Art or Artifice? Large Language Models and the False Promise of
Creativity [53.0] 本稿では,創造性を製品として評価するTorrance Test of Creative Writing (TTCW)を提案する。
TTCWは14のバイナリテストで構成されており、Fluency、Flexibility、Originality、Elaborationの3次元に分かれている。
分析の結果,LPM生成したストーリーはプロのストーリーよりもTTCWが3~10倍少ないことが判明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:20:08 GMT)
Arbitrary-Scale Point Cloud Upsampling by Voxel-Based Network with
Latent Geometric-Consistent Learning [52.8] Voxel-based Network (textbfPU-VoxelNet) を用いた任意のスケールのクラウド・アップサンプリング・フレームワークを提案する。
ボクセル表現から継承された完全性と規則性により、ボクセルベースのネットワークは3次元表面を近似する事前定義されたグリッド空間を提供することができる。
密度誘導グリッド再サンプリング法を開発し、高忠実度点を生成するとともに、サンプリング出力を効果的に回避する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:31:14 GMT)
DepWiGNN: A Depth-wise Graph Neural Network for Multi-hop Spatial
Reasoning in Text [52.7] マルチホップ空間推論のためのDepWiGNN(Depth-Wise Graph Neural Network)を提案する。
具体的には,新しいノードメモリ方式を設計し,グラフの幅次元ではなく深さ次元の情報を集約する。
2つの挑戦的なマルチホップ空間推論データセットの実験結果から,DepWiGNNが既存の空間推論手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:16:55 GMT)
Learning Expressive And Generalizable Motion Features For Face Forgery
Detection [52.5] 本稿では,既存のビデオ分類手法に基づく,シーケンスに基づく効果的な偽造検出フレームワークを提案する。
動作特徴をより表現しやすくするために,別の動作整合ブロックを提案する。
一般的なビデオ分類ネットワークを3つの顔偽造データに対して有望な結果を達成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:25:48 GMT)
Improving Probability-based Prompt Selection Through Unified Evaluation
and Analysis [52.0] 本稿では,既存の確率ベースプロンプト選択手法を解釈し,評価する統合フレームワークを提案する。
既存の手法は入力と予測出力(MI)の相互情報を最大化する手法の変種と解釈できることがわかった。
そこで本研究では,既存の手法であるCBM(Marginalization)と呼ばれる新しい校正手法を提案し,最良の方法の迅速な選択効率を96.85%に向上させるとともに,校正を行なわない託宣F1の99.44%を達成している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:51:03 GMT)
Learning to Rematch Mismatched Pairs for Robust Cross-Modal Retrieval [49.1] 実世界のシナリオでは、大規模なマルチモーダルデータは、必然的にPMP(Partially Mismatched Pairs)を含むインターネットから収集される。
従来の取り組みでは、PMPの貢献度を下げるためのソフトな対応を推定することで、この問題を軽減する傾向があった。
我々は、ミスマッチペアの再マッチを学習する最適輸送(OT)に基づく一般的なフレームワークであるL2RMを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:09:30 GMT)
ERBench: An Entity-Relationship based Automatically Verifiable
Hallucination Benchmark for Large Language Models [48.4] 大規模言語モデル(LLM)は、様々なアプリケーションにおいて前例のない性能を達成したが、その評価は依然として重要な問題である。
既存のリレーショナルデータベースを利用することは、正確な知識記述のためにベンチマークを構築する上で有望なアプローチである、と我々は主張する。
本稿では,エンティティ・リレーショナル・モデル(ER)に基づいて,関係データベースを自動的にベンチマークに変換するERBenchを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:42:36 GMT)
Maximum Entropy Heterogeneous-Agent Reinforcement Learning [47.7] 近年,多エージェント強化学習(MARL)が協調ゲームに有効であることが示されている。
本稿では,これらの問題を解決するために,アンフィストチャスティックな政策を学習するための統一的な枠組みを提案する。
The MaxEnt framework, we propose Heterogeneous-Agent Soft Actor-Critic (HASAC) algorithm。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:07:10 GMT)
Is Cosine-Similarity of Embeddings Really About Similarity? [46.8] コサイン相似性(Cosine-similarity)は、2つのベクトル間の角度のコサイン、すなわちそれらの正規化の間のドット積である。
正規化線形モデルから導かれる埋め込みについて検討し、そこでは閉形式解が解析的洞察を促進する。
我々はコサイン相似性が任意の、したがって無意味な類似性をもたらすか分析的に導出する」。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:48:20 GMT)
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors [46.3] 本稿では,オープン語彙フレームワークを用いて複数のオブジェクトカテゴリを同時カウント可能な,より実用的なアプローチを提案する。
我々のソリューションであるOmniCountは、事前訓練されたモデルから意味的および幾何学的な洞察を用いて、ユーザが指定したオブジェクトを数えることによって際立っている。
OmniCount-191の包括的な評価は、他の主要なベンチマークとともに、OmniCountの例外的なパフォーマンスを示しています。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:38:11 GMT)
FedLoGe: Joint Local and Generic Federated Learning under Long-tailed
Data [46.3] Federated Long-Tailed Learning (Fed-LT)は、分散化されたローカルクライアントから収集されたデータが、グローバルに普及しているロングテール分布を示すパラダイムである。
本稿では、Fed-LT(FedLoGe)におけるFederated Local and Generic Model Training(FedLoGe)というアプローチを紹介し、ローカルモデルとジェネリックモデルの両方のパフォーマンスを向上させる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:37:55 GMT)
A Variational Autoencoder for Neural Temporal Point Processes with
Dynamic Latent Graphs [46.0] このような時間的ダイナミクスの混合を捕捉する新しい変分自動エンコーダを提案する。
モデルは、学習した依存性グラフを使用して、過去のイベントの非貢献的な影響を取り除くことによって、将来のイベント時間を予測する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:41:37 GMT)
BjTT: A Large-scale Multimodal Dataset for Traffic Prediction [45.8] 従来の交通予測手法は、交通トレンドを予測するために、過去の交通データに依存している。
本研究では,交通システムを記述するテキストと生成モデルを組み合わせることで,交通生成にどのように応用できるかを考察する。
本稿では,テキスト・トラフィック生成のための最初の拡散モデルChatTrafficを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:19:56 GMT)
One-Shot Sensitivity-Aware Mixed Sparsity Pruning for Large Language
Models [45.5] そこで本研究では, ヘッセン感度を意識した混合疎水性プルーニング法を, 再トレーニングを必要とせず, 最低50%の疎水性まで適用する方法を提案する。
提案手法の利点は, 空間が極めて高い場合にさらに顕著である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:01:36 GMT)
Técnicas Quantum-Inspired en Tensor Networks para Contextos Industriales [45.0] 本稿では, 産業環境とコンテキストのためのテンソルネットワークにおける量子インスパイアされたアルゴリズムと手法の適用性と実現可能性について述べる。
このような手法の限界について検討し,その潜在的な拡張性について検討する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:58:13 GMT)
Text-to-Audio Generation Synchronized with Videos [44.8] 我々は,T2AV-Benchというビデオと連携したテキスト・ツー・オーディオ生成のための画期的なベンチマークを提案する。
また,ビデオアライメントTTA生成モデル,すなわちT2AVを提案する。
ビデオデータから時間的ニュアンスを抽出し、理解するために、時間的マルチヘッドアテンショントランスフォーマーを使用します。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:27:38 GMT)
Near-Optimal Non-Parametric Sequential Tests and Confidence Sequences
with Possibly Dependent Observations [44.7] 正規混合逐次確率比テスト(USPRT)を若干修正したユニバーサルシーケンシャル確率比テスト(USPRT)を提案する。
この非常に一般的な設定においても、uSPRTは穏やかな汎用条件下で最適であることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:04:10 GMT)
Interventional Fairness on Partially Known Causal Graphs: A Constrained
Optimization Approach [44.5] 本稿では,真の因果グラフが部分的に知られている場合の介入の概念に基づく因果フェアネスを実現するための枠組みを提案する。
提案手法は、観測データとドメイン知識を組み合わせて学習できる因果DAGのクラスを用いて、公正な予測をモデル化することを含む。
シミュレーションと実世界の両方のデータセットの結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:51:42 GMT)
A Unifying Variational Framework for Gaussian Process Motion Planning [44.3] 本稿では,変分ガウス過程に基づくロボット動作計画のためのフレームワークを提案する。
我々のフレームワークは、平等ベース、不平等ベース、ソフトモーションプランニング制約を組み込む、原則的で柔軟な方法を提供します。
その結果,提案手法は成功率とパス品質のバランスが良好であることが示唆された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:16:12 GMT)
Stacking as Accelerated Gradient Descent [44.2] スタック化は、層数を徐々に増やすことで、ディープ残余ネットワークをトレーニングするテクニックである。
本稿では,積み重ねの有効性に関する理論的説明を提案する。
我々は、ある深い線形残差ネットワークに対して、スタックリングが加速トレーニングをもたらすことを証明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:23:25 GMT)
How Far Are We from Intelligent Visual Deductive Reasoning? [43.5] 私たちは、より洗練されているが探求の少ない領域である、視覚に基づく誘惑的推論を掘り下げる。
現在のSOTA VLMでは、未公表の盲点が発見されている。
LLMに適用した場合に有効な標準的な戦略は、視覚的推論タスクによってもたらされる課題にシームレスに対応しないことがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:47:08 GMT)
Follow-the-Perturbed-Leader with Fr\'{e}chet-type Tail Distributions:
Optimality in Adversarial Bandits and Best-of-Both-Worlds [43.4] 本研究では,敵対的・武装的盗賊に対するFTPL(Follow-the-Perturbed-Leader)政策の最適性について検討した。
逆条件で$mathcalO(sqrtKT)$ regretsを達成するのに十分な摂動条件を確立する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:07:26 GMT)
A Novel Nuanced Conversation Evaluation Framework for Large Language Models in Mental Health [42.7] 大規模言語モデル(LLM)のニュアンス会話能力を評価するための新しい枠組みを提案する。
そこで我々は,心理療法の会話分析文献を用いた文献から開発された,一連の定量的指標を開発した。
GPTモデルやLlamaモデルを含むいくつかの人気のあるフロンティアLCMを、検証されたメンタルヘルスデータセットを通じて評価するために、当社のフレームワークを使用します。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:46:37 GMT)
PHNet: Patch-based Normalization for Portrait Harmonization [41.9] 合成画像の一般的な問題は、前景と背景の部品の非互換性である。
本稿では,新しいパッチベース正規化ブロックと特徴抽出器からなるパッチベースの調和ネットワークを提案する。
我々のネットワークは、iHarmony4データセット上で最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:56:43 GMT)
Multipartite entanglement in the diagonal symmetric subspace [41.9] 対角対称状態に対しては、$d = 3,4 $ および $N = 3$ の有界絡みがないことを示す。
四角形の多部対角対称状態をより大きい局所次元の二部対角対称状態に写像する構成的アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:06:16 GMT)
MMoE: Robust Spoiler Detection with Multi-modal Information and
Domain-aware Mixture-of-Experts [41.8] MMoEはマルチモーダルネットワークであり、複数のモーダルからの情報を利用してロバストなスポイラー検出を容易にする。
MMoEは2つの広く使用されているスポイラー検出データセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:42:04 GMT)
PromptIQA: Boosting the Performance and Generalization for No-Reference
Image Quality Assessment via Prompts [41.6] 本稿では,PmptベースのIQA(PromptIQA)を提案する。
PromptIQAは、さまざまな要件を学習するために、2つの提案されたデータ拡張戦略を備えた混合データセットでトレーニングされている。
実験により、PromptIQAはSOTA法よりも高い性能とより優れた一般化を実現していることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:10:25 GMT)
Improving Diffusion-Based Generative Models via Approximated Optimal
Transport [41.3] 本稿では,拡散モデルを用いた新しい学習手法である近似最適輸送手法を紹介する。
トレーニングにAOTを用いることで,画像品質の向上とサンプリングステップの短縮を実現した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:43:00 GMT)
G3DR: Generative 3D Reconstruction in ImageNet [40.8] 本稿では,新しい3D生成手法であるジェネレーティブ3Dレコンストラクション(G3DR)をImageNetに導入する。
G3DRは単一画像から多種多様な高品質の3Dオブジェクトを生成することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:55:11 GMT)
DiffChat: Learning to Chat with Text-to-Image Synthesis Models for
Interactive Image Creation [40.5] DiffChatは、対話型画像生成のための、インプット・アズ・インプット・テキスト・トゥ・イメージ合成(TIS)モデルと、大規模言語モデル(LLM)を"チャット"に整合させる新しい手法である。
生のプロンプト/イメージとユーザが指定した命令が与えられた場合、DiffChatは効果的に適切な修正を行い、ターゲットのプロンプトを生成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:24:27 GMT)
Training-Free Pretrained Model Merging [40.4] 双対空間制約(MuDSC)の下でのマージという,革新的なモデルマージフレームワークを提案する。
ユーザビリティを高めるため,マルチヘッドアテンションやグループ正規化など,グループ構造への適応も取り入れた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:33:32 GMT)
Profile of Vulnerability Remediations in Dependencies Using Graph
Analysis [40.4] 本研究では,グラフ解析手法と改良型グラフ注意畳み込みニューラルネットワーク(GAT)モデルを提案する。
制御フローグラフを分析して、脆弱性の修正を目的とした依存性のアップグレードから発生するアプリケーションの変更をプロファイルします。
結果は、コード脆弱性のリレーショナルダイナミクスに関する微妙な洞察を提供する上で、強化されたGATモデルの有効性を示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:01:47 GMT)
Harnessing Multi-Role Capabilities of Large Language Models for
Open-Domain Question Answering [40.3] オープンドメイン質問応答 (ODQA) は情報システムにおいて重要な研究スポットライトとなっている。
本稿では,ODQA処理をクエリ拡張,文書選択,回答生成という3つの基本ステップに定式化するフレームワークを提案する。
我々は,ロールプレイングプロンプトを洗練するための新しいプロンプト最適化アルゴリズムを導入し,高品質なエビデンスと回答を生成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:09:13 GMT)
A Deep Learning Method for Classification of Biophilic Artworks [40.1] 本研究では,生物親和性アートワークの分類における深層学習手法の適用について検討する。
人間と自然との深いつながりを仮定するバイオフィリアの概念を用いて、私たちは人工的に知的なアルゴリズムを使って、芸術作品におけるバイオフィリアの特徴の根底にある様々なパターンを認識する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:45:07 GMT)
Towards a tailored mixed-precision sub-8-bit quantization scheme for
Gated Recurrent Units using Genetic Algorithms [40.0] ゲーテッド・リカレント・ユニット(GRU)は内部状態に依存しているためチューニングが難しい。
本稿では,各演算子のビット幅を独立に選択できるGRUのモジュラ整数量子化方式を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:16:13 GMT)
GEAR: An Efficient KV Cache Compression Recipefor Near-Lossless
Generative Inference of LLM [39.8] キーバリュー(KV)キャッシングは,大規模言語モデル(LLM)推論における生成速度を高速化するデファクトとなっている。
既存の方法は、重要でないトークンをドロップしたり、全てのエントリを均一に定量化することに依存している。
本稿では,高速なKVキャッシュ圧縮フレームワークであるGEARを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:48:30 GMT)
VISAGE: Video Instance Segmentation with Appearance-Guided Enhancement [39.2] オンラインビデオインスタンス (VIS) 法は、強力なクエリベースの検出器によって著しく進歩している。
しかし,これらの手法は位置情報に大きく依存していることが観察された。
本稿では,トラッカーにおける物体マッチングの鍵軸は外観情報であり,位置的手がかりが不十分な状況下では,その特徴を識別する上で非常に指導的になることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:59:20 GMT)
LLMBind: A Unified Modality-Task Integration Framework [39.0] 本稿では,大規模言語モデルとタスク固有のトークンを結合したモータリティタスク統合のための統合フレームワークを提案する。
私たちのフレームワークは、他のモダリティタスクに容易に拡張することができ、統合AIエージェントを作成する有望な可能性を示している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:47:32 GMT)
Molecular De Novo Design through Transformer-based Reinforcement
Learning [38.8] 分子デノボ設計のためのトランスフォーマーを用いた生成モデルを微調整する手法を提案する。
提案手法は, 種々の生物標的に対して活性を示すと予測された化合物の生成において, 優れた性能を示す。
本手法は, 足場ホッピング, 単一分子からのライブラリ拡張, 生物標的に対する高い活性の化合物の生成に有効である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:54:25 GMT)
CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction
Model [37.8] 本稿では,高忠実度フィードフォワード画像から3次元画像生成モデルを提案する。
ネットワーク設計に幾何学的事前情報を統合する必要性を強調した。
我々のモデルは、テストタイムの最適化なしに、画像から10秒で高忠実なテクスチャメッシュを提供する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:25:29 GMT)
SecGPT: An Execution Isolation Architecture for LLM-Based Systems [37.5] SecGPTは、サードパーティアプリの実行に伴うセキュリティとプライバシの問題を軽減することを目的としている。
我々はSecGPTをいくつかのケーススタディアタックに対して評価し、多くのセキュリティ、プライバシ、安全性の問題から保護されていることを実証する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:02:30 GMT)
Out-of-Distribution Generalized Dynamic Graph Neural Network for Human
Albumin Prediction [37.3] 本稿では,ヒトアルバム予測のための動的グラフニューラルネットワークとして,Out-of-Distribution Generalized Dynamic Graph Neural Networkを提案する。
まず,人間のアルブミン予測を動的グラフ回帰問題としてモデル化し,ダイナミックスと患者関係をモデル化する。
最後に、モデルが予測を行うために不変パターンに依存することを奨励する不変動的グラフ回帰法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:49:24 GMT)
Tapilot-Crossing: Benchmarking and Evolving LLMs Towards Interactive
Data Analysis Agents [37.1] 本稿では,対話型データ解析におけるLarge Language Model (LLM) エージェントの評価のための新しいベンチマークであるTapilot-Crossingを紹介する。
タピロット・クロッシングは経済的なマルチエージェント環境であるDecision Companyによって建設され、人間の努力は少ない。
本稿では, LLM エージェントが成功した歴史から学ぶための自己生成リフレクション戦略である Adaptive Interaction Reflection (AIR) を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:34:20 GMT)
REPS: Reconstruction-based Point Cloud Sampling [37.1] ディープ・ダウンサンプリング法は、ジェネレーティブ・ベースとスコア・ベースという2つの主要なタイプに分類される。
本稿では,再構築に基づくスコアリング戦略であるREPSを提案する。
本手法は, サンプリングした点雲の構造的特徴を保存するための従来の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:48:56 GMT)
CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion [37.0] テキストと画像の拡散性能を向上させる革新的なカスケードフレームワークであるCogView3を提案する。
CogView3は、テキスト・ツー・イメージ生成の領域でリレー拡散を実装する最初のモデルである。
実験の結果,現在最先端のオープンソーステキスト・画像拡散モデルであるSDXLを,人間による評価では77.0%上回った。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:32:50 GMT)
InstructGIE: Towards Generalizable Image Editing [36.9] 一般化ロバスト性を高めた新しい画像編集フレームワークを提案する。
このフレームワークには、VMamba Blockを利用して、画像編集タスクに特別に最適化されたモジュールが組み込まれている。
また、生成された画像の劣化した詳細に対処し、修正するために特別に設計された、選択的な領域マッチング技術も披露する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:43:04 GMT)
Looking Ahead to Avoid Being Late: Solving Hard-Constrained Traveling
Salesman Problem [36.9] そこで本稿では,TSP と Time Windows (TSPTW) の正当性を改善するために,ルックアヘッド情報を用いた新しい学習手法を提案する。
多様なデータセットに関する包括的な実験により、MUSLAは既存のベースラインを上回り、一般化可能性を示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:49:21 GMT)
From CLIP to DINO: Visual Encoders Shout in Multi-modal Large Language
Models [36.4] 大規模言語モデル(MLLM)における視覚エンコーダの有効性について検討する。
以上の結果から,CLIPの浅層構造は,接地や領域理解といったきめ細かいタスクに特に有利であることがわかった。
我々は,CLIPとDINOをMergingと統合したシンプルな機能統合戦略であるCOMMを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:49:12 GMT)
Multi-View Causal Representation Learning with Partial Observability [36.4] 同時に観察された視点から学習した表現の識別可能性を研究するための統一的な枠組みを提案する。
任意のビューのすべてのサブセット間で共有される情報は、コントラスト学習を用いてスムーズなビジェクションまで学習できることを実証する。
数値、画像、マルチモーダルデータセットに関する我々の主張を実験的に検証する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:43:50 GMT)
Observation of Nonlinear Response and Onsager Regression in a Photon
Bose-Einstein Condensate [36.1] 量子回帰定理は、2つの異なる時間における系の相関が平均値の時間応答と同じ運動方程式によって制御されていることを述べる。
ここでは,光子ボース・アインシュタイン凝縮体中の2時間粒子数相関が,色素分子浴の急激な摂動に対する凝縮物の応答と同じダイナミクスを示すことを実験的に実証した。
これは量子気体の回帰定理を確認し、さらに、摂動が浴槽に作用し、凝縮反応のみが監視される非伝統的な形でこの関係のテストを確立する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:21:38 GMT)
Noise Level Adaptive Diffusion Model for Robust Reconstruction of
Accelerated MRI [35.7] 実世界のMRIは、熱ゆらぎによる固有のノイズを既に含んでいる。
一般的なシナリオは、既存の拡散モデルに基づく再構築手法の準最適性能や完全な失敗につながる可能性がある。
そこで本研究では,Nila-DC (NoIse Level Adaptive Data Consistency) を用いた後方サンプリング手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:07:18 GMT)
Medical Speech Symptoms Classification via Disentangled Representation [35.6] 本稿では,DRSC という医療用音声分類モデルを提案する。
本モデルでは,25種類の医学症状を平均95%の精度で検出する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:42:34 GMT)
RIS-empowered Topology Control for Distributed Learning in Urban Air
Mobility [35.0] アーバン・エアモビリティ(UAM)は、輸送システムの革命として想定される、地上から地上に近い空間に車両を拡大する。
この課題を克服するために、リソース制限されたデバイスが協調的に深層学習(DL)を行うことを可能にするために、フェデレーション・ラーニング(FL)や他の協調学習が提案されている。
本稿では,分散学習を支援する再構成可能なインテリジェントサーフェス (RIS) について検討する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:05:50 GMT)
Bias-Augmented Consistency Training Reduces Biased Reasoning in
Chain-of-Thought [35.0] 思考の連鎖は、モデルの振る舞いに影響を与える要因を誤って表現する。
バイアス強化された一貫性トレーニングは、モデルにバイアスのないプロンプト間で一貫した推論を与えるように訓練する。
BCTをGPT-3.5-Turboに1つのバイアスで適用することで、保留タスクにおいてバイアス付き推論の率を86%削減できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:41:42 GMT)
SplAgger: Split Aggregation for Meta-Reinforcement Learning [34.6] ブラックボックスメソッドは、オフザシェルフシーケンスモデルをエンドツーエンドでトレーニングすることで実現している。
タスク推論メソッドは、未知のタスク上の後方分布を明示的に推論する。
近年の研究では、タスク推論シーケンスモデルは高いパフォーマンスには必要ないことが示されている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:51:29 GMT)
Switching the Loss Reduces the Cost in Batch Reinforcement Learning [34.3] 本稿では,FQI-LOG尺度を用いた準最適政策の学習に必要なサンプル数と,最適政策の蓄積コストについて述べる。
我々は,FQI-LOGが目標を確実に達成する問題に対して,2乗損失を訓練したFQIよりも少ないサンプルを用いていることを実証的に検証した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:30:58 GMT)
Warfare:Breaking the Watermark Protection of AI-Generated Content [34.0] この目標を達成するための有望な解決策は透かしであり、サービス検証と帰属のためのコンテンツにユニークで受け入れがたい透かしを追加します。
敵が容易にこれらの透かし機構を破ることができることを示す。
両攻撃を包括的に達成するための統一的な方法論であるウォーフェアを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:58:10 GMT)
Face2Diffusion for Fast and Editable Face Personalization [33.7] 顔のパーソナライズのためのFace2Diffusion(F2D)を提案する。
F2Dの背後にある中核的な考え方は、トレーニングパイプラインからアイデンティティ非関連情報を削除することで、オーバーフィッティングの問題を防ぐことである。
F2Dは以下の3つの新しい構成要素から構成される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:46:01 GMT)
Efficient Public Health Intervention Planning Using Decomposition-Based
Decision-Focused Learning [33.1] 介入計画の高速化のために、レスレスマルチアーマッドバンド(RMAB)の構造を利用する方法を示す。
私たちはインドのNGOであるARMMANの実際のデータを使って、我々のアプローチが最先端のアプローチよりも最大2桁高速であることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:31:00 GMT)
Can we obtain significant success in RST discourse parsing by using
Large Language Models? [32.9] デコーダのみの大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)タスクに大きな影響を与えている。
本稿では,LLMがRST(Rhetorical Structure Theory)の言論解析にいかに有用かを検討する。
RST-DT, Instr-DT, GUMコーパスの3つのベンチマークデータセットによる実験結果から, ボトムアップ戦略に700億のパラメータを持つLlama 2が, 有意な差を示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:34:29 GMT)
TAIL: Task-specific Adapters for Imitation Learning with Large
Pretrained Models [32.8] TAIL(Task-specific Adapters for Learning)は,新しい制御タスクに効率的に適応するためのフレームワークである。
言語領域におけるパラメータ効率の良い微調整の最近の進歩に触発されて,効率的な微調整技術を探究する。
大規模言語条件の操作タスクにおける実験から,LoRAを用いたTAILは適応後最高の性能が得られることが示唆された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:39:39 GMT)
Aligning Large Language Models for Controllable Recommendations [32.8] 従来のレコメンデータモデルから派生したラベルを付加した教師付き学習タスクのコレクションを導入する。
そこで我々は,LLMの能力を高めるための強化学習に基づくアライメント手法を開発した。
提案手法は,高い精度性能を維持しつつ,レコメンダシステム内の命令に準拠するLLMの能力を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:23:27 GMT)
Joint control variate for faster black-box variational inference [32.4] ブラックボックスの変分推論性能は、高ばらつきの勾配推定器の使用によって妨げられることがある。
この分散は、データサブサンプリングとモンテカルロサンプリングの2つのランダム性源に由来する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:04:23 GMT)
DiffClass: Diffusion-Based Class Incremental Learning [32.3] クラスインクリメンタルラーニング(CIL)は破滅的な忘れが原因で困難である。
最近の例のないCIL手法は、過去のタスクデータを合成することによって破滅的な忘れを軽減しようとする。
そこで本研究では,これらの問題を克服するために,新しい非定型CIL法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:34:18 GMT)
Explaining Pre-Trained Language Models with Attribution Scores: An
Analysis in Low-Resource Settings [32.0] 我々は,素早いモデルから抽出した帰属スコアの妥当性と忠実度を分析した。
プロンプトパラダイムを用いることで、低リソース環境下でモデルを微調整するよりも、より妥当な説明が得られます。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:14:37 GMT)
A dynamical clipping approach with task feedback for Proximal Policy
Optimization [31.8] 最適クリッピング境界がトレーニングプロセス全体を通して一貫していることの理論的証明はない。
以前の研究では、固定された切り抜きがエージェントの探索を制限することが示唆された。
Pb-PPO(Preference based Proximal Policy Optimization)と呼ばれる新しいアルゴリズムを導入する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:37:16 GMT)
Multiple Instance Learning for Glioma Diagnosis using Hematoxylin and
Eosin Whole Slide Images: An Indian Cohort Study [31.8] 本研究は, 厳密な複数事例学習実験から得られた知見をもとに, 患者ケアを推し進めるものである。
複数のデータセットにまたがるグリオーマサブタイプ分類において、新しいパフォーマンスベンチマークを確立する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:31:58 GMT)
Be Careful What You Smooth For: Label Smoothing Can Be a Privacy Shield
but Also a Catalyst for Model Inversion Attacks [31.7] クラス表現型サンプルの生成を目的としたモデルアタック(MIA)に対するラベル平滑化の影響について検討する。
従来のラベルスムーシングはMIAを促進させ、それによってモデルのプライバシリークを増大させる。
ネガティブな要因による平滑化はこの傾向に逆らって,クラス関連情報の抽出を阻害し,プライバシ保護につながることが判明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:07:51 GMT)
Sora as an AGI World Model? A Complete Survey on Text-to-Video
Generation [31.5] 従来の生成モデルから最先端のSoraモデルへの移行に焦点を当て,テキスト・ビデオ技術の進歩を批判的に考察する。
この調査は、新参者と有能な研究者の両方を対象としたもので、テキスト・ビデオ・ジェネレーションの分野におけるさらなる革新と議論を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:58:13 GMT)
GenQ: Quantization in Low Data Regimes with Generative Synthetic Data [30.5] GenQは、高度な生成AIモデルを使用して高解像度の合成データを生成する新しいアプローチである。
データの可用性が限られている場合、実際のデータは合成データ生成プロセスのガイドに使用される。
厳密な実験を通じて、GenQはデータフリーおよびデータスカース量子化の新しいベンチマークを確立する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:15:22 GMT)
Enhancing Personality Recognition in Dialogue by Data Augmentation and
Heterogeneous Conversational Graph Networks [30.3] パーソナリティ認識は、ユーザ適応応答をカスタマイズするロボットの能力を高めるのに有用である。
この課題の1つは、既存の対話コーパスにおける話者の限られた数である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:56:57 GMT)
A Composite Decomposition Method for Large-Scale Global Optimization [30.0] グループ化の効率性と精度は最適化プロセスの性能に大きく影響した。
本稿では,GSG法をシームレスに統合したCSG法を提案する。
CSGはGSGや最先端DGシリーズの設計と比較して計算量が少なく、より正確な変数グループ化を実現している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:18:19 GMT)
Boosting Neural Representations for Videos with a Conditional Decoder [29.3] Inlicit Neural representations (INRs) は、ビデオストレージと処理において有望なアプローチとして登場した。
本稿では,現在の暗黙的ビデオ表現手法のための普遍的なブースティングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:11:05 GMT)
Unity by Diversity: Improved Representation Learning in Multimodal VAEs [29.1] ハード制約をソフト制約に置き換えることで、より優れた潜伏表現が得られることを示す。
既存の手法と比較して、学習した潜在表現の改善と欠落したデータモダリティの計算結果を示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:29:46 GMT)
Neural Network-based Two-Dimensional Filtering for OTFS Symbol Detection [29.0] OTFSシステムにおいて、オンラインサブフレームベースのシンボル検出のためのReservoir Computing (RC)ベースのアプローチが導入されている。
本稿では,OTFSシステムにおけるサブフレームに基づくオンラインシンボル検出のための2次元RC (2D-RC) 手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:33:41 GMT)
Robust Surgical Tool Tracking with Pixel-based Probabilities for
Projected Geometric Primitives [28.9] 視覚フィードバックによるロボットマニピュレータの制御には、ロボットとカメラの間の既知の座標フレーム変換が必要である。
メカニカルシステムとカメラキャリブレーションの不確かさは、この座標フレーム変換に誤りをもたらす。
画像ベース挿入軸検出アルゴリズムと確率モデルを用いて,手術用ロボットのカメラ間変換と関節角度測定誤差を推定する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:57:03 GMT)
Can LLMs Follow Simple Rules? [28.7] ルール追従言語評価シナリオ(ルール追従言語評価シナリオ、RuLES)は、大規模言語モデルにおけるルール追従能力を測定するためのフレームワークである。
RuLESは14の単純なテキストシナリオで構成され、そこではモデルがユーザと対話しながら様々なルールに従うように指示される。
現在のほとんどのモデルは、単純なテストケースであっても、シナリオルールに従うのに苦労しています。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:04:49 GMT)
A Concept-based Interpretable Model for the Diagnosis of Choroid
Neoplasias using Multimodal Data [28.6] 我々は成人で最も多い眼がんである脈絡膜新生症(5.1%)に焦点を当てた。
本研究は,3種類の脈絡膜腫瘍を識別する概念に基づく解釈可能なモデルを提案する。
注目すべきは、このモデルがブラックボックスモデルに匹敵するF1スコアの0.91を達成する一方で、ジュニア医師の診断精度を42%向上させることである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:15:53 GMT)
Invariant Aggregator for Defending against Federated Backdoor Attacks [28.4] フェデレートラーニングは、プライベートデータを直接共有することなく、複数のクライアントで高ユーティリティモデルをトレーニングすることを可能にする。
欠点として、フェデレートされた設定は、悪意のあるクライアントの存在下での様々な敵攻撃に対して、モデルを脆弱にする。
本稿では、集約された更新を一般的に有用である不変方向へリダイレクトする不変アグリゲータを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:32:07 GMT)
CriticBench: Benchmarking LLMs for Critique-Correct Reasoning [28.0] CriticBenchは、大規模言語モデルの推論を批判し修正する能力を評価するために設計されたベンチマークである。
生成, 批判, 修正推論における17個のLLMの性能を評価し, 評価した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:15:47 GMT)
Benchmarking Micro-action Recognition: Dataset, Methods, and
Applications [28.0] マイクロアクションは、低強度運動によって特徴づけられる非言語行動である。
本研究では,マイクロアクション52(MA-52)と呼ばれる新しいマイクロアクションデータセットを革新的に収集する。
MA-52は、ジェスチャー、上肢、下肢の動きを含む全身的な視点を提供する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:48:44 GMT)
SplattingAvatar: Realistic Real-Time Human Avatars with Mesh-Embedded
Gaussian Splatting [26.8] トライアングルメッシュ上に埋め込まれたガウススプラッティングと人間のアバターのハイブリッド3次元表現であるSplattingAvatarについて述べる。
SplattingAvatarは、最新のGPUで300FPS以上、モバイルデバイスで30FPS以上をレンダリングする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:28:09 GMT)
OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong
Baseline [26.4] 我々はOpenStereoと呼ばれるフレキシブルで効率的なステレオマッチングを開発する。
OpenStereoには10以上のネットワークモデルのトレーニングと推論コードが含まれている。
OpenStereoに基づいて実験を行い、元の論文で報告されたパフォーマンス指標を達成または超えた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:53:55 GMT)
Is this the real life? Is this just fantasy? The Misleading Success of
Simulating Social Interactions With LLMs [26.4] 大規模言語モデル(LLM)との社会的相互作用をシミュレートする評価フレームワークを開発した。
実験の結果,非正当性エージェントと比較して,相互行為者が社会的目標達成に成功していることが明らかとなった。
以上の結果から, 情報非対称性への対処は, LLMをベースとしたエージェントにとって依然として根本的な課題であることが示唆された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:49:17 GMT)
From Chain to Tree: Refining Chain-like Rules into Tree-like Rules on
Knowledge Graphs [26.2] 本稿では,知識グラフのツリーライクなルールの概念を提案し,適用範囲を拡大する。
本稿では,チェーンライクなルールをツリーライクなルールに書き換えるための効果的なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:55:42 GMT)
DiffuLT: How to Make Diffusion Model Useful for Long-tail Recognition [25.8] 本稿では,Long-tail (LT) 認識のための新しいパイプラインを提案する。
再重み付けや再サンプリングの代わりに、長い尾のデータセット自体を使用して、バランスの取れたプロキシを生成します。
具体的には、長い尾のデータセットに特化して訓練されたランダム拡散モデルを用いて、表現不足のクラスのための新しいサンプルを合成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:19:29 GMT)
ChatASU: Evoking LLM's Reflexion to Truly Understand Aspect Sentiment in
Dialogues [25.7] 本稿では、対話シナリオにおけるアスペクト感情を理解するLLMの能力を探求する、Chat-based Aspect Sentiment Understanding (ChatASU)タスクを提案する。
具体的には,ChatASUのバックボーンとしてChatGLMを用いた信頼自己回帰アプローチ(TSA)を提案する。
具体的には、このTSAは、ACRタスクを補助タスクとして扱い、主要なASUタスクの性能を高める。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:05:36 GMT)
Efficient and Multiply Robust Risk Estimation under General Forms of
Dataset Shift [25.5] 種々のデータセットシフト条件下で,ターゲット個体群リスクを効率的に推定する一般的な問題について検討する。
我々は, 簡易な仕様テストとともに, 効率的で頑健な推定器を開発する。
また、他の2つのデータセットシフト条件、後方ドリフトと位置スケールシフトの効率バウンダリを導出する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:11:10 GMT)
APPLE: Adversarial Privacy-aware Perturbations on Latent Embedding for
Unfairness Mitigation [25.1] 本稿では,デプロイされたセグメンタの公平性を向上する新しい手法であるAdversarial Privacy-aware Perturbations on Latent Embedding (APPLE)を提案する。
APPLEはセグメントの潜在ベクトルをデコレートし、公平性に関連する特徴をセグメントのデコーダに渡すことはできない。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:22:48 GMT)
Boosting Semi-Supervised 2D Human Pose Estimation by Revisiting Data
Augmentation and Consistency Training [25.0] SSHPEは、高度なデータ拡張と簡潔な一貫性のトレーニング方法という、2つのコアから強化できることがわかった。
本稿では,多彩なハード拡張を伴うラベルなし画像の繰り返し拡大と,連続的にマルチパス予測を生成することを提案する。
提案手法は,SOTA手法と比較して,公開データセットに大幅な改善をもたらす。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:46:23 GMT)
DuDoUniNeXt: Dual-domain unified hybrid model for single and
multi-contrast undersampled MRI reconstruction [24.9] そこで我々はDuDoUniNeXtを提案する。DuDoUniNeXtは、不在、低品質、高品質な参照画像を含むシナリオに対応可能な、統合されたデュアルドメインMRI再構成ネットワークである。
実験により,提案モデルが最先端のSCモデルとMCモデルを大幅に上回ることを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:26:48 GMT)
Towards Effective Usage of Human-Centric Priors in Diffusion Models for
Text-based Human Image Generation [24.5] バニラテキスト画像拡散モデルでは、正確な人間の画像を生成するのに苦労する。
既存のメソッドは、主に余分なイメージでモデルを微調整したり、追加のコントロールを追加することでこの問題に対処する。
本稿では,人間中心の先行概念のモデル微調整段階への直接統合について検討する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:59:32 GMT)
Decoupling Degradations with Recurrent Network for Video Restoration in
Under-Display Camera [24.3] ディスプレイ下カメラ(UDC)システムは、ディスプレイの下にレンズがマウントされるフルスクリーンディスプレイデバイスの基礎である。
本稿では,UDCシステム用に設計された新しいビデオ復元ネットワークD$2$RNetを紹介する。
ビデオ劣化要因を効果的に分離するデカップリング注意モジュール(DAM)のセットを採用している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:21:45 GMT)
Inception Attacks: Immersive Hijacking in Virtual Reality Systems [24.3] バーチャルリアリティ(VR)システムの最近の進歩は、ユーザとオンラインリソース、アプリケーション、および相互を接続する完全に没入的なインタラクションを提供する。
攻撃者がユーザーのVR環境やアプリケーションとのインタラクションを制御・操作するインセプション攻撃を導入する。
リモートサーバ、ネットワークアプリケーション、その他のVRユーザとのインタラクションはすべて、その知識なしに記録または修正することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:22:16 GMT)
PIFu for the Real World: A Self-supervised Framework to Reconstruct
Dressed Human from Single-view Images [24.1] そこで本研究では,多種多様なアプリ内画像を活用するために,セルフPIFuというエンドツーエンドのセルフ教師ネットワークを提案する。
In-theld imageでは、再構成された結果についてユーザスタディを行い、その結果の選択率は、他の最先端の方法と比較して68%以上である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:16:34 GMT)
VERVE: Template-based ReflectiVE Rewriting for MotiVational IntErviewing [24.0] VERVEはテンプレートベースの書き換えシステムである。
我々は,非反射文を優れたコンテンツ保存・反射スタイルのトレードオフを達成しつつ,より反射的な応答に変換するのに,我々の枠組みが有効であることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:29:47 GMT)
Machine Learning Security against Data Poisoning: Are We There Yet? [23.8] この記事では、機械学習モデル学習に使用されるトレーニングデータを侵害するデータ中毒攻撃についてレビューする。
基本的なセキュリティ原則を用いてこれらの攻撃を緩和するか、あるいはML指向の防御機構をデプロイするかについて議論する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:41:34 GMT)
Large-Scale Gaussian Processes via Alternating Projection [23.8] 本稿では,カーネル行列のサブブロックのみにアクセスする反復的手法を提案する。
我々のアルゴリズムは、交互プロジェクションに基づくもので、GPを非常に大きなデータセットにスケールするという現実的な課題の多くを解決し、各イテレーション時間と空間の複雑さを$mathcalO(n)で解決している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:25:44 GMT)
Towards Enhancing Time Series Contrastive Learning: A Dynamic Bad Pair
Mining Approach [23.6] 悪い正のペアは、対照的な学習を通して学んだ時系列表現の質を損なう可能性がある。
本稿では,悪い正のペアを確実に識別し,抑制する動的バッドペアマイニング(DBPM)アルゴリズムを提案する。
DBPMは、学習可能なパラメータなしで軽量なプラグインとして設計された単純なアルゴリズムである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:38:27 GMT)
ContrastDiagnosis: Enhancing Interpretability in Lung Nodule Diagnosis
Using Contrastive Learning [23.5] 臨床医のブラックボックスモデルに対する不信は、AI製品の臨床展開を妨げている。
ContrastDiagnosis(ContrastDiagnosis)を提案する。
AUCは0.977で高い診断精度を達成し、高い透明性と説明可能性を維持した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:00:52 GMT)
DeepSeek-VL: Towards Real-World Vision-Language Understanding [23.4] 本稿では、実世界のビジョンと言語理解アプリケーションのためのオープンソースのVision-Language(VL)モデルであるDeepSeek-VLを紹介する。
当社のアプローチは,3つの重要な側面に基づいて構成されています。
実際のユーザシナリオからユースケース分類を作成し、インストラクションチューニングデータセットを構築します。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:46:00 GMT)
What is different between these datasets? [23.3] 同じドメイン内の2つの同等のデータセットは、異なる分布を持つ可能性がある。
本稿では,2つのデータセットを比較するための解釈可能な手法(ツールボックス)を提案する。
我々の手法は、説明品質と正確性の観点から比較および関連するアプローチよりも優れているだけでなく、データセットの違いを効果的に理解し軽減するための実用的な補完的な洞察を提供する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:52:39 GMT)
In-n-Out: Calibrating Graph Neural Networks for Link Prediction [22.7] グラフニューラルネットワーク(GNN)は、負の予測では過信であり、正の予測では過信であることを示す。
リンク予測のためにGNNを校正する最初の方法であるIN-N-OUTを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:49:34 GMT)
Evaluating Text-to-Image Generative Models: An Empirical Study on Human
Image Synthesis [22.6] 本稿では,テキスト・ツー・イメージ(T2I)生成モデルのためのニュアンス評価フレームワークを提案する。
まず,美学やリアリズムといったイメージの質に着目し,第2に,概念のカバレッジと公平性を通じてテキストの条件を調べる。
コード、生成モデルの評価に使用されるデータ、欠陥のある領域に注釈付けされたデータセットを近くリリースします。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:41:47 GMT)
DyRoNet: A Low-Rank Adapter Enhanced Dynamic Routing Network for
Streaming Perception [22.2] Dynamic Router Network (DyRoNet)は、低ランクな動的ルーティングによってストリーミング知覚を向上するフレームワークである。
そのコア機能であるスピードルータモジュールは、入力データを最適な分岐ネットワークにインテリジェントに誘導し、パフォーマンスを最適化する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:53:53 GMT)
PEEB: Part-based Image Classifiers with an Explainable and Editable
Language Bottleneck [22.2] クラス名が不明なゼロショット設定では、PEEBはCLIPを大きなマージン(10倍精度)で上回る。
PEEBは、教師付き学習環境(88.80%の精度)の最先端技術であるだけでなく、ユーザーがクラス定義を編集して再訓練せずに新しい分類器を作成できるようにする最初の方法でもある。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:24:46 GMT)
CommitBench: A Benchmark for Commit Message Generation [22.0] 既存のデータセットはコミット選択の品質など,さまざまな問題を示す。
新しい大規模データセットであるCommitBenchをコンパイルし、データセット作成のベストプラクティスを採用しています。
私たちはCommitBenchを使って既存のモデルを比較し、他のアプローチがソースコードで事前訓練されたTransformerモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:56:45 GMT)
Towards Multimodal Sentiment Analysis Debiasing via Bias Purification [21.9] マルチモーダル・センティメント・アナリティクス(MSA)は、多様なモダリティから感情に関連する手がかりを統合することで、人間の意図を理解することを目的としている。
MSAタスクは、計画されていないデータセットバイアス、特にマルチモーダル発話レベルのラベルバイアスと単語レベルのコンテキストバイアスに悩まされる。
本稿では,従来の可能性ではなく因果関係に基づくマルチモーダル・カウンターファクト・インジェクチャ・インセプティメント分析フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:55:27 GMT)
Leveraging Continuous Time to Understand Momentum When Training Diagonal
Linear Networks [21.2] ステップサイズ$gamma$と運動量パラメータ$beta$を用いて運動量勾配勾配の解析に連続時間アプローチを用いる。
私たちは、$lambda$の小さな値がスパースソリューションの回復に役立つことを証明しています。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:21:07 GMT)
Functional Linear Regression of Cumulative Distribution Functions [21.0] 本稿では,CDFを至る所で正確に推定する機能リッジ回帰に基づく推定手法を提案する。
固定設計, ランダム設計, 対逆コンテキストの場合の$widetilde O(sqrtd/n)$の推定誤差上限を示す。
パラメータ空間が無限次元ヒルベルト空間である無限次元モデルを定式化し、この設定に対して自己正規化推定誤差上限を確立する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:50:17 GMT)
ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment [20.9] LLM(Large Language Models)とテキスト・画像拡散モデルを組み合わせた高能率大言語モデル適応器 ELLA を導入する。
提案手法は, 分割過程の異なる段階における意味的特徴に適応し, サンプリングタイムステップよりも長大かつ複雑なプロンプトを解釈する拡散モデルを支援する。
濃密なプロンプトにおけるテキスト・ツー・イメージのモデルを評価するために、1Kの濃密なプロンプトからなる挑戦的なベンチマークを導入する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:08:10 GMT)
UFORecon: Generalizable Sparse-View Surface Reconstruction from
Arbitrary and UnFavOrable Data Sets [20.8] 入力ビューの組み合わせの有効性を示すために、ビュー合成スコアを導入し、検証する。
これを実現するために、ソース画像間の相互作用とビルド相関フラストラムのモデル化にクロスビューマッチングトランスフォーマを適用した。
提案手法は,ビュー・コンビネーション・ジェネリゼーション・ジェネリザビリティにおいて,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:27:13 GMT)
Reset & Distill: A Recipe for Overcoming Negative Transfer in Continual
Reinforcement Learning [20.7] 有効な継続強化学習(CRL)アルゴリズムを開発する上での大きな障害の1つは、学習すべき新しいタスクが到着する際の負の伝達問題である。
CRLにおける負の伝達問題を克服するため, 単純かつ高効率なリセット・アンド・ディスティル法(R&D)を開発した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:37:59 GMT)
MixEHR-SurG: a joint proportional hazard and guided topic model for
inferring mortality-associated topics from electronic health records [20.6] 既存の生存モデルは、高次元データやマルチモーダルデータにスケールしないか、解釈が難しいかのいずれかである。
ヘテロジニアスEHRデータとモデル生存ハザードを同時に統合するために、MixEHR-SurGと呼ばれる教師付きトピックモデルを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:29:29 GMT)
DADIT: A Dataset for Demographic Classification of Italian Twitter Users
and a Comparison of Prediction Methods [20.6] イタリアで20万のTwitterユーザーの3000万ツイートのDADITデータセットを構築し、検証し、公開します。
DADITは、ソーシャルメディア利用者の性別や年齢を予測するために、様々な最先端モデルの性能を訓練し比較することを可能にする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:18:13 GMT)
Not just Birds and Cars: Generic, Scalable and Explainable Models for
Professional Visual Recognition [20.6] 本稿では,プロの視覚認識タスクを解くために,スケーラブルで説明可能なモデルを設計することを目的とする。
生物にインスパイアされたPro-NeXt構造を導入し、Pro-NeXtが様々な専門分野にまたがるかなりの一般化性を示すことを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:31:31 GMT)
The Behavior and Convergence of Local Bayesian Optimization [20.6] 局所最適化戦略は、従来のグローバル戦略と比較して高次元問題に対して強い経験的性能をもたらすことができる。
まず,局所的なアプローチの挙動を考察し,ガウス過程のサンプルパスの個々の局所解の統計値が,グローバルな手法から得られるであろうものと比較して驚くほど良好であることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:39:18 GMT)
Optimized View and Geometry Distillation from Multi-view Diffuser [20.5] 本研究では,2次元拡散モデルから無条件雑音を利用するUnbiased Score Distillation (USD)を提案する。
本研究では2次元拡散モデルの2段階の特殊化プロセスを開発する。
最後に,改良された多視点画像から直接忠実な形状とテクスチャを復元する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:36:58 GMT)
Balancing Act: Constraining Disparate Impact in Sparse Models [20.1] 本研究では,プルーニングの異なる影響に直接対処する制約付き最適化手法を提案する。
我々の定式化は、各部分群に対する密度モデルとスパースモデルの間の精度変化を束縛する。
実験により,本手法は大規模モデルや数百の保護されたサブグループに関わる問題に対して確実にスケール可能であることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:22:38 GMT)
EVD4UAV: An Altitude-Sensitive Benchmark to Evade Vehicle Detection in
UAV [20.0] 無人航空機(UAV)の撮影画像における車両検出は、航空写真やリモートセンシングに広く応用されている。
近年の研究では、物体に対向パッチを加えることで、よく訓練されたディープニューラルネットワークベースの物体検出器を騙すことが示されている。
UAVにおける車両検出を回避するための高度感度ベンチマークとしてEVD4UAVという新しいデータセットを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:19:39 GMT)
Beyond Finite Data: Towards Data-free Out-of-distribution Generalization
via Extrapola [19.9] ニューラルネットワークが人間のように外挿し、OODの一般化を実現するにはどうすればよいのか?
本稿では,大言語モデル(LLM)にカプセル化されている推論能力と広範な知識を活用して,完全に新しいドメインを合成する領域外挿手法を提案する。
提案手法は, VLCSなどのデータセットにおいて, 教師付き設定を約1~2%超え, 評価可能な性能を示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:44:23 GMT)
Wukong: Towards a Scaling Law for Large-Scale Recommendation [19.6] スケーリング法則はモデル品質の持続的な改善に重要な役割を果たしている。
現在までの勧告モデルは、大きな言語モデルの領域で見られるような法則を示さない。
本稿では,階層化された因子化マシンをベースとした効率的なネットワークアーキテクチャと,Wukongと呼ばれる相乗的アップスケーリング戦略を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:39:59 GMT)
CLLMs: Consistency Large Language Models [19.5] Jacobiデコーディングは、従来の自己回帰(AR)デコーディングと比較して、ほとんどスピードアップしない。
ヤコビ軌道上の任意の状態から固定点への高速収束を実現するための新しいアプローチを開発する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:13:31 GMT)
Can Large Language Models Reason and Plan? [19.2] LLMの場合、この仮定には根拠がないようである。
人間は自分自身の誤った推測を自己判断で修正する能力を示すことがあるが、LLMの場合、その仮定の根拠はないようである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:51:14 GMT)
SeeGULL Multilingual: a Dataset of Geo-Culturally Situated Stereotypes [19.0] SeeGULLは、20の言語にまたがって、23のリージョンにわたる人間のアノテーションを備えた、グローバルにスケールした、ソーシャルステレオタイプの多言語データセットである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:09:58 GMT)
DiffSF: Diffusion Models for Scene Flow Estimation [18.8] 本稿では,変圧器を用いたシーンフロー推定とデノナイズ拡散モデルを組み合わせたDiffSFを提案する。
拡散過程は, 従来の手法と比較して, 予測の堅牢性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:06:15 GMT)
AMUSE: Adaptive Multi-Segment Encoding for Dataset Watermarking [18.7] 透かし技術は、所有情報(すなわち透かし)を個々の画像サンプルに格納するために用いられる。
透かし全体をすべてのサンプルに埋め込むと、埋め込まれた情報にかなりの冗長性が生じる。
データセット透かしのためのマルチセグメント符号化復号法(AMUSE)を提案する。
次に、デコーダを使用して、抽出したサブメッセージから元のメッセージを再構築する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:02:21 GMT)
Exploring the Adversarial Frontier: Quantifying Robustness via
Adversarial Hypervolume [18.5] 本稿では,様々な摂動強度に対して総合的に深層学習モデルの頑健性を評価するための,対向超体積と呼ばれる新しい計量法を提案する。
我々は,様々な摂動強度の対向的堅牢性を均一に向上する新しいトレーニングアルゴリズムを採用する。
本研究はロバスト性の新しい尺度に寄与し、敵の脅威に対するベンチマーク評価と、現在および将来の防御モデルのレジリエンスの基準を確立する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:03:18 GMT)
FedFMS: Exploring Federated Foundation Models for Medical Image
Segmentation [18.4] Anything Model (SAM) は視覚的セグメンテーションの強力な基盤モデルとして機能し、医用画像セグメンテーションに適応することができる。
医療画像データは通常、プライバシーに敏感な情報を含んでいるため、集中的なストレージと共有で基礎モデルを訓練することは困難である。
We developed Federated Foundation model for Medical image (FedFMS) which includes the Federated SAM (FedSAM) and a communication and training- efficient SAM with Medical SAM Adapter (FedMSA)。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:06:54 GMT)
RomanSetu: Efficiently unlocking multilingual capabilities of Large
Language Models models via Romanization [18.3] ロマンティックテキストはトークンの肥大度を2x-4x削減する。
ロマンティックテキストは、様々なNLU、NLG、MTタスクにまたがるネイティブスクリプト表現にマッチまたは優れる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:04:24 GMT)
Masked Structural Growth for 2x Faster Language Model Pre-training [18.3] 我々は、小さなトランスフォーマー構造から大きな構造へと徐々に成長することで、事前学習のスピードアップに重点を置いている。
成長スケジュールの観点では、個々の次元がスケジュールの効率に与える影響は、既存の作業によって過小評価される。
本稿では, (i) 可能なすべての次元を含む成長スケジュールと, (ii) 厳密な機能保存型成長演算子を含む, マスケッド構造成長(MSG)を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:54:08 GMT)
SiamAF: Learning Shared Information from ECG and PPG Signals for Robust
Atrial Fibrillation Detection [18.0] 心房細動 (AF) は心不整脈の最も一般的なタイプである。
脳卒中、心不全、その他の心血管合併症のリスクが高まるが、臨床的には沈黙することがある。
現在のディープラーニングモデルは、心電図(ECG)または光胸波(PPG)信号のどちらかの単一のモードから学習する。
我々は,新しいSiameseネットワークアーキテクチャと共同学習損失関数を活用して,ECG信号とPSG信号の両方から学習するSiamAFという新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:11:41 GMT)
DNAct: Diffusion Guided Multi-Task 3D Policy Learning [17.6] DNActは言語条件のマルチタスクポリシーフレームワークである。
ニューラルネットワークによる事前トレーニングと拡散トレーニングを統合し、アクションシーケンス空間におけるマルチモーダル学習を強制する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:56:47 GMT)
TetraSphere: A Neural Descriptor for O(3)-Invariant Point Cloud Analysis [17.5] 我々は3次元回転と反射、すなわちO(3)作用の下で学習可能な記述子不変量を示す。
本研究では, 3次元球面ニューロンを4次元ベクトルニューロンに埋め込み, モデルのエンドツーエンドトレーニングを活用することを提案する。
以上の結果から,3次元ユークリッド空間で学習する3次元球状ニューロンの実用的価値が明らかとなった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:14:10 GMT)
EAR-Net: Pursuing End-to-End Absolute Rotations from Multi-View Images [17.4] 絶対回転推定は3次元コンピュータビジョンにおいて重要なトピックである。
深層ニューラルネットワークに基づく多視点画像から溶出回転を推定するエンド・ツー・エンド手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:42:25 GMT)
Descriptor Distillation: a Teacher-Student-Regularized Framework for
Learning Local Descriptors [17.4] 本稿では,DesDis と呼ばれるローカルな記述子学習のための記述子蒸留フレームワークを提案する。
学生モデルは、事前訓練された教師モデルから知識を得、設計された教師-学生正規化器によってさらに強化される。
3つの公開データセットによる実験結果から、同級生モデルが教師よりもはるかに優れたパフォーマンスを達成できることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:45:47 GMT)
Exploring Robust Features for Few-Shot Object Detection in Satellite
Imagery [17.2] 従来の2段階アーキテクチャに基づく数発の物体検出器を開発した。
大規模な事前訓練モデルを使用して、クラス参照の埋め込みやプロトタイプを構築する。
課題と稀なオブジェクトを含む2つのリモートセンシングデータセットの評価を行う。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:20:27 GMT)
Tracing the Roots of Facts in Multilingual Language Models: Independent,
Shared, and Transferred Knowledge [16.9] 本研究では,多言語言語モデル(ML-LM)が事実知識をどのように獲得し,表現するかを検討する。
ML-LMにおける事実の獲得と表現の3つのパターンを識別する。
本研究は,言語間における一貫した事実知識の維持という課題を浮き彫りにした。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:09:57 GMT)
RadarDistill: Boosting Radar-based Object Detection Performance via
Knowledge Distillation from LiDAR Features [16.8] RadarDistillは、LiDARデータを利用してレーダデータの表現を改善する知識蒸留(KD)手法である。
RadarDistillは、3つのキーコンポーネントを使用してLiDAR特徴の望ましい特徴をレーダー特徴に伝達することに成功した。
nuScenesデータセットの比較分析により、RadarDistillは、レーダのみのオブジェクト検出タスクに対して、最先端(SOTA)性能を達成することを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:15:48 GMT)
PipeRAG: Fast Retrieval-Augmented Generation via Algorithm-System
Co-design [16.8] PipeRAGは、生成遅延を低減し、生成品質を向上させるアルゴリズムとシステムの共同設計手法である。
評価の結果,PpipeRAGは最大2.6$times$の高速化を実現し,生成品質を向上した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:09:20 GMT)
Differentiable Learning of Generalized Structured Matrices for Efficient
Deep Neural Networks [16.5] 本稿では,高密度非構造体を所望の特性を持つ構造体に置き換えるための効率的なディープニューラルネットワーク(DNN)について検討する。
この課題は、一般的なニューラルネットワークモデルにおける最適な重み行列構造がほとんどの場合不明瞭であり、同じネットワークであっても層ごとに異なるためである。
本稿では,勾配降下による重み行列の効率的な構造を学習するための一般化および微分可能なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:13:00 GMT)
Employing Universal Voting Schemes for Improved Visual Place Recognition Performance [16.2] 本稿では,VPRアンサンブルの設定した位置検出精度を最大化する投票方式について分析する。
我々は政治や社会学などの分野で広く採用されている様々な投票方式から着想を得ている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:19:14 GMT)
HistGen: Histopathology Report Generation via Local-Global Feature
Encoding and Cross-modal Context Interaction [16.1] HistGenは、病理組織学レポート生成のための学習可能なフレームワークである。
スライド画像全体(WSI)と局所的およびグローバルな粒度からの診断レポートを整列させることで、レポート生成を促進することを目的としている。
WSIレポート生成実験の結果,提案手法は最先端モデル(SOTA)よりも大きなマージンで優れていた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:51:43 GMT)
Frequency-Adaptive Dilated Convolution for Semantic Segmentation [15.8] 本稿では、スペクトル分析の観点から、拡張畳み込みの個々の位相を改善するための3つの戦略を提案する。
周波数適応型拡張畳み込み(FADC)を導入し、局所周波数成分に基づいて空間的に拡散率を調整する。
2つのプラグインモジュールを設計し、有効帯域幅と受容フィールドサイズを直接的に拡張する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:00:44 GMT)
ChatUIE: Exploring Chat-based Unified Information Extraction using Large
Language Models [15.7] ChatUIEは、ChatGLM上に構築された革新的な統合情報抽出フレームワークである。
強化学習は、混乱と限られたサンプルを含む様々なタスクを改善し、調整するために使用される。
実験の結果,チャット能力の低下により,ChatUIEは情報抽出性能を大幅に向上できることがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:59:19 GMT)
XPSR: Cross-modal Priors for Diffusion-based Image Super-Resolution [15.7] 画像超解法では, 拡散法が注目されている。
ISRモデルでは、意味や劣化情報を知覚することは困難であり、不正確な内容や非現実的なアーティファクトによる復元画像が得られる。
拡散モデルに対する高精度かつ包括的意味条件を取得するために,テキストクロスモーダル・プライマリ・フォー・スーパー・リゾリューション(XPSR)フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:52:22 GMT)
Adaptive Split Learning over Energy-Constrained Wireless Edge Networks [15.6] 分割学習(SL)は人工知能(AI)モデルをトレーニングするための有望なアプローチであり、デバイスがサーバと協力してAIモデルを分散的にトレーニングする。
本稿では,端末の分割点を動的に選択し,無線エッジネットワークにおけるサーバの計算資源を割り当てるアダプティブスプリットラーニング(ASL)方式を設計する。
ASL方式は,既存のSL方式と比較して,平均訓練遅延とエネルギー消費をそれぞれ53.7%,22.1%削減できることを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:51:37 GMT)
DPOD: Domain-Specific Prompt Tuning for Multimodal Fake News Detection [15.6] 文脈外画像を用いたフェイクニュースが広まり、情報過負荷の時代における問題となっている。
ドメイン外データが、所望のドメインのコンテキスト外誤情報検出を改善するのに役立つかどうかを検討する。
DPOD (Domain-specific Prompt-tuning using Out-of-Domain data) と呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:39:24 GMT)
Chain of Thought with Explicit Evidence Reasoning for Few-shot Relation
Extraction [15.6] 大規模言語モデルを用いた数ショット関係抽出のための新しい手法を提案する。
CoT-ERは、タスク固有の知識と概念レベルの知識を使用して証拠を生成するために、まず大きな言語モデルを誘導する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:51:43 GMT)
Towards Multimodal Human Intention Understanding Debiasing via
Subject-Deconfounding [15.5] 本研究では,非保守的共同創設者として働く被験者の影響を抑えるために,因果介入モジュールであるSuCIを提案する。
プラグアンドプレイコンポーネントとして、SuCIは偏見のない予測を求めるほとんどの方法に広く適用することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:03:54 GMT)
Spectrum Translation for Refinement of Image Generation (STIG) Based on
Contrastive Learning and Spectral Filter Profile [15.5] 生成した画像の周波数領域における相違を緩和する枠組みを提案する。
これは、コントラスト学習に基づく画像生成(STIG)の洗練のためのスペクトル変換によって実現される。
我々は,STIGの有効性を実証するために,8つのフェイク画像データセットと様々な最先端モデルにまたがるフレームワークの評価を行った。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:39:24 GMT)
Interoperability of the Metaverse: A Digital Ecosystem Perspective
Review [15.5] その重要な役割について意見が一致しているにもかかわらず、メタバースへの影響を探るには研究のギャップがある。
本研究は,Web of Science と Scopus データベースの文献とコンテンツ分析の体系的レビューを通じて,このギャップを埋めるものである。
本研究は,メタバース相互運用研究の複雑な分野をナビゲートし,今後の調査のためのベンチマークを確立することを目的とする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:38:01 GMT)
Improved Convergence Rates of Windowed Anderson Acceleration for
Symmetric Fixed-Point Iterations [15.4] 本稿では,固定点法によく用いられるウィンドウ付きアンダーソン加速度(AA)アルゴリズムについて検討する。
異なるデータモデルを用いた実験では、AAはタイラーのM推定の標準的な固定点法よりもはるかに優れていることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:15:11 GMT)
SaGE: Evaluating Moral Consistency in Large Language Models [15.1] 我々は、最先端の大規模言語モデルでさえ、その世代において道徳的に矛盾していることを示す。
モデルの道徳的一貫性を測定するために,セマンティックグラフエントロピー(SaGE)と呼ばれる情報理論尺度を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:35:30 GMT)
PrimeComposer: Faster Progressively Combined Diffusion for Image
Composition with Attention Steering [15.1] 我々は、画像合成を主観的な局所的な編集タスクとして定式化し、前景生成にのみ焦点をあてる。
本研究では,様々なノイズレベルに対して注意制御を適切に設計することで,画像の合成を行う高速なトレーニングフリーディフューザであるPrimeComposerを提案する。
提案手法は,最も高速な推論効率を示し,定性的かつ定量的に,我々の優位性を実証する広範囲な実験を行った。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:58:49 GMT)
A Sinkhorn-type Algorithm for Constrained Optimal Transport [14.9] この研究は、等式制約と不等式制約を組み合わせた一般的なOT問題に焦点をあてる。
対応するエントロピー正規化の定式化を導出し、理論的保証によって支持される制約付きOT問題に対してシンクホーン型アルゴリズムを導入する。
全体として、この研究は、エントロピー最適輸送の最近の理論的および数値的な進歩と制約されたケースを体系的に組み合わせ、実践者は複雑なシナリオにおいて近似的な輸送計画を引き出すことができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:01:43 GMT)
Decomposing Vision-based LLM Predictions for Auto-Evaluation with GPT-4 [14.9] 世界中のCT検査の量は毎年増加しており、放射線技師のバーンアウトにつながっている。大型言語モデル(LLM)は負担軽減の可能性を秘めているが、診療所での採用は放射線技師の信頼に依存している。
我々は,CTに基づく異常の正確な要約を生成する上で,視覚言語LLMの能力を評価するための新しい評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:16:28 GMT)
Inverse Design of Photonic Crystal Surface Emitting Lasers is a Sequence
Modeling Problem [14.4] フォトニック結晶表面発光レーザー(PCSEL)の逆設計は、物理学、材料科学、量子力学の専門知識を必要とする。
高度なAI技術、特に強化学習(RL)は、この逆設計プロセスを強化し加速するための強力なツールとして登場した。
本稿では,PCSEL の逆設計をシーケンスモデリング問題として抽象化する PCSEL Inverse Design Transformer (PiT) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:38:50 GMT)
CLIP-Gaze: Towards General Gaze Estimation via Visual-Linguistic Model [13.9] 本稿では、事前学習された視覚言語モデルを用いて、その伝達可能な知識を活用するCLIP-Gazeという新しいフレームワークを提案する。
我々のフレームワークは、視線推定タスクに視覚・言語間の相互モダリティアプローチを利用した最初のものである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:37:21 GMT)
Estimating Extreme 3D Image Rotation with Transformer Cross-Attention [13.8] 画像ペアのアクティベーションマップ間の相互アテンションを計算するために,CNN特徴マップとTransformer-Encoderを利用するクロスアテンションベースのアプローチを提案する。
一般的に使用されている画像回転データセットやベンチマークに適用した場合、現代の最先端のスキームよりも優れた性能を示すことが実験的に示されている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:29:10 GMT)
Generalized Correspondence Matching via Flexible Hierarchical Refinement
and Patch Descriptor Distillation [13.8] 対応マッチングは多くのロボティクス応用において重要な役割を担っている。
本稿では,SoTA (State-of-the-art) のプラグ・アンド・プレイ対応手法であるDFM (Deep Feature Match) の限界に対処する。
提案手法は,それぞれ1,3,5画素に対する平均マッチング精度0.68,0.92,0.95の総合的な性能を実現する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:32:18 GMT)
Eigenmatrix for unstructured sparse recovery [13.8] 例えば、有理近似、スペクトル関数推定、フーリエインバージョン、ラプラスインバージョン、スパースデコンボリューションなどがある。
主な課題は、サンプル値のノイズとサンプル位置の非構造性である。
このノートは、所望の近似固有値と固有ベクトルを持つデータ駆動構成である固有行列を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:20:29 GMT)
MUC: Mixture of Uncalibrated Cameras for Robust 3D Human Body
Reconstruction [13.5] 複数のカメラビューから3次元人体を再構成する手法を提案する。
提案手法は,2つの公開データセット上に人体を再構築する際の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:03:25 GMT)
A Stochastic-Gradient-based Interior-Point Algorithm for Solving Smooth
Bound-Constrained Optimization Problems [13.4] このアルゴリズムは、連続的に微分可能な目的関数(残留する可能性がある)に基づいている。
ステップサイズシーケンス間の注意深くバランスをとることで、提案アルゴリズムはエディションベースの手法を満たすことを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:20:52 GMT)
Conjectural Online Learning with First-order Beliefs in Asymmetric
Information Stochastic Games [13.3] 既存のテキストスケージの計算方法は主にオフラインであり、平衡偏差に適応できない。
汎用的なテキストスキャスティングのためのオンライン手法であるconjectural online learning (textsccol)を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:36:48 GMT)
DP-TabICL: In-Context Learning with Differentially Private Tabular Data [12.8] In-context Learning (ICL)は、大規模言語モデル(LLM)が新しいタスクに適応できるようにする。
LLMは、プロンプトに含まれる情報をリークすることができる。
この研究は、差分プライバシー(DP)の使用方法に関する最初の調査として機能する。
ローカル (LDP-TabICL) とグローバル (GDP-TabICL) の2つのプライベート ICL フレームワークを立案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:19:01 GMT)
Considering Nonstationary within Multivariate Time Series with
Variational Hierarchical Transformer for Forecasting [12.8] MTS内の非定常性と固有特性を考慮した強力な階層的確率的生成モジュールを開発した。
次に、階層時間系列変分変換器(HTV-Trans)という、明確に定義された変動生成動的モデルに対する変換器と組み合わせる。
HTV-Transは強力な確率モデルであり、MTSの表現表現を学習し、予測タスクに適用する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:04:36 GMT)
Quantifying intrinsic causal contributions via structure preserving
interventions [12.7] 本稿では,DAGのノードに対するノードの寄与の内在的な部分を記述する因果影響の概念を提案する。
分散とエントロピーに対するコントリビューション分析について述べるが、他のターゲットメトリクスに対するコントリビューションは類似的に定義することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:33:03 GMT)
Explaining Bayesian Optimization by Shapley Values Facilitates Human-AI
Collaboration [12.6] ShapleyBOは、ゲーム理論のShapley値によってBOの提案を解釈するためのフレームワークである。
以上の結果から,ShapleyBOはアレタリックおよびてんかん不確実性を探究する人々への探索への貢献を解消できることが示唆された。
我々は、このHMIのメリットを、人間のループBOによってウェアラブルロボットデバイス(補助バックエクソスーツ)をパーソナライズするユースケースとして示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:52:32 GMT)
Precedence-Constrained Winter Value for Effective Graph Data Valuation [12.6] グラフデータのバリュエーションは、ノード間の複雑な依存関係と、価値推定コストの指数的な増加から起因した、ユニークな課題を導入します。
複雑なグラフ構造を考慮した先進制約冬(PC-Winter)値(Precedence-Constrained Winter:PC-Winter)を考案した。
さらに、計算課題に対処し、PC-Winterの効率的な近似を可能にするための様々な戦略を開発する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:34:12 GMT)
Deep Backward and Galerkin Methods for the Finite State Master Equation [12.6] 本稿では,有限状態平均場ゲームにおけるマスター方程式の解法として,2つのニューラルネットワーク手法を提案し,解析する。
アルゴリズムの損失関数を任意に小さくし、逆に損失が小さい場合、ニューラルネットワークはマスター方程式の解をよく近似する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:12:11 GMT)
APRICOT-Mamba: Acuity Prediction in Intensive Care Unit (ICU):
Development and Validation of a Stability, Transitions, and Life-Sustaining
Therapies Prediction Model [12.4] 集中治療室(ICU)の患者の体力状態は、すぐに安定して不安定になる。
早期の劣化状態の検出は、タイムリーな介入と生存率の改善をもたらす可能性がある。
Intensive Care Unit-MambaにおけるAPRICOT-M(Acuity Prediction in Intensive Care Unit-Mamba)を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:29:28 GMT)
H2O-SDF: Two-phase Learning for 3D Indoor Reconstruction using Object
Surface Fields [12.3] 本研究では,屋内環境における対象領域と非対象領域を識別する二相学習手法H2O-SDFを提案する。
当社の2相学習フレームワークの基盤は、永続的消滅勾配問題を軽減するために設計された新しい概念であるObject Surface Field (OSF)の導入である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:00:47 GMT)
Prepared for the Worst: A Learning-Based Adversarial Attack for
Resilience Analysis of the ICP Algorithm [12.3] 本稿では,ライダー点雲に対する深層学習に基づく攻撃により,ICPアルゴリズムのレジリエンスを評価する新しい手法を提案する。
提案した攻撃はICPに対して重大なポーズエラーを引き起こし、その88%以上でベースラインを上回ります。
例として、ICPが測定結果の破損に対して特に脆弱である地図上の領域を特定するために、我々の攻撃が有効であることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:43:57 GMT)
DITTO: Dual and Integrated Latent Topologies for Implicit 3D
Reconstruction [12.0] ノイズやスパース点の雲から暗黙的な3次元再構成を行うために,新しいDITTO(Double and Integrated Latent Topologies)を提案する。
DITTOは二重潜在エンコーダと統合暗黙デコーダから構成される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:03:41 GMT)
ActFormer: Scalable Collaborative Perception via Active Queries [12.0] 協調的知覚は、複数のロボットからの豊かな視覚的観察を利用して、単一のロボットの知覚能力を視野を超えて拡張する。
本稿では,鳥の目視(BEV)表現を予め定義されたBEVクエリを用いて学習し,マルチロボットマルチカメラ入力と対話するトランスフォーマーActFormerを提案する。
V2X-Simデータセットの実験では、ActFormerが検出性能を29.89%から45.15%に改善し、約50%のクエリが削減された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:45:18 GMT)
Direct Alignment of Draft Model for Speculative Decoding with
Chat-Fine-Tuned LLMs [11.9] 投機的復号化による推論アクセラレーションを実現するためには、高品質なドラフトモデルをトレーニングする必要がある。
我々は、Llama 2 Chat Drafter 115M、Llama 2 Chat 7B以上のドラフトモデル、オリジナルサイズの1.64%しか持たないLlama 2 Chat Drafter 115Mを訓練する。
Llama 2 Chat Dr After 115M with speculative decoding は最大2.3ブロック効率と2.4$times$ speed-upを実現している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:23:48 GMT)
EarthGPT: A Universal Multi-modal Large Language Model for Multi-sensor
Image Comprehension in Remote Sensing Domain [11.9] マルチモーダル大言語モデル(MLLM)は、自然画像領域における視覚および視覚言語タスクにおいて顕著な成功を収めている。
このギャップを埋めるために,EarthGPTと呼ばれる先駆的なMLLMが,様々なマルチセンサRS解釈タスクを統一的に統合する手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:36:11 GMT)
REPrune: Channel Pruning via Kernel Representative Selection [11.7] 本稿では,カーネルプルーニングをエミュレートする新しいチャネルプルーニング手法であるREPruneを提案する。
REPruneは、既存の方法よりもコンピュータビジョンタスクにおいて優れており、アクセラレーション比と性能保持のバランスを効果的に達成している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:03:57 GMT)
Out of Sight, Still in Mind: Reasoning and Planning about Unobserved
Objects with Video Tracking Enabled Memory Models [11.7] オブジェクト指向メモリを多目的操作推論フレームワークに符号化する問題について検討する。
部分ビュー点雲のトラジェクトリの履歴を符号化するためにトランスフォーマダイナミクスを利用するLOOMを提案する。
提案手法は,新規なオブジェクトの出現を排除した推論や,オブジェクトの再出現など,複数のタスクを実行できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:29:13 GMT)
Multistatic-Radar RCS-Signature Recognition of Aerial Vehicles: A
Bayesian Fusion Approach [11.6] 無人航空機(UAV)用のレーダー自動目標認識(RATR)は、電磁波(EMW)を送信し、受信したレーダーエコーに対して目標型認識を行う。
これまでの研究では、RATRにおけるモノスタティックレーダよりも、マルチスタティックレーダの構成の利点を強調していた。
本稿では,複数のレーダからの分類確率ベクトルを集約するために,OBF(Optimal Bayesian Fusion)を用いた完全ベイズRATRフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:47:21 GMT)
ROUGE-K: Do Your Summaries Have Keywords? [11.4] 要約における内容関連単語は,効率的な情報伝達において重要な役割を担っている。
極端な要約モデルの既存の評価指標は、要約のキーワードに明確な注意を払わない。
変換器モデルに単語の重要度を組み込むための4つの手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:54:56 GMT)
LLM4Decompile: Decompiling Binary Code with Large Language Models [11.3] Decompilationは、コンパイルされたコードを可読性のあるソースコードに復元することを目的としている。
大規模言語モデル(LLM)は、プログラムタスクの約束を示し、そのアプリケーションを非コンパイルに動機付ける。
C ソースコードの40億個のトークンと対応するアセンブリコードで事前訓練された 1B から 33B までの,最初のオープンアクセス逆コンパイル LLM をリリースする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:10:59 GMT)
From Registration Uncertainty to Segmentation Uncertainty [11.3] 本稿では, 画像登録において, エピステミックとアレタリックのセグメンテーションの不確実性の両方を同時に推定する新しい枠組みを提案する。
既存の登録不確実性を推定する手法とともにセグメンテーションの不確実性を導入することにより、画像登録の異なる段階における潜在的な不確実性について重要な洞察を提供する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:16:14 GMT)
Enhancing CLIP with CLIP: Exploring Pseudolabeling for Limited-Label
Prompt Tuning [11.3] 本稿では, 擬似ラベル, すなわちラベルなしデータのラベルを用いて, 即時チューニングによるCLIPの強化について検討する。
半教師付き, トランスダクティブなゼロショット, 教師なし学習といった学習パラダイムは, すべて同じ損失関数の最適化とみなすことができる。
1) 擬似ラベルを反復的に洗練する未探索プロンプトチューニング戦略は,半教師あり学習では19.5ポイント,帰納的ゼロショット学習では28.4ポイント,教師なし学習では15.2ポイント,CLIP精度を継続的に向上させる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:19:39 GMT)
JointMotion: Joint Self-supervision for Joint Motion Prediction [11.2] 自律運転における関節運動予測のための自己教師型学習手法であるJointMotionを提案する。
提案手法は,動作と環境を接続するシーンレベルの目的と,学習した表現を洗練するためのインスタンスレベルの目的を含む。
以上の結果から,これらの目的は協調動作予測のための事前学習として,近年のコントラスト・オートエンコーディング手法の相補的かつ優れたものであることが明らかとなった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:54:38 GMT)
Personalized Audiobook Recommendations at Spotify Through Graph Neural
Networks [11.1] Spotifyは最近、巨大なユーザーベースにオーディオブックを導入した。
この動きはパーソナライズされたレコメンデーションに重大な課題をもたらす。
異種グラフニューラルネットワーク(HGNN)と2Tモデルを組み合わせたスケーラブルなレコメンデーションシステムである2T-HGNNを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:53:07 GMT)
An In-depth Evaluation of GPT-4 in Sentence Simplification with
Error-based Human Assessment [10.8] 我々は,GPT-4の単純化機能を評価するために,エラーベースのヒューマンアノテーションフレームワークを設計する。
その結果, GPT-4は, 現在の最先端技術と比較して, 誤りの低減出力が少ないことがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:19:24 GMT)
SzCORE: A Seizure Community Open-source Research Evaluation framework
for the validation of EEG-based automated seizure detection algorithms [10.8] 本稿では,脳波を用いた発作検出アルゴリズムの標準化を目的とした統合フレームワークを提案する。
既存のガイドラインとレコメンデーションに基づいて、このフレームワークはデータセット、ファイルフォーマット、EEGデータ入力コンテンツ、アセプションアノテーション入力と出力、クロスバリデーション戦略、パフォーマンスメトリクスに関連する一連のレコメンデーションと標準を導入している。
また,公開データセットを標準フォーマットに変換する機械学習ベンチマークである,10~20回の発作検出ベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:21:14 GMT)
On Representing Electronic Wave Functions with Sign Equivariant Neural
Networks [10.8] 最近のニューラルネットワークは、電子基底波関数の驚くほど正確な近似を示した。
これらのニューラルネットワークは通常、置換同変ニューラルネットワークと置換反対称演算からなる。
正確性はあるものの、そのようなニューラルネットワークは計算コストが高い。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:13:11 GMT)
UI Semantic Group Detection: Grouping UI Elements with Similar Semantics
in Mobile Graphical User Interface [10.8] UI要素のグループ化に関する既存の研究は、主に単一のUI関連ソフトウェアエンジニアリングタスクに焦点を当てており、そのグループは外観と機能が異なる。
類似のセマンティクスで隣接したテキストと非テキスト要素をパックするセマンティクスコンポーネントグループを提案する。
UIページ上のセマンティックコンポーネント群を認識するために,我々は,堅牢で深層学習に基づく視覚検出システムであるUISCGDを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:52:44 GMT)
$\mathtt{tsGT}$: Stochastic Time Series Modeling With Transformer [10.7] 汎用トランスアーキテクチャ上に構築された時系列モデルを提案する。
MathttsGT$はMADやRMSEの最先端モデルよりも優れており、QLやCRPSの仲間よりも優れています。
データ分布をモデル化し、限界量子値を予測する$mathttsGT$の能力を詳細に分析することで、これらの結果を補完する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:59:41 GMT)
ACLSum: A New Dataset for Aspect-based Summarization of Scientific
Publications [10.5] ACLSumは、ドメインの専門家によって慎重に作成され、評価される新しい要約データセットである。
以前のデータセットとは対照的に、ACLSumは科学論文のマルチアスペクト要約を容易にする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:32:01 GMT)
RealCraft: Attention Control as A Tool for Zero-Shot Consistent Video
Editing [10.4] 本研究では,ゼロショット映像編集のためのアテンション制御方式であるRealCraftを提案する。
新たな特徴注入にクロスアテンションを切り替え、編集対象の空間的注意を緩和することにより、局所的な形状の編集を実現する。
提案するゼロショットアテンション制御方式を,様々なビデオで紹介し,形状,時間一貫性,パラメータフリーな編集方法を示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:57:48 GMT)
Testing Stationarity and Change Point Detection in Reinforcement
Learning [10.3] 予め収集した履歴データに基づいて最適なQ-関数の非定常性をテストする一貫した手順を開発する。
さらに、非定常環境における政策最適化のための既存の最先端RL手法と自然に結合可能な逐次変化点検出法を開発した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:00:47 GMT)
Beyond Ensemble Averages: Leveraging Climate Model Ensembles for
Subseasonal Forecasting [10.3] 本研究では,機械学習モデル(ML)を時系列予測のための後処理ツールとして応用することを検討した。
月平均降水量と2m温度を予測するため,様々なML手法にラベル付き数値アンサンブル予測と観測データを組み込んだ。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:45:35 GMT)
Bayesian Differentiable Physics for Cloth Digitalization [9.8] 布のデジタル化のための新しい手法を提案する。
まず,布の正確な測定を行う新しいデータセットを提案する。
小型データから学習するために,新しいベイズ微分可能な布モデルを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:16:31 GMT)
VLM-PL: Advanced Pseudo Labeling approach Class Incremental Object
Detection with Vision-Language Model [9.8] VLM-PL(Vision-Language Model Assisted Pseudo-Labeling)を紹介する。
この手法は視覚言語モデル(VLM)を用いて、追加のモデルトレーニングを必要とせず、擬似接地真実(GT)の正しさを検証する。
VLM-PLは改良された擬似GTと実GTを統合し、新しい知識と古い知識を効果的に組み合わせている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:23:00 GMT)
Shielded Deep Reinforcement Learning for Complex Spacecraft Tasking [9.8] まず、宇宙船の作業や安全要件を形式化するための形式言語であるLTL(Linear Temporal Logic)について検討する。
次に、SDRLフレームワークにおける効果的なトレーニングのために、コセーフ仕様から報酬関数を自動で構築する方法を定義する。
いくつかの実験を通して、これらのシールドが異なるポリシーや報酬構造の柔軟性とどのように相互作用するかを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:04:25 GMT)
Probabilistic Image-Driven Traffic Modeling via Remote Sensing [9.7] 都市交通モデルの構築に使用できるマルチモーダル・マルチタスクトランスフォーマーに基づくセグメンテーションアーキテクチャを提案する。
そこで我々は,Dynamic Traffic Speedsベンチマークデータセットを用いて提案手法を広範囲に評価し,現状を著しく改善した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:43:28 GMT)
Spectrogram-Based Detection of Auto-Tuned Vocals in Music Recordings [9.6] 本研究では,3重項ネットワークを利用した自動音節検出手法を提案する。
実験により,提案手法の精度とロバスト性の両方において,反汚濁防止のためのエンドツーエンドモデルであるRawnet2よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:19:26 GMT)
Variational Inference of Parameters in Opinion Dynamics Models [9.5] この研究は、変数推論を用いて、意見力学 ABM のパラメータを推定する。
我々は推論プロセスを自動微分に適した最適化問題に変換する。
提案手法は, シミュレーションベース法とMCMC法より, マクロ的(有界信頼区間とバックファイア閾値)と微視的(200ドル, エージェントレベルの役割)の両方を正確に推定する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:45:18 GMT)
Approximate Multiagent Reinforcement Learning for On-Demand Urban
Mobility Problem on a Large Map (extended version) [9.3] 大規模都市環境における自律型マルチエージェントタクシー経路問題について検討する。
最近の理論では、安定なベースポリシーを持つロールアウトアルゴリズムは、ほぼ最適に近い安定ポリシーを生成することが示されている。
本稿では,計算コストを削減できる近似マルチエージェントロールアウト方式の2相アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:36:50 GMT)
Augmentations vs Algorithms: What Works in Self-Supervised Learning [9.2] 自己監督学習(SSL)におけるデータ強化,事前学習アルゴリズム,モデルアーキテクチャの相対効果について検討する。
異なるSSLメソッドを単一の共有テンプレートに統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:42:06 GMT)
Quantized Fourier and Polynomial Features for more Expressive Tensor
Network Models [9.2] モデル重みを過度にパラメータ化されたテンソルネットワークに制約することで,特徴量に存在するテンソル構造を利用する。
同じ数のモデルパラメータに対して、結果の量子化モデルは、その非量子化モデルとは対照的に、VC次元に高いバウンドを持つことを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:12:38 GMT)
Attention-guided Feature Distillation for Semantic Segmentation [9.1] CBAM(Convolutional Block Attention Module)を応用したAttnFD(AttnFD)法の提案
AttnFDはセマンティックセグメンテーションにおいて優れたパフォーマンスを示し、PascalVoc 2012とCityscapesのデータセット上で、Union(mIoU)平均のインターセクションで最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:57:47 GMT)
A Bayesian Learning Algorithm for Unknown Zero-sum Stochastic Games with
an Arbitrary Opponent [9.1] ゼロサムゲームのための後サンプリング強化学習(PSRL-ZSG)
ゼロサムゲームのための後サンプリング強化学習(PSRL-ZSG)を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:31:18 GMT)
Predicting Single-cell Drug Sensitivity by Adaptive Weighted Feature for
Adversarial Multi-source Domain Adaptation [9.0] scAdaDrugはシングルセル薬物感受性を予測するマルチソース適応重み付けモデルである。
本モデルでは, 肝細胞, 細胞株, 患者データセットに対する薬剤感受性の予測において, 最先端の性能を達成した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:31:03 GMT)
DeepIPC: Deeply Integrated Perception and Control for an Autonomous
Vehicle in Real Environments [9.0] 本稿では,自動運転に適した新しいエンドツーエンドモデルであるDeepIPCを紹介する。
DeepIPCは知覚と制御タスクをシームレスに統合する。
本評価は,DeepIPCの乾燥性およびマルチタスク効率において優れた性能を示すものである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:40:12 GMT)
Cross-Modal and Uni-Modal Soft-Label Alignment for Image-Text Retrieval [9.0] クロスモーダル・ユニモーダル・ソフトレーベルアライメント(CUSA)と呼ばれる新しい手法を提案する。
本手法は,一様事前学習モデルのパワーを活用し,画像テキスト検索モデルのためのソフトラベル監視信号を提供する。
また,画像テキスト検索モデルのユニモーダル検索性能を向上し,ユニバーサル検索を実現する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:32:14 GMT)
On Practicality of Using ARM TrustZone Trusted Execution Environment for Securing Programmable Logic Controllers [9.0] 本稿では,PLCのセキュリティ向上のためのARM TrustZone TEE技術の適用について検討する。
本研究の目的は,OP-TEE や OpenPLC などのオープンソースソフトウェアを用いた概念実証設計と実装を通じて,TEE ベースの PLC の実現可能性と実用性を評価することである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:55:20 GMT)
RLPeri: Accelerating Visual Perimetry Test with Reinforcement Learning
and Convolutional Feature Extraction [8.9] RLPeriは、視覚的ペリメトリテストの最適化のための強化学習に基づくアプローチである。
我々は、正確な結果を提供しながら、視覚的腹腔鏡検査をより効率的かつ患者に優しいものにすることを目指している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:19:43 GMT)
Learning Temporal Distribution and Spatial Correlation Towards Universal
Moving Object Segmentation [8.8] 本稿では,時空間分布と空間相関(LTS)の学習手法を提案する。
提案手法では,時間画素からの分布を,シーン非依存のセグメンテーションのための欠陥反復分布学習(DIDL)ネットワークで学習する。
提案手法は、パラメータが固定された多様で複雑な自然シーンのほとんどすべてのビデオに対してよく機能する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:00:10 GMT)
Every Dataset Counts: Scaling up Monocular 3D Object Detection with
Joint Datasets Training [8.8] 本研究では,多種多様な3次元および2次元データセットを用いたモノクロ3次元物体検出モデルの学習パイプラインについて検討した。
提案フレームワークは,(1)様々なカメラ設定にまたがって機能するロバストなモノクル3Dモデル,(2)異なるクラスアノテーションでデータセットを適応するための選択学習戦略,(3)2Dラベルを用いた擬似3Dトレーニング手法により,2Dラベルのみを含むシーンにおける検出性能を向上させる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:51:28 GMT)
Are Human Conversations Special? A Large Language Model Perspective [8.6] 本研究では、人間(人間)の自然な会話を理解するために、大規模言語モデル(LLM)の注意機構の変化を分析する。
その結果,言語モデルはドメイン固有の注意行動を示すが,人間の会話を専門化する能力には大きなギャップがあることが判明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:44:25 GMT)
WatChat: Explaining perplexing programs by debugging mental models [8.6] プログラム合成技術を用いて、ユーザーがプログラムの動作に驚かされる可能性のある潜在的な誤解を自動的に推測する。
これらの誤解を分析することで、プログラムの振る舞いを簡潔かつ有用な説明を提供する。
また,本手法は,学生の誤認識を診断・修正するための教育的サンプルプログラムの合成にも適用可能である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:10:25 GMT)
SocialPET: Socially Informed Pattern Exploiting Training for Few-Shot
Stance Detection in Social Media [8.6] スタンス検出とは、ソーシャルメディア投稿の目的に対する視点を「好み」や「アゲインスト」として判断するタスクである。
SocialPETは、そのタスクに言語モデルを活用するための社会的に情報を得たアプローチである。
マルチターゲットとPスタンスという2つのスタンスデータセットに対するSocialPETの有効性を実証する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:00:09 GMT)
EventBind: Learning a Unified Representation to Bind Them All for
Event-based Open-world Understanding [8.5] EventBindは、イベントベースの認識のためのビジョン言語モデル(VLM)の可能性を解き放つ新しいフレームワークである。
まず、イベントからの時間情報を微妙にモデル化する新しいイベントエンコーダを紹介する。
次に、コンテントプロンプトを生成し、ハイブリッドテキストプロンプトを利用してEventBindの一般化能力を向上するテキストエンコーダを設計する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:16:54 GMT)
Developing Federated Time-to-Event Scores Using Heterogeneous Real-World
Survival Data [8.4] 既存のサバイバルスコアの構築方法は、データが単一のソースに由来することを前提としている。
本稿では,多地点生存のための統合スコアリングシステムを構築するための新しいフレームワークを提案する。
参加者各サイトからのデータセットのテストにおいて,提案するフェデレーションスコアリングシステムは,すべての局所モデルより一貫して優れていた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:32:00 GMT)
LanePtrNet: Revisiting Lane Detection as Point Voting and Grouping on
Curves [8.0] 車線検出は、自動運転の分野において重要な役割を果たす。
本稿では,順序付き集合上での点投票とグループ化のプロセスとしてレーン検出を扱う新しいアプローチであるLanePtrNetを提案する。
提案手法の有効性を検証するための総合的な実験を行い,その性能を実証した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:45:42 GMT)
Generating Hard-Negative Out-of-Scope Data with ChatGPT for Intent
Classification [8.0] 本稿では,ChatGPTを用いた強陰性OOSデータの自動生成手法を提案する。
分類器は、一般的なOOS発声よりも、強い負のOOS発声を正しく識別することが困難であることを示す。
最後に,OOSデータと一般的なOOSデータを検出する際のモデルロバスト性を向上することを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:25:00 GMT)
Are Large Language Models Aligned with People's Social Intuitions for
Human-Robot Interactions? [8.0] 大規模言語モデル(LLM)は、ロボット工学、特にハイレベルな行動計画にますます使われている。
本研究では,人間とロボットの相互作用のシナリオにおいて,LLMが人々の直感やコミュニケーションを再現するかどうかを検証する。
視覚モデルでは映像刺激の本質を捉えることができず、LLMは人よりもコミュニケーション行動や行動を評価する傾向にあることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:23:23 GMT)
Mining Issue Trackers: Concepts and Techniques [7.9] 内外の利害関係者は「問題」を報告し、管理し、議論する
課題追跡ツールは、組織がユーザと対話し、ソフトウェア開発ライフサイクルのさまざまな側面を管理するために使用するソフトウェアツールである。
この章では、問題データをアルゴリズムで分析する4つの主要なユースケースについて論じる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:02:41 GMT)
EdgeLeakage: Membership Information Leakage in Distributed Edge Intelligence Systems [7.8] 分散エッジノードは、処理されていないデータを集約し、低送信レイテンシとリアルタイムデータ処理能力を維持できるようにデータ分析を容易にする。
近年,これらのエッジノードは分散機械学習モデルの実装を容易にするために進化している。
エッジインテリジェンスの世界では、機械学習モデルに対する多数のセキュリティとプライバシの脅威に対する感受性が明らかになっている。
本稿では,分散エッジインテリジェンスシステムにおけるメンバシップ推論リークの問題に対処する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:28:39 GMT)
Defending Against Unforeseen Failure Modes with Latent Adversarial
Training [7.8] 赤いチームと敵のトレーニング(AT)は、AIシステムをより堅牢にするために一般的に使用される。
本研究では,LAT(Latent Adversarial Training)を用いて,脆弱性を誘発する入力を発生させることなく脆弱性を防御する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:22:48 GMT)
LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image
Segmentation [7.7] 本稿では,軽量なフレームワークとして,Mamba と UNet を統合した Lightweight Mamba UNet (LightM-UNet) を紹介する。
特に、LightM-UNetはResidual Vision Mamba Layerを純粋なMamba方式で利用し、深い意味的特徴を抽出し、長距離空間依存をモデル化する。
2つの実世界の2D/3Dデータセットで実施された実験は、LightM-UNetが既存の最先端の文献を上回っていることを示している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:07:42 GMT)
PillarGen: Enhancing Radar Point Cloud Density and Quality via
Pillar-based Point Generation Network [7.7] Pillar-based Point Generation Network (PillarGen) と呼ばれる新しい点生成モデルを提案する。
PillarGenは、提供される入力点雲に基づいて、密度と品質を向上した合成点雲を生成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:00:48 GMT)
ContriMix: Scalable stain color augmentation for domain generalization
without domain labels in digital pathology [7.6] ContriMix(コントリミクス)は、DRIT++をベースとした無料の染色色増色法である。
トレーニング用ミニバッチとランダムミキシングのサンプル染色色変化を利用して、病理画像からコンテンツや属性情報を抽出する。
その性能は、病理画像中の希少物質からの色変化に頑健でありながら、テストセット内の異なるスライド間で一貫性がある。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:28:47 GMT)
Neural General Circulation Models for Weather and Climate [7.5] 一般的な循環モデル(GCM)は、気象と気候予測の基礎である。
本稿では,大気力学の微分可能解法とML成分を組み合わせた最初のGCMを提案する。
決定論的気象,アンサンブル気象,気候の予測を,機械学習や物理に基づく最良の手法と同等に生成できることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:14:15 GMT)
Enabling Developers, Protecting Users: Investigating Harassment and
Safety in VR [7.4] 本研究では,安全管理のユーザビリティと有効性に対するユーザの認識と,VR安全管理の設計と展開において開発者が直面する課題について検討する。
私たちは、混み合った仮想空間のユーザーをブロックするなど、安全管理を採用する際にVRユーザーが直面する課題を特定します。
仮想環境におけるユーザの安全性を高めるための技術的・法的ガイドラインを確立することの重要性を強調した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:15:53 GMT)
A Formal Analysis of SCTP: Attack Synthesis and Patch Verification [7.3] SCTP設計の安全性について検討し,厳密なアプローチを形式的手法に根ざして検討した。
攻撃者は仲間のポートとIPを隠蔽できる外部者であり、攻撃者は悪意のあるピアであるEvil-Server、攻撃者が捕獲して再生できるReplay、パケットを変更できないOn-Path、攻撃者がピア間のチャネルを制御するOn-Pathの4つのモデルを定義します。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:38:56 GMT)
Robust automated calcification meshing for biomechanical cardiac digital
twins [7.3] 本稿では、患者固有の石灰化を所定の心臓メッシュに堅牢に組み込むことができるエンドツーエンドの自動メッシュアルゴリズムを提案する。
このアルゴリズムは、手動メッシュの数時間から、自動計算の$sim$1分までの大幅なスピードアップを提供する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:25:44 GMT)
Deep Prompt Multi-task Network for Abuse Language Detection [7.2] 既存の検出手法は、学習済み言語モデル(PLM)の微調整技術を用いて下流タスクを処理していると論じる。
本稿では,乱用言語検出のための新しいDeep Prompt Multi-task Network (DPMN)を提案する。
提案したDPMNは3つの公開データセット上の8つの典型的な手法に対して評価される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:45:53 GMT)
REValueD: Regularised Ensemble Value-Decomposition for Factorisable
Markov Decision Processes [7.2] 離散アクション強化学習アルゴリズムは、高次元の離散アクション空間を持つタスクにしばしば干渉する。
本研究は、値分解の効果を深く掘り下げ、対象の分散を増幅することを明らかにする。
我々は、ある次元における探索的行動が他の次元における最適な行動の価値に与える影響を軽減するのに役立つ正規化損失を導入する。
我々の新しいアルゴリズムREValueDはDeepMind Control Suiteタスクの離散バージョンでテストされ、優れた性能を示している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:06:53 GMT)
Benchmarking Large Language Models for Molecule Prediction Tasks [7.1] 大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクの最前線にある。
LLMは分子予測タスクを効果的に扱えるのか?
6つの標準分子データセットの分類および回帰予測タスクを同定する。
テキストベースのモデルと、分子の幾何学的構造を分析するために特別に設計されたモデルを含む、既存の機械学習(ML)モデルと比較する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:59:56 GMT)
Grasping Trajectory Optimization with Point Clouds [7.0] 本稿では,ロボットとタスク空間のポイントクラウド表現に基づく,ロボットグルーピングのための新しい軌道最適化手法を提案する。
本手法では,ロボットはリンク面上の3Dポイントで表現され,ロボットのタスク空間は深度センサから得られる点雲で表現される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:29:51 GMT)
Multimodal Interpretable Data-Driven Models for Early Prediction of
Antimicrobial Multidrug Resistance Using Multivariate Time-Series [6.8] 本稿では,フエンラブラダ大学附属病院の集中治療室 (ICU) における抗微生物多剤耐性 (AMR) 菌の出現を予測し, 理解することのできる, 解釈可能なマルチモーダルデータ駆動モデルの集合体上に構築したアプローチを提案する。
患者のプロファイルと初期健康状態は静的変数を用いてモデル化され、ICU滞在中の患者の健康状態の進化は、機械的換気や抗生物質摂取を含むいくつかのMSSを用いてモデル化される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:50:21 GMT)
An Adaptive Dimension Reduction Estimation Method for High-dimensional
Bayesian Optimization [6.8] BOを高次元設定に拡張するための2段階最適化フレームワークを提案する。
私たちのアルゴリズムは、これらのステップを並列またはシーケンスで操作する柔軟性を提供します。
数値実験により,困難シナリオにおける本手法の有効性が検証された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:21:08 GMT)
Discrimination of Chiral Molecules through Holonomic Quantum Coherent
Control [6.7] 捕捉イオンキュディットを用いた量子シミュレータにおいて、キラル分子を識別する新しい光学的手法を提案し、検証した。
本手法は, キラル分子の高効率, 非断熱的, 堅牢な検出と分離を実現する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:23:40 GMT)
Fairness-Aware Interpretable Modeling (FAIM) for Trustworthy Machine
Learning in Healthcare [6.6] フェアネス・アウェア・インタプリタブル・モデリング(FAIM)を提案し,性能を損なうことなくモデルフェアネスを改善する。
FAIMは、ハイパフォーマンスモデルのセットから"フェアラー"モデルを識別するためのインタラクティブインターフェースを備えている。
FAIMモデルは, 良好な識別性能を示すだけでなく, 確立された公正度測定値によって測定されたバイアスを著しく軽減することを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:51:00 GMT)
That Doesn't Go There: Attacks on Shared State in Multi-User Augmented Reality Applications [6.5] 共有状態を持つ複数のARフレームワークに対する一連の新しい攻撃を実演する。
これらのフレームワークは、異なる実装、スコープ、メカニズムを使用して共有状態を読み書きする一方で、統一された脅威モデルに脆弱性を共有していることを示します。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:15:11 GMT)
Intriguing Properties of Input-dependent Randomized Smoothing [6.1] CIFAR10 および MNIST 上で,滑らかな分散関数の具体的な設計と検証を行う。
入力依存の平滑化は次元性の呪いに悩まされ、分散関数は半弾性が低いことが示される。
我々は,次元の呪いがあっても,入力依存の平滑化を利用できる理論的,実践的な枠組みを提供する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:10:06 GMT)
Multi-Scale and Multi-Layer Contrastive Learning for Domain
Generalization [6.1] 深部畳み込みニューラルネットワークの一般化能力は、ネットワークの多層的および多スケール的表現を活用することで向上できると論じる。
画像分類器の領域一般化を目的とした,低レベル特徴と高レベル特徴を複数スケールで組み合わせたフレームワークを提案する。
我々のモデルは従来のDG手法よりも優れており、全てのデータセットにおいて競争力と最先端の結果を連続的に生成できることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:17:30 GMT)
A Data Augmentation Pipeline to Generate Synthetic Labeled Datasets of
3D Echocardiography Images using a GAN [6.0] 本研究では,3次元心エコー画像とそれに対応する基底真理ラベルを合成する画像生成パイプラインを提案する。
提案手法は, 心臓の詳細な解剖学的区分を基底真理ラベル源として利用する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:26:27 GMT)
ProtoCaps: A Fast and Non-Iterative Capsule Network Routing Method [6.0] 本稿では,カプセルネットワークのための新しい非定型ルーティング機構を提案する。
私たちは共有のCapsuleサブスペースを利用し、各下位のCapsuleを各上位のCapsuleに投影する必要性を否定します。
本研究は,カプセルネットワークの運用効率と性能を向上させるための提案手法の可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:54:12 GMT)
Probabilistic Lipschitzness and the Stable Rank for Comparing
Explanation Models [6.0] ニューラルネットワークのブラックボックスの性質に対処するために、機械学習内で説明可能性モデルが普及した。
確率論的リプシッツネスは、ニューラルネットワークの滑らかさがポストホックの説明の質と根本的に関連していることを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:03:38 GMT)
Bug Priority Change: An Empirical Study on Apache Projects [5.9] 各プロジェクトのバグの割合は、そのようなバグが報告された後に優先順位を変更した。
バグ修正プロセスに悪影響を及ぼす可能性があるバグ優先度変更の現象について、詳細な調査が行われていない。
その結果,(1)選択したプロジェクトのバグの8.3%が優先的な変更を受けており,(2)中央値の変更間隔は,ほとんどのプロジェクト(32件中28件)でわずか数日であり,半数(50.7%)がバグの処理前に発生していることがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:10:57 GMT)
Do Large Language Model Understand Multi-Intent Spoken Language ? [5.9] この研究は、多言語言語理解(SLU)にLarge Language Models(LLM)を活用することで、著しい進歩を示す。
我々の革新的な技術は、マルチインテリジェントSLU環境におけるLLMアプリケーション専用のエンティティスロットを再構成する。
LM-MixATISとLM-MixSNIPSと呼ばれるデータセットは、既存のベンチマークから作成されている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:47:16 GMT)
Enhancing Plausibility Evaluation for Generated Designs with Denoising
Autoencoder [5.8] 本稿では,単純なデノナイジングオートエンコーダ(DAE)を用いて入力設計を符号化し,その潜在空間における分布距離を測定することを提案する。
3つのデータセット上で、DAEベースのメトリクスをFIDやその他の最先端メトリクスで実験的にテストします。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:32:01 GMT)
Part-aware Personalized Segment Anything Model for Patient-Specific
Segmentation [5.8] 医用画像を利用した患者適応治療などの精密医療は、画像分割アルゴリズムに新たな課題をもたらす。
我々はこれらの課題,すなわちP2SAM(Part-aware Personalized Segment Anything Model)に対処するデータ効率のセグメンテーション手法を提案する。
ワンショットデータのパートレベル特徴に基づいて複数ポイントプロンプトを選択する新しいパートアウェア・プロンプト機構を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:34:30 GMT)
What makes an image realistic? [5.7] 非現実的なデータから現実的なデータを確実に検出できる関数を設計する、リアリズムの定量化の問題について議論する。
この問題がなぜ難しいのか、なぜ優れた生成モデルだけで解決できないのか、そして良い解決策がどのようなものかについて議論する。
我々は、敵の批判者と異なり、敵の訓練を必要としない普遍的な批判の概念を導入する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:02:55 GMT)
Multi-Agent Reinforcement Learning with a Hierarchy of Reward Machines [5.6] Reward Machines (RMs) を用いた協調型マルチエージェント強化学習(MARL)問題の検討
より複雑なシナリオを扱えるRM(MAHRM)階層のマルチエージェント強化学習を提案する。
3つの協調MARLドメインの実験結果から、MAHRMは、他のMARLメソッドよりも高いレベルの事象の事前知識の方が優れていることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:38:22 GMT)
3D molecule generation by denoising voxel grids [5.5] 正規格子上に原子密度を表す3次元分子を生成するための新しいスコアベース手法を提案する。
我々は、雑音分子のスムーズな分布から実際の分子の分布への写像を学習する認知ニューラルネットワークを訓練する。
我々の実験では、VoxMolは、薬品のような分子の分布を、技術の状態よりもよく捉えつつ、サンプルを生成するのが速いことが示されている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:30:22 GMT)
Extracting Protein-Protein Interactions (PPIs) from Biomedical
Literature using Attention-based Relational Context Information [5.5] 本研究は,二元的相互作用型ラベルを付加したベット型相互作用定義を用いた多元的PPIコーパスを提案する。
変換器を用いた深層学習手法は,関係表現のための関係文脈情報を利用して関係分類性能を向上させる。
このモデルの性能は, 広く研究されている4つのバイオメディカル関係抽出データセットで評価される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:43:21 GMT)
PIPsUS: Self-Supervised Dense Point Tracking in Ultrasound [5.4] 超音波(US)における点レベル対応の発見は基本的な問題である
PIPsUSと呼ばれる自己教師付きピクセルレベルの追跡モデルを提案する。
我々のモデルは、1つの前方通過において任意の数の点を追跡でき、連続するフレームではなく複数の時間情報を利用することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:53:49 GMT)
Exploring Large Language Models to Facilitate Variable Autonomy for
Human-Robot Teaming [5.4] 本稿では,VR(Unity Virtual Reality)設定に基づく,GPTを利用したマルチロボットテストベッド環境のための新しいフレームワークを提案する。
このシステムにより、ユーザーは自然言語でロボットエージェントと対話でき、それぞれが個々のGPTコアで動く。
12人の参加者によるユーザスタディでは、GPT-4の有効性と、さらに重要なのは、マルチロボット環境で自然言語で会話する機会を与えられる際のユーザ戦略について検討している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:33:21 GMT)
The Impact of Quantization on the Robustness of Transformer-based Text
Classifiers [5.3] この研究は、NLPモデルのロバスト性に対する量子化の最初の応用である。
SST-2, Emotion, MRデータセットを用いたテキスト分類において, BERT モデルと DistilBERT モデルに対する量子化の影響を評価する。
実験の結果, 量子化は, 対向訓練と比較して平均18.80%の頑健さを増大させることがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:55:05 GMT)
Learning without Exact Guidance: Updating Large-scale High-resolution
Land Cover Maps from Low-resolution Historical Labels [5.2] 大規模な高解像度(HR)の土地被覆マッピングは、地球の表面を調査し、人類が直面する多くの課題を解決するための重要な課題である。
本研究では,大規模人事地被覆地図作成のための効率的かつ弱教師付きフレームワーク(Paraformer)を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:59:40 GMT)
Automated Efficient Estimation using Monte Carlo Efficient Influence
Functions [5.2] 本稿では,MC-EIF(TextitMonte Carlo Efficient Influence Function)を紹介する。
MC-EIFは効率的な影響関数を近似する完全自動化技術である。
我々は,MC-EIF が一貫したものであり,MC-EIF を用いた推定器が最適$sqrtN$収束率を達成することを証明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:26:03 GMT)
Continuous-time q-learning for mean-field control problems [5.2] 我々は最近,Jia と Zhou (2023) による Q-learning の連続時間版として作られた q-learning を,Mckean-Vlasov 制御問題に対して検討した。
2つのq-函数が全てのテストポリシーの下で積分表現によって関連していることが示される。
弱いマーチンゲール条件とテストポリシーの探索法に基づいて,いくつかのモデルフリー学習アルゴリズムを考案した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:50:45 GMT)
LVIC: Multi-modality segmentation by Lifting Visual Info as Cue [5.2] ポイントペインティングは、直接LiDARポイントと視覚情報とを結合するストレートフォワード方式である。
本稿では,多モード融合を著しく促進する深度認識点塗装機構を提案する。
Visual InformationをCueとしてリフティングすることで、LVICはnuScenes LiDARセマンティックセマンティックセグメンテーションベンチマークで1位にランクインする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:52:55 GMT)
Embedded Deployment of Semantic Segmentation in Medicine through
Low-Resolution Inputs [5.1] ハードウェア限定環境では、高いスループットを保証するために、最も高可用性な入力解像度の使用を控えることが多い。
当社のアーキテクチャは,高精細なグランドトルースをいまだに活用できるという事実を活用して,この問題に対処する。
我々は,MRI画像におけるがんの軽量なセマンティックセグメンテーションのための最先端フレームワークを,我々のアーキテクチャが拡張していることを示すために,広範な分析を行う。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:17:07 GMT)
OccFusion: Depth Estimation Free Multi-sensor Fusion for 3D Occupancy
Prediction [5.1] マルチセンサフュージョンに基づく3次元占有予測は、信頼性の高い自律運転システムに不可欠である。
従来の核融合による3次元占有予測は2次元画像特徴の深度推定に頼っていた。
我々は,奥行き推定が不要なマルチモーダル融合法であるOccFusionと,画像特徴の密接な統合のための対応する点クラウドサンプリングアルゴリズムを紹介する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:07:37 GMT)
ERASOR++: Height Coding Plus Egocentric Ratio Based Dynamic Object
Removal for Static Point Cloud Mapping [5.1] 3Dポイントクラウドマップの動的オブジェクトは、地図歪みと長いトレースを導入することができる。
本研究では,Pseudo OccupancyのEgocentric Ratioに基づく動的オブジェクトの効率的な除去手法であるERASOR++を提案する。
提案手法は既存の手法と比較して精度と効率の点で優れた性能を示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:45:04 GMT)
Dendrogram of mixing measures: Hierarchical clustering and model
selection for finite mixture models [5.0] 本稿では,過度に適合した潜在混合指標から構築した階層的クラスタリング木(デンドログラム)を用いて,混合モデルを要約し,選択する新しい方法を提案する。
提案手法は,集合的階層的クラスタリングと混合モデリングを橋渡しする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:39:32 GMT)
Unraveling the Molecular Magic: AI Insights on the Formation of
Extraordinarily Stretchable Hydrogels [5.0] 過硫酸アンモニウム, メチレンビサクリルアミド, ジメチルエアクリルアミド, ポリエチレンオキシド濃度の操作により, 優れた伸縮性を持つハイドロゲルが発達した。
本研究は, この現象の基盤となる分子構造を, 潜在的な反応機構を探索することによって解明することを目的とする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:52:17 GMT)
Finding Waldo: Towards Efficient Exploration of NeRF Scene Spaces [4.9] 我々は,NeRFモデル入力の効率的な発見として,シーン探索フレームワークを提案し,正式に定義する。
シーン探索に対処するアプローチの欠如を解決するため,まず誘導ランダム探索 (GRS) と詩補間探索 (PIBS) という2つのベースライン手法を提案する。
そこで我々は,シーン探索を最適化問題としてキャストし,探索のための基準に依存しない進化誘導ポッドサーチ(EGPS)を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:34:48 GMT)
Overcoming Data Inequality across Domains with Semi-Supervised Domain
Generalization [4.9] 本稿では,ドメイン認識型プロトタイプを用いて,ドメイン不変性を効果的に学習できる新しいアルゴリズムProUDを提案する。
3つの異なるベンチマークデータセットに対する実験により, ProUDの有効性が示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:49:37 GMT)
Digital Wellbeing Redefined: Toward User-Centric Approach for Positive
Social Media Engagement [4.9] 本稿では、ポジティブなソーシャルメディア体験を促進することに焦点を当てた新しい視点を紹介する。
PauseNowは、ユーザのデジタル行動と意図を一致させるために設計された、革新的なデジタルウェルビーイングの介入である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:26:07 GMT)
A Protein Structure Prediction Approach Leveraging Transformer and CNN
Integration [4.9] 本稿では、畳み込みニューラルネットワーク(CCN)を用いた2次元融合深層ニューラルネットワークモデルDstruCCNと、単一配列タンパク質構造予測のための教師付きトランスフォーマー言語モデルを採用する。
両者のトレーニング特徴を組み合わせ、タンパク質トランスフォーマー結合部位マトリックスを予測し、エネルギー最小化を用いて三次元構造を再構築する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:30:10 GMT)
Global Latent Neural Rendering [4.8] 一般化可能な新しいビュー手法の最近のトレンドは、単一のカメラ線に作用するレンダリング演算子を学習することである。
ここでは,全カメラ光線に作用するグローバルレンダリング演算子を共同で学習することを提案する。
我々は,低解像度の潜時空間でグローバルにレンダリング操作を行う効率的な畳み込みアーキテクチャである畳み込みグローバル潜時レンダラー(ConvGLR)を紹介した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:15:27 GMT)
Strategic Usage in a Multi-Learner Setting [4.8] 現実世界のシステムは、サービスのセットを選択するユーザのプールを伴います。
戦略的ユーザがいくつかの利用可能なサービスの中から選択し、肯定的な分類を追求する環境について分析する。
また,全てのユーザが異なる時間に観察された場合でも,ナイーブリトレーニングは依然として振動を引き起こす可能性があることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:01:08 GMT)
MolNexTR: A Generalized Deep Learning Model for Molecular Image
Recognition [4.8] MolNexTRは、ConvNextとVision-TRansformerの強みを融合させる新しい画像-グラフモデルである。
同時に原子と結合を予測し、それらのレイアウトルールを理解することができる。
MolNexTRは81-97%の精度で優れた性能を示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:32:12 GMT)
Continual Learning and Catastrophic Forgetting [4.6] この章は、非定常的なデータストリームから漸進的に学習するプロセスである継続的学習のダイナミクスを掘り下げている。
重要な理由は、何か新しいことを学ぶとき、これらのネットワークは、彼らが以前に学んだことを素早く、そして劇的に忘れてしまう傾向があることです。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:32:43 GMT)
ManyQuadrupeds: Learning a Single Locomotion Policy for Diverse
Quadruped Robots [4.6] 動物運動制御からインスピレーションを得ることにより、四足歩行ロボットの1つの移動方針を効果的に訓練できることを示す。
我々の方針は脊髄の中央パターン生成器(CPG)の表現を調節する。
我々は,A1ロボットの名目質量の125%に相当する15kgの負荷を付加しても,頑健な性能を観察する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:10:02 GMT)
A Probabilistic Hadamard U-Net for MRI Bias Field Correction [4.5] 本稿では,前立腺MRIバイアス場補正のための確率的アダマールU-ネットを提案する。
高速な推論速度で前立腺MRIのバイアス場を補正するためのPHU-Netの有効性を示す実験を行った。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:02:34 GMT)
Can't Remember Details in Long Documents? You Need Some R&R [4.5] 2つの新しいプロンプトベースのメソッドを組み合わせた$textitR&R$を紹介します。
リプロンプトでは、コンテクスト文書を通して定期的にプロンプト命令を繰り返す。
ICRでは、LSMに直接答えるように指示するのではなく、最上位の$k$パス番号を検索するように指示する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:03:20 GMT)
Select High-Level Features: Efficient Experts from a Hierarchical
Classification Network [4.2] 本研究では,予測性能を損なうことなく,タスクと計算の複雑さを動的に低減する新しいエキスパート生成手法を提案する。
これは、一般的な低レベル特徴の逐次処理と並列性と高レベルの特徴のネスト処理を組み合わせた、新しい階層型分類ネットワークトポロジーに基づいている。
動的推論の観点では、我々の方法論は最大88.7.%のパラメータと73.4.%のギガ乗算(GMAC)演算を除外することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:02:42 GMT)
Dynamics of Moral Behavior in Heterogeneous Populations of Learning
Agents [4.2] 本研究では、道徳的に異質な集団が社会的ジレンマ環境で相互作用する学習力学について研究する。
我々は、親社会と反社会的エージェント間のいくつかの非自明な相互作用を観察する。
モラルエージェントのある種のクラスは、より協調的な行動に向けて利己的なエージェントを操ることができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:25:09 GMT)
A Benchmark of Domain-Adapted Large Language Models for Generating Brief
Hospital Course Summaries [4.2] 大規模言語モデル(LLM)は、現実世界のタスクを自動化する際、顕著な能力を示しているが、医療応用の能力は示されていない。
我々はMIMIC-IVノートから抽出した前処理データセットからなる新しいベンチマークを提案する。
臨床ノートからBHC合成を改善するために,2つの汎用LSMと3つの医療適応LSMの性能を評価した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:17:55 GMT)
The Brain Tumor Segmentation (BraTS) Challenge 2023: Focus on Pediatrics
(CBTN-CONNECT-DIPGR-ASNR-MICCAI BraTS-PEDs) [4.1] 中枢神経系の小児腫瘍は、小児におけるがん関連死の最も一般的な原因である。
小児の高次グリオーマの生存率は20%未満である。
BraTS-PEDs 2023チャレンジは、小児脳グリオーマのためのボリュームセグメンテーションアルゴリズムの開発に焦点を当てている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:06:42 GMT)
Semicoherent Symmetric Quantum Processes: Theory and Applications [4.1] 半コヒーレントな文脈で、$varepsilon$-approximationsプロセスと対称性の相互作用を考える。
我々の研究は、近未来における量子力学の制御に対称性をどのように利用できるか、より深く理解し、より深い評価の道を開く。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:33:33 GMT)
3D Face Reconstruction Using A Spectral-Based Graph Convolution Encoder [4.0] 本稿では,既存の2次元機能と3次元機能を統合し,モデル学習プロセスを導く革新的なアプローチを提案する。
我々のモデルはデータセットの組み合わせから2D-3Dデータペアを用いて訓練され、NoWベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:09:46 GMT)
Quantum error cancellation in photonic systems -- undoing photon losses [3.9] 実際のフォトニックデバイスは、システムに符号化された量子情報を復号化できる光子損失を受ける。
本稿では,確率的エラーキャンセルにインスパイアされたエラー軽減プロトコルを提案する。
提案プロトコルは,期待値推定タスクにおける光子損失を解消できることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:16:43 GMT)
Motion-Guided Dual-Camera Tracker for Low-Cost Skill Evaluation of
Gastric Endoscopy [3.9] 動作誘導型デュアルカメラトラッカーを提案し, 内視鏡技術評価のためのメカニカルシミュレータ内で, 信頼性の高い先端位置フィードバックを低コストで提供する。
内視鏡先端の顕著な外観変化に対処するため, クロスカメラ相互テンプレート戦略を提案する。
提案するトラッカーは,デュアルカメラ上でのロバストかつ一貫したトラッキングによりSOTA性能を実現する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:31:46 GMT)
A Task-Driven Multi-UAV Coalition Formation Mechanism [3.9] 既存の連立形成機構は、UAVとタスク要件の関連性が低い。
本稿では,複数UAV連立ネットワーク協調タスク完了モデルを提案する。
限界効用に基づく連立形成のためのアルゴリズムが提案された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:10:46 GMT)
Contextual Bandits with Budgeted Information Reveal [3.9] コンテキストバンディットアルゴリズムは、パーソナライズされた治療を推奨するために、デジタルヘルスで一般的に使用される。
治療の有効性を確保するため、患者は直接の利益のない行動を取るよう要求されることが多い。
本稿では,この問題に対処するための新しい最適化と学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:16:17 GMT)
Incompatibility as a resource for programmable quantum instruments [3.8] 資源理論の観点からプログラマブル・インスツルメンツ・デバイス(PID)について検討する。
物理的に重要なPIDのクラスは、実装する量子メモリを必要としないものである。
我々は、追加の量子メモリを必要としないプロセスを用いて、PID間の不整合事前順序を特定する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:36:15 GMT)
EAN-MapNet: Efficient Vectorized HD Map Construction with Anchor
Neighborhoods [3.7] Anchor Neighborhoodsを用いた効率的なHDマップ構築のためのEAN-MapNetを提案する。
nuScenesデータセットでは、EAN-MapNetが63.0 mAPで最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:33:06 GMT)
Internet Sanctions on Russian Media: Actions and Effects [3.7] ウクライナに対するロシアの攻撃を受けて、欧州連合(EU)はロシア連邦に属する組織や個人に対して制裁を課した。
本稿では、これらの制裁の実施を疑問視し、国の政府令の統一を効果的な技術的対策に変換する手段として解釈する。
我々は、国際的にも、個々の加盟国内でも、幅広い種類のブロッキングカバレッジを見いだしている。
我々は、EUの制裁によるデジタル主権は、具体的ではあるが情報の流れに明らかに限定的な影響を与えるという結論を導いた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:19:39 GMT)
Distill n' Explain: explaining graph neural networks using simple
surrogates [3.6] 我々はグラフニューラルネットワーク(GNN)におけるノード予測を説明するためにDistill n' Explain (DnX)を提案する。
まず、DnXは、知識蒸留により代理GNNを学習し、次に、単純な凸プログラムを解くことにより、ノードまたはエッジレベルの説明を抽出する。
我々はまた、我々の代理モデルの線形分解を利用するDnXのより高速なバージョンであるFastDnXを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:51:55 GMT)
Improving the Successful Robotic Grasp Detection Using Convolutional
Neural Networks [3.5] 本稿では,異なる物体や見えない物体に対する矩形表現としてグリップを検出しようとする改良されたパイプラインモデルを提案する。
主なアイデアは、前処理、出力正規化、データ拡張によって、システムが遅くなることなく精度を4.3%向上させることである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:55:07 GMT)
An Efficient Quasi-Random Sampling for Copulas [3.4] 本稿では、GAN(Generative Adrial Networks)のような生成モデルを用いて、任意のコプラに対して準ランダムなサンプルを生成することを提案する。
GANは、複雑なデータの分布を学習するために使われる暗黙的な生成モデルの一種であり、簡単にサンプリングできる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:01:09 GMT)
Synthetic Privileged Information Enhances Medical Image Representation
Learning [3.2] マルチモーダルな自己教師型表現学習は、医用画像解析において非常に効果的な方法であることが一貫して証明されている。
本研究では,ペア化された情報を合成することによって,表現学習を大幅に改善できることを実証する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:18:26 GMT)
Understanding Energy Level Structure Using Quantum Rubik's Cube [3.2] この研究は、量子ルービックキューブ行列とベナルカザール・ベルネヴィグ・ヒューズモデルを組み合わせたものである。
量子ルービックキューブ行列の操作をより明確にするために、ジョゼフス環を用いてルービックキューブ拡大の位相グラフを描く。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:45:13 GMT)
VTruST: Controllable value function based subset selection for
Data-Centric Trustworthy AI [3.1] 信頼できるAIは、高度なアプリケーションにAIを広く採用するために不可欠である。
本稿では,データ中心型信頼性AI(DCTAI)-VTruSTのための制御可能なフレームワークを提案する。
VTruSTは、社会的、画像的、科学的なデータセットにおける最先端のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:28:42 GMT)
HAISTA-NET: Human Assisted Instance Segmentation Through Attention [3.1] より正確な予測を可能にし,高品質なセグメンテーションマスクを生成する新しい手法を提案する。
我々の人間支援セグメンテーションモデルHAISTA-NETは、既存のStrong Mask R-CNNネットワークを拡張し、人間の特定部分境界を組み込む。
HAISTA-NETは,Mask R-CNN,Strong Mask R-CNN,Mask2Formerなどの最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:30:58 GMT)
A Framework for Effective AI Recommendations in Cyber-Physical-Human
Systems [3.1] 多くのサイバー物理人間システム(CPHS)は、人工知能(AI)プラットフォームからレコメンデーションを受けることができる人間の意思決定者を含んでいる。
このようなCPHSアプリケーションでは、人間の意思決定者は最適な推奨決定から離脱し、代わりに様々な理由で異なる決定を実装できる。
我々は、AIプラットフォームとは異なる方法でシステムの状態を知覚し、解釈することにより、人間がAIレコメンデーションから逸脱する可能性があると考えている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:02:20 GMT)
Advancing Deep Active Learning & Data Subset Selection: Unifying
Principles with Information-Theory Intuitions [3.1] 本論文は,ディープラーニングモデルのラベルとトレーニング効率を向上させることにより,ディープラーニングの実践性を高めることを目的とする。
本稿では,情報理論の原理に基づくデータサブセット選択手法,特にアクティブラーニングとアクティブサンプリングについて検討する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:32:13 GMT)
Limited or Biased: Modeling Sub-Rational Human Investors in Financial
Markets [2.9] 我々は、強化学習を用いて、人間のサブリレータリティの5つの側面を組み込んだフレキシブルモデルを導入する。
我々は,手作り市場シナリオとSHAP値分析を用いて,サブ専門家の行動を評価する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:31:36 GMT)
C2P-GCN: Cell-to-Patch Graph Convolutional Network for Colorectal Cancer
Grading [2.8] グラフベースの学習アプローチは、大腸癌組織像のグレード化にますます好まれている。
最近のグラフベースの手法では、スライドイメージ全体を小または中規模のパッチに分割し、各パッチにグラフを構築してトレーニングに使用する。
この方法は、WSI全体に存在する組織構造情報をキャプチャできず、画像パッチの膨大なデータセットからのトレーニングに依存します。
本稿では,2段階グラフ生成に基づく新しいセル・ツー・パッチグラフ畳み込みネットワーク(C2P-GCN)を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:15:43 GMT)
Speech Robust Bench: A Robustness Benchmark For Speech Recognition [2.8] Speech Robust Bench (SRB) は、さまざまな汚職に対するASRモデルの堅牢性を評価するためのベンチマークである。
SRBは69の入力摂動で構成されており、ASRモデルが物理的およびデジタルの世界で遭遇する可能性のある様々な腐敗をシミュレートすることを目的としている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:10:29 GMT)
Noise Robustness of Quantum Relaxation for Combinatorial Optimization [2.8] QRAOは、問題を解くのに必要なキュービットの数を減少させる緩和アルゴリズムである。
ノイズは未知のQRAOの2成分溶液の品質に影響を及ぼす。
脱分極雑音下でのQRAOのロバスト性の背後にある確実なメカニズムについて論じる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:41:55 GMT)
Efficient Measurement of the Bi-photon Spatial Mode Entanglement with
Stimulated Emission Tomography [2.7] タイプII SPDC結晶が生成する絡み合った光子対の軌道角運動量(OAM)スペクトルを測定する。
我々は,OAMスペクトルの強いアイドラー生成と理論予測との良好な一致を観察する。
この実験は、超薄型SPDC源による2光子波動関数の効率的な測定の道を開くことを期待する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:27:19 GMT)
Hybridized Convolutional Neural Networks and Long Short-Term Memory for
Improved Alzheimer's Disease Diagnosis from MRI Scans [2.6] 本研究では,CNNモデルの特徴抽出機能とLSTMモデルの検出機能を組み合わせたハイブリッドモデルを提案する。
ADNIデータセットを利用したハイブリッドモデルのトレーニング。
モデルの精度は98.8%、感度は100%、特異度は76%に達した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:34:32 GMT)
A Survey on Quantum Reinforcement Learning [2.6] 量子強化学習は、量子コンピューティングと機械学習の交差する分野である。
既に利用可能なノイズの多い中間スケール量子デバイスに焦点を合わせ、それらは関数近似器として機能する変分量子回路を含む。
さらに、将来のフォールトトレラントハードウェアに基づく量子強化学習アルゴリズムを調査し、その一部は証明可能な量子優位性を持つ。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:06:43 GMT)
Spectrally-Corrected and Regularized Linear Discriminant Analysis for
Spiked Covariance Model [2.5] 本稿では、スペクトル補正および正規化LDA(SRLDA)と呼ばれる線形判別分析の改善を提案する。
SRLDAはスパイクモデル仮定の下で線形分類大域最適解を持つことが証明された。
異なるデータセットに対する実験により、SRLDAアルゴリズムは、現在使われているツールよりも分類と次元の削減が優れていることが示された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:48:08 GMT)
Concept-aware Data Construction Improves In-context Learning of Language Models [2.5] 従来の命令チューニングと比較して,概念認識型インコンテキスト学習が新しいタスクの大部分に有効であることを示す。
概念認識学習(CoAT)は,実演から類推的推論概念を学習する上で,LMにとって有益な訓練シナリオを構築するためのフレームワークである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:07:47 GMT)
Geometric Neural Network based on Phase Space for BCI decoding [2.4] ディープラーニング(DL)アルゴリズムの脳信号解析への統合は、まだ初期段階にある。
EEGは、非侵襲的で費用効果の高い性質と時間分解能に優れたため、BCIシステムを設計するための広く採用されている選択である。
本稿ではSPDNet$_psi$アーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:36:20 GMT)
Cross-lingual Transfer or Machine Translation? On Data Augmentation for
Monolingual Semantic Textual Similarity [2.4] Wikipediaデータの言語間転送では、モノリンガルSTSのパフォーマンスが改善されている。
学習データとしてNLIに着目した先行研究とは対照的に,これらの言語ではWikipediaドメインがNLIドメインよりも優れている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:28:15 GMT)
Node Centrality Approximation For Large Networks Based On Inductive
Graph Neural Networks [2.4] ネットワーク分析において、クローズネス中央度(CC)とブロードネス中央度(BC)が重要な指標である。
大規模なネットワーク上での実践的な実装は、その高速な複雑さのため、計算的に要求される。
本稿では,CNCA-IGEモデルを提案する。CNCA-IGEモデルは,CCやBCのメトリクスに基づいてノードをランク付けするインダクティブグラフエンコーダ・デコーダモデルである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:23:12 GMT)
Adversarial Sparse Teacher: Defense Against Distillation-Based Model
Stealing Attacks Using Adversarial Examples [2.4] 知識蒸留(KD)は、先進的な教師モデルからより単純な学生モデルへの識別能力の移行を促進する。
また、モデル盗難攻撃にも利用されており、敵はKDを使って教師モデルの機能を模倣している。
この領域の最近の発展は、スパースアウトプットが学生モデルの性能を著しく低下させることを示す経験的分析であるスティンギー教師モデルの影響を受けている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:43:27 GMT)
MoD-SLAM: Monocular Dense Mapping for Unbounded 3D Scene Reconstruction [2.4] MoD-SLAMは、非有界シーンにおけるリアルタイムな3次元再構成を可能にする、最初のモノクラーNeRFを用いた高密度マッピング法である。
追跡処理にロバストな深度損失項を導入することにより,大規模シーンにおけるより正確なポーズ推定を実現する。
2つの標準データセットを用いた実験により, MoD-SLAMは競争性能を向上し, 3次元再構成の精度を最大30%, 15%向上した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:42:34 GMT)
Enhancing Automatic Modulation Recognition for IoT Applications Using Transformers [2.3] 本稿では,効率的なAMRのためのトランスフォーマーネットワークを用いた新しい手法を提案する。
実験の結果,提案手法は高度な深層学習技術より優れており,高い認識精度が得られた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:33:03 GMT)
An Improved Algorithm for Learning Drifting Discrete Distributions [2.2] 分散ドリフト下で離散分布を学習するための新しい適応アルゴリズムを提案する。
時間とともに変化する離散分布から独立したサンプルの列を観察し、その目標は現在の分布を推定することである。
より多くのサンプルを使用するには、過去にさらにサンプルに頼らなければならず、分布の変化によって生じるバイアスによりドリフトエラーが発生する。
ドリフトに関する事前の知識を必要とせずにこのトレードオフを解くことができる新しい適応アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:54:27 GMT)
Quantum Many-body Scar Models in One Dimensional Spin Chains [2.2] 本稿では,単純なモジュールを組み合わせることで,スカーモデルを構築するための一般的な手法を提案する。
我々は, このモデルの熱化と非可積分性を数値的に検証し, 傷跡状態の動的性質を実証する。
パラメータの連続的なチューニング性のため、このモデルはまた、QMBSの非可積分系から可積分系への遷移を調査することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:30:14 GMT)
Algorithmic Identification of Essential Exogenous Nodes for Causal
Sufficiency in Brain Networks [2.2] 脳の因果関係などの因果関係の解明において、因果関係の仮定は重要な役割を担っている。
そこで本稿では, 因果関係に係わる必要を満足する本質的ノードを決定するためのアルゴリズム的同定手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:05:47 GMT)
Brain decoding: toward real-time reconstruction of visual perception [2.2] 過去5年間で、生成的および基礎的AIシステムの使用は、脳活動の復号化を大幅に改善した。
視覚知覚は、機能的磁気共鳴イメージング(fMRI)から顕著な忠実さでデコードできる。
本稿では、高時間分解能で脳活動を測定する神経イメージング装置である脳磁図(MEG)に基づく別のアプローチを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:35:13 GMT)
(Chat)GPT v BERT: Dawn of Justice for Semantic Change Detection [2.2] BERTや(Chat)GPTのようなトランスフォーマーベースの言語モデルは、オープンな研究問題を解決するために強力な力を持つ語彙スーパーヒーローとして登場した。
我々は,Word-in-Context(WiC)タスクの2つのダイアクロニック拡張(TempoWiCとHistoWiC)を解く能力を評価する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:00:31 GMT)
Photonic simulation of Majorana-based Jones polynomials [2.1] ジョーンズ環は、位相的に異なるリンクを区別するための道具として導入された。
最近では、非アベリア異性体をブレイディングすることで、トポロジカル量子計算の中心的構成要素として出現した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:35:06 GMT)
Slow Light Augmented Unbalanced Interferometry for Extreme Enhancement
in Sensitivity of Measuring Frequency Shift in a Laser [2.0] レーザーの周波数シフトを測定する感度を高めるために、緩やかに拡張されたマッハ・ツェンダー干渉計を使用することができる。
レーザの周波数シフトの測定に依存するセンサの感度は、この技術により大幅に向上することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:57:23 GMT)
Quantifying Manifolds: Do the manifolds learned by Generative
Adversarial Networks converge to the real data manifold [1.9] MLモデルにより学習された固有多様体の次元と位相的特徴、モデルのトレーニングを続けるにつれてこれらの指標がどのように変化するか、そしてこれらの指標が実データ多様体のメトリクスにトレーニングの過程で収束するかを考察する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:23:50 GMT)
The R2D2 deep neural network series paradigm for fast precision imaging
in radio astronomy [1.9] 最近の画像再構成技術は、CLEANの能力をはるかに超えて、画像の精度が著しく向上している。
高ダイナミックレンジイメージングのためのResidual-to-Residual DNNシリーズと呼ばれる新しいディープラーニング手法を導入する。
R2D2の高精度化能力は、様々な画像範囲にわたってシミュレーションで実証されている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:57:54 GMT)
On the Pitfalls of Batch Normalization for End-to-End Video Learning: A
Study on Surgical Workflow Analysis [1.9] バッチの他のサンプルに依存するバッチ正規化(BN)固有の性質は、いくつかのタスクで問題を引き起こすことが知られている。
ビデオ学習におけるBNの落とし穴を解析し、期待する「暖房」効果などのオンラインタスクに特有な課題を含む。
外科的作業において,BNの落とし穴に対する意識は,効果的なエンドツーエンド学習に不可欠である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:24:04 GMT)
Spatial-aware Transformer-GRU Framework for Enhanced Glaucoma Diagnosis
from 3D OCT Imaging [1.8] 本稿では3次元光コヒーレンス・トモグラフィー(OCT)画像の診断値を利用した新しいディープラーニングフレームワークを提案する。
我々は、リッチスライスな特徴抽出のための網膜データに事前学習された視覚変換器と、スライス間空間依存性をキャプチャするための双方向Gated Recurrent Unitを統合する。
大規模データセットに対する実験結果から,提案手法の最先端手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:25:15 GMT)
Linearly Constrained Weights: Reducing Activation Shift for Faster Training of Neural Networks [1.8] 完全連結層と畳み込み層の両方の活性化シフトを低減するために,線形拘束重み (LCW) を提案する。
LCWは、消失する勾配問題を解くことにより、シグモイド活性化関数を持つディープフィードフォワードネットワークを効率的に訓練することができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:01:24 GMT)
Med3DInsight: Enhancing 3D Medical Image Understanding with 2D
Multi-Modal Large Language Models [1.6] 既存の3D畳み込みとトランスフォーマーベースの手法は、画像ボリュームのセマンティックな理解が限られている。
既存の3D画像エンコーダを2D MLLMでマージし,PSAT(Plane-Slice-Aware Transformer)モジュールを介してブリッジするMed3DInsightを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:15:53 GMT)
Private Count Release: A Simple and Scalable Approach for Private Data Analytics [1.6] 差分プライバシーで正確なカウントを解放できるデータ分析システムを提案する。
私たちの提案は、異なる要素に対するユーザのコントリビューションバウンダリに依存していません。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:55:16 GMT)
Improved particle-flow event reconstruction with scalable neural
networks for current and future particle detectors [1.5] 電子-陽電子衝突における事象再構成のためのスケーラブルな機械学習モデルについて, フル検出器シミュレーションに基づく検討を行った。
グラフニューラルネットワークとカーネルベースのトランスフォーマーを比較し、現実的な再構築を実現しつつ、操作を回避できることを実証する。
最良のグラフニューラルネットワークモデルでは、ルールベースのアルゴリズムと比較して、ジェット横運動量分解能が最大50%向上している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:01:11 GMT)
Maximal Non-Kochen-Specker Sets and a Lower Bound on the Size of
Kochen-Specker Sets [1.5] Kochen-Specker (KS) 集合は、反ポッド対を持たない二球面上のベクトルの有限集合である。
KS集合の存在は、コチェンとスペクターの非文脈的隠れ変数理論に対する議論の中心にある。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:38:16 GMT)
Extraction and Recovery of Spatio-Temporal Structure in Latent Dynamics
Alignment with Diffusion Models [1.5] 行動関連脳の計算では、神経信号をその中の急激な領域に合わせる必要がある。
本研究では,拡散モデルの表現性を利用して潜在力学の固有時間構造を保存するアライメント手法であるEDDiffを提案する。
提案手法は, 潜時力学の時間的構造を保ち, 整合性, ニューラルデコード性能において, 既存の手法より優れることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:11:55 GMT)
Enhancing Texture Generation with High-Fidelity Using Advanced Texture
Priors [1.5] 粗いテクスチャを初期入力として利用する高分解能で高忠実なテクスチャ復元手法を提案する。
また,現在の高分解能テクスチャ合成方式におけるノイズ問題に対処する自己教師型スキームに基づく背景雑音平滑化手法を提案する。
本手法により,高分解能なテクスチャ合成が可能となり,高精細テクスチャ合成技術への道が開かれた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:07:28 GMT)
Self-Supervised Multiple Instance Learning for Acute Myeloid Leukemia
Classification [1.3] 急性骨髄性白血病(AML)のような疾患は、単細胞レベルでのアノテーションが不足し、コストがかかるため困難である。
マルチインスタンス学習(MIL)は、弱いラベル付きシナリオに対処するが、ラベル付きデータで訓練された強力なエンコーダを必要とする。
本研究では,MILをベースとしたサブタイプAML分類のための事前学習手法として,自己監督学習(SSL)について検討する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:16:15 GMT)
Human-computer Interaction for Brain-inspired Computing Based on Machine
Learning And Deep Learning: A Review [1.3] 脳にインスパイアされたコンピューティングは、マルチモーダル技術とバイオメディカル分野の間の重要な交差点である。
本稿では、機械学習(ML)とディープラーニング(DL)に基づく脳に触発されたコンピューティングモデルについてレビューする。
脳にインスパイアされた計算モデルの大幅な進歩にもかかわらず、その能力を完全に活用することが課題である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:29:21 GMT)
Multi-Tower Multi-Interest Recommendation with User Representation Repel [1.2] 本稿では,ユーザ表現を補う新しい多層多目的フレームワークを提案する。
複数の大規模産業データセットにまたがる実験結果から,提案手法の有効性と一般化性が確認された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:36:14 GMT)
Quantum bounds for compiled XOR games and $d$-outcome CHSH games [1.2] Kalai et al. のコンパイル手順は、2種類のゲームに対する量子境界を保存することを示す。
任意の qubit の測定に対して、XOR ゲームが存在し、その最適な勝利確率はその測定の特定のペアの自己テストとして機能する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:20:21 GMT)
Quasilocal entanglement across the Mott-Hubbard transition [1.1] 厳密な準局所的絡み合いの測度の観点から、2次元ハバードモデルにおけるモット転移の代替的見解を提供する。
クラスター力学平均場理論の結果の空間分解解析は、モット局在の探索において最も近い隣り合う絡み合いの顕著な役割を解明する。
結果は、相互作用が増加すると単調に減少することが判明した単点フォン・ノイマンエントロピーに基づく以前の分析の矛盾を解消する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:34:10 GMT)
A Feature-based Generalizable Prediction Model for Both Perceptual and
Abstract Reasoning [1.1] 人間の知性の目印は、限られた経験から抽象的なルールを推論する能力である。
ディープラーニングの最近の進歩は、複数の人工知能ニューラルネットワークモデルが、人間のパフォーマンスにマッチしたり、超えたりしている。
本稿では,特徴検出,アフィン変換推定,探索を用いたルール検出と応用のためのアルゴリズム的アプローチを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:26:30 GMT)
Algorithmic error mitigation for quantum eigenvalues estimation [0.9] フォールトトレラントなコンピュータでさえ、固有値を推定する際にアルゴリズムエラーを受ける。
本稿では,アルゴリズムの誤りを低減できる誤り軽減戦略を提案する。
この結果から, 早期耐故障デバイスにおいても, 精度の高い固有値推定が可能であることがわかった。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:50:22 GMT)
Exploring the Links between the Fundamental Lemma and Kernel Regression [0.9] 基本補題のカーネル回帰と既知の非線形拡張の関係を定式化する。
この表現は、特定のカーネル回帰問題の解と等価であることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:59:15 GMT)
Treespilation: Architecture- and State-Optimised Fermion-to-Qubit
Mappings [0.9] 我々は,フェルミオン系を効率的にマッピングする手法である「ツリースピレーション」を導入する。
我々はこの手法を用いて化学基底状態のシミュレーションに必要なCNOTゲート数を最小化する。
完全な接続性に関するCNOTのカウントでは、最大で74%の大幅な削減が観測されている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:14:07 GMT)
Transfer and routing of Gaussian states through quantum complex networks
with and without community structure [0.8] 単一モードガウス状態のルーティングと量子調和振動子の複雑なネットワークによる絡み合いについて検討する。
ランダムで均一なネットワークであっても、転送の忠実度は、任意のリンク密度のノードの度合いに依存する。
本研究は,国家移動と関連する課題におけるコミュニティ構造の役割のさらなる探求の道を開くものである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:00:03 GMT)
Effective Fault Localization using Probabilistic and Grouping Approach [0.8] 本研究の目的は, 条件付き確率の概念を用いて, 効果的な断層位置決め手法を設計することである。
本稿では,文のカバレッジ情報とテストケースの実行結果の関係を導出するフォールトローカライゼーション手法を提案する。
本研究では,11個のオープンソースデータセットに対して提案手法の有効性を評価する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:55:09 GMT)
The Blind Normalized Stein Variational Gradient Descent-Based Detection for Intelligent Massive Random Access [0.8] 本稿では,MLEモデルに基づく早期プリアンブル検出手法を提案する。
MLEモデルに対する近似解を得るために,新しい盲点正規化スタイン変分勾配勾配検出器(SVGD)を提案する。
提案したブロックMHT層は、コストと性能の劣化の観点から、他の変換方式よりも優れている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:08:40 GMT)
To Err Is Human, but Llamas Can Learn It Too [0.7] 本研究では,言語モデル(LM)を用いた文法的誤り訂正の強化について検討する。
Llama 2-based LMs for error generation, and found that this approach yields synthetic error to a same error。
我々はこれらの人工的誤りの助けを借りてGEC Llamaモデルを訓練し、過去の最先端の誤り訂正モデルより優れていた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:04:03 GMT)
Probing Quantum Telecloning on Superconducting Quantum Processors [0.7] 量子テレクロニング(Quantum Telecloning)は、異なるパーティによって構築される量子情報の近似コピーを可能にする。
量子テレクロニングは、古典的なコプロセッサを用いて量子コンピュータの回路として実装することができる。
我々は,現在までの量子テレクロニング(単一量子ビット)に関する,最大かつ最も包括的なNISQコンピュータ実験の1つを提示する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:39:45 GMT)
Packaging Up Media Mix Modeling: An Introduction to Robyn's Open-Source Approach [0.7] 中小企業の広告主の多くは、高度なプロプライエタリなモデリング活動に投資する規模やリソースを欠いている。
デジタル広告測定にメディアミックスモデリングを広く採用するために、Metaのマーケティングデータサイエンティストはオープンソースの計算パッケージRobinnを始めた。
この記事では、Robinnにおけるアーキテクチャコンポーネントと選択について説明し、Robinnがどのようにバイアスや組織的受け入れに対してパッケージ化されることを目指しているかについて論じる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:46:03 GMT)
Blind Source Separation of Single-Channel Mixtures via Multi-Encoder
Autoencoders [0.7] ブラインドソース分離(BSS)は、ソースやミキシングシステムの事前の知識なしに、ソースを混合物から分離することを含む。
マルチエンコーダオートエンコーダの自然特徴部分空間特化能力を活用することで,単一チャネルの非線形混合体を用いたBSSに対処する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:45:37 GMT)
A Systematic Comparison of Contextualized Word Embeddings for Lexical
Semantic Change [0.7] 我々は、勾配変化検出(GCD)のための最先端モデルとアプローチを評価する。
我々はLCC問題をWord-in-Context(WiC)タスクとWord Sense Injection(WSI)タスクに分解し、これらの異なるレベルのモデルと比較する。
i) APDはGCDの他のアプローチよりも優れており、 (ii) XL-LEXEMEはGPT-4と同等でありながら、WiC、WSI、GCDの他の文脈モデルよりも優れています。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:50:40 GMT)
Authorship Attribution in Bangla Literature (AABL) via Transfer Learning
using ULMFiT [0.7] 著者属性(英: Authorship Attribution)とは、あるテキストの原作者を特定するために、テキストの適切な特徴づけを作成するタスクである。
英語、スペイン語、中国語など他の言語にも大きな進歩があったが、バングラはこの分野の包括的な研究を欠いている。
既存のシステムは、著者数が増えるとスケーラビリティが低下し、著者1人当たりのサンプル数が少なくなる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:42:59 GMT)
Recovery Guarantees of Unsupervised Neural Networks for Inverse Problems
trained with Gradient Descent [0.7] 一般化損失関数の収束と回復の保証は、勾配流を通したトレーニングでは真であることを示す。
また、この離散化は2層DIPネットワークの過パラメータ化に一定でしか影響しないことを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:45:13 GMT)
A Simple Framework Uniting Visual In-context Learning with Masked Image
Modeling to Improve Ultrasound Segmentation [0.6] ビジュアル・イン・コンテクスト・ラーニング(ICL)はコンピュータ・ビジョンの新しい研究分野である。
視覚的ICLペアリング画像とマスク画像モデリング(MIM)を組み合わせ,教師あり学習のための簡易な視覚的ICL手法SimICLを提案する。
SimICL は Dice coeffient (DC) が 0.96 で Jaccard Index (IoU) が 0.92 で、最先端のセグメンテーションとビジュアル ICL モデルを上回った。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:48:41 GMT)
Load Balancing For High Performance Computing Using Quantum Annealing [0.6] 高速コンピューティングにおける2つのパラダイム的アルゴリズムの負荷バランスに対する量子アニールの適用について検討する。
グリッドベースの文脈では、量子アニールはラウンドロビンプロトコルのような古典的手法よりも優れているが、より先進的な手法よりも決定的な優位性を欠いている。
これは、効果的なCPU使用量に大きな影響を与える、ソリューション品質の注目すべき進歩を示している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:58:12 GMT)
Applications of model-aware reinforcement learning in Bayesian quantum
metrology [0.6] Belliardo et al., arXiv:2312.16985 (2023) では、量子力学と推定において幅広いタスクを最適化できる手順を紹介した。
我々は、トレーニングにおいて、システムを記述する物理を明示的に考慮した最適化にモデルベースのアプローチを採用する。
この展示は、PyPIでリリースされたqsensoroptライブラリで実装されている、この方法の幅広い適用性を示している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:48:07 GMT)
GSEdit: Efficient Text-Guided Editing of 3D Objects via Gaussian
Splatting [0.6] 本稿では,Gaussian Splattingモデルに基づくテキスト誘導型3Dオブジェクト編集パイプラインであるGSEditを紹介する。
本手法では, 3Dオブジェクトの形状や外観の編集を, 消費者ハードウェア上で数分で行うことなく行うことができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:42:23 GMT)
Approaching the double-Heisenberg-scaling sensitivity in the
Tavis-Cummings model [0.5] タビス・カミングス (TC) モデルのような原型キャビティ・量子電磁力学 (QED) システムにより, ダブルHSの精度が達成できることを実証した。
本稿では、現実的な実験的状況下で、この二重HS精度を実現するための方法論について論じる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:59:47 GMT)
TIPS: Threat Sharing Information Platform for Enhanced Security [0.5] 本稿では、属性ベース暗号化(ABE)、同型暗号化(HE)、ゼロ知識証明(ZKP)を統合した信頼情報共有プロセスの抽象化を提案する。
次に、2つの脅威共有エージェント間のプロトコル交換を提供し、信頼されたチャネルを通じて暗号化されたメッセージを共有する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:50:49 GMT)
Percolation as a confinement order parameter in $\mathbb{Z}_2$ lattice
gauge theories [0.5] 本稿では, 動的物質の閉じ込めを$mathbbZ$ LGTsで探索するために, パーコレーションにインスパイアされた順序パラメータ (POPs) を提案する。
提案するPOPは,閉じ込めの幾何学的視点を提供し,量子シミュレータで得られたスナップショットに直接アクセス可能である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:15:13 GMT)
New intelligent defense systems to reduce the risks of Selfish Mining
and Double-Spending attacks using Learning Automata [0.4] 我々は、二重投機と利己的な鉱業攻撃を組み合わせた新たな攻撃を導入する。
我々はSDTLAとWVBMの2つのモデルを開発した。
我々の発見は、ブロックチェーンネットワークのセキュリティと効率を高めるための有望なソリューションとして、SDTLAとWVBMの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:42:28 GMT)
Engineering Formality and Software Risk in Debian Python Packages [0.4] FLOSS(Free/libre and Open Source Software)は、グローバルコンピューティングインフラにおいて重要なソフトウェアである。
エンジニアリングサプライと需要の不整合による失敗のリスクは、コードベースの崩壊につながった。
FLOSSプロジェクトは自己組織化されているが、多くの場合、より大きく、よりフォーマルな取り組みへと拡張される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:44:01 GMT)
Can Error Mitigation Improve Trainability of Noisy Variational Quantum
Algorithms? [0.4] 変分量子アルゴリズム(VQA)は、しばしば短期量子優位の最良の希望と見なされる。
近年の研究では、ノイズはVQAのトレーニング可能性を大幅に制限することが示された。
Error Mitigation (EM) は、ノイズが短期デバイスに与える影響を減らすことを約束している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:47:22 GMT)
vSPACE: Voting in a Scalable, Privacy-Aware and Confidential Election [0.4] vSPACEは、安全でプライベートでスケーラブルな選挙に対する新しいアプローチを提示している。
AnonCreds SSI (Self-Sovereign Identity)を統合してTrueElectとElectAnonプロトコルを拡張した。
vSPACEは、不変かつ認証可能な監査パスに対して、Distributed Ledger Technology (DLT)を統合している。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:56:10 GMT)
Synthetic data generation for system identification: leveraging
knowledge transfer from similar systems [0.4] 本稿では,データ不足を特徴とするシナリオにおけるモデル一般化とロバスト性の向上を目的とした,新しい合成データ生成手法を提案する。
合成データは、興味あるシステムが属すると考えられる幅広い種類のシステムを記述する、事前訓練されたメタモデルによって生成される。
この手法の有効性は,システム識別プロセスに合成データを組み込むことの利点を強調する数値的な例を通して示される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:09:15 GMT)
Multi-qubit Dynamical Decoupling for Enhanced Crosstalk Suppression [0.3] 静的クロストークは超伝導体や半導体量子ビットを含む様々なハードウェアプラットフォームに存在する。
駆動クロストークは、他のキュービット上の駆動ゲートからの漏れにより、望ましくない駆動用語として発生する可能性がある。
2組の量子ビットが同時に自由進化する「イドル・イドル」実験と、一方のペアが連続的に駆動される「駆動・イドル」実験である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:36:15 GMT)
Efficient Light Propagation Algorithm using Quantum Computers [0.3] 現代光学の基盤の1つはビーム伝搬アルゴリズムである。
伝搬は$mathcalO(logN)$ 1 個の位相ゲートで量子計算できることを示す。
我々は、量子的優位性を維持するために適切な観測可能なものを選ぶことの重要性を強調した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:29:38 GMT)
Fine-tuning a Multiple Instance Learning Feature Extractor with Masked
Context Modelling and Knowledge Distillation [0.2] 我々は,知識蒸留を用いたコンテキストモデリングを用いて特徴抽出モデルを微調整することにより,下流MIL分類を向上させることを提案する。
提案したタスクの1つのエポックは、MILシナリオで使用する場合の特徴抽出モデルの下流性能を向上させるのに十分であり、計算のごく一部を必要とする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:04:30 GMT)
SF-MMCN: A Low Power Re-configurable Server Flow Convolution Neural Network Accelerator [0.2] 畳み込みニューラルネットワーク(CNN)アクセラレータは近年急速に開発されている。
様々な機能とアルゴリズムを備えたCNNアクセラレータが多数存在し、低消費電力と高速な性能を実現している。
従来のCNNアクセラレータではPEアレイのスケールが大きすぎるため、乗算および蓄積(MAC)計算を行う際に最もエネルギー消費がかかる。
CNNモデルにおける並列構造の出現は、操作効率と面積効率の両方に影響を与えるため、CNNアクセラレータの設計に挑戦する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:04:14 GMT)
On marginal feature attributions of tree-based models [0.1] 辺縁的なシャプリー、オーウェンまたはバンジャフの値など、辺縁的な期待に基づく局所的な特徴属性を用いることができる。
パス依存(path-dependent)のTreeSHAPが特徴のランク付けを行うのと全く同じ関数を計算する2つの(統計的に類似した)決定木を提示する。
我々は、CataBoostモデルの余剰Shapley(およびBanzhafとOwen)値についてのみ、複雑さを改善し、内部モデルパラメータの観点からのみ、明示的な式を導出するために対称性を利用する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:01:00 GMT)
DualBEV: CNN is All You Need in View Transformation [0.0] カメラに基づくBird's-Eye-View(BEV)の知覚は、しばしば3D-to-2Dまたは2D-to-3Dビュートランスフォーメーション(VT)の採用に苦慮する。
我々は,共有CNNに基づく特徴変換を利用した統合フレームワークであるDualBEVを提案する。
提案手法は Transformer を使わずに, 55.2% mAP と 63.4% の NDS を nuScenes テストセット上で, LSS アプローチに匹敵する効率性を実現する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:58:00 GMT)
Will GPT-4 Run DOOM? [0.0] GPT-4の推論と計画能力は1993年のファーストパーソンシューティングゲーム『Doom』にまで拡張されている。
GPT-4は、ドアを操作し、敵と対戦し、パスを行うことができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:30:41 GMT)
Volume-entangled exact eigenstates in the PXP and related models in any
dimension [0.0] 本稿では,多体型アインシュタイン-ポドルスキー-ローゼン型体積エンタングルド正確な傷痕をライドベルク・ブロッドド原子系に対する多様なPXP型モデルで提示するアプローチについて述べる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:36:30 GMT)
Understanding Hybrid Spaces: Designing a Spacetime Model to Represent
Dynamic Topologies of Hybrid Spaces [0.0] 本研究では,ハイブリッド空間の動的位相の可視化のための時間モデルを開発した。
既存のハイブリッド空間の概念と表現のタイプを示す。
ハイブリッド空間の様々な動的トポロジーがうまく可視化された。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:18:27 GMT)
Tune without Validation: Searching for Learning Rate and Weight Decay on
Training Sets [0.0] Tune without Validation (Twin)は、学習率と体重減少をチューニングするためのパイプラインである。
我々は、20の画像分類データセットに関する広範な実験を行い、ディープネットワークの数家族を訓練する。
我々は,スクラッチと微調整の訓練において適切なHP選択を示し,小サンプルシナリオを強調した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:57:00 GMT)
Towards a Psychology of Machines: Large Language Models Predict Human
Memory [0.0] 本研究では,言語ベースのメモリタスクにおいて,ChatGPTが人間のパフォーマンスを予測する能力について検討する。
本研究では,人間とChatGPTの文関連性評価,ChatGPTのヤードパス文の記憶可能性評価,およびガーデンパス文の自然記憶の測定を行った。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:41:14 GMT)
Tortoise: An Authenticated Encryption Scheme [0.0] Tortoiseは、Synthetic Counter-in-Tweakをモデルとした、実験的なナンスベースの認証暗号化スキームである。
本稿では,ブロック暗号をAssociated Dataを用いた認証暗号化に変換するための汎用的なプラグイン・アンド・プレイフレームワークを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:51:57 GMT)
Theory of Multimode Squeezed Light Generation in Lossy Media [0.0] 損失媒体で発生する多重モード励起光の特性を記述するための統一的理論的アプローチを示す。
ガウス状態の重要なクラスについて、2階相関関数のマスター方程式を導出する。
ブロードバンドモードを導入するための様々な技術や戦略を考えることができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:30:34 GMT)
The role of polaron dressing in superradiant emission dynamics [0.0] 偏光線ドレッシングが明るいディック状態と暗いディック状態の混合によって光子放射に与える影響を示す。
数値シミュレーションにより, この混合は, システムの励起状況に大きく依存していることが判明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:57:08 GMT)
Tell me the truth: A system to measure the trustworthiness of Large
Language Models [0.0] 大型言語モデル (LLM) は2023年11月にChatGPTが導入されて以来、ほとんどのニュースでトップの座を占めてきた。
企業が採用に抵抗している主な理由の1つは、これらのシステムの信頼性に対する信頼性の制限である。
ドメインの知識グラフとして表現された前提真理に基づいて信頼度を測定するための体系的なアプローチを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:27:57 GMT)
Systematic analysis of relative phase extraction in one-dimensional Bose
gases interferometry [0.0] 相対位相の長手展開と混合により, 相対位相の読み出しを補正する。
ガスの物理量の推定に対する誤差伝搬を数値的に評価する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 18:49:09 GMT)
Squeezing, trisqueezing, and quadsqueezing in a spin-oscillator system [0.0] 単一ボソンを生成・消滅させる線形相互作用は、光や運動のコヒーレントな状態を生成することができる。
代わりにnボソンを含むN階非線形相互作用は、ますます複雑な量子挙動をもたらす。
ここでは、4階のボソニック相互作用を実演し、スキューズ、トリスキューズ、クワッドキューズを実演する。
本手法は, 相互作用次数nの基本的な極限を示さず, スピン依存線形相互作用を支持する任意のプラットフォームに適用する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:34:20 GMT)
Spectral Clustering of Categorical and Mixed-type Data via Extra Graph
Nodes [0.0] 本稿では,数値情報と分類情報の両方をスペクトルクラスタリングアルゴリズムに組み込むための,より自然な方法について検討する。
データの属する可能性のある異なるカテゴリに対応する追加ノードの追加を提案し、それが解釈可能なクラスタリング対象関数に繋がることを示す。
この単純なフレームワークは、分類のみのデータに対する線形時間スペクトルクラスタリングアルゴリズムに繋がることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:49:49 GMT)
Simulating adiabatic quantum computation with a variational approach [0.0] ここでは、関心の多くの状況において、この問題を実質的に緩和するための変分的アプローチを提案する。
本研究では, 1次元の動的相転移による欠陥生成の記述から, 完全連結およびキメラグラフ上のフラストレーション付きスピングラス問題の複雑な力学まで, 様々な問題において正確な結果が得られることを示した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 08:31:48 GMT)
Simulating Battery-Powered TinyML Systems Optimised using Reinforcement
Learning in Image-Based Anomaly Detection [0.0] この研究は、バッテリ駆動のイメージベースの異常検出(IoT)システムを最適化することによって、TinyMLの研究を拡張し、貢献する。
提案したソリューションは、800Bのメモリフットプリントが低いため、リソース制約のあるハードウェアにデプロイすることができる。
これにより、スマート農業などの重要な分野を含む、そのようなシステムの現実的な展開が促進される。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:09:56 GMT)
Semiclassical Theory and the Koopman-van Hove Equation [0.0] 位相空間 Koopman-van Hove (KvH) 方程式は偏微分方程式の半古典的解析から導出することができる。
構成空間の解に対して、この制約は位相空間に保存される2つの異なる密度が存在するというパラドックスを解く。
KvH波動関数は干渉効果の可能性を含むが、位相空間上のすべての観測可能が局所作用素に近似されている場合、干渉は観測不可能である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 20:23:09 GMT)
Scalable Software as a Service Architecture [0.0] 本稿では,ソフトウェア・アズ・ア・サービス(SaaS)プラットフォームのアーキテクチャについて考察し,スケーラビリティと保守性を強調した。
本稿では,スケーラブルでメンテナンスしやすいアーキテクチャを実現するための,高レベルの設計基準を提供することを目的とする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 15:09:27 GMT)
Remarks on effects of projective phase on eigenstate thermalization
hypothesis [0.0] 非自明な射影位相を持つ$mathbbZ_NtimesmathbbZ_N$対称性を考える。
また、$ (1+1)$-次元スピン鎖と$ (2+1)$-次元格子ゲージ理論についても数値解析を行う。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:35:09 GMT)
Quantum-critical properties of the one- and two-dimensional random
transverse-field Ising model from large-scale quantum Monte Carlo simulations [0.0] 本研究では1次元と2次元でT = 0$の焼成障害を有する強磁性横磁場イジングモデルについて検討する。
実効的なゼロ温度シミュレーションの強調は、既存の文献におけるいくつかの矛盾を解消する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:20:42 GMT)
Quantum phenomena in attosecond science [0.0] この視点では、量子現象の最近の進歩について研究する。
我々は、真に量子的な観測を識別し、それらを古典的な現象と区別することに集中する。
我々は、しばしば見過ごされるが、アト秒プロセスにおける絡み合いの重大な役割を照明する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:50:13 GMT)
Quantum Zeno Monte Carlo for observable measurement [0.0] 本稿では,量子ゼノモンテカルロ法 (Quantum Zeno Monte Carlo) と呼ばれる新しいノイズ耐性・アンザッツフリーアルゴリズムを提案する。
量子ゼノ効果とモンテカルロ積分を利用して、ターゲット固有状態への多段階の断熱遷移を行う。
静的だけでなく、基底状態エネルギー、励起状態エネルギー、グリーン関数などの動的物理特性も、変動パラメータを使わずに効率的に見つけることができる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:51:04 GMT)
Quantum Sensing in Tweezer Arrays: Optical Magnetometry on an
Individual-Atom Sensor Grid [0.0] 我々は、レーザー冷却原子を個別に保持できる数百のサイトからなる量子センシングのためのスケーラブルなプラットフォームを実装した。
この単一量子系センサアレイの2次元格子上の磁場マッピングへの適用性を実証する。
この個々の原子センサープラットフォームは、外部に印加された勾配直流磁場のマッピングにすぐに応用できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:25:01 GMT)
Quantum Event Learning and Gentle Random Measurements [0.0] 我々は、ランダムに順序付けられた射影測定の列によって量子系に生じる期待された乱が、少なくとも1つの測定が受け入れる確率の平方根によって上界されていることを証明した。
また、未知の状態の$rho$へのサンプルアクセスが与えられ、受理確率の特性を推定する問題についても検討する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:40:15 GMT)
Quantum Computation by Cooling [0.0] 断熱量子計算のための特定のハミルトンモデルを提案する。
本稿では, この冷却法に基づく計算が, 量子回路に基づく計算と同等であることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 01:27:50 GMT)
Quantum Algorithm for Radiative Transfer Equation [0.0] 放射線伝達方程式は、工学における熱伝達のシミュレート、医療における拡散光学トモグラフィー、天体物理学における放射線流体力学に広く用いられている。
格子ボルツマン法を組み合わせることで,放射能伝達の量子アルゴリズムを提案する。
このアルゴリズムは、吸収、散乱、放出といった放射移動の重要な物理過程をすべて包含する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 04:59:17 GMT)
Provably Time-Optimal Cooling of Markovian Quantum Systems [0.0] マルコフ量子系を極端に短い時間で純粋な状態に冷却する問題に対処する。
量子ビットのランクを1つ、量子ビット上の$Lambda$-systems、結合した2つのキュービットからなる特定のシステムに対して、明確な時間最適冷却プロトコルを導出する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:07:33 GMT)
On the structure of Completely Reducible States [0.0] バイパルタイト状態に対する完全な再現性は、内外絡み理論のいくつかの定理を証明するために用いられた。
この研究では、この性質を持つ状態を生成するための手順をいくつか提供し、完全に再現可能な状態の名前でこれらの状態を呼び出す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:55:57 GMT)
On the Expressive Power of Graph Neural Networks [0.0] グラフニューラルネットワーク(GNN)は、社会科学、化学、医学といった分野における様々なタスクを解くことができる。
ディープラーニングをグラフ構造化データに拡張することにより、GNNは、社会科学、化学、医学といった分野におけるさまざまなタスクを解決できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:57:35 GMT)
OmniJet-$\alpha$: The first cross-task foundation model for particle
physics [0.0] ファンデーションモデルはマルチデータセットとマルチタスクの機械学習手法で、一度トレーニングされたら、様々なダウンストリームアプリケーションのために微調整できる。
我々は,この課題について,いくつかの点で大きな進展を報告している。
我々は、教師なし問題(ジェット世代)と教師なしタスク(ジェットタグ付け)の移行学習を、新しいOmniJet-$alpha$モデルで実証する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 19:00:01 GMT)
Non-Markovian bath-induced coupling revealed by two-dimensional
spectroscopy [0.0] 浴槽の非マルコフ的処理においてのみ発生する形態の異なる系状態間のコヒーレントカップリングが存在することを示す。
これはシステムバス状態が絡み合っているため、単純な吸収スペクトルと2次元電子分光法において、この物理学の異なる符号が存在することを実証する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:59:20 GMT)
Multiple Instance Learning with random sampling for Whole Slide Image
Classification [0.0] トレーニング中のパッチのランダムサンプリングは計算的に効率的であり、正規化戦略として機能する。
我々は、CAMELYON16データセットのパッチの30%を使用して、1.7%の最適なパフォーマンス向上と、TUPAC16データセットのたった8つのサンプルで3.7%を見出した。
また,解釈可能性効果はデータセットに依存し,解釈性はCAMELYON16に影響を及ぼすが,TUPAC16には影響しない。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:31:40 GMT)
Multi-player quantum data hiding by nonlocal quantum state ensembles [0.0] 非局所量子状態アンサンブルに基づくマルチプレイヤー量子データ隠れを提供する。
我々のデータハイディング方式は、すべてのプレイヤーが協力しない限り、複数のビットを隠すのに使える。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 03:40:43 GMT)
Micro-Fracture Detection in Photovoltaic Cells with Hardware-Constrained
Devices and Computer Vision [0.0] 結晶シリコンは 脆弱で 時間の経過とともに ひび割れに弱い
本研究の目的は、太陽電池パネルのセルひび割れを検知し、潜在的な故障を予測し、警告するシステムを開発することである。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 22:09:10 GMT)
Making sense of relativistic Wigner friend scenarios: a problem for
unitary accounts of quantum measurements ? [0.0] ウィグナーフレンドリーなシナリオは、測定を考慮に入れているときに量子論に固有の困難を浮き彫りにする。
非相対論的シナリオでは、閉系に対するユニタリ進化に対応することが困難である。
相対論的シナリオでは、量子論と相対性理論の間の緊張が追加の制約を引き起こす。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:41:30 GMT)
Love, Joy, and Autism Robots: A Metareview and Provocatype [0.0] 自閉症ロボットレビューのレビューを行い,自閉症者の第2位から第24位(25点中24点)の研究の方向性について検討した。
我々は、最新の自閉症研究、フェミニストHRI、ロボティクスの原理と発見に基づいて、役割の逆転を想像する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:01:12 GMT)
Looking for Complexity at Phase Boundaries in Continuous Cellular
Automata [0.0] 本稿では,2つの位相間の境界に横たわるパラメータを効率的に生成する「位相遷移ファインダ(PTF)」アルゴリズムを提案する。
このような点が複雑な挙動を示す傾向が強く、PTFをレニアに適用することで2倍以上の興味深い挙動の頻度を増大させることができることが確認できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:05:17 GMT)
How Culture Shapes What People Want From AI [0.0] 文化的に多様なグループの視点をAI開発に組み込む必要がある。
我々は,AIの主流となるビジョンを拡張し,再定義し,再構築することを目的とした,研究のための新しい概念的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:08:19 GMT)
High fidelity optical readout of a nuclear spin qubit in Silicon Carbide [0.0] 繰り返し読み出し手法に基づくV2中心核スピンの高忠実度量子状態読み出しを実証する。
我々は、弱い結合二原子核スピン浴の量子センシングへの応用のために、核スピンを長寿命記憶として利用する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:31:55 GMT)
Hiding images in quantum correlations [0.0] 任意の振幅と位相オブジェクトの形で、絡み合った光子間の空間相関の整形を実証する。
画像情報を2つの相関関係内にエンコードし、従来の強度測定では検出できないようにした。
これは光子の量子相関を利用して複雑な高次元情報の伝送を可能にし、量子通信やイメージングプロトコルの開発に有用である。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:11:07 GMT)
Group selection and shrinkage: Structured sparsity for semiparametric
additive models [0.0] 群構造を尊重するスパース回帰と分類推定器は、統計学と機械学習の問題に応用できる。
非パラメトリックな面に適合するフレームワークを開発し、有限誤差モデルを示す。
多くの予測器を用いた足および経済予測器のモデル化における有効性を示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:55:49 GMT)
Generic ETH: Eigenstate Thermalization beyond the Microcanonical [0.0] 固有状態熱化仮説(ETH)は、高エネルギー・凝縮物質群集の最近の進歩において重要な役割を担っている。
我々は、保存された準局所電荷を持つ量子格子系を設計し、一般化された固有状態熱化の形式を検証する。
また、電荷とエネルギーの双方のマイクロカノニカルウィンドウの外側の状態における熱化の原型的シグネチャも観察する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:19:04 GMT)
Generalized Uncertainty Principle for Entangled States of Two Identical
Particles [0.0] 一般化不確実性原理(GUP)は通常、最小長の存在と関連付けられる。
本稿では, GUP の主な定式化に注目し, 修正 GUP によって誘導される位置の不確かさを最小限に決定する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:37:19 GMT)
Generalized Free Cumulants for Quantum Chaotic Systems [0.0] 固有状態と演算子間の任意の相関を計算する図式形式法を提案する。
還元密度行列は平衡形式に緩和され、システムは後期のページ曲線に従うことを示した。
また, エンタングルメントの拡散を規定するエンタングルメント速度が, EBの高相関にエンコードされていることを示す。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:17:25 GMT)
Fuzzy hyperparameters update in a second order optimization [0.0] 対角ヘッセン行列のオンライン有限差分近似を導入し、いくつかのハイパーパラメータをファジィ推論する。
競争の結果が得られた。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:47:27 GMT)
Fourier-transform infrared spectroscopy with undetected photons from
high-gain spontaneous parametric down-conversion [0.0] 我々は、検出されていない光子を持つMIRレンジFTIRのための高パラメトリックゲインSU(1,1)干渉計を開発した。
干渉計出力では高い光子数を示し、試料ではかなり低い光子数を示し、干渉コントラストを改善した。
ブロードバンドSU (1,1) 干渉計を照射し, 3mm領域におけるポリマーのMIR吸収スペクトルを測定し, 評価する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:19:52 GMT)
Foundational propositions of hesitant fuzzy soft $\beta$-covering
approximation spaces [0.0] ヘジットファジィ集合は様々な会員の学位を示し、それらの間の様々な形態の包摂関係を生み出している。
本稿では,ヘジットファジィソフト$beta$-coveringsとヘジットファジィソフト$beta$-neighborhoodsの概念を紹介する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:16:17 GMT)
First-principles construction of symmetry-informed quantum metrologies [0.0] 我々は、正確に解ける最適化方程式のクラスを開発する。
最適測定を考案する規則は、閉じた形で与えられる。
良い戦略を見つけることは、どの対称性が最大の無知不変状態を残すかを特定することにつながる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 11:32:02 GMT)
Federated Learning Method for Preserving Privacy in Face Recognition
System [0.0] 我々は,教師付き・教師なしの顔認識システムにおいて,セキュアなアグリゲータと非セキュアなアグリゲータを併用したフェデレート学習の適用について検討する。
提案システムでは,各エッジデバイスは独立して,セキュアなアグリゲータあるいは中央サーバに直接送信される独自のモデルを訓練する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 14:21:43 GMT)
FFSTC: Fongbe to French Speech Translation Corpus [0.0] Fongbe to French Speech Translation Corpus (FFSTC) を初めて紹介する。
このコーパスには約31時間のフォンベ語の内容が含まれており、フランス語の書き起こしと対応するフォンベの音声記録の両方が収録されている。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 17:53:58 GMT)
Evidence, Definitions and Algorithms regarding the Existence of
Cohesive-Convergence Groups in Neural Network Optimization [0.0] ニューラルネットワークのプロセスを理解することは、機械学習の分野で最も複雑で重要な問題の1つである。
本稿では,ニューラルネットワークの理論的収束に着目した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 13:23:42 GMT)
Evault for legal records [0.0] 弁護士、裁判官、クライアント、さらには登録者さえも、法的文書のアップロードや検索、変更の追跡、およびプラットフォーム内での情報共有などを行うことができる。
この機能により、ユーザーは法的文書を生成、安全に保存でき、ドキュメントプロセス全体を合理化できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 09:24:31 GMT)
Estimation of Electronic Band Gap Energy From Material Properties Using
Machine Learning [0.0] 本稿では,材料バンドギャップエネルギーを迅速に予測できる機械学習駆動モデルを提案する。
我々のモデルは、DFTに基づく予備的な計算や、材料の構造に関する知識を必要としない。
物質科学におけるMLモデルの性能を比較するための新しい評価手法を提案する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 07:32:28 GMT)
Entanglement detection in arbitrary dimensional bipartite quantum
systems through partial realigned moments [0.0] 任意の次元量子状態における二部構造絡み検出のための分離性基準を提案する。
提案手法は, 共用枠組みを用いて, 蒸留可能な状態と有界な絡み合った状態の両方を検出できる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 06:34:39 GMT)
Entanglement Trajectory and its Boundary [0.0] 本稿では,量子コンピューティングにおける絡み合いの新たな研究手法を提案する。
我々の手法は量子アルゴリズムの実行の異なる段階における密度行列の減少を分析することである。
軌道の境界を確立するために、ランダム行列理論を用いる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:12:19 GMT)
Elections in the Post-Quantum Era: Is the Complexity Shield Strong
Enough? [0.0] 量子コンピュータは、上述した複雑性シールドに対する新たな脅威だと考えている。
本稿では,選挙に対する攻撃の可能性について概説し,量子コンピューティングの能力について論じるとともに,今後の研究の方向性を図示する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 12:52:11 GMT)
Dunkl-Pauli Equation in the Presence of a Magnetic Field [0.0] ダンクル微分(Dunkl derivative)は、通常の微分の代わりに用いられるとき、パリティに依存した解をもたらす。
外部磁場の存在下では2次元非相対論的スピン-1/2$粒子系を考える。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 23:14:51 GMT)
Discriminative Sample-Guided and Parameter-Efficient Feature Space
Adaptation for Cross-Domain Few-Shot Learning [0.0] クロスドメインの少ショット分類は、ラベル付き例がほとんどない未確認領域で新しいクラスを学ぶという難しい課題を示す。
本稿では,パラメータ効率の低い適応戦略を導入し,従来の近距離セントロイドを分散認識損失関数に置き換える。
Meta-Datasetベンチマークの実証的な評価では、我々のアプローチは、それぞれに見えるデータセットと見えないデータセットで、精度を7.7%と5.3%向上させる。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:47:40 GMT)
Credit Card Fraud Detection in the Nigerian Financial Sector: A Comparison of Unsupervised TensorFlow-Based Anomaly Detection Techniques, Autoencoders and PCA Algorithm [0.0] クレジットカード詐欺はナイジェリアの金融セクターにおける国家的懸念の主な原因である。
本稿では,人間の介入から完全に独立して働くことを想定した2つの不正検出技術の有効性を比較することを目的とする。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 21:22:05 GMT)
Circuit realisation of a two-orbital non-Hermitian tight-binding chain [0.0] 単位セル当たりの2つの軌道とその電気回路アナログからなる非エルミタン(NH)強結合系について検討した。
非相互に近接する近接結合とオンサイトゲイン/ロス項によって特徴付けられるPT対称および非PT対称のケースを区別する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 02:09:15 GMT)
Bayesian Hierarchical Probabilistic Forecasting of Intraday Electricity
Prices [0.0] 本稿では,ドイツの日内取引市場における電力価格のベイズ予測に関する第1報について述べる。
検証には2022年の極端に不安定な電力価格を使用します。
我々は,電気価格予測における機能選択にLASSOを用いるという宣言されたゴールド標準に挑戦し,オルソゴンマッチング・パースーツ(OMP)がより良い予測性能をもたらすという強い統計的証拠を提示する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:51:27 GMT)
A structure theorem for generalized-noncontextual ontological models [0.0] 我々は、トモグラフィ的に局所的な操作理論の一般化された非文脈的存在論的モデルが驚くほど厳密で単純な数学的構造を持つことを示すために、プロセス理論の枠組みを用いる。
我々は,古典性の概念の同値性に関する既知結果を,準備尺度から任意の構成シナリオまで拡張する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 16:06:36 GMT)
A Voting Approach for Explainable Classification with Rule Learning [0.0] 両世界を組み合わせた投票方式を導入し,その成果を(説明不能な)最先端手法として実現することを目的とする。
我々は,本手法が通常のルール学習法より明らかに優れているだけでなく,最先端の結果と同等の結果が得られることを証明した。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 10:09:43 GMT)
A PnP Algorithm for Two-Dimensional Pose Estimation [0.0] 仮定を活用すれば、探索空間次元の減少による3次元精度の向上と性能向上が可能になる。
提案アルゴリズムは,システムを解くことによって不明瞭な解を見つけ,繰り返し誤差を最小限に抑えるためにその予測を反復的に洗練する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 05:19:33 GMT)
A "Perspectival" Mirror of the Elephant: Investigating Language Bias on
Google, ChatGPT, YouTube, and Wikipedia [0.0] 本稿では,言語バイアスのエビデンスと分析を行い,その社会的意味について論じる。
Googleとその最も顕著なリターンは、単に"Buddhism"、"Liberalism"、"Colonization"、"Iran"、"America"といった複雑なトピックの検索言語に関連する、文化的に支配的な見解の狭いセットを反映している。
言語バイアスは、検索を通じて他のグループを見ることができると各言語グループが考える、強いが目に見えない文化的障壁をオンラインで設定する。
論文参考訳(メタデータ) (Fri, 8 Mar 2024 00:15:02 GMT)