Technique Report of CVPR 2024 PBDL Challenges [210.4] 物理に基づくビジョンは、画像から形状、反射率、光の分布、中性などのシーン特性を復元する過程を反転させることを目的としている。
深層学習は様々な視覚タスクに対して有望な改善を示しており、物理に基づく視覚と組み合わせることで、これらのアプローチは視覚システムの堅牢性と精度を高めることができる。
CVPR 2024ワークショップで行われたPBDL 2024チャレンジの結果を要約する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:44:17 GMT)
Exploring In-Context Learning of Textless Speech Language Model for Speech Classification Tasks [98.5] インコンテキスト学習(ICL)は,大規模言語モデル(LLM)の利用において重要な役割を担っている。
本研究は,テキストレス音声 LM を用いた音声分類タスクのための ICL を探索する最初の研究である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:13:54 GMT)
Self-Supervised Representation Learning with Spatial-Temporal Consistency for Sign Language Recognition [96.6] 本研究では,空間的時間的整合性を通じてリッチな文脈を探索する自己教師付きコントラスト学習フレームワークを提案する。
動きと関節のモーダル性の相補性に着想を得て,手話モデルに一階動作情報を導入する。
提案手法は,4つの公開ベンチマークの広範な実験により評価され,新しい最先端性能と顕著なマージンを実現している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:50:19 GMT)
SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.0] コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:57:03 GMT)
HumanPlus: Humanoid Shadowing and Imitation from Humans [82.5] ヒューマノイドが人間のデータから動きや自律的なスキルを学ぶためのフルスタックシステムを導入する。
まず、既存の40時間動作データセットを用いて、強化学習によるシミュレーションの低レベルポリシーを訓練する。
次に、自己中心型視覚を用いてスキルポリシーを訓練し、ヒューマノイドが自律的に異なるタスクを完了できるようにする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:41:34 GMT)
Improving Large Models with Small models: Lower Costs and Better Performance [81.6] 我々は,小型モデルと大規模モデルの協調のための一般的なパラダイムであるData Shunt$+$ (DS$+$)を提案する。
例えば、ChatGPTはAmazon Productの感情分析で9,43%の精度を達成し、DS$+は9,5.64%の精度を達成している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:44:43 GMT)
MMToM-QA: Multimodal Theory of Mind Question Answering [80.9] 心の理論 (ToM) は人間レベルの社会知能を持つ機械を開発する上で不可欠な要素である。
最近の機械学習モデル、特に大きな言語モデルは、ToM理解のいくつかの側面を示しているようだ。
一方、ヒューマンToMはビデオやテキストの理解以上のものです。
人は、利用可能なデータから抽出された概念的表現に基づいて、他人の心について柔軟に推論することができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 10:13:14 GMT)
Complex Claim Verification with Evidence Retrieved in the Wild [73.2] Webから生の証拠を取り出すことによって,実世界のクレームをチェックするための,最初の完全自動化パイプラインを提示する。
私たちのパイプラインには,クレーム分解,生文書検索,きめ細かい証拠検索,クレーム中心の要約,正確性判定という5つのコンポーネントが含まれています。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:23:30 GMT)
FreePoint: Unsupervised Point Cloud Instance Segmentation [72.6] 点クラウド上の教師なしクラス非依存のインスタンスセグメンテーションを探索するためのFreePointを提案する。
我々は、座標、色、そして自己監督の深い特徴を組み合わせることで、点の特徴を表現する。
ポイント機能に基づいて、ポイントクラウドを擬似ラベルとして粗いインスタンスマスクに分割し、ポイントクラウドインスタンスセグメンテーションモデルをトレーニングする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:29:54 GMT)
Fast Last-Iterate Convergence of Learning in Games Requires Forgetful Algorithms [71.7] オンライン学習によるセルフプレイは、大規模な2人プレイのゼロサムゲームを解くための重要な方法の1つだ。
我々は,OMWUが支払行列のサイズに対数依存するなど,いくつかの利点があることを示した。
我々は、過去のことをすぐに忘れない幅広い種類のアルゴリズムが、すべて同じ問題に悩まされていることを証明している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:26:17 GMT)
Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching [67.1] 大きな言語モデル(LLM)は、一度のトレーニングのために最新の情報を提供するのに苦労することが多い。
効率的なヒューマンラーニングにおけるFeynman Techniqueの顕著な成功に感銘を受け、セルフチューニングを紹介した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:45:37 GMT)
Beyond Raw Videos: Understanding Edited Videos with Large Multimodal Model [62.4] 本稿では,人気のショートビデオプラットフォームであるtextiti.e.,TikTokで動画を編集するためのベンチマークを構築し,エフェクト,面白い,ミーム,ゲームをカバーする。
オープンソースビデオのLMMのほとんどはベンチマークでは不十分であり、ソーシャルメディア上の編集されたショートビデオと通常の生ビデオの間に大きなドメインギャップがあることを示唆している。
LMMの一般化能力を向上させるため,Panda-70M/WebVid生ビデオとTikTok/CapCut編集ビデオの両方に基づいて,提案したベンチマークのトレーニングセットを収集した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:28:52 GMT)
A Theory of Interpretable Approximations [61.9] 我々は、ある基底クラス $mathcalH$ の概念の小さな集合によってターゲット概念 $c$ を近似するという考え方を研究する。
任意の$mathcalH$と$c$のペアに対して、これらのケースのちょうど1つが成り立つ: (i) $c$を任意の精度で$mathcalH$で近似することはできない。
解釈可能な近似の場合、近似の複雑さに関するわずかに非自明なa-priori保証でさえ、定数(分布自由かつ精度)の近似を意味することを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:43:45 GMT)
DressCode: Autoregressively Sewing and Generating Garments from Text Guidance [61.5] DressCodeは、初心者向けのデザインを民主化し、ファッションデザイン、バーチャルトライオン、デジタルヒューマン創造において大きな可能性を秘めている。
まず,テキスト条件の埋め込みとクロスアテンションを統合して縫製パターンを生成する,GPTベースのアーキテクチャであるSewingGPTを紹介する。
次に、トレーニング済みの安定拡散を調整し、タイルベースの衣服用物理レンダリング(PBR)テクスチャを生成します。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:58:22 GMT)
A Survey of Large Language Models for Financial Applications: Progress, Prospects and Challenges [60.5] 大規模言語モデル(LLM)は金融分野における機械学習アプリケーションに新たな機会を開放した。
我々は、従来のプラクティスを変革し、イノベーションを促進する可能性に焦点を当て、様々な金融業務におけるLLMの適用について検討する。
本稿では,既存の文献を言語タスク,感情分析,財務時系列,財務推論,エージェントベースモデリング,その他の応用分野に分類するための調査を紹介する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:11:35 GMT)
NeRFDeformer: NeRF Transformation from a Single View via 3D Scene Flows [60.3] 本研究では,単一観測値に基づいてNeRF表現を自動的に修正する手法を提案する。
本手法は, 変形を3次元流れ, 特に剛性変換の重み付き線形ブレンディングとして定義する。
また,単一観測によるNeRFシーンの修正問題を探索するための新しいデータセットも導入した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:58:08 GMT)
DVIS-DAQ: Improving Video Segmentation via Dynamic Anchor Queries [60.1] 動的アンカークエリ(DAQ)を導入し、アンカーとターゲットクエリ間の遷移ギャップを短くする。
また,クエリレベルのオブジェクトEmergence and Disappearance Simulation(EDS)戦略を導入する。
実験により、DVIS-DAQは5つの主流ビデオセグメンテーションベンチマーク上で、新しい最先端(SOTA)性能を達成することが示された。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:56:23 GMT)
NewsQs: Multi-Source Question Generation for the Inquiring Mind [59.8] 我々は複数のニュース文書に対して質問応答ペアを提供するデータセットであるNewsQsを紹介する。
FAQスタイルのニュース記事に微調整されたT5-Largeモデルによって自動生成される質問を,従来のマルチドキュメント要約データセットに拡張する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:30:53 GMT)
Voxel Mamba: Group-Free State Space Models for Point Cloud based 3D Object Detection [59.3] 3Dボクセルをシリアライズして複数のシーケンスにグループ化し、トランスフォーマーに入力するシリアライズベースの手法は、3Dオブジェクト検出においてその効果を実証している。
グループフリー戦略を用いて、ボクセルの全空間を1つのシーケンスにシリアライズするVoxel SSMを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:45:07 GMT)
IMDL-BenCo: A Comprehensive Benchmark and Codebase for Image Manipulation Detection & Localization [58.3] IMDL-BenCoは、最初の包括的なIMDLベンチマークとモジュールである。
IMDLフレームワークを標準化された再利用可能なコンポーネントに分解し、モデル構築パイプラインを改訂する。
8つの最先端IMDLモデル(うち1つはスクラッチから再現される)、2つの標準トレーニングおよび評価プロトコル、15のGPUアクセラレーション評価メトリクス、そして3種類の堅牢性評価が含まれている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:44:54 GMT)
Optimization-based Structural Pruning for Large Language Models without Back-Propagation [58.0] 本稿では,Large-Language Models (LLMs) を用いた最適化に基づく構造解析手法を提案する。
本手法は,プルーニングモデルの損失を最適化することにより,確率空間におけるプルーニングマスクを直接学習する。
提案手法は,A100 GPUの13Bモデルに対して,約35GBのメモリで2.7時間動作する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:31:03 GMT)
Fair Allocation in Dynamic Mechanism Design [57.7] 競売業者が各ラウンドで2つのグループに分けない商品を、合計で$T$のラウンドで販売する問題を考える。
競売人は、各グループの最低平均配分を保証する公正な制約に固執しつつ、割引された全体の収益を最大化することを目的としている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:23:49 GMT)
Less Peaky and More Accurate CTC Forced Alignment by Label Priors [57.5] 接続性時間分類(CTC)モデルはピーク出力分布を持つことが知られている。
本稿では, CTCのピーク動作を緩和し, 強制アライメント生成への適合性を向上させることを目的とする。
我々のCTCモデルはピーク後部を減らし、トークンのオフセットをより正確に予測することができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 22:02:03 GMT)
Adaptive Experimentation When You Can't Experiment [55.9] 本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:54:48 GMT)
Choosing a Proxy Metric from Past Experiments [54.3] 多くのランダム化実験では、長期的な計量の処理効果は測定が困難または不可能であることが多い。
一般的な方法は、いくつかの短期的プロキシメトリクスを計測して、長期的メトリックを綿密に追跡することである。
ランダム化実験の同種集団において最適なプロキシメトリックを定義し構築するための新しい統計フレームワークを導入する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:56:22 GMT)
Emerging Safety Attack and Defense in Federated Instruction Tuning of Large Language Models [51.9] フェデレートラーニング(FL)は、複数のパーティが直接データ共有を必要とせずに、共同で大きな言語モデル(LLM)を微調整することを可能にする。
我々は、シンプルでステルス的で効果的な安全攻撃手法を提案することにより、FedITにおける安全性アライメントの脆弱性を初めて明らかにした。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:24:22 GMT)
Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews [51.5] 本稿では,大規模言語モデル (LLM) によって実質的に修正あるいは生成される可能性のある大規模コーパスにおけるテキストの分数推定手法を提案する。
我々の最大可能性モデルは、専門家による参照テキストとAIによる参照テキストを利用して、コーパスレベルでの実世界のLLM使用を正確かつ効率的に検証する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:23:06 GMT)
Planning with Adaptive World Models for Autonomous Driving [50.4] 運動プランナー(MP)は複雑な都市環境における安全なナビゲーションに不可欠である。
最近リリースされたMPベンチマークであるnuPlanは、クローズドループシミュレーションロジックで現実世界の駆動ログを拡張することで、この制限に対処している。
本稿では,モデル予測制御(MPC)ベースのプランナであるAdaptiveDriverを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:53:45 GMT)
Intertwining CP and NLP: The Generation of Unreasonably Constrained Sentences [49.9] 本稿では,この問題を解決するためにConstraints First Frameworkを提案する。
これは、言語特性とより古典的な制約を組み合わせた制約プログラミング手法によって解決される。
このアプローチの有効性は、より退屈な制約付きテキスト生成問題に取り組むことで実証される。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:40:49 GMT)
PIG: Prompt Images Guidance for Night-Time Scene Parsing [48.4] 非教師なし領域適応(UDA)が夜景の研究の主流となっている。
そこで我々はNFNet(Night-Focused Network)を提案する。
NightCity、NightCity+、Dark Zurich、ACDCの4つのナイトタイムデータセットで実験を行いました。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:06:19 GMT)
Mitigating the Curse of Dimensionality for Certified Robustness via Dual Randomized Smoothing [48.2] 本稿では,2次元平滑化による高次元入力に対する$ell$認証ロバスト性の実現可能性について検討する。
提案したDual Smoothing (DRS)は入力イメージを2つのサブイメージにダウンサンプルし、下位次元で2つのサブイメージを滑らかにする。
広汎な実験は、確立された方法論と統合する顕著な能力を示すDSSの一般化性と有効性を示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:14:36 GMT)
Augmenting Biomedical Named Entity Recognition with General-domain Resources [47.2] ニューラルネットワークに基づくバイオメディカル名前付きエンティティ認識(BioNER)モデルのトレーニングは通常、広範囲でコストのかかる人的アノテーションを必要とする。
GERBERAは、一般ドメインのNERデータセットをトレーニングに利用した、単純なyet効率の手法である。
我々は,81,410インスタンスからなる8つのエンティティタイプの5つのデータセットに対して,GERBERAを体系的に評価した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:28:02 GMT)
VCEval: Rethinking What is a Good Educational Video and How to Automatically Evaluate It [46.7] 本稿では,映像コンテンツの品質を自動評価する作業に焦点をあてる。
これらの原則に基づいて,3つの評価原則を提案し,新しい評価フレームワークであるtextitVCEval を設計する。
本手法は,コンテンツ品質の異なるビデオコースを効果的に識別し,様々な解釈可能な結果を生成する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:18:30 GMT)
RoboPoint: A Vision-Language Model for Spatial Affordance Prediction for Robotics [46.6] 本稿では,ロボットドメインやニーズに対して,視覚言語モデル(VLM)を命令チューニングする,自動合成データ生成パイプラインを提案する。
パイプラインを使用して、与えられた言語命令に対する画像キーポイントの価格を予測するVLMであるRoboPointを訓練する。
実験の結果,RoboPointは空間空き量の予測精度が21.8%,下流タスクの成功率が30.5%,最先端VLMが21.8%向上していることがわかった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:22:51 GMT)
How Far Are LLMs from Believable AI? A Benchmark for Evaluating the Believability of Human Behavior Simulation [46.4] 我々は,人間の振る舞いをシミュレートする際の大規模言語モデル (LLM) の信頼性を評価するために SimulateBench を設計する。
SimulateBenchに基づいて、文字をシミュレートする際、広く使われている10個のLLMの性能を評価する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:08:30 GMT)
Evaluating the Generalization Ability of Quantized LLMs: Benchmark, Analysis, and Toolbox [46.4] 大規模言語モデル(LLM)は、複数のシナリオでエキサイティングな進歩を見せている。
メモリフットプリントと推論コストを削減する効果的な方法として、量子化は低ビット幅での性能劣化にも直面する。
この研究は、評価システム、詳細な分析、一般的なツールボックスを含む、この研究トピックのための包括的なベンチマークスイートを提供する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:02:14 GMT)
Lift Your Molecules: Molecular Graph Generation in Latent Euclidean Space [46.1] 3次元分子生成モデルを用いた新しい分子グラフ生成フレームワークを提案する。
分子グラフを合成コンホメータ座標によりユークリッド点雲にマッピングし,E(n)-等変グラフニューラルネットワーク(EGNN)を用いて逆写像を学習する。
誘導点雲構造潜在空間は既存の3次元分子生成モデルを適用するのに適している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:29:07 GMT)
Quantum Random Walks and Quantum Oscillator in an Infinite-Dimensional Phase Space [46.0] 座標と運動量演算子のワイル表現を用いた無限次元位相空間における量子ランダムウォークを考える。
我々は、その強い連続性の条件を見つけ、それらの発電機の特性を確立する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:39:32 GMT)
Sampling and estimation on manifolds using the Langevin diffusion [45.6] 離散化マルコフ過程に基づく$mu_phi $の線形汎函数の2つの推定器を検討する。
誤差境界は、本質的に定義されたランゲヴィン拡散の離散化を用いてサンプリングと推定のために導出される。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:53:52 GMT)
MIND: Multimodal Shopping Intention Distillation from Large Vision-language Models for E-commerce Purchase Understanding [45.5] MINDは、マルチモーダル製品メタデータから購入意図を推測し、人間中心のものを優先するフレームワークである。
Amazon Reviewのデータを使用して、1,264,441万の意図を含むマルチモーダルな意図的知識ベースを作成します。
得られた意図は2つの意図的理解タスクにおいて大きな言語モデルを大幅に向上させる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:56:09 GMT)
Task Arithmetic can Mitigate Synthetic-to-Real Gap in Automatic Speech Recognition [44.9] タスクベクトル算術は音声認識における合成と現実のギャップを軽減するのに有効であることを示す。
提案手法であるSyn2REALは,ベースラインよりも単語誤り率を平均10.03%改善することを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:58:22 GMT)
MDeRainNet: An Efficient Neural Network for Rain Streak Removal from Macro-pixel Images [44.8] 我々は,LF画像から降雨ストリーク除去を行うために,MDeRainNetと呼ばれる効率的なネットワークを提案する。
提案するネットワークはマルチスケールエンコーダデコーダアーキテクチャを採用し, 直接マクロピクセル画像(MPI)を用いて降雨除去性能を向上する。
そこで本研究では,MDeRainNetのための新しい半教師付き学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:47:02 GMT)
Scalable Differentiable Causal Discovery in the Presence of Latent Confounders with Skeleton Posterior (Extended Version) [44.5] 異なる因果発見は、有向非巡回グラフの学習に大きな進歩をもたらした。
既存の差別化可能なMAG学習アルゴリズムは、小さなデータセットに限られており、より大きなデータセットにスケールできなかった。
本研究では, 骨格後頭骨を用いた2相フレームワークであるSPOT(Skeleton Posterior-Guided OpTimization)を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:40:36 GMT)
Emergent Open-Vocabulary Semantic Segmentation from Off-the-shelf Vision-Language Models [44.1] 大規模視覚言語モデル(VLM)は、画像領域と単語を暗黙的に関連付けることを学び、視覚的問題のようなタスクに有効である。
本稿では,OVSS(Plug-and-Play-Vocabulary Semantic)を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:20:34 GMT)
Text-space Graph Foundation Models: Comprehensive Benchmarks and New Insights [44.1] Graph Foundation Model(GFM)は、異なるグラフやタスクに対して、統一されたバックボーンでうまく機能する。
異なるモダリティと自然言語を一致させるマルチモーダルモデルに触発されたこのテキストは、近年、多様なグラフに統一された特徴空間を提供するために採用されている。
これらのテキスト空間 GFM の大きな可能性にもかかわらず、この分野での現在の研究は2つの問題によって妨げられている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:56:21 GMT)
Domain Adaptive Attention Learning for Unsupervised Person Re-Identification [44.0] 本稿では,ラベル付きソースドメインからラベル付きターゲットドメインへの識別表現を確実に伝達するドメイン適応型注意学習手法を提案する。
Market-1501、DukeMTMC-reID、MSMT17ベンチマークの実験では、提案されたアプローチが最先端技術より優れていることを示した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:06:16 GMT)
Multi-User Semantic Fusion for Semantic Communications over Degraded Broadcast Channels [43.5] 我々はDBC上の無線画像伝送のためのマルチユーザセマンティック・フュージョンに基づくセマンティック・コミュニケーション・アプローチを設計する。
提案手法は,これらの意味的特徴を,意味的類似性を利用して効果的に融合する。
実験の結果,提案方式は従来の放送方式よりも優れていた。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:19:59 GMT)
MINT: a Multi-modal Image and Narrative Text Dubbing Dataset for Foley Audio Content Planning and Generation [43.4] Foley AudioはAIGC(AI- generated Content)のランドスケープにおいて大きな課題に直面している。
現在のテクスト・トゥ・オーディオ技術は、詳細で音響的に関係のあるテキスト記述に依存している。
MINT(Multi-modal Image and Narrative Text Dubbing dataset)を導入する。
MINTは、文学的なストーリーオーディオブックのダビング、イメージ/サイレントビデオダビングといったメインストリームのダビングタスクを強化するように設計されている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 10:47:36 GMT)
We Care: Multimodal Depression Detection and Knowledge Infused Mental Health Therapeutic Response Generation [41.1] 拡張D-vlogデータセットは1,261のYouTube vlogのコレクションを含む。
本稿では,認知行動療法(Cognitive Behavioral Therapy, CBT)をベースとした, メンタルヘルス患者の初期接触として機能する仮想エージェントについて紹介する。
私たちのMistralモデルは歪み評価と分類で70.1%、30.9%、ベルトスコア88.7%を達成しました。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:41:46 GMT)
Facts-and-Feelings: Capturing both Objectivity and Subjectivity in Table-to-Text Generation [41.1] 私たちは3849のデータインスタンスを持つTa2TSデータセットを紹介します。
本稿では,線形化テーブル上でのシーケンス・ツー・シーケンスの微調整と,一般的な大言語モデルへのプロンプトを行う。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:41:44 GMT)
Discrete Latent Perspective Learning for Segmentation and Detection [40.9] 本稿では,多視点融合学習のための新しいフレームワークであるDLPLを提案する。
DLPLは、様々なシナリオやビジョンタスクに適用可能な、普遍的な視点学習フレームワークである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:40:49 GMT)
CroPrompt: Cross-task Interactive Prompting for Zero-shot Spoken Language Understanding [40.8] 音声言語理解のためのクロスタスク対話型プロンプト(CroPrompt)を提案する。
CroPromptは、SLU内の関連タスク間の情報交換をインタラクティブに活用することを可能にする。
また、インテント情報注入によるエラー伝播を軽減するために、マルチタスクの自己整合機構を導入する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:54:56 GMT)
Cleaner Pretraining Corpus Curation with Neural Web Scraping [40.0] 本稿では,Webページから一次的かつクリーンなテキストコンテンツを抽出するための,シンプルで高速かつ効果的なNeuScraper(NeuScraper)を提案する。
実験結果から,NeuScraperは20%以上の改善を達成し,ベースラインスクラップラーを上回ることがわかった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:05:54 GMT)
Form-Finding and Physical Property Predictions of Tensegrity Structures Using Deep Neural Networks [39.2] 本研究では, 緊張構造の幾何学的構成と物理特性を予測するために, ディープニューラルネットワーク (DNN) アプローチを開発した。
検証のために, 粘度Dバー, プリズム, ランダーを含む3つの張力構造を解析した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:39:53 GMT)
Designing a Dashboard for Transparency and Control of Conversational AI [39.0] エンド・ツー・エンドのプロトタイプ・トゥ・エンド・プロトタイプ・コネクテッド・インタプリタビリティ技術とユーザ・エクスペリエンス・デザインを提案する。
以上の結果から,利用者は内的状態の認識に感謝し,偏りのある行動に曝露し,コントロール意識を高めたことが示唆された。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:06:29 GMT)
Blockchains for Internet of Things: Fundamentals, Applications, and Challenges [38.3] すべてのブロックチェーンシステムが、特定のIoTアプリケーションに適しているわけではない。
パブリックブロックチェーンは機密データを格納するのに適していない。
ブロックチェーンのアプリケーションを、エッジAI、通信、ヘルスケアの3つの重要なIoT領域で調査する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:39:38 GMT)
Auto-Encoding Bayesian Inverse Games [36.1] ゲームの性質が不明な逆ゲーム問題を考える。
既存の最大推定手法は、未知のパラメータの点推定のみを提供する。
ベイズ的視点を採り、ゲームパラメータの後方分布を構成する。
この構造化されたVAEは、観測された相互作用のラベルのないデータセットから訓練することができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:01:48 GMT)
KnowPhish: Large Language Models Meet Multimodal Knowledge Graphs for Enhancing Reference-Based Phishing Detection [36.0] 各ブランドに関する情報が豊富な20万のブランドを含む,自動知識収集パイプラインを提案する。
KnowPhishは、既存の参照ベースのフィッシング検出器の性能を高めるために使用できる。
結果として得られたマルチモーダルフィッシング検出手法であるKnowPhish Detectorは,ロゴの有無にかかわらずフィッシングWebページを検出することができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:34:45 GMT)
Object-Attribute-Relation Representation based Video Semantic Communication [35.9] 我々は,低ビットレート符号化を実現するためのビデオのセマンティックフレームワークとして,OAR(Object-Atribute-Relation)を導入する。
我々は低ビットレート表現と生成ビデオ再構成の両方にOARシーケンスを利用する。
トラヒック監視ビデオデータセットに関する実験は,映像伝送性能の観点から,我々のアプローチの有効性を評価した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:19:31 GMT)
EvIL: Evolution Strategies for Generalisable Imitation Learning [33.7] 模倣学習(IL)の専門家によるデモンストレーションと、学習したポリシをデプロイしたい環境は、まったく同じではありません。
クローンのようなポリシー中心のアプローチと比較すると、逆強化学習(IRL)のような報酬中心のアプローチは、しばしば新しい環境における専門家の振る舞いをよりよく再現する。
最新のディープILアルゴリズムは、専門家よりもはるかに弱いポリシーを導出する報酬を頻繁に回収する。
本研究では,目標環境における再学習を高速化する報酬形成項を最適化する進化戦略に基づく新しい手法であるEvILを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 22:46:39 GMT)
Mental Disorder Classification via Temporal Representation of Text [33.5] ソーシャルメディア投稿からの精神障害予測は、逐次テキストデータの複雑さのために困難である。
本稿では,時系列に順序付けられたソーシャルメディア投稿を一連の数に圧縮する新しいフレームワークを提案する。
我々は、現在のSOTAを3つの異なる精神条件で上回ることで、フレームワークの一般化能力を実証する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 10:53:21 GMT)
DEGAP: Dual Event-Guided Adaptive Prefixes for Templated-Based Event Argument Extraction with Slot Querying [32.1] イベント引数抽出(EAE)の最近の進歩は、トレーニングや推論中に有用な補助情報をモデルに組み込むことである。
これらの手法は,(1)検索結果が無関係である場合があり,(2)テンプレートは関連性を考慮せずに,各イベントごとに独立して開発される場合の2つの課題に直面する。
本稿では,2つのプレフィックス,すなわち学習可能なプロンプトベクトル,イベント誘導型適応ゲーティング機構を用いて,これらの課題に対処するDEGAPを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:40:49 GMT)
A Late-Stage Bitemporal Feature Fusion Network for Semantic Change Detection [32.1] そこで本研究では,意味変化検出の課題に対処するため,新しい2段階の時間的特徴融合ネットワークを提案する。
具体的には,特徴融合を強化するため,局所的グローバルアテンショナルアグリゲーションモジュールを提案し,重要なセマンティクスを強調するために,局所的グローバルなコンテキスト拡張モジュールを提案する。
提案モデルにより,両データセットの最先端性能が向上する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:02:10 GMT)
Last-iterate Convergence Separation between Extra-gradient and Optimism in Constrained Periodic Games [32.0] 2人プレイのゼロサムゲームにおける学習アルゴリズムの終局的動作について、広範囲に研究されている。
既存の結果の多くは、ゲームが時間に依存しないという仮定の下でこれらの特性を確立する。
本稿では,制約付き周期ゲームにおける楽観的および外段階的手法の終局的挙動について検討する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:50:36 GMT)
StructBench: An Autogenerated Benchmark for Evaluating Large Language Model's Ability in Structure-Rich Text Understanding [30.8] StructBenchは、8つの異なる構造化言語に6,032の質問と29の特定のタスクからなるベンチマークである。
また、LLMと人的パフォーマンスのギャップをより深く調べるために、3,016の質問を含むStructBench-Hardについても紹介する。
結果は、現在最高の性能のLCMはStructBench-Hardで65.0%の精度を達成し、人間の精度は95.7%に達することを示唆している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:48:00 GMT)
Improving Ab-Initio Cryo-EM Reconstruction with Semi-Amortized Pose Inference [30.2] 2D画像からの非初期3D再構成では、構造に加えてポーズを推定する必要がある。
まずマルチヘッドアーキテクチャをポーズエンコーダとして採用し、画像ごとの複数の可視的なポーズを償却的に推測する。
我々のアプローチは最先端のCryoAIよりも高速で、高解像度の再構築を実現している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:44:32 GMT)
UniZero: Generalized and Efficient Planning with Scalable Latent World Models [29.6] textitUniZeroは、トランスフォーマーベースの潜伏世界モデルを用いて、潜伏状態を暗黙の潜伏歴史からテクティディケンタングする新しいアプローチである。
我々は,UniZeroがシングルフレーム入力であっても,Atari 100kベンチマーク上での MuZero スタイルのアルゴリズムの性能と一致または上回っていることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:24:15 GMT)
Fast graph-based denoising for point cloud color information [29.1] 例えば、3Dポイントクラウドを使ったライブストリーミングでは、視覚的品質を高めるためにリアルタイムのポイントクラウドデノゲーション方法が必要である。
本稿では,大規模クラウドのための高速グラフベースデノイング(FGBD)を提案する。
本実験では,従来の復調法と比較して精度を保ちながら,処理時間を劇的に短縮することに成功した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:38:29 GMT)
ADSNet: Cross-Domain LTV Prediction with an Adaptive Siamese Network in Advertising [28.9] 広告プラットフォームは、広告主の真のパフォーマンス指標との整合性を高めるために、ライフタイムバリュー(LTV)を推定するために進化してきた。
実世界のLTVデータのばらつきは、LTV予測モデルに重大な課題をもたらす。
我々は,外部データを利用して購入サンプルのサイズを拡大し,LTV予測モデルを強化することを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:04:46 GMT)
A Sparsity Principle for Partially Observable Causal Representation Learning [28.3] 因果表現学習は、知覚データから高レベルの因果変数を特定することを目的としている。
我々は、インスタンスに依存した部分的可観測パターンを持つデータセットから、未確認の観測から学ぶことに集中する。
提案手法は,推定された表現の間隔を小さくすることで,基礎となる因果変数を推定する2つの手法である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:06:08 GMT)
Full reference point cloud quality assessment using support vector regression [27.5] 本稿では,サポートベクタ回帰(FRSVR)を用いた完全参照点雲質評価法 (FR-PCQA) を提案する。
提案手法は,これらの5つの単純な測度とSVRの計算のみを含むため,精度と計算速度のトレードオフが優れている。
3種類のオープンデータセットによる実験結果から,提案手法は従来のFR-PCQA法よりも精度が高いことがわかった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:22:26 GMT)
The Implicit Bias of Adam on Separable Data [27.5] トレーニングデータが線形分離可能である場合、Adamは学習率の低下を達成する線形勾配に収束することを示す。
我々の結果は、アダムと(確率的な)子孫の違いを理論的観点から明らかにした。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:39:37 GMT)
Nurgle: Exacerbating Resource Consumption in Blockchain State Storage via MPT Manipulation [27.4] ブロックチェーンに新たなアタックサーフェス、すなわち状態ストレージを公開します。
Nurgleは、ステートストレージをターゲットにした最初のDonial-of-Service攻撃である。
Nurgleはブロックチェーンに、状態のメンテナンスと検証に新たなリソースを浪費させ、パフォーマンスを損なう。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:47:39 GMT)
Causal Machine Learning for Cost-Effective Allocation of Development Aid [26.8] 本研究では,援助給付金の不均一な処理効果を予測するための因果機械学習フレームワークを開発した。
本研究では, 半合成データを用いた不均一な処理応答曲線の計算に成功していることを示す。
我々の枠組みは、より効果的なエイズ割り当てのための大きな機会を示し、新しいHIV感染症の総数は最大3.3%減少する可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:47:00 GMT)
A Multimodal Transformer for Live Streaming Highlight Prediction [26.8] ライブストリーミングは、将来のフレームなしで推論し、複雑なマルチモーダルインタラクションを処理するモデルを必要とする。
モーダル信号の時間的シフトを扱うための新しいモーダル時間アライメントモジュールを提案する。
本稿では,大規模データセットから学習し,ユーザの暗黙的なフィードバックを弱い監視信号として活用するための,境界対応Pairwise Lossを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:59:19 GMT)
Eigenpruning: an Interpretability-Inspired PEFT Method [26.5] 固有プルーニング(eigenpruning)は,LLMから特異値を取り除き,特定のタスクの性能を向上させる手法である。
我々のテストでは、プルーンドモデルは元のモデルよりも大きなマージンで優れています。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:56:07 GMT)
Spuriousness-Aware Meta-Learning for Learning Robust Classifiers [26.5] Spurious correlations is brittle associations between certain attribute of inputs and target variables。
深部画像分類器はしばしばそれらを予測に利用し、相関が持たないデータの一般化が不十分になる。
スプリアス相関の影響を緩和することはロバストなモデル一般化に不可欠であるが、しばしばデータ内のスプリアス相関のアノテーションを必要とする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:41:25 GMT)
A DeNoising FPN With Transformer R-CNN for Tiny Object Detection [25.9] そこで本稿では,Trans R-CNN (DNTR) を用いたFPNのデノベーション手法を提案する。
DNTRは、簡単なプラグイン設計、DeNoising FPN (DN-FPN)、効果的なTransformerベースの検出器であるTrans R-CNNで構成されている。
我々は、古いR-CNN検出器を新しいTrans R-CNN検出器に置き換え、自己注意を持つ小さな物体の表現に集中する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:26:14 GMT)
SciAssess: Benchmarking LLM Proficiency in Scientific Literature Analysis [25.2] 大規模言語モデル(LLM)は、自然言語の理解と生成に革命をもたらした。
既存のベンチマークでは、科学文献分析においてLLMの熟練度を適切に評価することができない。
SciAssessは科学文献分析におけるLLMの総合的な評価を目的としたベンチマークである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:45:47 GMT)
On the Hardness of Faithful Chain-of-Thought Reasoning in Large Language Models [25.0] 大規模言語モデル(LLM)は、医療などの重要な領域における現実世界のアプリケーションにますます採用されている。
これらのモデルによって生成されたCoT(Chain-of-Thought)推論が、その基盤となる振る舞いを忠実に捉えることが重要である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:16:44 GMT)
Reasoning in Token Economies: Budget-Aware Evaluation of LLM Reasoning Strategies [24.9] 本稿では,計算予算を評価に組み込む枠組みを提案する。
複雑な推論戦略は、アルゴリズムの創発性のため、純粋に単純なベースラインを超えないことが多い。
自己整合性とは異なり、マルチエージェントの議論やリフレクションのような特定の戦略は、より多くの計算予算が利用されれば悪化する可能性がある。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:59:02 GMT)
Contrastive Diffuser: Planning Towards High Return States via Contrastive Learning [24.7] オフライン強化学習(RL)の性能は、オフラインデータセットにおけるハイリターン軌道の割合に敏感である。
本稿では,低リターントラジェクトリをフル活用し,オフラインRLアルゴリズムの性能を向上させるために,Contrastive diffuser (CDiffuser)を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:29:39 GMT)
SGSM: A Foundation-model-like Semi-generalist Sensing Model [24.2] 我々はセミジェネリストセンシングモデル(S GSM)と呼ばれる新しいセンシングモデルを提案する。
S GSMは従来のシステムに比べてタスク固有のラベル付きデータが少ないため、様々なタスクを半自動で解くことができる。
既存のセンサモデルにS GSMを適用する場合、Wi-Fi評価は20%の精度向上を示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:20:46 GMT)
RetinaQA: A Robust Knowledge Base Question Answering Model for both Answerable and Unanswerable Questions [23.7] State-of-the-the-art Knowledge Base Question Answering (KBQA)モデルはすべての質問に答えられると仮定する。
単一KBQAアーキテクチャにおいて2つの重要なアイデアを統一する新しいモデルであるRetinaQAを提案する。
RetinaQAは、解答可能な問題と解答不能な問題の両方を扱う上で、最先端KBQAモデルの適応性を大幅に上回ることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:42:13 GMT)
BlockPruner: Fine-grained Pruning for Large Language Models [23.5] 研究によると、大きな言語モデル(LLM)の特定のレイヤは、かなりの冗長性を持ち、これらのレイヤを刈り取ることは、全体的なパフォーマンスに最小限の影響を与える。
そこで我々は,BlockPrunerと呼ばれる新しい,トレーニング不要な構造化プルーニング手法を提案する。
我々は,BlockPrunerが最先端のベースラインよりも粒度が高く,効率的なプルーニングを実現していることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:03:33 GMT)
Benchmarking Children's ASR with Supervised and Self-supervised Speech Foundation Models [23.4] 音声基礎モデル(SFM)は、教師付き(例えば、Whisper)や自己監督型(例えば、WavLM)の様々な音声タスクに対して最先端の結果を得た。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:13:19 GMT)
A GPU-accelerated Large-scale Simulator for Transportation System Optimization Benchmarking [23.0] トランスポートシステムシミュレーションのための,初のオープンソースGPU加速型大規模顕微鏡シミュレータを提案する。
シミュレータは84.09Hzで反復可能で、100万台以上の車両で大規模シナリオで88.92倍の計算加速を達成している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:58:17 GMT)
Can We Verify Step by Step for Incorrect Answer Detection? [23.0] 我々は,様々な推論タスクにおける推論連鎖と性能の関係を検討するために,R2PEというベンチマークを導入する。
本ベンチマークは,LLMの最終出力の誤りを推論ステップに基づいて測定することを目的としている。
本稿では,回答チェックベースラインを大きなマージンで上回るPDS(Process Discernibility score)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:53:58 GMT)
Uni-SMART: Universal Science Multimodal Analysis and Research Transformer [22.9] bfUni-textは科学文献の深い理解のために設計された革新的モデルである。
ユニテキストは、他のテキスト中心のLLMよりも優れたパフォーマンスを示す。
我々の探索は、特許侵害検出やグラフのニュアンス解析など、実用的な応用にまで及んでいる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:03:29 GMT)
To Generate or Not? Safety-Driven Unlearned Diffusion Models Are Still Easy To Generate Unsafe Images ... For Now [22.8] 本研究は,5種類の安全駆動型未学習DM(望ましくない概念,スタイル,対象を学習した後のDM)の頑健性を評価する。
本研究は,UnlearnDiffAtkの有効性と有効性を示すものである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:37:23 GMT)
Where is the Truth? The Risk of Getting Confounded in a Continual World [21.9] データセットは、新たなデータへの一般化に失敗する急激な相関によって、最も容易に解決される場合、構築される。
共同創設者がタスク間で時間的に異なるような継続的な学習環境では、共同創設者の効果を緩和するという課題は、標準的な忘れる問題よりもはるかに多い。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:37:31 GMT)
Self-Supervised Vision Transformer for Enhanced Virtual Clothes Try-On [21.4] 本稿では,仮想衣料試着において,自己監督型視覚変換器(ViT)と拡散モデルを用いた革新的なアプローチを提案する。
提案手法は,ViTが生成するローカル衣料品のイメージ埋め込みとグローバルな衣料品との対比により,ディテールの強調を強調する。
実験結果は、仮想試行体験における現実性と詳細の精度の大幅な進歩を示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:46:22 GMT)
Neural Visibility Field for Uncertainty-Driven Active Mapping [21.0] アクティブマッピングに適用したニューラル・ラジアンス・フィールド(NeRF)の新しい不確実性定量化手法であるニューラル・ビザビリティ・フィールド(NVF)を提案する。
我々の重要な洞察は、トレーニングビューで見えない領域は、この領域でのNeRFによる本質的に信頼性の低い色予測につながり、合成ビューでは不確実性が増大するということである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:57:22 GMT)
Humor in AI: Massive Scale Crowd-Sourced Preferences and Benchmarks for Cartoon Captioning [20.9] 本稿では,220万以上のキャプションに2億5000万以上の人間格付けを含む,創造的なタスクのための新しいマルチモーダル選好データセットを提案する。
我々は,GPT4と人的判断の両方を用いて,モデル生成キャプションの品質を判定するための新しいベンチマークを提案する。
この広範なデータ収集の取り組みを締めくくると、私たちは研究コミュニティに選好データセット全体を公開します。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:26:25 GMT)
A Unified Graph Selective Prompt Learning for Graph Neural Networks [20.6] Graph Prompt Feature(GPF)は、Graph Neural Networks(GNN)のトレーニング済みモデルを適応することに成功した。
GNNファインチューニングのための新しいグラフ選択型プロンプト特徴学習(GSPF)を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:36:40 GMT)
Personalized Pieces: Efficient Personalized Large Language Models through Collaborative Efforts [20.5] Per-Pcsは、パーソナライズされたPEFTを安全に共有し、組み立てることを可能にするフレームワークである。
プライバシーを保護し、過剰なストレージや計算要求なしにきめ細かなユーザーモデリングを可能にする。
テストでは、Per-Pcsが非個人化およびPEFT検索ベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:26:18 GMT)
CoMM: A Coherent Interleaved Image-Text Dataset for Multimodal Understanding and Generation [20.1] 我々は、生成したマルチモーダルコンテンツの一貫性、一貫性、アライメントを高めるために設計された高品質なデータセットであるCoMMを紹介する。
CoMMは、教育内容とビジュアルストーリーテリングに焦点を当て、多様なソースからの生データを活用する。
さまざまな品質評価指標は、フィルタされたデータセットの高品質さを証明するように設計されている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:27:58 GMT)
GenMM: Geometrically and Temporally Consistent Multimodal Data Generation for Video and LiDAR [20.0] 時間的および幾何学的に整合した3Dオブジェクトを挿入することにより、RGBビデオとLiDARスキャンを共同で編集するGenMMを提案する。
提案手法では,対象映像に新たなオブジェクトをシームレスに挿入し,ブレンドするために,参照画像と3Dバウンディングボックスを用いる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:29:01 GMT)
FlowMap: High-Quality Camera Poses, Intrinsics, and Depth via Gradient Descent [20.0] FlowMapは、正確なカメラポーズ、カメラ内在、およびビデオシーケンスのフレーム毎の密度の深さを解決する、エンドツーエンドの微分可能な方法である。
提案手法は,最小2乗の目的をビデオごとの勾配差最小化する。
提案手法によって得られたカメラパラメータと密度深度は,360度軌道上での光リアルな新規ビュー合成を可能にすることを実証的に示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:30:56 GMT)
GenNBV: Generalizable Next-Best-View Policy for Active 3D Reconstruction [19.7] 我々は、エンドツーエンドの一般化可能なNBVポリシーであるGenNBVを提案する。
我々の政策は強化学習(RL)ベースのフレームワークを採用し、典型的な制限されたアクション空間を5次元自由空間に拡張する。
実験により, 建築規模が不明瞭な対象に対して, 98.26%, 97.12%のカバレッジ比を達成できた。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:54:19 GMT)
Enhancing the Inductive Biases of Graph Neural ODE for Modeling Dynamical Systems [19.6] 動的システムの時間進化を学習するために,グラフベースのニューラルODE,GNODEを提案する。
我々は,LNNやHNNと同様,制約を明示的に符号化することで,GNODEのトレーニング効率と性能を大幅に向上させることができることを示す。
これらのバイアスを誘導することで、エネルギー違反とロールアウトエラーの両方の観点から、モデルの性能を桁違いに向上させることができることを実証する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:23:00 GMT)
Self Pre-training with Topology- and Spatiality-aware Masked Autoencoders for 3D Medical Image Segmentation [19.6] Masked Autoencoders (MAEs) は、自然および医学的な画像解析問題に対する事前訓練型ビジョントランスフォーマー (ViTs) に有効であることが示されている。
既存のMAE事前学習手法は、ViTアーキテクチャで特別に開発されたが、幾何学的形状や空間情報をキャプチャする能力は欠けていた。
本稿では,3次元医用画像セグメンテーションのための自己事前トレーニング(すなわち,同じターゲットデータセット上で事前トレーニングされたモデル)のための既知のMAEの新たな拡張を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:15:17 GMT)
CancerLLM: A Large Language Model in Cancer Domain [19.4] CancerLLMは70億のパラメータとMistralスタイルのアーキテクチャを持つモデルで、17のがんタイプをカバーする2,676,642の臨床ノートと515,524の病理報告で事前訓練されている。
以上の結果から,ClancLLMは既存のLLMと比較して,F1スコアが平均8.1%向上した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:02:48 GMT)
From Trojan Horses to Castle Walls: Unveiling Bilateral Data Poisoning Effects in Diffusion Models [19.1] 我々は、BadNetsのようなデータ中毒法がDMによって直接的に生成を劣化させるかどうか検討する。
BadNetsのようなデータ中毒攻撃は、DMが誤画像を生成するのに依然として有効であることを示す。
被毒DMはトリガーの割合が増加しており、これはトリガー増幅と呼ばれる現象である」
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:31:04 GMT)
FreeMotion: MoCap-Free Human Motion Synthesis with Multimodal Large Language Models [19.1] MLLMをベースとしたユーザ制御信号として自然言語命令を用いたオープンなヒューマンモーション合成について検討する。
本手法は,多くの下流タスクにおいて,一般的な人間の動作合成を実現することができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:10:37 GMT)
Learning to Understand: Identifying Interactions via the Möbius Transform [19.0] 学習関数の解釈可能な表現を見つけるために、M"obius transform を用いる。
このアルゴリズムの頑健なバージョンはノイズに耐え、この複雑さを維持する。
いくつかの例では、M"obius変換によって生成される表現は元の関数に最大で2倍忠実である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:22:39 GMT)
MMBee: Live Streaming Gift-Sending Recommendations via Multi-Modal Fusion and Behaviour Expansion [18.5] ギフトインタラクションの正確なモデリングは、ユーザのエクスペリエンスを向上するだけでなく、ストリーマーの収益も増大させる。
従来のレコメンデーション問題として,ライブストリーミングギフト予測に関する先行研究がある。
実時間マルチモーダル・フュージョンとビヘイビア・エクスパンジョンに基づくMMBeeを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:59:00 GMT)
Generating and Evolving Reward Functions for Highway Driving with Large Language Models [18.5] 強化学習(RL)は自動運転技術の進歩において重要な役割を担っている。
本稿では,大規模言語モデル(LLM)をRLと統合し,自律運転における報酬関数設計を改善する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:50:10 GMT)
Can LLMs Effectively Leverage Graph Structural Information through Prompts, and Why? [18.3] 大きな言語モデル(LLM)は、リッチテキスト属性でグラフを処理する能力に注目が集まっている。
グラフデータに固有の構造情報の取り込みにより,LLMの予測性能が向上する理由を理解することを目的としている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:26:21 GMT)
2.5D Multi-view Averaging Diffusion Model for 3D Medical Image Translation: Application to Low-count PET Reconstruction with CT-less Attenuation Correction [17.9] ポジトロン・エミッション・トモグラフィ(PET)は重要な臨床画像診断ツールであるが、患者や医療機関に必然的に放射線障害をもたらす。
非減衰補正低線量PETを減衰補正標準線量PETに変換する3D法の開発が望ましい。
近年の拡散モデルは、従来のCNNベースの手法よりも優れた画像から画像への翻訳のための最先端のディープラーニング手法として登場した。
NACを用いた3次元画像から画像への変換のための新しい2.5次元マルチビュー平均拡散モデル(MADM)を開発した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:36:30 GMT)
Improved High-Probability Bounds for the Temporal Difference Learning Algorithm via Exponential Stability [17.8] 一般化された, インスタンスに依存しないステップサイズを持つ単純なアルゴリズムは, ほぼ最適分散とバイアス項を得るのに十分であることを示す。
本手法は, 線形近似のための洗練された誤差境界と, ランダム行列の積に対する新しい安定性結果に基づく。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:29:03 GMT)
Lightweight Audio Segmentation for Long-form Speech Translation [17.7] モデルサイズを小さくすることで、より優れた音声翻訳品質を実現するセグメンテーションモデルを提案する。
また,音声分割モデルの基盤となるSTシステムへの適切な統合は,推論時の全体的な翻訳品質の向上に不可欠であることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:02:15 GMT)
Enhancing Role-playing Systems through Aggressive Queries: Evaluation and Improvement [17.6] 大言語モデル(LLM)は、特にロールプレイングシステム(RPS)分野において、対話生成を新しい領域に推進している。
既存のLLMベースのRSSは、境界シナリオで複雑なクエリと閉じ込められたクエリを扱う場合、役割と整合するのに依然として苦労している。
本研究は,MORTISE (Modular Orchestrated Trap-setting Interaction SystEm) を設計し,ロールプレイングLLMの性能向上を図る。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:51:38 GMT)
On the Sequence Evaluation based on Stochastic Processes [17.5] 本稿では,テキストエンコーダの訓練目標について紹介し,長文評価のためのより徹底的な測定(スコア)を設計する。
提案したトレーニング目的はシーケンスコヒーレンスを効果的に保存し,新しいスコアは時間的および空間的両方の依存関係を包括的にキャプチャする。
実験の結果,異なる長さの文書間の大域的および局所的な識別を含む,様々なシーケンス評価タスクにおいて,優れた性能を示した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:08:53 GMT)
TokenRec: Learning to Tokenize ID for LLM-based Generative Recommendation [16.9] TokenRecは、大規模言語モデル(LLM)ベースのRecommender Systems(RecSys)のトークン化と検索のための新しいフレームワークである。
我々の戦略であるMasked Vector-Quantized (MQ) Tokenizerは、協調フィルタリングから学んだマスキングされたユーザ/イテム表現を離散トークンに定量化する。
我々の生成的検索パラダイムは,自動回帰復号処理やビーム検索処理の不要さを解消するために,ユーザに対してKドル以上のアイテムを効率的に推奨するように設計されている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:07:44 GMT)
CeRF: Convolutional Neural Radiance Fields for New View Synthesis with Derivatives of Ray Modeling [16.8] 我々は、光線に沿った放射の微分をモデル化するために、コナールニューラルレージアンス場を導入する。
提案手法は, 1次元畳み込み演算に基づいて, 構造化ニューラルネットワークアーキテクチャによる潜在的光線表現を効果的に抽出する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:47:05 GMT)
WirelessLLM: Empowering Large Language Models Towards Wireless Intelligence [16.7] 大規模言語モデル(LLM)は、無線通信システムに革命をもたらす可能性への関心を喚起している。
無線システム用LLMの既存の研究は、通信言語理解の直接的な応用に限られている。
本稿では,無線通信ネットワークのユニークな課題と要件に対処するため,LLMの適応と拡張のための総合的なフレームワークである WirelessLLM を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:01:54 GMT)
Occam's Razor for Self Supervised Learning: What is Sufficient to Learn Good Representations? [16.7] Self Supervised Learning (SSL)ソリューションには、数多くの設計選択が導入されている。
これらの追加は2つの課題をもたらす: まず、これらの相互に絡み合った設計を組み込むのに失敗する理論研究の影響を制限する。
本研究では、少なくとも数十万のサンプルの事前トレーニングデータセットに対して、SSLによって導入された追加設計は、学習された表現の品質に寄与しない、という驚くべき観察を前進させる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:42:15 GMT)
DIET: Customized Slimming for Incompatible Networks in Sequential Recommendation [16.4] 推奨システムは、頻繁なモバイル要求によるネットワークの混雑を軽減するために、エッジにモデルをデプロイし始める。
いくつかの研究はエッジ側とリアルタイムデータの近接を利用して、エッジ固有のモデルを作成するように微調整している。
これらの手法は、モデルを最新の状態に保つために、相当量の計算資源と頻繁なネットワーク転送を必要とする。
我々は、DIET(IncompatiblE neTworks)のためのカスタマイズされたslImmingフレームワークを提案し、DIETはすべてのデバイスに同じ一般的なバックボーン(潜在的に特定のエッジと互換性のない)をデプロイする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:57:25 GMT)
Mitigating Privacy Risk in Membership Inference by Convex-Concave Loss [16.4] 機械学習モデルは、トレーニングセットにサンプルがあるかどうかを推測することを目的とした、メンバシップ推論攻撃(MIA)の影響を受けやすい。
既存の作業では、勾配上昇を利用してトレーニングデータの損失分散を拡大し、プライバシリスクを軽減する。
本稿では,勾配降下によるトレーニング損失分布の分散化を可能にする新しい手法であるConvex-Concave Lossを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:10:56 GMT)
Why Not Use Your Textbook? Knowledge-Enhanced Procedure Planning of Instructional Videos [16.3] 本稿では,エージェントが行動手順を論理的に構築し,戦略的手続き計画を構築する能力について考察する。
この計画は、実生活の指導ビデオに示されているように、初期視覚観察から対象視結果へのナビゲートに不可欠である。
我々は,学習データから抽出した確率論的手続き的知識グラフを利用する,知識向上型プロジェクションプランニングシステムKEPPを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:55:58 GMT)
A Label is Worth a Thousand Images in Dataset Distillation [16.3] データ$textitquality$は、機械学習モデルのパフォーマンスにおいて重要な要素である。
本研究では, 最先端蒸留法の性能を説明する主な要因は, 合成データを生成する技術ではなく, ソフトラベルの利用であることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:30:29 GMT)
Robustness Implies Privacy in Statistical Estimation [16.1] 本研究では,高次元統計学における敵のプライバシーと差分プライバシーの関係について検討する。
プライバシーから堅牢性への最初のブラックボックスの削減は、最適なトレードオフを伴うプライベートな推定器を生み出すことができる。
また, アルゴリズムは, ほぼ最適に崩壊したサンプルに対して頑健である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:37:41 GMT)
Can We Catch the Elephant? A Survey of the Evolvement of Hallucination Evaluation on Natural Language Generation [15.7] 幻覚評価システムは複雑で多様であり、明確な組織が欠如している。
本調査は,幻覚評価における現在の限界を特定し,今後の研究方向性を明らかにすることを目的としている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 22:57:20 GMT)
Do Large Language Models Discriminate in Hiring Decisions on the Basis of Race, Ethnicity, and Gender? [15.4] 大規模言語モデル(LLM)が雇用決定において人種と性別に基づく名前の差別を示すか否かを検討する。
我々は、LLMに対して、雇用決定を告げるメールを書くための一連のテンポラティックなプロンプトを設計する。
応募者のファーストネームを操作することで、LLMが受信メールや拒否メールを生成する確率に対する、認識された人種、民族、性別の影響を測定する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:31:16 GMT)
Counterfactual Generative Models for Time-Varying Treatments [15.2] 公衆衛生・臨床科学における意思決定には, 治療の非現実的な結果の推定が不可欠である。
そこで本研究では, 時間変化処理下で, 反実例を生成できる新しい条件生成フレームワークを提案する。
合成データと実世界のデータの両方を用いて,本手法の徹底的な評価を行う。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:50:42 GMT)
How Should We Extract Discrete Audio Tokens from Self-Supervised Models? [15.0] 本稿では,識別的および生成的タスクにまたがるセマンティックトークンの最適構成について検討する。
複数のSSL層にまたがるユニバーサルヴォコーダをトレーニングするためのスケーラブルなソリューションを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:43:07 GMT)
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation [15.0] SGRv2は、視覚および行動表現の改善を通じてサンプル効率を向上させる模倣学習フレームワークである。
SGRv2 は RLBench タスクで5つのデモしか使用せず、26タスク中23タスクで RVT ベースラインを超えている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:27:35 GMT)
Sequential Decision-Making for Inline Text Autocomplete [14.8] テキスト入力システムにおけるインラインオートコンプリート提案の改善問題について検討する。
我々は、強化学習を用いて、ターゲットユーザとの繰り返しインタラクションを通じて提案ポリシーを学習する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:02:51 GMT)
Concentrate Attention: Towards Domain-Generalizable Prompt Optimization for Language Models [14.7] 集中」というドメイン一般化可能なプロンプト最適化に向けた新たな目標を提案する。
提案手法は,ソフトプロンプトの一般化では1.42%,ハードプロンプトの一般化では2.16%,マルチソース領域の一般化では2.16%,比較プロンプトの最適化では1.42%向上する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 10:02:46 GMT)
Interoperability of the Metaverse: A Digital Ecosystem Perspective Review [14.6] その重要な役割について意見が一致しているにもかかわらず、メタバースへの影響を探るには研究のギャップがある。
本研究は,Web of Science と Scopus データベースの文献とコンテンツ分析の体系的レビューを通じて,このギャップを埋めるものである。
本研究は,メタバース相互運用研究の複雑な分野をナビゲートし,今後の調査のためのベンチマークを確立することを目的とする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:39:26 GMT)
Unifying Demonstration Selection and Compression for In-Context Learning [14.5] ICL フレームワーク UniICL を提案する。このフレームワークは,実演選択と圧縮を統一し,単一の凍結 LLM による最終応答生成を行う。
UniICLは、プロジェクション層から派生した17Mのトレーニング可能なパラメータのみを含む、パラメータ効率のよいフレームワークである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:16:57 GMT)
Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models [14.5] 信頼性・確率アライメントの概念を紹介します。
モデルの内部と信頼感の一致を調査する。
分析したモデルのうち、OpenAIのGPT-4は信頼性と信頼性のアライメントが最強であった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 22:18:06 GMT)
QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL [14.3] 微調整されたモデルは、マルチターンのテキスト検索タスクでしばしば課題に直面します。
マルチターンテキスト-問合せタスクにおいて,複数種類の質問を処理するためのLLMの拡張が望まれる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 10:54:54 GMT)
Chip-scale generation of 60-mode continuous-variable cluster states [14.2] 色レーザー励起光マイクロ共振器において60モードのクラスター状態を示す。
最大60qumodsの1次元および2次元のクラスター状態を実現する。
我々の研究は、大規模に絡み合った量子資源を構築するためのコンパクトでスケーラブルなプラットフォームを提供する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:53:52 GMT)
Task Facet Learning: A Structured Approach to Prompt Optimization [14.2] 本稿では,タスクの複数の面をトレーニング例から学習するアルゴリズムを提案する。
結果のアルゴリズムであるUniPromptは、各プロンプトセクションの初期候補を生成する生成モデルで構成されている。
複数のデータセットと実世界のタスクに対する経験的評価は、UniPromptを使って生成されたプロンプトが、人間のチューニングしたプロンプトよりも高い精度が得られることを示している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:54:26 GMT)
Chu-ko-nu: A Reliable, Efficient, and Anonymously Authentication-Enabled Realization for Multi-Round Secure Aggregation in Federated Learning [13.6] セキュアなアグリゲーションのための,より信頼性が高く,匿名で認証する方式であるChu-ko-nuを提案する。
中古ぬは秘密鍵成分の再分配過程を補うことで確率P障壁を破る。
FLトレーニングに参加するクライアントを匿名でサポートし、攻撃の有無でクライアントを効果的に認証することができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:14:54 GMT)
Human-AI Collaborative Essay Scoring: A Dual-Process Framework with LLMs [13.3] 本研究では,Large Language Models (LLMs) のエッセイ自動評価における有効性について検討した。
本稿では,デュアルプロセス理論にインスパイアされたオープンソースのLLMベースのAESシステムを提案する。
本システムでは, 学習過程の自動化だけでなく, 成績や効率の向上も図っている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:44:08 GMT)
fNeRF: High Quality Radiance Fields from Practical Cameras [13.2] 本稿では,レンズの光学的特性を活用し,デフォーカスブラーの存在下でのシーン再構成を向上するレイキャスティングの改良を提案する。
提案手法は, ピンホールモデルよりも実用カメラのデフォーカスブラー挙動とよく一致していることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:33:06 GMT)
SemanticMIM: Marring Masked Image Modeling with Semantics Compression for General Visual Representation [13.0] SemanticMIMは、一般的な視覚表現のためのマスク付き画像モデリング(MIM)とコントラスト学習(CL)の利点を統合するためのフレームワークである。
我々はCLとMIMの徹底的な比較分析を行い、それらの相補的優位性は2つの相、すなわち圧縮と再構成から生じることを明らかにした。
我々は,SemanticMIMがCLとMIMの利点を効果的に実現し,性能と特徴線形分離性を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:39:32 GMT)
WaterScenes: A Multi-Task 4D Radar-Camera Fusion Dataset and Benchmarks for Autonomous Driving on Water Surfaces [12.8] WaterScenesは、水面での自律走行のための最初のマルチタスク4Dレーダーカメラ融合データセットである。
我々の無人表面車両(USV)は、オブジェクト関連の情報を識別するための全天候のソリューションを提供する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:28:33 GMT)
Learning to Adapt Foundation Model DINOv2 for Capsule Endoscopy Diagnosis [12.7] カスタマイズを容易にするローランク適応(LoRA)技術を用いたアダプティブ基礎モデル(Adapt foundation model)という簡易なアプローチを導入する。
従来の微調整方法とは異なり、我々は特定の外科領域の知識を吸収するように設計されたLoRAレイヤーを含む。
本ソリューションは,カプセル内視鏡診断に基礎モデルを適用できることを実証するものである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:21:33 GMT)
Noise-induced quantum synchronization and maximally entangled mixed states in superconducting circuits [12.6] ノイズ誘起量子同期は、隣同士の相互作用が近い超伝導トランスモン量子ビットで観測される。
2つの同期された終端量子ビットは、非零コンカレンスで絡み合っており、それらは一般化されたベル状態のクラスに属することを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:55:41 GMT)
Weakly Convex Regularisers for Inverse Problems: Convergence of Critical Points and Primal-Dual Optimisation [12.5] 臨界点の観点から収束正則化の一般化された定式化を提案する。
これは弱凸正規化器のクラスによって達成されることを示す。
この理論を正規化学習に適用し、入力の弱い凸ニューラルネットワークに対する普遍的な近似を証明した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:44:49 GMT)
A Finite Difference Informed Graph Network for Solving Steady-State Incompressible Flows on Block-Structured Grids [12.4] 本稿では,GNを物理制約下で訓練するためのグラフ畳み込みに基づく有限差分法(GC-FDM)を提案する。
我々のゴールは、後ろ向きのステップ、円形のシリンダー、二重シリンダー周辺の流れに対して、安定した非圧縮性ナビエ・ストークス方程式を解くことである。
トレーニング効率と精度を向上し,速度場予測における最小相対誤差を10~3ドルとした。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:30:40 GMT)
Privacy-Preserving Heterogeneous Federated Learning for Sensitive Healthcare Data [12.3] 我々は、AAFV(Abstention-Aware Federated Voting)と呼ばれる新しいフレームワークを提案する。
AAFVは、データのプライバシを同時に保護しながら、共同で機密的に異質なローカルモデルをトレーニングすることができる。
特に,提案手法では,不均一な局所モデルから高信頼投票を選択するために,しきい値に基づく棄権方式を採用している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:43:40 GMT)
Meta Prompting for AI Systems [12.3] 本稿では,言語モデル(LM)とAIシステムを利用した問題解決とデータインタラクションの革新的手法であるMeta Prompting(MP)について包括的な研究を行う。
MPは従来のコンテンツ中心の手法よりも情報の構造と構文を強調している。
複雑な問題をより単純なサブプロブレムに効果的に分解し、トークン効率を向上し、より公平な問題解決比較を可能にする方法を示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:19:24 GMT)
HiFGL: A Hierarchical Framework for Cross-silo Cross-device Federated Graph Learning [12.1] Federated Graph Learning (FGL)は、分散グラフデータから高品質な表現を学習するための有望な方法として登場した。
クロスデバイスFGLのための階層型フェデレーショングラフ学習フレームワークを提案する。
具体的には、異種クライアント上でのフェデレーション付きGNNトレーニングを保護するために、統一階層型アーキテクチャを考案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:34:40 GMT)
From Words to Worlds: Transforming One-line Prompt into Immersive Multi-modal Digital Stories with Communicative LLM Agent [11.6] 本稿では,デジタルストーリーテリングを自動化するためのStoryAgentフレームワークを紹介する。
StoryAgentは手動の介入、インタラクティブなシーンオーケストレーション、物語の一貫性といった重要な問題に取り組む。
その結果、参照ビデオなしでコヒーレントなデジタルストーリーを作成できるフレームワークの能力を実証した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:03:43 GMT)
E-SAGE: Explainability-based Defense Against Backdoor Attacks on Graph Neural Networks [11.1] 本稿では,説明可能性に基づくGNNバックドア攻撃の防御手法であるE-SAGEを提案する。
E-SAGEは、エッジスコアに基づいて、グラフ上に反復的なエッジプルーニング処理を適応的に適用する。
本研究では,E-SAGEが攻撃環境における最先端のグラフバックドア攻撃に対して有効であることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:50:41 GMT)
Unlocking Large Language Model's Planning Capabilities with Maximum Diversity Fine-tuning [10.7] 大規模言語モデル(LLM)は、技術やシステム設計の推進によって達成された、目覚ましいタスク解決能力を示している。
本稿では,LLMの計画能力に及ぼす微調整の影響について検討する。
計画領域におけるファインチューニングのサンプル効率を向上させるために,MDFT(Maximum Diversity Fine-Tuning)戦略を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:06:14 GMT)
Unprecedented Code Change Automation: The Fusion of LLMs and Transformation by Example [10.6] 大規模言語モデル(LLM)は、膨大なコードデータセットに基づいてトレーニングされる。
LLMを使用して、正確性、有用性、適用性の基準を満たすコード変種を生成するベストプラクティスを特定します。
PyCraftでそれらを実装し、正しい変種を識別し、入力を平均58倍に拡張し、ターゲットコードを増やすための変更を最大39倍まで自動化するF尺度を96.6%達成しました。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:40:07 GMT)
CoLoR-Filter: Conditional Loss Reduction Filtering for Targeted Language Model Pre-training [10.5] 本稿では,ベイズに触発された経験的アプローチを利用して,単純で効率的な選択基準を導出するデータ選択手法であるCoLoR-Filterを提案する。
CoLoR-Filterは1.2bパラメータターゲットモデルをトレーニングして、ランダムに選択された25bトークン上でトレーニングされた1.2bパラメータモデルにマッチさせることができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:28:02 GMT)
Large Language Models as Event Forecasters [10.3] 人間の出来事の鍵となる要素は、主題、関係、対象、タイムスタンプからなる四重項として抽出される。
これらの四重項または四重項は、特定の領域内で組織化されると、時間知識グラフ(TKG)を形成する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:09:31 GMT)
Decoding News Narratives: A Critical Analysis of Large Language Models in Framing Detection [10.3] 本稿では,ニュース見出しにおけるフレーミングの検出において,GPT-4,GPT-3.5 Turbo,FLAN-T5モデルを包括的に分析する。
我々はこれらのモデルを,ゼロショット,ドメイン内例による少数ショット,クロスドメイン例,モデルが予測を説明する設定など,さまざまなシナリオで評価した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 23:20:15 GMT)
MALLM-GAN: Multi-Agent Large Language Model as Generative Adversarial Network for Synthesizing Tabular Data [10.2] 大規模言語モデル(LLM)を用いた合成(語彙)データを生成するフレームワークを提案する。
提案手法は, サンプルサイズが小さい一般的なシナリオにおいて, 合成データ生成の品質を著しく向上させる。
以上の結果から,本モデルは下流タスクにおける高品質な合成データを生成する上で,実際のデータのプライバシを維持しつつ,いくつかの最先端モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:26:17 GMT)
SiBBlInGS: Similarity-driven Building-Block Inference using Graphs across States [9.8] 国間グラフを用いた類似性駆動型ビルディングブロック推論フレームワーク(SiBBlInGS)を提案する。
SiBBlInGSは、グラフベースの辞書学習アプローチを提供し、その時間的トレースとともにスパースBBを発見する。
我々は、SiBBlInGSの複雑な現象に関する洞察を明らかにする能力と、ノイズや欠落したサンプルに対する頑健さを実証する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:55:09 GMT)
Enhancing Anomaly Detection Generalization through Knowledge Exposure: The Dual Effects of Augmentation [9.7] 異常検出では、標準から逸脱し、頻繁に発生するデータセット内のインスタンスを識別する。
現在のベンチマークでは、実際のシナリオと一致しない通常のデータの多様性の低い方法を好む傾向にある。
本稿では,概念力学の理解に外部知識を統合した新しいテストプロトコルと知識公開(KE)手法を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:37:36 GMT)
Word Embedding for Social Sciences: An Interdisciplinary Survey [9.7] 我々は,調査論文の方法と手順を説明するための分類学を構築した。
この調査はまた、文献で使われる共通類似度の測定が異なる結果をもたらすことを警告するための簡単な実験も行った。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:59:28 GMT)
FedCVT: Semi-supervised Vertical Federated Learning with Cross-view Training [9.6] フェデレート・クロスビュー・トレーニング(Federated Cross-view Training, FedCVT)は、縦型フェデレーション学習モデルの性能を向上させる半教師付き学習手法である。
FedCVTは独自のデータとモデルパラメータを共有する必要はなく、データのプライバシを保存する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:55:58 GMT)
Panoptic-FlashOcc: An Efficient Baseline to Marry Semantic Occupancy with Panoptic via Instance Center [9.3] 我々は,リアルタイムなパノプティクスの占有を可能にする,単純かつ堅牢な2D機能フレームワークであるPanoptic-FlashOccを提案する。
本手法では,単一ネットワークにおけるセマンティック占有とクラス対応インスタンスクラスタリングを同時に学習する。
Panoptic-FlashOccは、汎視的占有率予測における顕著な成果を示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:39:38 GMT)
CrossFuse: A Novel Cross Attention Mechanism based Infrared and Visible Image Fusion Approach [9.3] 補完情報を強化するために,CAM(Cross attention mechanism)を提案する。
融合画像を生成するための2段階の訓練戦略に基づく融合スキームを提案する。
実験の結果,提案手法は既存の核融合ネットワークと比較してSOTA核融合性能が得られることがわかった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:52:42 GMT)
Candidate Pseudolabel Learning: Enhancing Vision-Language Models by Prompt Tuning with Unlabeled Data [9.1] 本研究では,未ラベルデータの多い視覚言語モデルに対して,Candidate Pseudolabel Learning法を提案する。
提案手法は,真のラベルインクルージョンとクラスバランスの取れたインスタンス選択において,性能が向上する可能性がある。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:50:20 GMT)
Federated Multi-Armed Bandits Under Byzantine Attacks [9.0] FMAB(Federated Multi-armed Bandits)は、学習者がMABゲームをし、集約されたフィードバックをサーバに伝達し、グローバルな最適なアームを学ぶための新興フレームワークである。
本研究では,学習プロセスを脅かす偽モデル更新を送信できるビザンティンクライアントの存在下でのFMAB問題について検討する。
我々は,ビザンティンの顧客に対応するために,中央値平均オンラインアルゴリズムであるFed-MoM-UCBを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:53:02 GMT)
A Comprehensive Survey of Foundation Models in Medicine [8.9] ファンデーションモデル(FM)は、自己教師技術を用いて広範囲のデータセットでトレーニングされた大規模なディープラーニングモデルである。
私たちは、医療におけるFMの歴史、学習戦略、旗艦モデル、アプリケーション、課題に焦点を当てています。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:04:06 GMT)
Nonlocality and Nonlinearity Implies Universality in Operator Learning [8.8] ニューラル作用素アーキテクチャは、無限次元バナッハ空間の間の作用素を近似する。
函数空間間の作用素の一般近似が非局所的かつ非線形であることは明らかである。
これら2つの属性をどのように組み合わせて、普遍近似を導出するかを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:00:32 GMT)
A Comprehensive Taxonomy and Analysis of Talking Head Synthesis: Techniques for Portrait Generation, Driving Mechanisms, and Editing [8.2] トーキングヘッド合成は、特定のコンテンツによって駆動される静止画像からポートレートビデオを生成する高度な方法である。
本調査は,3つの重要な領域 – ポートレート生成,駆動機構,編集技術 – に分類し,その技術を体系的にレビューする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:14:59 GMT)
Hijacking Large Language Models via Adversarial In-Context Learning [8.2] In-context Learning (ICL)は、特定の下流タスクにLLMを活用する強力なパラダイムとして登場した。
既存の攻撃は、検出しやすく、外部モデルに依存しているか、ICLに対する特異性を欠いている。
この研究は、これらの問題に対処するために、新たなICLに対するトランスファー可能な攻撃を導入する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:54:54 GMT)
MMVR: Millimeter-wave Multi-View Radar Dataset and Benchmark for Indoor Perception [8.1] マルチビュー高分解能レーダヒートマップを用いた屋内レーダデータの収集を行う。
データセットは、25ドル(約2,300円)の被験者から収集された345ドル(約3,300円)のマルチビューレーダーフレームで構成されています。
我々はMMVRが屋内車両(ロボット/ヒューマノイド)航法、建築エネルギー管理、高齢者介護のための屋内レーダ認識開発を促進し、効率、ユーザエクスペリエンス、安全性の向上を期待する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:35:47 GMT)
Quantum Equation-of-Motion Method with Single, Double, and Triple Excitations [7.9] 単一,二重,三重の励起を用いたqEOM法の効率的な実装を提案する。
我々の新しい手法は0.18eV未満のエネルギー誤差をもたらす。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:07:20 GMT)
Poetry2Image: An Iterative Correction Framework for Images Generated from Chinese Classical Poetry [7.5] Poetry2Imageは、漢詩から生成された画像の反復的な補正フレームワークである。
提案手法は70.63%の平均要素完全性を実現し,直接画像生成よりも25.56%向上した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:45:08 GMT)
Graph Neural Backdoor: Fundamentals, Methodologies, Applications, and Future Directions [7.4] GNNの強化にもかかわらず、最近の研究はバックドア攻撃に対する潜在的な脆弱性を実証的に実証している。
この調査は、グラフバックドアの原則を探求し、ディフェンダーに洞察を提供し、将来のセキュリティ研究を促進することを目的としている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:23:46 GMT)
Adversarial Math Word Problem Generation [6.9] 大規模言語モデル(LLM)の公平な評価を保証するための新しいパラダイムを提案する。
評価を目的とした質問の構造と難易度を保持する逆例を生成するが,LLMでは解けない。
我々は様々なオープン・クローズド・ソース LLM の実験を行い、定量的かつ質的に、我々の手法が数学の問題解決能力を著しく低下させることを示した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 22:36:20 GMT)
MDA: An Interpretable Multi-Modal Fusion with Missing Modalities and Intrinsic Noise [6.6] 本稿では,モーダル・ドメイン・アテンション(MDA)を導入して,各モーダルの重みに対する適応調整を実現する,新しいマルチモーダル融合フレームワークを提案する。
本研究の目的は、欠落したモダリティや固有のノイズを取り入れつつ、マルチモーダル情報の融合を容易にし、マルチモーダルデータの表現を向上させることである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:08:58 GMT)
Seeing Clearly, Answering Incorrectly: A Multimodal Robustness Benchmark for Evaluating MLLMs on Leading Questions [6.4] ほとんどの評価ベンチマークは、誤った答えは視覚的内容の理解の欠如を示していると仮定している。
その結果,MLLMは視覚的内容が正しく理解されているにもかかわらず,誤解答をすることが多いことがわかった。
このことは、誤った答えは必ずしも理解の欠如を示唆するものではなく、むしろ主要な質問に対する堅牢性の欠如に起因する可能性があることを示唆している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:58:26 GMT)
KBody: Towards general, robust, and aligned monocular whole-body estimation [6.3] KBodyは、低次元のボディモデルを画像に適合させる方法である。
データ駆動モデルの推定に頼って、予測と最適化のアプローチに従う。
非対称距離場を統合して、ポーズと形状捕獲能力のバランスをとる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:41:53 GMT)
Large Language Models as Surrogate Models in Evolutionary Algorithms: A Preliminary Study [5.7] サロゲートアシスト選択は、高価な最適化問題を解決する進化アルゴリズムの中核的なステップである。
伝統的に、これは従来の機械学習手法に依存しており、過去の評価を利用して新しいソリューションの性能を予測する。
本研究では,LLM推論機能に基づいた新しいサロゲートモデルを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:54:00 GMT)
SparseRadNet: Sparse Perception Neural Network on Subsampled Radar Data [5.3] レーダー生データは、しばしば過剰なノイズを含むが、レーダー点雲は限られた情報しか保持しない。
本稿では,適応的なサブサンプリング手法と,空間パターンを利用したネットワークアーキテクチャを提案する。
RADIalデータセットの実験により,SparseRadNetはオブジェクト検出における最先端(SOTA)性能を超え,自由空間セグメンテーションにおけるSOTA精度に近づいた。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:26:10 GMT)
Forecasting for Swap Regret for All Downstream Agents [5.1] 我々は, 最善を尽くす下流エージェントが, スワップ後悔を抑えることが保証されるよう, 予測を行うことの問題点について検討する。
校正されていないが、慎重に選択されたイベントの収集に偏っていない予測を行うことで、任意の下流エージェントが後悔のスワップを減らすことを保証できることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:31:37 GMT)
Unleashing GPT on the Metaverse: Savior or Destroyer? [4.9] この論文は、メタバースベースの教育、エンターテイメント、パーソナライゼーション、サポートにGPTを活用することの長所と短所を掘り下げている。
ダイナミックでパーソナライズされたエクスペリエンスは、このテクノロジでは可能ですが、適切なプライバシ、バイアス、倫理的な問題も考慮する必要があります。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:29:25 GMT)
PlotMap: Automated Layout Design for Building Game Worlds [4.7] 本稿では,ゲームマップ上の具体的位置を,所定のストーリー(プロット施設)に言及された抽象的位置に自動的に割り当てるシステムを提案する。
意思決定エージェントは、プロット施設を地図と相互の関係を考慮して、物語の制約を最も満たす地図上の場所に移動させる。
本システムでは,画像の画素化,施設位置の実際の値化,自然言語で表現されたストーリー制約など,複数のモードからの入力について検討する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:57:09 GMT)
Focused State Recognition Using EEG with Eye Movement-Assisted Annotation [4.7] 脳波と眼球運動の特徴を学習するためのディープラーニングモデルは、脳活動の分類に有効である。
焦点を絞った状態は、タスクや思考に強い集中力を示し、焦点を絞らない状態は目の動きによって達成される。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:06:00 GMT)
SyntheT2C: Generating Synthetic Data for Fine-Tuning Large Language Models on the Text2Cypher Task [4.6] SyntheT2Cは2つの医療データベースに適用され、合成データセットMedT2Cの作成が完了する。
このデータセットは、Text2CypherタスクのバックボーンLDMのパフォーマンスを効果的に向上させる。
SyntheT2CとMedT2Cデータセットの両方が近くリリースされる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:43:49 GMT)
DCDILP: a distributed learning method for large-scale causal structure learning [4.6] 本稿では,分断・対数的枠組みによる因果発見への新たなアプローチを提案する。
マルコフ毛布上に定義されたより小さなサブプロブレムに分解することで、提案したDCDILP法は、これらのサブプロブレムの局所因果グラフを並列に探索する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:17:48 GMT)
MFF-EINV2: Multi-scale Feature Fusion across Spectral-Spatial-Temporal Domains for Sound Event Localization and Detection [4.2] イベント独立ネットワークV2(EINV2)は、音事象の局所化と検出において優れた性能を発揮している。
本稿では,マルチスケール・フィーチャー・フュージョン(MFF)モジュールという3段階のネットワーク構造を提案し,スペクトル領域,空間領域,時間領域にまたがるマルチスケール特徴を抽出する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:52:49 GMT)
Geodesic Distance Between Graphs: A Spectral Metric for Assessing the Stability of Graph Neural Networks [4.1] グラフニューラルネットワーク(GNN)の一般化と安定性を評価するためのグラフ測地距離(GGD)メトリクスを導入する。
提案したGGD測度は、2つのグラフ間の相違性を重要構造(スペクトル)特性の相違をカプセル化することにより効果的に定量化できることを示す。
提案したGGD測定値は,特に部分ノードの特徴のみが利用可能である場合,GNNの安定性評価の性能を著しく向上させる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:47:40 GMT)
Multilingual Large Language Models and Curse of Multilinguality [4.1] 大規模言語モデル(LLM)は自然言語処理(NLP)の研究者や実践者の間で広く普及している。
本稿では,多言語LLMの展望を概観し,その技術的側面について概観する。
基礎となるアーキテクチャ、客観的関数、事前トレーニングされたデータソース、トークン化メソッドを説明します。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:31:39 GMT)
Stable Neural Stochastic Differential Equations in Analyzing Irregular Time Series Data [3.7] 実世界の時系列データにおける不規則サンプリング間隔と欠落値は,従来の手法の課題である。
本稿では,Langevin-type SDE,Linear Noise SDE,Geometric SDEの3つの安定クラスを提案する。
本研究は,実世界の不規則時系列データを扱う上で,提案手法の有効性を示すものである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 23:32:54 GMT)
Reasoning or Simply Next Token Prediction? A Benchmark for Stress-Testing Large Language Models [3.7] 大規模言語モデル(LLM)の真の理解能力を測定するための新しいデータセットMMLU-SRを提案する。
我々は、キーワードをダミー語に置き換え、その定義に従って標準化されたテスト質問を修正した。
このような置換後のモデル性能は大幅に低下し,理解力の低下が示唆された。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:35:47 GMT)
GenHeld: Generating and Editing Handheld Objects [3.6] 我々は3次元ハンドモデルや2次元画像に条件付き保持オブジェクトを合成する逆問題にGenHeldを提案する。
GenHeld 3Dは、オブジェクトコードと呼ばれるコンパクトなオブジェクト表現を使用して、大きなデータセットから可塑性保持オブジェクトを選択することができる。
GenHeld 2Dは、GenHeld 3Dの能力と拡散ベースの画像編集を組み合わせることで動作する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 03:10:59 GMT)
The Devil is in the Details: StyleFeatureEditor for Detail-Rich StyleGAN Inversion and High Quality Image Editing [3.6] 本稿では,w-latentとF-latentの両方で編集できる新しい方法であるStyleFeatureEditorを紹介する。
また、Fレイテンシーを正確に編集するためのモデルをトレーニングするために特別に設計された新しいトレーニングパイプラインも提示する。
提案手法は最先端の符号化手法と比較し, モデルが復元品質の点で優れていることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:28:32 GMT)
MindEye2: Shared-Subject Models Enable fMRI-To-Image With 1 Hour of Data [3.5] この研究は、1時間分のfMRIトレーニングデータを使用して高品質な再構成を行う。
MindEye2は、MRI施設への単一の訪問から、いかに正確に知覚の再構築が可能かを実証する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 23:07:17 GMT)
Public Computer Vision Datasets for Precision Livestock Farming: A Systematic Survey [3.4] 本研究は,家畜のCVデータセットの公開に関する最初の体系的な調査である。
58の公開データセットのうち、ほぼ半分は牛用で、続いて豚、鶏、その他の動物が続く。
個人の動物検出とカラーイメージングは、家畜にとって主要な応用であり、画像のモダリティである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:22:41 GMT)
DataStates-LLM: Lazy Asynchronous Checkpointing for Large Language Models [3.3] モデルと状態シャードを構成するテンソルが、長期間にわたって不変であるという事実を生かして、遅延非同期マルチレベルアプローチを導入する。
その結果、48$times$より高速なチェックポイントと2.2$times$より高速なエンドツーエンドトレーニングを実現した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:30:40 GMT)
RMF: A Risk Measurement Framework for Machine Learning Models [3.0] 機械学習(ML)をコンポーネントとして使用するシステムのセキュリティを測定することは重要である。
本稿では、MLの分野、特に自動運転車のセキュリティに焦点を当てる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:22:47 GMT)
Applications of Computer Vision in Autonomous Vehicles: Methods, Challenges and Future Directions [2.7] 本稿では,過去10年間に出版されたコンピュータビジョンと自動運転に関する論文をレビューする。
特に、まず自律運転システムの開発について検討し、各国の主要自動車メーカーによって開発されたこれらのシステムを要約する。
そこで, 深度推定, 物体検出, 車線検出, 信号認識など, 自律運転におけるコンピュータビジョン応用の概要を概観する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:40:40 GMT)
Emergent Equivariance in Deep Ensembles [2.7] 深層アンサンブルは、データ拡張を用いることで、全ての入力とあらゆる訓練時間に等しくなることを示す。
これは、個々のアンサンブルメンバーの予測が同変ではなく、集合的予測であるという意味で創発的である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:25:19 GMT)
Justice in Healthcare Artificial Intelligence in Africa [2.5] 正義は、社会的不平等の増幅に影響を及ぼすAIにおける主要な関心事である。
アフリカがAIの恩恵を効果的に受けられるためには、これらの原則は現地の文脈と一致すべきである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:47:03 GMT)
Approximation of relation functions and attention mechanisms [2.5] ニューラルネットワーク特徴写像の内部積は、入力間の関係をモデル化する方法として現れる。
本研究では,ニューラルネットワークの内部積の近似特性について検討する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:03:56 GMT)
Beyond the Visible: Jointly Attending to Spectral and Spatial Dimensions with HSI-Diffusion for the FINCH Spacecraft [2.5] FINCHミッションは、農地の作物の残留物を監視することを目的としている。
ハイパースペクトルイメージングは、スペクトル情報と空間情報の両方をキャプチャする。
ランダムノイズ、ストライプノイズ、デッドピクセルなど、様々な種類のノイズが生じる傾向がある。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:34:18 GMT)
Large Language Model Enhanced Clustering for News Event Detection [2.4] 本稿では,大規模言語モデル(LLM)とクラスタリング解析を組み合わせたイベント検出フレームワークを提案する。
このフレームワークは、事前検出タスクと後検出タスクの両方を通じてイベントクラスタリングを強化する。
本稿では,クラスタリング結果の有効性とロバスト性を評価するための新しいクラスタ安定性評価指標(CSAI)を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:13:47 GMT)
Group-theoretic error mitigation enabled by classical shadows and symmetries [2.4] オブザーバブルの大規模なコレクションを学習するために必要なサンプルの数が限られており、量子エラー訂正のないデバイスにエラーが蓄積されている。
我々は、対称性調整された古典的影」と呼ばれる量子誤差緩和戦略を開発する。
この結果から, 対称性を調整した古典影は, 対称性の存在下でのノイズ量子実験による誤差を軽減するために, 低コストな戦略であることが明らかとなった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:28:25 GMT)
Eye in the Sky: Detection and Compliance Monitoring of Brick Kilns using Satellite Imagery [2.0] 密集したインド・ガンガティック平野では、レンガ製造が大気汚染の8%-14%を占めている。
従来の研究では、衛星画像からのレンガキルン検出にコンピュータビジョンに基づく機械学習手法が用いられてきた。
ブロックキルン検出と自動コンプライアンス監視のためのスケーラブルなフレームワークを導入する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:32:00 GMT)
Stacking for Probabilistic Short-term Load Forecasting [1.6] メタラーニングのグローバル版とローカル版の両方を導入する。
ローカル学習モードでは、メタモデルはクエリパターンに最もよく似たパターンを使って訓練される。
以上の結果から, コンペティターに比べて, 量的回帰林が優越していることが示唆された。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:05:49 GMT)
m-QMDS codes over mixed alphabets via orthogonal arrays [1.6] 混合アルファベットを用いた$m$-QMDS符号の一般的な構成法を提案する。
符号は、アルファベットのサイズ、長さ、エンコーディング状態の寸法など、パラメータの選択に柔軟性がある。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:23:17 GMT)
The data augmentation algorithm [1.6] データ拡張(DA)アルゴリズムはマルコフ連鎖モンテカルロ(MCMC)アルゴリズムであり、難解な確率分布からサンプリングするために使われる。
本稿では,DA MCMCアルゴリズムの理論的基礎,方法論的実装,多種多様な応用について概説する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:51:08 GMT)
Gain assistant control of photonic spin Hall effect [1.5] フォトニックスピンホール効果(SHE)では、逆スピンの入射光子を横方向に空間的に分離する。
反射型プローブ光におけるSHEを制御するためのゲインアシストモデルを提案する。
ゲインアシストに基づくフォトニックSHEの測定は、光センシングのようなスピン関連の応用を可能にする可能性がある。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:50:57 GMT)
Approximate Quantum Compiling for Quantum Simulation: A Tensor Network based approach [1.2] 行列生成状態(MPS)から短深さ量子回路を生成する新しいアルゴリズムであるAQCtensorを導入する。
我々のアプローチは、量子多体ハミルトニアンの時間進化から生じる量子状態の準備に特化している。
100量子ビットのシミュレーション問題に対して、AQCtensorは、結果の最適化回路の深さの少なくとも1桁の縮小を実現していることを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:04:57 GMT)
Cutting through the noise to motivate people: A comprehensive analysis of COVID-19 social media posts de/motivating vaccination [1.2] 新型コロナウイルス(COVID-19)のパンデミックは、医療情報システムの重大な弱点を露呈した。
ソーシャルメディア上の誤報が圧倒的に多いことは、人々に適切な予防措置をとらせ、予防接種を受けるよう動機付けるという課題を生み出した。
本研究では,ソーシャルメディアにおける科学的コミュニケーションと公衆のモチベーションについて論じる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:36:11 GMT)
Large Language Models Playing Mixed Strategy Nash Equilibrium Games [1.1] 本稿では,混合戦略のナッシュ均衡と純粋戦略のナッシュ均衡が存在しないゲームにおいて,ナッシュ均衡を求めるための大規模言語モデルの能力に焦点を当てる。
この研究は、コード実行の可能性を備えたLLMの性能が大幅に向上していることを明らかにする。
LLMは、よく知られた標準ゲームにおいて顕著な熟練度を示すが、その性能は、同じゲームのわずかな変更に直面した時に低下する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:30:20 GMT)
Explain the Black Box for the Sake of Science: Revisiting the Scientific Method in the Era of Generative Artificial Intelligence [0.9] 科学的手法は自然科学と応用科学の全ての分野における人間の進歩の基盤である。
我々は、人工知能の出現以前には、科学的発見のための人間の複雑な推論が重要な存在であると主張している。
決定に使用するデータAIシステムを知ることは、ドメインの専門家や科学者との接触点になる可能性がある。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:34:42 GMT)
Emotional Theory of Mind: Bridging Fast Visual Processing with Slow Linguistic Reasoning [0.7] 本研究では,感情認知に関連する「物語キャプション」を構築することで,感情的推論機能を組み込む手法を提案する。
ゼロショット分類器 (CLIP) と微調整型視覚言語モデル (LLaVA) を用いて, 人間の生成した記述子上でのキャプションを構築する2つの方法を提案する。
実験の結果,「最強」の物語記述子と言語モデルの「スロー」推論を組み合わせることは,心の感情理論を実現するための有望な方法であることがわかった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:47:22 GMT)
A tutorial on fairness in machine learning in healthcare [0.6] このチュートリアルは、機械学習における公平性の共通概念に医療情報コミュニティを導入するために設計されている。
本稿では、医療におけるモデルが不公平である理由の概説を含む、MLにおける公平性を定義するための基本的な概念と方法について述べる。
我々は、総合的なグループフェアネス評価のためのユーザフレンドリーなRパッケージを提供し、研究者や臨床医が自身のMLワークにおけるフェアネスを評価することを可能にする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:44:20 GMT)
Validating an Instrument for Teachers' Acceptance of Artificial Intelligence in Education [0.6] 教師によるAI(TAAI)の受容を計測する既存の機器は、信頼性と妥当性の低い証拠を報告した。
本研究は,高心理測定品質を示す十分な証拠を持つTAAI機器を開発し,評価することを目的とした。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:01:16 GMT)
Symmetry-driven embedding of networks in hyperbolic space [0.5] 双曲モデルでは、経験的ネットワークの重み付き次数分布、高いクラスタリング、階層構造を再現することができる。
しかし、ネットワークの双曲座標を見つけるための現在のアルゴリズムは、推論された座標の不確かさを定量化しない。
BIGUEはマルコフ連鎖モンテカルロアルゴリズムであり、ベイズ的双曲乱数グラフモデルの後部分布をサンプリングする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:44:02 GMT)
Entanglement Rényi Negativity of Interacting Fermions from Quantum Monte Carlo Simulations [0.4] 相互作用するフェルミオン系における負性率を用いた混合状態量子絡み合いについて検討する。
半充填ハバードモデルとスピンレス$t$-$V$モデルのランク2のR'enyi負性性を計算する。
我々の研究は絡み合いの計算に寄与し、様々なフェルミオン多体混合状態における量子絡み合いの将来の研究の舞台となる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:07:09 GMT)
DIEKAE: Difference Injection for Efficient Knowledge Augmentation and Editing of Large Language Models [0.4] 効率的な知識向上・編集のための差分注入法(DIEKAE)について紹介する。
PLMによるバックプロパゲーションを必要としないエンコーダのための新しいトレーニング手法を提案する。
本研究は,学習と推論の双方において,知識向上と編集の複数のベースラインと比較して,我々の手法がより速く,より効率的であることを示すものである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:57:39 GMT)
Nuclear scattering via quantum computing [0.3] 未結合チャネルにおける2つの有界核の弾性散乱位相シフトを解くためのハイブリッド量子古典的枠組みを提案する。
量子コンピューティングの利点を利用して、多くの核子ハミルトニアン固有値問題の集合からこれらの固有エネルギーを解く。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:12:50 GMT)
Transformative Influence of LLM and AI Tools in Student Social Media Engagement: Analyzing Personalization, Communication Efficiency, and Collaborative Learning [0.2] AIによるアプリケーションは、学生がソーシャルメディアと対話する方法を変えつつある。
AIによって強化されたソーシャルメディアプラットフォームに関わる学生は、高等教育のパフォーマンスを報告します。
AIアルゴリズムは、共有された学術的関心とキャリア目標に基づいて、学生を効果的にマッチングする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:05:56 GMT)
Fast Unsupervised Tensor Restoration via Low-rank Deconvolution [0.1] 低ランクデコンボリューション(LRD)は、重要な効率性と柔軟性を持つ新しい多次元表現モデルとして現れている。
我々は、この分析モデルがDeep Image Prior(DIP)やBlind-Spot Networks(BSN)といったディープラーニング(DL)フレームワークと競合できるかどうかを自問する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:04:49 GMT)
A Lightweight Generative Model for Interpretable Subject-level Prediction [0.1] 本稿では,本質的に解釈可能な単一対象予測手法を提案する。
実験により、結果のモデルを効率よく逆転させ、正確な主観レベルの予測を行うことが示されている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:11:14 GMT)
Synthetic Data Generation Framework, Dataset, and Efficient Deep Model for Pedestrian Intention Prediction [0.1] エゴ車の前で歩行者が横断するかどうかを知ることは、自動運転にとって不可欠だ。
これに対する要因は、さまざまなクロスクロスノンクロス(C/NC)シナリオを持つデータセットの欠如である。
Ped/NCビデオクリップのサンプルからなる合成データセットを生成するARCRUフレームワークを導入することで、この問題に対処する。
また,高速かつメモリフットプリントの少ないPedGNNというディープモデルを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:44:22 GMT)
What's in an embedding? Would a rose by any embedding smell as sweet? [0.0] 大規模言語モデル(LLM)は、真の「理解」と知識を「理解」する能力に欠けるとしてしばしば批判される。
我々は, LLM が「幾何学的」な経験的「下地」を発達させ, NLP の様々な応用に適していると考えられることを示唆する。
これらの制限を克服するために、LLMはシンボリックAI要素を含む知識の「代数的」表現と統合されるべきである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:35:33 GMT)
Two-time second-order correlation function [0.0] 微分方程式,コヒーレント状態プロパゲータ,準統計分布関数などによる2次相関関数の導出について述べる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:59:39 GMT)
Trading Devil: Robust backdoor attack via Stochastic investment models and Bayesian approach [0.0] 本研究は、投資ベースのバックドアアタック(MarketBack)として知られる特定のタイプの攻撃について検討する。
MarketBackは、敵が音声のスタイリスティックな特性を、ばかげた音声認識システムに戦略的に操作するシステムである。
機械学習モデルのセキュリティと整合性は、バックドア攻撃によって深刻に脅かされている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:12:00 GMT)
Topological Quantum Teleportation and Superdense Coding -- Without Braiding [0.0] タンバラ・山上圏から派生した任意の理論の族に対するテレポーテーションと超高密度符号化プロトコルについて述べる。
正弦波計算に対する通常のアプローチとは対照的に、我々は正弦波をブレイドできるという要求を緩和する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 01:33:44 GMT)
Statistical arbitrage in multi-pair trading strategy based on graph clustering algorithms in US equities market [0.0] 本研究は,グラフクラスタリングアルゴリズムに基づく統計仲裁の新しい枠組みに基づく効果的な戦略の開発を目指す。
この研究は、最適な信号検出とリスク管理のための統合的なアプローチを提供することを目指している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:25:32 GMT)
Speech Emotion Recognition Using CNN and Its Use Case in Digital Healthcare [0.0] 人間の感情と感情状態を音声から識別するプロセスは、音声感情認識(SER)として知られている。
私の研究は、畳み込みニューラルネットワーク(CNN)を使って、音声録音と感情を区別し、異なる感情の範囲に応じてラベル付けすることを目指しています。
私は、機械学習手法を用いて、供給された音声ファイルから感情を識別する機械学習モデルを開発した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:33:03 GMT)
SISMIK for brain MRI: Deep-learning-based motion estimation and model-based motion correction in k-space [0.0] 本研究では,脳の2次元スピンエコースキャンにおける動き推定と補正の振り返り手法を提案する。
この手法は、深いニューラルネットワークのパワーを利用してk空間の運動パラメータを推定する。
モデルに基づくアプローチを用いて、劣化した画像を復元し、「幻覚」を避ける。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 21:09:40 GMT)
Robust Image Classification in the Presence of Out-of-Distribution and Adversarial Samples Using Attractors in Neural Networks [0.0] 完全に接続されたニューラルネットワークは、トレーニングサンプルをアトラクタとして使用するように訓練されており、堅牢性を高めている。
その結果,敵の例を分類してもネットワークは性能を維持していることがわかった。
激しい敵対攻撃が存在する場合、これらの対策は98.48%と98.88%にわずかに減少し、提案手法の堅牢性を示している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:38:41 GMT)
Reducing Selection Bias in Large Language Models [0.0] 大規模言語モデル(LLM)は意味的タスクの解釈と実行に不可欠である。
本研究は、これらのバイアスを批判的に検討し、代表リスト選択タスクへの影響を定量化する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:23:21 GMT)
Reactor Mk.1 performances: MMLU, HumanEval and BBH test results [0.0] Reactor Mk.1はGPT-4o、Claude Opus、Llama 3といったモデルよりも優れており、MMLUデータセットで92%、HumanEvalデータセットで91%、BBHデータセットで88%のスコアを得た。
困難な仕事の管理と推論の両方に優れており、現在の最先端のAI技術において、目立ったAIソリューションとして確立されている。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:52:32 GMT)
Re-Envisioning Numerical Information Field Theory (NIFTy.re): A Library for Gaussian Processes and Variational Inference [0.0] 我々は、NIFTyの書き直しを行い、NIFTy.reという、モデリングの原則を再検討し、推論戦略を拡張し、JAXへの重み付けの多くをアウトソースする。
このリライトはNIFTyで書かれたモデルを劇的に加速し、新しいタイプの推論マシンの基礎を築き、保守性を改善し、NIFTyとJAX機械学習エコシステムの相互運用性を可能にする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:50:17 GMT)
Quantum spin ice in three-dimensional Rydberg atom arrays [0.0] 量子スピン液体(Quantum spin liquids)は、低エネルギー物理学を創発ゲージ理論の分解相として記述した物質のエキゾチック相である。
本稿では,Rydbergをベースとした量子シミュレータを用いて,3次元の量子スピン液体(U(1)$)を実現する方法を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:19:45 GMT)
Order-theoretic models for decision-making: Learning, optimization, complexity and computation [0.0] インテリジェントシステムの研究は、経済合理性の観点から行動を説明する。
この論文の第一の目的は、インテリジェントシステムの研究におけるこれらの結果の適用性を明らかにすることである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 20:20:43 GMT)
On-chip microwave coherent source with in-situ control of the photon number distribution [0.0] 本研究では,チップ上で直接光子注入が可能な新しい設計を提案し,理論的に検討する。
提案手法の主な特徴は、ソースとターゲットキャビティ間の通常の容量リンクを調整可能なカプラで置き換えることである。
本研究では,外部フラックススレッディングにより生成したコヒーレント状態の動的制御を検証する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 11:09:24 GMT)
Observation of anisotropy-independent magnetization dynamics in spatially disordered Heisenberg spin systems [0.0] 本研究では, ハイゼンベルク XX-, XXZ- およびイジング・ハミルトンの磁化緩和力学におけるロバストな特徴を実験的に観察した。
小系の数値シミュレーションにおいて、これらのスピン対が運動の近似局所積分を構成することを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 19:22:30 GMT)
Nonstandard derivation of the Gorini-Kossakowski-Sudarshan-Lindblad master equation of a quantum dynamical semigroup from the Kraus representation [0.0] 我々は、量子力学半群 $exp(tL)$ の生成元 $L$ が、ゴリーニ=コッサ=スダルシャン=リンドブラッド生成子(GKSL)と呼ばれる特定の形式を持つという定理の新たな非標準証明を与える(リンドブラディアンとも呼ばれる)。
また、閉完全正の写像が閉クラウス作用素を持つという関連する事実の非標準的証明を与える。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 10:32:03 GMT)
Model Evaluation and Anomaly Detection in Temporal Complex Networks using Deep Learning Methods [0.0] 本稿では,時間的ネットワークモデルの結果評価の問題に対処するために,ディープラーニングに基づく自動アプローチを提案する。
評価法に加えて,提案手法は進化するネットワークにおける異常検出にも利用できる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:19:09 GMT)
Memory Faults in Activation-sparse Quantized Deep Neural Networks: Analysis and Mitigation using Sharpness-aware Training [0.0] メモリ障害がアクティベーションスパース量子化DNN(AS QDNN)に与える影響について検討する。
As QDNNは標準QDNNよりも11.13%低い精度を示す。
我々は、メモリ障害の影響を軽減するために、シャープネス対応量子化(SAQ)トレーニングを採用する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:40:48 GMT)
Mehta's eigenvectors for the finite Hartely transform [0.0] 本稿では,有限ハートレー変換の解析的固有関数を評価するための新しい手法を提案する。
このアプローチは、基本的なツールとして$N=1/2$-supersymmetric quantum mechanicsを使用する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 05:09:36 GMT)
Long-Range Entangled Quantum Noise Radar Over Order of Kilometer [0.0] 本稿では,量子2モード圧縮(QTMS)レーダーの最大検出範囲の明示的表現を導出した。
本稿では,QTMSレーダを閾値信号対雑音比の低減した従来のレーダとみなすことができることを示す。
都市部での小型無人航空機の認識に適した最大検出範囲が最大2kmのQTMSレーダを実装することが可能である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:13:42 GMT)
Learning Temporal Logic Predicates from Data with Statistical Guarantees [0.0] 有限サンプル精度保証データから時間論理の述語を学習する新しい手法を提案する。
提案手法は,表現最適化と共形予測を利用して,将来の軌跡を正しく記述した述語を学習する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 00:07:36 GMT)
Large Reasoning Models for 3D Floorplanning in EDA: Learning from Imperfections [0.0] 我々は,大推論モデル(LRM)として知られる,自己回帰型意思決定モデルの新たなクラスを導入する。
LRMは電子設計自動化(EDA)における3次元フロアプランニングを改善するように設計されている
我々はその性能を現在の最先端手法と比較して評価し、顕著な改善点を浮き彫りにした。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:41:16 GMT)
Landau-Lifshitz damping from Lindbladian dissipation in quantum magnets [0.0] LL力学はリンドブラディアン力学から体系的に導出できることが示されている。
鍵となる側面は、リンドブラディアン緩和は各時点においてハミルトニアン$H(t)$に適応しなければならないことである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:26:17 GMT)
Integration of Programmable Diffraction with Digital Neural Networks [0.0] 近年のディープラーニングとデジタルニューラルネットワークの進歩は、バックエンドとして機能するデジタルニューラルネットワークと共同最適化された微分プロセッサの確立に繋がった。
この記事では、さまざまなアプリケーションに対して、エンジニアリングとプログラムされた回折とデジタルニューラルネットワークのこのエキサイティングなコラボレーションの有用性を強調します。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 16:49:53 GMT)
Implicit Neural Representation for Videos Based on Residual Connection [0.0] 画像再構成に有効な残差接続として低解像度フレームを用いる手法を提案する。
実験の結果,本手法はPSNRの既存手法であるHNeRVを49本中46本で上回っていることがわかった。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 10:10:48 GMT)
Hyperbolic sentence representations for solving Textual Entailment [0.0] 我々は、テキスト・エンタテインメントの解決にハイパーボリック・スペースをどのように使えるかを証明するために、ポインケア・ボールを使って文を埋め込む。
LSTMs, Order Embeddings, Euclidean Averagingなど,様々な背景のベースラインに対して評価を行った。
SICKデータセットのベースラインを一貫して上回り、SNLIデータセットのOrder Embeddingsに次いで第2位です。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:39:43 GMT)
How can scientists establish an observer-independent science? [0.0] 具体的認知の理論のためにエビデンスが成長している。
特に、実験を行う実施科学者は、別の科学者の視点から説明する必要があると推測する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:10:51 GMT)
Grad-Instructor: Universal Backpropagation with Explainable Evaluation Neural Networks for Meta-learning and AutoML [0.0] 評価ニューラルネットワーク(ENN)は、ターゲットネットワークの性能を予測するために、深層強化学習を通じて訓練される。
ENNは、バックプロパゲーション中に追加評価機能として機能する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 08:37:51 GMT)
Entanglement classification and \emph{non-k}-separability certification via Greenberger-Horne-Zeilinger-class fidelity [0.0] 多体量子系は、エンプク分離性と絡み合い深さの概念を用いて特徴づけることができる。
量子状態がemphk-分離可能であるのは、emphk 絡み合ったサブシステムの混合として表現できる場合である。
提案手法は,3量子系を既知のローカル操作と古典的通信クラスに分類することに成功している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:00:18 GMT)
Digital Quantum Simulation of Reaction-Diffusion Systems on Lattice [0.0] ディジタル量子コンピュータ上での反応拡散系の量子シミュレーションについて検討する。
我々は、確率分布を直接シミュレートするために、トロタライズと確率的想像時間進化(PITE)を用いる。
このアプローチは,単純な単一格子サイト生成消滅プロセスから,能動吸収相転移を特徴とするシステムまで,4つの多種多様な例を通して説明する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 14:22:05 GMT)
Crossing The Gap Using Variational Quantum Eigensolver: A Comparative Study [0.0] 分子の励起状態を調べるために、変量量子固有溶媒 (VQE) が開発された。
本稿では,変分量子デフレレーション(VQD)法とサブスペース探索変分量子固有解法(SSVQE)法の比較を行った。
本稿では、Folded Spectrum VQE (FS-VQE) とVQDまたはSSVQEを組み合わせ、高励起状態の探索を可能にする新しいアプローチを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:07:41 GMT)
Correlations enable lossless ergotropy transport [0.0] 「電池を駆動する装置」は「電池に蓄えられた作業がデバイスに運ばれている」と読むことができる。
量子電池では、蓄えられた作業の総量はエルゴトロピーによって測定でき、これはユニタリ演算によって抽出できる最大作業である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:14:20 GMT)
Complete Positivity and Thermal Relaxation in Quadratic Quantum Master Equations [0.0] 量子マスター方程式は一般化されたブラウン運動の正準量子化によって得られると仮定する。
力学は、ハミルトニアン系の選択にかかわらず、熱緩和過程を記述する。
量子マスター方程式のCPTP基準を確立する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 02:56:28 GMT)
Calibrating Neural Networks' parameters through Optimal Contraction in a Prediction Problem [0.0] 論文では、リカレントニューラルネットワーク(RNN)を、パラメータが線形な領域の収縮に変換する方法について詳述する。
次に、損失関数の特定の正規化項を持つRNNによってモデル化された予測問題は、その一階条件を解析的に表現できることを示した。
特定の条件が満たされた場合、最適なパラメータが存在し、任意の所望の精度に簡単なアルゴリズムで見つけることができる。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 18:08:04 GMT)
Bridging the Gap in Drug Safety Data Analysis: Large Language Models for SQL Query Generation [0.0] 伝統的に、安全データにアクセスするにはデータベースの専門知識が必要であり、より広範な使用を制限する。
本稿では,非技術的ユーザを対象としたデータベースアクセスの民主化に,LLM(Large Language Models)の新たな応用を提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:07:31 GMT)
Bayesian Inference for Consistent Predictions in Overparameterized Nonlinear Regression [0.0] 本研究では,ベイズフレームワークにおける過パラメータ化非線形回帰の予測特性について検討した。
リプシッツ連続活性化関数を持つ一般化線形および単一ニューロンモデルに対して後部収縮が成立する。
提案手法は数値シミュレーションと実データアプリケーションを用いて検証した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 06:58:56 GMT)
Automating the Identification of High-Value Datasets in Open Government Data Portals [0.0] 高価値データセット(HVD)は、より広いOpen Government Data(OGD)ムーブメントにおいて重要な役割を果たす。
OGDポータル上でのHVDの識別は、データ値の微妙な性質のため、リソース集約的で複雑な課題である。
本提案では,ユーザ関心の詳細な分析に基づく定量的アプローチを用いて,OGDポータル上でのHVDの識別を自動化することを目的とする。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 07:54:37 GMT)
Applications of Generative AI in Healthcare: algorithmic, ethical, legal and societal considerations [0.0] 生成AIは、医療画像とテキスト分析を急速に変換している。
本稿では,正確性,インフォームドコンセント,データプライバシ,アルゴリズム制限の問題について検討する。
我々は、医療における生成AIの倫理的かつ責任ある実装のロードマップを策定することを目指している。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 13:28:07 GMT)
Analyzing constrained LLM through PDFA-learning [0.0] 我々は,言語モデルの出力がテキスト生成中に何らかの方法で制約されたときに発生する,ヌル次シンボル確率に対処する合同を定義する。
本研究では,このコングルーエンスを効率的に学習するアルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 04:00:54 GMT)
An iterated learning model of language change that mixes supervised and unsupervised learning [0.0] 反復学習モデルは、教師から生徒に言語が伝達される言語変化のエージェントベースモデルである。
従来のモデルは、人工ニューラルネットワークデコーダを使用して、信号から意味へのエージェントのマッピングを実装していた。
ここでは、デコーダとエンコーダの両方がニューラルネットワークであり、教師なし学習を通じて個別に訓練され、教師なし学習によってオートエンコーダの形で訓練される新しいモデルを示す。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 15:25:01 GMT)
An investigation into the scientific landscape of the conversational and generative artificial intelligence, and human-chatbot interaction in education and research [0.0] 本研究では,CGAIと人間-チャットボットのインタラクション/コラボレーションの科学的景観について検討する。
CGAIの教育・学習・研究活動における顕著な利用例は、コンピュータ科学、医療・医療・工学・ビジネス分野で発生した。
教育・学習・実践におけるCGAIの潜在的な課題に対処するための戦略と政策の定式化が最優先事項である。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 12:37:29 GMT)
Activation of post-quantumness in bipartite generalised EPR scenarios [0.0] 一般化されたアインシュタイン・ポドルスキー・ローゼンのシナリオで生成された相関関係は、量子後挙動を示す可能性のある非シグナリングなバイパルタイト資源の例である。
量子後資源であるにもかかわらず、バイパーティイトベル型シナリオにおいて量子相関しか生成できないアセンブリが存在する。
本稿では、Bob-with-input, Measurement-device-independent, channel EPRシナリオにおける後量子性の活性化のためのプロトコルを提案する。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 17:33:23 GMT)
Activation of post-quantum steering [0.0] ベルシナリオにおいて、量子後相関として確認できるように、量子後ステアリングを活性化する方法を示す。
独立した関心を持つかもしれない我々の研究の1つの要素は、ネットワーク内の二部量子集合を自己テストする方法を示すことである。
論文参考訳(メタデータ) (Sat, 15 Jun 2024 09:17:12 GMT)