Unsupervised Open-Vocabulary Object Localization in Videos [118.3] 近年,映像表現学習と事前学習型視覚言語モデルの進歩により,自己教師付き映像オブジェクトのローカライゼーションが大幅に向上したことを示す。
そこで本稿では,まず,スロットアテンションを考慮したオブジェクト中心アプローチを用いてビデオ内のオブジェクトをローカライズし,得られたスロットにテキストを割り当てる手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:26:08 GMT)
VDG: Vision-Only Dynamic Gaussian for Driving Simulation [112.6] ポーズフリーな動的ガウス法(VDG)に自己教師付きVOを導入する。
VDGはRGB画像入力のみで動作可能で、ポーズフリーのダイナミックビュー合成法に比べて高速で広いシーンで動的シーンを構築することができる。
その結果,現状の動的ビュー合成法よりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:29:21 GMT)
UIO-LLMs: Unbiased Incremental Optimization for Long-Context LLMs [111.1] UIO-LLMsは、長いコンテキスト設定下でのメモリ拡張トランスフォーマーの漸進的な最適化手法である。
本稿では,TBPTTアルゴリズムを用いて学習過程を改良する。
UIO-LLMは、Llama2-7b-chatのコンテキストウィンドウを4Kから100Kトークンに、2%の追加パラメータで拡張するなど、長いコンテキストを扱うことに成功した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:44:36 GMT)
Iterated Denoising Energy Matching for Sampling from Boltzmann Densities [109.2] 反復Denoising Energy Matching (iDEM)
iDEMは,拡散型サンプリング装置から高モデル密度のサンプリング領域を (I) 交換し, (II) それらのサンプルをマッチング目的に使用した。
提案手法は,全測定値の最先端性能を達成し,2~5倍の速さでトレーニングを行う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:14:13 GMT)
LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks [106.1] 人間の判断の代わりにLCMによる判断でNLPモデルを評価する傾向が高まっている。
人間のデータとの比較がないと、これらの評価の有効性が懸念される。
JUDGE-BENCHは、人間のアノテーションを持つ20個のNLPデータセットの集合である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:56:13 GMT)
Evaluating Copyright Takedown Methods for Language Models [100.4] 言語モデル(LM)は、潜在的に著作権のある資料を含む様々なデータに対する広範な訓練からその能力を引き出す。
本稿では,LMの著作権削除の可能性と副作用を初めて評価する。
システムプロンプトの追加、デコード時間フィルタリングの介入、未学習アプローチなど、いくつかの戦略を検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:09:46 GMT)
The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources [100.2] ファンデーションモデル開発は、急速に成長するコントリビュータ、科学者、アプリケーションを引き付けている。
責任ある開発プラクティスを形成するために、我々はFoundation Model Development Cheatsheetを紹介します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:19:01 GMT)
APIGen: Automated Pipeline for Generating Verifiable and Diverse Function-Calling Datasets [99.9] APIGenは、関数呼び出しアプリケーションのための検証可能な高品質データセットを合成するために設計された、自動データ生成パイプラインである。
APIGenを活用して、21のカテゴリにわたる3,673の実行可能なAPIを収集し、多様な関数呼び出しデータセットを生成します。
機能呼び出しエージェントドメインの分野を推し進めるため、6万の高品質なエントリを含むデータセットをリリースする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:49:11 GMT)
GaussianDreamerPro: Text to Manipulable 3D Gaussians with Highly Enhanced Quality [99.6] 3D-GSは現実世界のシーンの再構築とレンダリングで大きな成功を収めた。
高いレンダリング品質を生成タスクに転送するために、テキストから3Dガウス資産を生成するための一連の研究が進められている。
生成品質を向上させるため,GaussianDreamerProという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:12:09 GMT)
DICE: End-to-end Deformation Capture of Hand-Face Interactions from a Single Image [98.3] DICEは1枚の画像から変形認識による手と顔のインタラクションを再現する最初のエンドツーエンド手法である。
ローカルな変形場とグローバルなメッシュ位置の回帰を2つのネットワークブランチに切り離すことが特徴である。
標準的なベンチマークと、精度と物理的妥当性の点から見れば、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:08:29 GMT)
CHIRON: Rich Character Representations in Long-Form Narratives [98.3] 文字のテキスト情報を整理・フィルタリングする新しい文字シートの表現であるCHIRONを提案する。
実験の結果,CHIRONは類似の要約に基づくベースラインよりも優れ,柔軟であることが判明した。
CHIRONから派生したメトリクスは、ストーリーのキャラクター中心性を自動的に推測するために使用することができ、これらのメトリクスは人間の判断と一致している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:22:18 GMT)
SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models [97.4] MLLM(Multimodality Large Language Model)シリーズを開発した。
我々は、言語、ビジョン、視覚言語タスクで利用可能なリソースを網羅した包括的なデータセットを組み立てる。
パラメータサイズや多言語能力の異なるMLLMのスペクトルを得る。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:59:03 GMT)
CritiqueLLM: Towards an Informative Critique Generation Model for Evaluation of Large Language Model Generation [87.4] Eval-Instructは、疑似参照でポイントワイズした批評を取得し、マルチパスプロンプトを通じてこれらの批評を修正できる。
CritiqueLLMは、ChatGPTとすべてのオープンソースベースラインを上回るように実証的に示されています。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:44:11 GMT)
XLD: A Cross-Lane Dataset for Benchmarking Novel Driving View Synthesis [84.2] 本稿では,自律走行シミュレーションに特化して設計された新しい駆動ビュー合成データセットとベンチマークを提案する。
データセットには、トレーニング軌跡から1-4mずれて取得した画像のテストが含まれているため、ユニークなものだ。
我々は、フロントオンリーおよびマルチカメラ設定下で、既存のNVSアプローチを評価するための最初の現実的なベンチマークを確立する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:00:21 GMT)
I2V-Adapter: A General Image-to-Video Adapter for Diffusion Models [80.3] テキスト誘導画像合成(I2V)は、入力画像の同一性を保持するコヒーレントなビデオを生成することを目的としている。
I2V-Adapterは、クロスフレームアテンション機構を介して、未通知の入力画像を後続のノイズフレームに適応的に伝搬する。
実験の結果,I2V-Adapterは高品質な動画を制作できることがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:00:02 GMT)
Emergent World Representations: Exploring a Sequence Model Trained on a Synthetic Task [75.4] 言語モデルは驚くべき範囲の能力を示しているが、その明らかな能力の源泉は不明である。
これらのネットワークは単に表面統計の集合を記憶しているだけなのか、あるいは、彼らが見るシーケンスを生成するプロセスの内部表現に依存しているのだろうか?
簡単なボードゲームOthelloにおける法的な動きを予測するタスクに,GPTモデルの変種を適用して検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:27:49 GMT)
Compact Speech Translation Models via Discrete Speech Units Pretraining [75.3] 本手法は,SSSモデルから抽出した離散音声単位(DSU)に基づく。
本手法では, コンパクト化に加えて, 低リソース設定にも適用できるため, 文字起こしは不要である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:50:28 GMT)
"Glue pizza and eat rocks" -- Exploiting Vulnerabilities in Retrieval-Augmented Generative Models [74.1] Retrieval-Augmented Generative (RAG)モデルにより大規模言語モデル(LLM)が強化される
本稿では,これらの知識基盤の開放性を敵が活用できるセキュリティ上の脅威を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:36:23 GMT)
RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation [73.2] 付加的な構造仮定を伴わずにLMDPのサンプル効率アルゴリズムを初めて導入する。
楽観的な探索アルゴリズムのほぼ最適保証を導出するためにどのように使用できるかを示す。
これらの結果は、LMDP以外の幅広い対話型学習問題、特に部分的に観察された環境において有用である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:42:57 GMT)
Scaling and renormalization in high-dimensional regression [72.6] 本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。
本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:56:06 GMT)
BigCodeBench: Benchmarking Code Generation with Diverse Function Calls and Complex Instructions [72.6] Benchは、大規模言語モデルに対して、139のライブラリと7つのドメインから1,140のきめ細かいプログラミングタスクのためのツールとして、複数の関数呼び出しを実行するためのベンチマークである。
評価の結果,LLMは機能コールを正確に使用するための複雑な指示に従うことができず,スコアは最大60%,人的性能は97%と極めて低いことがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:05:14 GMT)
360$^\circ$REA: Towards A Reusable Experience Accumulation with 360° Assessment for Multi-Agent System [72.0] 評価フィードバックからの経験を総合的に評価し蓄積することは、システム性能を改善するための効果的なアプローチである、と我々は主張する。
企業組織の実践にインスパイアされた階層的なマルチエージェントフレームワークである360$circ$REA(360$circ$REA)による再利用可能なエクスペリエンス蓄積を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:42:10 GMT)
Generating Chain-of-Thoughts with a Pairwise-Comparison Approach to Searching for the Most Promising Intermediate Thought [70.3] CoT法(Chain-of- Thoughts)は、大規模言語モデルにステップバイステップの推論を誘導し、単純から複雑への問題解決を可能にする手法である。
大規模言語モデル (LLMs) による評価は、一般的にうるさく、信頼できないものであり、将来有望な中間的思考を選択する際の生成過程を誤解させる可能性がある。
本稿では,Vapnikの原理を動機として,ポイントワイドスコアではなくペアワイズ比較評価を用いて,有望な中間思考を探索する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:47:52 GMT)
PlaMo: Plan and Move in Rich 3D Physical Environments [68.8] シーン認識型パスプランナで,ロバストな物理制御系であるPlaMoについて紹介する。
プランナーは、シーンが動きに課す様々な制限を考慮して、一連の動き経路を生成する。
私たちのコントロールポリシーは、計画に忠実なリッチでリアルな物理運動を生成します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:41:07 GMT)
Artificial Immune System of Secure Face Recognition Against Adversarial Attacks [67.3] 昆虫生産には 最大限の可能性を実現するために 最適化が必要です
これは選択的育種による興味のある形質の改善が目的である。
このレビューは、様々な分野の知識と、動物の繁殖、定量的遺伝学、進化生物学、昆虫学のギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:50:58 GMT)
FaithLM: Towards Faithful Explanations for Large Language Models [67.3] 大きな言語モデル(LLM)は、内部知識と推論能力を活用することで複雑なタスクに対処するのに熟練している。
これらのモデルのブラックボックスの性質は、意思決定プロセスを説明するタスクを複雑にしている。
自然言語 (NL) による LLM の決定を説明するために FaithLM を紹介した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:43:11 GMT)
Speech2UnifiedExpressions: Synchronous Synthesis of Co-Speech Affective Face and Body Expressions from Affordable Inputs [67.3] 本稿では,デジタル文字の表情と上半身ジェスチャーを同時に合成するマルチモーダル学習手法を提案する。
提案手法は, 映像データから直接推定される, まばらな顔のランドマークと上体関節から学習し, もっともらしい感情的性格運動を生成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:53:11 GMT)
WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models [66.3] 我々は、WildTeamingを紹介した。これは自動LLM安全リチームフレームワークで、Wild-Chatbotインタラクションをマイニングし、新しいジェイルブレイク戦術の5.7Kのユニークなクラスタを発見する。
WildTeamingは、未確認のフロンティアLSMの脆弱性を明らかにし、最大4.6倍の多様性と敵の攻撃に成功した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:31:22 GMT)
Ouroboros: Generating Longer Drafts Phrase by Phrase for Faster Speculative Decoding [65.9] 投機的復号化(英: Speculative decoding)は、大規模言語モデルの生成プロセスを加速する広く使われている手法である。
我々は,草案作成プロセスの並列化のために,草案文を生成するOuroborosを紹介した。
ウロボロは投機的復号化で最大2.4倍、バニラ復号化で3.9倍のスピードアップを達成できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:52:02 GMT)
Denoising as Adaptation: Noise-Space Domain Adaptation for Image Restoration [64.8] 拡散モデルを用いて雑音空間を介して領域適応を行うことが可能であることを示す。
特に,マルチステップの復調過程が補助的な条件入力の影響を受けるというユニークな特性を利用して,雑音予測から有意義な勾配を求める。
トレーニング中のショートカットを防止するため,チャンネルシャッフルや残余スワッピングのコントラスト学習などの有用な手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:40:30 GMT)
Understand What LLM Needs: Dual Preference Alignment for Retrieval-Augmented Generation [64.8] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)の幻覚化問題を緩和する効果を実証している。
本稿では,RAGシステム内での多様な知識嗜好の整合を図った汎用フレームワークであるDPA-RAGを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:26:53 GMT)
RealTalk: Real-time and Realistic Audio-driven Face Generation with 3D Facial Prior-guided Identity Alignment Network [63.8] RealTalkは、音声から表現へのトランスフォーマーであり、高忠実な表現から顔へのフレームワークである。
第1成分として, 口唇運動に関連する個人性および個人内変動の特徴について考察した。
第2のコンポーネントでは、軽量な顔認証アライメント(FIA)モジュールを設計する。
この新しい設計により、高度で非効率な特徴アライメントモジュールに依存することなく、リアルタイムに細部を生成できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:09:59 GMT)
Towards Human-Level 3D Relative Pose Estimation: Generalizable, Training-Free, with Single Reference [63.0] 人間は、単一のクエリ参照イメージペアのみを与えられたラベル/トレーニングなしで、目に見えないオブジェクトの相対的なポーズを容易に推論することができる。
そこで,本研究では,RGB-D参照から2.5D形状のRGB-D参照,オフザシェルフ微分可能なRGB-D参照,DINOv2のような事前学習モデルからのセマンティックキューを用いた3D一般化可能な相対ポーズ推定手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:01:10 GMT)
CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs [62.8] CharXivは、arXiv論文の2,323のチャートを含む総合的な評価スイートである。
品質を確保するために、すべてのチャートと質問は、人間の専門家によって手書きされ、キュレーションされ、検証されます。
その結果、最強のプロプライエタリモデルの推論スキルの間に、かなり過小評価されていたギャップが明らかとなった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:50:11 GMT)
Math-LLaVA: Bootstrapping Mathematical Reasoning for Multimodal Large Language Models [62.8] 我々は、LLaVA-1.5ベースのMathV360Kで微調整されたモデルであるMath-LLaVAを紹介する。
この手法はLLaVA-1.5のマルチモーダル数学的推論能力を著しく改善する。
Math-LLaVAは、MMMUベンチマークで大幅に改善された一般化性を示している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:43:27 GMT)
Categorical Syllogisms Revisited: A Review of the Logical Reasoning Abilities of LLMs for Analyzing Categorical Syllogism [62.6] 本稿では,分類的シロジズムを解析するための大規模言語モデルの論理的推論能力に関する先行研究を体系的に概説する。
まず、純粋に論理的な観点から分類的シロジズムの可能なバリエーションについて検討する。
次に、既存のデータセットでテストされた基本的な設定(ムードとフィギュア)を調べます。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:17:20 GMT)
Changen2: Multi-Temporal Remote Sensing Generative Change Foundation Model [62.3] 安価で自動的な生成モデルに基づく変更データ生成器を提案する。
Changen2は、自己監督を通じて大規模にトレーニング可能な、生成的な変更基盤モデルである。
得られたモデルには、固有のゼロショット変化検出機能と優れた転送性がある。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:03:39 GMT)
Inference-Time Intervention: Eliciting Truthful Answers from a Language Model [61.9] Inference-Time Intervention (ITI)は,大規模言語モデル(LLM)の「真実性」を高める技術である。
ITIは、推論中にモデルのアクティベーションをシフトし、限られた数の注意ヘッドにまたがる一連の方向に従う。
以上の結果から, LLMは表面の虚偽を生じるとしても, 真実の可能性を内部的に表現できる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:11:53 GMT)
S3: A Simple Strong Sample-effective Multimodal Dialog System [61.3] 本稿では,多モーダルダイアログタスクであるS3モデルに対して,概念的にシンプルだが強力なベースラインを提案する。
このシステムは、訓練済みの大規模言語モデル、画像とオーディオのための訓練済みのモダリティエンコーダ、および訓練可能なモダリティプロジェクタに基づいている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:45:43 GMT)
MultiDiff: Consistent Novel View Synthesis from a Single Image [60.0] MultiDiffは、単一のRGB画像からシーンを一貫した新しいビュー合成のための新しいアプローチである。
以上の結果から,MultiDiffは,課題の多いリアルタイムデータセットであるRealEstate10KとScanNetにおいて,最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:53:51 GMT)
A simple and improved algorithm for noisy, convex, zeroth-order optimisation [59.5] 我々は、$f(hat x)$ ができるだけ小さいような点 $hat xin barmathcal X$ を返すアルゴリズムを構築している。
この方法は、$f(hat x) - min_xin barmathcal X f(x)$ が、多対数項まで$d2/sqrtn$ より小さい順序であることを証明する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:19:10 GMT)
Preference Elicitation for Offline Reinforcement Learning [59.1] オフラインの嗜好に基づく強化学習アルゴリズムであるSim-OPRLを提案する。
本アルゴリズムは,配当外データに対する悲観的アプローチと,最適方針に関する情報的嗜好を得るための楽観的アプローチを用いる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:59:13 GMT)
Dynamic Data Pruning for Automatic Speech Recognition [59.0] ASR(DDP-ASR)のダイナミック・データ・プルーニング(Dynamic Data Pruning for ASR)を導入し,音声関連データセットに特化して微細なプルーニングの粒度を提供する。
実験の結果,DDP-ASRは最大1.6倍のトレーニング時間を節約できることがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:17:36 GMT)
Deductive Closure Training of Language Models for Coherence, Accuracy, and Updatability [58.6] 言語モデル(LM)は、実際に正しいテキストを生成し、個々のクレームの真理値を推定することがある。
現在のLMは誤った内容や非意味な内容を生成しており、編集や更新は困難である。
本稿では,DCT(Deductive Closure Training)と呼ばれる手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:52:35 GMT)
Dynamic Gaussian Marbles for Novel View Synthesis of Casual Monocular Videos [58.2] 既存の4次元ガウス法は単分子配置が制約されていないため、この設定で劇的に失敗することを示す。
単分子配置の難易度を目標とした3つのコア修正からなる動的ガウス大理石 (DGMarbles) を提案する。
我々は,Nvidia Dynamic ScenesデータセットとDycheck iPhoneデータセットを評価し,DGMarblesが他のガウシアンベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:37:07 GMT)
ChronoMagic-Bench: A Benchmark for Metamorphic Evaluation of Text-to-Time-lapse Video Generation [57.7] ChronoMagic-Benchは、テキスト・トゥ・ビデオ(T2V)生成ベンチマークである。
モデルがメタモルフィックな振幅と時間的コヒーレンスを持つタイムラプスビデオを生成する能力に焦点を当てている。
10種類の代表的なT2Vモデルの手動評価を行い、その強度と弱点を明らかにした。
大規模なChronoMagic-Proデータセットを作成し、460kの高品質な720pタイムラプスビデオを含む。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:50:47 GMT)
Learning to Remove Cuts in Integer Linear Programming [57.2] 本研究では, 学習可能なパラメトリック基準の下で, 手法の前回の繰り返しで導入された前回のカットの除去について検討する。
基本的な最適化設定では、カット削除ポリシーは、ヒューマンベースおよび機械学習誘導のカット追加ポリシーよりも大幅に改善される可能性があることを実証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:50:43 GMT)
Automatic Prediction of Amyotrophic Lateral Sclerosis Progression using Longitudinal Speech Transformer [56.2] ニューラルネットワークを用いたALS病進行自動予測器であるALS長手音声変換器(ALST)を提案する。
録音における高品質な事前訓練音声特徴と長手情報を活用することで、最良のモデルが91.0%のAUCを達成できる。
ALSTはALS進行の細粒度で解釈可能な予測が可能で、特に稀な症例と重篤な症例の区別が可能である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:28:24 GMT)
EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation [54.3] CVPR 2024のEgoVis Challengesには、Ego4Dチャレンジの5トラックとEPIC-Kitchensチャレンジの3トラックが含まれています。
ビデオ言語2towerモデルを構築し,厳密に整理された自我中心型ビデオデータを活用することにより,EgoVideoという新しい基礎モデルを導入する。
このモデルは、エゴセントリックなビデオの特徴に特化して設計されており、当社のコンペティションへの強力なサポートを提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:01:37 GMT)
Mixtures of Experts Unlock Parameter Scaling for Deep RL [54.3] 本稿では,Mixture-of-Expert(MoE)モジュールを値ベースネットワークに組み込むことで,パラメータスケーラブルなモデルが得られることを示す。
この研究は、強化学習のためのスケーリング法則の開発に関する強力な実証的証拠を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:50:01 GMT)
Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.2] Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:30:21 GMT)
WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs [54.1] LLM安全性のためのオープンで軽量なモデレーションツールであるWildGuardを紹介します。
WildGuardは、ユーザプロンプトにおける悪意のある意図の特定、モデルレスポンスの安全性リスクの検出、モデル拒絶率の決定という3つの目標を達成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:58:20 GMT)
Step-DPO: Step-wise Preference Optimization for Long-chain Reasoning of LLMs [54.1] 本稿では,Step-DPOと呼ばれるシンプルで効果的でデータ効率のよい手法を提案する。
Step-DPOは、個々の推論ステップを、論理的に回答を評価するのではなく、優先最適化の単位として扱う。
以上の結果から,70B パラメータ以上のモデルでは,10K の選好データペアと500 Step-DPO トレーニングステップ以下では,MATH の精度が約3%向上する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:43:06 GMT)
3D-MVP: 3D Multiview Pretraining for Robotic Manipulation [53.5] マスク付きオートエンコーダを用いた3次元マルチビュー事前学習のための新しいアプローチである3D-MVPを提案する。
我々は,多視点トランスを用いたロボットビュートランス(RVT)を利用して3Dシーンを理解し,ポーズ動作を予測する。
最小限の微調整を施した実際のロボットプラットフォームで有望な結果を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:17:59 GMT)
A Stem-Agnostic Single-Decoder System for Music Source Separation Beyond Four Stems [53.3] Banquetは1つのデコーダを使って複数の幹のソース分離を可能にするシステムである。
バンドスプリットソース分離モデルは、楽器認識PaSSTモデルと共にタンデムでクエリベースのセットアップで動作するように拡張される。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:25:53 GMT)
Boosting the Cross-Architecture Generalization of Dataset Distillation through an Empirical Study [52.8] データセット蒸留のクロスアーキテクチャ一般化は、その実用的重要性を弱める。
EvaLuation with distillation Feature (ELF)を提案する。
大規模な実験を行うことで、ALFが現在のDD法のクロスアーキテクチャ一般化を十分に強化できることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:43:43 GMT)
Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.8] 本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:10:43 GMT)
MatchTime: Towards Automatic Soccer Game Commentary Generation [52.4] 観客の視聴体験を改善するために,自動サッカーゲーム解説モデルの構築を検討する。
まず、既存のデータセットでよく見られるビデオテキストのミスアライメントを観察し、49試合のタイムスタンプを手動でアノテートする。
第2に,既存のデータセットを自動的に修正・フィルタリングするマルチモーダル時間アライメントパイプラインを提案する。
第3に、キュレートされたデータセットに基づいて、MatchVoiceという自動コメント生成モデルをトレーニングします。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:57:25 GMT)
Multi-Agent Imitation Learning: Value is Easy, Regret is Hard [52.3] 我々は,エージェント群を協調させようとする学習者の視点で,マルチエージェント模倣学習(MAIL)問題を研究する。
MAILの以前の作業のほとんどは、基本的には、デモのサポート内で専門家の振る舞いにマッチする問題を減らすものです。
エージェントが戦略的でないという仮定の下で、学習者と専門家の間の価値ギャップをゼロにするのに十分であるが、戦略的エージェントによる逸脱を保証するものではない。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:39:31 GMT)
A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.8] 水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:28:15 GMT)
MindStar: Enhancing Math Reasoning in Pre-trained LLMs at Inference Time [51.5] MindStarは、大言語モデルの純粋に推論に基づく探索手法である。
推論タスクを探索問題として定式化し、最適な推論経路を特定するための2つの探索アイデアを提案する。
Llama-2-13BやMistral-7Bのようなオープンソースモデルの推論能力を大幅に向上させ、GPT-3.5やGrok-1に匹敵する性能を実現している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:01:15 GMT)
Improving Demonstration Diversity by Human-Free Fusing for Text-to-SQL [51.5] 本稿では,テキスト・ツー・ダイバーシティ研究における実証の多様性を計測し,改善する方法について論じる。
我々は,高多様性のデモンストレーションプールを構築するために,デモ(Fused)のために反復的に融合することを提案する。
本手法は,複数の主流データセットにラベルを付けることなく,平均3.2%と5.0%の改善を実現する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:54:35 GMT)
Antigen-Specific Antibody Design via Direct Energy-based Preference Optimization [51.3] 我々は,抗原特異的抗体配列構造共設計を,特定の嗜好に対する最適化問題として取り組んだ。
そこで本研究では,有理構造と抗原への結合親和性の両方を有する抗体の生成を誘導する,直接エネルギーに基づく選好最適化を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:06:42 GMT)
A Survey of Privacy-Preserving Model Explanations: Privacy Risks, Attacks, and Countermeasures [51.0] AIのプライバシと説明可能性に関する研究が増えているにもかかわらず、プライバシを保存するモデル説明にはほとんど注意が払われていない。
本稿では,モデル説明に対するプライバシ攻撃とその対策に関する,最初の徹底的な調査を紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:28:15 GMT)
MUMU: Bootstrapping Multimodal Image Generation from Text-to-Image Data [50.9] 合成画像データと公開画像データのキャプション中の単語に対応する意味論的に意味のある画像作物を抽出し,マルチモーダルデータセットをブートストラップする。
我々のモデルMUMUは拡散復号器を備えた視覚言語モデルエンコーダで構成されており、単一の8xH100 GPUノードで訓練されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:21:42 GMT)
Towards Synchronous Memorizability and Generalizability with Site-Modulated Diffusion Replay for Cross-Site Continual Segmentation [50.7] 本稿では,同期記憶可能性と一般化可能性(SMG-Learning)に学ぶ新しい学習パラダイムを提案する。
我々は,過去の地点での記憶可能性を確保するために方位勾配アライメントと,目に見えない地点での一般化性を高めるために任意の勾配アライメントを作成する。
実験により,本手法は,他の最先端手法よりも,記憶可能性と一般性の両方を効果的に向上させることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:10:57 GMT)
Start from Zero: Triple Set Prediction for Automatic Knowledge Graph Completion [49.2] トリプルセット予測(TSP)と呼ばれるグラフレベルの自動KG補完タスクを提案する。
TSPは、欠落した三重項の要素が与えられていないと仮定する。
予測のための巨大な候補三重項に対処するために,新しい,効率的なサブグラフベースGPHTを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:26:32 GMT)
WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.2] textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:34:13 GMT)
Editable Scene Simulation for Autonomous Driving via Collaborative LLM-Agents [49.1] ChatSimは、編集可能な3Dドライビングシーンシミュレーションを、外部デジタル資産を持つ自然言語コマンドで実現した最初のシステムである。
ChatSimは、フォトリアリスティックな結果を生成するために、新しいマルチカメラニューラルフィールド法を採用している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:44:58 GMT)
Splatter a Video: Video Gaussian Representation for Versatile Processing [49.0] ビデオ表現は、トラッキング、深度予測、セグメンテーション、ビュー合成、編集など、さまざまなダウンストリームタスクに不可欠である。
我々は,映像を3Dガウスに埋め込む,新しい3D表現-ビデオガウス表現を導入する。
トラッキング、一貫したビデオ深度と特徴の洗練、動きと外観の編集、立体映像生成など、多数のビデオ処理タスクで有効であることが証明されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:20:11 GMT)
Differential error feedback for communication-efficient decentralized learning [48.9] 本稿では,差分量子化と誤りフィードバックをブレンドする分散通信効率学習手法を提案する。
その結果,平均二乗誤差と平均ビットレートの両面において通信効率が安定であることが示唆された。
その結果、小さなステップサイズで有限ビットの場合には、圧縮がない場合に達成可能な性能が得られることが判明した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:11:26 GMT)
Machine Learning-Enabled Software and System Architecture Frameworks [48.9] データサイエンスと機械学習に関連する関心事、例えばデータサイエンティストやデータエンジニアの利害関係者は、まだ既存のアーキテクチャフレームワークには含まれていない。
10か国25以上の組織から61名の被験者を対象に調査を行った。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:09:04 GMT)
SafeAligner: Safety Alignment against Jailbreak Attacks via Response Disparity Guidance [48.8] SafeAlignerは、ジェイルブレイク攻撃に対する防御を強化するためのデコード段階で実装された方法論である。
安全性を高めるために訓練されたセンチネルモデルと、よりリスクの高い応答を生成するように設計されたイントルーダモデルである。
SafeAlignerは有害なトークンの発生を低減しつつ、有益トークンの可能性を高めることができることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:15:44 GMT)
Learn it or Leave it: Module Composition and Pruning for Continual Learning [48.1] MoCL-Pは知識統合と計算オーバーヘッドのバランスをとる軽量な連続学習手法である。
評価の結果,MoCL-Pは最先端性能を実現し,パラメータ効率を最大3倍向上することがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:18:28 GMT)
Caught in the Quicksand of Reasoning, Far from AGI Summit: Evaluating LLMs' Mathematical and Coding Competency through Ontology-guided Interventions [47.8] 大規模言語モデル(LLM)は論理的推論ベンチマークで顕著な結果を示した。
算術的推論とコード生成という,2つの一般的な推論タスクに注目します。
質問に対して、すべてのモデルで大幅なパフォーマンス低下を見せています。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:43:39 GMT)
Towards Understanding Jailbreak Attacks in LLMs: A Representation Space Analysis [47.8] 大規模言語モデル(LLM)は、有害な内容を出力するためにLLMを誤解させるジェイルブレーキング(jailbreaking)と呼ばれるタイプの攻撃を受けやすい。
本稿では, LLMの表現空間における有害かつ無害なプロンプトの挙動を考察し, ジェイルブレイク攻撃の本質的特性について検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:50:32 GMT)
Diffusion Model-Based Video Editing: A Survey [47.5] 本稿では,拡散モデルに基づくビデオ編集技術について概説する。
進化的軌跡を描写した映像編集手法を,コア技術の本質的な接続によって分類する。
本稿では,ポイントベース編集やポーズ誘導型ヒューマンビデオ編集など,新しい応用についても検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:58:39 GMT)
Enhancing Geometric Ontology Embeddings for $\mathcal{EL}^{++}$ with Negative Sampling and Deductive Closure Filtering [45.8] オントロジーはクラス、関係、個人を$mathbbn$に埋め込み、$bbRn$のエンティティ間の類似性を計算することができる。
還元的閉鎖と異なるタイプの負の双方を考慮に入れた新規な負の損失を生じさせる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:17:13 GMT)
ClickPrompt: CTR Models are Strong Prompt Generators for Adapting Language Models to CTR Prediction [45.2] クリックスルー率(CTR)の予測は、様々なインターネットアプリケーションにとってますます不可欠になっている。
従来のCTRモデルは、マルチフィールド分類データをワンホット符号化によりID特徴に変換し、特徴間の協調信号を抽出する。
我々は、CTRモデルを組み込んで対話対応ソフトプロンプトを生成する、新しいモデル非依存フレームワーク(ClickPrompt)を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:59:47 GMT)
CIMRL: Combining IMitation and Reinforcement Learning for Safe Autonomous Driving [45.1] 本研究では,模擬動作の事前条件と安全性制約を活用することで,シミュレーションにおける運転ポリシーのトレーニングを可能にするフレームワークを提案する。
RLと模倣を組み合わせることで,本手法は閉ループシミュレーション駆動ベンチマークにおいて最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:56:39 GMT)
Confident Natural Policy Gradient for Local Planning in $q_π$-realizable Constrained MDPs [44.7] 制約付きマルコフ決定プロセス(CMDP)フレームワークは、安全性や他の重要な目的を課すための重要な強化学習アプローチとして出現する。
本稿では,線形関数近似が$q_pi$-realizabilityで与えられる学習問題に対処する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:57:13 GMT)
Bayesian inverse Navier-Stokes problems: joint flow field reconstruction and parameter learning [44.6] ベイズ逆ナヴィエ・ストークス(N-S)問題を定式化して解く。
境界位置を含む未知のN-Sパラメータを学習する。
次に,この手法を用いて3次元定常層流の磁気共鳴速度測定データを再構成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:16:36 GMT)
LongIns: A Challenging Long-context Instruction-based Exam for LLMs [44.5] 大規模言語モデル(LLM)の長いコンテキスト能力は近年ホットな話題となっている。
本稿ではLongInsベンチマークデータセットを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:28:04 GMT)
EFCNet: Every Feature Counts for Small Medical Object Segmentation [44.3] 本報告では, 臨床的意義の大きい, 非常に小さな医療対象のセグメンテーションについて検討する。
CNN、UNetのようなモデル、そして最近のトランスフォーマーは、画像セグメンテーションの大幅な進歩を示している。
医用画像における小物体分割のためのEFCNetという新しいモデルを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:33:51 GMT)
FactFinders at CheckThat! 2024: Refining Check-worthy Statement Detection with LLMs through Data Pruning [43.8] 本研究では,オープンソースの言語モデルを用いて,政治的書き起こしからチェックにふさわしい文章を識別する手法について検討する。
本稿では,高品質なトレーニングデータインスタンスを自動的に同定し,効果的な学習を行うための2段階のデータ解析手法を提案する。
私たちのチームは英語のチェック・マインドネス・タスクで1位にランクインした。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:31:31 GMT)
From Majority to Minority: A Diffusion-based Augmentation for Underrepresented Groups in Skin Lesion Analysis [43.1] AIに基づく診断は皮膚がんの分類における皮膚科レベルのパフォーマンスを示す。
このようなシステムは、トレーニングセットに十分な表現が欠けている少数派のグループからのデータでテストすると、性能が低下する傾向にある。
マイノリティグループに利益をもたらすために,多数派からの豊富な情報の利用を最大化する,効果的な拡散に基づく拡張フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:19:31 GMT)
Learning Neural Networks with Sparse Activations [42.9] 変圧器ネットワークでは、このブロックの隠された層における活性化は、任意の入力に対して非常に緩い傾向にある。
ネットワークから除去できるニューロンやウェイトが存在する従来のスペーシリティとは異なり、このエムアクティベーションのスペーシリティは利用するのが困難である。
関数のクラスが証明可能な計算と統計上の優位性をもたらすことを示す様々な結果を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:11:13 GMT)
Scattering Neutrinos, Spin Models, and Permutations [42.6] 我々は、超新星におけるニュートリノ相互作用にインスパイアされたハイゼンベルク全結合スピンモデルのクラスを$N$自由度で考える。
これらのモデルは、非自明な固有値である$N$に対して、わずかしか存在しないという意味では比較的単純である結合行列によって特徴づけられる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:27:15 GMT)
Closed-form solutions for the Salpeter equation [41.9] スピンを持たない相対論的量子粒子を記述した1+1$次元サルペター・ハミルトンのプロパゲータについて検討する。
複素平面におけるハミルトニアンの解析的拡張により、等価な問題、すなわちB"オーマー方程式を定式化することができる。
この B "aumera" は、コーシーとガウス拡散を補間する相対論的拡散過程のグリーン関数に対応する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:52:39 GMT)
PaCoST: Paired Confidence Significance Testing for Benchmark Contamination Detection in Large Language Models [41.8] 大規模言語モデル(LLM)は膨大な量のデータに基づいて訓練されることが知られており、意図的または故意によく使われるベンチマークのデータを含むことがある。
このインクルージョンは、モデルリーダーボードの不正な高いスコアにつながるが、現実のアプリケーションではパフォーマンスに失望する。
LLMのベンチマーク汚染を効果的に検出するPaired Confidence Significance TestingであるPaCoSTを紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:12:40 GMT)
RouteLLM: Learning to Route LLMs with Preference Data [41.7] 大きな言語モデル(LLM)は、幅広いタスクにわたって印象的な機能を示すが、どのモデルを使うかの選択は、パフォーマンスとコストのトレードオフを伴うことが多い。
推論において,より強いLLMと弱いLLMを動的に選択する効率的なルータモデルを提案する。
我々は、人間の嗜好データとデータ拡張技術を利用して、これらのルータのためのトレーニングフレームワークを開発し、性能を向上する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:10:22 GMT)
LLMs for Doctors: Leveraging Medical LLMs to Assist Doctors, Not Replace Them [41.7] 我々は、より経験豊富な医師と協力する医療アシスタントになるよう、Large Language Modelsをチューニングすることに重点を置いている。
我々は、医師のワークフロー全体をサポートするために、DoctorFLANと呼ばれる中国の医療データセットを構築した。
550個のシングルターンQ&Aを含むDoctorFLAN-textittestと74個のマルチターン会話を含むDotaBenchを構築し,医師指向のシナリオにおけるLCMの評価を行った。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:08:24 GMT)
MM-MATH: Advancing Multimodal Math Evaluation with Process Evaluation and Fine-grained Classification [41.5] 本稿では,マルチモーダル数学推論のための新しいベンチマークMM-MATHを提案する。
MM-MATHは、5,929個のオープンエンド中等教育数学問題と視覚的文脈を持ち、難易度、学級レベル、知識点の詳細な分類を行う。
最高の性能モデルはMM-MATHで31%の精度しか達成していないが、人間では82%である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:50:58 GMT)
Large Stepsize Gradient Descent for Non-Homogeneous Two-Layer Networks: Margin Improvement and Fast Optimization [41.2] 第2フェーズは、経験的リスクが一定の閾値以下に落ちてから始まり、ステップサイズに依存することを示す。
また、正規化マージンは第2相においてほぼ単調に成長し、非均一予測器のトレーニングにおいてGDの暗黙の偏りを示す。
我々の分析は、よく知られたニューラルネットワークカーネルや平均場状態を超えて、あらゆる幅のネットワークに適用できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:40:57 GMT)
Do LLMs dream of elephants (when told not to)? Latent concept association and associative memory in transformers [41.0] LLM(Large Language Models)は、事実を保存およびリコールする能力を持つ。
LLMは、コンテキスト内の特定のトークンが事実を取得する手がかりとなる連想記憶モデルのように振る舞う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:49:54 GMT)
SUB-PLAY: Adversarial Policies against Partially Observed Multi-Agent Reinforcement Learning Systems [40.9] 攻撃者は被害者の脆弱性を迅速に悪用し、特定のタスクの失敗につながる敵のポリシーを生成する。
部分観測可能性の影響を軽減するために,複数のサブゲームを構築するという概念を取り入れた新しいブラックボックス攻撃(SUB-PLAY)を提案する。
我々は,敵対的政策によるセキュリティの脅威を軽減するための3つの防衛策を評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:41:59 GMT)
PGODE: Towards High-quality System Dynamics Modeling [40.8] 本稿では,エージェントが相互に相互作用して動作に影響を与えるマルチエージェント力学系をモデル化する問題について検討する。
最近の研究では、主に幾何学グラフを用いてこれらの相互相互作用を表現し、グラフニューラルネットワーク(GNN)によって捉えられている。
本稿では,プロトタイプグラフODE(Prototypeal Graph ODE)という新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:37:46 GMT)
"Vorbeşti Româneşte?" A Recipe to Train Powerful Romanian LLMs with English Instructions [40.6] ルーマニア語用にカスタマイズされたオープンソースのLLMを収集、翻訳し、評価し、リリースするのはこれが初めてです。
我々は,RoLLMsの有用性と高い性能について,各ボードにまたがって最先端の結果を得ることによって論じる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:39:51 GMT)
Few-shot Personalization of LLMs with Mis-aligned Responses [40.0] 本稿では,大規模言語モデル(LLM)のパーソナライズのための新しいアプローチを提案する。
私たちのキーとなるアイデアは、LSMを用いてプロンプトを段階的に改善することで、各ユーザに対してパーソナライズされたプロンプトのセットを学ぶことです。
即時改善の反復過程において,LLMによる不整合応答の文脈を取り入れた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:29:12 GMT)
MFDNet: Multi-Frequency Deflare Network for Efficient Nighttime Flare Removal [39.7] ラプラシアンピラミッドに基づくMFDNet(MFDNet)を提案する。
我々のネットワークは、フレア崩壊した画像を低周波帯と高周波帯に分解し、画像内の照明と内容情報を効果的に分離する。
実験により,本手法は実空間および合成画像の夜間フレア除去において,最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:31:36 GMT)
Exploring Gender-Specific Speech Patterns in Automatic Suicide Risk Assessment [39.3] 本研究は、中性テキストを読む20人の患者の音声記録を含む新しいデータセットに関するものである。
解釈可能な特徴と深い特徴を含む4つの音声表現を抽出する。
性別排他モデルを適用することにより、感情の微調整wav2vec2.0モデルから抽出した特徴を利用して、低自殺リスクから高リスクを81%の精度で識別することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:51:28 GMT)
Themis: Towards Flexible and Interpretable NLG Evaluation [39.1] 我々は,人間とGPT-4アノテーションを併用した大規模NLG評価コーパスNLG-Evalを構築し,この分野における関連データの欠如を軽減した。
我々は,NLG評価専用のLLMであるThemisを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:04:29 GMT)
Few-Shot Medical Image Segmentation with High-Fidelity Prototypes [38.1] 本稿では,オブジェクトフォアグラウンドと背景を包括的に表現する高忠実度プロトタイプを構築するための,DSPNet(Detail Self-Refined Prototype Network)を提案する。
得られた詳細セマンティクスを維持しつつグローバルなセマンティクスを構築するために,マルチモーダル構造をクラスタリングでモデル化し,それぞれをチャネル的に融合させることにより,前景のプロトタイプを学習する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:06:14 GMT)
Explicit Diversity Conditions for Effective Question Answer Generation with Large Language Models [37.6] 質問応答生成(QAG)は,質問応答システムの精度を向上させる効果的なデータ拡張手法である。
我々は,空間的側面,質問タイプ,実体に着目し,QAGの明確な多様性条件を提示する。
特に、下流QAモデルをトレーニングする際、明確な多様性条件から生成されたQAペアは、QAGよりも平均4.1%正確な一致と4.5%のF1改善をもたらす。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:12:08 GMT)
Large Knowledge Model: Perspectives and Challenges [37.4] emphLarge Language Models (LLMs) は、広範囲なシーケンスベースの世界知識をニューラルネットワークに事前学習する。
本稿では,「知識」のレンズを用いた大規模モデルについて考察する。
人間の知識の複雑な性質を考えると、私たちはEmphLarge Knowledge Models(LKM)の作成を提唱する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:11:55 GMT)
MATE: Meet At The Embedding -- Connecting Images with Long Texts [37.3] Meet At The Embedding (MATE)は、大型言語モデル(LLM)とビジョン言語モデル(VLM)の機能を組み合わせた、新しいアプローチである。
我々は、VLMのテキストエンコーダを、長文の理解に優れたLLMベースのエンコーダに置き換える。
画像と長いテキストを接続するタスクを評価するために,2つの新たなクロスモーダル検索ベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:10:00 GMT)
Learning to Correct for QA Reasoning with Black-box LLMs [37.1] 我々は,機械学習におけるオープンチャレンジとして,COBB (Correct for improve QA reasoning of Black-Box LLMs)を提案する。
トレーニングされた適応モデルを使用して、オリジナルのブラックボックスLSMのしばしば不完全な推論から正しい推論、または改善された推論へのセック2seqマッピングを実行する。
実験の結果,CoBBは様々なQAベンチマークにおいて推理精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:57:32 GMT)
IRCAN: Mitigating Knowledge Conflicts in LLM Generation via Identifying and Reweighting Context-Aware Neurons [35.9] 近年の研究では、大規模言語モデル(LLM)生成における知識衝突が明らかにされている。
我々は、文脈的手がかりの処理に不可欠なニューロンを活かすための新しいフレームワークIRCANを提案する。
そこで我々は, LLM を利用してコンテキストに付与された新しい知識に対して, 文脈に敏感な出力を生成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:57:38 GMT)
The Fundamental Limits of Least-Privilege Learning [35.7] 機械学習における最小特権原理の最初の形式化を提供する。
与えられたタスクに対する表現の効用と、意図したタスク以上のリークとの間には、根本的なトレードオフがあることを証明します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:18:44 GMT)
Solving the homogeneous Bethe-Salpeter equation with a quantum annealer [35.3] 等質Bethe-Salpeter方程式(hBSE)は、D-Wave量子アニールを用いて初めて解かれた。
D-Wave Advantage 4.1 システムとプロプライエタリなシミュレート・アニーリング・パッケージを用いて,提案アルゴリズムの広範な数値解析を行った。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:12:53 GMT)
Fast Optimizer Benchmark [34.8] 本稿では,Fast Benchmark(FOB)について紹介する。
このベンチマークは、コンピュータビジョン、自然言語処理、グラフ学習などの複数のドメインからのタスクをサポートする。
モジュール化された設計は、単にタスクのコレクションとして使うだけで、カスタムパイプラインへの統合を可能にする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:10:34 GMT)
Multilingual Knowledge Graph Completion from Pretrained Language Models with Knowledge Constraints [34.7] 本稿では,mKGCの国際的および地域的知識制約について紹介する。
公開データセットの実験結果から,Hits@1とHits@10では,私たちのメソッドが以前のSOTAよりも優れていたことが示されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:46:35 GMT)
Two Tales of Persona in LLMs: A Survey of Role-Playing and Personalization [33.5] 対話文学で最初に採用されたペルソナの概念は、大きな言語モデルを特定の文脈に合わせるための有望な枠組みとして復活してきた。
ギャップを埋めるために、フィールドの現状を分類するための総合的な調査を提示する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:37:48 GMT)
ES-GNN: Generalizing Graph Neural Networks Beyond Homophily with Edge Splitting [32.7] 本稿では,学習タスクに関係のないグラフエッジを適応的に識別する新しいエッジ分割GNN(ES-GNN)フレームワークを提案する。
本稿では,ES-GNNを非交叉グラフ記述問題の解とみなすことができることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:59:04 GMT)
Spatial-temporal Hierarchical Reinforcement Learning for Interpretable Pathology Image Super-Resolution [32.5] 空間的階層的階層的強化学習(STAR-RL)と呼ばれる最初の階層的強化学習フレームワークを提案する。
我々は、SR問題を解釈操作のマルコフ決定プロセスとして再構成し、階層的回復機構をパッチレベルで適用する。
異なるカーネルによる医用画像の劣化実験の結果,STAR-RLの有効性が示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:50:10 GMT)
DeCoF: Generated Video Detection via Frame Consistency: The First Benchmark Dataset [32.2] 生成したビデオのオープンソースデータセットと検出手法を初めて提案する。
まず,964のプロンプトからなるスケーラブルなデータセットを提案する。
第二に、空間的人工物に基づく検出器が一般化性に欠けていることの探索実験により明らかになった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:32:50 GMT)
LOOK-M: Look-Once Optimization in KV Cache for Efficient Multimodal Long-Context Inference [32.2] LOOK-Mは、マルチモーダルKVキャッシュサイズを効率的に削減する、先駆的で微調整のないアプローチである。
最大1.5倍高速なデコードを実現し、また、様々な長いコンテキストマルチモーダルタスクのパフォーマンスを維持または強化する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:44:24 GMT)
ObjFormer: Learning Land-Cover Changes From Paired OSM Data and Optical High-Resolution Imagery via Object-Guided Transformer [31.5] 本稿では,ペアOSMデータと光学画像を用いた土地被覆変化の直接検出の先駆者となる。
本稿では、オブジェクトベース画像解析(OBIA)技術と高度な視覚変換器アーキテクチャを自然に組み合わせたオブジェクト誘導変換器(Former)を提案する。
OpenMapCDと呼ばれる大規模なベンチマークデータセットは、詳細な実験を行うために構築されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:31:54 GMT)
Selective Prompting Tuning for Personalized Conversations with LLMs [31.3] textbfSelective textbfPrompt textbfTuning (SPT)を提案する。
SPTは、他の重要なパフォーマンス指標の改善とともに、応答の多様性を最大90%向上させる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:03:52 GMT)
Situational Awareness Matters in 3D Vision Language Reasoning [30.1] SIG3Dは3次元視覚言語推論のためのエンド・ツー・エンドのコンディション・グラウンドド・モデルである。
我々は,3Dシーンをスパースボクセル表現にトークン化し,言語に基づく状況推定手法を提案する。
SQA3DとScanQAデータセットの実験により、SIG3Dは状況推定や質問応答において最先端のモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:59:50 GMT)
CLARA: Classifying and Disambiguating User Commands for Reliable Interactive Robotic Agents [29.6] 我々は、対話型ロボットエージェントの文脈において、与えられたユーザコマンドが明確であるか、曖昧であるか、あるいは不可能であるかを推測することに集中する。
あいまいなコマンドに対しては、質問生成を通じてユーザと対話することで、コマンドを曖昧にします。
本稿では,ロボットによる状況認識のためのデータセットについて述べる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:39:36 GMT)
GUIDE: A Guideline-Guided Dataset for Instructional Video Comprehension [29.2] 日常生活に関連する8つの領域における560の指導課題の3.5Kビデオを含むGUIDEデータセットを提案する。
我々は、各指導課題にガイドラインを付け、すべてのタスク関連ビデオで共有される共通パターンを表現する。
提案するベンチマークは,モデルの理解能力を評価するための3つのサブタスクからなる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:24:00 GMT)
SuperGrad: a differentiable simulator for superconducting processors [29.0] SuperGradは超伝導量子プロセッサの設計を、勾配計算機能を組み込んで加速するシミュレータである。
SuperGradは、ハミルトン人を構築するためのユーザフレンドリなインターフェースを提供し、複合システムの静的特性と動的特性の両方をコンピューティングする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:13:06 GMT)
PharmGPT: Domain-Specific Large Language Models for Bio-Pharmaceutical and Chemistry [28.9] 大規模言語モデル(LLM)は、複雑な機能工学の必要性を最小限に抑えて、自然言語処理(NLP)に革命をもたらした。
しかし、生物医薬品や化学といった専門分野へのLSMの応用は、まだほとんど解明されていない。
本研究では,13億~70億のパラメータを持つ多言語LLMのスイートであるPharmGPTについて紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:43:09 GMT)
DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution [28.6] Low-Rank Adaptation (LoRA) は、ウェイト行列の差分パラメータ予算要件を無視したバイパスフレームワークに依存している。
DoRAは、高ランクのLoRA層を構造化シングルランクコンポーネントに分解し、パラメータ予算の動的プルーニングを可能にする。
実験結果から,LORAやフルモデルファインチューニングと比較して,DoRAの競争性能が向上することが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:41:33 GMT)
Toward Availability Attacks in 3D Point Clouds [28.5] 距離正規化による2次元アベイラビリティーアタックを3次元点群に直接適用することは, 縮退の影響を受けやすいことを示す。
特徴空間に新たなショートカットを生成するFC-EM(Feature Collision Error-Minimization)法を提案する。
典型的なポイントクラウドデータセット,3次元頭蓋内動脈瘤医療データセット,および3次元顔データセットを用いて,我々のアプローチの優位性と実用性を検証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:13:30 GMT)
$\text{Alpha}^2$: Discovering Logical Formulaic Alphas using Deep Reinforcement Learning [28.5] 深部強化学習(DRL)を用いたアルファ発見のための新しい枠組みを提案する。
DRLでガイドされた探索アルゴリズムは、潜在的なアルファ結果の値推定に基づいて探索空間をナビゲートする。
実世界の株式市場での実証実験は、さまざまな論理的かつ効果的なアルファを識別するtextAlpha2$の能力を実証している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:40:12 GMT)
Mélange: Cost Efficient Large Language Model Serving by Exploiting GPU Heterogeneity [27.9] 大規模言語モデル(LLM)はますます多くのオンラインサービスに統合されているが、デプロイにはコストがかかる。
我々は,所与のLLMサービスに対して,最小コストのGPUアロケーションを自動かつ効率的に導出するフレームワークであるM'elangeを紹介する。
M'elangeは、会話設定で最大77%、ドキュメントベースの設定で33%、混合設定で51%のデプロイメントコストを削減する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:39:26 GMT)
ViT-1.58b: Mobile Vision Transformers in the 1-bit Era [27.7] 本稿では、メモリと計算オーバーヘッドを大幅に削減する新しい1.58ビット量子化ViTモデルViT-1.58bを紹介する。
CIFAR-10 と ImageNet-1k の実験では、ViT-1.58b は完全精度の Vit に匹敵する精度を維持している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:01:19 GMT)
CodeHalu: Code Hallucinations in LLMs Driven by Execution-based Verification [27.7] 本稿では,コード幻覚の概念を導入し,実行検証に基づくコード幻覚の分類法を提案する。
コード幻覚を、マッピング、命名、リソース、論理幻覚の4つの主なタイプに分類する。
コード幻覚を体系的に定量的に評価するために、699のタスクから8,883のサンプルを含むCodeHaluEvalベンチマークを構築した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:28:36 GMT)
Robustness to Subpopulation Shift with Domain Label Noise via Regularized Annotation of Domains [27.5] 明示的なドメインアノテーションを必要とせずに、ロバストな最終層分類器をトレーニングするために、ドメインの規則化された依存(RAD)を導入します。
RADは、いくつかの公開データセットのトレーニングデータにおいて、5%のノイズしか持たない最先端のアノテーション-リライアントメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:35:16 GMT)
Evaluating and Benchmarking Foundation Models for Earth Observation and Geospatial AI [27.0] 我々は、地球観測のための基礎モデル(EO)と地理空間AIのコンピュータビジョン応用に焦点を当てた。
限られたラベル付きデータに対して、ファンデーションモデルは問題固有モデルと比較して性能が向上することを示す。
本稿では,EOファンデーションモデルの評価ベンチマークを用いて,下流タスクにおいて,ファンデーションモデルがラベル効率が高いことを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:27:06 GMT)
Bidirectional-Reachable Hierarchical Reinforcement Learning with Mutually Responsive Policies [26.9] 階層強化学習(HRL)は、それらをサブゴールに分解することで複雑な長距離タスクに対処する。
本稿では,計算効率も向上する単純かつ効果的なアルゴリズムである双方向到達型階層型ポリシー最適化(BrHPO)を提案する。
様々な長期タスクの実験結果からは、BrHPOは他の最先端のHRLベースラインよりも優れており、探索効率と堅牢性が著しく高いことが示されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:05:04 GMT)
Towards understanding neural collapse in supervised contrastive learning with the information bottleneck method [26.9] ニューラル崩壊(Neural collapse)とは、パフォーマンスプレートを超えてトレーニングされたディープニューラルネットワークの最終層におけるアクティベーションの幾何学である。
分類問題の最適IB解に近づくと、神経崩壊は特に良い一般化をもたらすことを実証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:52:52 GMT)
AI-native Memory: A Pathway from LLMs Towards AGI [26.7] 大規模言語モデル(LLM)は、人工知能(AGI)の火花で世界を実証した。
我々は,メモリ統合によるLLMからAGIへの経路を構想する。
中間段階として、メモリは自然言語記述の形式になる可能性が高い。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:51:37 GMT)
A Closer Look into Mixture-of-Experts in Large Language Models [26.5] エクササイズ・オブ・エクササイズ(Mixture-of-experts, MOE)は,その特性と顕著な性能から注目を集めている。
MoEアーキテクチャは計算効率を犠牲にすることなくモデルサイズを増大させることができる。
本稿は,MoEベースの大規模言語モデルの内部動作を理解するための最初の試みである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:07:57 GMT)
Slot State Space Models [26.2] 本稿では,情報分離の保存・促進を目的として,独立したメカニズムをSSMに組み込む新しいフレームワークであるSlotSSMを紹介する。
実験では,対象中心の映像理解,3次元視覚推論,映像予測タスクにおけるモデルの評価を行った。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:04:04 GMT)
Adam-mini: Use Fewer Learning Rates To Gain More [26.0] Adam-miniはAdamの学習率リソースを削減してメモリを削減します。
Adam-miniは、メモリフットプリントを45%から50%削減したAdamWよりも、オンパーまたは優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:03:16 GMT)
GRAM: An Interpretable Approach for Graph Anomaly Detection using Gradient Attention Maps [26.0] 本稿では,性能向上のための解釈可能性の力を活用したグラフ異常検出手法を提案する。
本手法は, グラフニューラルネットワークの勾配から抽出したアテンションマップを抽出し, 異常評価の基礎となる。
実世界のグラフ分類と無線ネットワークデータセットにおける最先端グラフ異常検出技術に対する我々のアプローチを広く評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:24:08 GMT)
MolFusion: Multimodal Fusion Learning for Molecular Representations via Multi-granularity Views [25.7] 分子多量性を組み合わせた多粒性融合法を提案する。
MolFusionは分子レベルのエンコーディングコンポーネントであるMollSimと、原子レベルのエンコーディングコンポーネントであるAtomAlignの2つの重要なコンポーネントで構成されている。
その結果,MolFusionは補完的なマルチモーダル情報を効果的に活用し,性能が大幅に向上した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:26:50 GMT)
CTNeRF: Cross-Time Transformer for Dynamic Neural Radiance Field from Monocular Video [25.6] 複雑でダイナミックなシーンのモノクロ映像から高品質な新しいビューを生成するための新しいアプローチを提案する。
物体の動きの特徴を集約するために,時間領域と周波数領域の両方で動作するモジュールを導入する。
実験により,動的シーンデータセットにおける最先端手法に対する大幅な改善が示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:59:02 GMT)
Adversarial Search Engine Optimization for Large Language Models [25.3] 大規模言語モデル(LLM)は、競合するサードパーティのコンテンツからモデルを選択するアプリケーションで、ますます使われている。
我々は、LLMの選択を操作して攻撃者を支持する新しいタイプの攻撃であるPreference Manipulation Attacksを紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:24:51 GMT)
On Scaling Up 3D Gaussian Splatting Training [25.1] 3DGSは、視覚的品質とレンダリング速度が優れているため、3D再構成でますます人気がある。
現在、3DGSトレーニングは1つのGPU上で行われ、高解像度で大規模な3D再構成タスクを処理する能力を制限する。
Grendelは3DGSパラメータを分割し、複数のGPUを並列化するように設計された分散システムである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:59:28 GMT)
Unifying the Perspectives of NLP and Software Engineering: A Survey on Language Models for Code [24.9] 我々は、70以上のモデル、40以上の評価タスク、180以上のデータセット、900以上の関連する作業を含む、言語モデルによるソフトウェア工学の最近の進歩についてレビューする。
私たちは、コード処理モデルを、GPTファミリで表される一般的な言語モデルと、特にコードで事前訓練された特殊なモデルに分解します。
また、要件エンジニアリング、テスト、デプロイメント、オペレーションを含む他のソフトウェアエンジニアリング活動において、LCMのアプリケーションをプログラミングし、レビューする余地もあります。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:11:00 GMT)
MultiAgent Collaboration Attack: Investigating Adversarial Attacks in Large Language Model Collaborations via Debate [24.9] 大規模言語モデル(LLM)は、個別に作業する場合に、現在のベンチマークで例外的な結果を示す。
パラメータサイズと推論時間の短縮とともに、それらの能力の進歩は、これらのモデルをエージェントとしての使用を促進する。
敵の影響下での議論を通じて協調するモデルのネットワークの挙動を評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:05:20 GMT)
OlympicArena Medal Ranks: Who Is the Most Intelligent AI So Far? [24.7] 我々は、最近リリースされたClaude-3.5-Sonnet、Gemini-1.5-Pro、GPT-4oに焦点を当てている。
本稿では,各種分野にわたる総合的なパフォーマンスに基づいて,初めてオリンピック・メダリスト・テーブルを用いてAIモデルをランク付けする手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:00:04 GMT)
Breaking the Barrier: Enhanced Utility and Robustness in Smoothed DRL Agents [24.7] 本稿では,S-DQNとS-PPOを提案する。これは,標準RLベンチマークにおけるクリーン報酬,経験的ロバスト性,ロバスト性保証の顕著な改善を示す新しいアプローチである。
S-DQNとS-PPOのエージェントは、最強の攻撃を受けた場合の平均的な2.16倍の力強い訓練を受けたエージェントを上回った。
Smoothed Attackも紹介します。これは既存の敵攻撃よりもスムーズなエージェントの報酬を減らすのに効果的です。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:49:03 GMT)
Invertible Consistency Distillation for Text-Guided Image Editing in Around 7 Steps [24.4] 本研究の目的は, 蒸留されたテキストから画像への拡散モデルに, 実画像の潜在空間へのエンコードを効果的に行うことにある。
Invertible Consistency Distillation (iCD) は,高画質な画像合成と高精度な画像符号化を,わずか3~4ステップで実現する,汎用的な一貫性蒸留フレームワークである。
我々は、ダイナミックガイダンスを備えたiCDが、より高価な最先端の代替品と競合して、ゼロショットテキスト誘導画像編集の高効率ツールとして役立つことを実証した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:59:24 GMT)
Case-Based or Rule-Based: How Do Transformers Do the Math? [24.2] 変圧器はルールベースかケースベースの推論を数学問題に用いているかを検討する。
入力に明示的なルールを提供し、次にトランスフォーマーに、ルールを段階的に引用し、従うように指示します。
この大幅な改善は、LLMにルールを明示的に使用するように教えることが、ルールベースの推論を学習し、長さを一般化するのに役立つことを示している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:25:07 GMT)
"Is ChatGPT a Better Explainer than My Professor?": Evaluating the Explanation Capabilities of LLMs in Conversation Compared to a Human Baseline [23.8] 説明は知識共有の基礎を形成し、コミュニケーションの原則、社会的ダイナミクス、学習理論に基づいて構築される。
本研究は、説明者や説明者が会話で採用するさまざまな戦略を理解するための枠組みである説明行為に関する過去の研究を活用し、相手を説明・理解・関与する。
この1年で生成AIが台頭したことにより、LLM(Large Language Models)の能力と、専門家による会話環境における説明能力の強化について、より深く理解したいと思っています。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:33:51 GMT)
WV-Net: A foundation model for SAR WV-mode satellite imagery trained using contrastive self-supervised learning on 10 million images [23.7] 本研究では,1000万近いWVモード画像とコントラスト型自己教師型学習を用いて,WV-Netと呼ばれるセマンティック埋め込みモデルを訓練する。
複数の下流タスクにおいて、WV-Netは、教師あり学習を伴う自然画像に事前訓練された同等のモデルより優れている。
WV-Net埋め込みは教師なしのイメージ検索タスクでは優れており、データスパース設定ではスケールが優れている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:30:41 GMT)
Improving the Consistency in Cross-Lingual Cross-Modal Retrieval with 1-to-K Contrastive Learning [23.5] CCR(Cross-lingual Cross-modal Retrieval)は,Web検索において重要なタスクである。
本稿では,各言語を等しく扱う1対Kのコントラスト学習手法を提案する。
提案手法は,より小規模な事前学習データを用いて,リコール率と平均ランク変動(MRV)の両方を改善する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:04:25 GMT)
Kirchhoff Meets Johnson: In Pursuit of Unconditionally Secure Communication [23.2] 従来の工学では、ノイズとその有害な影響を排除、抑制、戦闘、無視することに集中しています。
ノイズライクなキャリア信号を使って情報を伝達する生物学に似ていますか?
ノイズ(ノイズに似た信号)は、将来、無条件でセキュアな通信システムを実現する手段として提案されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:28:07 GMT)
AdaZeta: Adaptive Zeroth-Order Tensor-Train Adaption for Memory-Efficient Large Language Models Fine-Tuning [23.0] 微調整型大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著なパフォーマンスを実現している。
メモリ効率のゼロ階数法(MeZO)は、前方通過のみを使用してLPMを微調整しようとするため、バックプロパゲーショングラフは不要である。
本稿では,ZO手法の性能と収束性を改善するために,AdaZeta(Adaptive Zeroth-order-Train Adaption)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:33:13 GMT)
PrExMe! Large Scale Prompt Exploration of Open Source LLMs for Machine Translation and Summarization Evaluation [22.7] 大規模言語モデル(LLM)はNLPの分野に革命をもたらした。
本研究では,機械翻訳(MT)および要約データセット上で,オープンソースのLLMベースのメトリクスに対して,720以上のプロンプトテンプレートを評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:56:29 GMT)
Fast Encoder-Based 3D from Casual Videos via Point Track Processing [22.6] そこで我々は,カジュアルビデオから3D構造とカメラの位置を動的コンテンツから推定できる学習ベースのTracksTo4Dを提案する。
TracksTo4Dは、カジュアルなビデオのデータセットに基づいて教師なしの方法で訓練される。
実験により、TracksTo4Dは、最先端の手法に匹敵する精度で、基礎となるビデオの時間点雲とカメラの位置を再構築できることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:09:12 GMT)
MT2ST: Adaptive Multi-Task to Single-Task Learning [22.2] Multi-Task to Single-Task (MT2ST) は単語埋め込み訓練の効率と精度を大幅に向上させる新しい手法である。
実験により,MT2STはシングルタスク学習と比較してトレーニング時間を67%短縮できることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:12:07 GMT)
Exclusive Style Removal for Cross Domain Novel Class Discovery [22.2] 新たなクラスディスカバリ(NCD)は,オープンワールド学習において有望な分野である。
本稿では,基本特徴と異なるスタイル情報を抽出するための排他的スタイル除去モジュールを提案する。
このモジュールは他のNCDメソッドと簡単に統合でき、異なるディストリビューションを持つ新しいクラスのパフォーマンスを向上させるプラグインとして機能する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:44:27 GMT)
Mitigate the Gap: Investigating Approaches for Improving Cross-Modal Alignment in CLIP [22.1] コントラスト言語-画像事前学習は、ゼロショット分類とクロスモーダル視覚言語タスクにおいて顕著に改善されている。
幾何学的な観点から、CLIP埋め込み空間は明らかにモダリティギャップを持つ。
本稿では,AlignCLIPが組込みのクロスモーダルアライメントにおいて顕著な拡張を実現していることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:58:48 GMT)
Scalp Diagnostic System With Label-Free Segmentation and Training-Free Image Translation [21.8] ScalpVisionは,頭皮疾患とアロペシアの全身診断のためのAI駆動型システムである。
有効ヘアセグメンテーションは、従来のヘアマスクラベルが存在しない場合に、擬似画像ラベル対と革新的プロンプト法を用いて達成される。
以上の結果から,ScalpVisionは各種の頭皮疾患やアロペシアの診断に有効であり,皮膚科的治療に有用である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:21:00 GMT)
Towards Compositionality in Concept Learning [21.0] 既存の教師なし概念抽出手法では、構成的でない概念が見つかる。
これらの特性に従う概念を見つけるための合成概念抽出(CCE)を提案する。
CCEは、ベースラインよりも構成的な概念表現を見つけ、下流の4つの分類タスクでより良い精度を得る。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:59:30 GMT)
LayerMerge: Neural Network Depth Compression through Layer Pruning and Merging [20.8] 既存の深度圧縮法では、冗長な非線形活性化関数を除去し、連続する畳み込み層を単一の層にマージする。
これらの手法は、マージされたレイヤのカーネルサイズが大きくなるという重大な欠点に悩まされる。
畳み込み層とアクティベーション関数を併用することにより,この問題に対処できることを示す。
本稿では,どのアクティベーション層と畳み込み層を除去するかを選択するディープ圧縮手法であるLayerMergeを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:28:12 GMT)
Layer-Wise Quantization: A Pragmatic and Effective Method for Quantizing LLMs Beyond Integer Bit-Levels [20.7] 本稿では,大規模言語モデル(LLM)の異なる層を異なるビットレベルで定量化する,シンプルな変数量子化手法を提案する。
具体的には、最も重要な層を高いビット精度に量子化し、低いビットに対して重要でない層を定量化する。
重要度に応じて異なる層を異なるビットで定量化すると、より圧縮されたモデルサイズで性能低下が最小となることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:00:18 GMT)
To smooth a cloud or to pin it down: Guarantees and Insights on Score Matching in Denoising Diffusion Models [20.3] 微分拡散モデル(Denoising diffusion model)は、最近多くの領域で最先端の結果を得た生成モデルのクラスである。
我々は、F"ollmer flow"に似た既知の接続を利用して、F"ollmer drift"の確立されたニューラルネットワーク近似結果を拡張し、拡散モデルとサンプリング器をデノナイズする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:41:36 GMT)
MathOdyssey: Benchmarking Mathematical Problem-Solving Skills in Large Language Models Using Odyssey Math Data [20.3] 大規模言語モデル(LLM)は、非常に高度な自然言語理解を持ち、強力な問題解決能力を示した。
本稿では,新たに開発された"MathOdyssey"データセットを用いて,LLMの数学的問題解決能力について検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:02:35 GMT)
Commonsense Prototype for Outdoor Unsupervised 3D Object Detection [20.2] 本稿では,教師なし3次元物体検出のためのCommonsense Prototype-based Detectorについて紹介する。
CPDは、コモンセンス直観に基づいて、高品質なバウンディングボックスと高密度点を特徴とするコモンセンスプロトタイプ(CProto)を最初に構築する。
CPDは90.85%、平均3D精度は81.01%である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:51:51 GMT)
Learning for Bandits under Action Erasures [20.2] 我々は,学習者が消去チャネル上で分散エージェントにアクションを伝える必要がある,新しいマルチアーム・バンディット(MAB)について考察する。
我々のモデルでは、分散エージェントはアクションが消去されるかどうかを知っているが、中心的な学習者は知らない。
本稿では,既存のMABアルゴリズム上で動作可能な手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:03:00 GMT)
Continual Collaborative Distillation for Recommender System [20.1] 非定常データストリームにおける教師学生KDの運用に関する体系的なアプローチを提案する。
我々は,教師と学生がデータストリームに沿って継続的に協調的に進化する連続的協調蒸留(Continuous Collaborative Distillation, CCD)フレームワークを提案する。
実世界の2つのデータセットにおいて, CCDの有効性を定量的, アブレーション的, 探索的実験により検証した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:21:43 GMT)
On the Role of Visual Grounding in VQA [20.0] VQAの「ビジュアルグラウンド」とは、質問関連画像領域に基づいて回答を推測するモデルの傾向を指す。
DNNベースのVQAモデルは、ショートカット(SC)学習によってVGをバイパスしたことで有名である。
本稿では、VGとReasoningの概念を用いて、VQA推論を記述する新しい理論フレームワーク「Visually Grounded Reasoning」(VGR)を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:57:52 GMT)
Cascading Large Language Models for Salient Event Graph Generation [19.7] CALLMSAEは、SAlient Event Graph生成のためのCAscading Large Language Modelフレームワークである。
まず、LSMにサマリを生成するよう促すことで、サレントイベントを識別する。
我々は、イベント関係グラフを生成するための反復的なコード改善促進戦略を開発する。
LLM生成グラフ上の微調整グラフ生成モデルは、CAEVO生成データに基づいてトレーニングされたモデルよりも優れている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:53:54 GMT)
Deception Detection from Linguistic and Physiological Data Streams Using Bimodal Convolutional Neural Networks [19.6] 本稿では,畳み込み型ニューラルネットワークのマルチモーダルな騙し検出への応用について検討する。
2つのトピックについて104人の被験者にインタビューして構築したデータセットを使用します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:45:32 GMT)
Octo-planner: On-device Language Model for Planner-Action Agents [19.6] Planner-Actionフレームワークは、計画とアクションの実行を2つの異なるコンポーネントに分離する。
Agentはまず、タスクをサブステップのシーケンスに分解してユーザクエリに応答し、アクションエージェントによって実行される。
我々は、文脈内学習の代わりにモデル微調整を採用し、計算コストとエネルギー消費を削減した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:40:10 GMT)
Human-free Prompted Based Anomaly Detection: prompt optimization with Meta-guiding prompt scheme [19.3] 事前学習された視覚言語モデル(VLM)は、数ショットの学習を通じて、様々な下流タスクに高い適応性を持つ。
従来の手法は、特定の異常なタイプの事前の知識を必要とする人為的なプロンプトに依存している。
我々のゴールは、データ駆動方式でプロンプトを最適に学習する、人間の自由なプロンプトベースの異常検出フレームワークを開発することである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:29:05 GMT)
Exploring quantum weight enumerators from the $n$-qubit parallelized SWAP test [19.2] 量子量列挙器と$n$-qubit並列化SWAPテストの接続を構築する。
それぞれのシャドウ列挙子は$n$-qubit並列化SWAPテストの確率と正確に一致することがわかった。
アプリケーションでは、$n$-qubit並列化SWAPテストを用いて量子誤り訂正符号の距離を判定する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:06:40 GMT)
Towards Arbitrary-Scale Histopathology Image Super-resolution: An Efficient Dual-branch Framework via Implicit Self-texture Enhancement [18.9] Inlicit Self-Texture Enhancement-based dual-branch framework (ISTE) を提案する。
ISTEには、まずピクセルの特徴とテクスチャの特徴を学習するテクスチャ学習ブランチと、画素学習ブランチが含まれている。
我々はISTEが既存の固定スケールおよび任意のスケールのアルゴリズムを複数の倍率で上回ることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:47:02 GMT)
Multimodal Physiological Signals Representation Learning via Multiscale Contrasting for Depression Recognition [18.7] 機能近赤外分光法(NIRS)や脳波法(EEG)などの生理的信号に基づく抑うつは大きな進歩を遂げている。
本稿では,抑うつ認識のためのマルチスケールコントラストを用いたアーキテクチャを用いたマルチモーダル生理学的信号表現学習フレームワークを提案する。
刺激タスクに関連する意味表現の学習を強化するために,意味コントラストモジュールを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:54:51 GMT)
ProFLingo: A Fingerprinting-based Intellectual Property Protection Scheme for Large Language Models [18.5] 大規模言語モデル(LLM)のためのブラックボックス指紋認証に基づくIP保護スキームProFLingoを提案する。
ProFLingoは、オリジナルのモデルから特定の応答を引き出すクエリを生成し、ユニークな指紋を確立する。
提案手法は,疑似モデルにおけるこれらのクエリの有効性を評価し,元のモデルから派生したものかどうかを判断する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:22:43 GMT)
MFSN: Multi-perspective Fusion Search Network For Pre-training Knowledge in Speech Emotion Recognition [18.4] 音声感情認識(SER)は人間とコンピュータの相互作用において重要な研究課題である。
我々は,Multi-perspective Fusion Search Network (MFSN)と呼ばれる,SERにおける知識の事前学習のための新しいフレームワークを提案する。
包括性を考慮して、音声知識をテキスト関連感情コンテンツ(TEC)と音声関連感情コンテンツ(SEC)に分割する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:54:14 GMT)
MSR-86K: An Evolving, Multilingual Corpus with 86,300 Hours of Transcribed Audio for Speech Recognition Research [18.3] 本稿では,音声認識研究のための大規模多言語コーパスであるMSR-86Kを紹介する。
コーパスは15の言語と86,300時間の転写されたASRデータからなるYouTube上の公開ビデオに由来する。
MSR-86K は HuggingFace 上で公開され,多言語 ASR 研究のための新たな道が開かれると我々は信じている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:35:12 GMT)
DiarizationLM: Speaker Diarization Post-Processing with Large Language Models [18.3] DiarizationLMは、大きな言語モデル(LLM)を利用して話者ダイアリゼーションシステムから出力を後処理するフレームワークである。
このフレームワークは、市販のASRや話者ダイアリゼーションシステムにも容易に適用できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:49:05 GMT)
ChangeMamba: Remote Sensing Change Detection with Spatio-Temporal State Space Model [18.1] Mambaアーキテクチャは、一連の自然言語処理タスクにおいて顕著なパフォーマンスを示している。
我々は、バイナリ変更検出、セマンティック変更検出、建築損傷評価のために、MambaBCD、MambaSCD、MambaBDAと呼ばれる対応するフレームワークをカスタマイズする。
3つのフレームワークはいずれも最先端のVisual Mambaアーキテクチャをエンコーダとして採用しており、入力画像からグローバルな空間的情報を完全に学習することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:38:29 GMT)
MammothModa: Multi-Modal Large Language Model [18.0] MammothModaは、Multi-modal large language model(MLLM)である。
MammothModaは、例えばLLaVAシリーズのような最先端のモデルを、ベルやホイッスルのない主要な実世界のビジュアル言語ベンチマークで一貫して上回っている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:17:27 GMT)
Med-MoE: Mixture of Domain-Specific Experts for Lightweight Medical Vision-Language Models [17.6] 差別的, 生成的両マルチモーダル医療課題に対処する新しい枠組みを提案する。
Med-MoEの学習は、マルチモーダル医療アライメント、命令チューニングとルーティング、ドメイン固有のMoEチューニングの3つのステップで構成されている。
我々のモデルは最先端のベースラインに匹敵する性能を達成できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:04:51 GMT)
The Multilingual Alignment Prism: Aligning Global and Local Preferences to Reduce Harm [17.6] AIシステムは世界中でますます使われていますが、安全アライメントは均質なモノリンガル設定に重点を置いています。
我々は、グローバルとローカルの害を区別した、人間の注釈付きレッドチームプロンプトの最初のセットを異なる言語で収集する。
汎用性能の低下を最小限に抑えた6言語にまたがる最先端アライメント手法の新たな先例を確立した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:39:08 GMT)
SynRS3D: A Synthetic Dataset for Global 3D Semantic Understanding from Monocular Remote Sensing Imagery [17.4] 単一視点高分解能リモートセンシング(RS)画像からのグローバルセマンティック3D理解は地球観測(EO)に不可欠である
我々は、EOのための特殊な合成データ生成パイプラインを開発し、最大の合成RS3DデータセットであるSynRS3Dを紹介する。
SynRS3Dは69,667個の高解像度光学画像で構成されており、世界中の6つの異なる都市スタイルをカバーし、8種類のランドカバー、正確な高さ情報、建築変更マスクを備えている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:04:42 GMT)
Marathon: A Race Through the Realm of Long Context with Large Language Models [17.3] Marathonは、複数選択の質問フォーマットを採用する新しい評価ベンチマークである。
これは特に、以前のベンチマークの制約を克服するために設計されている。
これは、大規模言語モデルの長文理解スキルの迅速で正確で偏見のない評価を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:48:11 GMT)
Efficient and Accurate Explanation Estimation with Distribution Compression [17.3] 我々は,より効率的かつ正確な説明推定のための新しいパラダイムであるCompress Then Explain (CTE)を紹介した。
CTEはカーネルスライニングによる分散圧縮を用いて、限界分布を最もよく近似するデータサンプルを得る。
2-3倍のサンプル、すなわち2-3倍のモデル評価を必要とするサンプルを用いて、オンパー説明近似誤差をしばしば達成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:21:24 GMT)
Large Language Models in the Clinic: A Comprehensive Benchmark [17.2] 診療所の大規模言語モデル(LLM)をよりよく理解するためのベンチマークであるClimateBenchを構築した。
実世界の実践に近い6つの新しいデータセットと複雑な臨床タスクを構築した。
ゼロショット設定と少数ショット設定の両方で、20個のLDMを広範囲に評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:48:18 GMT)
Weak Reward Model Transforms Generative Models into Robust Causal Event Extraction Systems [17.1] 我々は人的評価を近似するために評価モデルを訓練し、高い合意を得る。
そこで本研究では,アノテートデータの一部を用いて評価モデルを訓練する弱強監督手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:48:14 GMT)
Trimming the Fat: Efficient Compression of 3D Gaussian Splats through Pruning [17.1] 脂肪を磨く」とは、モデルに符号化された余分な情報を除去する、ポストホックな勾配インフォームド・イテレーティブ・プルーニング技術である。
提案手法は,ベースラインモデルと同等の性能を維持しつつ,50$times$圧縮を実現し,最大600FPSの高速化を実現している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:57:55 GMT)
Assessing "Implicit" Retrieval Robustness of Large Language Models [17.0] 様々な大規模言語モデルの「単純」検索頑健性を評価する。
金と気を散らすコンテキストの混合による微調整は、モデルの不正確な検索に対する堅牢性を大幅に向上させる。
これは、大きな言語モデルは、最終回答の監督からのみ学習することで、関連性または無関係な検索コンテキストを暗黙的に扱うことができることを示唆している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:38:24 GMT)
CTS: Sim-to-Real Unsupervised Domain Adaptation on 3D Detection [17.0] クロスドメインオブジェクト検出アルゴリズムは通常、劇的なパフォーマンス低下に悩まされる。
本稿では,ラベル付きシミュレーション(ソース)からラベル付き現実(ターゲット)ドメインへモデルを転送する新しいフレームワークを提案する。
実験結果から,提案手法は3次元物体検出モデルの実領域適応能力を大幅に向上することが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:31:16 GMT)
Retrieval Augmented Zero-Shot Text Classification [16.9] QZeroは、ウィキペディアからサポートカテゴリを検索することでクエリを再構築する、新しいトレーニングフリーな知識増強手法である。
6つの多様なデータセットを対象とした実験により、QZeroは、再トレーニングを必要とせずに、最先端の静的およびコンテキスト埋め込みモデルの性能を向上させることを示した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:04:30 GMT)
VarBench: Robust Language Model Benchmarking Through Dynamic Variable Perturbation [16.9] 本稿では,ベンチマークをバリビライズし,動的に言語モデルを評価することを提案する。
具体的には、各テストケースから変数を抽出し、各変数の値範囲を定義する。
それぞれの評価のために、これらの値から新しい値をサンプリングし、ユニークなテストケースを作成します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:21:49 GMT)
Competitive Algorithms for Online Knapsack with Succinct Predictions [16.8] オンラインのknapsack問題では、異なる値と重みを持つオンラインで到着するアイテムをキャパシティ限定のknapsackにまとめて、受け入れられたアイテムの総価値を最大化する。
この問題に対するテキスト学習強化アルゴリズムについて検討し、機械学習による予測を用いて悲観的な最悪のケースの保証を超えて行動することを目的とする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:38:00 GMT)
Combining Reconstruction and Contrastive Methods for Multimodal Representations in RL [16.8] 再構成や対照的な損失を用いた自己教師型表現の学習は、画像ベース・マルチモーダル強化学習(RL)の性能とサンプルの複雑さを向上させる
ここでは、異なる自己教師付き損失関数は、基礎となるセンサのモジュラリティの情報密度によって異なる利点と制限を有する。
コントラスト的再構成集約表現学習(CoRAL)を提案する。このフレームワークは,各センサのモダリティに対して,最も適切な自己管理的損失を選択することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:28:35 GMT)
Improving Hyperparameter Optimization with Checkpointed Model Weights [16.5] 本研究では,トレーニングした重みのログ化されたチェックポイントを用いたニューラルネットワークのためのHPO法を提案する。
我々の手法である予測モデル探索(FMS)は、重みをガウス過程のディープカーネルサロゲートモデルに埋め込む。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:59:54 GMT)
Single-Model Attribution of Generative Models Through Final-Layer Inversion [16.5] 最終層逆転と異常検出に基づくオープンワールド設定における単一モデル属性に対する新しいアプローチを提案する。
得られた最終層インバージョンを凸ラッソ最適化問題に還元し,理論的に健全で計算効率がよいことを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:31:04 GMT)
An Empirical Study of Unit Test Generation with Large Language Models [16.4] 単体テストは、ソフトウェアコンポーネントの正しさを検証するために、ソフトウェア開発において不可欠な活動である。
LLM(Large Language Models)の出現は、ユニットテスト生成を自動化するための新しい方向性を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:57:03 GMT)
Catching Chameleons: Detecting Evolving Disinformation Generated using Large Language Models [16.4] 我々は,事前学習した言語モデルの一般的な事実チェック機能と協調的に活用するパラメータ効率の高いDLD(Detecting Evolving LLM-Generative Disinformation)を提案する。
実験の結果, TextitDELD は最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:21:39 GMT)
SEED: Accelerating Reasoning Tree Construction via Scheduled Speculative Decoding [16.4] 大きな言語モデル(LLM)は、様々なタスクにまたがる顕著な創発的な能力を示すが、複雑な推論や計画タスクには欠ける。
本稿では,実行速度とGPUメモリ管理を同時に最適化する新しい,効率的な推論フレームワークであるSeeDを紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:33:41 GMT)
Human-AI Collaborative Taxonomy Construction: A Case Study in Profession-Specific Writing Assistants [16.3] LLM(Large Language Models)は、テキストのリビジョンやストーリー生成など、複数の作業において人間を支援する。
本稿では,ドメイン固有書記アシスタントのガイドラインとして,人間とAIの連携による分類学開発手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:25:06 GMT)
Towards Neural Scaling Laws for Foundation Models on Temporal Graphs [16.3] 我々は,85のERC20トークントランザクションネットワークからなる時間グラフの集合であるテンポラルグラフスケーリングデータセットを提案する。
時間グラフ特性予測タスクにおける時間グラフニューラルネットワーク(TGNN)の事前学習による伝達性の評価を行った。
NLPやComputer Visionで観測されるニューラルネットワークのスケーリング法則は、時間グラフ学習にも適用され、より多くのネットワークで事前学習することで、下流のパフォーマンスが向上する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:26:58 GMT)
Human-Aware 3D Scene Generation with Spatially-constrained Diffusion Models [16.3] 従来の自己回帰に基づく3Dシーン生成手法は、複数の物体と入力人間の関節分布を正確に捉えるのに苦労してきた。
本研究では,人間-物体衝突回避機構とオブジェクト-部屋境界制約という2つの空間衝突誘導機構を導入する。
我々のフレームワークは、人間とシーンのインタラクションを正確に行うことで、より自然でわかりやすい3Dシーンを生成することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:18:39 GMT)
AlphaForge: A Framework to Mine and Dynamically Combine Formulaic Alpha Factors [16.3] 本稿では,アルファ因子マイニングと因子組み合わせのための2段階のアルファ生成フレームワークAlphaForgeを提案する。
実世界のデータセットを用いて行った実験により,我々の提案したモデルは,定式的アルファファクターマイニングにおいて,同時代のベンチマークより優れていることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:34:37 GMT)
Towards Zero-Shot Interpretable Human Recognition: A 2D-3D Registration Framework [16.2] 法学・法学の目的(裁判所など)に使える証拠を提供することが重要である。
本稿では,3つの弱点を同時に解決することを目的とした,最初の認識フレームワークと戦略について述べる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:01:55 GMT)
Open-vocabulary Mobile Manipulation in Unseen Dynamic Environments with 3D Semantic Maps [16.1] Open-Vocabulary Mobile Manipulation (OVMM)は、自律ロボットにとって重要な機能である。
ゼロショット検出とグラウンドド認識機能を活用した新しいフレームワークを提案する。
我々は,10-DoFモバイル操作ロボットプラットフォームJSR-1を構築し,実世界のロボット実験で実証した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:06:42 GMT)
Efficient Data Learning for Open Information Extraction with Pre-trained Language Models [15.6] オープン情報抽出(OpenIE)は自然言語処理の基本的な課題である。
本稿では,OpenIEのタスク形式をT5モデルの事前学習タスク形式に変換する新しいフレームワークであるOK-IEを紹介する。
さらに、モデル出力のシーケンスを制御するためのアンカーの革新的な概念を導入し、モデル収束に対するオーダーペナルティの影響を効果的に排除する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:23:10 GMT)
A Context-Driven Approach for Co-Auditing Smart Contracts with The Support of GPT-4 code interpreter [15.3] 本稿では,スマートコントラクト・コオーディティングのためのコンテキスト駆動型プロンプト手法を提案する。
このアプローチでは、コンテキストスコープと拡張のための3つのテクニックを採用し、長いコードを自己完結したコードセグメントに分割するコードスコープを包含する。
本法では,脆弱な機能に対する検出率は96%であり,ネイティブプロンプト法では53%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:14:35 GMT)
An Information Theoretic Perspective on Conformal Prediction [15.2] コンフォーマル予測(CP)は、ユーザが特定した確率で真の答えを含むことが保証される予測セットを構成する。
本研究では,情報理論を利用して共形予測と不確実性の概念を結びつける。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:58:25 GMT)
Mixture of Experts in a Mixture of RL settings [15.1] ネットワークのパラメータ数を拡大し、休眠ニューロンを減らし、MoEsはDeep Reinforcement Learning(DRL)の性能を向上させることができることを示す。
DRL設定におけるMoEsの非定常性対応能力について,マルチタスクトレーニングによる「増幅された」非定常性を用いた検討を行った。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:15:15 GMT)
Implicit Discourse Relation Classification For Nigerian Pidgin [14.9] ナイジェリアのピジン(NP)は1億人近い人々によって話されているが、比較的少ないNLP資源とコーパスを持っている。
我々は、オープンソースのIDRCツールを使用してラベルをバックプロジェクションし、NPのための合成談話コーパスを作成し、PDTBとPDTBラベルをプロジェクションする。
ネイティブ」NP分類を学習する後者のアプローチは、ベースラインを13.27%、f$_1$スコアで33.98%上回っている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:10:15 GMT)
Guarantees in Security: A Philosophical Perspective [14.8] もっとも重要なソフトウェアシステムでさえ、攻撃に弱いことが判明した。
証明可能なセキュリティでさえ、攻撃者がセキュリティ上の欠陥を見つけるのを止めることはできない。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:46:50 GMT)
Mental Modeling of Reinforcement Learning Agents by Language Models [14.7] この研究は、いかに大きな言語モデルがエージェントのメンタルモデルを構築することができるか、初めて実証的に検証する。
本研究は, LLMを用いたRL剤の挙動解明の可能性を明らかにする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:14:45 GMT)
Unlocking the Potential of Operations Research for Multi-Graph Matching [14.4] マルチグラフマッチングはコンピュータビジョンにおいて、例えば画像や形状のマッチングにおいて中心的な役割を果たす。
我々はMDAPのよく知られた近似アルゴリズムを不完全な多重グラフマッチングに転送する。
私たちのアルゴリズムは、2分以内でそれぞれ500以上のキーポイントを持つ29の画像と一致します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:58:05 GMT)
Repeat and Concatenate: 2D to 3D Image Translation with 3D to 3D Generative Modeling [14.3] 本稿では,2次元X線と3次元CTライクな再構成が可能な2次元-3次元画像変換法について,簡単な手法で検討する。
我々は,潜伏空間内の複数の2次元ビューにまたがる情報を統合する既存のアプローチが,潜伏符号化中に貴重な信号情報を失うことを観察する。代わりに,2次元ビューを高チャネルの3次元ボリュームに繰り返して,簡単な3次元から3次元生成モデル問題として3次元再構成課題にアプローチする。
この方法では、再構成された3Dボリュームが、2D入力から貴重な情報を保持でき、Swin Uのチャネル状態間で渡される。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:18:20 GMT)
Large Language Models for Cuffless Blood Pressure Measurement From Wearable Biosignals [14.2] 大規模言語モデル(LLM)を用いてウェアラブルバイオシグナーを分析し,カフレス血圧(BP)測定を行った。
本稿では,ウェアラブルバイオシグナーを用いたカフレスBP推定のためのLCMのキャパシティを初めて検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:54:45 GMT)
Expressive Keypoints for Skeleton-based Action Recognition via Skeleton Transformation [14.0] 我々は,手と足の詳細を組み込んだ表現的キーポイントを提案し,複雑な動作を識別する既存のモデルの識別能力を向上させる。
プラグアンドプレイのインスタンスプールモジュールは、計算コストを増大させることなく、マルチパーソンシナリオにアプローチを拡張するために利用されます。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:48:56 GMT)
Energy-Efficient Channel Decoding for Wireless Federated Learning: Convergence Analysis and Adaptive Design [13.9] 分散学習を無線ネットワークに展開する上で最も重要な課題の1つは、モバイルデバイスのバッテリ容量の制限である。
本稿では,FLの固有ロバスト性を利用したエネルギー効率適応型チャネル復号法を提案する。
実験の結果,提案手法は同じ学習精度を維持しつつ,既存の手法と比較してチャネル復号化エネルギー消費量を20%削減できることがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:59:49 GMT)
Prompting Whole Slide Image Based Genetic Biomarker Prediction [13.8] 本稿では,全スライド画像(WSI)に基づく遺伝的バイオマーカー予測手法を提案する。
我々は、大きな言語モデルを利用して、遺伝バイオマーカーに関連する事例を抽出する際、先行知識となる医学的プロンプトを生成する。
腫瘍微小環境におけるバイオマーカー情報のマイニングには粗大なアプローチを採用する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:05:46 GMT)
Improving Entity Recognition Using Ensembles of Deep Learning and Fine-tuned Large Language Models: A Case Study on Adverse Event Extraction from Multiple Sources [13.8] 副作用イベント(AE)抽出は、免疫の安全プロファイルを監視し解析するために重要である。
本研究では,AE抽出における大規模言語モデル(LLM)と従来のディープラーニングモデルの有効性を評価することを目的とする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:56:21 GMT)
Towards Training-free Open-world Segmentation via Image Prompt Foundation Models [13.7] Image Prompt(IPSeg)は、画像プロンプト技術を利用したトレーニングフリーのパラダイムである。
IPSegは、主観的視覚概念を含む単一のイメージを、視覚基盤モデルをクエリするための柔軟なプロンプトとして利用する。
提案手法は,プロンプト画像と入力画像のロバストな特徴を抽出し,入力表現とプロンプト表現とのマッチングを行う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:30:49 GMT)
UniRec: A Dual Enhancement of Uniformity and Frequency in Sequential Recommendations [13.7] 新たな双方向拡張シーケンシャルレコメンデーション手法であるUniRecを提案する。
UniRecは、一様でないシーケンスと少ない頻度のアイテムの表現を改善している。
我々の知る限り、UniRecは特徴増強のための均一性と周波数の特性を利用する最初の方法である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:28:24 GMT)
Active Preference Inference using Language Models and Probabilistic Reasoning [13.5] 本稿では,大規模言語モデルによるユーザの嗜好の推測を支援する推論時アルゴリズムを提案する。
我々のアルゴリズムは, LLM を誘導することで条件分布が定義される確率モデルを用いている。
実商品を用いた簡易な対話型Webショッピング設定の結果, エントロピー低減アルゴリズムを備えたLCMは, ベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:00:52 GMT)
Jailbreaking LLMs with Arabic Transliteration and Arabizi [13.3] 本研究は,大規模言語モデル(LLM)による'jailbreak'攻撃の潜在的な脆弱性を明らかにする。
我々の調査はアラビア語の調査の範囲を広げる。
アラビア語とその様々な形態を使用することで、隠されたままの情報を公開することができ、脱獄のリスクが高まる可能性がある。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:48:48 GMT)
A Large-scale Investigation of Semantically Incompatible APIs behind Compatibility Issues in Android Apps [13.2] Android Open Source Project(AOSP)において、互換性のないAPIを大規模に発見する。
非互換なAPI,特にセマンティックな変更を検出するための統合フレームワークを提案する。
提案手法は,バージョン4からバージョン33までの互換性のない5,481のAPIを検出する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:29:56 GMT)
Learning in RKHM: a $C^*$-Algebraic Twist for Kernel Machines [13.2] カーネルヒルベルト空間(RKHS)とベクトル値RKHS(vvRKHS)の再現学習は30年以上にわたって研究されてきた。
我々は、RKHSとvvRKHSの教師あり学習をカーネルHilbert $C*$-module (RKHM) の再生に一般化することで、新しいツイストを提供する。
我々は、$C*$-algebraの観点から、有効正定値カーネルを構築する方法を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:29:54 GMT)
On the Impact of Voice Anonymization on Speech Diagnostic Applications: a Case Study on COVID-19 Detection [13.2] 話者のプライバシーとアイデンティティを維持するために、音声匿名化への関心が高まっている。
しかし、感情コンピューティングや疾患モニタリングのアプリケーションにとって、パラ言語的コンテンツはより重要かもしれない。
我々は3つの匿名化手法と、5つの異なる最先端の新型コロナウイルス診断システムへの影響を検証した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:58:42 GMT)
InstructTA: Instruction-Tuned Targeted Attack for Large Vision-Language Models [13.2] 大規模視覚言語モデル(LVLM)は、画像理解と応答生成において、その驚くべき能力を示した。
本稿では,被害者LVLMの視覚エンコーダのみを敵が知ることのできる,新規で実用的な攻撃シナリオを定式化する。
本研究では,LVLMに対して高い転送性を有する目標対向攻撃を実現するために,命令調整型ターゲットアタック(dubed textscInstructTA)を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:29:50 GMT)
AND: Audio Network Dissection for Interpreting Deep Acoustic Models [13.0] $textitAND$は、高応答性オーディオに基づいて、音響ニューロンの自然言語説明を自動的に確立するフレームワークである。
さらに、オーディオマシンのアンラーニングに$textitAND$を使用する可能性を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:36:53 GMT)
Reinforcement Learning with Intrinsically Motivated Feedback Graph for Lost-sales Inventory Control [12.8] 強化学習(Reinforcement Learning, RL)は, インベントリコントロール(IC)領域において, 優れた性能と汎用性があることが証明されている。
オンライン体験は、現実世界のアプリケーションで入手するのに費用がかかる。
オンライン体験は、ICの典型的な失業現象による真の需要を反映していない可能性がある。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:52:47 GMT)
A Lung Nodule Dataset with Histopathology-based Cancer Type Annotation [12.6] 本研究は,医療診断用データセットと信頼性ツールを提供することにより,このギャップを埋めることを目的としている。
330個の注記結節(結節は束縛箱とラベル付けされている)を95名の別患者から抽出し,CT画像の多彩なデータセットを収集した。
これらの有望な結果は、データセットが実現可能であり、さらにインテリジェントな補助診断を容易にすることを証明している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:39:11 GMT)
VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges [12.6] VIPriors: Visual Inductive Priors for Data-Efficient Deep Learning”ワークショップの第4版では、2つのデータ不足の課題が紹介されている。
これらの課題は、限られたデータでコンピュータビジョンタスクのディープラーニングモデルをトレーニングする際の問題に対処する。
深層学習モデルのデータ効率を向上させるために,帰納的バイアスを取り入れた新しい手法の開発を促進することを目的としている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:50:51 GMT)
JailbreakZoo: Survey, Landscapes, and Horizons in Jailbreaking Large Language and Vision-Language Models [12.3] 大規模言語モデル(LLM)と視覚言語モデル(VLM)は、セキュリティと倫理的整合性に関する懸念を提起する。
今回の研究は、ジェイルブレイクを7つの異なるタイプに分類し、これらの脆弱性に対処する防衛戦略を精査する。
我々の発見は、次世代の言語モデルのための堅牢でセキュアで信頼性の高い環境を育むために、ジェイルブレイク戦略と防御ソリューションの両方を統合する統一的な視点の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:20:23 GMT)
Token-Weighted RNN-T for Learning from Flawed Data [12.3] トークン固有の重みでRNN-T目標を増大させるトークン重み付きRNN-T基準を提案する。
トークン重み付きRNN-Tは,この劣化を克服するのに適しており,精度損失の64%~99%を回復することを示した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:48:11 GMT)
Multimodal foundation world models for generalist embodied agents [12.3] 強化学習(RL)は、タスクごとに複雑な報酬設計を必要とするため、スケールアップが難しい。
現在の基盤視覚言語モデル(VLM)は、機能するためには細調整やその他の適応が必要である。
本稿では、基礎VLMの表現とRL生成世界モデルの潜在空間を接続・整合できる多モード基礎世界モデルを提案する。
結果として得られるエージェント学習フレームワークであるGenRLは、視覚移動や言語プロンプトを通じてタスクを指定し、それを具体化されたドメインのダイナミクスに固定し、それに対応する振る舞いを想像力で学習する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:41:48 GMT)
Key-Element-Informed sLLM Tuning for Document Summarization [12.1] 文書中のキー要素を識別し,これらのキー要素をキャプチャする要約を生成するためのsLLMを指示する,KEITSumと呼ばれるキー要素インフォームド命令チューニングを提案する。
対話とニュースデータセットの実験結果から,KEITSumを用いたsLLMは高い関連性と幻覚の少ない高品質な要約を実現し,プロプライエタリなLLMと競合することを示した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:22:11 GMT)
A Survey on Mixture of Experts [11.8] モデルキャパシティを最小限のオーバーヘッドでスケールアップする有効な方法として、専門家(MoE)の混在が現れた。
MoEは、最小限のオーバーヘッドでモデルキャパシティを実質的にスケールアップする効果的な方法として登場した。
この調査は、このギャップを埋めることを目指しており、MoEの複雑さを探求する研究者にとって不可欠なリソースとなっている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:34:33 GMT)
Neuromorphic Visual Scene Understanding with Resonator Networks [11.7] 3つの重要な概念を生かしたニューロモルフィックな解を提案する。
このフレームワークは、複雑な値のベクトルを持つベクトルアーキテクチャに基づいている。
ネットワークは、視覚シーンにおける非可換変換と回転を分解する。
機械ビジョンとロボット工学の現実的な応用シナリオにおいて、同種のアプローチを実証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:16:08 GMT)
Quantum Resources Required for Binding Affinity Calculations of Amyloid beta [11.7] アミロイドベータ(英: Amyloid beta)は、アルツハイマー病のような神経変性疾患において重要な役割を担っているが、十分に理解されていない。
アミロイドベータの鍵となる特徴は、鉄や銅のような特定の金属中心への結合親和性である。
量子コンピュータはそのような計算を加速する可能性があるが、必要な量子資源を理解することが重要である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:19:14 GMT)
Beyond Statistical Estimation: Differentially Private Individual Computation in the Shuffle Model [11.7] 本研究は,非統計計算におけるシャッフル・プライバシ・アンプリフィケーションの実現可能性について検討する。
本稿では、メッセージ認証や結果アクセス制御といった重要なセキュリティ機能を提供できるシャッフルモデルの新たなパラダイムを提案する。
我々のパラダイムとメカニズムは、最大90%のエラーを減らし、実用性能を100%-300%向上させながら、非プライベートな設定として高速であることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:53:48 GMT)
FedAQ: Communication-Efficient Federated Edge Learning via Joint Uplink and Downlink Adaptive Quantization [11.7] Federated Learning(FL)は、クライアントのデータプライバシを保護すると同時に、クライアントのデータと計算リソースを活用する強力な機械学習パラダイムである。
従来の研究は主にアップリンク通信に重点を置いており、固定ビット量子化法や適応量子化法を用いている。
本研究では,通信オーバヘッドを低減するために,結合アップリンクとダウンリンク適応量子化による包括的アプローチを導入する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:14:23 GMT)
Minimal Interaction Edge Tuning: A New Paradigm for Visual Adaptation [11.7] 我々は、エッジチューニングと呼ばれる新しいビジュアル適応パラダイムを探求し、大規模な事前訓練されたモデルを、強力なクラウドサーバ上で動作するスタンドアロンの機能抽出器として扱う。
この微調整は、少ない計算資源を必要とする小さなネットワークを持つエッジデバイス上で実行される。
そこで本研究では,事前学習したモデルから得られた中間的特徴の総和が最小限の情報伝達と高適応性を有することを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:23:32 GMT)
Truthful Aggregation of LLMs with an Application to Online Advertising [11.6] 大規模言語モデル(LLM)は、オンラインプラットフォームのサービスに統合されている。
これにより、LLM生成コンテンツから収益を生み出すことが、オンライン広告における次の大きな課題となる。
LLM微調整なしで動作可能な,この問題に対するオークション機構を導入する。
当社のメカニズムは,計算オーバーヘッドの少ない広告主の価値とプラットフォーム収益を著しく向上させることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:29:32 GMT)
Geometric Features Enhanced Human-Object Interaction Detection [11.5] 我々は、新しいエンドツーエンド変換方式HOI検出モデル、すなわち幾何学的特徴強化HOI検出器(GeoHOI)を提案する。
モデルの1つの重要な部分は、UniPointNetと呼ばれる新しい統合された自己教師付きキーポイント学習方法である。
GeoHOIはトランスフォーマーをベースとしたHOI検出器を効果的にアップグレードする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:52:53 GMT)
Exploring Energy-Based Models for Out-of-Distribution Detection in Dialect Identification [11.4] 本研究は, 方言のOOD検出に特化して, 新たなマージン強化ジョイントエネルギーモデル(MEJEM)を提案する。
生成モデルとエネルギーマージン損失を統合することにより,方言識別システムの堅牢性を高めることを目的とする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:52:48 GMT)
BiTrack: Bidirectional Offline 3D Multi-Object Tracking Using Camera-LiDAR Data [11.2] BiTrackは2D-3D検出融合、初期軌道生成、双方向軌道再最適化のモジュールを含む3D OMOTフレームワークである。
KITTIデータセットを用いた実験結果から,BiTrackは3次元OMOTタスクの最先端性能を精度と効率で達成できることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:09:54 GMT)
AutoProSAM: Automated Prompting SAM for 3D Multi-Organ Segmentation [11.1] Segment Anything Model (SAM)は、画像セグメンテーションのための先駆的なプロンプトベースの基礎モデルの一つである。
臨床環境では、効果的なプロンプトを作成することは困難であり、ドメインスペシャリストの専門知識を必要とする。
本稿では,これらの課題を克服するため,AutoProSAMと呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:25:03 GMT)
Decoding with Limited Teacher Supervision Requires Understanding When to Trust the Teacher [11.1] sLLMはどのようにしてLLMの監督を効果的に活用し、その生成品質を向上するか?
我々は,初期トークン上でのsLLMとLLM予測を効果的に集約し,sLLMによるトークン生成をより正確に条件付けるアルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:16:12 GMT)
EmT: A Novel Transformer for Generalized Cross-subject EEG Emotion Recognition [11.0] 感情トランス(EmT)と呼ばれる新しいトランスモデルを導入する。
EmTは、一般化されたクロスオブジェクトEEG感情分類と回帰タスクの両方において優れているように設計されている。
4つの公開データセットの実験により、EmTは脳波の感情分類と回帰タスクの両方のベースラインメソッドよりも高い結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:42:11 GMT)
Stabilizing Policy Gradients for Stochastic Differential Equations via Consistency with Perturbation Process [11.0] 我々は、ディープニューラルネットワークパラメータ化微分方程式(SDE)の最適化に焦点をあてる。
我々は、SDEが関連する摂動過程と整合するように制約することを提案する。
我々のフレームワークは、SDEを効果的かつ効率的に訓練するためのポリシー勾配法を多目的に選択する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:28:07 GMT)
Space-Efficient and Noise-Robust Quantum Factoring [11.0] 我々はRegevの最近の量子ファクタリングアルゴリズム(arXiv:2308.06572)を改善する。
我々は独立に$approx sqrtn$ timesを実行し、Regevの古典的な後処理手順を適用する。
第二の貢献は、レゲフの古典的な後処理手順が量子回路の一定の部分の誤りを許容するために修正可能であることを示すことである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:29:33 GMT)
Outlier-Efficient Hopfield Layers for Large Transformer-Based Models [11.0] Outlier-Effient Modern Hopfield Model (termed $mathrmOutEffHop$)を導入する。
我々の主な貢献は、テクティトゥーラ効率の良い連想記憶検索を容易にする新しい連想記憶モデルである。
$mathrmOutEffHop$は平均カルトシスで平均22%、モデル出力の最大無限ノルムで26%の減少を達成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:50:18 GMT)
Routing in Quantum Repeater Networks with Mixed Efficiency Figures [11.0] 本研究では、量子ネットワークにおけるルーティングのアプローチを探求し、現実世界の古典的ネットワークをミラーリングする。
我々は、より効率のよいノードの分数など、運用量子ネットワークにおけるいくつかの重要なパラメータに焦点を当てる。
シミュレーションにより、ノード品質の知識を取り入れることで、ルーティングパスの一部の忠実度を高めるだけでなく、量子ネットワークにおけるブロックパスの数を減少させることが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:58:51 GMT)
Assessing Annotation Accuracy in Ice Sheets Using Quantitative Metrics [10.8] 本研究は,氷床アノテーション手法の検証を目的とした定量的指標スイートを導入することで,正確な氷床データ解釈の必要性に対処する。
本手法は,氷層アノテーションの連続性と接続性を評価するために,伝統的に氷河学研究で利用されていないいくつかのコンピュータビジョンメトリクスを取り入れている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:43:51 GMT)
Grammar Assistance Using Syntactic Structures (GAUSS) [10.5] 本稿では,豊かな言語形式に依存したスペイン語の文法コーチングシステムを提案する。
このアプローチは、コンピュータ化された文法が存在する任意の言語に対して実現可能である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:35:10 GMT)
A Refer-and-Ground Multimodal Large Language Model for Biomedicine [10.5] Med-GRIT-270kデータセットは、バイオメディカルドメインに初めて専用のデータセットであり、参照と地上の会話を統合している。
本稿では,このデータセットとマルチタスク・インストラクション・ラーニングを用いて,バイオメディシンのためのRefer-and-Ground Multimodal Large Language Model(BiRD)を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:56:17 GMT)
Reinforcement Learning from Delayed Observations via World Models [10.3] 強化学習環境では、エージェントはそれらを取るとすぐに行動の効果についてのフィードバックを受ける。
実際には、この仮定は物理的制約のために当てはまらない可能性があり、学習アルゴリズムの性能に大きな影響を及ぼす可能性がある。
本稿では、過去の観測と学習のダイナミクスを統合することに成功している世界モデルを活用して、観測遅延を処理することを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:44:18 GMT)
Methodology of Adapting Large English Language Models for Specific Cultural Contexts [10.2] 本稿では,特定の文化的文脈における大規模モデルの迅速な適応手法を提案する。
適応LLMは、ドメイン固有の知識と安全性値への適応性において、その能力を著しく向上させる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:16:08 GMT)
Sample Complexity of Locally Differentially Private Quantum Hypothesis Testing [10.1] 異なる設定に対して、達成可能性と逆バウンダリを提供します。
これには、様々なレジームにおける対称状態の識別と非対称ケースが含まれる。
この取り組みにおける重要なツールは、私たちが独立した関心を持つと信じている新しいエントロピーの不平等である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:00:19 GMT)
Towards Large Language Model Aided Program Refinement [10.1] プログラムの洗練には、正式なハイレベルな仕様文から実行可能なプログラムへの正当性保存の変換が含まれる。
大型言語モデル(LLM)は、非公式な自然言語仕様から自動コード生成を可能にする。
LLM4PRは,形式的プログラム改善手法と非公式なLCMベースの手法を組み合わせたツールである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:29:27 GMT)
Scaling Painting Style Transfer [10.1] ニューラル・スタイル・トランスファー(Neural Style Transfer, NST)は、スタイル・イメージからコンテンツ・イメージへ、前例のないほどリッチなスタイル・トランスファーを生成する技術である。
本稿では,超高解像度(UHR)画像に対するグローバル最適化の解法を提案する。
このような高精細な絵画スタイルに対して,本手法が不整合品質のスタイル転送を実現することを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:59:56 GMT)
ReLU Neural Networks with Linear Layers are Biased Towards Single- and Multi-Index Models [10.0] この原稿は、2層以上の深さのニューラルネットワークによって学習された関数の性質が予測にどのように影響するかを考察している。
我々のフレームワークは、すべて同じキャパシティを持つが表現コストが異なる、様々な深さのネットワーク群を考慮に入れている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:29:56 GMT)
Visual Odometry with Neuromorphic Resonator Networks [9.9] 視覚オドメトリー(英語: Visual Odometry, VO)は、視覚センサを用いた移動ロボットの自走を推定する手法である。
ニューロモルフィックハードウェアは多くのビジョンとAI問題に対する低消費電力のソリューションを提供する。
本稿では,2次元VOタスクにおける最先端性能を実現するモジュール型ニューロモルフィックアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:17:08 GMT)
WavRx: a Disease-Agnostic, Generalizable, and Privacy-Preserving Speech Health Diagnostic Model [9.7] WavRxは、普遍的な音声表現から呼吸と調音関連ダイナミクスをキャプチャする音声健康診断モデルである。
我々は,WavRxヘルス埋め込みに係わる話者アイデンティティの量は,トレーニング中に追加指導なしで有意に減少することを示した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:59:21 GMT)
Poisoned LangChain: Jailbreak LLMs by LangChain [9.7] 本稿では,間接的ジェイルブレイクの概念を提案し,LangChain経由でRetrieval-Augmented Generationを実現する。
我々はこの手法を,ジェイルブレイク問題の3つの主要なカテゴリにわたる6つの大言語モデルで検証した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:21:02 GMT)
3D Feature Distillation with Object-Centric Priors [9.6] CLIPのような2Dビジョン言語モデルは、2Dイメージのオープン語彙グラウンドディングに優れた機能を備えているため、広く普及している。
最近の研究は、特徴蒸留によって2D CLIP機能を3Dに高めることを目的としているが、シーン固有のニューラルネットワークを学ぶか、室内のスキャンデータにフォーカスする。
提案手法は, 3次元CLIPの特徴を再構築し, 接地能力と空間的整合性を改善した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:16:49 GMT)
Blockchain Based Zero-Knowledge Proof of Location in IoT [9.6] ユーザのプライバシーをよりよく保護するために,ゼロ知識による位置証明(zk-PoL)プロトコルを提案する。
評価の結果,zk-PoLは主攻撃に対して優れたセキュリティを有することがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:30:56 GMT)
Decentralized Semantic Traffic Control in AVs Using RL and DQN for Dynamic Roadblocks [9.5] 車両自体にセマンティックエンコーディングの責務を委譲するセマンティックトラフィック制御システムを提案する。
このシステムは、強化学習(RL)エージェントから得られる意思決定を処理し、意思決定プロセスの合理化を行う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:12:48 GMT)
AlignedCut: Visual Concepts Discovery on Brain-Guided Universal Feature Space [9.3] 視覚データ,深層ネットワーク,脳間の興味深い関連性について検討する。
本手法は,脳のボクセルfMRI応答予測をトレーニングの目的とするユニバーサルチャネルアライメントを生成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:38:16 GMT)
Molecular Diffusion Models with Virtual Receptors [9.2] 本稿では,構造に基づく医薬品設計への拡散に基づくアプローチを拡張する手法を提案する。
まず、薬物分子とターゲット/受容体の間のサイズ格差に対処し、学習をより困難にし、推論を遅くする。
私たちは、この受容体の圧縮版である仮想レセプター(Virtual Receptor)の概念を通して実現しています。
第2に、タンパク質の折り畳みの文脈で使われるタンパク質言語の埋め込みを組み込んだ。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:18:42 GMT)
Detecting Brittle Decisions for Free: Leveraging Margin Consistency in Deep Robust Classifiers [9.1] ディープラーニングモデルの意思決定は、知覚できない摂動に敏感である。
敵攻撃を使用してインスタンス単位でモデルの脆弱性を評価することは、リアルタイムのデプロイメントシナリオには計算集約的であり、適さない。
本稿では,脆弱な試料の効率的な検出のためのマージン整合性の概念を紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:00:35 GMT)
SC-MoE: Switch Conformer Mixture of Experts for Unified Streaming and Non-streaming Code-Switching ASR [9.1] SC-MoE というスイッチコンフォーマーベースの MoE システムを提案する。
我々は,マンダリン,英語,空白に対応する3つの言語専門家からなるストリーミングMoE層を設計する。
テキストに埋め込まれた言語情報をさらに活用するために、SC-MoEのデコーダにMoE層を組み込む。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:32:59 GMT)
SoK: Web Authentication in the Age of End-to-End Encryption [9.1] E2EEメッセージングとバックアップサービスは、使用可能な認証に新たな課題をもたらしている。
パスワードなし認証(パスキー)は、パスワードを完全に置き換える有望な候補となっている。
E2EE認証は、ニッチなE2EE愛好家のグループだけでなく、一般大衆にとっても急速に重要になっている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:23:58 GMT)
Are AI-Generated Text Detectors Robust to Adversarial Perturbations? [9.0] AI生成テキスト(AIGT)の現在の検出器は、敵の摂動に対する堅牢性を欠いている。
本稿では,既存のAIGT検出手法の堅牢性について検討し,新しい検出器であるシームズキャリブレーション・リコンストラクション・ネットワーク(SCRN)を導入する。
SCRNは、テキストからのノイズの追加と除去に再構成ネットワークを使用し、局所的な摂動に対して堅牢な意味表現を抽出する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:43:56 GMT)
A Survey of Generative AI for de novo Drug Design: New Frontiers in Molecule and Protein Generation [8.9] デ・ノボの医薬品設計のための生成モデルは、スクラッチから完全に新規な生物学的化合物の創出に焦点を当てている。
この分野の急速な発展と創薬プロセスの複雑さが組み合わさって、新しい研究者が参入するのは難しい風景を生み出している。
本調査では,ド・ノボの薬物設計を小分子とタンパク質生成という2つの大まかなテーマにまとめる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:03:21 GMT)
CDQuant: Accurate Post-training Weight Quantization of Large Pre-trained Models using Greedy Coordinate Descent [8.9] 大規模言語モデル(LLM)は、最近、様々な言語タスクで顕著なパフォーマンスを示した。
ポストトレーニング量子化(PTQ)法である最近のGPTQアルゴリズムは,LLMの圧縮に極めて有効であることが証明されている。
我々は、GPTQの単純でスケーラブルな代替品であるCDQuantを導入し、性能を改善した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:44:42 GMT)
Transferable Reward Learning by Dynamics-Agnostic Discriminator Ensemble [8.9] 専門家によるデモンストレーションから報酬関数を復元することは、強化学習における根本的な問題である。
本研究では、状態行動と状態のみの報酬関数の両方を学習できる動的非依存型識別器・アンサンブル報酬学習法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:24:26 GMT)
Improving Local Training in Federated Learning via Temperature Scaling [8.8] そこで本研究では,ロジット・チル化手法を利用したフェデレーション学習のための新しいモデルトレーニング手法FLex&Chillを提案する。
我々は,グローバルフェデレーション学習モデルの収束時間において最大6倍の改善を観察し,推論精度を最大3.37%改善した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:16:46 GMT)
Conformalized Link Prediction on Graph Neural Networks [8.8] グラフニューラルネットワーク(GNN)は様々なタスクに優れていますが、高い領域でのその応用は信頼性の低い予測によって妨げられます。
本稿では,GNNに基づくリンク予測の統計的保証を伴う予測区間を構築するために,分布自由かつモデルに依存しない不確実性定量化手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:17:37 GMT)
A Zero Auxiliary Knowledge Membership Inference Attack on Aggregate Location Data [8.8] 位置データを集約するZero Auxiliary Knowledge (ZK) MIAを開発した。
これにより、実際の個々のトレースの補助データセットが不要になる。
ZK MIAは、敵が目標の位置情報のごく一部しか知らない場合でも有効であることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:14:36 GMT)
Unveiling the Unknown: Conditional Evidence Decoupling for Unknown Rejection [8.8] 不足したトレーニングサンプルの条件下でのオープンセットオブジェクト検出器のトレーニングに重点を置いている。
この挑戦的なシナリオでは、未知の判断境界は学習が困難であり、しばしば曖昧である。
我々は,未知の拒絶に対して条件付き証拠を分離する,新しいオープンセットオブジェクト検出フレームワークを開発した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:48:24 GMT)
Detecting Machine-Generated Texts: Not Just "AI vs Humans" and Explainability is Complicated [8.8] そこで本研究では,新たな3次テキスト分類手法を導入し,いずれの情報源にも起因する可能性のあるテキストの「未決定」カテゴリを追加する。
この研究は、単に分類から機械が生成したテキストの説明へとパラダイムをシフトさせ、ユーザーに対して明確で理解可能な説明を提供するための検出器の必要性を強調した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:11:47 GMT)
Speakers Unembedded: Embedding-free Approach to Long-form Neural Diarization [8.7] 本研究では,話者埋め込みを別途行わずに,EENDを局所的かつグローバルに長大な音声に適用する新しいフレームワークを提案する。
このアプローチは、コールホーム・アメリカン・イングリッシュとRT03-CTSデータセットにおける従来の1パスEENDよりも13%と10%の大幅な削減を実現している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:32:16 GMT)
Documenting Ethical Considerations in Open Source AI Models [8.5] 本研究では,開発者がオープンソースAIモデルの倫理的側面を実際にどのように文書化しているかを検討する。
2,347の文書の最初の集合をフィルタリングした後、265の関連文書を特定した。
モデル行動リスク、モデルユースケース、モデルリスク軽減の6つのテーマが浮かび上がっています。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:02:44 GMT)
PianoBART: Symbolic Piano Music Generation and Understanding with Large-Scale Pre-Training [8.5] PianoBARTは、BARTを象徴的なピアノ音楽の生成と理解の両方に使用する事前訓練されたモデルである。
我々は,PanoBARTの事前学習タスクに対して,情報漏洩や損失を防止できる多レベルオブジェクト選択戦略を考案した。
実験により、ピアノBARTは効率よく音楽パターンを学習し、高品質なコヒーレントな作品を生成する際、優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:35:54 GMT)
Unveiling and Controlling Anomalous Attention Distribution in Transformers [8.5] ウェイバー現象は、要素が情報への貢献に影響を与えることなく過剰な注意を吸収することを可能にする。
特定のモデルでは、位置符号化と注意パターンの違いにより、モデルによるウェイブラー要素の選択は2つの方法に分類できることがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:53:35 GMT)
Facial Image Feature Analysis and its Specialization for Fréchet Distance and Neighborhoods [8.4] 画像と画像データセット間の距離を評価することは、視覚に基づく研究の基本的な課題である。
批判にもかかわらず、最もユビキタスな方法はFr'echet Inception Distanceである。
本稿では,Fr'echet 距離と画像近傍の領域の特殊化に関する知見と知見を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:27:26 GMT)
RetroGFN: Diverse and Feasible Retrosynthesis using GFlowNets [8.3] 単段階の逆合成は、標的分子の生成につながる一連の反応を予測することを目的としている。
本稿では,限られたデータセットの外部を探索し,多様な実行可能な反応を返却できる新しいモデルRetroGFNを提案する。
RetroGFNは,既存のラウンドトリップ精度の手法よりも高い性能を保ちながら,標準的なトップk精度で競合する結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:10:03 GMT)
BADGE: BADminton report Generation and Evaluation with LLM [8.3] 我々は,この目的のためにLarge Language Model (LLM) を用いて設計した BADGE という新しいフレームワークを紹介する。
本手法は,レポート生成とレポート評価の2つの主要なフェーズから構成される。
GPT-4による評価結果と人的判断結果との比較では,GPT-4による報告が好まれる傾向が見られた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:07:52 GMT)
Boundary Detection Algorithm Inspired by Locally Linear Embedding [8.3] 本稿では,広く使用されている局所的線形埋め込みアルゴリズムにインスパイアされた境界点検出手法を提案する。
本手法は,2つの近傍探索スキーム($epsilon$-radius ball scheme)と$K$-nearest neighbor scheme($K$-nearest neighbor scheme)を用いて実装する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:05:57 GMT)
Mixed-state quantum anomaly and multipartite entanglement [8.1] 混合状態絡み合いと't Hooft anomaly'との間に驚くべき関連性を示す。
非自明な長距離多粒子交絡を伴う混合状態の例を生成する。
また、強い対称性と弱い対称性の両方を含む混合異常についても簡潔に論じる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:25:30 GMT)
MALSIGHT: Exploring Malicious Source Code and Benign Pseudocode for Iterative Binary Malware Summarization [8.0] バイナリマルウェアの記述を生成できる新しいコード要約フレームワークMALSIGHTを提案する。
具体的には、LSMを用いて、最初のマルウェア要約であるMalSとMalPを構築し、このデータセットを人間の努力で手作業で洗練する。
3つのデータセットの実験は、提案したMALSIGHTの有効性を示している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:21:09 GMT)
Learning pure quantum states (almost) without regret [8.0] 学習者は、未知の純粋量子状態にシーケンシャルなオラクルアクセスを持つ。
学習者の目標は、予想される累積的後悔をT$ラウンドで最小化することである。
累積的後悔は,新しいトモグラフィーアルゴリズムを用いて$Theta(operatornamepolylog T)$とスケールすることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:13:50 GMT)
Lazy Safety Alignment for Large Language Models against Harmful Fine-tuning [7.9] 安全アライメントを備えた大規模言語モデル(LLM)は、有害なデータと混在するデータセットを微調整することで、脱獄することができる。
調整段階の状態を分離して、アライメントとユーザデータセットを最適化することで、脱獄効果を緩和できることを示す。
textbfLazy(textbfi) textbfalignment(textbfLisa)を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:54:59 GMT)
Automated Clinical Data Extraction with Knowledge Conditioned LLMs [7.9] 大規模言語モデル(LLM)は、レポート中の構造化されていないテキストの解釈に有効であるが、ドメイン固有の知識の欠如により幻覚することが多い。
In-context Learning (ICL) を通じて生成された内部知識を外部知識と整合させる新しい枠組みを提案する。
本フレームワークでは,検索した内部知識および外部知識の関連単位を抽出し,抽出した内部知識規則の真偽と有用性を評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:49:28 GMT)
Sequential Disentanglement by Extracting Static Information From A Single Sequence Element [7.6] 基本的な表現学習タスクの1つは、教師なしのシーケンシャルな絡み合いである。
本稿では,情報漏洩を軽減し,簡易かつ効果的な減算帰納入バイアスを提供することにより,情報漏洩を緩和する新規かつ簡易なアーキテクチャを提案する。
いくつかの強力なベースラインと比較して、生成および予測タスクにおける最先端結果以上の結果を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:32:47 GMT)
Combining Automated Optimisation of Hyperparameters and Reward Shape [7.4] 本稿では,ハイパーパラメータと報酬関数を組み合わせた最適化手法を提案する。
近似ポリシー最適化とソフト・アクター・クリティカルを用いた広範囲な実験を行った。
以上の結果から,統合最適化は環境の半分のベースライン性能よりも有意に向上し,他の環境との競争性能も向上することが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:23:54 GMT)
Quantum Lower Bounds by Sample-to-Query Lifting [7.3] 本稿では,量子サンプル対クエリリフト定理を用いて,量子クエリの下限を証明するための新しい手法を提案する。
位相/振幅推定やハミルトニアンシミュレーションなど,いくつかの既知の下界に対する統一的な証明を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:11:04 GMT)
A Survey on Human-AI Teaming with Large Pre-Trained Models [7.3] HAIチーム(Human-AI Teaming)は、問題解決と意思決定のプロセスを進めるための基盤として登場した。
大規模事前訓練モデル(LPtM)の出現は、この景観を大きく変えた。
複雑なパターンを理解し予測するために大量のデータを活用することで、前例のない機能を提供します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:44:48 GMT)
Fast Learnings of Coupled Nonnegative Tensor Decomposition Using Optimal Gradient and Low-rank Approximation [7.3] 交互勾配法(CoNCPD-APG)により最適化された新しい非負のCANDECOMP/PARAFAC分解アルゴリズムを提案する。
提案手法は,低ランク近似をCONCPD-APG法と組み合わせることで,分解品質を損なうことなく計算負担を大幅に削減することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:25:49 GMT)
An unsupervised approach towards promptable defect segmentation in laser-based additive manufacturing by Segment Anything [7.2] 我々は、最先端のビジョントランスフォーマー(ViT)ベースのファンデーションモデルを用いて、画像セグメンテーションのためのフレームワークを構築する。
我々は、ラベル付きデータを使わずに高精度に学習し、迅速なチューニングプロセスを導出する。
我々は、現在のレーザー添加物製造プロセスに革命をもたらす可能性のある、リアルタイムな異常検出パイプラインの構築を構想する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:41:37 GMT)
How Good are LLMs at Relation Extraction under Low-Resource Scenario? Comprehensive Evaluation [7.2] 本稿では,3地域(中央アジア,東南アジア,中東)の低リソース言語10言語(LRL)における低リソース関係抽出データセットを構築する。
コーパスは、有効な多言語機械翻訳を使用して、オリジナルの公開可能な英語REデータセット(NYT10、FewRel、CrossRE)を翻訳することで構築される。
次に、言語パープレキシティ(PPL)を使用して、翻訳されたデータセットから低品質データをフィルタリングする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:43:15 GMT)
Stable Diffusion Segmentation for Biomedical Images with Single-step Reverse Process [7.0] 安定拡散(SD)に基づく第1潜伏拡散分割モデルSDSegを導入する。
SDSegは、単一ステップの逆プロセスを容易にするために、単純な遅延推定戦略を取り入れている。
単独の逆ステップとサンプルで安定した予測を生成でき、その名の通りモデルの安定性を表わすことができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:01:07 GMT)
LLaMIPa: An Incremental Discourse Parser [7.0] 本稿では,SDRT形式で注釈付けされたコーパスを微調整した大規模言語モデルを用いた最初の談話解析実験について述べる。
これは、下流タスクにおける言論情報の最終的な使用に不可欠である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:08:17 GMT)
Quantifying Arbitrage in Automated Market Makers: An Empirical Study of Ethereum ZK Rollups [6.9] 本研究は、ZKロールアップにおけるAMM(Automated Market Makers)とCEX(Centralized Exchanges)の仲裁の機会を体系的にレビューする。
このような仲裁の機会を計測し、関連する最大任意値(MAV)の式を導出する理論的枠組みを提案する。
全体として、USDC-ETH SyncSwapプールにおける2023年7月から2023年までの累積MAVは104.96k(取引量の0.24%)である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:40:08 GMT)
Enhancing Explainability of Knowledge Learning Paths: Causal Knowledge Networks [6.8] 信頼できる知識構造は、効果的な適応学習システムを構築するための前提条件である。
本稿では,因果知識ネットワークを構築する手法を提案する。
また,信頼度の高い知識学習パスレコメンデーション手法も導入する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:25:44 GMT)
PDFA Distillation via String Probability Queries {PDFA Distillation via String Probability Queries} [6.8] 本稿では,確率的決定論的有限オートマトン (PDFA) をニューラルネットワークから抽出するアルゴリズムを提案する。
我々のアルゴリズムはL#アルゴリズムの派生であり、新しいタイプのクエリからPDFAを学習することができる。
訓練されたニューラルネットワークの集合からPDFAを蒸留することにより、最近の公開データセット上での有効性を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:16:40 GMT)
Online Learning of Multiple Tasks and Their Relationships : Testing on Spam Email Data and EEG Signals Recorded in Construction Fields [6.6] 本稿では,オンラインマルチタスク学習(OMTL)手法について検討する。
静的なタスク関連性を仮定した従来のモデルとは異なり、本手法はタスクを独立に扱い、新たに計算された重みベクトルを用いて関連性を反復的に更新する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:50:13 GMT)
Leveraging Large Language Models for Software Model Completion: Results from Industrial and Public Datasets [6.6] 検索拡張生成によるモデル補完のための大規模言語モデルの可能性を評価する。
大規模な言語モデルは、ソフトウェアモデルの進化をサポートするための有望な技術であることがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:43:15 GMT)
Is In-Context Learning a Type of Gradient-Based Learning? Evidence from the Inverse Frequency Effect in Structural Priming [6.4] 大規模言語モデル(LLM)は、文脈内学習(ICL)の創発的能力を示している。
我々は、ICLが勾配学習と機能的に等価であるかどうかを診断する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:06:41 GMT)
AssertionBench: A Benchmark to Evaluate Large-Language Models for Assertion Generation [6.4] 本稿では,アサーション生成におけるLarge-Language Modelsの有効性を評価するための新しいベンチマークを提案する。
AssertioBenchにはOpenCoresから100のキュレートされたVerilogハードウェア設計が含まれており、GoldMineとHARMから生成された各設計について正式に承認されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:47:28 GMT)
Unified Uncertainties: Combining Input, Data and Model Uncertainty into a Single Formulation [6.1] 本稿では,ニューラルネットワークによる入力の不確実性を伝播する手法を提案する。
その結果,入力の不確実性の伝播により,より安定な決定境界が得られることがわかった。
入力の不確かさがモデルを通して伝播すると、出力におけるモデルの不確かさが生じることを議論し、実証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:13:45 GMT)
A Multi-Stage Goal-Driven Network for Pedestrian Trajectory Prediction [6.1] 本稿では,多段階目標駆動ネットワーク(MGNet)と呼ばれる,歩行者軌道予測の新しい手法を提案する。
ネットワークは、条件付き変分オートエンコーダ(CVAE)、アテンションモジュール、多段階ゴール評価器の3つの主要コンポーネントから構成される。
MGNetの有効性は、JAADおよびPIEデータセットに関する総合的な実験を通して示される。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:59:21 GMT)
Automated Immunophenotyping Assessment for Diagnosing Childhood Acute Leukemia using Set-Transformers [6.1] 本稿では,小児急性白血病における免疫フェノタイピング評価の自動化を目的として,機械学習による自己注意型FCM診断ツールであるFCM-Formerを提案する。
急性B細胞, T細胞リンパ芽球性, 急性骨髄性白血病(B-ALL, T-ALL, AML)の960例において, FCM-Formerは96.5%の精度でそれぞれの標本に系統を割り当てている。
我々の知る限り、FCM-Formerは小児急性白血病の診断において、FCMデータによる免疫フェノタイピング評価を自動化する最初の研究である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:50:07 GMT)
Source-Free Domain Adaptation with Diffusion-Guided Source Data Generation [6.1] 本稿では、ソースフリードメイン適応(DM-SFDA)のための拡散モデルの一般化可能性を活用する新しいアプローチを提案する。
提案するDMSFDA法では,事前学習したテキスト・画像拡散モデルを微調整し,ソース・ドメイン・イメージを生成する。
私たちは、Office-31、Office-Home、VisDAなど、さまざまなデータセットにわたる包括的な実験を通じて、このアプローチを検証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:57:15 GMT)
Visual Reasoning and Multi-Agent Approach in Multimodal Large Language Models (MLLMs): Solving TSP and mTSP Combinatorial Challenges [5.9] MLLM(Multimodal Large Language Models)は、テキスト、画像、音声にまたがる包括的な知識を活用して、複雑な問題に対処する。
本研究では、旅行セールスマン問題(TSP)と旅行セールスマン問題(mTSP)を視覚的に解決するMLLMの能力について検討する。
本稿では,MLLMフレームワークに複数の特殊エージェントを取り入れた新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:12:06 GMT)
ViPro: Enabling and Controlling Video Prediction for Complex Dynamical Scenarios using Procedural Knowledge [5.9] 我々は、最先端のビデオ予測器が複雑な動的設定に苦しむことを示す。
我々のアプローチは、モデルにおけるデータ駆動型アスペクトと専用手続き型知識モジュールとの間の、象徴的な対処可能なインターフェースの学習をもたらす。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:01:35 GMT)
Guiding Video Prediction with Explicit Procedural Knowledge [5.9] 本稿では,ドメインの手続き的知識をディープラーニングモデルに統合する一般的な方法を提案する。
これは、データ駆動モデル単独の使用よりもパフォーマンスが向上することを示している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:08:24 GMT)
Sharing tripartite nonlocality sequentially using only projective measurements [5.8] 射影測定と古典的ランダム性のみを用いた三部構造非局所性の共有について検討する。
偏りの測定値を用いることで、標準三部作非局所性を共有するシーケンシャルオブザーバの数が増加しないことがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:09:41 GMT)
Diff3Dformer: Leveraging Slice Sequence Diffusion for Enhanced 3D CT Classification with Transformer Networks [5.8] 拡散型3次元視覚変換器(Diff3Dformer)を提案する。
本手法は, 肺CTの2種類の小さなデータセットに対して, 改良された性能を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:54:45 GMT)
Vanilla Bayesian Optimization Performs Great in High Dimensions [5.8] 高次元問題はベイズ最適化アルゴリズムのアキレスのヒールと見なされてきた。
既存のアルゴリズムが、モデルの複雑さを下げるレンズを通して、これらの退化にどのように対処しているかを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:10:56 GMT)
DeepExtremeCubes: Integrating Earth system spatio-temporal data for impact assessment of climate extremes [5.7] 機械学習技術は、将来性を示すが、十分に構造化され、高品質で、キュレートされた分析可能なデータセットを必要とする。
ここでは、熱波の周囲をマッピングし、干ばつによる極端な衝撃に対処するDeepExtremesデータベースを紹介します。
全世界で4万個以上の空間サンプリングされた小さなデータキューブ(すなわちミニキューブ)を含み、空間カバレッジは2.5×2.5kmである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:53:26 GMT)
Empathy Detection from Text, Audiovisual, Audio or Physiological Signals: Task Formulations and Machine Learning Methods [5.7] 共感の検出は、社会、医療、教育に潜在的な応用がある。
広範かつ重複するトピックであるにもかかわらず、機械学習を利用した共感検出の道はいまだに探索されていない。
我々は、Affective Computingベースの共感領域における課題、研究ギャップ、潜在的な応用について論じる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:10:49 GMT)
Simultaneous Masking, Not Prompting Optimization: A Paradigm Shift in Fine-tuning LLMs for Simultaneous Translation [5.7] 大規模言語モデル(LLM)は、様々な言語処理タスクにおいて最先端のパフォーマンスを達成した。
同時翻訳のための微調整LDMのための新しいパラダイムであるSimulMaskを提案する。
5つの言語対における最先端の最適化戦略と比較して,翻訳品質の大幅な改善が見られた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:22:31 GMT)
DiffuseHigh: Training-free Progressive High-Resolution Image Synthesis through Structure Guidance [5.7] テキストと画像の拡散モデルは、高忠実度画像生成の可能性から、様々な領域で広く採用されている。
既存の大規模拡散モデルでは、1K解像度の画像を生成できるが、これは現代の商用応用の要求を満たすには程遠い。
本稿では,高分解能画像の生成を導くために,生成した低分解能画像を完全に活用する新しいプログレッシブアプローチを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:10:31 GMT)
ConStyle v2: A Strong Prompter for All-in-One Image Restoration [5.7] 本稿では,U-Netイメージ復元モデルのための強力なプラグアンドプレイプロンプトであるConStyle v2を紹介する。
実験によると、ConStyle v2は任意のU-Netスタイルの画像復元モデルをオールインワンの画像復元モデルに拡張できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:46:44 GMT)
ADO-LLM: Analog Design Bayesian Optimization with In-Context Learning of Large Language Models [5.6] 本稿では,大規模言語モデル(LLM)とベイジアン最適化を統合したアナログ設計最適化手法であるADO-LLMを提案する。
ADO-LLMは、LLMのドメイン知識を注入して実行可能な設計ポイントを迅速に生成し、高価値な設計領域を見つけるためのBOの非効率性を改善する能力を活用している。
提案手法を2種類のアナログ回路上で評価し,設計効率と性能の顕著な向上を実証した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:42:50 GMT)
InterCLIP-MEP: Interactive CLIP and Memory-Enhanced Predictor for Multi-modal Sarcasm Detection [5.6] マルチモーダルサルカズム検出のための堅牢なフレームワークであるInterCLIP-MEPを提案する。
InterCLIP-MEPはCLIPの改良版であるInterCLIP(Interactive CLIP)をバックボーンとして導入している。
メモリ拡張予測器にInterCLIPを適用するための新しいトレーニング戦略が設計されている。
実験により、InterCLIP-MEPはMMSD2.0ベンチマークで最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:40:16 GMT)
Towards View-based Development of Quantum Software [5.5] 我々は、SUM(Single Underlying Model)と支援量子統合開発環境(IDE)に基づくビューベース量子開発手法を提案する。
今後の研究における新たな課題を強調します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:01:35 GMT)
ToM-LM: Delegating Theory of Mind Reasoning to External Symbolic Executors in Large Language Models [5.5] 心の理論(りょうせい、英: Theory of Mind、ToM)とは、個人が心の状態を他人に当てはめる能力のこと。
大きな言語モデル(LLM)は、ToMの能力といくつかの約束を示しているが、それでも複雑なToM推論に苦戦している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:57:22 GMT)
InstantGroup: Instant Template Generation for Scalable Group of Brain MRI Registration [5.4] InstantGroupは、変動オートエンコーダ(VAE)モデルに基づく効率的なグループワイドテンプレート生成フレームワークである。
3D脳MRIでの実験によると、InstantGroupは実行時間を劇的に減らし、さまざまなグループサイズのテンプレートを生成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:34:47 GMT)
Towards Open-World Grasping with Large Vision-Language Models [5.3] オープンワールドの把握システムは、高レベルの文脈と低レベルの物理幾何学的推論を組み合わせることができるべきである。
本稿では,視覚言語モデルとセグメンテーションとグルーピング合成モデルを組み合わせたオープンワールドグルーピングパイプラインOWGを提案する。
乱雑な屋内シーンデータセットを用いて,オープンエンド言語を基盤としたOWGのロバスト性を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:42:08 GMT)
Long-Term Prediction Accuracy Improvement of Data-Driven Medium-Range Global Weather Forecast [5.3] 長期的反復予測を改善するために、Spherical Harmonic Neural Operator (SHNO)と呼ばれる普遍的神経オペレータが導入された。
SHNOは球面の高調波基底を用いて球面データの歪みを緩和し、異なるスケールでスプリアス相関によって生じるスペクトルバイアスを補正するためにゲート残留スペクトルアテンション(GRSA)を用いる。
本研究は,長期予測の精度を向上させるため,SHNOの利点と可能性を強調した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:06:27 GMT)
General Distribution Learning: A theoretical framework for Deep Learning [5.3] 本稿では,機械学習と統計的タスクに対処する新しい理論フレームワークを提案する。
従来の統計機械学習とは別に、GD Learningは真の分布に焦点を当てている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:32:28 GMT)
Theory of Mind for Multi-Agent Collaboration via Large Language Models [5.3] 本研究では,多エージェント協調型テキストゲームにおけるLarge Language Models (LLMs) ベースのエージェントを,理論オブマインド (ToM) 推論タスクを用いて評価する。
LLMをベースとしたエージェント間の創発的協調行動と高次マインド理論の実証を行った。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:15:34 GMT)
Entanglement and classical nonseparability convertible from orthogonal polarizations [5.3] ユークリッド空間における偏光度自由度を持つ光ビームは、バイパルタイトヒルベルト空間におけるコヒーレント積状態とみなす。
ユークリッド空間における偏光度自由度を持つ光ビームを両部ヒルベルト空間におけるコヒーレントな積状態として考慮し、この2つの偏光を同時絡み合いと古典的非分離性に変換する方法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:56:28 GMT)
Contraction of Private Quantum Channels and Private Quantum Hypothesis Testing [5.2] プライバシ制約下でのホッケースティックの分散に対する収縮係数について検討する。
また、プライベートな量子チャネルが量子学習環境における公平性とホレボ情報の安定性をどのように提供するかを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:00:03 GMT)
Multiple-Choice Questions are Efficient and Robust LLM Evaluators [5.2] 我々は60のオープンソースモデルから GSM8K の回答と誤予測を収集して構築した多重選択(MC)データセット GSM-MC を提案する。
本稿では,このベンチマークのMCバージョンにおけるLCMの性能が,オリジナルのバージョンにおける性能と強く相関していることを示す。
我々は、MATHから構築したMATH-MCと、HumanEvalとMBPPから構築したMCデータセットであるPythonIOを紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:16:42 GMT)
Jina CLIP: Your CLIP Model Is Also Your Text Retriever [5.1] Contrastive Language-Image Pretraining (CLIP) は、一般的な埋め込み空間における画像とテキストを固定サイズのベクトルにマッピングすることで、モデルをトレーニングするために広く使われている。
本稿では,この問題に対処する新しいマルチタスクコントラストトレーニング手法を提案し,テキスト画像とテキストテキスト検索の両タスクにおける最先端性能を実現するために,jina-clip-v1モデルをトレーニングするために使用する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:31:48 GMT)
Re-Ranking Step by Step: Investigating Pre-Filtering for Re-Ranking with Large Language Models [5.0] 大規模言語モデル(LLM)は、さまざまなゼロショット機能を備えた多種多様な自然言語処理タスクに革命をもたらしている。
本稿では、情報検索(IR)における通過前の事前フィルタリングステップの使用について検討する。
実験の結果, この事前フィルタリングにより, LLMは再ランクタスクにおいて, 性能が大幅に向上することがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:12:24 GMT)
Sparse deep neural networks for nonparametric estimation in high-dimensional sparse regression [5.0] 本研究は、非パラメトリック推定とパラメトリックスパースディープニューラルネットワークを初めて組み合わせたものである。
偏微分の非パラメトリック推定は非線形変数選択にとって非常に重要であるため、現在の結果はディープニューラルネットワークの解釈可能性に有望な未来を示すものである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:41:41 GMT)
Universal scaling of quantum state transport in one-dimensional topological chain under nonadiabatic dynamics [4.9] 線形駆動を受ける一次元トポロジカルシステムにおける量子状態輸送のスケーリングについて検討する。
駆動速度における量子状態の輸送距離,幅,ピークマグニチュードの電力-法則依存性について述べる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:08:28 GMT)
Decoding the AI Pen: Techniques and Challenges in Detecting AI-Generated Text [4.9] 大規模言語モデル(LLM)は、人間に似たテキストを生成する素晴らしい能力を示すことによって、自然言語生成(NLG)の分野に革命をもたらした。
しかし、彼らの普及した利用は、思慮深い検査、倫理的精査、責任ある実践を必要とする課題をもたらす。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:49:32 GMT)
Emergence of Gibbs Ensemble as the Unique Steady State in Open Quantum Systems [4.9] 我々は、ギブスアンサンブルを特徴とするリンドブラッドマスター方程式のユニークな非平衡定常状態(NESS)を明示的に構成する。
XXモデルとフレドキンモデルを研究することにより、ギブス状態がユニークな定常状態としてどのように現れるかを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:38:34 GMT)
Boosting Soft Q-Learning by Bounding [4.9] 任意の値関数推定が最適値関数上の二辺境界の導出にも利用できることを示す。
派生したバウンダリは、トレーニングパフォーマンスを高めるための新しいアプローチにつながります。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:02:22 GMT)
Joint Stream: Malignant Region Learning for Breast Cancer Diagnosis [4.9] Estrogen receptor (ER), Progesterone receptor (PR), Human epidermal Growth Factor receptor 2 (HER2) gene, Histological grade (HG), Auxiliary lymph node (ALN) status, Molecular subtype (MS) は, BC診断の改善に重要な役割を果たす。
本稿では,H&E染色WSIを用いて早期に診断された6つの重要な因子 (ER, PR, HER2, ALN, HG, MS) を分類することを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:56:29 GMT)
Aligning Model Properties via Conformal Risk Control [4.7] AIモデルのアライメントは、トレーニングデータにおける不注意なバイアスと、現代の機械学習における未特定パイプラインのために不可欠である。
最近の進歩は、人間のフィードバックによるトレーニング後のモデルアライメントがこれらの課題のいくつかに対処できることを示している。
プロパティテストを通じてモデルアライメントを解釈し、アライメントモデル $f$ を関数のサブセット $mathcalP$ に属するものとして定義する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:24:46 GMT)
Mean-Field Langevin Dynamics for Signed Measures via a Bilevel Approach [4.6] 平均場ランゲヴィン力学(英: Mean-field Langevin dynamics、MLFD)は、多様体上の確率測度に対する凸最適化に取り組む相互作用粒子法の一種。
我々は,MFLDフレームワークを拡張して,符号付き測度よりも最適化問題を凸化する方法を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:12:27 GMT)
DF-SLAM: Dictionary Factors Representation for High-Fidelity Neural Implicit Dense Visual SLAM System [4.5] DF-SLAMと呼ばれる高忠実度ニューラル暗黙的視覚的局所化マッピングシステムを提案する。
本研究では,シーンの形状と外観情報を基本因子と係数因子の組み合わせとして符号化し,シーン表現に辞書因子を用いる。
モデルのサイズはシーンマップのサイズに敏感であるのに対し,本手法ではシーン詳細再構築機能とメモリ使用効率が向上している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:14:32 GMT)
EHR-Based Mobile and Web Platform for Chronic Disease Risk Prediction Using Large Language Multimodal Models [4.3] 2017年から2021年にかけて、台湾の病院データベースから5年間のElectronic Health RecordsをAIデータベースとして収集しました。
LLMM(Large Language Multimodal Models)を用いたEHRに基づく慢性疾患予測プラットフォームを開発した。
この予測プラットフォームは病院のバックエンドデータベースに接続し、医師にリアルタイムのリスクアセスメントを提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:51:08 GMT)
A Dynamic Systems Approach to Modelling Human-Machine Rhythm Interaction [4.3] 本研究では、リズム処理の基礎となる物理および生物学的プロセスにインスパイアされた計算モデルを紹介する。
本研究は,人間の知覚範囲内でのリズムパターンを正確に知覚し,適応する能力を示すものである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:07:20 GMT)
A GPU-Accelerated Bi-linear ADMM Algorithm for Distributed Sparse Machine Learning [4.3] Bi-cADMMは、計算ノードのネットワーク上で定義された大規模正規化されたスパース機械学習問題を解決することを目的としている。
Bi-cADMMはParallel Sparse Fitting Toolboxと呼ばれるオープンソースのPythonパッケージで実装されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:27:56 GMT)
GS-Octree: Octree-based 3D Gaussian Splatting for Robust Object-level 3D Reconstruction Under Strong Lighting [4.3] 我々はオクツリーに基づく暗黙的な表面表現とガウススプラッティングを組み合わせた新しいアプローチを導入する。
SDFによる3次元ガウス分布を利用した本手法は,特に高輝度光による特徴強調画像において,より正確な形状を再構成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:29:56 GMT)
RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker [4.2] 本稿では,新しいRGB-Sonar(RGB-S)トラッキングタスクを提案する。
RGBとソナーモダリティの相互作用により、水中の標的の効率的な追跡を実現する方法について検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:39:49 GMT)
Navigating the Minefield of MT Beam Search in Cascaded Streaming Speech Translation [4.2] 我々は,機械翻訳においてよく知られたビームサーチアルゴリズムを適用し,実時間音声翻訳システムで動作させる。
これは4つの重要な課題のために、当初予想されていたよりも複雑であることが判明した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:34:53 GMT)
Benchmarking mortality risk prediction from electrocardiograms [4.2] 大規模な病院所有の心電図データベースは、患者の死亡をモデル化し予測するために使用することができる。
MIMIC-IV(英語: MIMIC-IV)は、2023年9月にリリースされた、アメリカ合衆国の病院システムから80,000のECGを含む、最初の同等のパブリックデータセットである。
これらのデータセットは、より広範な聴衆にECGサバイバルモデリングを探求するための優れたリソースを提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:27:16 GMT)
MgNO: Efficient Parameterization of Linear Operators via Multigrid [4.1] 我々は、ニューロン間の線形演算子をパラメータ化するために多重格子構造を利用するMgNOを紹介する。
MgNOは、他のCNNベースのモデルと比べてトレーニングの容易さが優れている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:00:14 GMT)
NeBuLa: A discourse aware Minecraft Builder [4.0] 先行した言論と非言語的文脈を取り入れることで、そのような相互作用の「言語から行動への」要素がいかに改善されるかを示す。
我々のモデルであるNeBuLaは、ベースライン上でのネットアクションF1スコアを2倍にします。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:24:44 GMT)
Research on Information Extraction of LCSTS Dataset Based on an Improved BERTSum-LSTM Model [3.9] 本稿では,改良されたBERTSum-LSTMモデルに基づくLCSTSデータセットの情報抽出手法について検討する。
BERTSum-LSTMモデルの改良により,中国語ニュース要約生成の性能が向上する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:04:15 GMT)
Deep Fusion: Efficient Network Training via Pre-trained Initializations [3.9] 我々は、より小さなネットワークの初期化を事前訓練したネットワークトレーニングの効率的なアプローチであるDeep Fusionを提案する。
我々の実験は、Deep Fusionが訓練プロセスを加速するだけでなく、計算要求を減少させる実用的で効果的なアプローチであることを示す。
我々は,Deep Fusionの最適利用を導く理論的枠組みを検証し,トレーニング時間と資源消費の両方を著しく削減することを示した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:16:57 GMT)
VADA: a Data-Driven Simulator for Nanopore Sequencing [3.9] 本稿では,自己回帰潜在変数モデルに基づいて,ナノ孔をシミュレーションする純粋データ駆動手法を提案する。
実験的なナノ孔データに対して,本モデルが競合シミュレーション性能を実現することを実証的に実証した。
我々は,DNAラベルから予測される情報的潜伏表現を学習したことを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:46:19 GMT)
Super Tiny Language Models [3.8] 本稿では,スーパーティニー言語モデル(STLM)に着目した一連の研究成果を紹介する。
我々は,プーリング機構によるバイトレベルのトークン化,ウェイトタイリング,効率的なトレーニング戦略など,革新的な手法を探求する。
我々の最終的な目標は、広範囲のアプリケーションに対して、高性能な言語モデルをよりアクセスしやすく、実用的なものにすることです。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:41:06 GMT)
Galaxy spectroscopy without spectra: Galaxy properties from photometric images with conditional diffusion models [3.6] 我々は、測光広帯域画像のみから光銀河スペクトルを予測できる生成AI法を開発した。
この研究は、測光画像から速度分散を推定するための文献における最初の試みである。
活動銀河核の存在を82%の精度で予測できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:49:51 GMT)
Local Linear Recovery Guarantee of Deep Neural Networks at Overparameterization [3.4] 局所線形リカバリ (LLR) は, 目標関数リカバリの弱い形式である。
より狭いDNNで表現可能な関数は、モデルパラメータよりも少ないサンプルから復元可能であることを証明した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:08:24 GMT)
Exploring the Relationship Between Ownership and Contribution Alignment and Code Technical Debt [3.4] この記事では、オーナシップとコントリビューションアライメントアライメントの関係とコード品質の劣化について検討する。
また、チーム構造の変化がコード品質の劣化を管理する能力にどのように影響するかについても検討している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:46:33 GMT)
Evaluating Quality of Answers for Retrieval-Augmented Generation: A Strong LLM Is All You Need [3.4] 本稿では,vRAG-Evalを用いた検索型拡張生成(RAG)アプリケーションにおける解答品質の総合評価を行う。
品質面の階調をバイナリスコアにマッピングし、受け入れまたは拒否の決定を示す。
このアプローチは、明確な意思決定の意見が不可欠である現実的なビジネス設定に適合します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:49:41 GMT)
Safely Learning with Private Data: A Federated Learning Framework for Large Language Model [3.1] フェデレートラーニング(FL)は、分散プライベートデータを用いたモデルのトレーニングに理想的なソリューションである。
FedAvgのような従来のフレームワークは、大きな言語モデル(LLM)には適さない
本稿では,サーバサイド攻撃とピアクライアント攻撃の両方によるデータ漏洩を防止するFL-GLMを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:28:38 GMT)
Bayesian Uncertainty Estimation by Hamiltonian Monte Carlo: Applications to Cardiac MRI Segmentation [3.1] 最近の研究では、ディープニューラルネットワーク(DNN)が誤解され、過信され、"サイレント障害"につながることが示されている。
我々はハミルトン・モンテカルロ(HMC)による医療データ拡張のためのフレームワークを提案し,HMC-CPと命名した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:14:21 GMT)
A Single Graph Convolution Is All You Need: Efficient Grayscale Image Classification [3.0] グレースケール画像分類は、医用画像やSAR ATRなどの分野で重要な応用がある。
画像のベクトル化ビューを用いた新しいグレースケール画像分類手法を提案する。
提案手法では,単一のグラフ畳み込み層をバッチ的に組み込んで,精度の向上と性能のばらつきの低減を図る。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:08:51 GMT)
A Communication Satellite Servises Based Decentralized Network Protocol [3.0] このプロトコルは、ブロックチェーンネットワーク全体にわたって衛星通信サービスのステータスに関する情報を配布する方法の概要である。
我々の主な目的は、通信衛星プロトコルの下で全衛星ネットワークが配信するサービスを標準化することである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:01:40 GMT)
Weisfeiler Leman for Euclidean Equivariant Machine Learning [3.0] PPGNは, 複雑度が低い全点クラウド上で, 均一に2$-WLをシミュレートできることを示す。
第二に、2ドルのWLテストは、位置と速度の両方を含む点雲まで拡張可能であることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:11:16 GMT)
Neuromorphic hardware for sustainable AI data centers [3.0] ニューロモルフィックハードウェアは、脳が情報を処理する方法からインスピレーションを得ている。
その可能性にもかかわらず、ニューロモルフィックなハードウェアは商用AIデータセンターに導入されていない。
本稿は、ニューロモルフィックハードウェアをデータセンターに統合する際の課題に対する意識を高めることを目的としている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:46:24 GMT)
Localized statistics decoding: A parallel decoding algorithm for quantum low-density parity-check codes [3.0] 任意の量子低密度パリティチェック符号に対する局所統計復号法を導入する。
我々のデコーダは専用ハードウェアの実装に適しており、実験からリアルタイムシンドロームをデコードするための有望な候補として位置づけられている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:00:09 GMT)
Foundation Models for Electrocardiograms [2.9] 自己教師付き学習(SSL)技術によって強化された基礎モデルは、バイオメディカルシグナル分析における最先端のフロンティアを表している。
本研究は,1100万以上の心電図サンプルからなる膨大なデータセットを用いて,心電図の基礎モデルの包括的解析を行う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:24:13 GMT)
ContactNet: Geometric-Based Deep Learning Model for Predicting Protein-Protein Interactions [2.9] 我々は,PPIモデルを正確かつ誤ったものに分類するための新しい注目型グラフニューラルネットワーク(GNN)であるContactNetを開発した。
ドッキング抗原やモデル抗体構造を訓練すると、ContactNetは現在の最先端のスコアリング機能の精度を2倍にする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:54:41 GMT)
Shimo Lab at "Discharge Me!": Discharge Summarization by Prompt-Driven Concatenation of Electronic Health Record Sections [2.8] EHR から "Brief Hospital Course" と "Discharge Instructions" のセクションを生成するパイプラインを開発した。
次に、これらのセクションに説明プロンプトを追加し、別々のトークンでそれらを抽出して入力テキストを作成します。
提案手法はROUGE-1スコアが0.394$であり,上位のソリューションに匹敵するものである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:10:20 GMT)
Dawn of a nuclear clock: frequency ratio of the $^{229m}$Th isomeric transition and the $^{87}$Sr atomic clock [2.8] トリウム229核は、最先端真空紫外(VUV)レーザー光源の届く範囲内で、一意に低エネルギーの核転移を示す。
固体CaF$ホスト材料中の229ドルTh原子核時計遷移を励起するために、VUV周波数コムを用いる。
このVUVコムは、核エネルギーレベルと電子エネルギーレベルの周波数リンクを確立し、27ドルSr原子時計と229ドルTh原子時計の周波数比を直接測定することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:38:45 GMT)
Games of Knightian Uncertainty [2.7] ゲーム研究がAGIパスに再び関係するようになるためには、textitKnightianの不確実性に対処する必要がある、と我々は主張する。
エージェントは、警告なし、以前のデータなし、モデルアクセスなしで、オンザフライでゲームルールの迅速な変更に適応できる必要がある。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:52:34 GMT)
IDA-UIE: An Iterative Framework for Deep Network-based Degradation Aware Underwater Image Enhancement [2.6] 水中画像強調に関する最近の研究は、これらの問題に対処するための異なるディープネットワークアーキテクチャを提案している。
特定の条件でトレーニングされたディープネットワークは、すべての劣化事例から学んだ単一のネットワークよりも優れたパフォーマンスをもたらすと考えている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:58:15 GMT)
Operator Learning of Lipschitz Operators: An Information-Theoretic Perspective [2.4] この研究は、リプシッツ連続作用素の一般クラスに対するニューラル作用素近似のパラメトリック複雑性に対処する。
我々の主な貢献は、2つの近似設定におけるリプシッツ作用素の計量エントロピーの低い境界を確立することである。
使用したアクティベーション関数にかかわらず、近似精度が$epsilon$に達する神経オペレーターアーキテクチャは、$epsilon-1$で指数関数的に大きいサイズでなければならない。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:36:46 GMT)
Operating Single-Photon Circulator by Spinning Optical Resonators [2.4] サーキュレータは量子ネットワークやシミュレーションにおいて重要なデバイスの一つである。
ミューチ周波数点における単一光子のフローを制御する4ポート循環器を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:09:45 GMT)
Generative Discrimination: What Happens When Generative AI Exhibits Bias, and What Can Be Done About It [2.3] 第1章は、genAIが非差別法とどのように交わるかを考察する。
差別的アウトプットには2つの主要な種類がある: (i) 嫌悪的内容と (ii) 保護されたグループの不適切な表現による微妙なバイアス。
差別的なアウトプットに責任を負うgenAIプロバイダやデプロイの保持を主張し、genAI固有の問題に対処する従来の法的枠組みの不十分さを強調している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:32:58 GMT)
Robust personnel rostering: how accurate should absenteeism predictions be? [2.3] 欠勤による人事異動は、従業員の労働時間に対する最後の数分の調整を必要とすることが多い。
このような変化の影響を緩和するための一般的な戦略は、従業員にリザーブシフトを割り当てることである。
我々は、機械学習モデルからの欠如予測を用いて、適切な数のリザーブシフトをスケジュールする予測を最適化するアプローチを仮定する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:16:18 GMT)
SAM: Semi-Active Mechanism for Extensible Continuum Manipulator and Real-time Hysteresis Compensation Control Algorithm [2.3] 本稿では,機械的要素やアクティベーションを伴わない翻訳動作により作業空間を拡張するためのセミアクティブ機構(SAM)を備えたCDCMを提案する。
トレーニングされた時間変化ネットワーク(TCN)を1msの遅延時間でリアルタイムに補償するアルゴリズムを開発し,マニピュレータの挙動を効果的に推定する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:30:51 GMT)
A Quantization-based Technique for Privacy Preserving Distributed Learning [2.2] 本稿では,機械学習モデルの分散トレーニングのための,新しい規則に準拠したデータ保護手法について述べる。
本手法は,Hash-Combとランダム化を組み合わせた量子化マルチハッシュデータ表現に基づくプロトコルを用いることで,トレーニングデータとMLモデルパラメータの両方を保護する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:54:12 GMT)
AI Cards: Towards an Applied Framework for Machine-Readable AI and Risk Documentation Inspired by the EU AI Act [2.2] その重要性にもかかわらず、AI法に沿ったAIとリスクドキュメントの作成を支援するための標準やガイドラインが欠如している。
提案するAIカードは,AIシステムの意図した使用を表現するための,新しい総合的なフレームワークである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:51:49 GMT)
Multi-step Knowledge Retrieval and Inference over Unstructured Data [2.2] 医療、法律、金融などの分野における高い意思決定タスクは、精度、包括性、論理的一貫性のレベルを必要とする。
これらの問題に対処するための,ニューロシンボリックAIプラットフォームを開発した。
このプラットフォームは、知識抽出とアライメントのための微調整LDMと、堅牢なシンボリック推論エンジンを統合している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:00:45 GMT)
Innovating for Tomorrow: The Convergence of SE and Green AI [2.0] 機械学習は、既存のソフトウェアエンジニアリングプロセスのフロンティアを変えつつある。
我々は、環境に優しいプラクティスを採用してAI対応のソフトウェアシステムを構築することの影響を反映する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:47:04 GMT)
Generalized Concentratable Entanglement via Parallelized Permutation Tests [2.0] 一般化された収束エンタングルメント測度を導入し、量子タリスエントロピーへの自然な対応を強調し、新しいエントロピー不等式を予想する。
量子コンピュータにおけるGCEの効率的な測定法を,素数の状態コピーに対して並列化置換テストを用いて示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:44:01 GMT)
Fair, Manipulation-Robust, and Transparent Sortition [1.9] 我々は、ボランティアが選択の機会が少なすぎることを保証するため、新しい平等目標であるGoldilocksを提案する。
この目的は、ほとんどの実インスタンスにおいて、ほぼインスタンス最適最小および最大選択確率を同時に達成することを発見した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:26:50 GMT)
Dating ancient manuscripts using radiocarbon and AI-based writing style analysis [1.8] 我々は,Dead Sea Scrollsの新しい放射性炭素年代測定サンプルに基づいて,AIに基づく年代予測モデルであるEnochを紹介する。
エノクは放射性炭素による年代を、放射性炭素年代測定と比較して27.9年から30.7年の様々なMAEで予測することができる。
その後、135点の未確認の写本の日付を推定するために用いられ、この標本の79パーセントがパレオグラフィーによるポストホック評価に基づいて「現実的」であるとされた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:33:34 GMT)
Protecting three-dimensional entanglement from correlated amplitude damping channel [1.8] 本稿では, 相関振幅減衰(CAD)ノイズの存在下で, 四重項と四重項の絡み合いを保存するための2つの方法を紹介する。
相関効果が絡み合いの保護と成功確率の増大に与える影響を論じる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:54:28 GMT)
Systematic literature review of the trust reinforcement mechanisms exist in package ecosystems [1.8] このレビューは、現在のnpm環境における一般的なトレンド、方法、および信頼ツールの関心点を特定することを目的としている。
初期の研究を分析した結果、見落とされがちな地域を見つけ出し、それに対応するために我々の研究を推し進めることが目的だった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:21:24 GMT)
Towards Deep Active Learning in Avian Bioacoustics [1.8] アクティブラーニング(AL)は、アノテーションのコストを削減し、ラベル付けに最も有用なインスタンスをクエリすることで、さまざまなシナリオへの適応を高速化する。
本稿では、ALのアプローチを概説し、重要な課題を紹介し、小規模のパイロットスタディを実施している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:43:05 GMT)
Role-Play Zero-Shot Prompting with Large Language Models for Open-Domain Human-Machine Conversation [1.7] 大きな言語モデル(LLM)は、ユーザクエリに応答できるが、真の会話ではなく、一方的なQ&A形式である。
特定のデータセットの微調整は、会話能力を高めるためにスタイルを変更する一般的な方法だが、これは高価であり、通常はいくつかの言語でのみ利用可能である。
本研究では、オープンドメイン会話の効率的かつ費用対効果の高いソリューションとして、ロールプレイゼロショットプロンプトについて検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:10:53 GMT)
Zero-shot prompt-based classification: topic labeling in times of foundation models in German Tweets [1.7] そこで,本論文では,文章ガイドラインを用いてテキストを自動的に注釈付けするツールについて,トレーニングサンプルを提供することなく提案する。
提案手法は細調整されたBERTに匹敵するが,アノテートしたトレーニングデータはない。
本研究は,NLPランドスケープにおける進行中のパラダイムシフト,すなわち下流タスクの統一と事前ラベル付きトレーニングデータの必要性の排除を強調した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:44:02 GMT)
ECGrecover: a Deep Learning Approach for Electrocardiogram Signal Completion [1.7] 完全12誘導ECG信号を不完全部分から再構成するという課題に対処する。
再建問題に対処するために,新しい目的関数を訓練したU-Netアーキテクチャを用いたモデルを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:54:40 GMT)
Large Language Model Enhanced Clustering for News Event Detection [1.7] 本稿では,大規模言語モデル(LLM)とクラスタリング解析を組み合わせたイベント検出フレームワークを提案する。
このフレームワークは、事前検出タスクと後検出タスクの両方を通じてイベントクラスタリングを強化する。
本稿では,クラスタリング結果の有効性とロバスト性を評価するための新しいクラスタ安定性評価指標(CSAI)を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:42:59 GMT)
Regional Style and Color Transfer [1.7] 本稿では,地域スタイル移行の分野への新たな貢献について述べる。
既存の手法は、画像全体にわたって均一にスタイルを適用するという欠点に悩まされることが多い。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:43:05 GMT)
Quantum computing for corrosion-resistant materials and anti-corrosive coatings design [1.6] このプロジェクトは、物質と環境の相互作用をモデル化する方法を根本的に変えるために量子コンピュータをどのように活用するかを説明することを目的としている。
量子コンピュータの実用性は、2つの産業的に関係のある問題のレンズを通して探索される。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:04:42 GMT)
ArzEn-LLM: Code-Switched Egyptian Arabic-English Translation and Speech Recognition Using LLMs [1.6] 本稿では,機械翻訳(MT)と自動音声認識(ASR)システムの複雑さについて検討する。
我々は、コード変更されたエジプトのアラビア語を英語またはエジプトのアラビア語に翻訳することに重点を置いている。
本稿では,LLama や Gemma などの大規模言語モデルを用いて,これらのシステムの開発に使用される手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:19:51 GMT)
Implications of the AI Act for Non-Discrimination Law and Algorithmic Fairness [1.5] AIにおける公平性というトピックは、ここ数年で意味のある議論を巻き起こした。
法的な見地からは、多くのオープンな疑問が残る。
AI法は、これらの2つのアプローチをブリッジする大きな一歩を踏み出すかもしれない。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:35:30 GMT)
Petal-X: Human-Centered Visual Explanations to Improve Cardiovascular Risk Communication [1.5] 本研究は臨床医が共有した意思決定を支援する新しいツールであるPetal-Xの設計と実装について述べる。
Petal-Xは、新しいビジュアライゼーション、Petal Product Plots、そしてSCORE2のテーラーメイドのグローバルサロゲートモデルに依存している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:48:50 GMT)
Towards realization of universal quantum teleportation using weak measurements [1.4] 我々は、メモリやメモリレスダイナミクスの存在下での普遍的な量子テレポーテーションを分析する。
以上の結果から,メモリや非マルコビアン性,弱測定の複合効果が量子テレポーテーションに繋がる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:02:37 GMT)
Enabling Large Language Models to Perform Power System Simulations with Previously Unseen Tools: A Case of Daline [1.4] この研究は、パワーシステムと大規模言語モデルの両方から専門知識を統合するモジュラーフレームワークを提案する。
GPT-4oのシミュレーション符号化精度は0%から96.07%に向上し、ChatGPT-4oのウェブインタフェースの33.8%の精度を上回っている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:45:28 GMT)
Where there's a will there's a way: ChatGPT is used more for science in countries where it is prohibited [1.4] OpenAIは中国やロシアを含むいくつかの国でChatGPTアクセスを制限している。
そこで我々は,ChatGPTの初期バージョンに見られる特徴的単語使用量に基づく分類器を用いて使用量を測定した。
2023年8月までに、ChatGPTはプリプリントの約12.6%で使用され、制限された国では7.7%高用量であった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:38:13 GMT)
Introducing 3DCNN ResNets for ASD full-body kinematic assessment: a comparison with hand-crafted features [1.3] 本稿では,新しい3DCNN ResNetを提案するとともに,モータASD評価に広く用いられている手作り機能と比較する。
具体的には、複数のモータータスクと、両方のアプローチを用いたトレーニングモデルを備えたバーチャルリアリティ環境を開発した。
その結果,提案モデルでは最大85$pm$3%の精度を達成し,短い1~3分間のサンプルで最先端のエンド・ツー・エンドモデルを上回る結果を得た。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:29:12 GMT)
Transformer-based de novo peptide sequencing for data-independent acquisition mass spectrometry [1.3] 本稿では,変換器アーキテクチャに基づくディープラーニングモデルであるDiaTransを紹介する。
DIA質量分析データからペプチド配列を解読する。
その結果,既存のSTOA法よりも大幅に改善した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:45:33 GMT)
Facets of correlated non-Markovian channels [1.3] 非マルコフ力学によるチャネルの相関作用と固有記憶から生じる電位記憶について検討する。
チャネル相関の影響は、異なる非マルコビアン性指標と測定値を用いて研究される。
非マルコフチャネルの動的側面は、絡み合いのダイナミクスや、アクセス可能な状態の体積の変化を含む。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:23:26 GMT)
CoDA: Interactive Segmentation and Morphological Analysis of Dendroid Structures Exemplified on Stony Cold-Water Corals [1.3] CoDAは、複雑なデンドロイドサンゴコロニーの個体発生形態学的発達を初めて研究することができる。
CoDAの一部であるCoDAGraphは、スケルトンツリーの抽出した特徴と2Dグラフレイアウトを視覚化するための、機能豊富なリンクとブラシのユーザインターフェースである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:37:02 GMT)
Quantum computational resources for lattice QCD in the strong-coupling limit [1.3] 格子QCDとマスレススタージャドクォークとの強い結合限界を考察する。
トラップイオン系やフォトニックデバイスで用いられるqudits$(d>2)$およびqumodesにこの理論をマッピングする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:39:03 GMT)
Classification of Inkjet Printers based on Droplet Statistics [1.2] 与えられた文書を印刷するために使用されるプリンタモデルを知ることは、偽造を識別したり、実際の文書の有効性を検証するための重要な手がかりとなるかもしれない。
印刷文書スキャンから抽出した周波数領域の特徴を含む液滴特性を基礎となるプリンタモデルの分類に利用することを検討した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:20:01 GMT)
Data-driven identification of port-Hamiltonian DAE systems by Gaussian processes [1.2] ポート・ハミルトン系(pHS)は力学系の構造保存モデリングを可能にする。
いくつかのサブシステムは物理的pHS記述を許可していない(a)これは利用できないか(b)高すぎるためである。
ここでは、データ駆動アプローチを使用して、そのようなサブシステムに対してpHSを提供し、構造保存的な方法で他のサブシステムと結合することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:51:53 GMT)
Robust Surgical Phase Recognition From Annotation Efficient Supervision [1.2] 本稿では,欠落した位相アノテーションを効果的に扱える外科的位相認識のためのロバストな手法を提案する。
ビデオあたり3つの注釈付きフレームのみを用いて,MultiBypass140データセット上で85.1%の精度を実現する。
本研究は,外科的ワークフロー認識の進歩に寄与し,より効率的かつ信頼性の高い外科的位相認識システムの実現に寄与する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:47:31 GMT)
Unified Architecture for a Quantum Lookup Table [1.1] ユニタリブラックボックスで符号化された任意の古典データへの量子アクセスは、興味深いデータ集約量子アルゴリズムの基盤となる。
本稿では、ルックアップテーブルを実装した量子回路の汎用パラメータ化アーキテクチャを提案する。
私たちのアーキテクチャでは、ローカルな2D接続のみを前提としていますが、以前はオール・ツー・オール接続が必要でした。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:54:02 GMT)
Enhancing Data Privacy in Large Language Models through Private Association Editing [1.1] 大規模言語モデル(LLM)は広範なアプリケーションを持つ強力なツールであるが、プライベート情報を記憶する傾向があるため、大きな懸念が生じる。
本稿では,プライベートデータ漏洩に対する新しい防御手法であるプライベートアソシエーション編集(PAE)を紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:08:47 GMT)
ConvoCache: Smart Re-Use of Chatbot Responses [1.0] 遅くて高価な生成AIモデルの問題を解決する対話型キャッシュシステムであるConvoCacheを提案する。
ConvoCacheは過去にセマンティックに類似したプロンプトを見つけ、レスポンスを再利用する。
ConvoCacheは、90%のUniEvalコヒーレンスしきい値を適用し、平均遅延214msのキャッシュを使用するプロンプトの89%に対応することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:35:10 GMT)
GlucOS: Security, correctness, and simplicity for automated insulin delivery [1.0] 1型糖尿病(1 type 1 Diabetes、T1D)は、膵臓がインスリンを産生するのを止める代謝障害である。
補うために、合成インスリンを注入する。自動インスリンデリバリーシステムと呼ばれるコンピューターシステムは、インスリンを自動的に注入する。
本稿では,GlucOSと呼ばれる新しい信頼性の高い自動インスリンデリバリーシステムの構築に挑戦する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:20:15 GMT)
Cultural Bias and Cultural Alignment of Large Language Models [0.9] 広く使われている5つの大言語モデルに対して,文化的偏見の分散評価を行う。
全てのモデルは、英語とプロテスタントのヨーロッパ諸国に似た文化的価値を示す。
生成AIの出力における文化的バイアスを軽減するために,文化的なプロンプトと継続的な評価を用いることを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:26:44 GMT)
ResumeAtlas: Revisiting Resume Classification with Large-Scale Datasets and Large Language Models [0.9] 様々な情報源から13,389人の履歴書を収集した。
我々は BERT や Gemma1.1 2B などの大規模言語モデル (LLM) を分類に用いた。
その結果,従来の機械学習手法よりも大幅に改善された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:25:18 GMT)
Robust Low-Cost Drone Detection and Classification in Low SNR Environments [0.9] ドローンを検知し、分類する能力について、様々な畳み込みニューラルネットワーク(CNN)を評価した。
本稿では,標準コンピュータ,ソフトウェア定義無線(SDR),アンテナを用いた低コストドローン検知システムについて紹介する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:50:55 GMT)
Single-sample versus case-control sampling scheme for Positive Unlabeled data: the story of two scenarios [0.9] 経験的リスク最小化(ERM)に基づく正の未ラベルデータに対する分類器の性能は,単一サンプルシナリオに適用した場合に著しく低下する可能性がある。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:22:48 GMT)
SetBERT: Enhancing Retrieval Performance for Boolean Logic and Set Operation Queries [0.8] 本稿では,設定操作とブール論理クエリに対するクエリ埋め込みを強化するための,細調整BERTベースのモデルであるSetBERTを紹介する。
実験の結果, SetBERT-base は BERT-base を大幅に上回るだけでなく, より大型の BERT-large モデルに匹敵する性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:38:31 GMT)
Encouraging Responsible Use of Generative AI in Education: A Reward-Based Learning Approach [0.8] 本研究は、生成AIを統合した革新的な数学的学習手法を導入し、素早い解ではなく構造化学習を育成する。
目標は、学生が迅速な修正を求めることから、総合的な学習体験に積極的に参加することにある。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:27:24 GMT)
Sequence Graph Network for Online Debate Analysis [0.7] オンライン討論をモデル化するためのシーケンスグラフアプローチを導入する。
オンライン討論において,シーケンスグラフネットワークは既存の手法よりも優れた結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:58:23 GMT)
Psychological Profiling in Cybersecurity: A Look at LLMs and Psycholinguistic Features [0.7] 心理学的プロファイリング手法の可能性を探り、特に大規模言語モデル(LLM)と心理言語学的特徴の利用に焦点を当てる。
我々の研究は、サイバーセキュリティの実践に心理学的視点を統合することが、進化する脅威に対する防御メカニズムを強化することの重要性を強調している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:04:52 GMT)
On Convex Data-Driven Inverse Optimal Control for Nonlinear, Non-stationary and Stochastic Systems [0.7] 本稿では, エージェントの動作を駆動する非定常コストの観測から, 再構成を目標とする有限水平逆制御問題について考察する。
本研究では,非定常エージェントコストの対流的な問題を解くことで,コスト最適化を実現する結果を提案する。
すべての実験が我々のアプローチの有効性を確認した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:59:37 GMT)
A Review of Large Language Models and Autonomous Agents in Chemistry [0.7] 大規模言語モデル(LLM)は、複数のドメインにわたる化学において強力なツールとして登場している。
中心となるアイデアは、LSMと合成プランナーやデータベースのような化学固有のツールを組み合わせることで、いわゆる「エージェント」に繋がる。
新たな方向性として、Human-in-the-loopアプローチを用いたマルチエージェントシステムの開発がある。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:33:21 GMT)
Non-Markovian Quantum Exceptional Points [0.7] 非マルコフ力学の数値的正確な記述に基づく理論的枠組みを提案する。
マルコフ極限では観測できない純粋非マルコフ EP を公表する。
これらの発見は、非マルコフ貯水池工学と非エルミート物理学の理論的基礎と新しい道を開いた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:01:17 GMT)
Pre-Calc: Learning to Use the Calculator Improves Numeracy in Language Models [0.7] 本稿では,エンコーダのみのアーキテクチャとエンコーダデコーダアーキテクチャの両方で計算機を利用するための,簡単な事前学習目的であるPre-Calcを提案する。
我々は,MAWPS,SVAMP,AsDiv-Aデータセットを用いて,識別計算機用BERTとRoBERTaを事前訓練し,生成計算機用Flan-T5を作成した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:52:24 GMT)
Duality analysis in symmetric group and its application to random tensor network model [0.7] 双対性解析は自然に、$Z(q)$対称性とランダムスピン系を持つ自由度の場合に一般化することができる。
対称群の置換モデルは、ランダム量子回路とランダムテンソルネットワークモデルと密接に関連している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:52:17 GMT)
Solving optimal stopping problems with Deep Q-Learning [0.6] 本稿では,オプションタイプの製品に対して最適なエクササイズ戦略をモデル化するための強化学習(RL)手法を提案する。
基本関数の仕様を必要としない深層ニューラルネットワークを用いてQ関数を近似する。
我々は、トレーニングされたニューラルネットワークから得られるオプション価格と、停止問題の2つの定式化から得られる上限を低くする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:45:21 GMT)
Automatic Speech Recognition for Hindi [0.6] この研究は、Webアプリケーションの開発と音声認識のためのWebインターフェースの設計に関するものだった。
ウェブアプリケーションは、大量のオーディオファイルとその転写を管理し、ASR転写の人間の修正を容易にする。
音声認識用Webインターフェースは、Webアプリを実行するデバイスから16kHzのモノオーディオを記録し、音声アクティビティ検出(VAD)を行い、音声認識エンジンに音声を送信する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:39:20 GMT)
Bayesian identification of nonseparable Hamiltonians with multiplicative noise using deep learning and reduced-order modeling [0.6] 本稿では,非分離型ハミルトニアン系を学習するための構造保存型ベイズ的アプローチを提案する。
本研究では,ハイ次元システムに対するベイズ同定のコスト効率向上のための新しいアルゴリズムを開発した。
訓練目的としてベイズ後部を使用すれば,ハミルトン平均二乗誤差の724倍の改善が得られることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:55:27 GMT)
Documentation Practices of Artificial Intelligence [0.6] 我々は、一般的な傾向、永続的な問題、およびドキュメントに影響を与える要因の相互作用の概要について説明する。
スコープ,ターゲットオーディエンス,マルチモーダリティのサポート,自動化レベルといった重要な特徴について検討した結果,より包括的でエンゲージメント,自動化されたドキュメントへのシフトが浮き彫りになった。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:33:52 GMT)
Concordance in basal cell carcinoma diagnosis. Building a proper ground truth to train Artificial Intelligence tools [0.6] 異なる基底細胞癌 (BCC) の診断基準の存在は客観的に検証できない。
本研究の目的は,204BCCの皮膚内視鏡的基準に基づいて皮膚科医間のコンセンサスを決定することである。
4人の皮膚科医のコンセンサスから統計的に推測し, 1人の皮膚科医のグラウンド・トゥルースを用いて訓練したAIツールのパフォーマンスに統計的差異が認められた。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:44:48 GMT)
Scaling Quantum Computations via Gate Virtualization [0.6] 本稿では,大規模量子回路のスケーラブルな実行のためのエンドツーエンド汎用システムであるQuantum Virtual Machine (QVM)を提案する。
QVMは量子回路の概念を拡張する仮想回路中間表現(IR)を公開する。
我々は、IBMの7ビットおよび27ビット量子プロセッサ(QPU)上でのQVMを評価する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:06:19 GMT)
QBI: Quantile-based Bias Initialization for Efficient Private Data Reconstruction in Federated Learning [0.5] フェデレーション学習は、ユーザのプライバシを損なうことなく、分散データ上で機械学習モデルのトレーニングを可能にする。
近年の研究では、中央のエンティティが共有モデル更新からプライベートデータを完全に再構築できることが示されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:19:32 GMT)
Early Classification of Time Series: Taxonomy and Benchmark [0.5] この文書は原則に基づく分類から始まり、非常に広範な実験の結果を報告する。
評価を整理するための次元を定義し、非常に広範な実験の結果を報告する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:21:00 GMT)
Nonparametric Strategy Test [0.5] 本稿では,エージェントが与えられた混合戦略に従っているかどうかを,エージェントのプレイのサンプルが与えられた繰り返し戦略形式のゲームで判定する非パラメトリック統計的テストを提案する。
これには、エージェントの純粋な戦略の頻度がターゲットのイテレーションに十分近いかどうかを判断し、選択された純粋な戦略が異なるゲームイテレーション間で独立であるかどうかを決定する2つのコンポーネントが含まれる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:06:49 GMT)
Empirical Analysis of Fictitious Play for Nash Equilibrium Computation in Multiplayer Games [0.5] 架空のプレイは、2つのプレイヤーゼロサムゲームのような特定のゲームクラスにおいてナッシュ均衡に収束することが保証される。
実のところ、架空の遊びは、様々なゲームクラスやサイズに対するナッシュ均衡近似の改善につながることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:27:36 GMT)
Fuzzing at Scale: The Untold Story of the Scheduler [0.5] 我々は、どのプログラムをファズすべきか、どのくらいの間、プログラム全体で見つかったバグの数に大きな影響を与えるかを決定する、よく設計された戦略を示します。
いくつかのスケジューラを開発し、最も洗練されたスケジューラを活用して、新しくコンパイルされた約5,000のUbuntuプログラムのベンチマークを同時にファズし、4908のバグを検出する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:28:02 GMT)
Unleashing the Expressive Power of Pulse-Based Quantum Neural Networks [0.5] ノイズ中間スケール量子(NISQ)デバイスに基づく量子機械学習(QML)は、限られた量子リソースの最適利用に依存している。
ゲートベースのQMLモデルは、ソフトウェアエンジニアにとってユーザフレンドリーである。
パルスベースのモデルにより、"無限に"深い量子ニューラルネットワークを同時に構築することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:20:37 GMT)
Towards diffusion models for large-scale sea-ice modelling [0.4] データ空間におけるガウス分布を検閲して、潜伏拡散モデルを海氷物理学に調整し、モデル化された変数の物理的境界に従うデータを生成する。
我々の潜伏拡散モデルは、データ空間で訓練された拡散モデルと同様のスコアに達するが、潜伏写像によって生成されたフィールドは滑らかである。
大規模地球系モデリングでは、スムース化の重要な障壁を解決することができる場合、遅延拡散モデルはデータ空間の拡散に比べて多くの利点を持つ。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:11:15 GMT)
Re-initialization-free Level Set Method via Molecular Beam Epitaxy Equation Regularization for Image Segmentation [0.4] 本稿では,分子線エピタキシー(MBE)方程式の正則化と統合した高次準位変分法を提案する。
この方法は、MBEプロセスにおける結晶成長を利用して、レベルセット関数の進化を制限する。
滑らかなセグメンテーション曲線を生成し、細かいセグメンテーション目標を保持し、小さなオブジェクトの堅牢なセグメンテーション結果を得ることができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:22:31 GMT)
On the practical usefulness of the Hardware Efficient Ansatz [0.4] 1次元層状ハードウェア効率アンザッツ(HEA)は、ネイティブゲートと接続体を用いてハードウェアノイズの影響を最小限に抑える。
このような場合、浅いHEAは常に訓練可能であり、損失関数値の集中防止が存在することを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:14:58 GMT)
Learning Optimal Filters Using Variational Inference [0.4] アンサンブルカルマンフィルタ(EnKF)のような実際に用いられるフィルタは非線形系には偏りがある。
本稿では,予測分布と観測値をフィルタリング分布に反映するパラメータ化解析マップの学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:51:14 GMT)
Managing Classical Processing Requirements for Quantum Error Correction [0.4] ハードウェアデコーダの数を削減し,計算メモリのトレードオフをナビゲートするフレームワークを提案する。
プログラムの実行に必要なハードウェアデコーダの数を最大10倍に削減できる効率的なデコーダスケジューリングポリシーを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 00:50:10 GMT)
Learning Generalizable Program and Architecture Representations for Performance Modeling [0.3] PerfVecは、新しいディープラーニングベースのパフォーマンスモデリングフレームワークである。
高次元および独立/直交プログラムとマイクロアーキテクチャ表現を学習する。
PerfVecは、命令のパフォーマンスの本質をキャプチャする基盤モデルを生成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:12:21 GMT)
AI Alignment through Reinforcement Learning from Human Feedback? Contradictions and Limitations [0.2] 我々は、誠実さ、無害さ、役に立つという、広く追求されたアライメント目標の欠点を示す。
我々はRLxFの目標に固有の緊張と矛盾を強調する。
我々は、RLxFの社会技術的影響を批判的に評価するよう研究者や実践者に促すことで結論付ける。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:42:13 GMT)
On Reducing Activity with Distillation and Regularization for Energy Efficient Spiking Neural Networks [0.2] スパイクニューラルネットワーク(SNN)への関心は着実に増加しており、フォーマルニューラルネットワーク(FNN)に代わるエネルギー効率の高い代替品として期待されている。
本稿では,SNN訓練における知識蒸留(KD)を活用して,性能とスパイク活動のトレードオフを最適化することを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:51:57 GMT)
Topological data quality via 0-dimensional persistence matching [0.2] 本稿では,トポロジカルデータ解析技術を用いた教師あり学習のためのデータ品質の測定手法を提案する。
包含によって誘導され、0$次元の持続的ホモロジーを用いて、持続的マッチングに基づく新しい位相不変量を提供する。
このアプローチによって、選択したデータセットがパフォーマンスを低下させる理由を説明することができます。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:37:58 GMT)
Entangling Schrödinger's cat states by seeding a Bell state or swapping the cats [0.2] DV-CVハイブリッドアプローチは,2つの簡単な方法により,一対のシュリンガーの猫状態を絡めることができることを示す。
我々の研究は、DV-CVハイブリッド化のシンプルながら強力なアプリケーションを提供しながら、この平面KPOシステムのスケーラビリティを強調しています。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:04:24 GMT)
How coherence measurements of a qubit steer its quantum environment [0.2] 量子ビットのRIMが量子環境上で量子チャネルを誘導することを示す。
偏極, 脱分極, 準安定分極の3つの異なる環境ステアリング効果を明らかにする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:57:15 GMT)
MedMNIST-C: Comprehensive benchmark and improved classifier robustness by simulating realistic image corruptions [0.1] 神経ネットワークに基づくシステムの臨床実践への統合は、ドメインの一般化と堅牢性に関連する課題によって制限される。
我々は、12のデータセットと9つの画像モダリティをカバーするMedMNIST+コレクションに基づくベンチマークデータセットであるMedMNIST-Cを作成し、オープンソース化した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:52:47 GMT)
Sanskrit Knowledge-based Systems: Annotation and Computational Tools [0.1] 我々はサンスクリットの知識システム開発における課題と機会に対処する。
本研究はサンスクリット語文に具現化された豊かな言語情報の保存,理解,活用に寄与する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:00:10 GMT)
The Impact of Feature Representation on the Accuracy of Photonic Neural Networks [0.0] フォトニックニューラルネットワーク(PNN)は、高並列化、低レイテンシ、エネルギー効率といった可能性から、研究コミュニティにおいて大きな関心を集めている。
複数の特徴を1つの入力に組み合わせることで、入力や関連機器の数を減らし、より小さくエネルギー効率のよいPNNを生み出すことが一般的である。
本稿では,PNNの性能と学習能力に共通する特徴を組み合わせた符号化手法について検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:55:26 GMT)
Distinguishing mechanisms of social contagion from local network view [0.0] 複数の採用ルールは、同じ社会的感染プロセスでも共存することがある。
我々のゴールは、既存の採用メカニズムが顕微鏡的視点から区別できるかどうかを理解することである。
本研究は、自我中心レベルでの伝播過程の観察について、新しい視点を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 17:49:24 GMT)
Why Teach Quantum In Your Own Time: The Values of Grassroots Organizations Involved in Quantum Technologies Education and Outreach [0.0] 本稿では,量子技術(QT)教育の領域で活動する草の根組織における目標と価値の交わりについて検討する。
この分析は、これらの組織が、持続的な成長と開発を目標にしながら、基礎的な価値に固執するという2つの課題に悩まされる、初期段階の段階をナビゲートする方法を明らかにしている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:13:54 GMT)
Wafer-Scale Fabrication of InGaP-on-Insulator for Nonlinear and Quantum Photonic Applications [0.0] InGaP-on-insulator は可視光通信波長 $chileft (2right)$非線形光学プロセスに最適化されている。
1550nm付近の単一共振モードにおいて, 固有共振器の品質係数を最大324,000 (440,000) まで示す。
これらの結果は、絡み合った光子、多光子、圧縮された光の発生の可能性を開く。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:15:36 GMT)
View-Invariant Pixelwise Anomaly Detection in Multi-object Scenes with Adaptive View Synthesis [0.0] インフラ資産の検査と監視には、定期的に撮影されるシーンの視覚異常を特定する必要がある。
手動で収集した画像や、同じ場面で同じシーンから無人航空機などのロボットで撮影された画像は、通常は完全に一致していない。
現在の非教師なし画素レベルの異常検出法は, 主に産業環境下で開発されている。
提案するScene AD問題に対処するために,OmniADと呼ばれる新しいネットワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:54:10 GMT)
Using Helium Balloon Flying Drones for Introductory CS Education [0.0] 現在のコンピューティング教育が通常ターゲットとしているものよりも、幅広い聴衆の関心を捉えるために教育方法を適用することが不可欠である。
物理コンピューティングデバイスは、学生がコンピュータ科学を勉強しているときに、学生のモチベーションが増大していることと相関することが示されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:19:44 GMT)
Unbiased least squares regression via averaged stochastic gradient descent [0.0] 最適解 $theta*$ および Hessian matrix H を用いたオンライン最小二乗回帰問題を考える。
kge2$の場合、時間平均推定器の修正である$theta*$の偏りのない推定器を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:39:22 GMT)
Trade-off between Gradient Measurement Efficiency and Expressivity in Deep Quantum Neural Networks [0.0] 量子ニューラルネットワーク(QNN)は、実用的な量子優位性を達成するために効率的なトレーニングアルゴリズムを必要とする。
本研究では,多種多様な深部QNNにおいて,勾配測定効率と表現率の一般的なトレードオフを証明した。
本稿では, トレードオフ不平等の上限に達する安定器-論理積アンサッツ (SLPA) と呼ばれる一般QNNアンサッツを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:59:37 GMT)
Time crystal embodies chimeralike state in periodically driven quantum spin system [0.0] 相互接続された要素からなるシステムは、同期化と非同期化の特徴的な組み合わせを示す。
典型的な多体周期駆動系における離散時間結晶(DTC)の出現は、時間翻訳対称性の破れがあるときに起こる。
我々は、周期的に駆動される量子多体系における外部静的場に対して堅牢なDMC-DMBL-chimera様状態の出現に対する新しいアプローチに寄与する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:51:38 GMT)
The Surprising Effectiveness of Multimodal Large Language Models for Video Moment Retrieval [0.0] ビデオ言語タスクは空間的・時間的理解を必要とし、かなりの計算を必要とする。
本研究は,画像テキスト事前学習MLLMをモーメント検索に活用することの驚くべき有効性を示す。
我々は、Charades-STA、QVHighlights、ActivityNet Captionsといった広く使われているベンチマーク上で、新しい最先端のモーメント検索を実現する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:59:09 GMT)
The Kepler problem on the lattice [0.0] クーロンポテンシャルの存在下での3次元格子中の粒子の運動について検討する。
半古典学において、軌道は常に長方形格子として取り得る平面に留まることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 23:16:35 GMT)
The Influence of Experimental Imperfections on Photonic GHZ State Generation [0.0] 我々は,光子損失,多光子項および光子識別性が,確立された核融合プロトコルによる光子3部GHZ状態の生成に及ぼす影響について検討した。
本研究は,不完全性および発生確率に関して,異なる種類の不完全性が支配的であることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:09:23 GMT)
The Effects of Data Split Strategies on the Offline Experiments for CTR Prediction [0.0] 本研究の目的は,現在のオフライン評価手法と実世界のユースケースの矛盾に対処することである。
大規模なオープンベンチマークデータセットであるCriteo上で、ランダムスプリットとテンポラルスプリットの両方を用いて広範な実験を行う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:01:52 GMT)
The Challenges of the Nonlinear Regime for Physics-Informed Neural Networks [0.0] 非線形シナリオではNTKの視点が不足していることを示す。
線形および非線形の両方の場合において,そのような手法の収束保証について検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:05:18 GMT)
Spectral and temporal metrology with bandlimited functions and finite-time measurements [0.0] 時間周波数ベースのメロジカルプロトコルは空間領域から借りることができるが、その最終的な実用性は信号と測定の両方の帯域幅の制限によって制限される。
議論された制約の下で、量子クラムエルラオ境界の到達可能性に関する必要な操作基準を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:40:34 GMT)
SpY: A Context-Based Approach to Spacecraft Component Detection [0.0] 本稿では、カメラフィードを用いて、未知の宇宙物体(RSO)のソーラーパネル、ボディパネル、アンテナ、スラスタなどのコンポーネントを自律的に特徴付けることに焦点を当てる。
CNNは学習パターンとオブジェクト検出の実行に優れていますが、トレーニングデータとは異なる環境で検出や誤分類を見逃すことに苦労しています。
本稿では,コンテキスト知識を取り入れたCNNの一般化性を活用した,SpaceYOLOv2(SpY)と呼ばれるエンドツーエンドオブジェクト検出器を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:18:36 GMT)
Simulating The U.S. Senate: An LLM-Driven Agent Approach to Modeling Legislative Behavior and Bipartisanship [0.0] 本研究では,LSM駆動型仮想エージェントを用いた立法プロセスのシミュレーション手法を提案する。
我々は、個々の上院議員を代表するエージェントを開発し、それらを模擬委員会議論に配置した。
エージェントは現実的な議論を行い、思慮深いリフレクションを提供し、双党派の解決策を見つける能力を示した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:10:51 GMT)
Selective cooling and squeezing in a lossy optomechanical closed loop embodying an exceptional surface [0.0] 1つの光と2つの縮退する機械共振器からなる損失光学系について検討する。
特定の量子特性を調べる際に、プラケット位相から選択された共振器内の2次分散の制御を探索する。
我々は,非ハーミティシティが,異常点に近づいた冷却とスクイーズを促進させる上で,いかに重要な役割を担っているか,物理的知見を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:28:26 GMT)
Second Maximum of a Gaussian Random Field and Exact (t-)Spacing test [0.0] リーマン部分多様体上のガウス確率場の第二極大の概念を導入する。
副次的なカクライス式を利用して,最大分布の明示的な形式を導出する。
このアプローチは、これらの最大値間の間隔の評価に基づいて、正確なテストを行う。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:44:24 GMT)
Scalable, Trustworthy Generative Model for Virtual Multi-Staining from H&E Whole Slide Images [0.0] 化学染色法は信頼性が高いが、幅広い時間と高価な化学物質を必要とし、環境問題を引き起こす。
ジェネレーティブAI技術は、これらの問題に対処する上で重要である。
我々の研究は、仮想染色に生成AIを導入し、計算病理学における性能、信頼性、スケーラビリティ、適応性を向上させることを目的としている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:52:05 GMT)
Scalable tomography of many-body quantum environments with low temporal entanglement [0.0] 本研究では,量子プロセッサ上でシミュレーションされた多体環境のIMを再構築するための学習アルゴリズムについて検討する。
1次元スピンチェーン環境の例を用いて、古典的に生成されたトレーニングデータセットを用いて、このアルゴリズムが長い進化期間にわたってIMのスケーラブルな再構築を可能にすることを実証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:08:45 GMT)
Revisiting the controversy over the time-dependent Aharonov-Bohm effect [0.0] 時間依存的なアハロノフ・ボーム効果(AB)は、ソレノイド内部の磁束が時間依存的に変化する状況を考える。
この難しさは、その理論解析が4次元ミンコフスキー空間の経路に沿った直線積分を必要とするという事実に起因している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:47:53 GMT)
Revising the quantum work fluctuation framework to encompass energy conservation [0.0] 我々は、エネルギー保存を引き起こすことに起因するジャジンスキーの等式に対して、真に量子的で正の補正を導入する。
我々は、コヒーレント量子状態のエネルギー保存を確保するために、修正された2点測定方式を構築した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:00:00 GMT)
Resource overheads and attainable rates for trapped-ion lattice surgery [0.0] 本研究では,空間的に分離されたイオン表面符号間の耐故障性格子手術に必要なイオン数を推定する。
この結果から,トラップイオン量子コンピュータのスケール化のために,光カップリングの改善が急務であることが示唆された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:27:36 GMT)
Redactable Blockchain Solutions for IoT: A Review of Mechanisms and Applications [0.0] IoT(Internet of Things)とブロックチェーンテクノロジの統合は、IoTエコシステム内のデータセキュリティ、整合性、信頼性を強化するための、有望なソリューションを提供する。
ブロックチェーン技術の不変性は、データ保護法によって規定されるデータリアクション要件と矛盾する。
本稿では,ブロックチェーンとリアクション機構の現状を概観する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:03:57 GMT)
ROLCH: Regularized Online Learning for Conditional Heteroskedasticity [0.0] 大規模ストリーミングデータは、現代の機械学習アプリケーションで一般的である。
条件付きヘテロスケダスティック性に対する正規化線形分布モデルのオンライン推定手法を提案する。
我々のアルゴリズムは計算効率のよいPythonパッケージで実装されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:04:49 GMT)
Quantum-tunnelling deep neural networks for sociophysical neuromorphic AI [0.0] 量子トンネル効果を利用して情報を処理する,新しいディープニューラルネットワークアーキテクチャを導入する。
量子トンネルDNN(QT-DNN)が人間のような錯覚を認識できることを実証する。
QT-DNNのハードウェア実装は、自動運転車への応用に適した安価でエネルギー効率の良いニューロモルフィックチップをもたらすことが期待されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:49:07 GMT)
Quantum speed limit in quantum sensing [0.0] 最適時間分解能は量子速度限界(QSL)と密接に関連していることを示す。
ダイアモンド中の窒素空孔中心のスピン-1 クォートを例に、実践的な実装について議論する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:44:43 GMT)
Quantum Sensing with Nanoelectronics: Fisher Information for an Adiabatic Perturbation [0.0] 量子システムでは、従来のシステムよりも精度が向上する。
量子フィッシャー情報(QFI)は、理想的な測定値に対するパラメータ推定の精度を特徴付ける。
量子ドットナノエレクトロニクスデバイスでは、電子相互作用がQFIの指数的スケーリングとシステムサイズにつながることが示される。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:03:17 GMT)
Protecting coherence from the environment via Stark many-body localization in a Quantum-Dot Simulator [0.0] 本研究では, 局所量子コヒーレントなダイナミックな$ell-$bitを誘導するために, 半導体量子ドットアレイに磁場勾配を実装できることを示す。
これらの$ell-$bitsは、モデルが多体ローカライズされる原因である。
電子-フォノン相互作用が非局所的でない場合、これらの動的$ell-$bitとそれに対応する多体局在はフォノンを含む全てのノイズから十分に長期にわたって保護されることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:06:59 GMT)
Probability vector representation of the Schrödinger equation and Leggett-Garg-type experiments [0.0] レゲット=ガーグの不等式は、マクロ的リアリズムの原理に基づくシステムの時間的相関に縛られる。
そこで本研究では,Schr"odinger方程式の確率ベクトル表現を用いて,一般的な$N$レベルの量子系の力学を記述する手法を提案する。
また,非可換オブザーバブルの確率分布について,NSIT(No-signaling in Time)という正確な概念を定義した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 06:02:58 GMT)
Price-Wharton Constrained Colliders: Co-Causation or No Causation? [0.0] 我々は、ベル状態を持つV字型ケースに対する制約付きコライダーの接続は「絡み合いのメカニズム」ではないと主張する。
CCCは、局地性や統計的独立性に反しない実験の2つの翼間の分光的共因関係を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:20:50 GMT)
Predictive accuracy of recommender algorithms [0.0] ディープラーニングニューラルネットワークの適用を含む,レコメンデータシステムのさまざまなアルゴリズムが開発され,改良されている。
最近の研究報告は、異なる推奨アルゴリズムの相対的精度に関する洞察を得るために、慎重に制御された実験を行う必要があることを指摘している。
この調査では、従来の3つの推奨アルゴリズムと2つのディープラーニング(DL)アルゴリズムを組み合わせて、公開されている評価データのソースを使用して、比較精度を評価した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 19:25:07 GMT)
Porosity and topological properties of triply periodic minimal surfaces [0.0] 3つの周期的最小面 (TPMS) は、その構造的効率と制御可能な幾何学のために大きな関心を集めている。
本稿では, ポロシティとエントロピーとTPMSの形状因子との関係について検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:39:00 GMT)
Pointwise convergence of Fourier series and deep neural network for the indicator function of d-dimensional ball [0.0] クラツボ (2010) は球面部分和の挙動を調査し、有名なギブス・ウィルブラハム現象とピンスキー現象以外の3番目の現象を発見した。
それとは対照的に、特定のディープニューラルネットワークを与え、ポイントワイド収束を証明します。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:00:53 GMT)
Photonic quantum information processing using the frequency continuous-variable of single photons [0.0] 2光子干渉計のリッチさは時間周波数干渉計の領域にまで及ぶことを示す。
位相推定のためのハイゼンベルクスケーリングを実現するために,周波数工学的な2光子状態を用いた干渉計戦略を導入する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:58:55 GMT)
Optimal mixers restricted to subspaces and the stabilizer formalism [0.0] 与えられた部分空間を保存するミキサーの理解と構築を両立させる新しい形式主義を提示する。
我々は、我々のアプローチを論理X-ミクサーまたは論理XQAOAと呼ぶ。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:28:28 GMT)
On the effectiveness of the collapse in the Diósi-Penrose model [0.0] 崩壊がマクロスケールの古典性を保証するのに十分な効果があるという要求から得られる上限を求める。
これは、モデルをさらにテストするために、将来の実験をより直接的に行うのに役立つだろう。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:57:39 GMT)
Normalizing Flows for Conformal Regression [0.0] Conformal Prediction (CP)アルゴリズムは、ラベル付きデータに基づいて出力を校正することで予測モデルの不確実性を推定する。
キャリブレーション過程をトレーニングすることで、間隔をローカライズする一般的なスキームを提案する。
PapadopoulosらによるError Reweighting CPアルゴリズム(2008年)とは異なり、このフレームワークは名目と経験的条件の妥当性のギャップを推定できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:55:02 GMT)
Nonlocality of local Andreev conductances as a probe for topological Majorana wires [0.0] ゼロバイアス局所伝導は、Gamma_R$の変動の影響を顕著に受けていることが分かる。
トポロジ的なフェーズでは、$G_LL$と$G_RR$はどちらも$G_LL sim G_RR$で抑制される。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:30:06 GMT)
Noise reduction via optimal control in a light-matter quantum system [0.0] ショットノイズ限界以下での量子ノイズの低減は、光とマッターの量子相互作用の兆候である。
本研究では,高調波モードにおける過渡雑音低減のための2レベルシステムに対する最適量子制御法を提案する。
パルス時間の正しい選択は、ショットノイズのかなり下方にある二次場モードのノイズを低減することができる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:55:31 GMT)
Neural Methods for Amortised Inference [0.0] 統計的推論のシミュレーションに基づく手法は、過去50年間で劇的に進化し、技術進歩のペースを維持している。
結果として得られるツールは、高速なフィードフォワード操作による迅速な推論を可能にするという意味で、償却される。
本稿では, 点推定, 近似ベイズ推定, 要約統計的構成, 確率近似の文脈における最近の進歩を概観する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:27:25 GMT)
Near-Term Quantum Spin Simulation of the Spin-$\frac{1}{2}$ Square $J_{1}-J_{2}$ Heisenberg Model [0.0] J_1-J_2$Heisenbergモデルに焦点をあてる。
このモデルは、高温超伝導と結びつくかもしれない相を含む磁気状態の研究に役立つ。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:33:40 GMT)
Majorana fermion induced power-law scaling in the violation of Wiedemann-Franz law [0.0] マヨラナ境界状態による2次元トポロジカル絶縁体におけるウィーデマン・フランツの法則の違反は、単一粒子像におけるローレンツ比によって研究される。
本研究では,バチカー電圧温度プローブを用いた非弾性散乱によるMBSの存在と欠如におけるローレンツ比のスケーリングについて検討した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:51:46 GMT)
Learning Antenna Pointing Correction in Operations: Efficient Calibration of a Black Box [0.0] 運用アンテナシステムのための効率的なオフラインポインティングキャリブレーション手法を提案する。
我々の手法は校正の労力を最小化し、技術的信号情報を活用する。
本実験では,実環境における提案手法の有用性を示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:08:00 GMT)
Latent diffusion models for parameterization and data assimilation of facies-based geomodels [0.0] 拡散モデルは、ランダムノイズを特徴とする入力場から新しい地質学的実現を生成するために訓練される。
遅延拡散モデルは、ジオモデリングソフトウェアからのサンプルと視覚的に整合した実現を提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:23:23 GMT)
Indefinite Causal Structure and Causal Inequalities with Time-Symmetry [0.0] 不定因果構造に対する時間対称プロセス行列形式を考案する。
このフレームワークは、これまで考えられていたよりも多くのプロセスと、より大きな因果不等式を可能にする。
このより大きな因果不等式が、因果非分離性のデバイス非依存的な認証に新たな機会をもたらすことを実証する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:53:44 GMT)
ICTSurF: Implicit Continuous-Time Survival Functions with Neural Networks [0.0] 本研究はImplicit Continuous-Time Survival Function (ICTSurF)を紹介する。
ICTSurFは連続生存モデルに基づいて構築され、暗黙の表現を通して生存分布を構築する。
本手法は,ニューラルネットワークアーキテクチャに依存しない連続時間空間における入力を受信し,継続時間空間における生存確率を生成する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:51:44 GMT)
Graph Neural Networks for Emulation of Finite-Element Ice Dynamics in Greenland and Antarctic Ice Sheets [0.0] 同変グラフ畳み込みネットワーク(EGCN)は、氷床力学モデリングのためのエミュレータである。
EGCNはヘルハイム氷河、グリーンランド氷河、パインアイランド氷河の氷厚と速度の変化をそれぞれ260倍と44倍の速度で再現する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:18:49 GMT)
Graph Neural Network as Computationally Efficient Emulator of Ice-sheet and Sea-level System Model (ISSM) [0.0] 氷床・海面システムモデル(ISSM)のための高速エミュレータとしてグラフ畳み込みネットワーク(GCN)を設計する。
GCNはCPUベースのISSMモデリングよりも34倍高速である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:13:11 GMT)
Geode: A Zero-shot Geospatial Question-Answering Agent with Explicit Reasoning and Precise Spatio-Temporal Retrieval [0.0] 本研究では,ゼロショット地理空間的質問応答タスクを高精度に処理するための先駆的システムを提案する。
当社のアプローチは,現在の大規模言語モデルの限界に対処する上で,大幅な改善を図っている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:59:54 GMT)
Generative artificial intelligence in ophthalmology: multimodal retinal images for the diagnosis of Alzheimer's disease with convolutional neural networks [0.0] 本研究の目的は,マルチモーダル網膜イメージングと畳み込みニューラルネットワーク(CNN)を用いたアミロイドポジトロンCT(AmyloidPET)の現状予測である。
Denoising Diffusion Probabilistic Models (DDPM) は合成画像を生成するために訓練された。
単調なCNNは合成データで事前訓練され、実際のデータで微調整されたり、実際のデータでのみ訓練された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:49:26 GMT)
From Counting Stations to City-Wide Estimates: Data-Driven Bicycle Volume Extrapolation [0.0] ストリートレベルの自転車量情報は、都市が自転車を奨励するためのインフラの改善を計画するのに役立つだろう。
現在市や市民が利用できるデータは、わずかに数える駅からしか得られないことが多い。
本論文は,ベルリン全都市における自転車の容積を推定するために,これらの数箇所を超える自転車の容積を推定する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:01:53 GMT)
Foundational Models for Pathology and Endoscopy Images: Application for Gastric Inflammation [0.0] ファンデーションモデル(FM)は、多様なデータに基づいて訓練され、幅広いユースケースに適用できる機械学習モデルまたはディープラーニングモデルである。
FMは内視鏡とそれに続く病理画像解析の精度を高めるための有望なソリューションを提供する。
本総説は,FMを臨床実践に組み込むことの複雑さをナビゲートする上で,研究者や実践者にとってのロードマップを提供することを目的としている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:51:44 GMT)
Feasibility of a trapped atom interferometer with accelerating optical traps [0.0] 我々は,高帯域幅アプリケーションのためのセットアップを提案し,全体の感度を向上した。
最大103$-105$ m/s$2$の加速度は、AOD(Acousto-optic Reflector)を用いて達成できる。
適切なビームと光学安定化の限界において、10-14$ (m/s$2$)/$sqrtrm Hz$に近づく感度は1Hzで達成できる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:09:49 GMT)
Exact and approximate fluxonium array modes [0.0] 本稿では, 超伝導量子ビットフラクソニウムの線形結合配列モードに対して, 配列障害のない正確な解を提案する。
また、回路パラメータのアレイモード特性を推定する、単純で近似的な解も提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:55:31 GMT)
Evolution Dynamics Toward the Limit Cycle of a Quantum Self-Sustained Oscillator [0.0] 準調和極限サイクルを持つ量子レイリー・ヴァン・デル・ポル(RvdP)発振器の進化について検討する。
極限サイクルへの1つの進化は、他のサイクルよりもずっと長くかかり、最小時間パラメータが存在するかもしれない。
得られたダイナミクスを,コヒーレンス崩壊と固有状態占有の再分配の観点から記述する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 08:24:03 GMT)
Entanglement suppression and low-energy scattering of heavy mesons [0.0] 我々は、等スピンとスピンの自由度の両方を扱うために、テンソル積のフレームワークにおける絡み込み抑制について検討する。
絡み合いの抑制は、実際には創発的な対称性、すなわち光クォークスピン対称性をもたらす。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 03:10:53 GMT)
Enhancing Federated Learning with Adaptive Differential Privacy and Priority-Based Aggregation [0.0] フェデレートラーニング(FL)は、ローカルデータセットに直接アクセスせずにグローバルモデルを開発する。
クライアントとサーバ間で転送されるモデル更新にアクセスすることが可能で、敵に機密性の高いローカル情報を公開する可能性がある。
微分プライバシー(DP)は、パラメータにノイズを加えることでこの問題に対処するための有望なアプローチを提供する。
本稿では、クライアントの相対的影響要因に基づいてノイズを注入し、パラメータを集約するパーソナライズされたDPフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:55:07 GMT)
Encoding quantum phase-space with classical wireless microwave constellation [0.0] マイクロ波-光デジタル情報マッピングを特徴付けるために,量子力学ネットワークモデルを導入する。
情報マッピングの強度を最大化する設計ガイドラインについて論じる。
提示されたフレームワークはまた、圧縮された状態のような他の古典的でない光の状態の符号化の基盤となる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:14:26 GMT)
Effects of Using Synthetic Data on Deep Recommender Models' Performance [0.0] 本研究では,レコメンデータシステム内のデータ不均衡に対処する上で,合成データ生成の有効性について検討する。
その結果,生成した負のサンプルを挿入することで,AUC(Area Under the Curve)スコアが一貫して改善されることが判明した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:14:10 GMT)
Density Classification with Non-Unitary Quantum Cellular Automata [0.0] 密度分類(DC)タスクは1次元非単位量子セルオートマトン(QCA)を用いて研究される
2つのアプローチが考えられる: 1つは数密度を保存するもので、もう1つは多数決を行うものである。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 10:13:35 GMT)
Continuous Sign Language Recognition Using Intra-inter Gloss Attention [0.0] 本研究では,手話認識研究において,インター・グロス・アテンション・モジュール(inter-inter gloss attention module)と呼ばれる新しいモジュールを導入する。
グロス内注目モジュールでは、動画を等サイズのチャンクに分割し、各チャンク内に自己注意機構を適用する。
PHOENIX-2014ベンチマークデータセットの実験結果から,本手法が手話の特徴をエンドツーエンドで効果的に抽出できることが示されている。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 13:21:08 GMT)
Constant search time algorithm via topological quantum walks [0.0] 本研究では,探索確率を極端に改善した探索時間量子アルゴリズムの実現が可能であることを示す。
具体的には,2次元分割型量子ランダムウォークによって実現された空間探索アルゴリズムについて検討する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 21:36:47 GMT)
Computing Quantum Mean Values in the Deep Chaotic Regime [0.0] 量子作用素の平均値の時間的進化は、強大でユビキタスな古典的カオスに悩まされている。
我々のアプローチは、深いカオス体制において前例のない正確さを持つことを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:28:25 GMT)
Computational Fluid Dynamics on Quantum Computers [0.0] Qubitは計算流体力学(CFD)のための量子解に取り組んでいる
我々は、変分量子CFD(VQCFD)アルゴリズムとそれに基づく2Dソフトウェアプロトタイプを作成しました。
量子シミュレータ上でSoftware Prototypeをテストすることにより、CFDの根底にある偏微分方程式を量子コンピュータで解くことができることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 20:26:48 GMT)
Clustering in pure-attention hardmax transformers and its role in sentiment analysis [0.0] ハードマックス自己アテンションと正規化サブ層を有する変圧器の挙動を, 層数が無限大になる傾向があるため, 厳密に特徴づける。
変換器は、リーダーと呼ばれる特別な点によって決定されるクラスター平衡にインプット的に収束することを示す。
そして、この理論的理解を利用して、完全に解釈可能なトランスフォーマーモデルを用いて、言語処理から感情分析問題を解く。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 16:13:35 GMT)
Charge and Spin Dynamics and Destabilization of Shallow Nitrogen-Vacancy Centers under UV and Blue Excitation [0.0] ダイヤモンド中の低窒素空孔(NV)中心は、単一の分子レベルで光化学反応を研究する特別な機会を提供する。
光励起化学種に必要な短波長光に曝露されたNV中心の電荷とスピンダイナミクスを解析した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:51:16 GMT)
Can Public LLMs be used for Self-Diagnosis of Medical Conditions ? [0.0] 大規模言語モデル(LLM)の開発は、会話タスクにおける変換パラダイムとして進化してきた。
GeminiをGoogle検索と統合し、GPT-4.0をBing検索と統合したことで、自己診断の傾向が変化した。
自己診断作業における最先端GPT-4.0と料金ゲミニモデルの性能を比較した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 01:12:11 GMT)
CAS: Confidence Assessments of classification algorithms for Semantic segmentation of EO data [0.0] リモートセンシングにおけるセマンティックセグメンテーションアルゴリズムの信頼性評価が重要である。
セグメントと画素レベルで信頼度評価を行い,ラベルと信頼度の両方を出力するモデルを開発した。
主な応用は、セマンティックセグメンテーション下流タスクにおけるEOファンデーションモデルの評価である。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:05:49 GMT)
Benchmark Computations of Nearly Degenerate Singlet and Triplet states of N-heterocyclic Chromophores : I. Wavefunction-based Methods [0.0] 我々は,シクラジンの集合における励起エネルギーの予測における電子相関の役割について検討した。
実験では、正と負の両方が実験誤差バー内にある、ほぼ縮退したレベルが示されている。
本稿では,より安価な理論を確立するためのベンチマーク数値を作成することを目的とする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:28:42 GMT)
Autoencoder-based Anomaly Detection System for Online Data Quality Monitoring of the CMS Electromagnetic Calorimeter [0.0] 半教師付き機械学習を用いたリアルタイムオートエンコーダによる異常検出システムを提案する。
異常の時間依存性の進化を利用して異常検出性能を最大化する新しい手法を提案する。
システムの性能は、2018年と2022年のLHC衝突データに見られる異常で検証される。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 12:45:55 GMT)
Are Protein Language Models Compute Optimal? [0.0] 固定計算予算におけるモデルパラメータとトレーニングトークンの最適比について検討する。
本研究により, pLM サイズは計算予算とともにサブ線形にスケールし, モデルサイズが大きくなるにつれて性能が低下することが示された。
この研究は、より計算効率の良いPLMへの道を開き、そのトレーニングと計算生物学の実践的応用を民主化している。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 05:07:15 GMT)
Annealing-based approach to solving partial differential equations [0.0] 提案アルゴリズムは,Isingマシンを用いて変数数を増大させることなく,任意の精度で固有ベクトルの計算を可能にする。
この手法と理論解析を用いて解決した簡単な例は、適切なパラメータ設定のためのガイドラインを提供する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 22:15:27 GMT)
Analytic solution to the nonlinear generation of squeezed states in a thermal bath [0.0] ここでは, 熱光子の損失と熱浴から生じる熱状態が, 厳密な解であることを示す。
本研究では, この溶液を異なるポンプ条件下で適用し, 温度環境が2次スクイーズをいかに低減するかを詳細に示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 18:57:13 GMT)
An LLM-based Knowledge Synthesis and Scientific Reasoning Framework for Biomedical Discovery [0.0] 本稿では,生物分析支援ツールとしてLunarフレームワークを用いて開発されたBioLunarについて述べる。
このプラットフォームはLarge Language Models (LLM)を統合し、分散エビデンス空間における複雑な科学的推論を容易にする。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 14:22:46 GMT)
An Event-based Algorithm for Simultaneous 6-DOF Camera Pose Tracking and Mapping [0.0] イベントカメラは、各画素位置の強度の変化に基づいて、非同期にコンパクトなビジュアルデータを出力することができる。
我々は、その機能を評価するために、イベントのみのパイプラインの慣性バージョンを提案する。
地図推定が信頼できるならば、同等あるいはより正確な結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 02:42:30 GMT)
An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors [0.0] Support Vector Machine (SVM) は、科学や工学で広く使われている最先端の分類手法である。
そこで本稿では,SVMにおけるハイパーパラメータの範囲を定量化して最適選択を識別する,自動チューニングに基づく最適化フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 15:50:13 GMT)
Accelerated creation of NOON states with ultracold atoms via counterdiabatic driving [0.0] 量子制御プロトコルは、2つのモードでN個の超低温ボゾン原子を持つNOON状態を生成するために提案される。
この状態は、最初に全てのボソンが配置され、他の2つのモードと対称に結合された第3モードを用いて作成することができる。
この第3モードのエネルギーを他のモードのエネルギーレベルに調整することで、NOON状態の断熱的な生成が可能になる。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 11:45:53 GMT)
A Meta-Learning Method for Estimation of Causal Excursion Effects to Assess Time-Varying Moderation [0.0] 本稿では,メタ・ラーナーの観点からの因果抽出効果の推定について再検討する。
提案する推定器の特性を理論的および広範囲なシミュレーションにより比較する。
その結果, 相対効率が向上し, 既存手法の2倍頑健な代替案が提案された。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 09:04:03 GMT)
A Likelihood-Based Generative Approach for Spatially Consistent Precipitation Downscaling [0.0] この研究は、生成モデルで使用される可能性に基づく強みと敵対的損失の強みを融合させることにより、新しいアプローチを探求する。
その結果,両手法の利点を生かし,降水量削減のための可能性に基づく生成手法を提案する。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 07:32:04 GMT)
A Large-Scale Exploration of $μ$-Transfer [0.0] $mu$-Transferは、モデルのスケーリングルールを出力する。
導入者と学習率です
$mu$-Transferはまだ広く採用されていない。
最大10Bパラメータのモデルと最大190Bトークンのトレーニング予算について検討し、重要ケースの大多数を意図した$mu$-Transferが機能することを確認した。
論文参考訳(メタデータ) (Wed, 26 Jun 2024 04:07:08 GMT)