SalienDet: A Saliency-based Feature Enhancement Algorithm for Object
Detection for Autonomous Driving [160.6] 未知の物体を検出するために,サリエンデット法(SalienDet)を提案する。
我々のSaienDetは、オブジェクトの提案生成のための画像機能を強化するために、サリエンシに基づくアルゴリズムを利用している。
オープンワールド検出を実現するためのトレーニングサンプルセットにおいて、未知のオブジェクトをすべてのオブジェクトと区別するためのデータセットレザベリングアプローチを設計する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:28:33 GMT)
Scaling Data-Constrained Language Models [151.9] データ制約付きシステムにおける言語モデルのスケーリングについて検討する。
固定された計算予算に対する制約付きデータでは、反復するデータの最大4つのエポックなトレーニングは、ユニークなデータに比べて損失に対する無視可能な変化をもたらす。
本稿では,繰り返しトークンと過剰パラメータの値の減少を考慮に入れた計算最適性のスケーリング法則を提案し,実証的に検証する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:20:45 GMT)
Dynamics of magnetization at infinite temperature in a Heisenberg spin
chain [146.2] 46個の超伝導量子ビットの鎖において, チェーンの中心に伝達される磁化の確率分布である$P(mathcalM)$について検討した。
P(mathcalM)$の最初の2つの瞬間は超拡散的挙動を示し、これはKPZの指標である。
第3モーメントと第4モーメントは、KPZ予想を除外し、他の理論を評価することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:58:48 GMT)
Infinite Photorealistic Worlds using Procedural Generation [135.1] インフィニゲン(Infinigen)は、自然界のフォトリアリスティックな3Dシーンのプロシージャジェネレータである。
形状からテクスチャに至るまで、すべての資産はランダム化された数学的ルールによってゼロから生成される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:46:16 GMT)
CMMLU: Measuring massive multitask language understanding in Chinese [121.8] 本稿では, 自然科学, 社会科学, 工学, 人文科学など, さまざまな分野をカバーする総合的な中国のベンチマークを紹介する。
CMMLUは、中国語の文脈における大きな言語モデルの知識と推論能力の評価におけるギャップを埋める。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:49:51 GMT)
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.1] 鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:41:12 GMT)
Tool Learning with Foundation Models [114.3] 基礎モデルの出現により、AIシステムは、人間としてのツールの使用に等しく適応できる可能性がある。
その大きな可能性にもかかわらず、この分野における重要な課題、機会、そして将来の取り組みに関する包括的な理解はいまだに欠けている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:10:42 GMT)
Transformer-based stereo-aware 3D object detection from binocular images [110.2] 視覚変換器は、モノクロ2D/3D検出やサラウンドビュー3D検出など、様々な物体検出タスクにおいて有望な進歩を示している。
しかし、本質的で古典的なステレオ3Dオブジェクト検出で使用される場合、それらのサラウンドビュー変換器を直接採用すると、収束が遅く、精度が大幅に低下する。
この欠陥の原因の1つは、サラウンドビュー変換器がステレオ固有画像対応情報を考慮していないことである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 01:56:53 GMT)
Data-Driven Influence Functions for Optimization-Based Causal Inference [105.5] 統計的汎関数に対するガトー微分を有限差分法で近似する構成的アルゴリズムについて検討する。
本研究では,確率分布を事前知識がないが,データから推定する必要がある場合について検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:14:40 GMT)
SpeechLM: Enhanced Speech Pre-Training with Unpaired Textual Data [100.5] 本稿では,事前定義した統一表現と音声とテキストの事前学習を協調させるクロスモーダル音声言語モデル(SpeechLM)を提案する。
具体的には、音声とテキストのモダリティをブリッジするために、2つの別の離散トークン化器を導入する。
音声認識, 音声翻訳, ユニバーサル表現評価フレームワーク SUPERB など, 様々な音声言語処理タスクにおける音声LM の評価を行った。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:43:48 GMT)
Delving into 3D Action Anticipation from Streaming Videos [99.0] アクション予測は、部分的な観察でアクションを認識することを目的としている。
本稿では,いくつかの相補的評価指標を導入し,フレームワイド動作分類に基づく基本モデルを提案する。
また,全動作表現とクラス非依存行動ラベルという2つの側面から補助情報を取り入れたマルチタスク学習戦略についても検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 00:09:45 GMT)
Exploring the Application of Large-scale Pre-trained Models on Adverse
Weather Removal [97.5] ネットワークが異なる気象条件を適応的に処理できるようにするために,CLIP埋め込みモジュールを提案する。
このモジュールは、CLIP画像エンコーダによって抽出されたサンプル特定気象と、パラメータセットによって学習された分布特定情報を統合する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:06:13 GMT)
Document Entity Retrieval with Massive and Noisy Pre-training [97.3] 本稿では,Webから大規模でノイズの多いラベル付きデータを収集し,VDERモデルの学習に役立てる手法を提案する。
本論文では,UniFormerという軽量なマルチモーダルアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:21:15 GMT)
Diffusion Models for Zero-Shot Open-Vocabulary Segmentation [97.3] 本稿では,ゼロショット開語彙セグメンテーションのための新しい手法を提案する。
我々は,大規模テキスト・画像拡散モデルの生成特性を利用して,支援画像の集合をサンプリングする。
提案手法は,既存の事前学習型自己教師型特徴抽出器を自然言語で抽出するのに有効であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:51:28 GMT)
Combinatorial Pure Exploration of Multi-Armed Bandit with a Real Number
Action Class [91.4] マルチアーム・バンディット・セッティング(MAB)における純粋探査(CPE)について検討する。
プレイヤーは、theimphaction class $mathcalA$からthetimal emphaction $boldpi*$を見つけたいと思っています。
我々は,R-CPE-MABに対する,我々の複雑性に対する試料の上限と,アクションクラスに依存した下限を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:37:31 GMT)
Diplomat: A Dialogue Dataset for Situated PragMATic Reasoning [89.9] 実践的推論は、実生活で一般的に起こる暗黙的な意味を解消することを目的としており、コミュニケーション的社会的エージェントを構築するのに不可欠である。
実践的推論と位置的会話理解のための統一パラダイムを目的とした,新たなベンチマークであるDiplomatを導入する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:41:23 GMT)
SLUE Phase-2: A Benchmark Suite of Diverse Spoken Language Understanding
Tasks [88.4] 音声言語理解(SLU)タスクは、音声研究コミュニティで何十年にもわたって研究されてきた。
SLUタスクベンチマークはそれほど多くはなく、既存のベンチマークの多くは、すべての研究者が自由に利用できないデータを使っている。
最近の研究は、いくつかのタスクにそのようなベンチマークを導入し始めている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:51:09 GMT)
Can Language Models Teach Weaker Agents? Teacher Explanations Improve
Students via Theory of Mind [86.3] 我々は,Large Language Models (LLMs) がより弱いエージェントに優れた教師を提供するかどうかを検討する。
まず,教師のLLMが生徒の推論に介入して成績を向上できることを示す。
また,教師のミスアライメントを意図的に誤解させることで,学生のパフォーマンスをランダムな機会に低下させることも証明した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:27:20 GMT)
GDA: Generative Data Augmentation Techniques for Relation Extraction
Tasks [81.5] 本稿では,意味的一貫性と構文構造を両立させるために2つの相補的モジュールを用いるGDAという,関係テキスト専用の拡張手法を提案する。
低リソース環境下での3つのデータセットによる実験結果から,GDAはエム2.0%のF1改善をもたらすことが示された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:43:12 GMT)
OpenOOD v1.5: Enhanced Benchmark for Out-of-Distribution Detection [81.3] アウト・オブ・ディストリビューション(OOD)検出は、オープンワールド・インテリジェントシステムの信頼性の高い運用に不可欠である。
本稿では,OOD検出手法の精度,標準化,ユーザフレンドリな評価を保証したOpenOOD v1.5を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:28:00 GMT)
Cheap and Quick: Efficient Vision-Language Instruction Tuning for Large
Language Models [80.3] 大規模言語モデル(LLM)の有効なVL適応のための,新規で安価なソリューションを提案する。
画像エンコーダとLLMを接続するために大きなニューラルネットワークを使用する代わりに、MMAは軽量モジュール、すなわちアダプタを採用する。
MMAはまた、LLMがシングルモードとマルチモードの命令を自動シフトするのを助けるルーティングアルゴリズムも備えている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:02:41 GMT)
Single-Stage Visual Query Localization in Egocentric Videos [79.7] エンドツーエンドのトレーニングが可能なシングルステージのVQLフレームワークを提案する。
我々は,クエリとビデオフレーム間の問合せ対応を考慮し,問合せとビデオの関係を確立する。
実験により,提案手法の精度は従来のVQL手法よりも20%向上し,推論速度は10倍向上した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:57:28 GMT)
COSA: Concatenated Sample Pretrained Vision-Language Foundation Model [78.3] ほとんどの視覚言語基盤モデルは、事前トレーニングに画像テキストデータセットを使用している。
我々は,COncatenated SAmple pretrained vision- language foundation modelであるCOSAを提案する。
複数の画像テキストペアを事前学習用入力として逐次結合することで、これを実現する。
この変換により、既存の画像テキストコーパスを擬似長文ビデオパラグラフコーパスに変換する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:29:42 GMT)
When and Why Momentum Accelerates SGD:An Empirical Study [76.3] 本研究では,運動量を有する勾配降下(SGD)の性能について検討する。
運動量加速度は,更新方向に沿った方向ヘッセンの急激な跳躍を示す強調シャープニングと密接に関連していることがわかった。
モーメントは、急激な研削の発生を防止または延期することにより、SGDMの性能を向上させる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:54:21 GMT)
Multi-Temporal Relationship Inference in Urban Areas [75.9] 場所間の時間的関係を見つけることは、動的なオフライン広告やスマートな公共交通計画など、多くの都市アプリケーションに役立つ。
空間的に進化するグラフニューラルネットワーク(SEENet)を含むグラフ学習方式によるTrialの解を提案する。
SEConvは時間内アグリゲーションと時間間伝搬を実行し、位置メッセージパッシングの観点から、多面的に空間的に進化するコンテキストをキャプチャする。
SE-SSLは、位置表現学習を強化し、関係の空間性をさらに扱えるように、グローバルな方法でタイムアウェアな自己教師型学習タスクを設計する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:48:32 GMT)
Shuffle SGD is Always Better than SGD: Improved Analysis of SGD with
Arbitrary Data Orders [75.6] グラディエントDescent(SGD)アルゴリズムは、ランダムリシャッフル(RR)とシングルシャッフル(SS)を用いて、ニューラルネットワークで広く使われている。
分析の結果,ランダム単一シャッフルのSGDは古典的訓練よりも常に高速か,少なくとも良好であることが判明した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:10:57 GMT)
Fast Training of Diffusion Models with Masked Transformers [74.3] マスク付き変圧器を用いた大規模拡散モデルの学習に有効な手法を提案する。
ImageNet-256$times$256の実験は、我々の手法が最先端の拡散変換器(DiT)モデルと同じ性能を達成することを示している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:38:48 GMT)
How Does Pseudo-Labeling Affect the Generalization Error of the
Semi-Supervised Gibbs Algorithm? [73.8] 擬似ラベル付き半教師付き学習(SSL)におけるGibsアルゴリズムによる予測一般化誤差(ゲンエラー)を正確に評価する。
ゲンエラーは、出力仮説、擬ラベルデータセット、ラベル付きデータセットの間の対称性付きKL情報によって表現される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:22:45 GMT)
Learning to Imagine: Visually-Augmented Natural Language Generation [73.7] 本稿では,事前学習型言語モデル(PLM)を視覚的に拡張した自然言語gEnerationのために学習する手法を提案する。
拡散モデルを用いて、入力テキストに条件付き高品質な画像を合成する。
段落全体に対して1つの画像のみを生成するのではなく、各文に対して合成を行う。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:25:34 GMT)
Neural Relighting with Subsurface Scattering by Learning the Radiance
Transfer Gradient [73.5] 本稿では,ボリュームレンダリングによる放射移動場学習のための新しいフレームワークを提案する。
我々は、我々のコードと、地下散乱効果を持つ新しい光ステージのオブジェクトデータセットを公開します。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:56:04 GMT)
Artificial intelligence adoption in the physical sciences, natural
sciences, life sciences, social sciences and the arts and humanities: A
bibliometric analysis of research publications from 1960-2021 [73.1] 1960年には333の研究分野の14%がAIに関連していたが、1972年には全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
1960年には、333の研究分野の14%がAI(コンピュータ科学の多くの分野)に関連していたが、1972年までに全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
我々は、現在の急上昇の状況が異なっており、学際的AI応用が持続する可能性が高いと結論付けている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:08:07 GMT)
Propagating Knowledge Updates to LMs Through Distillation [72.6] 文脈に基づくアプローチは、エンティティに関する知識を付与し、その知識を広めてより広範な推論を可能にすることができることを示す。
実験により,本手法は,微調整や他の勾配に基づく知識編集手法と比較して,知識更新の伝播に有効であることが示された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:39:50 GMT)
Class-Conditional Conformal Prediction With Many Classes [71.9] 本稿では「類似」な共形スコアを持つクラスをクラスタリングするクラスタ化共形予測法を提案する。
クラスタ化されたコンフォメーションは、クラス条件カバレッジとセットサイズメトリクスの点で、既存のメソッドよりも一般的に優れています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:02 GMT)
Exploiting the Brain's Network Structure for Automatic Identification of
ADHD Subjects [70.4] 我々は脳を機能的ネットワークとしてモデル化できることを示し,ADHD被験者と制御対象とではネットワークの特定の特性が異なることを示した。
776名の被験者で分類器を訓練し,ADHD-200チャレンジのために神経局が提供する171名の被験者を対象に試験を行った。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:22:57 GMT)
Annotator Consensus Prediction for Medical Image Segmentation with
Diffusion Models [70.3] 医療画像のセグメンテーションにおける大きな課題は、複数の専門家が提供したアノテーションにおける、サーバ間の大きなばらつきである。
拡散モデルを用いたマルチエキスパート予測のための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:01:05 GMT)
Retrieving-to-Answer: Zero-Shot Video Question Answering with Frozen
Large Language Models [69.6] 本稿では,ビデオQAのためのシンプルで効果的な検索・回答(R2A)フレームワークを提案する。
R2Aは、まず、事前訓練されたマルチモーダルモデルを用いて、ジェネリックテキストコーパスから意味論的に類似したテキストの集合を検索する。
質問と検索されたテキストの両方で、LSMを直接使用して、望ましい回答を得ることができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:56:20 GMT)
Floquet time-crystals as sensors of AC fields [68.8] 本稿では,離散時間結晶(DTC)の量子センサとしての性能について論じる。
DTCによって示される長距離空間および時間順序は、指数関数的に遅い加熱をもたらし、DTCを有利なセンサーに変える。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:47:45 GMT)
Fermion production at the boundary of an expanding universe: a cold-atom
gravitational analogue [68.8] フリードマン・ロバートソン・ウォルカー時空におけるディラックフェルミオンの宇宙粒子生成現象について検討した。
ラマン光学格子における超低温原子を用いた重力アナログの量子シミュレーション手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:26:39 GMT)
Neural Fields with Hard Constraints of Arbitrary Differential Order [66.6] 我々は、ニューラルネットワークに厳しい制約を課すための一連のアプローチを開発する。
制約は、ニューラルネットワークとそのデリバティブに適用される線形作用素として指定することができる。
また、標準モデルが困難に遭遇する可能性のある問題に対して、特定のモデル表現とトレーニング戦略を設計する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:33:52 GMT)
Symmetry-Informed Geometric Representation for Molecules, Proteins, and
Crystalline Materials [66.1] 幾何戦略の有効性をベンチマークできるGeom3Dというプラットフォームを提案する。
Geom3Dは16の高度な対称性インフォームド幾何表現モデルと46の多様なデータセット上の14の幾何事前学習方法を含んでいる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:37:25 GMT)
MetricPrompt: Prompting Model as a Relevance Metric for Few-shot Text
Classification [65.5] MetricPromptは、数発のテキスト分類タスクをテキストペア関連性推定タスクに書き換えることで、言語設計の難易度を緩和する。
広範に使われている3つのテキスト分類データセットを4つのショット・セッティングで実験する。
結果から,MetricPromptは,手動弁証法や自動弁証法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:51:35 GMT)
Transferring Knowledge for Food Image Segmentation using Transformers
and Convolutions [65.5] 食品画像のセグメンテーションは、食品の皿の栄養価を推定するなど、ユビキタスな用途を持つ重要なタスクである。
1つの課題は、食品が重なり合ったり混ざったりし、区別が難しいことだ。
2つのモデルが訓練され、比較される。1つは畳み込みニューラルネットワークに基づくもので、もう1つは画像変換器(BEiT)のための双方向表現に関するものである。
BEiTモデルは、FoodSeg103上の49.4の結合の平均的交点を達成することで、従来の最先端モデルよりも優れている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:38:10 GMT)
Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.0] モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:19:34 GMT)
Inverse Scaling: When Bigger Isn't Better [65.0] 大規模言語モデル(LM)は、スケールの増大による全体的な損失に対する予測可能な改善を示している。
我々は,LMが逆スケーリングや,スケールの増大に伴うタスクパフォーマンスの悪化を示す可能性があるという主張を裏付ける証拠を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:11:23 GMT)
Spike Stream Denoising via Spike Camera Simulation [64.1] 本稿では,スパイクカメラのユニークな回路に基づくシステマティックノイズモデルを提案する。
スパイクストリームをデノナイジングするための最初のベンチマークは、クリアな(ノイズの多い)スパイクストリームを含む。
実験の結果、DnSSは提案されたベンチマークで有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:46:24 GMT)
Multi-level Purcell effect and the impact of vibrational modes in
molecular quantum optics [63.0] バイオインスパイアされた光合成二量体におけるパーセル効果の顕在化について検討した。
実効的な非エルミート的ハミルトニアンの観点からの理論図面を提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:27:40 GMT)
Full counting statistics as probe of measurement-induced transitions in
the quantum Ising chain [63.0] 局所射影測定は局所磁化の平衡外確率分布関数の修正をもたらすことを示す。
特に, 前者の確率分布が, 地域法規と容積法則で異なる振る舞いを示すかを説明する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:53:14 GMT)
Evaluating Data Attribution for Text-to-Image Models [62.8] 我々は,既存の大規模モデルを与えられた模範オブジェクトやスタイルにチューニングする「カストミゼーション」手法による属性評価を行う。
私たちのキーとなる洞察は、これによって、構築によって模範にコンピュータ的に影響される合成画像を効率的に作成できるということです。
問題の本質的な不確実性を考慮することで、一連のトレーニング画像に対してソフトな属性スコアを割り当てることができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:51 GMT)
An Energy-Based Prior for Generative Saliency [62.8] 本稿では,情報的エネルギーベースモデルを事前分布として採用する,新たな生成正当性予測フレームワークを提案する。
生成サリエンシモデルを用いて,画像から画素単位の不確実性マップを得ることができ,サリエンシ予測におけるモデル信頼度を示す。
実験結果から, エネルギーベース先行モデルを用いた生成正当性モデルでは, 精度の高い正当性予測だけでなく, 人間の知覚に整合した信頼性の高い不確実性マップを実現できることが示された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:33:07 GMT)
Efficient Self-supervised Learning with Contextualized Target
Representations for Vision, Speech and Language [60.1] data2vecは学習目標であり、いくつかのモダリティにまたがって一般化します。
マスクされたトークンをエンコードしたり、高速な畳み込みデコーダを使ったり、教師表現の構築に力を注いだりはしません。
ImageNet-1K画像分類の実験では、Data2vec 2.0は16.4倍低いトレーニング時間でMasked Autoencodersの精度と一致している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:19:22 GMT)
Enhancing Neural Rendering Methods with Image Augmentations [59.0] 本研究では,3次元シーンの学習型ニューラルレンダリング法(NRM)における画像拡張の利用について検討した。
トレーニング中に画像拡張を導入すると、幾何学的および測光的不整合などの課題が生じる。
本実験は,NRMの学習において,光学的品質向上や表面再構成など,拡張を取り入れることの利点を実証するものである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:18:27 GMT)
Linguistic Binding in Diffusion Models: Enhancing Attribute
Correspondence through Attention Map Alignment [58.9] テキスト条件付き画像生成モデルは、エンティティとその視覚的属性間の誤った関連をしばしば生成する。
本稿では、まず、エンティティとその修飾子を識別するプロンプトを構文解析するSynGenを提案する。
本研究では,テキスト・ツー・イメージ生成における文構造の利用が,テキスト・ツー・イメージ生成の忠実性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:21:44 GMT)
Probabilistic-based Feature Embedding of 4-D Light Fields for
Compressive Imaging and Denoising [58.8] 4次元光電場(LF)は、効率的かつ効果的な機能埋め込みにおいて大きな課題を提起する。
確率に基づく機能埋め込み(PFE)は、様々な低次元の畳み込みパターンを組み立てることで、機能埋め込みアーキテクチャを学ぶ。
実世界および合成4次元LF画像において,本手法の有意な優位性を実証した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:46:40 GMT)
Identifying key players in dark web marketplaces [58.7] この論文は、暗黒市場に関連するBitcoin取引ネットワークのキープレーヤーを特定することを目的としている。
取引量の大部分は、エリート市場参加者の小さなグループに集中していることを示す。
ダークウェブのマーケットプレースにおけるキープレーヤーの行動を理解することは、違法行為を効果的に破壊するために重要であることを示唆している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:30:43 GMT)
Pix2Struct: Screenshot Parsing as Pretraining for Visual Language
Understanding [58.7] Pix2Structは、純粋に視覚的な言語理解のための事前訓練された画像-テキストモデルである。
4つの領域にまたがる9つのタスクのうち6つのタスクにおいて、1つの事前訓練されたモデルが最先端の結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 21:34:23 GMT)
KIT's Multilingual Speech Translation System for IWSLT 2023 [58.5] IWSLT 2023の多言語トラックに対する音声翻訳システムについて述べる。
このタスクは、様々な量のリソースを持つ10の言語に翻訳する必要がある。
我々のケースド音声システムは、科学的な話の翻訳において、エンドツーエンドの音声よりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:38:23 GMT)
FFB: A Fair Fairness Benchmark for In-Processing Group Fairness Methods [57.2] 本稿では,グループフェアネス手法のベンチマークフレームワークであるFair Fairness Benchmark(textsfFFB)を紹介する。
グループフェアネスの異なる概念を確実にするための最先端手法を包括的に分析する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:51:28 GMT)
KoLA: Carefully Benchmarking World Knowledge of Large Language Models [56.7] 我々は知識指向LLMアセスメントベンチマーク(KoLA)を構築した。
能力モデリングでは、人間の認知を模倣して知識関連能力の4段階の分類を作成し、19ドルのタスクをカバーしている。
データには、LLMによって事前訓練されたコーパスであるウィキペディアと、継続的に収集される新興コーパスの両方を使用し、目に見えないデータを扱う能力と知識の進化を評価することを目的としています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:20:46 GMT)
NAVI: Category-Agnostic Image Collections with High-Quality 3D Shape and
Pose Annotations [55.5] NAVIは、高品質な3Dスキャンと画像ごとの2D-3Dアライメントを備えたカテゴリに依存しない画像コレクションの新しいデータセットである。
これらの2D-3Dアライメントにより,高密度画素対応,深度,セグメンテーションマップなどの正確な微分アノテーションを抽出できる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:11:30 GMT)
Second-order optimization with lazy Hessians [55.5] 一般の非線形最適化問題を解くためにニュートンの遅延ヘッセン更新を解析する。
我々は、メソッドの各ステップで新しい勾配を計算しながら、これまで見られたヘッセン反復を再利用する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:25:04 GMT)
PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal
Distillation for 3D Shape Recognition [55.4] 本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。
複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:21:09 GMT)
LVLM-eHub: A Comprehensive Evaluation Benchmark for Large
Vision-Language Models [55.3] 本稿では,LVLM評価ハブ(LVLM-eHub)の構築により,一般公開された大規模マルチモーダルモデルの包括的評価を行う。
我々のLVLM-eHubは、InstructBLIPやMiniGPT-4などの代表的LVLMから成り、定量的能力評価とオンラインアリーナプラットフォームによって徹底的に評価されている。
この研究は、いくつかの革新的な発見を明らかにしている。まず、インストラクタBLIPのような膨大なドメイン内データを持つ命令調整型LVLMは、多くの既存のタスクを過度にオーバーフィットさせ、オープンワールドのシナリオでは一般化が不十分である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:39:24 GMT)
Reconstructing the somatotopic organization of the corticospinal tract
remains a challenge for modern tractography methods [55.1] CST(Corticospinal tract)は、人間の脳において、身体の自発的な動きを制御できる重要なホワイトマター線維である。
拡散MRIトラクトグラフィーは、ヒトの健康におけるCST経路の解剖学的および変動性の研究を可能にする唯一の方法である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:04:37 GMT)
ATCO2 corpus: A Large-Scale Dataset for Research on Automatic Speech
Recognition and Natural Language Understanding of Air Traffic Control
Communications [51.2] 本稿では,ATC分野の研究を促進するためのデータセットであるATCO2コーパスを紹介する。
ATCO2コーパスは3つのサブセットに分けられる。
我々はATCO2コーパスが堅牢なASRとNLUの研究を促進することを期待している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:53:05 GMT)
Differentially Private Domain Adaptation with Theoretical Guarantees [51.2] 多くのアプリケーションでは、ラベル付きデータの処分におけるラベル付きデータはプライバシー上の制約を受けており、比較的制限されている。
これは、パブリックソースからプライベートターゲットドメインへのドメイン適応を監督する現代の問題である。
我々は、理論的な学習保証の恩恵を受けるために、一般の学習者を利用する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:03:06 GMT)
Non-Asymptotic Performance of Social Machine Learning Under Limited Data [51.1] 本研究では,社会機械学習フレームワークに関連付けられた誤りの確率について検討する。
このフレームワークは、ラベルのないデータのストリームを分散的に分類する問題に対処する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:42:14 GMT)
Quantum Current and Holographic Categorical Symmetry [51.0] 量子電流は、任意の長距離にわたって対称性電荷を輸送できる対称作用素として定義される。
量子電流は、ドリンフェルト中心$Z_(mathcalC)$の物体と正確に一致する。
固定点モデルでは、凝縮された量子電流が$Z_(mathcalC)$でラグランジアン代数を形成し、境界バルク対応がリッチな設定で検証されることが証明された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:52:37 GMT)
Macaw-LLM: Multi-Modal Language Modeling with Image, Audio, Video, and
Text Integration [50.9] 視覚情報,音声情報,テキスト情報をシームレスに統合する新しい多モード大言語モデル(LLM)を提案する。
Macaw-LLMは、マルチモーダルデータを符号化するモダリティモジュール、事前訓練されたLLMを利用する認知モジュール、多様な表現を調和させるアライメントモジュールの3つの主要コンポーネントから構成される。
我々は,69K画像インスタンスと50Kビデオインスタンスを含む,大規模なマルチモーダル・インストラクション・データセットを構築した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:45:25 GMT)
Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [50.4] 本研究では,拡散モデルのデータ生成過程を離散時間で理解するために,非漸近理論のスイートを開発する。
収束率は1/sqrtT$に比例し、最先端の理論と一致する。
2つの加速変種を設計し、その収束性を改善してODEベースのサンプルラーに1/T2$、DDPMタイプのサンプルラーに1/T$とする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:30:08 GMT)
UrbanIR: Large-Scale Urban Scene Inverse Rendering from a Single Video [49.6] 映像からの新たな照明条件下でシーンのリアルで自由視点のレンダリングを可能にするモデルを構築する方法について述べる。
我々の手法 - UrbanIR: Urban Scene Inverse Rendering - はビデオから逆グラフィック表現を計算する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:59 GMT)
Debiasing Recommendation by Learning Identifiable Latent Confounders [49.2] コンバウンディングバイアスは、ユーザの露出とフィードバックの両方に影響を与える未測定変数の存在によって生じる。
既存の手法では,(1) 未測定変数について不確定な仮定を行うか,(2) 潜伏した共同創設者を直接ユーザの露出から推測する。
本稿では、上記の非識別問題の解決にプロキシ変数の集合を利用する新しい方法、すなわち、識別可能なデコノウ(iDCF)を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:21:32 GMT)
Visual Information Extraction in the Wild: Practical Dataset and
End-to-end Solution [48.7] 視覚情報抽出(VIE)のためのカメラ画像からなる大規模データセットを提案する。
我々は,OCRの段階と情報抽出をエンド・ツー・エンドの学習方式で組み合わせた,エンド・ツー・エンドVIEのための新しいフレームワークを提案する。
提案したデータセット上で既存のVIEのエンド・ツー・エンド手法を評価し,これらの手法の性能がSROIEから提案したデータセットに相違があることを観察した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:31:12 GMT)
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image
Encoders and Large Language Models [48.6] BLIP-2は視覚言語による事前学習のための汎用的で効率的な事前学習戦略である。
市販のフリーズイメージエンコーダとフリーズされた大型言語モデルから、ビジョン言語による事前トレーニングをブートストラップする。
BLIP-2は、既存の手法に比べてトレーニング可能なパラメータが大幅に少ないにもかかわらず、様々な視覚言語タスクにおける最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:57:29 GMT)
DiffRoom: Diffusion-based High-Quality 3D Room Reconstruction and
Generation with Occupancy Prior [48.4] DiffRoomは,高品位な室内3次元再現・生成の課題に対処するための新しいフレームワークである。
KinectFusionのインクリメンタルアライメントとローカルSDFの融合に着想を得て,拡散型TSDF融合法を提案する。
学習を容易にするために,カリキュラム拡散学習パラダイムを導入し,学習の収束過程を高速化する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:52:29 GMT)
Exploring Resolution Fields for Scalable Image Compression with
Uncertainty Guidance [48.0] 本研究では,スケーラブルな画像圧縮における分解能場の可能性について検討する。
本稿では,より適応的で多目的な圧縮を実現するための相互ピラミッドネットワーク(RPN)を提案する。
実験は、既存の古典的およびディープラーニングベースのスケーラブルコーデックに対するRPNの優位性を示している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:26:24 GMT)
A Review on Quantum Approximate Optimization Algorithm and its Variants [47.9] 量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm、QAOA)は、難解な最適化問題を解くことを目的とした、非常に有望な変分量子アルゴリズムである。
この総合的なレビューは、様々なシナリオにおけるパフォーマンス分析を含む、QAOAの現状の概要を提供する。
我々は,提案アルゴリズムの今後の展望と方向性を探りながら,選択したQAOA拡張と変種の比較研究を行う。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:28:12 GMT)
QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [47.9] 我々は、2,399分子動力学軌道に対して正確なハミルトン行列を提供するために、QH9と名付けられた新しい量子ハミルトンデータセットを生成する。
現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:39:07 GMT)
The Devil is in the Details: On the Pitfalls of Event Extraction
Evaluation [46.1] イベント抽出(EE)は、テキストからイベントを抽出することを目的とした重要なタスクである。
本稿では,脳波評価の信頼性を確認し,大きな落とし穴を3つ同定する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:23:57 GMT)
SSCBench: A Large-Scale 3D Semantic Scene Completion Benchmark for
Autonomous Driving [45.8] SSCBenchは、広く使用されている自動車データセットのシーンを統合するベンチマークである。
SSCBenchはコミュニティで確立された設定とフォーマットに従っている。
SSCBench上での最先端アルゴリズムの評価を行う。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:56:33 GMT)
On the Feasibility of Cross-Task Transfer with Model-Based Reinforcement
Learning [45.7] 最新のモデルベースRLアルゴリズムで学習した内部モデルが、新しい明らかに異なるタスクを高速に解くために活用できるかどうかを考察する。
我々は,学習世界のモデルのスケーラブルな事前学習と微調整が可能な,サンプル効率の高いオンラインRLのためのフレームワークであるModel-Based Cross-Task Transfer (XTRA)を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:57:18 GMT)
Emotional Speech-Driven Animation with Content-Emotion Disentanglement [45.7] EMOTEは、感情表現の明示的な制御を可能にしながら、リップシンクを維持する3Dトーキングヘッドアバターを生成する。
我々は、音声依存コンテンツを保存するために、唇読取目的の形でEMOTEを更なる監督で訓練する。
音声に同期した唇の動きを維持しながら、同じ音声上で異なる感情を監督するために、コンテンツ・感情交換機構を用いる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:31:31 GMT)
FedMultimodal: A Benchmark For Multimodal Federated Learning [45.0] フェデレートラーニング(FL)は、データプライバシの課題に取り組むための、新たな機械学習技術になりつつある。
コンピュータビジョン、オーディオ、自然言語処理などの分野でFLに多大な努力を払っているにもかかわらず、マルチモーダルデータストリームを利用したFLアプリケーションは、ほとんど探索されていない。
FedMultimodalは10個の一般的なデータセットから5つの代表的マルチモーダルアプリケーションをカバーするマルチモーダル学習のための最初のFLベンチマークである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:31:26 GMT)
Towards Benchmarking and Improving the Temporal Reasoning Capability of
Large Language Models [44.7] 本研究では,大規模言語モデルの時間的推論能力を評価するために,総合的な探索データセットテンプレートを導入する。
我々のデータセットには3つの時間的推論レベルに関する質問が含まれている。
また,大規模言語モデルの時間的推論能力を向上させるための新しい学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:44:41 GMT)
Active Representation Learning for General Task Space with Applications
in Robotics [44.4] 本稿では,テキスト対話型表現学習のためのアルゴリズムフレームワークを提案する。
この枠組みの下では、双線型および特徴ベースの非線形ケースから一般的な非線形ケースまで、いくつかのインスタンス化を提供する。
我々のアルゴリズムは平均で20%-70%のベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:27:50 GMT)
InstructBLIP: Towards General-purpose Vision-Language Models with
Instruction Tuning [43.5] 我々は、事前訓練されたBLIP-2モデルに基づいて、視覚言語による指導のチューニングについて研究する。
InstructBLIPは、13のホールトアウトデータセットすべてにわたって、最先端のゼロショットパフォーマンスを実現する。
私たちのモデルは、個々の下流タスクに微調整された場合、最先端のパフォーマンスももたらします。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:00:18 GMT)
RecFusion: A Binomial Diffusion Process for 1D Data for Recommendation [43.2] 本稿では,レコメンデーションのための拡散モデルからなるRecFusionを提案する。
1次元ベクトル上での拡散を定式化し、2次元拡散を提案する。
提案する拡散モデルでは,MRIやCTなどの医療領域において,推奨システム以上の意味を持つ。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:39:24 GMT)
Hyperbolic Representation Learning: Revisiting and Advancing [43.2] 本稿では,現在普及しているhlmを精査する位置追跡機構を導入し,学習された表現が準最適で不満足であることを明らかにする。
本稿では,ノードの双曲的距離から推定されるコストフリーな階層的情報を原点に組み込むことにより,シンプルで効果的な情報埋め込み手法であるハイボリックインフォメーション(HIE)を提案する。
提案手法は, 競合するベースラインに比べて最大21.4%向上した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:25:39 GMT)
Deep Learning for Energy Time-Series Analysis and Forecasting [42.6] エネルギー時系列分析(Energy time-series analysis)は、過去のエネルギー観測とおそらく外的要因を分析し、未来を予測するプロセスを記述する。
広範囲の視覚タスクにおけるDeep Learning(DL)の異常なパフォーマンスに続いて、DLモデルは時系列予測タスクでうまく活用されている。
本稿では,エネルギー時系列予測タスクの性能向上を目的とした多種多様なDL手法について考察する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:41:59 GMT)
Crowd-Powered Photo Enhancement Featuring an Active Learning Based Local
Filter [42.4] コンテンツ認識型ローカルエンハンスメントのための,クラウドを利用したローカルエンハンスメント手法を提案する。
パラメータの局所最適化を容易にするために,能動的学習に基づく局所フィルタを提案する。
実験の結果,提案フィルタは既存のフィルタよりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:55:11 GMT)
DreamHuman: Animatable 3D Avatars from Text [41.3] 本研究では,テキスト記述のみから現実的な3次元アバターモデルを生成するDreamHumanを提案する。
我々の3Dモデルは、外観、衣服、肌のトーン、体形が多様であり、一般的なテキストから3Dへのアプローチと、以前のテキストベースの3Dアバタージェネレータを視覚的忠実度で大幅に上回っている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:58:21 GMT)
Encyclopedic VQA: Visual questions about detailed properties of
fine-grained categories [41.2] Encyclopedic-VQAは、細かなカテゴリやインスタンスの詳細な特性に関する視覚的な質問を含む大規模な視覚的質問応答(VQA)データセットである。
私たちのデータセットには、Wikipediaから派生した制御された知識ベースがあり、各回答をサポートする証拠をマークしています。
本研究では,知識ベースから関連情報を抽出する機構により,大規模モデルの強化により,百科事典的質問への回答の進展が達成できることを実験的に示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:03:01 GMT)
On Strengthening and Defending Graph Reconstruction Attack with Markov
Chain Approximation [40.2] 本研究は,ノードの隣接性を再構築することを目的としたグラフ再構成攻撃の総合的研究である。
我々は、GNNにおける様々な要因が、驚くほどのプライベートリンクの漏洩につながることを示している。
そこで我々は,(1)よりプライベートな情報を抽出する適応設計のチェーンベース攻撃法,(2)精度の低い攻撃忠実度を鋭く低減するチェーンベース防御法,という2つの情報理論誘導機構を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:00:56 GMT)
ViP: A Differentially Private Foundation Model for Computer Vision [40.1] 本稿では,差分プライバシ(DP)を保証した基礎視覚モデルを学習するためのレシピを提案する。
マスク付きオートエンコーダをDP-SGDに適合する適切な学習アルゴリズムとして同定する。
我々は、標準の下流視覚タスクを用いて、VIPが学習した表現の質を評価する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:06:24 GMT)
CAD-Estate: Large-scale CAD Model Annotation in RGB Videos [40.0] 本稿では,オブジェクトのグローバルな3D表現を用いて,複雑なマルチオブジェクトシーンのビデオに注釈を付ける手法を提案する。
データベースから各オブジェクトにCADモデルをアノテートし,9-DoFのポーズ変換でシーンの3次元座標フレームに配置する。
われわれのデータセットCAD-Estateは、21Kビデオの3D表現に配置された12KユニークなCADモデルの108Kインスタンスを提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:12:02 GMT)
Estimating Generic 3D Room Structures from 2D Annotations [39.8] 本稿では,2次元セグメンテーションマスクのみから汎用的な3次元部屋レイアウトを生成する手法を提案する。
これらの2次元アノテーションに基づいて,構造要素とその空間的範囲の3次元平面方程式を自動再構成する。
YouTubeビデオを含むRealEstate10kデータセット上に2266の3Dルームレイアウトをリリースする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:10:27 GMT)
Relational Temporal Graph Reasoning for Dual-task Dialogue Language
Understanding [39.8] デュアルタスクダイアログ理解言語は、2つの相関ダイアログ言語理解タスクを、その固有の相関を通じて同時に扱うことを目的としている。
我々は、リレーショナル時間グラフ推論(Relational temporal graph reasoning)が中心となる新しいフレームワークを提唱した。
私たちのモデルは最先端のモデルよりも大きなマージンで優れています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:19:08 GMT)
Calibrate and Debias Layer-wise Sampling for Graph Convolutional
Networks [39.6] 本稿では,行列近似の観点からアプローチを再考する。
本稿では,サンプリング確率と効率的なデバイアスアルゴリズムを構築するための新しい原理を提案する。
改良は、推定分散の広範囲な解析と、一般的なベンチマークの実験によって実証される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:26:40 GMT)
INSTRUCTEVAL: Towards Holistic Evaluation of Instruction-Tuned Large
Language Models [39.5] INSTRUCTEVALは、命令調整された大規模言語モデルのために特別に設計された、より包括的な評価スイートである。
我々は,事前学習の基礎,指導指導データ,訓練方法など,モデル性能に影響を与える諸要因を総合的に分析する。
その結果, モデル性能のスケーリングにおいて, 命令データの品質が最も重要な要因であることが判明した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:08:56 GMT)
Augmenting Rule-based DNS Censorship Detection at Scale with Machine
Learning [38.0] ドメイン名システム(DNS)の検閲は、異なる国で使用される重要なメカニズムである。
本稿では,機械学習(ML)モデルが検出プロセスの合理化にどのように役立つかを検討する。
検閲されていないインスタンスのみに基づいてトレーニングされた教師なしモデルは、既存のプローブが見逃した新しいインスタンスと検閲のバリエーションを特定することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:52:14 GMT)
Exploring Diverse In-Context Configurations for Image Captioning [37.2] Vision-Languageドメインの研究者たちは、最も単純な方法、すなわちランダムサンプリングを使って、テキスト内の画像とテキストのペアを設定する。
画像選択のための4つの戦略と、キャプション代入のための4つの戦略を考案し、画像キャプションのためのインテキスト画像-テキストペアを設定した。
我々の総合的な実験は2つの反直感的だが価値ある洞察を与え、マルチモーダル・シナジーによるビジョン・ランゲージ・イン・コンテクスト学習の特徴を強調した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:05:04 GMT)
Motion Comfort Optimization for Autonomous Vehicles: Concepts, Methods,
and Techniques [37.0] 本稿では、人間の快適性の観点から、自律運転と関連する補完的枠組みのアーキテクチャを概説する。
同時に、本論文では、自動運転の構造と自動運転の反応時間に関する技術を紹介する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:32:04 GMT)
Action Sensitivity Learning for the Ego4D Episodic Memory Challenge 2023 [36.9] 本稿では、CVPR 2023のEgo4D Episodic Memory Benchmarkの2つのトラックにReLERを提出する。
この手法は提案したASL(Action Sensitivity Learning framework)を継承し,フレームの分散情報をよりよく取得する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:50:17 GMT)
DreamSim: Learning New Dimensions of Human Visual Similarity using
Synthetic Data [36.6] 現在の知覚的類似度メトリクスは、ピクセルとパッチのレベルで動作します。
これらのメトリクスは、低レベルの色やテクスチャの観点から画像を比較するが、画像レイアウト、オブジェクトポーズ、セマンティック内容の中間レベルの類似点や相違点をキャプチャできない。
我々は,画像の全体的評価を行う知覚的指標を開発した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:50 GMT)
On Pre-Training for Visuo-Motor Control: Revisiting a
Learning-from-Scratch Baseline [35.9] データ拡張と浅いConvNetを組み込んだシンプルなLearning-from-Scratch(LfS)ベースラインを再検討する。
このベースラインは、大規模な視覚データセットでトレーニングされた凍結した視覚表現を活用する最近のアプローチと驚くほど競合している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:57:21 GMT)
Private Federated Frequency Estimation: Adapting to the Hardness of the
Instance [35.6] より実用的なマルチラウンドFEE設定の下では、カウントスケッチの単純な適応は厳密に準最適であることを示す。
そこで本研究では,より高精度なハイブリッドスケッチアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:30:03 GMT)
Language-Guided Music Recommendation for Video via Prompt Analogies [35.5] 本稿では,ユーザが自由形式の自然言語で楽曲選択をガイドできるようにし,入力ビデオに楽曲を推薦する方法を提案する。
既存の音楽ビデオデータセットは、必要な(ビデオ、音楽)トレーニングペアを提供するが、音楽のテキスト記述は欠落している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:58:01 GMT)
Re-thinking Model Inversion Attacks Against Deep Neural Networks [34.9] モデルインバージョン(MI)攻撃は、モデルへのアクセスを悪用することで、プライベートトレーニングデータを推論し、再構築することを目的としている。
MIの最近のアルゴリズムは攻撃性能を改善するために提案されている。
我々は、すべての最先端(SOTA)MIアルゴリズムに関する2つの基本的な問題について研究する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:00:24 GMT)
E-Calib: A Fast, Robust and Accurate Calibration Toolbox for Event
Cameras [34.7] E-Calibは、イベントカメラの新しい、高速で、堅牢で、正確なキャリブレーションツールボックスである。
提案手法は,様々なイベントカメラモデルに対する様々な厳密な実験で検証される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:16:38 GMT)
Langevin Thompson Sampling with Logarithmic Communication: Bandits and
Reinforcement Learning [34.4] トンプソンサンプリング(TS)は、使用が容易で、経験的性能に訴えるため、シーケンシャルな意思決定に広く用いられている。
バッチ化された$textitLangevin Thompson Sampling$アルゴリズムを提案する。
アルゴリズムは計算効率が高く,MABでは$mathcalO(log T)$,RLでは$mathcalO(sqrtT)$と同じオーダー最適後悔保証を維持している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 01:16:29 GMT)
Improving Speech Enhancement Performance by Leveraging Contextual Broad
Phonetic Class Information [33.8] 音声強調のための追加情報として,音節属性の文脈情報について検討する。
本稿では,エンド・ツー・エンドの自動音声認識モデルによる損失を利用してSE性能を向上させることを提案する。
その結果,文脈的BPC情報によりSE性能が向上することが確認された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:39:47 GMT)
Efficient Token-Guided Image-Text Retrieval with Consistent Multimodal
Contrastive Training [33.8] 画像テキスト検索は、視覚と言語間の意味的関係を理解するための中心的な問題である。
以前の作品では、全体像とテキストの粗い粒度の表現を単に学習するか、画像領域またはピクセルとテキストワードの対応を精巧に確立する。
本研究では、粗い表現学習ときめ細かい表現学習を統一した枠組みに組み合わせて、新しい視点から画像テキストの検索を行う。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 00:19:13 GMT)
An Efficient and Multi-private Key Secure Aggregation for Federated
Learning [33.1] フェデレート学習のための効率的かつ多目的な鍵セキュアアグリゲーション手法を提案する。
具体的には、変種ElGamal暗号を巧みに修正し、同型加算演算を実現する。
高次元深層モデルパラメータに対しては,多次元データを1次元に圧縮する超増進シーケンスを導入する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:05:36 GMT)
Xiezhi: An Ever-Updating Benchmark for Holistic Domain Knowledge
Evaluation [33.0] 我々は、総合的なドメイン知識を評価するために設計された最も包括的な評価スイートであるXiezhiを紹介する。
Xiezhiは、13の被験者から249,587の質問、Xiezhi- SpecialtyとXiezhi-Interdisciplineを伴い、15kの質問を含む516の多様な分野にわたる複数の選択の質問で構成されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:51:40 GMT)
Segment Any Point Cloud Sequences by Distilling Vision Foundation Models [32.8] Sealは、さまざまな自動車のポイントクラウドシーケンスをセグメント化するためのビジョンファウンデーションモデル(VFM)を利用するフレームワークである。
Sealはスケーラビリティ、一貫性、一般化性という3つの魅力的な特性を示している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:54 GMT)
Graph Propagation Transformer for Graph Representation Learning [32.8] グラフ伝搬注意(GPA)と呼ばれる新しい注意機構を提案する。
ノード・ツー・ノード、ノード・ツー・エッジ、エッジ・ツー・ノードという3つの方法で、ノードとエッジ間で明示的に情報を渡す。
提案手法は,多くの最先端のトランスフォーマーベースグラフモデルよりも優れた性能を有することを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:55:59 GMT)
Centroid Distance Keypoint Detector for Colored Point Clouds [32.7] キーポイント検出は多くのコンピュータビジョンとロボティクスアプリケーションの基礎となる。
そこで本研究では,色点雲中の幾何塩分と色塩分の両方のキーポイントを抽出できる効率的なマルチモーダルキーポイント検出器を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:43:24 GMT)
Seeing the World through Your Eyes [32.1] 人間の目の反射的な性質は、私たちの周りの世界がどのように見えるかという、未熟な情報源です。
本稿では,眼の反射を含むポートレート画像を用いて,カメラの視線を越えて3次元シーンを再構成する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:59 GMT)
Residual Q-Learning: Offline and Online Policy Customization without
Value [31.9] イミテーション・ラーニング(Imitation Learning, IL)は、実演から模倣行動を学ぶためのフレームワークである。
政策カスタマイズと呼ばれる新しい問題設定を定式化する。
本稿では,従来の政策を活かして定式化MDPを解くための新しいフレームワークであるResidual Q-learningを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:01:19 GMT)
Human Preference Score v2: A Solid Benchmark for Evaluating Human
Preferences of Text-to-Image Synthesis [31.8] 近年のテキスト・ツー・イメージ生成モデルでは,テキスト入力から高忠実度画像を生成することができる。
HPD v2は、幅広いソースの画像上の人間の好みをキャプチャする。
HPD v2は、430,060対の画像に対して798,090人の好みの選択を含む。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:31 GMT)
Feed Two Birds with One Scone: Exploiting Wild Data for Both
Out-of-Distribution Generalization and Detection [31.7] そこで本稿では,未ラベルのデータを野生で自由に利用できるように活用する,マージンベースの学習フレームワークを提案する。
我々は,提案した限界制約がOOD一般化と検出の両方を達成する鍵であることを実証的および理論的に示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:32:35 GMT)
PINNacle: A Comprehensive Benchmark of Physics-Informed Neural Networks
for Solving PDEs [31.5] このギャップを埋めるために設計されたベンチマークツールであるPINNacleを紹介する。
PINNacleは、さまざまなドメインから20以上の異なるPDEを含む、多様なデータセットを提供する。
PINNacleはユーザフレンドリーなツールボックスも提供しており、システム評価と比較のために約10の最先端のPINNメソッドが組み込まれている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:49:05 GMT)
Tighter Prediction Intervals for Causal Outcomes Under Hidden
Confounding [31.3] 本稿では,因果関係の間隔を変調アンサンブルによって特徴づけるCaus-Modensを紹介する。
ベイズ統計から動機づけられたカス=モザンスは、必要な間隔サイズによって測定された、実際により厳密な結果間隔を与える。
最後のベンチマークは、未知だが調査可能な地上の真理を持つ観測実験に、GPT-4の新たな使用法である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 21:42:40 GMT)
Spatiotemporal-Augmented Graph Neural Networks for Human Mobility
Simulation [30.7] 位置の動的時間的影響をモデル化する新しい枠組みを提案する。
このフレームワークは、行動対応を捉えるために様々な時間グラフを構築し、場所の様々な居住地をシミュレートする新しいブランチを構築している。
私たちのコードは公開されます。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:47:45 GMT)
Graph Convolution Based Efficient Re-Ranking for Visual Retrieval [29.8] 特徴を更新することで、初期検索結果を洗練する効率的な再ランク付け手法を提案する。
具体的には、グラフ畳み込みネットワーク(GCN)に基づく再ランク付けを再構成し、特徴伝搬による視覚的検索タスクのための新しいグラフ畳み込みベース再ランク付け(GCR)を提案する。
特に、平面GCRは、クロスカメラ検索のために拡張され、異なるカメラ間の親和性関係を活用するために、改良された特徴伝搬定式化が提示される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 00:28:08 GMT)
Stable Tomography for Structured Quantum States [29.7] 実験的測定から量子状態の再構成は、量子デバイスの検証とベンチマークに不可欠である。
ノイズや中間スケールの量子コンピュータによって生成される状態のような多くの物理量子状態は通常、構造化される。
圧縮センシングのツールと経験過程の理論を用いて,MPOの安定回復の理論的保証を確立する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:23:55 GMT)
Enhancing Quality of Pose-varied Face Restoration with Local Weak
Feature Sensing and GAN Prior [29.2] 本稿では,前向きに顔の再生を行うブラインド・フェイス・リカバリ・ネットワークを提案する。
我々のモデルは、顔の復元や顔の超解像処理において、従来の技術よりも優れている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:24:58 GMT)
Resolving the Human Subjects Status of Machine Learning's Crowdworkers [29.0] MLクラウドソーシング研究の適切な指定について検討する。
私たちは、MLがもたらす2つの課題を強調します。同じ労働者のセットが複数の役割を担い、さまざまな情報を提供することができます。
我々の分析は、研究者がデータ収集と分析を別々の研究に分割することで、研究倫理の監督を免れるという共通規則の潜在的な抜け穴を露呈する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:10:08 GMT)
STARSS23: An Audio-Visual Dataset of Spatial Recordings of Real Scenes
with Spatiotemporal Annotations of Sound Events [28.7] 本稿では,音声-視覚的音声イベントの局所化・検出(SELD)タスクを提案する。
マルチチャンネルオーディオと方向情報を用いて、ターゲット音事象の時間的アクティベーションDOAを推定する。
我々は、マイクロホンアレイで記録されたマルチチャンネルオーディオデータからなるオーディオ映像データセット、Sony-TAu Realistic Spatial Soundscapes 2023(STARSS23)を紹介する。
評価の結果,音声ビジョンSELDシステムでは,音声のみのシステムよりもローカライズ誤差が低いことがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:37:14 GMT)
Mind2Web: Towards a Generalist Agent for the Web [28.5] Mind2Webは、Webのためのジェネラリストエージェントの開発と評価のための最初のデータセットである。
31のドメインにまたがる137のWebサイトから2,000以上のオープンエンドタスクが収集され、Mind2WebはジェネラリストWebエージェントを構築するために必要な3つの材料を提供する。
Mind2Webをベースとして,汎用的なWebエージェントを構築するために,大規模言語モデル(LLM)を最初に検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:50:30 GMT)
Accelerating Dynamic Network Embedding with Billions of Parameter
Updates to Milliseconds [28.0] 本稿では,ノードごとの更新ではなく,埋め込み空間の軸を回転させ,拡張する新しい動的ネットワーク埋め込みパラダイムを提案する。
具体的には,DAMF(Dynamic Adjacency Matrix Factorization)アルゴリズムを提案する。
異なるサイズの動的グラフ上でのノード分類、リンク予測、グラフ再構成の実験は、DAMFが動的ネットワーク埋め込みを進めることを示唆している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:02:17 GMT)
Challenges of Using Real-World Sensory Inputs for Motion Forecasting in
Autonomous Driving [28.0] 動き予測は、ロボットが周囲のエージェントや計画の将来の軌道を予測できるようにする上で重要な役割を果たす。
既存の予測方法は、現実世界の知覚パイプラインが提供できるものに忠実でない、キュレートされたデータセットに依存することが多い。
本稿では、知覚モジュールによって入力が提供されるこの現実的な環境に、動き予測モデルを導入する際の課題を明らかにすることを目的とする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:03:14 GMT)
UniOcc: Unifying Vision-Centric 3D Occupancy Prediction with Geometric
and Semantic Rendering [27.7] 我々は、ビジョン中心の3D占有率予測トラックにUniOCCというソリューションを提示する。
我々のソリューションは、単一のモデルで公式のリーダーボード上で51.27% mIoUを達成した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:23:57 GMT)
Optimal Best-Arm Identification in Bandits with Access to Offline Data [27.4] オフラインデータとオンライン学習を組み合わせることを検討する。
差分$が小さい場合、サンプルの複雑さに基づいて低い境界に一致するアルゴリズムを開発する。
我々のアルゴリズムは, サンプル当たりの平均取得コストが$tildeO(K)$で計算的に効率的であり, 下界問題の最適条件の注意深い評価に頼っている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:12:35 GMT)
Re-Benchmarking Pool-Based Active Learning for Binary Classification [27.3] アクティブラーニング(英: Active Learning)は、ラベル付きデータを取得する際の機械学習モデルの性能を大幅に向上させるパラダイムである。
アクティブな学習戦略を評価するためのベンチマークはいくつか存在するが、それらの発見はいくつかの誤解を示している。
この不一致は、コミュニティのために透明で再現可能なベンチマークを開発する動機となります。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:47:50 GMT)
Tighter Information-Theoretic Generalization Bounds from Supersamples [27.1] 本稿では,学習アルゴリズムのための情報理論の新たな一般化境界について述べる。
提示される境界は平方根境界、高速レート境界を含み、分散と鋭さに基づく境界を含む。
理論的あるいは経験的に、これらの境界は、同じスーパーサンプル設定で知られているすべての情報理論境界よりも厳密であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:46:14 GMT)
Revisiting Hate Speech Benchmarks: From Data Curation to System
Deployment [26.5] GOTHateは、Twitterからヘイトスピーチを検出するために約51万の投稿をクラウドソースした大規模クラウドソースデータセットである。
最近の10のベースラインでベンチマークを行い、内因性信号の追加がヘイトスピーチ検出タスクをどのように強化するかを検討する。
我々のHEN-mBERTは多言語混合実験モデルであり、潜在内因性信号で言語的部分空間を豊かにする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:37:34 GMT)
Generative Proxemics: A Prior for 3D Social Interaction from Images [25.9] 近親密なソーシャルインタラクションにおいて,2人の前に3Dプロキセミクスを学習する新しいアプローチを提案する。
提案手法は,ノイズの多い初期推定値から,より正確で確実な3次元ソーシャルインタラクションを復元する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:20 GMT)
Probabilistic Learning of Multivariate Time Series with Temporal
Irregularity [25.9] 不均一な時間間隔やコンポーネントのミスアライメントを含む時間的不規則。
我々は,非ガウス的データ分布を非パラメトリック的に表現する条件フロー表現を開発する。
提案手法の広範な適用性と優位性は,実世界のデータセット上でのアブレーション研究とテストを通じて,既存のアプローチと比較することによって確認される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:08:48 GMT)
Distributionally Robust Data Join [25.2] 本稿では,元の特徴,補助特徴,バイナリラベルに対する全ての確率に対する最大損失を最小限に抑える予測器の構築問題を紹介する。
これは分散ロバスト最適化(DRO)の一般化であり、2つのデータソースが可能であり、そのうちの1つはラベル付けされていないものは補助的特徴を含む可能性がある。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 00:02:37 GMT)
Harvard Glaucoma Fairness: A Retinal Nerve Disease Dataset for Fairness
Learning and Fair Identity Normalization [25.0] 緑内障は全世界で不可逆的な盲目の原因であり、黒人は他の人種に比べて緑内障の頻度が倍増している。
グラウコーマ・フェアネス(Harvard Glaucoma Fairness,Harvard-GF)は、2Dおよび3D画像データと、グラウコーマ検出のための人種的バランスの取れたデータセットである。
我々のFINアプローチは、人種的、性別的公正なタスクにおいて優れたパフォーマンスを持つ、最先端のフェアネス学習手法と比較される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:39:05 GMT)
Unprocessing Seven Years of Algorithmic Fairness [24.9] 7年前、研究者は、異なる人口集団にわたるモデルのエラー率を等化するためのポストプロセッシング手法を提案した。
いくつかのデータセット上で、何千ものモデル評価を通じてクレームを実証的に評価する。
過去の観測を裏付ける2つの一般的な方法論的誤りに対処する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:27:33 GMT)
Opinion Tree Parsing for Aspect-based Sentiment Analysis [24.3] 本稿では、より高速で、より包括的で完全なアスペクトレベルの感情構造を明らかにすることができる、意見木からすべての感情要素を解析することを目的とした意見木解析モデルを提案する。
特に、まず、文脈自由な意見文法を導入して、意見木構造を正規化する。次に、感情要素間の相関関係を網羅的に検討し、それらを意見木構造に解析する神経チャートベースの意見木を用いる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:53:14 GMT)
DIFFender: Diffusion-Based Adversarial Defense against Patch Attacks in
the Physical World [24.3] 物理的世界のアドリアック、特にパッチ攻撃は、ディープラーニングモデルの堅牢性と信頼性に重大な脅威をもたらす。
本研究では,事前学習した拡散モデルを利用して,潜在的な敵パッチ攻撃に対する局所化と防御を行う新しい防御手法であるDIFFenderを提案する。
画像分類と顔認識に関する広範な実験を行い、DIFFenderが強い適応攻撃下で優れた堅牢性を示すことを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:33:27 GMT)
Low-Switching Policy Gradient with Exploration via Online Sensitivity
Sampling [24.0] 一般非線形関数近似を用いた低スイッチングサンプリング効率ポリシ最適化アルゴリズム LPO を設計する。
提案アルゴリズムは,$widetildeO(fractextpoly(d)varepsilon3)$サンプルのみを用いて,$varepsilon$-optimal Policyを得る。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:51:46 GMT)
Your Room is not Private: Gradient Inversion Attack for Deep Q-Learning [23.8] プライバシーは、ロボットが実質的な個人情報にアクセスすることによって、具体化されたAIの領域における重要な関心事として浮上する。
本稿では、状態、行動、Q値の再構成に勾配インバージョンを利用するディープQラーニングアルゴリズムに対する攻撃を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:53:26 GMT)
Interleaving Pre-Trained Language Models and Large Language Models for
Zero-Shot NL2SQL Generation [23.5] ZeroNL2は、新しい環境に適応する自然言語のtosqlの実現に不可欠である。
既存のアプローチは、データに基づいた微調整事前学習言語モデル(PLM)か、ChatGPTのような固定された大言語モデル(LLM)をガイドするプロンプトを使用する。
ゼロショットNL2をサポートするために, PLM と LLM の相補的な利点を組み合わせた ZeroNL2 フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:50:51 GMT)
Toward 3D Spatial Reasoning for Human-like Text-based Visual Question
Answering [23.1] テキストベースのビジュアル質問回答(TextVQA)は,複数のシーンテキストを用いた画像に関する質問に対して,適切な回答を生成することを目的としている。
我々は,キーオブジェクトの文脈的知識を捉えるために,人間のような空間的推論プロセスに3次元幾何学的情報を導入する。
本手法は,TextVQAおよびST-VQAデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:38:25 GMT)
Datasets and Benchmarks for Offline Safe Reinforcement Learning [22.9] 本稿では、オフライン安全な強化学習(RL)課題に適した総合ベンチマークスイートを提案する。
ベンチマークスイートには3つのパッケージがある: 1) 専門家による安全なポリシー、2) D4RLスタイルのデータセットと環境ラッパー、3) 高品質のオフライン安全なRLベースライン実装。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:31:26 GMT)
Opportunities and Challenges for ChatGPT and Large Language Models in
Biomedicine and Health [22.3] チャットGPTは、バイオメディシンと健康の分野における多様な応用の出現につながっている。
生体情報検索,質問応答,医用テキスト要約,医学教育の分野について検討する。
テキスト生成タスクの分野では,従来の最先端手法を超越した大きな進歩が見られた。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:19:08 GMT)
Occ3D: A Large-Scale 3D Occupancy Prediction Benchmark for Autonomous
Driving [22.2] 我々は,任意のシーンに対して,濃密で可視性に配慮したラベルを生成するラベル生成パイプラインを開発した。
このパイプラインは、ボクセルの密度化、推論、画像誘導ボクセル精製の3段階からなる。
我々は、Occ3Dベンチマークにおいて優れた性能を示すCTF-Occネットワークと呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:53:43 GMT)
Temporally-Extended Prompts Optimization for SAM in Interactive Medical
Image Segmentation [22.2] Anything Model (SAM) は画像セグメンテーションに対処するための基礎モデルとして登場した。
本稿では,対話型医用画像セグメンテーション(IMIS)パラダイムにおけるSAMのゼロショット機能の可能性を評価することに焦点を当てる。
我々は、人間の専門家に適切なプロンプトフォームを提供するフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:51:24 GMT)
DeAR: Accelerating Distributed Deep Learning with Fine-Grained
All-Reduce Pipelining [22.2] コミュニケーションスケジューリングは、分散トレーニングの加速に有効であることが示されている。
本稿では,全再現プリミティブを2つの連続演算に分解する新しいスケジューリングアルゴリズムであるDeARを提案する。
DeARは最先端ソリューションよりも最大83%,15%のトレーニングスピードアップを実現していることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:19:25 GMT)
The 2023 Video Similarity Dataset and Challenge [21.9] この研究は、ビデオコピーの検出とローカライゼーションの問題に対するデータセット、ベンチマーク、課題を導入している。
このベンチマークは、これらの2つのタスクのメソッドを評価し、現実的なニードル・イン・ヘイスタック設定をシミュレートするように設計されている。
関連する課題は、2つの対応するトラックで構成され、それぞれに現実世界の設定を反映した制限がある。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:34:43 GMT)
Exploring the MIT Mathematics and EECS Curriculum Using Large Language
Models [21.9] 我々は,MITの数学・脳科学専攻の卒業要件を満たすために,大規模言語モデルの能力を評価する。
その結果, GPT-3.5はMITのカリキュラム全体の3分の1を解くのに成功し, GPT-4は迅速なエンジニアリングにより, 画像に基づく質問を除いたテストセット上で完璧に解けることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:48:14 GMT)
BrainNet: Epileptic Wave Detection from SEEG with Hierarchical Graph
Diffusion Learning [21.7] 実世界のSEEGデータセットにおけるてんかん性波を検出するための,最初のデータ駆動型研究を提案する。
臨床的には、てんかん波の活動は脳の異なる領域間で伝播していると考えられている。
各患者に対して正確なてんかん原性ネットワークをどうやって抽出するかという問題は、神経科学の分野では未解決の問題のままである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:29:10 GMT)
When Hyperspectral Image Classification Meets Diffusion Models: An
Unsupervised Feature Learning Framework [21.6] 本稿では,HSI分類のための拡散モデルに基づくスペクトル空間特徴学習フレームワークDiff-HSIを提案する。
豊富な時間ステップの機能をうまく利用するために、時間ステップのフィーチャバンクと動的な機能融合モジュールを設計する。
以上の結果から,Diff-HSIはHSI分類における最先端の教師あり手法および教師なし手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:56:58 GMT)
Reward-Free Curricula for Training Robust World Models [21.6] 報酬のない探索から世界モデルを学ぶことは、有望なアプローチである。
異なる環境は、適切な世界モデルを学ぶために異なる量のデータを必要とするかもしれない。
我々は、報酬のない環境でロバストな世界モデルを効率的に学習する問題に対処する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:40:04 GMT)
Improving Training Stability for Multitask Ranking Models in Recommender
Systems [21.4] YouTubeレコメンデーションのための実世界のマルチタスクランキングモデルのトレーニング安定性を改善する方法について述べる。
既存のソリューションの限界を緩和する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:28:12 GMT)
Learning by Analogy: Diverse Questions Generation in Math Word Problem [21.2] AI技術を用いた数学語問題(MWP)の解法は、最近ディープニューラルネットワーク(DNN)の成功で大きな進歩を遂げた。
我々は、MWPソルバが様々な方法で定式化されるのと同じ問題をよりよく理解するために、類推による学習能力が不可欠であると主張する。
本稿では,MWPを多様だが一貫した問合せ/解法を生成することで,MWPの解法を初めて試みる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:47:07 GMT)
Relation-Aware Diffusion Model for Controllable Poster Layout Generation [20.2] ポスターレイアウトは、ポスターデザインの重要な側面である。
本研究では,レイアウト生成のための関係認識拡散モデルを提案する。
提案手法は,ユーザの制約に基づいて多様なレイアウトを生成することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:31:20 GMT)
PEACE: Cross-Platform Hate Speech Detection- A Causality-guided
Framework [20.1] ヘイトスピーチ検出(Hate speech detection)とは、宗教、性別、性的指向、その他の特徴に基づいて個人または集団を軽蔑することを目的としたヘイトフルコンテンツを検出するタスクである。
本稿では,2つの本質的な因果的手がかりをヘイトフルコンテンツで識別し,活用する因果性誘導型フレームワークPEACEを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 01:18:02 GMT)
A9 Intersection Dataset: All You Need for Urban 3D Camera-LiDAR Roadside
Perception [20.1] A9 Intersectionデータセットはラベル付きLiDAR点雲と同期カメラ画像で構成されている。
私たちのデータセットは4.8kの画像と57.4k以上の3Dボックスを手動でラベル付けした点雲で構成されています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:39:51 GMT)
Audio Tagging on an Embedded Hardware Platform [20.0] Raspberry Piなどのハードウェアにデプロイした場合,大規模な事前学習型オーディオニューラルネットワークの性能がどう変化するかを分析する。
実験の結果,連続したCPU使用量によって温度が上昇し,自動減速機構が起動できることが判明した。
マイクの品質、特にGoogle AIY Voice Kitのような安価なデバイスや音声信号のボリュームは、システムのパフォーマンスに影響を与えます。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:02:41 GMT)
WizMap: Scalable Interactive Visualization for Exploring Large Machine
Learning Embeddings [19.9] 我々は、研究者や実践者が大きな埋め込みを簡単に探索するのに役立つインタラクティブな可視化ツールであるWizMapを紹介します。
WizMapは、新しいマルチ解像度埋め込み要約法と、慣れ親しんだマップのようなインタラクション設計により、ユーザが簡単に埋め込みスペースをナビゲートし、解釈できる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:58:04 GMT)
PLAtE: A Large-scale Dataset for List Page Web Extraction [19.9] PLAtEは6,694ページと156,014属性から収集された52,898項目で構成されており、これが最初の大規模リストページWeb抽出データセットである。
我々は、データセットの収集と注釈付けに多段階のアプローチを用い、3つの最先端Web抽出モデルを2つのタスクに適用し、その強みと弱さを定量的かつ質的に比較する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:06:49 GMT)
Systematic Design and Evaluation of Social Determinants of Health
Ontology (SDoHO) [19.9] 健康の社会的決定因子(SDoH)は、健康の結果と幸福に重大な影響を及ぼす。
本稿では,SDoH の基本的な因子とその関係を標準化し,測定可能な方法で表現する SDoH オントロジー (SDoHO) を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:24:10 GMT)
Fit Like You Sample: Sample-Efficient Generalized Score Matching from
Fast Mixing Markov Chains [19.7] 生成器との混合時間$mathcalL$と一般化されたスコアマッチング損失との密接な関係を示す。
これは、スコアマッチングにおけるアニールの利点を初めて特徴づけるものです -- より洗練されたスコアベースのアプローチにおいて、重要なコンポーネントです。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:58:42 GMT)
Learning from Partially Annotated Data: Example-aware Creation of
Gap-filling Exercises for Language Learning [19.4] 本稿では,言語学習,特に文法演習のためのギャップ埋め演習の自動作成に着目する。
i) 上記のギャップ充足運動生成タスクに特化して設計された新しいニューラルネットワークアーキテクチャ、および(ii) フランス語文法のための実世界のベンチマークデータセットをコントリビュートする。
モデル実装とデータセットは今後の研究を促進するために公開されており、文法演習作成における部分注釈付きデータ予測タスクの標準化された評価とベースラインソリューションを提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:23:53 GMT)
Diff-TTSG: Denoising probabilistic integrated speech and gesture
synthesis [19.4] 本稿では,Diff-TTSGと呼ばれる拡散型確率モデルについて述べる。
本稿では,統合音声とジェスチャー合成システムを評価するための,一様・多様主観的一様・多様主観的テストのセットについて述べる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:02:49 GMT)
On the Correspondence Between Monotonic Max-Sum GNNs and Datalog [19.3] グラフニューラルネットワーク(GNN)に基づくデータ変換の研究
最大および総和集約関数を持つGNNのサブクラスをカバーするモノトニックマックスサムGNNの表現性について検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:22:01 GMT)
CoverHunter: Cover Song Identification with Refined Attention and
Alignments [19.2] カバーソング識別(CSI)は、クエリトラックが与えられたアンカーの異なるバージョンで同じ音楽を見つけることに焦点を当てている。
本研究では,既存の検出方式の欠点を克服するCoverHunterという新しいシステムを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:34:20 GMT)
Participatory Research as a Path to Community-Informed, Gender-Fair
Machine Translation [19.1] 本稿では、クイア人や非バイナリ人、翻訳者、MT専門家を含む参加型行動研究のための方法とケーススタディを提案する。
ケーススタディは、アイデンティティの無効化を避けるためにコンテキスト依存の重要性が中心的な発見であるドイツに焦点を当てている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:20:14 GMT)
A Gromov--Wasserstein Geometric View of Spectrum-Preserving Graph
Coarsening [19.1] この研究はグラフの粗大化を別の観点から研究し、グラフ距離を保存する理論を発展させた。
幾何学的アプローチは、グラフ分類や回帰のようなグラフの集合を扱う際に有用である。
この差を最小化するには、一般的な重み付きカーネル$K$-means法を用いる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:47:26 GMT)
Evaluation and Optimization of Gradient Compression for Distributed Deep
Learning [19.1] 同期勾配降下(S-SGD)における通信ボトルネックを軽減するための勾配圧縮法が提案されている。
そこで本研究では,交流圧縮パワーSGD(ACP-SGD)と呼ばれる新しい勾配圧縮手法を提案する。
ACP-SGD は S-SGD と Power-SGD でそれぞれ平均 4.06x と 1.43x のスピードアップを達成し、異なる設定で他のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:35:24 GMT)
Contrast, Stylize and Adapt: Unsupervised Contrastive Learning Framework
for Domain Adaptive Semantic Segmentation [18.8] 画素レベルと特徴レベルの両方で領域ギャップを埋めるためのコントラストFEaTureとpIxelアライメントを提案する。
提案手法はDeepLabV2を用いて既存の最先端手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:50:46 GMT)
Scalable Resource Management for Dynamic MEC: An Unsupervised
Link-Output Graph Neural Network Approach [18.5] ディープラーニングは、タスクオフロードとリソース割り当てを最適化するために、モバイルエッジコンピューティング(MEC)でうまく採用されている。
エッジネットワークのダイナミクスは、低スケーラビリティと高トレーニングコストという、ニューラルネットワーク(NN)ベースの最適化方法における2つの課題を提起する。
本稿では,新たなリンクアウトプットGNN(LOGNN)ベースの資源管理手法を提案し,MECにおける資源割り当てを柔軟に最適化する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:21:41 GMT)
Mnemosyne: Learning to Train Transformers with Transformers [18.4] 暗黙の低ランクアテンション変換器であるPerformersを用いたMnemosyneを提案する。
タスク固有のチューニングを必要とせずに、他のトランスフォーマーを含む、ニューラルネットワーク全体のトレーニングを学ぶことができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:20:59 GMT)
Modularizing while Training: a New Paradigm for Modularizing DNN Models [18.3] モデルトレーニングプロセス,すなわちモジュール化時トレーニング(MwT)にモジュール化を取り入れた新しいアプローチを提案する。
MwTによる精度損失は1.13ポイントであり、ベースラインよりも1.76ポイント少ない。
トレーニングとモジュール化に必要な総時間費用は,ベースラインの半分の108分に過ぎません。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:45:43 GMT)
Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca [17.9] 中国語テキストの理解・生成機能を備えたLLaMAの拡張手法を提案する。
我々は、中国語データを用いた二次事前学習を取り入れ、中国語の命令データセットでモデルを微調整する。
以上の結果から,新たに提案されたモデルは,中国コンテンツの理解と生成におけるLLaMAの習熟度を著しく向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:23:19 GMT)
A Multi-Level, Multi-Scale Visual Analytics Approach to Assessment of
Multifidelity HPC Systems [17.2] ハードウェアシステムのイベントと振る舞いは、システムの堅牢性と信頼性を改善するために不可欠である。
本研究では,このような膨大なデータを理解するための総合分析システムの構築を目指す。
このエンド・ツー・エンドのログ分析システムとビジュアル・アナリティクス・サポートが組み合わさって、ユーザーはスーパーコンピュータの使用状況やエラーパターンを素早く抽出できる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:23:50 GMT)
Neural models for Factual Inconsistency Classification with Explanations [17.2] 言語学における既存の作業を活用して、5種類の事実的矛盾を定義する。
我々はニューラルネットワークをトレーニングし、(定義、文脈)文ペアを与えられた説明で不整合型を予測する。
提案手法は,5つのクラスにまたがる不整合型分類において87%の重み付きF1を提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:06:50 GMT)
Multi-omics Prediction from High-content Cellular Imaging with Deep
Learning [17.0] Image2Omicsは、多重蛍光染料で染色された高濃度画像から直接、細胞集団のマルチオミクスを予測するディープラーニングアプローチである。
画像2Omics は, 細胞画像から直接, 転写学や計測を予測できる性能が, 予測値よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:13:52 GMT)
Multi-Loss Convolutional Network with Time-Frequency Attention for
Speech Enhancement [16.7] 我々はDPCRNモジュールにおける自己注意を探求し、音声強調のためのMNTFA(Multi-Loss Convolutional Network with Time-Frequency Attention)と呼ばれるモデルの設計を行う。
DPRNNと比較して、軸方向の自己アテンションはメモリと計算の必要性を大幅に減らす。
本稿では,WavLMネットワークを用いた多分解能STFT損失とWavLM損失のジョイントトレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:48:19 GMT)
Bilinear value networks [16.5] 両線形分解方式はデータ効率を大幅に向上させ, 分配目標への転送に優れることを示す。
シミュレーションされたFetchロボットのタスクスーツとシャドウハンドによる巧妙な操作に関する実証的証拠が提供される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:32:59 GMT)
Winning Solution for the CVPR2023 Visual Anomaly and Novelty Detection
Challenge: Multimodal Prompting for Data-centric Anomaly Detection [16.3] 本稿では,CVPR2023 Visual Anomaly and Novelty Detection (VAND)チャレンジに対するチームテキストSegment Any Anomalyの勝利ソリューションを紹介する。
マルチモーダルプロンプトを用いたゼロショット異常セグメンテーションのための新しいフレームワーク、textiti.e., Segment Any Anomaly + (SAA$+$)を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:49:44 GMT)
Bridging the Gap between Decision and Logits in Decision-based Knowledge
Distillation for Pre-trained Language Models [16.1] 決定分布からロジットを推定する新しい手法を提案する。
本手法は,自然言語理解と機械読解データセットの両面において,強いベースラインを著しく上回っている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:23:44 GMT)
SSL4EO-L: Datasets and Foundation Models for Landsat Imagery [16.0] ランドサット計画 (Landsat program) は、過去最長の地球観測計画であり、8つの衛星による50年以上のデータ取得である。
深層学習やリモートセンシングの普及にもかかわらず、ほとんどの研究者はランドサットの画像解析に決定木とランダムな森林を使っている。
本稿では,ランドサット衛星群を対象としたセルフ・スーパーバイザード・ラーニング・フォー・アース・オブ・オブ・アース・オブ・ザ・観察のために設計された最初のデータセットであるSSL4EO-Lを紹介する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:11:20 GMT)
Enabling Full-Stack Quantum Computing with Changeable Error-Corrected
Qubits [15.9] 我々は、変更可能な論理量子ビットに基づくFTQCの大規模設計空間を探索するために、CECQを提案する。
様々な量子プログラムの実験は、CECQの有効性を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:17:32 GMT)
Do Not Train It: A Linear Neural Architecture Search of Graph Neural
Networks [15.8] ニューラルアーキテクチャコーディング(NAC)という新しいNAS-GNN法を開発した。
当社のアプローチでは,最先端のパフォーマンスを実現しています。そのパフォーマンスは,強いベースラインよりも200倍高速で,18.8%の精度で実現しています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:23:46 GMT)
MCPI: Integrating Multimodal Data for Enhanced Prediction of Compound
Protein Interactions [15.6] 複合タンパク質相互作用(CPI)の同定は、薬物スクリーニング、薬物再精製、併用療法研究において重要な役割を担っている。
CPI予測の有効性は、化合物と標的タンパク質の両方から抽出された特徴に大きく依存している。
本研究では,CPIの予測性能の向上を目的としたMCPIモデルを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:20:26 GMT)
ChessGPT: Bridging Policy Learning and Language Modeling [15.5] ChessGPTはポリシー学習と言語モデリングのためのGPTモデルである。
チェスに関連する大規模ゲームと言語データセットを構築した。
政策学習と言語モデリングを統合したChessCLIPとChessGPTのモデル例を2つ紹介する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:35:31 GMT)
Accurate Airway Tree Segmentation in CT Scans via Anatomy-aware
Multi-class Segmentation and Topology-guided Iterative Learning [15.5] CT(Computed tomography)における胸腔内気道セグメンテーションは様々な呼吸器疾患解析の前提条件である。
既存のエアウェイデータセットのほとんどは、不完全なラベル付き/注釈付きである。
本稿では,トポロジ誘導型反復型自己学習によって強化された,解剖学に適応したマルチクラスエアウェイセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:23:05 GMT)
Revealing the Illusion of Joint Multimodal Understanding in VideoQA
Models [15.4] VideoQA Transformerモデルは標準ベンチマークで競合性能を示す。
我々はこれを、軽量で非パラメトリックなプローブである$textitQUAG$ (QUadrant AveraGe)で解析する。
本稿では,ビデオQAにおけるマルチモーダル理解のベンチマークを行うための診断データセットであるtextitCLAVI$ベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:45:46 GMT)
Self-Supervised Monocular Depth Estimation with Self-Reference
Distillation and Disparity Offset Refinement [15.0] 自己教師付き単分子深度推定を改善するための2つの新しいアイデアを提案する。
我々は,教師が訓練の時期に合わせて更新したパラメータ最適化モデルを用いて,さらなる指導を行う。
我々は,高次特徴量と低次特徴量とのコンテキスト整合性を利用して,マルチスケールの相違オフセットを得る。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:35:44 GMT)
FP8 versus INT8 for efficient deep learning inference [15.0] デバイス上での効率的な推論のために,FP8フォーマットとINTフォーマットの両方のパフォーマンスを比較した。
FP フォーマットは INT フォーマットよりも,専用ハードウェアの計算効率が 50-180% 程度低いことを示す。
提案したFP8フォーマットはトレーニングに適しているが,推測の結果はFP8の専用実装を保証していない。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:14:02 GMT)
Med-MMHL: A Multi-Modal Dataset for Detecting Human- and LLM-Generated
Misinformation in the Medical Domain [14.8] Med-MMHLは、複数の疾患を含む一般的な医療領域において、新しいマルチモーダルな誤情報検出データセットである。
本データセットは,各種疾患および各種シナリオにおける誤情報検出手法の総合的な研究・開発を促進することを目的としている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:59:11 GMT)
AQuA: A Benchmarking Tool for Label Quality Assessment [14.8] 近年の研究では、機械学習モデルのトレーニングと評価に広く使用されているデータセットに、広範なラベル付けエラーがあることがわかった。
本稿では,ラベルノイズの存在下で機械学習を可能にする手法を厳格に評価するためのベンチマーク環境AQuAを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:42:11 GMT)
Rethinking Document-Level Relation Extraction: A Reality Check [14.6] この分野を詳しく見て、これらのパフォーマンス向上が実際に真実かどうかを確認します。
典型的なDocREモデルのロバスト性を調べるために,4種類のエンティティ参照攻撃を構築した。
この結果,現在のDocREモデルのほとんどはエンティティ参照攻撃に対して脆弱であり,現実のエンドユーザーNLPアプリケーションにデプロイすることは困難であることが判明した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:47:42 GMT)
Optimal Exploration for Model-Based RL in Nonlinear Systems [14.5] 未知の非線形力学系を制御する学習は、強化学習と制御理論の基本的な問題である。
本研究では,タスク依存メトリックにおける不確実性を低減するために,効率よくシステムを探索できるアルゴリズムを開発した。
我々のアルゴリズムは、ポリシー最適化から任意のシステムにおける最適な実験設計への一般的な還元に依存しており、独立した関心を持つ可能性がある。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:47:50 GMT)
QuadSwarm: A Modular Multi-Quadrotor Simulator for Deep Reinforcement
Learning with Direct Thrust Control [14.3] 強化学習(Reinforcement Learning, RL)は、ロボティクスタスクの堅牢なポリシーを作成する上での約束である。
現代のRLアルゴリズムは、しばしば成功したポリシーをトレーニングするために何十億もの環境遷移を必要とする。
クアッドスワーム(QuadSwarm)は、クアッドロータ用のシングルロボットRLとマルチロボットRLの研究のための高速で信頼性の高いシミュレータである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:46:20 GMT)
OMS-DPM: Optimizing the Model Schedule for Diffusion Probabilistic
Models [14.2] 拡散確率モデル(英: Diffusion Probabilistic Model、DPM)は、最先端の生成品質を達成した新しい生成モデルである。
DPMの大きな欠点のひとつは、生成プロセスに必要な多数のニューラルネットワーク評価のために、生成速度が遅いことだ。
我々は、任意の生成時間予算と事前学習モデルのセットを与えられたモデルスケジュールを最適化するために、予測器ベースの探索アルゴリズムであるOMS-DPMを設計する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:04:39 GMT)
Understanding Optimization of Deep Learning [14.1] 本稿では,ディープラーニングにおける最適化の包括的理解について述べる。
モデル表現能力の低下とトレーニング不安定性の低下につながる勾配消滅と勾配爆発の課題に焦点をあてる。
現在の最適化手法を理解するために、明示的な最適化と暗黙的な最適化の2つのクラスに分類する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:27 GMT)
Ghost Booking as a New Philanthropy Channel: A Case Study on
Ukraine-Russia Conflict [14.0] ゴースト・ブッキングという用語は、2022年のロシアとウクライナの紛争で人道的な行為を行う新しい方法として最近登場した。
この現象は、ネット市民がAirbnbプラットフォーム上の見知らぬ予約を通じてウクライナ市民に寄付する出来事を記述している。
本研究の目的は、もともと経済交流を目的としたプラットフォーム上でのピアツーピア寄付行動を探ることである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:11:51 GMT)
LOVM: Language-Only Vision Model Selection [13.9] 言語のみの視覚モデル選択(Language-Only Vision Model Selection)では,モデル選択と性能予測の両方を実行することが期待される。
次に,35個の事前学習されたVLMと23個のデータセットの地上信頼度評価からなるLOVMベンチマークを導入した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:53:05 GMT)
Text Promptable Surgical Instrument Segmentation with Vision-Language
Models [13.8] 我々は、そのタスクを即時にテキストとして再定義し、手術器具のよりきめ細やかな理解を可能にする。
視覚言語モデルの最近の進歩に触発されて、事前訓練された画像とテキストエンコーダをモデルバックボーンとして活用する。
これは外科用機器のセグメンテーションへの迅速なアプローチの最初の実装であり、ロボット補助手術の分野における実践的応用に有意義な可能性を秘めている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:26:20 GMT)
Detection of sepsis during emergency department triage using machine
learning [13.6] セプシス(Sepsis)は、臓器機能不全の生命を脅かす疾患であり、世界中で死と致命的な病気の原因となっている。
16病院のトリアージデータを用いた機械学習モデル(KATE Sepsis)を開発した。
KATEセプシスモデルでは、重篤な敗血症を検知する感度が77.67%(75.78% -79.42%)、敗血症を検知する感度が86.95%(84.2% -88.81%)である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 00:57:57 GMT)
Robustness Analysis on Foundational Segmentation Models [13.4] モデルはしばしば、分類、オブジェクト検出、セグメンテーションといったさまざまな下流タスクに適応し、ターゲットデータセットでほとんどトレーニングされない。
我々は、COCOとADE20Kという2つの異なるデータセットを使用して、4つの最先端セグメンテーションアーキテクチャをベンチマークした。
我々は,(1)VFMは圧縮による汚損に対して堅牢ではないこと,(2)選択されたVFMは非VFMモデルに比べて顕著に性能が向上したり堅牢性を示したりしないが,ゼロショット評価では競争的に堅牢であること,などの興味深い洞察を得た。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:59:42 GMT)
Stable Deep MRI Reconstruction using Generative Priors [13.4] 本稿では,参照等級画像のみを生成的設定でトレーニングした,新しいディープニューラルネットワークベース正規化器を提案する。
その結果,最先端のディープラーニング手法に匹敵する競争性能が示された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:10:10 GMT)
1st Solution Places for CVPR 2023 UG$^{\textbf{2}}$+ Challenge Track
2.1-Text Recognition through Atmospheric Turbulence [13.4] CVPR 2023 UG$2$+チャレンジのトラック2.1における大気乱流によるテキスト認識のためのVIELab-HUSTの開発したソリューションを提案する。
本フレームワークは,最終テストフェーズで提供されるホットエアテキストデータセットと乱流テキストデータセットの両方を処理し,テキスト認識精度において第1位を達成した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:56:51 GMT)
ST-PINN: A Self-Training Physics-Informed Neural Network for Partial
Differential Equations [13.2] 偏微分方程式 (Partial differential equations, PDE) は物理学や工学において重要な計算核である。
ディープラーニングの進歩により、物理インフォームドニューラルネットワーク(PINN)は、様々なアプリケーションで高速なPDE解決の可能性を示している。
本稿では,既存のPINNの低精度・収束問題に対処するため,自己学習型物理インフォームドニューラルネットワークST-PINNを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:49:13 GMT)
Stochastic Re-weighted Gradient Descent via Distributionally Robust
Optimization [13.2] 我々は、ディープニューラルネットワークの性能を高めるために、再重み付け勾配降下法を開発した。
我々は,バニラ分類を含む様々な課題において,アプローチの優位性を示す。
提案アルゴリズムは,GLUEベンチマーク上でのBERTを+1.94%,ImageNet-1K上でのViTを0.9%向上させる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:58:04 GMT)
ScrollTimes: Tracing the Provenance of Paintings as a Window into
History [13.0] ScrollTimesは、ハンドクロールの歴史的コンテキストをトレースするビジュアル分析システムである。
われわれのアプローチは歴史の窓口を提供し、ハンドクロールの証明と歴史的意義の全体的理解を育む。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:38:09 GMT)
Large language models predict human sensory judgments across six
modalities [12.9] 我々は、現在最先端の大規模言語モデルが、知覚世界を言語から回復する問題に対する新たな洞察を解き放つことができることを示す。
我々は、6つの精神物理学的データセットにわたるGPTモデルからペアワイズ類似性判定を導出する。
これらの判断は, 色輪やピッチスパイラルなどのよく知られた表現を復元し, 全領域にわたる人的データと有意な相関関係を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:18:04 GMT)
How Robust is your Fair Model? Exploring the Robustness of Diverse
Fairness Strategies [12.6] 本稿では,様々な公正度最適化戦略のロバスト性(ロバスト性比)を測定するための新しい基準を提案する。
我々は,5つのベンチマークフェアネスデータセットに対して,最もポピュラーなフェアネス戦略の3つを用いて,最もポピュラーなフェアネス定義の4つについて,広範な実験を行った。
実験により, しきい値の最適化に依存するフェアネス法は, 評価された全てのデータセットのノイズに非常に敏感であることが実証された。
これは他の2つの手法とは対照的であり、低騒音のシナリオではより公平ではなく、高騒音ではより公平である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:32:27 GMT)
Pushing the Limits of Unsupervised Unit Discovery for SSL Speech
Representation [12.5] HuBERTは、オフラインクラスタリングを利用して、音声特徴を個別単位に変換して、マスク付き言語モデリングプリテキストタスクの例である。
SSLターゲットを改善するための教師なし手法を提案する。
MonoBERTとPolyBERTの2つのモデルが提案されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:45:12 GMT)
1st Solution Places for CVPR 2023 UG$^2$+ Challenge Track 2.2-Coded
Target Restoration through Atmospheric Turbulence [12.5] 本報告では,CVPR 2023 UG$2$+トラック2.2における大気乱流によるターゲット復元のためのVIELab-HUSTの解について紹介する。
歪んだフレームから高品質な画像を復元するための効率的な多段階フレームワークを提案する。
我々のフレームワークは、最終テストフェーズで提供されるさまざまな種類のコード化されたターゲットデータセットを処理でき、最終リーダーボードで1位にランクインしています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:06:48 GMT)
BeGin: Extensive Benchmark Scenarios and An Easy-to-use Framework for
Graph Continual Learning [12.2] 連続学習(英: Continual Learning, CL)とは、絶え間なく一連のタスクを学習する過程である。
グラフデータ(グラフCL)は、標準の実験的な設定が欠如しているため、驚くほど過小評価されている。
我々は,グラフCLのための容易かつ愚かなフレームワークであるBeGinを開発した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:29:36 GMT)
Improving Explainability of Disentangled Representations using
Multipath-Attribution Mappings [12.1] 下流タスク予測に解釈不能な不整合表現を利用するフレームワークを提案する。
提案手法の有効性を,総合ベンチマークスイートと2つの医療データセットで実証する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:52:29 GMT)
Compositor: Bottom-up Clustering and Compositing for Robust Part and
Object Segmentation [11.9] 関節部と物体のセグメンテーションに対する頑健なアプローチを提案する。
ボトムアップ方式で,画素,部分,オブジェクトレベルの埋め込みを含む階層的な特徴表現を構築した。
このボトムアップ相互作用は、より低いセマンティックレベルからより高いセマンティックレベルへの情報の統合に有効であることが示されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:56:15 GMT)
Building blocks for complex tasks: Robust generative event extraction
for radiology reports under domain shifts [11.8] マルチパスT5ベースのテキスト・テキスト生成モデルでは、BERTベースのタスク固有分類層を用いた手法と比較して、試験モード間の一般化が優れていることを示す。
そこで我々は, 大規模コーパス処理を臨床応用に利用しやすくするため, モデルの推論コストを低減させる手法を開発した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:16:58 GMT)
Inconsistency Ranking-based Noisy Label Detection for High-quality Data [11.8] 本稿では,高品質データに対する非整合性ランキング付き自動ノイズラベル検出(NLD)手法を提案する。
クラス間の不整合度ランキングとクラス内不整合度ランキングを比較し,異なる雑音条件下でのメトリクス学習損失関数を比較した。
実験結果から,提案手法は大規模話者認識データセットの効率的なクリーニングと効率的なクリーニングを両立させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:08:55 GMT)
Decentralized Social Navigation with Non-Cooperative Robots via Bi-Level
Optimization [11.6] 本稿では,ソーシャルミニゲームにおけるリアルタイム非協調型マルチロボットナビゲーションのための,完全に分散化されたアプローチを提案する。
我々のコントリビューションは新しいリアルタイムバイレベル最適化アルゴリズムであり、トップレベルの最適化は公正で衝突のない順序付けを演算する。
F$1/10のロボット、Clearpath Jackal、Boston Dynamics Spotを使って提案したアルゴリズムを現実世界に展開することに成功しました。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:18:21 GMT)
Matching Pairs: Attributing Fine-Tuned Models to their Pre-Trained Large
Language Models [11.6] 異なる知識レベルと属性戦略を考慮し、最良の方法で10の微調整されたモデルのうち8つを正確に追跡できることに気付きます。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:42:48 GMT)
$m^\ast$ of two-dimensional electron gas: a neural canonical
transformation study [11.4] 均一な電子ガスの有効質量の正確な値は、何十年にもわたっての研究の後、まだ解明されていない。
新たに開発されたニューラルカノニカル変換アプローチは、電子ガスの有効質量を抽出する原理的な方法を提供する。
本計算により, 2次元スピン偏極電子ガスの有効質量の抑制が明らかとなった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:07:39 GMT)
TenCirChem: An Efficient Quantum Computational Chemistry Package for the
NISQ Era [11.2] TenCirChemは、量子計算化学のための変分シミュレーション量子アルゴリズムのためのオープンソースライブラリである。
TenCirChemは、一元結合クラスタ回路のシミュレーションにおいて高い性能を示す。
TenCirChemは、実際の量子ハードウェア実験を実行することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:37:27 GMT)
A Framework for Learning from Demonstration with Minimal Human Effort [11.2] ロボット学習は、システムの制御が人間の遠隔操作と自律的な制御とを切り替えることのできる、共有自律という文脈で考える。
この設定では、強化学習と、人的時間に関連するコストがある実演からの学習に対処する。
提案手法は,2つのシミュレートされたタスクと1つの実世界のタスクを実行するための人件費を削減できることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:49:37 GMT)
Edit-DiffNeRF: Editing 3D Neural Radiance Fields using 2D Diffusion
Model [11.1] 事前学習した拡散モデルとニューラルラジアンス場(NeRF)の組み合わせは,テキストから3D生成への有望なアプローチとして現れている。
本研究では,凍結拡散モデルと,拡散モデルの潜在意味空間を編集するデルタモジュールと,NeRFからなるEdit-DiffNeRFフレームワークを提案する。
提案手法は実世界の3Dシーンを効果的に編集し,25%の改善が得られた。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:41:58 GMT)
Autoencoding Under Normalization Constraints [10.9] オートエンコーダから構築した正規化確率モデルを提案する。
NAEの確率密度はオートエンコーダの再構成誤差を用いて定義される。
本モデルでは, 負のサンプルの再構成を抑えることにより正規化を行う。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:30:40 GMT)
Pragmatic Inference with a CLIP Listener for Contrastive Captioning [10.7] そこで本研究では、ターゲット画像と、非常に類似した代替画像とを区別する識別キャプションを生成する手法を提案する。
提案手法は,話者とリスナ間の参照ゲームとしてキャプションを定式化する実用的な推論手法に基づいている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:22:28 GMT)
Entanglement Distribution in Satellite-based Dynamic Quantum Networks [10.4] 低地球軌道(LEO)衛星は、グローバルな量子情報ネットワークを確立するための魅力的な機会を提供する。
既存の作品では、絡み合いを分散する際に時間とともに衛星の動きを考慮せず、あるいは衛星間リンクに沿って絡み合い分布を許可しない場合が多い。
まず、衛星移動と衛星間リンクの両方を考慮したシステムモデルを定義する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:56:26 GMT)
From Human Days to Machine Seconds: Automatically Answering and
Generating Machine Learning Final Exams [10.3] 大規模な言語モデルは、MIT、ハーバード、コーネルから引き出されたコーパスで、人間のレベルで機械学習のファイナルをパスすることを示した。
他の質問やコースノートから新しい質問を生成する方法を示します。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:32:23 GMT)
Neural Fine-Tuning Search for Few-Shot Learning [10.2] 数発の認識では、分類器は、解離した新しいクラスの集合に迅速に適応し、一般化するために必要となる。
近年の研究では、慎重に製作された適応型アーキテクチャによる微調整の有効性が示されている。
ニューラル・アーキテクチャ・サーチ(NAS)のレンズを用いてこの問題を研究する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:20:35 GMT)
Mitigating Cold-start Forecasting using Cold Causal Demand Forecasting
Model [10.1] 我々は、因果推論とディープラーニングモデルを統合するCDF-cold(Cold Causal Demand Forecasting)フレームワークを紹介する。
実験により,CDF-coldフレームワークは,多変量時系列データの将来値を予測する上で,最先端の予測モデルより優れていることが示された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:36:34 GMT)
DiViNeT: 3D Reconstruction from Disparate Views via Neural Template
Regularization [10.1] 本稿では3つの異なるRGB画像を入力として用いたボリュームレンダリングに基づくニューラルサーフェス再構成手法を提案する。
我々のキーとなる考え方は再建を規則化することであり、これは深刻な問題であり、スパースビューの間に大きなギャップを埋めることである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:08:25 GMT)
Who Needs to Know? Minimal Knowledge for Optimal Coordination [10.0] 戦略的に関連性のある情報と無関係な情報の間には明確な二分法が存在することを示す。
本稿では,この二分法を用いて,Overcooked環境の標準および部分的に観測可能な両方のタスクの戦略的関連情報を解析する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:43:17 GMT)
Neural Network Compression using Binarization and Few Full-Precision
Weights [9.9] 自動Prune Binarization (APB) は量子化とプルーニングを組み合わせた新しい圧縮技術である。
APBは、数個の完全精度重みを使ってバイナリネットワークの表現能力を向上する。
APBは最先端の方法よりも精度とメモリのトレードオフが優れていることを示している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:52:00 GMT)
Enlarged Large Margin Loss for Imbalanced Classification [9.9] 我々は,大縁ソフトマックスクロスエントロピー損失の概念を用いてLDAM損失の式を復元する。
本稿では,LDAM損失の広い範囲を拡大する新たなELM損失を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:44:49 GMT)
Training Diffusion Classifiers with Denoising Assistance [9.8] 本稿では,雑音と雑音の両例を用いて学習した聴覚支援型(DA)分類器を提案する。
Cifar10 と Imagenet を用いた実験の結果,DA-classifier はノイズの多い分類器よりも改善されていることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:19:25 GMT)
Real-Time Network-Level Traffic Signal Control: An Explicit Multiagent
Coordination Method [9.8] 交通信号の効率的な制御 (TSC) は, 都市交通渋滞の低減に最も有用な方法の1つである。
強化学習(RL)手法を適用した最近の取り組みは、トラフィック状態を信号決定にリアルタイムでマッピングすることでポリシーをクエリすることができる。
本稿では,適応的,リアルタイム,ネットワークレベルのTSCを満足する,EMCに基づくオンライン計画手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:08:09 GMT)
Towards Practical Federated Causal Structure Learning [9.7] FedC2SLは、条件付き独立性テストを用いて因果グラフを学習する制約に基づく因果構造学習スキームである。
この研究は、既存のソリューションに対する合成データセットと実世界のデータの両方を用いてFedC2SLを評価する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:23:58 GMT)
Stochastic Simulated Quantum Annealing for Fast Solving Combinatorial
Optimization Problems [9.5] SSQAは計算と量子モンテカルロに基づいて設計されている。
QAと比較して100倍の問題を処理でき、従来のSA法よりも大きい問題を処理できる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:50:27 GMT)
Relation-Aware Network with Attention-Based Loss for Few-Shot Knowledge
Graph Completion [9.2] 現在のアプローチでは、マージンベースのランキング損失を最小限に抑えるために、参照エンティティペア毎に1つの負のサンプルをランダムに選択する。
本稿では,意図に基づくロスフレームワークを用いたリレーショナル・アウェア・ネットワークを提案する。
実験により、RANAは2つのベンチマークデータセットで最先端モデルよりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 21:41:43 GMT)
Automated Scoring for Reading Comprehension via In-context BERT Tuning [9.1] 本稿では,NAEP(National Assessment of Education Progress)自動採点課題に対する(大賞受賞)ソリューションについて報告する。
In-context BERT fine-tuning は、慎重に設計された入力構造を持つ全ての項目に対して単一のスコアリングモデルを生成する。
この課題から得られたトレーニングデータセットを用いて,地域評価によるアプローチの有効性を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:37:17 GMT)
Vision-Based Robust Lane Detection and Tracking under Different
Challenging Environmental Conditions [8.3] レーンマーキング検出は、どちらも先進運転支援システムの基本である。
本稿では,3つの重要な技術を用いた頑健な車線検出・追跡手法を提案する。
実験の結果、平均検出率は97.55%であり、平均処理時間は22.33msec/frameであることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:35:28 GMT)
R2-Diff: Denoising by diffusion as a refinement of retrieved motion for
image-based motion prediction [8.1] 画像に基づく動き予測において、拡散モデルは、画像コンテキストに基づいてランダムノイズを段階的に denoising することによって、文脈的に適切な動きを予測する。
R2-Diffでは、画像類似性に基づいてデータセットから取得した動きをランダムノイズの代わりに拡散モデルに入力する。
R2-Diffは、ロボット操作における最近の最先端モデルと比較して、適切な動作を正確に予測し、高いタスク成功率を達成する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:27:06 GMT)
Learning by Aligning 2D Skeleton Sequences in Time [8.1] 自己監督型時間的ビデオアライメントフレームワークは、いくつかのきめ細かい人間の活動理解アプリケーションに有用である。
2Dスケルトン熱マップをビデオ変換器に供給し、空間時間領域の両方で自己注意を行う。
提案手法は, 精度の向上だけでなく, 欠落したキーポイントに対してCASAよりも優れている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:29:15 GMT)
Contrasting Intra-Modal and Ranking Cross-Modal Hard Negatives to
Enhance Visio-Linguistic Fine-grained Understanding [7.9] 現在のビジョンと言語モデル(VLM)は、様々な視覚言語タスクにおいて強いパフォーマンスを示すが、細かな理解に苦慮している。
カリキュラム学習として機能する適応しきい値を持つモード内コントラスト損失とユニークなクロスモーダルランク損失を導入する。
提案手法は,3つのきめ細かいベンチマークにおいて顕著な改善をもたらすとともに,精密な推論における最先端のモッセルであるX-VLMの性能も向上する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:26:28 GMT)
Representation Disentaglement via Regularization by Identification [7.8] 分散因数分解特性に適合するデータの、現代の深層表現学習モデルは、コライダーバイアスの振る舞いに悪影響を及ぼしていると論じる。
本稿では,大規模DLモデルの振る舞いをドメイン知識と整合させるモジュール型正規化エンジンReIを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 21:31:23 GMT)
Joint Path planning and Power Allocation of a Cellular-Connected UAV
using Apprenticeship Learning via Deep Inverse Reinforcement Learning [7.8] 本稿では,郊外環境におけるセルラー接続型無人航空機(UAV)の干渉対応共同経路計画と電力配分機構について検討する。
UAVは、そのアップリンクスループットを最大化し、近隣のBSに接続された地上ユーザ機器(UE)への干渉のレベルを最小化することを目的としている。
Q-learning と深層強化学習 (DRL) を併用した逆強化学習 (IRL) による見習い学習手法
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:50:05 GMT)
Sampling-Based Techniques for Training Deep Neural Networks with Limited
Computational Resources: A Scalability Evaluation [7.7] ディープニューラルネットワークのトレーニング時間を高速化するためのサンプリングベースのテクニックがいくつか提案されている。
本稿では,計算資源が限られているCPUマシンにおいて,これらの手法のスケーラビリティを評価する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:19:48 GMT)
MBrain: A Multi-channel Self-Supervised Learning Framework for Brain
Signals [7.7] 本稿では,SEEGデータとEEGデータのいずれかを事前学習できる脳信号の自己教師型学習フレームワークについて検討する。
そこで我々は,異なるチャネル間の空間的および時間的相関を暗黙的に学習するために,MBrainを提案する。
我々のモデルは、最先端のSSLおよび教師なしモデルよりも優れており、臨床に展開する能力を持っている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:14:26 GMT)
SCALE: Scaling up the Complexity for Advanced Language Model Evaluation [7.6] 現在のLarge Language Models (LLM) に課題をもたらす新しい NLP ベンチマークを導入する。
我々のベンチマークはスイスの法体系の様々な法的NLPデータセットで構成されている。
本研究の一環として,ベンチマークで事前学習した複数言語モデルを評価し,基準点として強いベースラインを確立する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:19:15 GMT)
Spherical Inducing Features for Orthogonally-Decoupled Gaussian
Processes [7.4] ガウス過程(GP)は、表現を学習する能力の欠如により、ディープニューラルネットワーク(NN)と比較されることがしばしばある。
GPとディープNNのギャップを埋める最近の試みは、新しいタイプのドメイン間変分GPを生み出し、誘導変数はフィードフォワードNNの隠れ単位に対応する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:51:43 GMT)
Sample-Efficient Learning of Novel Visual Concepts [7.4] 最先端のディープラーニングモデルは、数ショットで新しいオブジェクトを認識するのに苦労している。
我々は,記号的知識グラフを最先端認識モデルに組み込むことで,効果的に数発の分類を行うことができることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:24:30 GMT)
WebIE: Faithful and Robust Information Extraction on the Web [7.4] We present WebIE, a first large-scale, entity-linked closed IE dataset with 1.6M sentences。
WebIEには否定的な例、すなわち事実の3倍の文が含まれており、ウェブ上のデータをよく反映している。
生成IEモデルのドメイン内, ドメイン内, ドメイン内, ゼロショットの言語間性能を評価し, WebIE で訓練されたモデルの方がより汎用性が高いことを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:51:36 GMT)
Multi Kernel Positional Embedding ConvNeXt for Polyp Segmentation [7.3] 本稿では,ConvNeXtバックボーンとMulti Kernel Positional Embeddingブロックで構成される新しいフレームワークを提案する。
我々のモデルは,Kvasir-SEGデータセット上でのDice係数0.8818とIOUスコア0.8163を達成する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:08:06 GMT)
Predictive Maneuver Planning with Deep Reinforcement Learning (PMP-DRL)
for comfortable and safe autonomous driving [7.3] 本稿では,演習計画のためのPMP-DRLモデルを提案する。
その経験から学ぶことで、強化学習(RL)ベースの運転エージェントは、変化する運転条件に適応することができる。
その結果、PMP-DRLは複雑な現実世界のシナリオを処理でき、ルールベースや模倣の模倣よりも快適で安全な操作判断ができることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:27:30 GMT)
Knowledge Guided Representation Learning and Causal Structure Learning
in Soil Science [7.2] 本研究では,土壌科学における科学的発見を促進するためのフレームワーク,知識指導型表現学習,因果構造学習(KGRCL)を提案する。
このフレームワークは, 観測された土壌プロセスと条件分布マッチングにより, シミュレーションされた土壌プロセスの表現学習を改善する。
学習された因果グラフは、他の因果発見法から生成された他のグラフよりも、基底真理を代表している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:31:13 GMT)
Span-Selective Linear Attention Transformers for Effective and Robust
Schema-Guided Dialogue State Tracking [7.2] 本稿では,従来の手法よりも優れた一般化と効率を実現する新しいアーキテクチャであるSPLATを紹介する。
本稿では,SGD(Guided Dialogue)とMultiWOZ(MultiWOZ)データセットにおけるモデルの有効性を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:31 GMT)
Instantaneous nonlocal quantum computation and circuit depth reduction [7.1] 我々は、瞬時二要素量子計算(または測定)のための効率的なプロトコルを示す。
クリフォードゲートとTゲートの層からなる任意のユニタリ回路は、元の回路のT深さに比例した深さの測定値を持つ回路を用いて実装可能であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:57:50 GMT)
Advancing Volumetric Medical Image Segmentation via Global-Local Masked
Autoencoder [7.0] Masked Autoencoder (MAE) は有望な自己教師型事前訓練技術として登場した。
Global-Local Masked AutoEncoder (GL-MAE) は、シンプルだが効果的な自己指導型事前学習戦略である。
GL-MAEは、マスクされたグローバルボリュームとマスクされたローカルボリュームの両方を再構築する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:32:10 GMT)
PaReprop: Fast Parallelized Reversible Backpropagation [6.9] 非常にメモリ効率のよいトレーニングのためのエキサイティングな新しい方法として、可逆変換器が導入されている。
それらは、バックプロパゲーションフェーズにおけるアクティベーション再計算のさらなる計算オーバーヘッドを伴っている。
本稿では,高速並列化可逆バックプロパゲーションアルゴリズムPaRepropを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:32 GMT)
INoD: Injected Noise Discriminator for Self-Supervised Representation
Learning in Agricultural Fields [6.9] Injected Noise Discriminator (INoD) を提案する。
INoDは、畳み込みエンコーディング中に2つの非結合データセットからフィーチャーマップをインターリーブし、結果のフィーチャーマップのデータセットアフィリエイトをプレテキストタスクとして予測する。
提案手法により、ネットワークは、あるデータセットで見られるオブジェクトの無意味な表現を学習し、解離したデータセットの類似した特徴と合わせて観察することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:55:23 GMT)
Do Software Security Practices Yield Fewer Vulnerabilities? [6.7] 本研究の目的は、専門家や研究者がどのセキュリティプラクティスを採用するべきかを判断するのを支援することである。
4つのセキュリティプラクティスが、脆弱性数に影響を与える最も重要なプラクティスでした。
パッケージの総セキュリティスコアが増加するにつれて、報告された脆弱性の数は減少した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:45:33 GMT)
Symmetry & Critical Points for Symmetric Tensor Decomposition Problems [6.7] 我々は,非言語性ミニマの家系が出現し,他の家系が消滅することを示す。
大域点ミニマの集合に対して、異なる選択のテンソルノルムの下では不変であることが示されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:51:43 GMT)
In Search of netUnicorn: A Data-Collection Platform to Develop
Generalizable ML Models for Network Security Problems [6.6] 我々は、古典的な「時間ガラス」モデルからインスピレーションを得て、その「薄腰」として実装されるデータ収集プラットフォームであるnetUnicornを開発した。
我々は、NetUnicornが複数のネットワーク環境から異なる学習問題に対するデータ収集をいかに単純化するかを実証する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:42:25 GMT)
Multilingual End to End Entity Linking [6.5] 私たちは、最初の完全なエンドツーエンドの多言語エンティティリンクモデルであるBELAをリリースし、オープンソース化しました。
BelAは97言語のいずれかのテキストのエンティティを効率的に検出し、リンクする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:02:00 GMT)
Rosetta Neurons: Mining the Common Units in a Model Zoo [6.5] 我々は、様々なモデルにまたがって「ロセッタニューロン」と呼ばれる共通機能の存在を実証する。
本稿では,ロゼッタニューロンの辞書を複数の一般的な視覚モデルでマイニングするアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:54 GMT)
Hyperspectral Image Super-Resolution via Dual-domain Network Based on
Hybrid Convolution [6.4] 本稿ではハイブリッド畳み込み(SRDNet)に基づく新しいHSI超解像アルゴリズムを提案する。
スペクトル間自己相似性を捉えるため、空間領域に自己注意学習機構(HSL)を考案する。
HSIの知覚品質をさらに向上するため、周波数領域のモデルを最適化するために周波数損失(HFL)を導入した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:59:45 GMT)
Training Multimedia Event Extraction With Generated Images and Captions [6.3] CAMEL(Cross-modality Augmented Multimedia Event Learning)を提案する。
我々は,Stable DiffusionやBLIPなどの画像キャプタなどの市販画像生成装置を用いて,マルチモーダルトレーニングデータを生成する。
実験では、CAMELはM2E2ベンチマークの最先端(SOTA)ベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:01:33 GMT)
Engineering imaginary stark ladder in a dissipative lattice: passive
$\mathcal{PT}$ symmetry, K symmetry and localized damping [6.2] 本稿では, 仮想スタークはしごモデルについて検討し, 位置依存散逸強度を線形に増加させた散逸鎖によるモデルの実現を提案する。
単一粒子相関関数の動的進化は、想像上のスタークはしごモデルのハミルトニアンによって制御されていることを明らかにした。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:40:47 GMT)
Attention-based Open RAN Slice Management using Deep Reinforcement
Learning [6.2] 本稿では,O-RAN分散化モジュールと分散エージェント協調を利用した,革新的アテンションベースディープRL(ADRL)技術を提案する。
シミュレーションの結果,他のDRLベースライン法と比較してネットワーク性能が大幅に向上した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:37:19 GMT)
Modularity Trumps Invariance for Compositional Robustness [6.2] 構成画像分類タスクを開発し、いくつかの要素的汚職を考慮し、モデルにこれらの汚職の構成を一般化するよう依頼する。
このモジュラーアプローチは、非モジュラーアプローチよりも優れた構成的ロバスト性を実現することを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:04:10 GMT)
Fast Algorithms for Directed Graph Partitioning Using Flows and
Reweighted Eigenvalues [6.1] 我々は,有向エッジ拡張に対する$O(sqrtlogn)$-approximationとCheeger型保証を実現するために,ほぼ線形時間アルゴリズムを導出する。
これは、有向グラフ分割のための最もよく知られたアルゴリズムを得るための、原始二重フローベースのフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:41:17 GMT)
Host-Based Network Intrusion Detection via Feature Flattening and
Two-stage Collaborative Classifier [6.0] NIDSとHIDSを組み合わせたハイブリッドネットワーク侵入検知システムを提案する。
ネットワーク侵入を識別するために、2段階のMLアルゴリズムをデプロイする2段階の協調分類器が導入された。
提案手法は、CICIDS 2018とNDSec-1という、よく知られた2つのデータセットにまたがって一般化される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:09:00 GMT)
Why does Stereo Triangulation Not Work in UAV Distance Estimation [6.0] 我々は、UAV距離推定のためのUAVDEデータセットを構築し、提示する。
画像位置と実際のUAVとのオフセットを直接予測できる新しい位置補正モジュール(PCM)を提案する。
提案手法は38.84%の性能向上を実現し,その有効性と優位性を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:22:05 GMT)
SIGHT: A Large Annotated Dataset on Student Insights Gathered from
Higher Education Transcripts [5.9] SIGHTは、マサチューセッツ工科大学 OpenCourseWare (MIT OCW) YouTubeチャンネルから収集された数学講義の大量のデータセットと15,784のコメントである。
本稿では,大規模言語モデル(LLM)を用いたコメントの分類を安価に行うためのベストプラクティスを提案する。
これらのテクニックは、何千ものコメントからの有用な学生のフィードバックを明らかにし、コメント1件あたり0.002ドル程度を支払った。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:47 GMT)
Solution of a $5$-state Landau-Zener model and applications to
Su-Schrieffer-Heeger chains [5.9] 積分可能性法では解けない5ドル状態ランダウ・ツェナーモデルについて検討する。
このモデルを用いて5ドルのSu-Schrieffer-Heeger鎖の結合が時間的に線形に変化することを示した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:29:50 GMT)
ChatGPT for Suicide Risk Assessment on Social Media: Quantitative
Evaluation of Model Performance, Potentials and Limitations [5.9] 本稿では,ソーシャルメディア投稿からの自殺評価の文脈において,対話型ChatGPTモデルを評価するための枠組みを提案する。
我々はZero-ShotとFew-Shot実験を用いてChatGPTの性能の技術的評価を行う。
以上の結果から,ChatGPTの精度は高いが,人間の注釈付きデータセットを微調整したトランスフォーマーモデルの方が優れた性能を示した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:01:30 GMT)
Evolutionary Curriculum Training for DRL-Based Navigation Systems [5.9] 本稿では,衝突回避問題に対処するための進化的カリキュラムトレーニングという新しい手法を提案する。
進化的カリキュラムトレーニングの第一の目的は、様々なシナリオにおいて衝突回避モデルの能力を評価し、そのスキルを不十分にするためにカリキュラムを作成することである。
我々は,この進化的学習環境がより高い成功率と平均衝突回数の低下につながるという仮説を検証するために,5つの構造化環境にまたがってモデルの性能をベンチマークした。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:56:34 GMT)
Semantic HELM: An Interpretable Memory for Reinforcement Learning [5.8] 意思決定過程を照らすために,人間の言語で機能する新しい記憶機構を提案する。
我々の記憶機構は,過去の記憶がタスクの解決に不可欠である環境において,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:47:31 GMT)
Large-Scale Quantum Separability Through a Reproducible Machine Learning
Lens [5.8] 量子分離性問題は、二部格子密度行列が絡み合っているか分離可能であるかを決定することである。
大規模シナリオにおいて,このNP-hard問題に対する近似解を求めるための機械学習パイプラインを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:53:26 GMT)
Few-shot bioacoustic event detection at the DCASE 2023 challenge [5.8] この課題は、今年3回目となるDCASEチャレンジの一環として実施された。
2023年、Fスコアが最大63%に達する6つの異なるチームから、ショットタスクが提出された。
Fスコアの結果は着実に改善されている(40%から60%から63%)。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:59:26 GMT)
Hyperbolic Graph Diffusion Model for Molecule Generation [5.4] 分子生成のための拡散モデルを双曲多様体、すなわち双曲グラフ拡散モデル(HGDM)に拡張することを提案する。
提案したHGDMは,双曲型変分オートエンコーダを用いてノードの双曲型隠れ表現を生成し,スコアベースの双曲型グラフニューラルネットワークを用いて双曲空間の分布を学習する。
数値実験により,提案したHGDMは,最先端手法と比較して,複数の分子データセット上で高い性能を示すことが示された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:25:24 GMT)
Detecting Misuses of Security APIs: A Systematic Review [5.3] セキュリティAPIの誤使用は、ハッカーが悪用できる脆弱性をもたらす可能性がある。
API設計の複雑さ、不十分なドキュメント、不十分なセキュリティトレーニングは、セキュリティAPIを誤用する理由のひとつだ。
弊社のレビューは、セキュリティAPIの誤用を検出する最先端技術に関するオープンな研究課題を強調している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:53:23 GMT)
Task-Aware Meta Learning-based Siamese Neural Network for Classifying
Obfuscated Malware [5.3] 既存のマルウェア検出方法は、トレーニングデータセットに難読化されたマルウェアサンプルが存在する場合、異なるマルウェアファミリーを正しく分類できない。
そこで我々は,このような制御フロー難読化技術に対して耐性を持つ,タスク対応の複数ショット学習型サイメスニューラルネットワークを提案する。
提案手法は,同一のマルウェアファミリーに属するマルウェアサンプルを正しく分類し,ユニークなマルウェアシグネチャの認識に極めて有効である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:30:53 GMT)
Unsupervised speech intelligibility assessment with utterance level
alignment distance between teacher and learner Wav2Vec-2.0 representations [5.3] 音声の知性は、効果的なコミュニケーションのための言語学習において不可欠である。
研究の多くは、その知性を監督的な方法で評価している。
本研究は,SIDに対する教師なしアプローチを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:18:30 GMT)
Understanding the Application of Utility Theory in Robotics and
Artificial Intelligence: A Survey [5.2] このユーティリティは、経済学、ゲーム理論、およびオペレーション研究において、ロボティクスとAI分野においても統一された概念である。
本稿では,エージェントのインタラクション間の相互関係を記述し,評価するためのユーティリティ指向の要求パラダイムを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:55:48 GMT)
Robust gates with spin-locked superconducting qubits [5.1] 本稿では、スピンロックと呼ばれる動的疎結合の連続的なバージョンと、トランスモンのためのカプラベースのCZゲートを組み込んだ理論的提案を行う。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:09:51 GMT)
Causal Modeling of Policy Interventions From Sequences of Treatments and
Outcomes [5.1] データ駆動意思決定は、ポリシーが変更されたときに何が起こるかを予測する能力を必要とする。
結果がどのように進化するかを予測する既存の方法は、将来の治療の仮のシーケンスが事前に固定されていると仮定する。
実際には、治療は政策によって決定され、以前の治療の効率に依存する可能性がある。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:23:17 GMT)
MuRS: Mutant Ranking and Suppression using Identifier Templates [4.9] Googleの突然変異テストサービスは、差分ベースの突然変異テストをコードレビュープロセスに統合する。
Googleの突然変異テストサービスは、役に立たないミュータントをターゲットにした、いくつかの抑制ルールを実装している。
テスト中のソースコードのパターンによってミュータントをグループ化する自動手法である MuRS を提案し,評価する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:43:52 GMT)
Explore, Establish, Exploit: Red Teaming Language Models from Scratch [4.7] 大型言語モデル(LLM)は、有害な音声や不正直な音声などの有害な出力から危険をもたらす可能性がある。
従来の作業では、これらのリスクを特定し軽減するために有害なアウトプットを引き出すツールが導入されていた。
この作業は、レッドチームにおける中心的な課題である、モデルが提示できる振る舞いのコンテキスト的理解の開発を省略する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:49:50 GMT)
Combining the QAOA and HHL Algorithm to achieve a Substantial Quantum
Speedup for the Unit Commitment Problem [4.7] 本稿では,既存の古典的手法よりも少なくとも3倍高速に単位コミットメント(UC)問題を解く量子アルゴリズムを提案する。
これは、QAOAルーチン内のHHLアルゴリズムを用いてエネルギー伝達コストを計算することで達成される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:56:58 GMT)
Self-Interpretable Time Series Prediction with Counterfactual
Explanations [4.7] 解釈可能な時系列予測は、医療や自動運転といった安全上重要な分野において重要である。
既存の手法の多くは、重要なスコアを時系列のセグメントに割り当てることで予測を解釈することに集中している。
我々は,時系列予測のための非現実的かつ実用的な説明を生成する,CounTS(Counfactual Time Series)と呼ばれる自己解釈可能なモデルを開発した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:24:08 GMT)
Lexical Speaker Error Correction: Leveraging Language Models for Speaker
Diarization Error Correction [4.4] 話者ダイアリゼーション (SD) は通常、認識された単語に話者ラベルを登録するために自動音声認識 (ASR) システムで使用される。
このアプローチは、特に話者回転と話者重複領域に関する話者誤差を引き起こす可能性がある。
語彙情報を用いた第2パス話者誤り訂正システムを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:47:41 GMT)
Computational-level Analysis of Constraint Compliance for General
Intelligence [4.4] ルール、法則、道徳的命令は人間の行動を管理する制約の類の一例である。
このような混乱にもかかわらず、人間は決定に制約をしっかりと迅速に組み込む。
一般に、人工的な知性エージェントは、現実世界の制約のシステムの混乱をナビゲートできなければならない。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:03:11 GMT)
Extrapolated cross-validation for randomized ensembles [4.3] 本稿では,ランダム化アンサンブルにおけるアンサンブルとサブアンブルサイズを調整するためのクロスバリデーション手法ECVを提案する。
我々は,ECVが2乗予測リスクに対して$delta$-Optimalアンサンブルを得られることを示す。
サンプル分割クロスバリデーションと$K$-foldクロスバリデーションと比較して、ECVはサンプル分割を避けて高い精度を達成する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:12:47 GMT)
Human or Machine: Reflections on Turing-Inspired Testing for the
Everyday [4.3] アラン・チューリングは論文"Computing Machinery and Intelligence"で「アニメーションゲーム」を紹介した。
ここでは、特定のマシンにインテリジェントなラベルを付けることができるのか、あるいは特定のコンテキストにおける人間の能力と一致すると言えるのか、という問題を副次的に取り上げる。
ここでの課題の短期的な探索は,計算機システムの開発に寄与すると考えられる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:24:03 GMT)
Non-Hermitian Topological Phases: Principles and Prospects [4.3] 非エルミート相の特徴の根底にある鍵となる原理を述べる。
例外点、複素エネルギーギャップ、非エルミート対称性の分類について議論する。
また、障害の役割、線形応答フレームワークの提示、および非エルミート系のホール輸送特性の解析についても検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:21:02 GMT)
A Tropical Geometric Approach To Exceptional Points [4.3] 非エルミート系の異なる面を特徴付ける統一的な熱帯幾何学的枠組みを導入・開発する。
我々の研究は、非エルミート物理学の研究のための新しい枠組みを示し、この分野への熱帯幾何学の新たな結びつきを明らかにしている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:17:50 GMT)
Training generative models from privatized data [4.3] ローカルディファレンシャルプライバシ(LDP)は、プライバシ保護データ収集のための強力な方法である。
本研究では,GAN(Generative Adversarial Networks)を,差分民営化データに基づいて学習するためのフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:28:45 GMT)
Deep Generative Models for Decision-Making and Control [4.2] この論文の2つの目的は、これらの欠点の理由を研究し、未解決問題に対する解決策を提案することである。
本稿では、ビームサーチを含む現代の生成モデリングツールボックスからの推論手法を、強化学習問題のための実行可能な計画戦略として再解釈する方法について述べる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 01:54:30 GMT)
Multipartite Nonlocality in Clifford Networks [4.2] 我々は、ネットワーク上の運用上の制約の観点から、異なるタイプの量子ネットワーク非局所性を分類する。
両部絡み合いは、選択後に許容される全ての量子ネットワーク非局所性を生成するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:55:22 GMT)
Overcoming the Limitations of Localization Uncertainty: Efficient &
Exact Non-Linear Post-Processing and Calibration [4.2] 既存の研究は、その局在化出力をガウス分布としてモデル化することで、物体検出器のアレター的不確かさを推定する。
我々は、芸術の状況に適応していない3つの側面を識別するが、さらなる探索は保証する。
我々は,(1)効率の良いDetにおける損失減衰を実装し,出力分布の正確かつ迅速な伝播のための2つの決定論的手法を提案し,(2)予測の不確実性が誤校正されていることをKITTIとBDD100Kデータセットで示すことによって,これらの制限を克服する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:20:07 GMT)
Searching for the Fakes: Efficient Neural Architecture Search for
General Face Forgery Detection [4.2] 我々は、ディープフェイク検出のためのニューラルネットワーク探索(NAS)に基づくエンドツーエンドフレームワークを開発する。
本稿では,より一般的なモデルを選択するための探索プロセスを導く新しい性能推定指標を提案する。
人工的に設計した最先端ネットワークと比較して,本手法は,データベース内シナリオとデータセット間シナリオの両方において,競合性能を実現する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:01:13 GMT)
Neuroevolution is a Competitive Alternative to Reinforcement Learning
for Skill Discovery [4.2] 深層強化学習(Deep Reinforcement Learning, RL)は、複雑な制御タスクを解決するために神経ポリシーをトレーニングするための強力なパラダイムとして登場した。
品質多様性(QD)手法は,スキル発見のための情報理論強化RLの代替手段であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:08:19 GMT)
Shadow-based quantum subspace algorithm for the nuclear shell model [4.1] 核系の基底エネルギーを計算するための新しいアルゴリズムを提案する。
我々のアルゴリズムは古典的な影と部分空間の対角化技術を組み合わせたものである。
ショット数が増えるにつれて,結果の精度が向上することがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:39:23 GMT)
Performance Evaluation and Comparison of a New Regression Algorithm [4.1] 新たに提案した回帰アルゴリズムの性能を,従来の4つの機械学習アルゴリズムと比較した。
GitHubリポジトリにソースコードを提供したので、読者は結果の複製を自由にできます。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:01:16 GMT)
Hyperbolic Convolution via Kernel Point Aggregation [4.1] HKConvは、まず、訓練可能な局所双曲的特徴と、双曲空間に固定されたカーネル点とを相関付ける新しい訓練可能な双曲的畳み込みである。
我々は,HKConv層を有するニューラルネットワークが,様々なタスクにおいて最先端を推し進めていることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:15:13 GMT)
LMD: Light-weight Prediction Quality Estimation for Object Detection in
Lidar Point Clouds [3.9] Lidarのクラウドデータのオブジェクト検出は、自動運転とロボット工学にとって有望な技術だ。
不確実性推定は下流タスクにとって重要な要素であり、ディープニューラルネットワークは信頼性の高い予測であってもエラーを起こしやすい。
予測品質推定のための軽量後処理方式LidarMetaDetectを提案する。
本実験は,偽予測から真を分離する際の統計的信頼性を著しく向上させることを示した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:14:19 GMT)
Improving Reading Comprehension Question Generation with Data
Augmentation and Overgenerate-and-rank [3.9] 自動回答対応読解質問生成は、教育活動における学習者支援を拡大する大きな可能性を秘めている。
この設定における重要な技術的課題の1つは、複数の質問があり得るということです。
本研究では,(1)同じ文脈と回答を与えられた多様な質問でトレーニングデータセットを充実させるデータ拡張手法,(2)候補のプールから最適な質問を選択する過剰な生成とランクの手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:23:25 GMT)
Wikibio: a Semantic Resource for the Intersectional Analysis of
Biographical Events [3.8] 文献的事象検出のための新しいコーパスを提示する。
このモデルでは、Fスコア0.808のバイオグラフィーでターゲットエンティリティのすべての言及を検出することができた。
また、ウィキペディアの伝記の中で、女性と非西洋人の偏見の分析にも使用された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:59:37 GMT)
Tree Variational Autoencoders [3.7] 本稿では,潜在変数上の柔軟木に基づく後続分布を学習する階層的階層クラスタリングモデルを提案する。
The proposed Tree Variational Autoencoder (TreeVAE)hierarchically splits sample based to their intrinsic Characteristics, shedding light on hidden structure in the data。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:25:04 GMT)
A Self-Supervised Miniature One-Shot Texture Segmentation (MOSTS) Model
for Real-Time Robot Navigation and Embedded Applications [3.7] 本稿では, 自己教師型ワンショットテクスチャセグメンテーションフレームワークとRGB-Dカメラを用いて, 堅牢なドライビング可能な領域セグメンテーションを実現する方法について検討する。
MOSTSの性能を既存の1ショットテクスチャセグメンテーションモデルと比較するためのベンチマーク研究を行った。
その結果,MOSTSは室内乾燥領域のセグメンテーションにおいて最大8倍高速な推論速度で比較精度が得られた。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:12:45 GMT)
Self-supervised Equality Embedded Deep Lagrange Dual for Approximate
Constrained Optimization [3.7] ニューラルネットワーク(NN)を用いた高速最適近似器としてDeepLDEを提案する。
不等式制約を課すために,DeepLDEと初等・非双対学習法の収束を証明した。
提案したDeepLDEソリューションは,最小のNNベースアプローチ間の最適ラグギャップを実現する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:00:27 GMT)
A Comparison of Self-Supervised Pretraining Approaches for Predicting
Disease Risk from Chest Radiograph Images [3.6] 胸部X線画像を用いた半教師付き学習と自己指導型学習を比較し,死亡リスクを予測する。
半教師付きオートエンコーダは,内部および外部の検証において,コントラストや伝達学習よりも優れることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:48:14 GMT)
Cross-Modal Video to Body-joints Augmentation for Rehabilitation
Exercise Quality Assessment [3.5] 運動に基づくリハビリテーションプログラムは、生活の質を高め、死亡率と再入院を減らすことが示されている。
AIによる仮想リハビリテーションプログラムにより、患者は自宅で独立して運動を完了できる一方、AIアルゴリズムは運動データを分析して患者にフィードバックを与え、臨床医に進捗を報告することができる。
本稿では,RGBビデオを用いてリハビリテーション運動の質を評価するための新しいアプローチを提案する。また,連続したRGBビデオフレームから骨格体関節の配列を抽出し,多対一の連続ニューラルネットワークを用いて解析し,運動品質を評価する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:23:35 GMT)
Leveraging Residue Number System for Designing High-Precision Analog
Deep Neural Network Accelerators [3.4] 我々は、残基数システム(RNS)を用いて、複数の低精度演算から高精度演算を構成する。
RNSは6ドルビットの精度しか持たないデータコンバータを用いて、最先端のDNN推論に対して99%のFP32精度を達成できる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:24:18 GMT)
Arbitrariness Lies Beyond the Fairness-Accuracy Frontier [3.4] 我々は,最先端のフェアネス介入が,グループフェアネスと精度の指標よりも高い予測倍率を隠蔽できることを示した。
より一貫した予測を確実に保証するフェアネス介入に適用可能なアンサンブルアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:15:46 GMT)
A Graphical Formalism for Commonsense Reasoning with Recipes [3.3] コンベチブル(インディエント、中間食品、最終製品)をキャプチャするグラフィカルな形式化を提案する。
次に,レシピの比較,レシピのサブレシピからの合成,レシピをサブレシピに分解するための公式な定義を提案する。
また, 食材が不足している場合, あるいはいくつかの動作が不可能であったり, 最終製品を変更する必要があるため, レシピに置き換える公式な定義を2つ導入し比較する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:04:30 GMT)
A Search for Nonlinear Balanced Boolean Functions by Leveraging
Phenotypic Properties [3.3] 非線型値の高い完全平衡ブール関数を求める問題を考察する。
このような関数は暗号や誤り訂正符号理論のような領域に広く応用されている。
そこで本研究では,その基礎となる問題の構造を利用した局所探索手法を用いて,そのような関数の探索手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:16:19 GMT)
Open-Source Skull Reconstruction with MONAI [3.2] MUG500+の頭蓋骨データセットを事前訓練したmonAIの深層学習に基づく頭蓋骨再建法を提案する。
本論文の主目的は、monAIフレームワークの下で、オープンソースコードと事前学習されたディープラーニングモデルの調査である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:37:12 GMT)
Chirped Bloch-Harmonic oscillations in a parametrically forced optical
lattice [3.2] 周期ポテンシャルにおけるウェーブパレット伝播の加速は、k空間力学と実空間力学を乱す。
我々は,k空間の力学と実空間の力学が位置依存力によって絡み合っているモデル系の力学を解析する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:43:42 GMT)
CNN Feature Map Augmentation for Single-Source Domain Generalization [3.1] ドメイン・ジェネリゼーション(DG)はここ数年で大きな注目を集めている。
DGの目標は、トレーニング中に利用可能なものと異なるデータ分散を提示した場合、引き続き正常に機能するモデルを作成することだ。
単一ソースDG画像分類設定における畳み込みニューラルネットワークアーキテクチャの代替正則化手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:26:46 GMT)
On the Interplay of Subset Selection and Informed Graph Neural Networks [3.1] この研究は、QM9データセットにおける分子の原子化エネルギーの予測に焦点を当てている。
トレーニングセット選択過程における分子多様性の最大化は,線形回帰法および非線形回帰法のロバスト性を高めることを示す。
また、モデルに依存しない説明器を用いて、グラフニューラルネットワークによる予測の信頼性を確認する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:09:27 GMT)
Classification of integers based on residue classes via modern deep
learning algorithms [3.0] 本稿では,大規模有限整数の分類において,複数のディープラーニングアーキテクチャと特徴工学的アプローチを検証した。
ネットワークアーキテクチャやネットワークの複雑さに関わらず、分類の能力は、ディープラーニングモデルに入力される機能空間に依存することが判明した。
また、Amazon、Google、Microsoftから入手可能なAutomated Machine Learning (AutoML)パイプラインを評価しました。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:33:55 GMT)
The Split Matters: Flat Minima Methods for Improving the Performance of
GNNs [2.9] グラフニューラルネットワーク(GNN)のトレーニングのための平らなミニマ法とそれらの組み合わせについて検討する。
我々は,異なる列車試験分割による,小規模かつ大規模な引用,共同購入,およびタンパク質データセットの実験を行った。
実験結果から, 列車分割がランダム化される場合, 平坦なミニマ法はGNNモデルの性能を2点以上向上できることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:29:09 GMT)
Subject Granular Differential Privacy in Federated Learning [2.9] 本稿では,各フェデレーションユーザに対して,主観レベルDPを局所的に適用する2つの新しいアルゴリズムを提案する。
我々の最初のアルゴリズムはLocalGroupDPと呼ばれ、人気のあるDP-SGDアルゴリズムにおけるグループ差分プライバシーの簡単な応用である。
第2のアルゴリズムは、トレーニングミニバッチに参加する被験者を対象とした階層的勾配平均化(HiGradAvgDP)という新しいアイデアに基づいている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:37:11 GMT)
Get Out of the Nest! Drivers of Social Influence in the
#TwitterMigration to Mastodon [2.9] Elon Muskの買収後のTwitterユーザからMastodonへのマイグレーションは、集合行動を研究するユニークな機会である。
移行した約75,000人の利用者のソーシャルネットワークと公開会話を分析した。
移動の時間的痕跡は、社会的影響の現象と相容れないことが判明した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:11:39 GMT)
Zero-Shot Anomaly Detection with Pre-trained Segmentation Models [2.9] 本稿では,視覚異常・ノベルティ検出(VAND)2023チャレンジのゼロショットトラックについて概説する。
WINCLIPフレームワークの性能に基づいて、ゼロショットセグメンテーションモデルを統合することにより、システムのローカライゼーション能力を向上することを目指している。
パイプラインは外部データや情報を必要としないため、新たなデータセットに直接適用することが可能です。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:43:07 GMT)
DaMuEL: A Large Multilingual Dataset for Entity Linking [2.8] DaMuELは、エンティティに関する言語に依存しない情報を含む知識ベースと、知識ベースにリンクされたエンティティの言及を持つウィキペディアテキストの2つのコンポーネントから構成される。
データセットには、知識ベースに279万個の名前付きエンティティと、Wikipediaのテキストから12.3Gトークンが含まれている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:15:52 GMT)
Neural World Models for Computer Vision [2.7] 深層ニューラルネットワークによってパラメータ化された世界モデルと政策をトレーニングするためのフレームワークを提案する。
我々は、幾何学、意味論、動きといった重要なコンピュータビジョンの概念を活用して、複雑な都市運転シーンに世界モデルを拡張する。
都会の運転環境における静的シーン, 動的シーン, エゴビヘイビアを共同で予測できる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:58:21 GMT)
The Rise of Disappearing Frameworks in Web Development [2.7] いわゆる消滅するWebフレームワークの台頭は、初期のWebと単純な静的サイトの恩恵をもたらす。
これらの最新の発展は、初期の世代のWebフレームワークの公理に疑問を呈する、いわゆる消滅するWebフレームワークの台頭である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:09:04 GMT)
Offline Multi-Agent Reinforcement Learning with Coupled Value
Factorization [2.7] OMACは結合値因数分解を伴う新しいオフラインマルチエージェントRLアルゴリズムである。
OMACは局所状態値関数でサンプル内学習を行い、局所レベルで最大Q演算を暗黙的に行う。
我々は、最先端のオフラインマルチエージェントRL法よりも優れたOMAC性能を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:08:41 GMT)
NERFBK: A High-Quality Benchmark for NERF-Based 3D Reconstruction [2.6] NeRFBKは、NeRFベースの3D再構成アルゴリズムのテストと比較のために設計された、リアルで合成されたデータセットである。
本稿では,NeRFBKベンチマークの設計と作成,様々な実例と応用シナリオについて述べる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:51:34 GMT)
Yes, we CANN: Constrained Approximate Nearest Neighbors for local
feature-based visual localization [2.5] Constrained Approximate Nearest Neighbors (CANN) は、局所的特徴のみを用いて、幾何学と外観空間の両方にわたって k-アネレスト近傍の合同解である。
提案手法は,現在最先端のグローバルな特徴量検索と,局所的な特徴量集計手法を用いたアプローチの両方に優れる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:12:10 GMT)
Are ChatGPT and Other Similar Systems the Modern Lernaean Hydras of AI? [2.5] AIシステムは、数十年にわたって開発者が作成したオープンソースコードの巨大なライブラリにアクセスすることで、質問や要求に対する応答(出力)を提供する。
どのようにしてこのようなことが起こるのか、そして、イノベーションを保護できる何年にもわたって訴訟の解決が、この記事の焦点である。
a) 開発者が作成したオープンソースコードのライセンスの即時変更により、人間のみへのオープンソースコードのアクセスおよび/または使用が可能になります。 (b) AIシステムがオープンソースから適切なライセンスを取得するために、マサチューセッツ工科大学(MIT)ライセンスの改訂を提案します。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:40:30 GMT)
Sound Demixing Challenge 2023 -- Music Demixing Track Technical Report [2.4] 我々は2023年のミュージック・デミキシング・トラック・オブ・サウンド・デミキシング・チャレンジで受賞したソリューションについて紹介する。
我々は,MUSDBベンチマークの最先端結果を実現する時間効率のよいソース分離ネットワークと,ノイズ・ロバスト音源分離のための損失マスキング手法の2つの手法に着目した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:59:04 GMT)
Improving Knowledge Extraction from LLMs for Robotic Task Learning
through Agent Analysis [2.4] 大規模言語モデル(LLMs)は、ロボットタスク学習の知識源として大きな可能性を秘めている。
素早いエンジニアリングを拡張し補完する認知エージェントアプローチについて述べる。
ロボットがLLMから幅広い応答を抽出し,評価することにより,一発学習において75%以上のタスク完了を達成できることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:05:51 GMT)
Statutory Professions in AI governance and their consequences for
explainable AI [2.4] AIの使用によって引き起こされる意図的・偶発的な害は個人の健康、安全、権利に影響を及ぼした。
我々は、AI規制フレームワークの必須部分として、法定専門職の枠組みを導入することを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:51:28 GMT)
Datasheets for Machine Learning Sensors [2.4] 機械学習(ML)センサーは、エッジでのインテリジェンスを可能にするための新たなパラダイムを提供すると同時に、エンドユーザによるデータコントロールの強化を実現している。
本稿では,MLセンサの標準テンプレートを導入し,システムのハードウェア,MLモデルとデータセット属性,エンドツーエンドのパフォーマンス指標,環境への影響など,その重要なコンポーネントについて論じる。
センサデータの責任と効果的な利用を保証するため、幅広いMLコミュニティにおける標準化の必要性を強調した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:24:13 GMT)
To the Noise and Back: Diffusion for Shared Autonomy [2.3] 拡散モデルの前方および逆拡散過程を変調した共有自律性に対する新しいアプローチを提案する。
我々のフレームワークは望ましい行動の空間上の分布を学習する。
次に、拡散モデルを使用して、ユーザのアクションをこのディストリビューションのサンプルに変換する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:06:12 GMT)
Diffusion-based Conditional ECG Generation with Structured State Space
Models [2.3] 我々は,70以上の心電図を用いた合成12誘導心電図作成のためのSSSD-ECGを提案する。
信頼性の低いベースラインが欠如しているため、2つの最先端非条件生成モデルの条件変種も提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:30:31 GMT)
Engaging Google Teams Through Moral Imagination: A Bottom-Up Approach
for Responsible Innovation and Ethical Culture Change in Technology Companies [2.3] 我々は,技術系企業のエンジニアリングチームと製品チームに対して,責任あるイノベーションの文化を促進するための「モラル・イマジネーション」手法を提案する。
当社のアプローチは、過去2年間にわたってGoogleで運用され、組織全体のチームと40以上のワークショップを開催しています。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:10:01 GMT)
MPSTAN: Metapopulation-based Spatio-Temporal Attention Network for
Epidemic Forecasting [2.0] メタポピュレーションに基づく時空間注意ネットワーク(MPSTAN)と呼ばれるハイブリッドモデルを提案する。
本モデルは,マルチパッチ疫学知識を時間モデルに取り入れ,パッチ間相互作用を適応的に定義することにより,流行予測の精度を向上させることを目的とする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:12:55 GMT)
Generalizable Resource Scaling of 5G Slices using Constrained
Reinforcement Learning [2.0] ネットワークスライシングは、5Gが様々なアプリケーションをサポートするための重要なイネーブルである。
5G インフラストラクチャプロバイダ (InP) は,スライストラフィックに応じて適切なリソースを割り当てることが必須である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:16:34 GMT)
Quality and Efficiency of Manual Annotation: Pre-annotation Bias [1.9] この実験の目的は、事前アノテーションを用いた場合の最終的なアノテーション品質を判断することである。
実験により、事前アノテーションはより高速な手動構文アノテーションのための効率的なツールであることが確認された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:41:14 GMT)
ppAURORA: Privacy Preserving Area Under Receiver Operating
Characteristic and Precision-Recall Curves [1.9] AUCは、異なる機械学習モデルの品質を比較するためのパフォーマンス指標である。
ラベルにはプライバシーに敏感な情報も含まれているため、グローバルAUCを計算することも問題になる可能性がある。
我々は、複数のソースから個別にソートされたリストをプライベートにマージし、正確なAUCを計算するMPCベースのソリューションpAURORAを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:09:19 GMT)
Seeing the Pose in the Pixels: Learning Pose-Aware Representations in
Vision Transformers [1.8] 視覚変換器(ViT)におけるポーズ認識表現学習のための2つの戦略を導入する。
Pose-aware Attention Block (PAAB)と呼ばれる最初の方法は、ビデオ内のポーズ領域に局所的な注意を向けるプラグインとプレイのViTブロックである。
第2の方法は Pose-Aware Auxiliary Task (PAAT) と呼ばれ、プライマリなViTタスクと協調して最適化された補助的なポーズ予測タスクを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:58:39 GMT)
Fundamental Sensitivity Limits for non-Hermitian Quantum Sensors [1.8] 我々は,非エルミートセンサが感度性能においてハーミートセンサよりも優れていないことを証明した。
2つの具体的な非エルミートセンシングの提案を精査することにより、これらのセンサの感度が予測と一致していることが実証された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:33:35 GMT)
Out of Distribution Generalization via Interventional Style Transfer in
Single-Cell Microscopy [1.8] コンピュータビジョンシステムの現実的な展開には、文脈的ニュアンスに不変な因果表現が必要である。
我々は,OOD一般化の難易度が高まる中で,モデルが因果表現を学習する程度を評価するテストを提案する。
他の確立された指標によって評価されるように、一見強靭なパフォーマンスにもかかわらず、これらのテストでは、悪質なベースラインと現代的なベースラインの両方が、相反することを防ぐために設計されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:08:16 GMT)
On Certified Generalization in Structured Prediction [1.8] 構造化予測では、対象オブジェクトは独立成分に分解されない豊富な内部構造を持つ。
一般化の速度は、構造化された例の数だけでなく、その大きさでスケールする、構造化予測のための新しいPAC-ベイジアンリスクバウンドを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:15:26 GMT)
On the $k$-Hamming and $k$-Edit Distances [1.6] 我々は、古典的なハミングと編集距離の自然な一般化である、重量付き$k$ハミングと$k$-Edit距離を考える。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:03:28 GMT)
Properties of donor qubits in ZnO formed by indium ion implantation [1.6] 弱中性ドナー (D$0$) inO は固体スピン量子ビットの候補として浮上している。
ドナースピン上のレーザーラマン分光は、ドナー電子とスピン-9/2 In核との超微細な相互作用を明らかにする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:13:11 GMT)
Evolving Populations of Diverse RL Agents with MAP-Elites [1.6] 政策だけでなく,任意の強化学習(RL)アルゴリズムの利用を可能にするフレキシブルなフレームワークを導入する。
我々は,多数のロボット制御問題に対する広範な数値実験を通じて,我々のフレームワークがもたらすメリットを実証する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:04:39 GMT)
MLonMCU: TinyML Benchmarking with Fast Retargeting [1.4] 特定のアプリケーションに対して、フレームワークとターゲットの最適な組み合わせを選択するのは簡単ではありません。
MLonMCUと呼ばれるツールが提案され,最新のTinyMLフレームワークであるTFLite for MicrocontrollersとTVMのベンチマークによって実証されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:44:35 GMT)
Motion Capture Dataset for Practical Use of AI-based Motion Editing and
Stylization [1.4] そこで我々は,動きスタイル伝達領域のための新しいスタイル多様性データセットを提案する。
運動データセットは産業標準のヒト骨構造を使用する。
我々は,最先端技術を用いた実験において,動作スタイルの伝達に関する包括的な研究を行う。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:12:54 GMT)
Improving Path Planning Performance through Multimodal Generative Models
with Local Critics [1.4] 本稿では,障害物のある未知のシーンにおける経路計画タスクを高速化する新しい手法を提案する。
自由条件構成空間の分布を近似するために,Wasserstein Generative Adversarial Networks (WGANs) と Gradient Penalty (GP) を用いる。
実験の結果,WGAN-GPで準最適経路を生成しながら,未知のシーンでの経路計画タスクを高速化する有望な結果が得られた。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:51:35 GMT)
MPSA-DenseNet: A novel deep learning model for English accent
classification [1.3] MPSA-DenseNetは、英語のアクセントを正確に識別するための非常に有望なモデルである。
本稿では,英語アクセント分類のための3つの革新的なディープラーニングモデルを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 01:03:54 GMT)
Shor's Algorithm Does Not Factor Large Integers in the Presence of Noise [1.3] 我々は、ショアの量子ファクタリングアルゴリズムをノイズの多い量子ゲートの設定とみなす。
回転ゲートに対するランダムノイズの一般的なモデルの下では、このアルゴリズムが$pq$という形の整数を分解しないことが証明される。
さらに、確率 1 - o(1)$ over random prime pairs $(p,q)$, Shor's factoring algorithm not factor number of the form $pq$, with the level of random noise present。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 21:55:44 GMT)
Joint optimization of a $\beta$-VAE for ECG task-specific feature
extraction [1.3] 説明可能な特徴抽出器として$beta$-variational autoencoders (VAEs) を用いた。
信号再構成と心機能予測を共同で最適化することにより,予測能力の向上を図る。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:24:01 GMT)
The pop song generator: designing an online course to teach
collaborative, creative AI [1.3] この記事では、新しいオンラインAI創造コースについて記述し、評価する。
このコースは、3つの最先端AIモデルに基づいており、ポップソング生成システムに組み込まれている。
微調整されたGPT-2モデルは歌詞を書き、Music-VAEは楽譜と楽器を作成し、Diffsingerは歌声を合成する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:17:28 GMT)
Towards Mode Balancing of Generative Models via Diversity Weights [1.2] トレーニングデータセットのモードのバランスをとることで、モデルの出力の多様性を高めるトレーニングスキームであるダイバーシティウェイトを提示する。
我々は、より一般的に、生成機械学習における多様性、エクイティ、包摂性への我々のアプローチの関連と、特に計算的創造性について論じる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:21:29 GMT)
Domain-specific ChatBots for Science using Embeddings [1.1] 大規模言語モデル(LLM)は、無数のタスクを処理できる強力な機械学習システムとして登場した。
本稿では,既存の手法とソフトウェアツールを簡単に組み合わせて,ドメイン固有のチャットボットを実現する方法を紹介する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:26:20 GMT)
Efficient Learning of Quantum States Prepared With Few Non-Clifford
Gates [1.0] 我々はクリフォードゲートと$O(log(n))$非クリフォードゲートで用意された量子状態を効率的に学習するアルゴリズムを与える。
具体的には、$n$-qubit state $lvert psi rangle$に対して、$mathsfpoly(n,2t,1/epsilon)$ time and copy of $lvert psi rangle$ sufficeを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:50:37 GMT)
BED: Bi-Encoder-Based Detectors for Out-of-Distribution Detection [1.0] 本稿では,バイエンコーダを用いた検出器を用いた新しい手法を提案する。
NLPにおける様々なアウト・オブ・ディストリビューション(OOD)検出法を比較した総合的研究を行った。
提案されたバイエンコーダベースの検出器は、トレーニングでOODラベルを必要とするものと、そうでないものの両方において、他の方法よりも優れている。
トレーニングプロセスの単純さと優れた検出性能により、現実のシナリオに適用できる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:41:28 GMT)
Quantifying non-stabilizerness efficiently via information scrambling [1.0] 量子資源を定量化する方法は、マジックモノトンと呼ばれる関数のクラスを使用することである。
我々は、マジックモノトーンを近似する時間外相関器を効率的にサンプリングする方法を確立した。
我々は、局所ハミルトンの時間進化のためのマジックの単調な振る舞いを測定するためのプロトコルを前進し、シミュレートした。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:34:55 GMT)
Graph Extraction for Assisting Crash Simulation Data Analysis [1.0] 我々は,コンピュータ支援工学(CAE)からグラフへ情報を抽象化する手法を確立する。
我々は,車両設計の複雑なサブディシデントであるクラッシュネス解析における負荷経路に着目した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:47:01 GMT)
Community Detection Attack against Collaborative Learning-based
Recommender Systems [0.9] フェデレートラーニング(FL)やゴシップラーニング(GL)といった協調学習に基づく推薦システムが登場した。
最近の研究では、協調学習は様々なプライバシー攻撃に弱いことが示されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:02:07 GMT)
Geometric-Based Pruning Rules For Change Point Detection in Multiple
Independent Time Series [0.9] 複数の独立時系列における複数の変化を検出することの問題点を考察する。
PELTアルゴリズムに符号化された不等式に基づくプルーニングルールは、線形時間複雑性をもたらす。
本稿では, 単純な幾何学的形状を用いて, 複数の独立時系列に対する機能的プルーニングの拡張を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 23:56:39 GMT)
Explaining Legal Concepts with Augmented Large Language Models (GPT-4) [0.9] 我々は,法律における用語の事実的正確で明確で関連性の高い説明を生成する上で,GPT-4の性能を評価する。
GPT-4の直接適用により, 表面の非常に高品質な説明が得られることがわかった。
その結果,増悪によって品質が向上し,幻覚の問題は解消されることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 21:58:18 GMT)
Integrating planar circuits with superconducting 3D microwave cavities
using tunable low-loss couplers [0.9] インタフェースはループアンテナとジョセフソン接合に基づく結合素子をシームレスに統合する。
この界面を空洞に接続することで得られた損失は1/(4.5×106)$の逆品質係数に対応する1.28kHzである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:14:31 GMT)
A quantum-classical decomposition of Gaussian quantum environments: a
stochastic pseudomode model [0.8] 量子系に線形に結合したボソニック環境の効果は、ガウス・リンドブラッドマスター方程式によってシミュレートできることを示す。
有理スペクトル密度のサブセットの場合、すべてのパラメータは適合手順を必要とせずに明示的に指定される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 01:08:52 GMT)
Probabilistic relations for modelling epistemic and aleatoric
uncertainty: semantics and automated reasoning with theorem proving [0.7] 確率的プログラミングは、一般的なコンピュータプログラミング、統計的推論、形式的意味論を組み合わせたものである。
私たちの仕事は、Hehner氏の予測確率的プログラミングに基づいていますが、彼の仕事が広く採用されるにはいくつかの障害があります。
ロボットのローカライゼーションの問題,機械学習の分類,確率ループの終了など,6つの事例で研究成果を実演する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:32:35 GMT)
Exploiting Uncertainty for Querying Inconsistent Description Logics
Knowledge Bases [0.7] 我々は、この問題を解決するために、disPONTEと呼ばれる既存の確率論的意味論を利用する。
提案手法をTRILLとBUNDLEに実装し,提案手法の有効性を実証的に検証した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:50:46 GMT)
Multi-modal Hate Speech Detection using Machine Learning [0.7] 音声,テキスト,使用済み機械学習,自然言語処理から抽出した特徴画像,特徴値を抽出することにより,ビデオコンテンツからヘイトスピーチを検出するために,マルチモーダルシステムを組み合わせたアプローチが提案されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:46:52 GMT)
Mapping Researcher Activity based on Publication Data by means of
Transformers [0.6] 我々はこの概念を地域出版データベースの調査に用いている。
研究論文は、科学的トピックのランドスケープビューを形成するためにエンコードされ、クラスタ化されている。
同様のトピックに取り組んでいる著者は、論文間の類似性を計算することで特定することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:13:54 GMT)
Improving Image Tracing with Convolutional Autoencoders by High-Pass
Filter Preprocessing [0.6] 本研究では,画像の抽象表現を抽出するために,ハイパスフィルタリング,オートエンコーディング,ベクトル化などの処理手法を検討する。
結果によると、オートエンコーダで画像を再構築し、ハイパスフィルタリングし、ベクター化することで、ベクター化プロセスの有効性を高めながら、画像をより抽象的に表現することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:59:29 GMT)
Hands-on detection for steering wheels with neural networks [0.6] 機械学習に基づくハンズオン検出アルゴリズムの概念を提案する。
ハンドルのセンサーマットは、運転者の手が近づくとすぐに容量の変化を検出する。
ハンズオンやハンドオフの状況に関する評価と最終決定は、機械学習を用いて行われる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:07:17 GMT)
MobileASR: A resource-aware on-device personalisation framework for
automatic speech recognition in mobile phones [0.6] 本稿では,携帯電話上で効果的にモデルを訓練することにより,ユーザ声のパーソナライズされたASRモデルを開発するための包括的方法論について述べる。
そこで本研究では,携帯電話のRAMとバッテリ能力を考慮したリソース対応サブモデルベーストレーニング手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:44:45 GMT)
Artificial Intelligence for Emergency Response [0.6] 緊急対応管理(ERM)は、世界中のコミュニティが直面している課題である。
データ駆動モデルは、人的および財政的な損失を減らし、設計コード、交通規制、安全対策を改善するのに役立つ。
本チュートリアルでは,緊急応答における4つのサブプロブレム(インシデント予測,インシデント検出,リソース割り当て,リソースディスパッチ)について検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:16:08 GMT)
Inroads into Autonomous Network Defence using Explained Reinforcement
Learning [0.6] 本稿では,攻撃戦略の研究,防衛エージェントの設計,運用説明のためのエンド・ツー・エンド手法を提案する。
状態図、タスクの異なる部分でトレーニングされ、浅い階層で編成された深層強化学習エージェントを使用します。
評価の結果, 得られた設計は, 先行作業に比べ, 大幅な性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:53:14 GMT)
Exact Count of Boundary Pieces of ReLU Classifiers: Towards the Proper
Complexity Measure for Classification [0.5] 我々は決定境界の複雑さを直接測定することを提唱する。
まずReLUニューラルネットワークを解析し、その境界の複雑さをアフィンの個数によって便利に特徴付ける。
本研究では, 境界部分の正確な数と, 副生成物として, 総アフィン部分の正確な数とを明示的にカウントできる新しい手法を開発した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 01:21:12 GMT)
Web of Things and Trends in Agriculture: A Systematic Literature Review [0.5] 本研究の主な目的は,WOTを基盤とした農業に関する,成長途上かつ既存の研究内容,課題,今後の方向性の理解と提供である。
WOTベースの農業分野の分類も本研究で紹介されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:20:30 GMT)
Deformation Monitoring of Tunnel using Phase-based Motion Magnification
and Optical Flow [0.4] 本研究は,PMMとOFを組み合わせて,地下トンネルシーンの拡大変形モード画素変位の定量化を行う。
GPUアクセラレーションでは、各ピクセルの変位を計算し、シーン全体の動きを導出するアルゴリズムが採用されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:39:47 GMT)
KUCST at CheckThat 2023: How good can we be with a generic model? [0.3] 著者の帰属やプロファイリングにインスパイアされた,多種多様なタスクに対処するための汎用的なアプローチを採用している。
多くの機械学習モデルをトレーニングし、この結果から、Gradient Boostingが両方のタスクに最適であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:09:40 GMT)
On the preferred extensions of argumentation frameworks: bijections with
naive sets [0.3] 議論の枠組みが否定的かつ客観的な場合を考える。
境界内を持つフレームワークに対しては、トラクタブルであることを示します。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:03:25 GMT)
Exploring the Intersection between Neural Architecture Search and
Continual Learning [0.2] ニューラルネットワークの継続的な適応性と自動化は、いくつかの領域において最重要となる。
本研究では,ニューラル・アーキテクチャ・サーチ(NAS)と継続学習(CL)の交点を網羅的に検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:04:02 GMT)
High-Resolution Convolutional Neural Networks on Homomorphically
Encrypted Data via Sharding Ciphertexts [0.2] 我々は,1つの暗号文に格納できる範囲を超えて,大きな次元と多数のチャネルを持つ画像上でDCNNを評価する手法を拡張した。
トレーニングプロセス中に既存のDCNNモデルがどのように正規化され、効率と精度をさらに向上するかを示す。
これらの手法は、高解像度のImageNetデータセットに高い精度でDCNNをホモモルフィックに評価し、80.2%の精度を達成した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:16:16 GMT)
Behavioral Cloning via Search in Embedded Demonstration Dataset [0.2] 振る舞いクローンは、行動ポリシーを学ぶためにデモのデータセットを使用する。
遅延スペースを使用して、デモデータセットをインデックス化し、関連するエクスペリエンスに即座にアクセスし、これらの状況から振る舞いをコピーします。
提案手法は,マインクラフト環境において,有意義なデモンストレーションを効果的に再現し,エージェントの人間的行動を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:25:41 GMT)
A comprehensive review of 3D convolutional neural network-based
classification techniques of diseased and defective crops using non-UAV-based
hyperspectral images [0.1] ハイパースペクトルイメージング(HSI)は、物体の構造と組成に関する貴重な情報を提供する非破壊的で接触のない技術である。
スペクトル範囲が広いため、HSIは作物の健康と生産性をモニタリングするためのより効果的なツールとなる。
農業技術におけるこのイメージングツールの出現により、研究者は病気や欠陥のある作物の検出に関する問題をより正確に解決することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:02:53 GMT)
GPTutor: a ChatGPT-powered programming tool for code explanation [0.1] GPTutorはChatGPTを使ったプログラミングツールで、ChatGPT APIを使ってプログラミングコードの説明を提供するVisual Studio Codeエクステンションである。
Visual Studio Code Extension Marketplaceで公開されており、ソースコードはGitHubで公開されている。
予備評価は、GPTutorがバニラChatGPTやGitHub Copilotと比較して、最も簡潔で正確な説明を提供することを示している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:06:55 GMT)
Radars for Autonomous Driving: A Review of Deep Learning Methods and
Challenges [0.0] Radarは、自動運転車に使用される知覚センサーのスイートの重要なコンポーネントである。
低解像度、疎度、乱雑、高い不確実性、優れたデータセットの欠如などが特徴である。
現在のレーダーモデルは、レーダーデータに比較的弱い光学的特徴に焦点を当てたライダーや視覚モデルの影響を受けやすい。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:37:52 GMT)
Wegner's Ising gauge spins versus Kitaev's Majorana partons: Mapping and
application to anisotropic confinement in spin-orbital liquids [0.0] ウェグナーが最初に導入した$mathbbZ$格子ゲージ理論の一般的な構成は、リンク上のイジングゲージスピンを含む。
ウェグナーが最初に導入した$mathbbZ$格子ゲージ理論の一般的な構成は、リンク上のイジングゲージスピンを含む。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:00:01 GMT)
Voting Booklet Bias: Stance Detection in Swiss Federal Communication [0.0] 我々は最近のスタンス検出手法を用いて、有権者のための公式情報ブックレットにおける文のスタンス(例えば、反対か中立か)を研究する。
私たちの主な目標は、基本的な質問に答えることです。
本研究は,今後の投票帳簿の編集プロセスと,政治談話分析のためのより良い自動システムの設計に影響を及ぼすものである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:49:12 GMT)
Vibrational response functions for multidimensional electronic
spectroscopy: from Duschinsky rotations to multimode squeezed coherent states [0.0] 多次元分光法は核と電子力学の相互作用を明らかにする。
本稿では,振動状態の明示的導出に基づく応答関数の計算手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:41:09 GMT)
Update on the Verification and Validation Efforts for the Stakeholder
Tool for Assessing Radioactive Transportation [0.0] アメリカ合衆国エネルギー省(U.S. DOE)は、使用済み核燃料(SNF)と高レベル放射性廃棄物(HLW)の輸送、貯蔵、廃棄を民間の原子力発電所や他の米国のDOE施設から計画している。
STARTは、ルーティングオプションの評価や、SNFとHLWをバージ、トレイン、トラック、インターモーダルな表面輸送を通じて輸送するその他の側面のために開発された、Webベースの地理空間決定支援ツールである。
検証と検証(V&V)の取り組みは、STARTを独立して評価し、ツールの能力に対する信頼性を提供することを目的としている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:36:26 GMT)
Unsupervised Anomaly Detection via Nonlinear Manifold Learning [0.0] 異常は、残りのデータから著しく逸脱するサンプルであり、その検出は機械学習モデルを構築する上で大きな役割を果たす。
非線形多様体学習に基づく頑健で効率的かつ解釈可能な手法を導入し,教師なし設定における異常を検出する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:48:10 GMT)
Understanding and Mitigating Extrapolation Failures in Physics-Informed
Neural Networks [0.0] 物理インフォームドニューラルネットワーク(PINN)は、ディープニューラルネットワークを用いた偏微分方程式(PDE)の効果的な近似により、最近科学界で人気を集めている。
本稿では,PINNの外挿行動に関する詳細な調査を行い,これまで想定されていたいくつかの仮定に対する証拠を提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:08:42 GMT)
Ultimate-rate quantum repeaters for quantum communications [0.0] 量子リピータは、リピータレスバウンダリを克服するために必要である。
この論文では、この達成可能性のための物理リピータ設計を提案する。
また,実世界の実用化に向けて,短期的可能性を秘めた実用的なリピータ設計を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:19:18 GMT)
Towards Interpretability in Audio and Visual Affective Machine Learning:
A Review [0.0] 我々は、感情的機械学習の文脈における解釈可能性の使用について、構造化された文献レビューを行う。
以上の結果から,過去5年間の解釈可能性手法の出現が示唆された。
現在、使用法は、使用方法の範囲、評価の深さ、使用事例の検討に限られている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:16:01 GMT)
Toward collective chemistry by strong light-matter coupling [0.0] 理論は分子ハミルトニアンの擬粒子表現によって構築され、偏光性ハミルトニアンを粒子数制約の下で結合フェルミオン-ボソンモデルにマッピングする。
数値実験は、正確な結果と良好な一致を示す、駆動型Tavis-Cummingsモデルに対して示される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:34:28 GMT)
Thrilled by Your Progress! Large Language Models (GPT-4) No Longer
Struggle to Pass Assessments in Higher Education Programming Courses [0.0] GPTモデルは、典型的なプログラミングクラスの評価が完全に失敗することから、人間の関与なしにコースを確実に通過することへと進化した。
本研究は,学習者が合格点の収集に利用できる使い勝手の良い技術が存在する世界に備える必要があることを示すものである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:12:34 GMT)
The Timescales of Quantum Breaking [0.0] 古典的な記述は、有限量子ブレークタイム$t_q$の後に一般的に分解される。
動的にアクセス可能な量子モードを多数備えた新しいプロトタイプモデルを構築した。
展望として、我々の結果をブラックホールに転送し、時空を拡大する可能性が指摘されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:00:02 GMT)
Stabilizer Testing and Magic Entropy [0.0] 量子状態とゲートの安定化テストを行うための体系的プロトコルを導入する。
これらのプロトコルは量子回路によって実現された量子畳み込みとスワップテストに基づいている。
また、量子状態やゲートの魔法を定量化するために「魔法のエントロピー」を導入する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:18:52 GMT)
Single-Step Parity Check Gate Set for Quantum Error Correction [0.0] 有効量子誤り補正スキームの鍵となる要件は、物理量子ビットが一定の閾値未満の誤差率を持つことである。
我々は、QECコードは普遍論理ゲートを必要としないが、誤り検出と修正の唯一のタスクを実行するために単純化できるという知見を利用する。
本稿では, プロセス行列の物理的測定をQEC解析でよく用いられる抽象的誤りモデルにリンクして, これらのゲートの誤り挙動の構築と検証を行う厳密な形式について述べる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:24:56 GMT)
Signatures of superradiance as a witness to multipartite entanglement [0.0] 半導体ナノレーザーからの超放射能のサインは、自発放出時間の修正として現れ、エミッタの基底状態における絡みを検知する証人として解釈できるかどうかを議論する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:43:17 GMT)
Short-Term Density Forecasting of Low-Voltage Load using
Bernstein-Polynomial Normalizing Flows [0.0] 高いゆらぎと電化の増大は、従来の点推定に反映されない、大きな予測変動を引き起こす。
本稿では,正規化フローに基づく短期負荷のフレキシブルな条件密度予測手法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:23:30 GMT)
Shor's Factoring Algorithm and Modular Exponentiation Operators: A
Pedagogical Presentation with Examples [0.0] Shorの分解アルゴリズムは、非常に大きな数(数百から数千ビット)を時間で分解する量子アルゴリズムである。
因数分解問題に対する既知のすべての古典的アルゴリズムは、多数の因数分解に指数関数的な時間を要する。
これらのノートでは、ショアのアルゴリズムについて、量子コンピューティングの回路モデルに精通した基礎的知識以上の事前知識は仮定しない。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:29:20 GMT)
Shaping digital transformation for a sustainable society --
Contributions from Bits & B\"aume [0.0] 2022年の"Bits & B"カンファレンスのコンパニオンブックでは、65人以上の著者の洞察、研究、意見がまとめられている。
これらの論文は、デジタル化と持続可能性の間の交差の異なるサブ領域について論じている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:40:00 GMT)
Seq-HyGAN: Sequence Classification via Hypergraph Attention Network [0.0] シークエンス分類は、健康におけるゲノム分類やビジネスにおける異常検出など、さまざまな領域における幅広い実世界の応用を有する。
シーケンスデータに明示的な機能がないため、機械学習モデルでは難しい。
本稿では,新しいハイパーグラフ注意ネットワークモデル,Seq-HyGANを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 21:49:25 GMT)
Self-testing of semisymmetric informationally complete measurements in a
qubit prepare-and-measure scenario [0.0] 自己検査は量子システムを認証するための強力な方法である。
本研究では,特定の種類の非射影量子ビット測定の自己検査に焦点をあてる。
我々の結果は、潜在的に最小限の PM シナリオ内で、極小の qubit POVM を自己テストするための道を開いた。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:56:08 GMT)
Scrambling and operator entanglement in local non-Hermitian quantum
systems [0.0] 我々は、パラダイム的局所量子スピンチェーンモデルの非エルミート変種における情報スクランブルと量子カオスについて研究する。
我々は、閉かつオープンな量子システムに関する以前の研究から、監視量子力学の新しい領域まで、演算子絡み合いに基づく診断を拡張した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 03:20:09 GMT)
Schr\"{o}dinger operators with multiple Aharonov-Bohm fluxes [0.0] N geqslant 1 $ Aharonov-Bohm 磁束の存在下で動く2次元量子粒子を記述する。
我々はそのような作用素の自己随伴実現を全て分類し、それらの領域と行動を明確に特徴づける。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:25:58 GMT)
Recurrent generation of maximally entangled single particle states via
quantum walks on cyclic graphs [0.0] 最大絡み合った単一粒子状態(MESPS)は量子技術の新たな可能性を開く。
1つのコインが4ドルおよび8ドルのサイト巡回グラフ上の離散時間量子ウォークによって(周期的に)繰り返し時間ステップでMESPSを生成可能であることを示す。
また、任意の$k$のサイト循環グラフ、$kin3,4,5,8$の有効シングルコイン(Identity and arbitrary coin)または2つのコイン進化シーケンスで繰り返しMESPSを生成可能であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:40:15 GMT)
Reconstruction-based Out-of-Distribution Detection for Short-Range FMCW
Radar [0.0] 本稿では,レーダ領域で動作する新しい再構成型OOD検出器を提案する。
提案手法はオートエンコーダ(AE)とその潜在表現を利用してOODサンプルを検出する。
我々は60GHz短距離FMCWレーダを用いて収集したデータセットに対して90.72%のAUROCを達成した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:26:42 GMT)
Quasiprobability distribution of work in the quantum Ising model [0.0] 逆場におけるIsingモデルの作業準確率を研究することによって、プロセスの真に量子的な特徴を明らかにすることを試みる。
大域的クエンチでは、作業のガウス確率分布を持つ対称非コンテキスト表現が存在するが、局所的クエンチでは、作業の負の4番目のモーメントによって信号される量子的文脈性が得られる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:56:59 GMT)
Quantum Scar States in Coupled Random Graph Models [0.0] 我々は、基底状態のグレイ符号数を用いてハミルトン行列を構成することにより、$L$サイトPXP-モデルのヒルベルト空間接続を解析する。
エネルギー固有状態の絡み合い構造を研究し、弱絡み状態の2つのクラスを見つける。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:30:47 GMT)
Quantum Ergotropy and Quantum Feedback Control [0.0] 一般量子演算による有限次元量子系へのエネルギー抽出と充電について検討する。
ユニタリ量子演算によるエネルギー変化は、ユニタリ量子演算に対するエルゴトロピー/チャージバウンドによって制限されることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:57:20 GMT)
Prevention of cyberattacks in WSN and packet drop by CI framework and
information processing protocol using AI and Big Data [0.0] 本研究では、認知知能(CI)フレームワーク、情報処理プロトコル、高度な人工知能(AI)およびビッグデータ分析アプローチを統合する。
このフレームワークは、DoS(DoS)攻撃、ノードの妥協、データ改ざんなど、さまざまなタイプの攻撃を検出し、防止することができる。
パケットドロップの発生に対して非常に耐性があり、WSN全体の信頼性と性能を向上させる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:00:39 GMT)
Potential and Feshbach $s$-wave resonances in coupled atomic collision
channels [0.0] 2つの結合チャネルによる原子二元衝突における$s$波散乱について論じる。
解析は正方形ウェルポテンシャルのスタイリングモデルを用いて行われる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:18:06 GMT)
PRISMA-DFLLM: An Extension of PRISMA for Systematic Literature Reviews
using Domain-specific Finetuned Large Language Models [0.0] 本稿では,Large Language Models(LLMs)のパワーと,PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)の厳密な報告ガイドラインを組み合わせたAI対応方法論フレームワークを提案する。
厳密なSLRプロセスの結果として選択されたドメイン固有の学術論文にLCMを微調整することにより、提案するPRISMA-DFLLMレポートガイドラインは、より効率、再利用性、拡張性を達成する可能性を秘めている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 02:52:50 GMT)
Opportunities for Large Language Models and Discourse in Engineering
Design [0.0] 談話はエンジニアリング設計プロセスの中核と見なされるべきであり、したがってデジタルアーティファクトで表現されるべきである、と我々は主張する。
シミュレーション,実験,トポロジ最適化,その他のプロセスステップを,機械操作可能な,談話中心の設計プロセスに統合する方法について述べる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:46:44 GMT)
One-Shot Learning of Visual Path Navigation for Autonomous Vehicles [0.0] 本稿では,イメージ・ツー・ステアリング・パスのナビゲーションを行う新しいディープニューラルネットワークを提案する。
システムにワンショットの学習を追加することで、データの問題に対処する。
提案したナビゲーションの性能を検証するために、車内テストとオフラインテストが使用される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:27:46 GMT)
On the Omnipresence of Spurious Local Minima in Certain Neural Network
Training Problems [0.0] 本研究では,1次元実出力を持つ深層ニューラルネットワークにおける学習課題の損失状況について検討する。
このような問題は、アフィンでないすべての対象函数に対して、刺激的(すなわち、大域的最適ではない)局所ミニマの連続体を持つことが示されている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:32:47 GMT)
On Consistency and Asymptotic Normality of Least Absolute Deviation
Estimators for 2-dimensional Sinusoidal Model [0.0] パラメータ推定のためのロバスト最小絶対偏差推定器を提案する。
2次元正弦波モデルの信号パラメータのLAD推定器の強い一貫性と正規性を確立する。
2次元テクスチャデータのデータ解析は,提案手法の実用性を示している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:46:53 GMT)
Numerical approach to the black-to-white hole transition [0.0] 深部量子状態における遷移の交差時間を計算するために,アルゴリズムを適用した。
本稿では,現在文献に存在しているものに対する代替手法を用いて,横断時間の分析方法を示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:30:47 GMT)
Numerical Simulation of Large-Scale Nonlinear Open Quantum Mechanics [0.0] 本研究では, 素粒子の非線形開量子力学をシミュレーションする数値計算法を提案する。
提案手法の有効性を実証するため, 1次元弱クォートポテンシャルで進行する粒子の開量子力学を, 最初は強高調波ポテンシャルで冷却された後に検討した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:26:35 GMT)
Meta-Polyp: a baseline for efficient Polyp segmentation [0.0] 本稿では,UNetとMeta-Formerの融合と,デコーダの段階におけるレベルアップを組み合わせたマルチスケールアップサンプリングブロックの導入について述べる。
提案手法は競合性能を達成し,CVC-300データセット,Kvasir,CVC-ColonDBデータセットにおけるState of the Artの上位結果を得た。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:10:45 GMT)
Manifesto for the Responsible Development of Mathematical Works -- A
Tool for Practitioners and for Management [0.0] このマニフェストは実践的なツールとして書かれており、数学的な作業を実行、管理、あるいは影響を与えるすべての人を助ける。
数学的に力のある製品やサービスを安全かつ責任ある方法で実行し、開発する方法に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:44:40 GMT)
Leveraging Human Salience to Improve Calorie Estimation [0.0] 食品画像からのカロリー予測のタスクに人体サリエンスを組み込むことの有効性について検討した。
食品の食感を最も強調する画像に塩分マップを取り入れた場合,32.2%の相対的な改善が観察された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:13:26 GMT)
Leveraging Evolutionary Changes for Software Process Quality [0.0] 現実世界のソフトウェアアプリケーションは、常に進化し続けなければならない。
ソフトウェア品質管理の従来の手法には、ソフトウェアの品質モデルと継続的コード検査ツールが含まれる。
しかし、開発プロセスの品質と結果のソフトウェア製品との間には、強い相関関係と因果関係がある。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:24:20 GMT)
Learning Transductions and Alignments with RNN Seq2seq Models [0.0] 本研究では,4つのトランスダクションタスクの学習において,Recurrent-Neural-Network sequence to sequence (RNN seq2seq)モデルの有効性について検討する。
RNN seq2seqモデルは、基礎となる関数を学習するのではなく、トレーニングデータや配信データに適合するマッピングを近似することができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:18:54 GMT)
Leaping through tree space: continuous phylogenetic inference for rooted
and unrooted trees [0.0] 勾配の最適化が可能な連続空間において、木探索と推論の両方を行う。
この連続的な緩和は、根付き木と根なし木の両方において木空間を横断する大きな跳躍を可能にし、局所ミニマへの収束の感受性が低い。
提案手法は, 未開根木に対する推定法や, シミュレーションにおいて, 超測定の場合, 木と根を正確に推定する手法よりも優れている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:54:10 GMT)
Language Aligned Visual Representations Predict Human Behavior in
Naturalistic Learning Tasks [0.0] 人間は自然物の関連する特徴を識別し、一般化する能力を持っている。
カテゴリー学習と報奨学習の2つの実験を行った。
参加者は数回の臨床試験で関連する刺激の特徴を特定できた。
本研究では,多様な深層学習モデルの試行錯誤精度を評価するため,広範囲なモデル比較を行った。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:18:29 GMT)
LMs stand their Ground: Investigating the Effect of Embodiment in
Figurative Language Interpretation by Language Models [0.0] 表現言語は、その解釈が従来の順序や意味から逸脱しているため、言語モデルの課題である。
しかし、人間がメタファーを理解し解釈するのは、メタファーを具現化したメタファーから導き出すことができるためである。
本研究は、比喩文の動作がより具体化されている場合に、より大きな言語モデルが比喩文の解釈にいかに優れているかを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:33:37 GMT)
Krylov construction and complexity for driven quantum systems [0.0] 時間依存型(駆動型)量子システムにおけるK-複素性の研究を行う。
周期的時間依存(フロケ)システムでは、クリロフ構成を行う方法を開発する。
系の結合定数の関数としてのクリロフ部分空間次元の成長について検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:24:12 GMT)
Interferometric phase estimation and quantum resources dynamics in Bell
coherent-states superpositions generated via a unitary beam splitter [0.0] 本稿では,ビームスプリッタの作用によりベルコヒーレント状態重畳を生成する手法を提案する。
異なる量化器は出力状態の量子度を測定するために用いられる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 22:33:43 GMT)
Interferometric imaging using shared quantum entanglement [0.0] 本稿では,2つの交叉場モードを利用したテーブルトップエンタングルメントに基づく干渉画像技術について報告する。
模擬熱源の空間分布は、各開口部で収集された光を干渉することによって決定される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:06:12 GMT)
How are the people in the photos judged? Analysis of brain activity when
assessing levels of trust and attractiveness [0.0] この記事では、異なる人々の顔が提示された実験について述べる。
参加者の任務は、ある人物がどれだけ信頼でき、どれだけ魅力的かを評価することである。
顔の信頼度と魅力の評価に関与する脳の最も活発な領域が示唆された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:49:54 GMT)
HiveNAS: Neural Architecture Search using Artificial Bee Colony
Optimization [0.0] 本研究では,ニューラルネットワーク探索のための人工蜂コロニー最適化の実現可能性を評価する。
提案するフレームワークであるHiveNASは、最先端のSwarm IntelligenceベースのNASフレームワークを短時間で上回ります。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:02:09 GMT)
Hierarchical confusion matrix for classification performance evaluation [0.0] 階層的混乱行列の概念を開発し、階層的分類問題にその適用性を証明する。
我々は,3つの実世界の階層的分類のベンチマークにおけるモデルを評価するために,新しい混乱行列に基づく測度を用いる。
その結果、このアプローチの理性とその階層的分類問題を評価するための有用性について概説した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:31:59 GMT)
HRFuser: A Multi-resolution Sensor Fusion Architecture for 2D Object
Detection [0.0] マルチモーダル2Dオブジェクト検出のためのモジュールアーキテクチャであるHRFuserを提案する。
マルチレゾリューション方式で複数のセンサーを融合させ、任意の数の入力モードにスケールする。
我々は、nuScenesとDENSEデータセットに関する実験を通じて、我々のモデルが追加のモーダルから補完的な特徴を効果的に活用できることを実証する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:38:57 GMT)
Grating design methodology for tailored free-space beam-forming [0.0] グラティングカプラの一般プロファイルを用いた自由空間ビーム形成のための設計手法を提案する。
異なる波長と導波路材料を用いて様々な格子を用いてその機能を示す。
導波路テーパ幾何、放射角、焦点高さに制限を伴わない回折制限焦点の設計と高次ヘルミート・ガウス線とラゲール・ガウス線の設計。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:55:24 GMT)
Fully Solvable Finite Simplex Lattices in Arbitrary Dimensions [0.0] 二次ボゾン系の高階場移動空間(FMS)から$n$-simplex 格子モデルを構築することができることを示す。
ボソニックシステムのFMSは,様々な実空間$n$-simplex格子をシミュレートする汎用的なプラットフォームを提供することを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 05:55:43 GMT)
From Database Repairs to Causality in Databases and Beyond [0.0] 本稿では,データベースにおける問合せ応答に対するスコアベース説明に対する最近のアプローチについて述べる。
スコアの仕様と計算に反実的推論を使うことに特に重点を置いている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:08:23 GMT)
FANET Experiment: Real-Time Surveillance Applications Connected to Image
Processing System [0.0] 本論文の主な目的は、FANETアプリケーションにおけるデータの強化と抽出に画像強調技術を使用することである。
提案する概念システム設計は,石油パイプラインの監視,スポーツおよびメディアの報道におけるFANET活動の可能性を向上させることができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:14:44 GMT)
ExoMDN: Rapid characterization of exoplanet interior structures with
Mixture Density Networks [0.0] 太陽系外惑星の内在性評価のための機械学習モデルであるExoMDNを提案する。
ExoMDNは、標準のIntel i5 CPU上で、各惑星層の質量分率と厚さの完全な後部分布を1秒以下で実現できることを示す。
我々はエクソMDNを用いて、質量と半径の不確かさがそれぞれ10%と5%以下である22個の確認された太陽系外惑星の内部を特徴付ける。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:00:03 GMT)
Exact and approximate bound state solutions of the Schr\"odinger
equation with a class of Kratzer-type potentials in the global monopole
spacetime [0.0] 粒子の運動を2つの相互作用で記述するためにシュリンガー方程式を導入する。
問題の固有関数と固有値は、ラジアル方程式を導出して解くことによって得られる。
スクリーニングされた修正クラッツァーポテンシャルとスクリーニングされた自己相互作用電位は、有効電位とエネルギースペクトルの両方に影響を与える重要な役割を担っている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:21:30 GMT)
Ergotropic interpretation of entanglement entropy [0.0] エンタングルメントエントロピー(Entanglement Entropy)は、量子物理学において最も顕著な測度の一つである。
単体抽出作業の観点からは、興味深いエルゴトロピックな解釈があることが示される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:29:45 GMT)
Enhanced Sampling with Machine Learning: A Review [0.0] 分子動力学(MD)は、優れた解像度を持つ物理サンプリングシステムの研究を可能にするが、厳しい時間スケールの制限に悩まされる。
これを解決するため,探索時間空間を改善するため,改良されたサンプリング手法が開発されている。
近年,機械学習(ML)技術がさまざまな分野に統合されることが約束されている。
本稿では,MLの融合とMDの強化について検討する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 13:13:56 GMT)
Energy Trees: Regression and Classification With Structured and
Mixed-Type Covariates [0.0] エネルギー木はエネルギー統計を利用して条件推論木の能力を拡張する。
モデルの競争性能を,多変量選択と過度適合に対する頑健性の観点から示す。
また、人間の生物学的データを含む2つの経験的分析を通して、モデルの予測能力を評価する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:41:43 GMT)
Early heart disease prediction using hybrid quantum classification [0.0] 心臓病の早期予測は、心臓死亡率と死亡率の低下に不可欠である。
本稿では,心臓疾患の早期発見のための2つの量子機械学習手法を提案する。
これらの手法はクリーブランドとスタットログのデータセットに適用される。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 07:57:36 GMT)
Discrete Quantum Gaussians and Central Limit Theorem [0.0] 我々は離散可変(DV)量子系における状態を研究する。
安定化状態は、連続変数系においてガウス状態が果たす役割と同様、DV量子系において役割を果たす。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:50:01 GMT)
Dis-AE: Multi-domain & Multi-task Generalisation on Real-World Clinical
Data [0.0] 本稿では,新しい非交叉型オートエンコーダ(Dis-AE)ニューラルネットワークアーキテクチャを提案する。
Dis-AEは、医療測定のマルチラベル分類のためのドメイン不変データ表現を学習する。
人工的データセットと血液提供者からの全血液量(FBC)データに基づいて,モデルの領域一般化能力を評価する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:56:37 GMT)
DiAReL: Reinforcement Learning with Disturbance Awareness for Robust
Sim2Real Policy Transfer in Robot Control [0.0] 遅延マルコフ決定プロセスは、最近コミットされたアクションの有限時間ウィンドウでエージェントの状態空間を拡大することでマルコフ特性を満たす。
本稿では,遅延した環境下での乱れ増進型マルコフ決定プロセスを導入し,政治強化学習アルゴリズムのトレーニングにおける乱れ推定を取り入れた新しい表現法を提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:11:38 GMT)
Deep learning techniques for blind image super-resolution: A high-scale
multi-domain perspective evaluation [0.0] 視覚画像SRに適した最近の5つのDL技術を評価するため, 高速(8倍)制御実験を行った。
航空、動物相、植物相、医学、衛星の5つの異なる領域の14の小さなデータセットを考察する。
MoESRは、生成したHR画像の知覚的品質がまだ改善する必要があるにもかかわらず、最良の解と見なすことができる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:18:02 GMT)
Deep learning based Meta-modeling for Multi-objective Technology
Optimization of Electrical Machines [0.0] 本稿では,2つの異なるマシン技術を同時に最適化するための変分自動エンコーダの応用について述べる。
トレーニング後、私たちは、グローバルなキーパフォーマンス指標を予測するために、ディープニューラルネットワークとデコーダをメタモデルとして使用します。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:33:39 GMT)
DEYOv2: Rank Feature with Greedy Matching for End-to-End Object
Detection [0.0] 本稿では,第1世代のDEYOモデルの改良版であるDEYOv2を提案する。
モデルトレーニングを加速し、パフォーマンスを高めるために、プログレッシブな推論アプローチを採用している。
私たちの知る限りでは、DEYOv2は古典的な検出器とクエリベースの検出器のそれぞれの強度を組み合わせた、最初の完全なエンドツーエンドのオブジェクト検出器である。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:42:26 GMT)
Convert Monolithic Application to Microservice Application [0.0] 多くの企業は、スケールアップとアジャイル開発としてビジネス要件を達成するために、既存のモノリシックアプリケーションをマイクロサービスに変換する。
本稿では,既存のモノリシックアプリケーションをスクラッチからマイクロサービスアプリケーション全体を書き換えることなく,マイクロサービスアプリケーションに変換する方法について,ソフトウェア開発者を指導する。
また、NetflixとAirbnbがモノリシックアプリケーションをマイクロサービスアプリケーションにどのように変換したかを要約します。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 04:27:49 GMT)
Context-Aware Change Detection With Semi-Supervised Learning [0.0] 地球観測データを用いた変化検出は、被災地における災害の影響を定量化する上で重要な役割を担っている。
Sentinel-2のようなデータソースは、豊富な光学情報を提供するが、しばしば雲のカバーによって妨げられる。
本研究では,変更検出タスクにおけるSentinel-2データのコントリビューションを評価するモデルを開発した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:17:49 GMT)
Conditional Human Sketch Synthesis with Explicit Abstraction Control [0.0] 本稿では,クラス条件とフォト・ツー・スケッチ合成における抽象的制御に対処する,新しい自由手スケッチ合成手法を提案する。
本稿では,2つの新しい抽象化制御機構,状態埋め込みとストロークトークンをトランスフォーマベース潜在拡散モデルに統合する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:54:58 GMT)
Color Mismatches in Stereoscopic Video: Real-World Dataset and Deep
Correction Method [0.0] データセットは、このタスクのどの部分よりも大きい。
我々は,人工および実世界のデータセットに対して,8種類のカラーミスマッチ補正手法を比較した。
立体画像におけるカラーミスマッチ補正のための最新の局所ニューラルネットワーク法の改良を行った。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:42:26 GMT)
Cognitive Ledger Project: Towards Building Personal Digital Twins
Through Cognitive Blockchain [0.0] Cognitive Ledger Projectは、ユーザの個人情報を構造化情報や機械学習モデルに変換するモジュールシステムを開発するためのプロジェクトである。
このアーキテクチャには、デジタル環境におけるユーザのアクティビティを再利用可能な知識オブジェクトに変換するモジュールがいくつか含まれている。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 06:13:33 GMT)
Characterizing quantum chaoticity of kicked spin chains [0.0] 量子多体系は、そのスペクトル統計がランダム行列理論のものと一致する場合、一般に量子カオスと見なされる。
レベル間隔分布と固有ベクトル統計の両方がランダムな行列予測とよく一致しているとしても、絡み合いエントロピーは期待するページ曲線から逸脱する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 10:51:11 GMT)
Causal classification of spatiotemporal quantum correlations [0.0] 特定の量子相関は時間固有の矢印を持ち、時空をまたいだ一般的な量子相関の分類を可能にする。
以上の結果から,特定の量子相関は時間的固有矢印を持ち,様々な因果構造との整合性に基づいて,時空間における一般量子相関の分類が可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:59:18 GMT)
Can ChatGPT pass the Vietnamese National High School Graduation
Examination? [0.0] 研究データセットには、文学テストケースで30のエッセイと、他の被験者向けにデザインされた1,700の多重選択質問が含まれていた。
ChatGPTは平均スコア6-7で試験に合格し、この技術が教育現場に革命をもたらす可能性を実証した。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 14:47:03 GMT)
Bootstrap aggregation and confidence measures to improve time series
causal discovery [0.0] 本稿では,時系列因果発見と組み合わせた新しいブートストラップアグリゲーション(バッグ)と信頼度測定手法を提案する。
本手法では,因果探索法により計算された時系列グラフのリンクに対する信頼度を測定することができる。
本研究では,現状の条件付き独立性に基づくアルゴリズムPCMCI+を併用する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 08:37:16 GMT)
Benchmarking simulated and physical quantum processing units using
quantum and hybrid algorithms [0.0] QMwareシミュレータは、量子回路の実行ランタイムを最大78%削減することができる。
リゲッティのAspen-M2のような物理量子デバイスは、30量子ビット以上の回路に対して指数的ランタイムの利点を提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:36:40 GMT)
ArtFusion: Arbitrary Style Transfer using Dual Conditional Latent
Diffusion Models [0.0] Arbitrary Style Transfer (AST)は、任意のアートワークからスタイルを採用することで、イメージを変換することを目的としている。
我々は、コンテンツとスタイルの柔軟なバランスを提供する新しいアプローチ、ArtFusionを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 17:58:36 GMT)
Analogue and Physical Reservoir Computing Using Water Waves [0.0] 35億人以上の人々が田園部に住んでおり、水と水資源が持続的で生産的な田園経済の維持に重要な役割を担っている。
本稿では, 波動の物理特性とエネルギーによって駆動されるアナログ・貯水池計算の分野における最近の進歩をレビューし, 批判的に分析する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:47:22 GMT)
An Algorithm For Adversary Aware Decentralized Networked MARL [0.0] 既存のMARLアルゴリズムのコンセンサス更新に脆弱性を導入する。
我々は,非敵エージェントが敵の存在下で合意に達することを可能にするアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:35:56 GMT)
Algorithmic Cluster Expansions for Quantum Problems [0.0] 計算問題のクラスに対して近似アルゴリズムを開発するための一般的な枠組みを確立する。
我々は,その同一性に近い量子回路の確率振幅を近似するために,我々の枠組みを適用した。
我々のアルゴリズム条件は期待値に対してほぼ最適であり、ゼロ自由度という意味での熱予測値に対して最適であることを示す。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 09:11:48 GMT)
Accurate and efficient Bloch-oscillation-enhanced atom interferometry [0.0] 本稿では,Bloch-oscillation-enhanced atom interferometryの包括的な理論的枠組みを提案する。
我々は、シュリンガー方程式の正確な数値解との比較により、その精度を検証する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 18:00:00 GMT)
A superconducting-nanowire single-photon camera with 400,000 pixels [0.0] 我々は40万画素のSNSPDカメラの実装とその特性について報告する。
これは、以前の最先端カメラよりも400倍も改善されている。
アーキテクチャは現在のデモ以上の拡張性があります。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 19:55:43 GMT)
A Universal Quantum Algorithm for Weighted Maximum Cut and Ising
Problems [0.0] 本稿では,二項問題の近似解を計算するためのハイブリッド量子古典アルゴリズムを提案する。
我々は、重み付き最大カットまたはイジング・ハミルトン演算子をブロック符号化するユニタリおよびエルミート演算子を実装するために浅深さ量子回路を用いる。
この作用素の変動量子状態への期待を測定すると、量子系の変動エネルギーが得られる。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:20:46 GMT)
A Survey of Some Density Based Clustering Techniques [0.0] 密度ベースのクラスタリングは、データセットから未知のパターンを抽出するためにデータマイニングで使用されるクラスタリングの一種である。
DBSCAN、OPTICS、DENCLUE、VDBSCAN、DVBSCAN、DBCLASD、ST-DBSCANなどの密度ベースのクラスタリング手法がある。
これらの手法の研究は、それらの特性、利点、欠点とともに行われ、最も重要なのは、有用かつ適切なパターンをマイニングするために異なるタイプのデータセットに適用可能であることである。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 16:32:08 GMT)
A Short Introduction to Quantum Computing for Physicists [0.0] 主な対象はプロの物理学者と物理学の上級学生であるが、技術者や計算機科学者もその恩恵を受けるかもしれない。
これらのノートは、既に量子力学の基礎知識を持っている人のために、量子計算と通信に関する標準的なトピックを紹介している。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 15:33:42 GMT)
A Hybrid Feature Selection and Construction Method for Detection of Wind
Turbine Generator Heating Faults [0.0] 本稿では,風力タービン発電機の暖房故障検出のための特徴選択と施工手法を提案する。
データ収集システムから直接収集された特徴は、風の特性、運用データ、温度測定、ステータス情報から成っている。
障害のより強力な兆候となる情報を得るために、機能構築のステップで新しい機能が作成されました。
その結果,提案手法は,特に誤報の件数を減少させる点において,より信頼性の高い故障検出システムに寄与することが示唆された。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 20:37:30 GMT)
A Bayesian approach to uncertainty in word embedding bias estimation [0.0] WEAT や MAC のような複数の測度は、単語の埋め込みに存在するバイアスの大きさを1つの数字のメートル法で定量化しようとする。
このような手法を用いて、意図したバイアスを欠いたnullモデルによってデータが生成される場合でも、同様の結果が容易に得られることを示す。
単語埋め込みにおけるバイアスのより不確実性に敏感な検査を可能にする階層型ベイズモデルを提案する。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 11:48:50 GMT)
A "thoughtful" Local Friendliness no-go theorem: a prospective
experiment with new assumptions to suit [0.0] 我々は、システムが*考え*を持つことはオブザーバとなるのに十分な条件であるという考えを真剣に考える新しいLFのノーゴー定理を提案する。
これら4つのメタ物理的な仮定に加えて、この新しいno-go定理は、*技術的に*実現可能なものに関する2つの仮定を必要とする。
論文参考訳(メタデータ) (Thu, 15 Jun 2023 12:19:15 GMT)