TextDiffuser-2: Unleashing the Power of Language Models for Text
Rendering [118.3] TextDiffuser-2は、テキストレンダリングのための言語モデルのパワーを解き放つことを目的としている。
拡散モデル内の言語モデルを用いて,行レベルでの位置とテキストを符号化する。
我々は広範な実験を行い、GPT-4Vと同様に、ヒトの参加者を含むユーザスタディを取り入れた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:02:40 GMT)
HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting [118.3] 既存の方法は、スコア蒸留サンプリング(SDS)を通じてメッシュやニューラルフィールドのような3D表現を最適化する。
本稿では,高精細な形状とリアルな外観を持つ高品質な3D人間を創出する,効率的かつ効果的な枠組みであるHumanGaussianを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:58 GMT)
No Representation Rules Them All in Category Discovery [115.5] 一般化カテゴリー発見(GCD)の課題に取り組む
ラベル付きおよびアンラベル画像のデータセットが与えられた場合、そのタスクはすべての画像をアンラベル画像のサブセットにまとめることである。
カテゴリー発見のための合成データセット「Clevr-4」を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:46 GMT)
Evolving Knowledge Mining for Class Incremental Segmentation [113.6] クラスインクリメンタルセマンティック(CISS)は、最近、現実世界のアプリケーションにおいて大きな重要性があるため、トレンドとなっている。
冷凍バックボーンを用いた新規なkNowleDgeマイニング法を提案する。
提案手法を2つの広く使用されているベンチマークで評価し,新しい最先端性能を一貫して示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:34:14 GMT)
Panoptic Video Scene Graph Generation [110.8] パン光学シーングラフ生成(PVSG)と呼ばれる新しい問題を提案し,研究する。
PVSGは、ビデオ内のバウンディングボックスで接地された人間とオブジェクト間の時間的相互作用に焦点を当てた、既存のビデオシーングラフ生成問題に関連している。
PVSGデータセットは400本(3人称289本+111本自撮り111本)からなり、合計150Kフレームに汎視的セグメンテーションマスクと微妙な時間的シーングラフをラベル付けした。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:57 GMT)
LoftQ: LoRA-Fine-Tuning-Aware Quantization for Large Language Models [104.2] 我々は、事前訓練されたモデルに量子化とLoRA微調整を併用するシナリオに焦点を当てる。
本稿では,新しい量子化フレームワークであるLoftQ(LoRA-Fine-Tuning-Aware Quantization)を提案する。
実験の結果,本手法は有効であり,既存の量子化法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:06:59 GMT)
DiffuseBot: Breeding Soft Robots With Physics-Augmented Generative
Diffusion Models [102.1] 本稿では,様々なタスクにおいて優れたソフトロボット形態を生成する物理拡張拡散モデルであるDiffuseBotを提案する。
我々は、その能力とともに、シミュレーションされた、そして製造された様々なロボットを紹介します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:58:48 GMT)
Phenomenal Yet Puzzling: Testing Inductive Reasoning Capabilities of
Language Models with Hypothesis Refinement [95.1] 言語モデル(LM)は、しばしば帰納的推論に不足する。
我々は,反復的仮説修正を通じて,LMの帰納的推論能力を体系的に研究する。
本研究は, LMの誘導的推論過程と人間とのいくつかの相違点を明らかにし, 誘導的推論タスクにおけるLMの使用の可能性と限界に光を当てる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:24:30 GMT)
Scalable Extraction of Training Data from (Production) Language Models [93.8] 本稿では,学習データセットの事前知識を必要とせず,機械学習モデルに問い合わせることで,相手が効率的に抽出できる学習データについて検討する。
敵は、PythiaやGPT-Neoのようなオープンソースの言語モデル、LLaMAやFalconのようなセミオープンモデル、ChatGPTのようなクローズドモデルから、ギガバイトのトレーニングデータを抽出できることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:47:03 GMT)
Breaking Language Barriers in Multilingual Mathematical Reasoning:
Insights and Observations [90.7] 本稿では, マルチリンガル数学推論 (xMR) LLM の探索と学習の先駆者である。
翻訳を利用して,最初の多言語数学推論命令データセットMGSM8KInstructを構築した。
我々は、MathOctopusという名の強力なxMR LLMを構築するための異なるトレーニング戦略を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:25:14 GMT)
Event-Free Moving Object Segmentation from Moving Ego Vehicle [90.7] 動的シーンにおけるオブジェクトセグメンテーション(MOS)の移動は、自律運転において困難である。
ほとんどの最先端の手法は、光学フローマップから得られるモーションキューを利用する。
我々は,光学的フローに頼らずにリッチなモーションキューを提供する,より優れた映像理解のためのイベントカメラを活用することを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:12:39 GMT)
Can Generalist Foundation Models Outcompete Special-Purpose Tuning? Case
Study in Medicine [89.5] 本研究は, GPT-4の医学的課題評価における能力について, 専門訓練の欠如による先行研究に基づくものである。
イノベーションを促進することで、より深い専門能力が解放され、GPT-4が医学ベンチマークの先行結果に容易に勝っていることが分かる。
Medpromptを使用すると、GPT-4はMultiMedQAスイートのベンチマークデータセットの9つすべてに対して最先端の結果を得る。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:16:12 GMT)
Empowering Autonomous Driving with Large Language Models: A Safety
Perspective [86.5] 本稿では,大規模言語モデル(LLM)の自律運転システムへの統合を提唱する。
アプローチの有効性を実証する2つのケーススタディの結果を報告する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:13:09 GMT)
Parameter Efficient Fine-tuning via Cross Block Orchestration for
Segment Anything Model [86.4] PEFTにクロスブロックオーケストレーション機構を組み、SAM(Segment Anything Model)の様々な下流シナリオへの適応を可能にする。
本稿では,超複素層から重みが生じる線形射影ヘッドを導入するブロック内拡張モジュールを提案する。
提案手法は,約1Kのパラメータのみを付加した新規シナリオにおいて,セグメンテーション性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:23:34 GMT)
Segment Anything in 3D with NeRFs [85.5] 本稿では,Segment Anything Model (SAM) を一般化して3次元オブジェクトをセグメント化する。
我々は、マルチビュー2D画像を3D空間に接続する安価なオフザシェルフとして、Neural Radiance Field(NeRF)を使用している。
実験では,SA3Dが様々な場面に適応し,数分で3Dセグメンテーションを実現することを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:58:15 GMT)
Telling Left from Right: Identifying Geometry-Aware Semantic
Correspondence [84.7] 本稿では,意味的対応のための幾何学的認識の重要性を明らかにする。
この情報を活用することで,意味的対応性能が著しく向上することを示す。
我々は既存の動物ポーズ推定データセットから構築された意味対応のための新しいベンチマークを構築した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:45:13 GMT)
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models [84.7] SparseCtrlは時間的にスパース信号で柔軟な構造制御を可能にする。
トレーニング済みのT2Vモデルに触ることなく、これらのスパース信号を処理するための追加条件が組み込まれている。
提案手法はスケッチ,深度マップ,RGB画像など,さまざまなモダリティと互換性がある。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:33:08 GMT)
Surf-D: High-Quality Surface Generation for Arbitrary Topologies using
Diffusion Models [84.7] Surf-Dは任意の位相を持つ表面として高品質な3次元形状を生成する新しい方法である。
UDFは任意のトポロジを扱うのに優れており、複雑な形状を生成することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:56:01 GMT)
A Tale of Two Features: Stable Diffusion Complements DINO for Zero-Shot
Semantic Correspondence [83.9] 我々は,意味的および密接な対応のために安定拡散機能を利用する。
単純な後処理により、SD機能はSOTA表現と定量的に類似させることができる。
これらの対応は,2つの画像のインスタンススワップなど,興味深い応用を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:47:46 GMT)
ShareGPT4V: Improving Large Multi-Modal Models with Better Captions [82.0] 120万の記述キャプションを含むデータセットであるShareGPT4Vを紹介する。
このデータセットは、多様性と情報内容の既存のデータセットを超え、世界的知識、オブジェクトの特性、空間的関係、美的評価をカバーしている。
さらに,ShareGPT4Vデータを事前学習とSFTフェーズの両方に組み込んで,優れたLMMであるShareGPT4V-7Bを得る。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:52:50 GMT)
Video-Bench: A Comprehensive Benchmark and Toolkit for Evaluating
Video-based Large Language Models [81.8] ビデオベースの大規模言語モデル(Video-LLMs)が最近導入され、認識と理解の基本的な改善と多様なユーザからの問い合わせの両方をターゲットにしている。
このようなモデルの開発を導くため、堅牢で包括的な評価システムの構築が重要となる。
本稿では,ビデオLLMの評価に特化して設計されたツールキットとともに,新しい総合的なベンチマークであるtextitVideo-Benchを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:16:29 GMT)
Power Hungry Processing: Watts Driving the Cost of AI Deployment? [81.1] 多目的生成AIシステムは、機械学習(ML)モデルを技術に組み込む統一的なアプローチを約束する。
この「一般性」という野心は、これらのシステムが必要とするエネルギー量と放出する炭素量を考えると、環境に急激なコストがかかる。
これらのモデルを用いて,代表的なベンチマークデータセット上で1,000の推論を行うのに必要なエネルギーと炭素の量として,デプロイメントコストを測定した。
本稿は、多目的MLシステムの展開動向に関する議論から締めくくり、エネルギーと排出の面でコストの増大に対して、その実用性はより意図的に重み付けされるべきである、と警告する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:09:36 GMT)
Text-Driven Image Editing via Learnable Regions [79.9] 本研究では,ユーザが提供するマスクやスケッチを必要とせずに,テキストプロンプトによって駆動される領域ベースの画像編集手法を提案する。
この単純なアプローチにより、現在の画像生成モデルと互換性のあるフレキシブルな編集が可能になることを示す。
実験では,提案した言語記述と一致した高忠実度およびリアリズムの画像操作において,提案手法の競合性能を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:27:31 GMT)
A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on
Reasoning, Hallucination, and Interactivity [79.1] 8種類の共通NLPアプリケーションタスクをカバーする23のデータセットを用いてChatGPTの広範な技術的評価を行う。
これらのデータセットと、新たに設計されたマルチモーダルデータセットに基づいて、ChatGPTのマルチタスク、マルチリンガル、マルチモーダルの側面を評価する。
ChatGPTの精度は平均63.41%で、論理的推論、非テキスト的推論、コモンセンス推論の10の異なる推論カテゴリで正確である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:01:12 GMT)
Strategyproof and Proportionally Fair Facility Location [77.2] 簡単な1次元集団決定問題(しばしば施設配置問題と呼ばれる)に焦点を当てる。
比例に基づく様々な強度のフェアネス公理の階層構造を解析する。
各公理に対して、公理と戦略の安全性を満足するメカニズムのファミリーを特徴付ける。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:00:07 GMT)
DreamPropeller: Supercharge Text-to-3D Generation with Parallel Sampling [76.3] そこで我々はDreamPropellerを提案する。DreamPropellerは、既存のテキストから3D生成パイプラインの周囲を、スコアの蒸留に基づいてラップできる加速アルゴリズムである。
我々のフレームワークは、ODEパスを並列サンプリングする古典的なアルゴリズムであるPicardイテレーションを一般化する。
提案アルゴリズムは, 並列計算をウォールクロック時間で処理し, 最大4.7倍の高速化を実現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:28:58 GMT)
UniIR: Training and Benchmarking Universal Multimodal Information
Retrievers [76.1] 命令誘導型マルチモーダルレトリバーであるUniIRを導入する。
UniIRは、10の多様なマルチモーダル-IRデータセットで共同で訓練された単一の検索システムであり、様々な検索タスクを実行するためにユーザー命令を解釈する。
我々は,汎用マルチモーダル情報検索の評価を標準化するために,総合的な結果を持つマルチモーダル検索ベンチマークであるM-BEIRを構築した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:55:52 GMT)
DI-Net : Decomposed Implicit Garment Transfer Network for Digital
Clothed 3D Human [75.5] 既存の2D仮想試行法は、各ピクセルの深さを知覚できないため、直接3Dに拡張することはできない。
本稿では,新たに試みられた3次元メッシュをシームレスに再構築可能な,分解型インプリシト衣服転送ネットワーク(DI-Net)を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:28:41 GMT)
SARA: Controllable Makeup Transfer with Spatial Alignment and
Region-Adaptive Normalization [72.8] 本稿では,空間アライメントと領域適応正規化法(SARA)を提案する。
提案手法は,大規模な空間的不整合を処理し,部分特異的かつ日陰制御可能なメイク転送を実現するための詳細なメイク転送結果を生成する。
実験の結果,SARA法は既存の手法よりも優れており,2つの公開データセット上での最先端性能を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:46:51 GMT)
TLControl: Trajectory and Language Control for Human Motion Synthesis [72.2] 本稿では,人間のリアルな動き合成のための新しい手法であるTLControlを提案する。
まず、VQ-VAEをトレーニングし、ボディパーツによって構成されたコンパクトな潜伏運動空間を学習する。
そこで我々は,関節の完全な軌跡の粗い初期予測を行うMasked Trajectories Transformerを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:54:16 GMT)
ReMoS: Reactive 3D Motion Synthesis for Two-Person Interactions [71.7] 本稿では,反応運動合成のための拡散型確率モデルReMoSを紹介する。
本稿では,ペアダンス,忍術,キックボクシング,アクロバティックスなど,多岐にわたる難解な2人シナリオ下でのReMoSの性能を示す。
この結果はインタラクティブなアプリケーションでも利用でき、アニメーターに十分な量の制御を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:52 GMT)
Image segmentation with traveling waves in an exactly solvable recurrent
neural network [71.7] 繰り返しニューラルネットワークは、シーンの構造特性に応じて、画像をグループに効果的に分割できることを示す。
本稿では,このネットワークにおけるオブジェクトセグメンテーションのメカニズムを正確に記述する。
次に、グレースケール画像中の単純な幾何学的対象から自然画像まで、入力をまたいで一般化するオブジェクトセグメンテーションの簡単なアルゴリズムを実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:46:44 GMT)
HallusionBench: An Advanced Diagnostic Suite for Entangled Language
Hallucination & Visual Illusion in Large Vision-Language Models [71.4] 本稿では,画像コンテキスト推論評価のためのベンチマークであるHalusionBenchを紹介する。
このベンチマークは、1129の質問と組み合わせた346の画像で構成されており、すべて人間の専門家によって細心の注意を払って作成されている。
我々は13種類のモデルをベンチマークし、最先端のGPT-4Vによって達成された31.42%の質問対精度を強調した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:56:41 GMT)
ChatGPT's One-year Anniversary: Are Open-Source Large Language Models
Catching up? [71.1] ChatGPTは、AIのランドスケープ全体において、地震的な変化をもたらした。
モデルは人間の質問に答え、幅広いタスクのパネルで指示に従うことができることを示した。
クローズドソースのLLMは一般的にオープンソースよりも優れていますが、後者の進歩は急速に進んでいます。
これは研究だけでなく、ビジネスにも重要な意味を持つ。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:44:51 GMT)
On the Long Range Abilities of Transformers [69.3] トランスアーキテクチャの変更を最小限に抑えることで,Long Range Arenaベンチマークの性能を大幅に向上させることができることを示す。
長距離タスクの2つの鍵となる原理(すなわち、滑らか性に対する帰納的バイアス)と局所性(すなわち、局所性)である。
以下に示すように、これらのアイデアを注意機構に組み込むことで、追加の計算量や追加のトレーニング可能なパラメータなしで結果を改善することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:21:48 GMT)
CompenHR: Efficient Full Compensation for High-resolution Projector [68.4] プロジェクター補償はプロジェクターカメラシステムの実用的なタスクである。
プロジェクター入力画像、名前付き補償画像を見つけることを目的としており、プロジェクターが投影されると幾何学的および測光的歪みがキャンセルされる。
最先端の手法では、ディープラーニングを使ってこの問題に対処し、低解像度のセットアップで有望なパフォーマンスを示す。
しかし、ディープラーニングを高精細なセットアップに直接適用することは、長いトレーニング時間と高いメモリコストのために現実的ではない。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:12:46 GMT)
SEED-Bench-2: Benchmarking Multimodal Large Language Models [67.3] MLLM(Multimodal large language model)は、最近、テキストだけでなく、インターリーブされたマルチモーダル入力の画像を生成できることを実証した。
SEED-Bench-2は、正確な人間のアノテーションを持つ24Kの多重選択質問で構成されており、27次元にまたがっている。
我々は,23個の著名なオープンソースMLLMの性能を評価し,貴重な観察結果を要約した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:53:55 GMT)
Quantifying the redundancy between prosody and text [67.1] 我々は大きな言語モデルを用いて、韻律と単語自体の間にどれだけの情報が冗長であるかを推定する。
単語が持つ情報と韻律情報の間には,複数の韻律的特徴にまたがる高い冗長性が存在する。
それでも、韻律的特徴はテキストから完全には予測できないことが観察され、韻律は単語の上下に情報を運ぶことが示唆された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:15:24 GMT)
SCALAR-NeRF: SCAlable LARge-scale Neural Radiance Fields for Scene
Reconstruction [66.7] 本稿では,スケーラブルな大規模ニューラルシーン再構築に適した新しいフレームワークであるSCALAR-NeRFを紹介する。
ニューラル表現をエンコーダ・デコーダアーキテクチャとして構成し、そこではエンコーダが3次元点座標を処理してエンコーダ化された特徴を生成する。
そこで本研究では,これらの局所モデルから出力を抽出し,最終的な再構築を実現するための効率的かつ効率的な手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:18:16 GMT)
CharacterGLM: Customizing Chinese Conversational AI Characters with
Large Language Models [66.4] 本稿では,ChatGLM上に構築されたモデルである characterGLM について紹介する。
我々のキャラクタGLMは文字ベースの対話(CharacterDial)を生成するために設計されており、人間固有の社会的欲求と感情的欲求を満たすための文字カスタマイズを備えた対話型AIシステムを実現することを目的としている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:49:23 GMT)
Exploring Straighter Trajectories of Flow Matching with Diffusion
Guidance [66.4] フローマッチング(StraightFM)のストレートトラジェクトリを提案する。
分布レベル全体から拡散モデルによって導かれる結合戦略により軌道を直線化する。
拡散法と従来のフローマッチング法の間で、FIDが低い視覚的に魅力的な画像を生成する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:19:30 GMT)
LLaMA-VID: An Image is Worth 2 Tokens in Large Language Models [66.4] 本稿では,視覚言語モデル(VLM)において,LLaMA-VIDと呼ばれるビデオおよび画像理解のためのトークン生成に挑戦する新しい手法を提案する。
LLaMA-VIDは、各フレームを2つの異なるトークン、すなわちコンテキストトークンとコンテントトークンで表現することでこの問題に対処する。
このデュアルトークン戦略は、重要な情報を保持しながら、長いビデオのオーバーロードを大幅に削減する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:53:43 GMT)
SplitNeRF: Split Sum Approximation Neural Field for Joint Geometry,
Illumination, and Material Estimation [66.0] 本稿では, 実世界の物体の形状, 材料特性, 照明特性を推定してデジタル化する手法を提案する。
提案手法は,実時間物理ベースのレンダリングに画像ベースの照明で使用される分割和近似を,レーダランスニューラルネットワーク(NeRF)パイプラインに組み込む。
提案手法は,NVIDIA A100 GPUを1つのGPUで1時間に1ドル程度のトレーニングをした後で,最先端のリライト品質を実現することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:36:36 GMT)
Rethinking Backdoor Attacks on Dataset Distillation: A Kernel Method
Perspective [65.7] 本稿では, データセット蒸留に特化した2つの新しい理論駆動トリガパターン生成手法を提案する。
最適化に基づくトリガ設計フレームワークは,データセットの蒸留に対する効果的なバックドア攻撃を通知する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:53:05 GMT)
Continuous Pose for Monocular Cameras in Neural Implicit Representation [65.4] 本稿では,時間的連続的な機能として単眼カメラのポーズを最適化することの有効性を示す。
提案手法を4つの異なる実験環境において活用する。
連続運動の仮定を用いて、ポーズの変化は実際には6度以下の自由度(DOF)を持つ多様体に生きることができる。
我々はこの低DOF動作表現を固有運動と呼び、vSLAM設定でのアプローチを用い、カメラ追跡性能を高く評価した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:14:58 GMT)
PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.2] ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:42:30 GMT)
Debiasing Multimodal Models via Causal Information Minimization [65.2] 我々は、マルチモーダルデータのための因果グラフにおいて、共同創設者から生じるバイアスを研究する。
ロバストな予測機能は、モデルがアウト・オブ・ディストリビューションデータに一般化するのに役立つ多様な情報を含んでいる。
これらの特徴を共同設立者表現として使用し、因果理論によって動機づけられた手法を用いてモデルからバイアスを取り除く。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:46:14 GMT)
Egocentric Whole-Body Motion Capture with FisheyeViT and Diffusion-Based
Motion Refinement [65.1] 本研究では,人体と手の動きを同時に推定する単一魚眼カメラを用いて,自我中心型全体モーションキャプチャーを探索する。
この課題は、高品質なデータセットの欠如、魚眼カメラの歪み、人間の身体の自己閉塞など、重大な課題を提起する。
そこで本研究では,魚眼画像の特徴を3次元人体ポーズ予測のための3次元熱マップ表現に変換した魚眼画像の特徴を抽出する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:13:47 GMT)
MVBench: A Comprehensive Multi-modal Video Understanding Benchmark [64.8] 本稿では、MVBenchという総合的なマルチモーダルビデオ理解ベンチマークを紹介する。
まず、これらの時間的タスクを定義するための新しい静的-動的手法を提案する。
そして,タスク定義に従って,公開ビデオアノテーションを複数選択QAに自動的に変換し,各タスクを評価する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:59:04 GMT)
Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.3] シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:34:58 GMT)
Enhancing Scene Text Detectors with Realistic Text Image Synthesis Using
Diffusion Models [64.0] DiffTextは、前景のテキストと背景の本質的な特徴をシームレスにブレンドするパイプラインです。
テキストインスタンスが少なくなると、生成したテキストイメージはテキスト検出を支援する他の合成データを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:51:28 GMT)
Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following [63.6] 画像にテキストのデコードとして意味パネルを導入する。
パネルは、入力テキストから解析された視覚概念をアレンジすることで得られる。
我々は,連続生成とチャットによる編集におけるその可能性を示す実用的なシステムを開発した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:57:44 GMT)
Hybrid Search for Efficient Planning with Completeness Guarantees [63.0] 本稿では,離散的な行動空間における完全性を実現するために,部分ゴール探索法を効果的に拡張する手法を提案する。
このソリューションは、高レベルの探索の実践的効率と低レベルの探索の完全性という、両方の世界のベストを達成している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:23:22 GMT)
Model-free Test Time Adaptation for Out-Of-Distribution Detection [62.5] 我々はtextbfDistribution textbfDetection (abbr) のための非パラメトリックテスト時間 textbfAdaptation フレームワークを提案する。
Abbrは、オンラインテストサンプルを使用して、テスト中のモデル適応、データ分散の変更への適応性を向上させる。
複数のOOD検出ベンチマークにおける包括的実験により,abrの有効性を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:00:47 GMT)
LasTGL: An Industrial Framework for Large-Scale Temporal Graph Learning [61.5] LasTGLは、共通時間グラフ学習アルゴリズムの実装を統合し、統一する産業用フレームワークである。
LasTGLは、詳細なチュートリアルとともに、包括的な時間グラフデータセット、TGNNモデル、ユーティリティを提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:45:37 GMT)
End-to-End Temporal Action Detection with 1B Parameters Across 1000
Frames [60.9] 時間的行動検出(TAD)は、エンドツーエンドのトレーニングで大幅に改善された。
メモリボトルネックのため、限られたスケールと限られたデータ量を持つモデルだけがエンドツーエンドのトレーニングを受けることができる。
本稿では,エンド・ツー・エンドのトレーニングにおけるメモリ消費を削減し,10億のパラメータと入力映像を1,536フレームにスケールアップする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:31:04 GMT)
Progressive Learning with Visual Prompt Tuning for Variable-Rate Image
Compression [60.7] 本稿では,変圧器を用いた可変レート画像圧縮のためのプログレッシブラーニングパラダイムを提案する。
視覚的プロンプトチューニングにインスパイアされた私たちは,エンコーダ側とデコーダ側でそれぞれ入力画像と隠蔽特徴のプロンプトを抽出するためにLPMを使用する。
提案モデルでは, 速度歪み特性の観点から現行の可変画像法よりも優れ, スクラッチから訓練した最先端の固定画像圧縮法にアプローチする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:31:43 GMT)
RELIC: Investigating Large Language Model Responses using
Self-Consistency [60.4] LLM(Large Language Models)は、フィクションと事実を混同し、幻覚として知られる非事実コンテンツを生成することで有名である。
本稿では,ユーザが生成したテキストの信頼性に関する洞察を得るのに役立つ対話型システムを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:55:52 GMT)
Towards an Automatic AI Agent for Reaction Condition Recommendation in
Chemical Synthesis [60.0] 本稿では,このギャップを埋めるために,Large Language Model (LLM) を利用したAIエージェントを提案する。
我々は新しい3相パラダイムを提案し、高度なインテリジェンス・エンハンスメント手法を適用した。
提案したAIエージェントは、人間の相互作用なしに最適な反応条件の推薦を自律的に生成することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:21:40 GMT)
Explainability for Large Language Models: A Survey [59.7] 大規模言語モデル(LLM)は、自然言語処理における印象的な能力を示している。
本稿では,トランスフォーマーに基づく言語モデルを記述する手法について,説明可能性の分類法を紹介した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:04:45 GMT)
Beyond Sole Strength: Customized Ensembles for Generalized
Vision-Language Models [59.6] ファインチューニング型視覚言語モデル (VLM) はその実用的価値から人気が高まっている。
本稿では、より弱いVLMを活用してロバストな単一モデルの一般化を促進するための協調可能性について検討する。
それぞれが特定のシナリオに合わせてカスタマイズされた3つのアンサンブル戦略を導入する。
提案したアンサンブル戦略はゼロショット,ベース・ツー・ニュー,クロスデータセットの一般化に基づいて評価され,新たな最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:17:25 GMT)
LightGaussian: Unbounded 3D Gaussian Compression with 15x Reduction and
200+ FPS [59.2] 光ガウシアン(LightGaussian)は、3次元ガウシアンをより効率的でコンパクトなフォーマットに変換する新しい方法である。
ネットワーク・プルーニング(Network Pruning)の概念からインスピレーションを得たLightGaussianは、シーンの再構築に貢献するに足りていないガウシアンを特定する。
本稿では,全ての属性を量子化するハイブリッド方式であるVecTree Quantizationを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:39:20 GMT)
Fourier Neural Differential Equations for learning Quantum Field
Theories [57.1] 量子場理論は相互作用ハミルトニアンによって定義され、散乱行列によって実験データにリンクされる。
本稿では,NDEモデルを用いて理論,スカラー・ユーカワ理論,スカラー量子電磁力学を学習する。
理論の相互作用ハミルトニアンは、ネットワークパラメータから抽出することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:11:15 GMT)
Proximal Algorithms for Accelerated Langevin Dynamics [57.1] 我々は,確率化Nesterovスキームに基づくMCMCアルゴリズムの新たなクラスを開発する。
統計処理と画像処理の異なるモデルに対して,Langevinサンプルよりも提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:27:26 GMT)
Proximal Algorithms for Accelerated Langevin Dynamics [57.1] 我々は,確率化Nesterovスキームに基づくMCMCアルゴリズムの新たなクラスを開発する。
統計処理と画像処理の異なるモデルに対して,Langevinサンプルよりも提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:27:26 GMT)
E-polis: A serious game for the gamification of sociological surveys [55.2] E-polisは、若者の理想的な社会に関する意見を研究するための社会学的調査をゲーミフィケーションする真剣なゲームである。
このゲームは、社会正義や経済発展などの様々なトピックに関するデータを収集したり、市民のエンゲージメントを促進するために使用することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:03:24 GMT)
CodeChain: Towards Modular Code Generation Through Chain of
Self-revisions with Representative Sub-modules [54.9] 我々は,自己修正の連鎖を通じてモジュール化されたコード生成を誘発する,新しい推論フレームワークであるCodeChainを提案する。
CodeChainは、生成したソリューションのモジュール性と正確性の両方を大幅に向上させ、APPSで35%、CodeContestsで76%の相対パス@1の改善を実現しています。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:32:19 GMT)
CLiC: Concept Learning in Context [54.8] 本稿では,視覚概念学習の最近の進歩に基づく。
ソースイメージから視覚概念を取得し、その後ターゲットイメージ内のオブジェクトに適用する。
概念学習のローカライズには,マスク内の概念と周囲の画像領域の両方を含むソフトマスクを用いる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:33:18 GMT)
Towards Full-scene Domain Generalization in Multi-agent Collaborative
Bird's Eye View Segmentation for Connected and Autonomous Driving [54.6] 協調認識の学習段階と推論段階の両方に適用可能な統合ドメイン一般化フレームワークを提案する。
我々は、AmpAug(Amplitude Augmentation)法を用いて、低周波画像の変動を増大させ、学習能力を拡大する。
推論フェーズでは、システム内ドメインアライメント機構を導入し、ドメインの不一致を減らし、潜在的に排除する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:52:49 GMT)
Image Inpainting via Tractable Steering of Diffusion Models [54.1] 本稿では,トラクタブル確率モデル(TPM)の制約後部を正確に,かつ効率的に計算する能力を活用することを提案する。
具体的には、確率回路(PC)と呼ばれる表現型TPMのクラスを採用する。
提案手法は, 画像の全体的な品質とセマンティックコヒーレンスを, 計算オーバーヘッドを10%加えるだけで一貫的に改善できることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:14:02 GMT)
Perceptual Image Compression with Cooperative Cross-Modal Side
Information [53.4] 本稿では,テキスト誘導側情報を用いた新しい深層画像圧縮手法を提案する。
具体的には,CLIPテキストエンコーダとSemantic-Spatial Awareブロックを用いてテキストと画像の特徴を融合する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:49:54 GMT)
A Unified Approach for Text- and Image-guided 4D Scene Generation [53.2] 本研究では,テキストから4Dへの新たな2段階合成手法であるDream-in-4Dを提案する。
提案手法は,画像の画質,3次元整合性,テキスト・ツー・4次元生成におけるテキストの忠実度を著しく向上することを示す。
本手法は,テキストから4D,画像から4D,パーソナライズされた4D生成タスクに対して,初めて統一されたアプローチを提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:03:53 GMT)
HumanRef: Single Image to 3D Human Generation via Reference-Guided
Diffusion [53.2] 単一ビュー入力から3次元のヒューマン生成フレームワークであるHumanRefを提案する。
生成した3Dモデルが入力画像と光写実的に整合していることを保証するため、HumanRefは参照誘導スコア蒸留サンプリングと呼ばれる新しい手法を導入した。
実験結果から,HumanRefは3D衣服を製作する上で,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:06:28 GMT)
Neural Poisson Surface Reconstruction: Resolution-Agnostic Shape
Reconstruction from Point Clouds [53.0] 我々は,3次元形状を点から復元するという課題に対処する形状再構成アーキテクチャであるニューラルポアソン表面再構成(nPSR)を導入する。
nPSRには2つの大きな利点がある: まず、高分解能評価において同等の性能を達成しつつ、低分解能データの効率的なトレーニングを可能にする。
全体として、ニューラル・ポアソン表面の再構成は、形状再構成における古典的なディープニューラルネットワークの限界を改良するだけでなく、再構築品質、走行時間、分解能非依存の観点からも優れた結果が得られる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:40:01 GMT)
Multi-Scale 3D Gaussian Splatting for Anti-Aliased Rendering [52.9] 3Dガウシアンは最近、3D再構成とレンダリングの非常に効率的な表現として現れた。
そこで本研究では,ガウスを異なるスケールで維持し,同じシーンを表現できるマルチスケール3次元ガウススプラッティングアルゴリズムを提案する。
提案アルゴリズムは13%-66%のPSNRと160%-2400%のレンダリング速度を4$times$-128$times$ scale rendering on Mip-NeRF360 data。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:31:35 GMT)
A Counterfactual Safety Margin Perspective on the Scoring of Autonomous
Vehicles' Riskiness [52.3] 本稿では,異なるAVの行動のリスクを評価するためのデータ駆動型フレームワークを提案する。
本稿では,衝突を引き起こす可能性のある名目行動から最小限の偏差を示す,対実的安全マージンの概念を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:23:04 GMT)
Single-Cell Clustering via Dual-Graph Alignment [52.1] この研究は、正確な細胞サブポピュレーションを取得し、実際の生物学的シナリオによく似たクラスタリング結果を生成することに寄与する。
疾患細胞の特徴と分布に関するより良い洞察を与え、最終的に早期疾患の診断と治療の基礎を構築する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:14:55 GMT)
Typhoon Intensity Prediction with Vision Transformer [51.8] 台風強度を正確に予測するために「台風強度変換器(Tint)」を導入する。
Tintは、層ごとにグローバルな受容野を持つ自己認識機構を使用する。
公開されている台風ベンチマークの実験は、Tintの有効性を検証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:11:33 GMT)
Large Model Based Referring Camouflaged Object Detection [51.8] Referring camouflaged object detection (Ref-COD)は、テキストまたはビジュアル参照にマッチした特定のcamouflaged objectを分割することを目的とした、最近提案された問題である。
我々のモチベーションは、最近のMLLM(Multimodal Large Language Models)のセマンティックインテリジェンスと本質的な知識をフル活用して、この複雑なタスクを人間的な方法で分解することである。
MLKGと呼ばれるRef-CODのための大規模モデルベースマルチレベル知識誘導型マルチモーダル手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:45:09 GMT)
Stitched ViTs are Flexible Vision Backbones [51.4] 我々は、縫合可能なニューラルネットワーク(SN-Net)にインスパイアされ、訓練済みのモデルファミリーを縫合することで、リッチワークをカバーする単一のモデルを生成する。
我々は、下流タスク適応を容易にするために、体系的に改良されたモデル縫合フレームワークSN-Netv2を紹介する。
SN-Netv2は、下流の高密度予測においてSN-Netv1よりも優れた性能を示し、柔軟なビジョンバックボーンとして強力な能力を示している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:28:21 GMT)
Nonlocality under Computational Assumptions [51.0] 相関の集合が非局所であるとは、空間的分離な当事者がランダム性を共有し、局所的な操作を実行することによって再現できないことである。
ランダム性や量子時間計算によって再現できない局所的な(効率のよい)測定結果が存在することを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:53:15 GMT)
ID-like Prompt Learning for Few-Shot Out-of-Distribution Detection [50.0] アウト・オブ・ディストリビューション(OOD)検出法は、OODサンプルを識別するモデルを訓練するために補助的なアウトレーヤを利用することが多い。
我々は,IDサンプルの近傍空間からCLIPを用いて,IDのような外れ値を検出する新しいOOD検出フレームワークを提案する。
OOD検出のためのCLIPの機能をさらに活用するために、識別されたIDライクなアウトレイラを利用した即時学習フレームワークが提案されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:06:43 GMT)
Sinkhorn Flow: A Continuous-Time Framework for Understanding and
Generalizing the Sinkhorn Algorithm [49.5] 我々はシンクホーンアルゴリズムの連続時間アナログを導入する。
この観点から、ノイズやバイアスに頑健なシンクホーンスキームの新たな変種を導出することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:29:12 GMT)
ConTex-Human: Free-View Rendering of Human from a Single Image with
Texture-Consistent Synthesis [49.3] テクスチャに一貫性のあるバックビュー合成モジュールを導入し、参照画像コンテンツをバックビューに転送する。
また、テクスチャマッピングとリファインメントのための可視性対応パッチ整合性正規化と、合成したバックビューテクスチャの組み合わせを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:55:53 GMT)
SceneTex: High-Quality Texture Synthesis for Indoor Scenes via Diffusion
Priors [49.0] SceneTexは、奥行き拡散前処理を用いた室内シーンの高品質でスタイルに一貫性のあるテクスチャを生成する新しい方法である。
SceneTexは3D-FRONTシーンの様々な正確なテクスチャ合成を可能にする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:49:57 GMT)
Context-lumpable stochastic bandits [49.0] 我々は、$S$コンテキストと$K$アクションによる文脈的盗賊問題を考える。
我々は,最大$widetilde O(r (S +K )/epsilon2)$サンプルを用いて,$epsilon$-optimal Policyを出力するアルゴリズムを提案する。
後悔の設定では、T$までの累積後悔を$widetilde O(sqrtr3(S+K)T)$で束縛するアルゴリズムを与える。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:53:55 GMT)
Point-PEFT: Parameter-Efficient Fine-Tuning for 3D Pre-trained Models [48.5] 我々は、最小限の学習可能なパラメータを持つポイントクラウド事前学習モデルに適用するための新しいフレームワークであるPoint-PEFTを紹介する。
具体的には、事前訓練された3Dモデルに対して、パラメータの大部分を凍結し、新たに追加されたPEFTモジュールを下流タスクでチューニングする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:31:34 GMT)
De-identification of clinical free text using natural language
processing: A systematic review of current approaches [48.3] 自然言語処理は、その非識別プロセスの自動化の可能性を繰り返し示してきた。
本研究の目的は,過去13年間に臨床自由テキストの非識別化が進展したことを示す体系的な証拠を提供することである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:20:41 GMT)
SR-OOD: Out-of-Distribution Detection via Sample Repairing [48.3] アウト・オブ・ディストリビューション(OOD)検出は、機械学習モデルの信頼性と堅牢性を保証するための重要なタスクである。
近年の研究では、生成モデルはOODサンプルに高い信頼度を割り当てることがしばしばあり、データのセマンティックな情報を捕捉できないことが示されている。
我々は,サンプル修復の利点を生かし,新しいOOD検出フレームワーク,SR-OODを提案する。
本フレームワークは,OOD検出における最先端な生成手法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:34:58 GMT)
Viewport Prediction for Volumetric Video Streaming by Exploring Video
Saliency and Trajectory Information [47.6] 本稿では,Saliency and Trajectory Viewport Prediction (STVP) という新しいアプローチを提案し,提案する。
ボリュームビデオストリーミングにおけるビューポート予測の精度の向上を目的としている。
特に,計算複雑性を低減するために,新しいサンプリング手法であるUniform Random Smpling (URS)を導入する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:45:29 GMT)
Scalable Label Distribution Learning for Multi-Label Classification [47.6] マルチラベル分類(MLC、Multi-label classification)とは、あるインスタンスに関連ラベルのセットをタグ付けする問題を指す。
既存のMLC手法の多くはラベル数に関連する学習プロセスを設計しており、大規模な出力空間にスケールアップする際の計算複雑性をボトルネックにしている。
本稿では,多ラベル分類のためのスケーラブルラベル分散学習(SLDL)と呼ばれる新しいMLC学習手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:52:53 GMT)
Reason out Your Layout: Evoking the Layout Master from Large Language
Models for Text-to-Image Synthesis [47.3] 本稿では,レイアウト生成器としてLarge Language Models (LLM) を用いたT2I拡散モデルの改良手法を提案する。
実験により,画像の画質とレイアウト精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:51:13 GMT)
Is This the Subspace You Are Looking for? An Interpretability Illusion
for Subspace Activation Patching [47.1] 機械的解釈可能性(Mechanistic Interpretability)は、特定の、解釈可能な特徴の観点からモデル行動を理解することを目的としている。
最近の研究は、モデル行動を操作し、その背後にある特徴を与えられた部分空間とみなす方法として、サブスペース介入を探求している。
これらの2つの目的が多様であることを示し、潜在的に説明可能性という幻想的な感覚に繋がる可能性があることを実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:32:19 GMT)
Improving Image Captioning via Predicting Structured Concepts [46.9] 本研究では,概念とその構造を予測するための構造的概念予測器を提案し,それをキャプションに統合する。
我々は、単語依存によって駆動される概念関係を記述するために、重み付きグラフ畳み込みネットワーク(W-GCN)を設計する。
提案手法は,概念間の潜在的な関係を捉え,異なる概念を識別的に学習することにより,画像キャプションの継承を容易にする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:05:03 GMT)
Digital Twin-Enhanced Deep Reinforcement Learning for Resource
Management in Networks Slicing [46.7] 本稿では,デジタルツインと強化学習エージェントからなるフレームワークを提案する。
具体的には、歴史的データとニューラルネットワークを用いて、実環境の状態変動則をシミュレートするデジタルツインモデルを構築することを提案する。
また、このフレームワークをオフラインで強化学習に拡張し、歴史的データのみに基づいたインテリジェントな意思決定にソリューションを利用できるようにします。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:25:14 GMT)
Exploring Semantic Attributes from A Foundation Model for Federated
Learning of Disjoint Label Spaces [46.6] 本研究では,特定の対象に敏感でない中レベルの意味的知識(属性など)の伝達を検討する。
我々はFZSL(Federated Zero-Shot Learning)パラダイムを定式化し、複数のローカルクライアントで中レベルのセマンティック知識を学習する。
モデル識別能力を向上させるために,外的知識からの意味的知識増強について検討する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:49:39 GMT)
From Simulations to Reality: Enhancing Multi-Robot Exploration for Urban
Search and Rescue [46.4] 本研究では,コミュニケーションが限られ,位置情報がない未知の環境での効率的なマルチロボット探索のための新しいハイブリッドアルゴリズムを提案する。
連続した目標情報なしでシナリオに合うように、ローカルなベストとグローバルなベストポジションを再定義する。
提示された研究は、限られた情報と通信能力を持つシナリオにおけるマルチロボット探索の強化を約束している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:05:25 GMT)
Bridging the Gap: A Unified Video Comprehension Framework for Moment
Retrieval and Highlight Detection [45.8] ビデオモーメント検索 (MR) とハイライト検出 (HD) は, ビデオ解析の需要が高まっているため, 注目されている。
最近のアプローチでは、MRとHDをビデオグラウンド問題として扱い、トランスフォーマーベースのアーキテクチャでそれらに対処している。
本稿では,そのギャップを埋め,MRとHDを効果的に解決するための統一ビデオ理解フレームワーク(UVCOM)を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:55:23 GMT)
HandyPriors: Physically Consistent Perception of Hand-Object
Interactions with Differentiable Priors [45.8] 我々は、人間と物体の相互作用シーンにおけるポーズ推定のための統一的で汎用的なパイプラインであるHandyPriorsを提案する。
提案手法では,入力画像やセグメンテーションマスクのレンダリング先と物理前のレンダリング先とを併用し,フレーム間の浸透と相対スライディングを緩和する。
我々は,HandyPriorsがポーズ推定タスクにおいて同等あるいは優れた結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:42:44 GMT)
Beyond Hallucinations: Enhancing LVLMs through Hallucination-Aware
Direct Preference Optimization [45.5] 本稿では,Halucination-Aware Direct Preference Optimization (HA-DPO)という新しい戦略を紹介する。
提案手法は,幻覚の問題を独自の選好選択問題として扱い,非幻覚反応を好むようにモデルを訓練する。
その結果,幻覚の問題は大幅に減少し,モデルの一般化能力が向上した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:54:37 GMT)
ControlVideo: Conditional Control for One-shot Text-driven Video Editing
and Beyond [45.2] ControlVideoは、ソースビデオの構造を保持しながら、所定のテキストと整列するビデオを生成する。
トレーニング済みのテキスト・ツー・イメージ拡散モデルに基づいて構築されたコントロールビデオは、忠実度と時間的一貫性を高める。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:37:16 GMT)
D4AM: A General Denoising Framework for Downstream Acoustic Models [45.0] 音声強調(SE)は、自動音声認識(ASR)システムを支援するフロントエンド戦略として用いられる。
既存のSE手法の訓練目的は、未知のASRシステムに向けたトレーニングのために、音声テキストとノイズクリーンなペアデータを統合するのに完全には有効ではない。
そこで我々は,様々な下流音響モデルのための一般的なデノベーションフレームワークD4AMを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:27:27 GMT)
A Floquet-Rydberg quantum simulator for confinement in $\mathbb{Z}_2$
gauge theories [45.0] 量子技術分野の最近の進歩は、小型量子シミュレータの実現への道を開いた。
実時間力学の量子シミュレーションのためのスケーラブルなFloquetスキームを$mathbbZ$ LGTで提案する。
Floquet-Rydberg セットアップにおけるゲージ不変閉じ込め力学の観測が,現在の実験手法の到達点であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:01:24 GMT)
Zero-shot Visual Relation Detection via Composite Visual Cues from Large
Language Models [44.6] 本稿では,ゼロショット視覚認識のための新しい手法であるRECODEを提案する。
各述語カテゴリを主題、対象、空間構成要素に分解する。
異なる視覚的手がかりは、異なる視点から類似した関係カテゴリの識別可能性を高める。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:36:44 GMT)
CDEval: A Benchmark for Measuring the Cultural Dimensions of Large
Language Models [44.0] CDEvalは、大規模言語モデルの文化的側面を評価するためのベンチマークである。
GPT-4の自動生成と人間による検証の両方を取り入れて構築され、7つの領域にわたる6つの文化的次元をカバーする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:01:25 GMT)
Data-efficient operator learning for solving high Mach number fluid flow
problems [43.1] 本研究では,SciMLを用いて不規則な地形上のマッハ流体の解を予測することの問題点を考察する。
データから行動モードの基底を学習するニューラル基底関数(NBF)は,ベースを意識しないベースラインモデルよりも効果的であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:07:25 GMT)
On the quantum time complexity of divide and conquer [42.7] 量子分割の時間的複雑さと古典的問題に対するアルゴリズムの克服について検討する。
これらの定理を、弦、整数、幾何学的対象を含む一連の問題に適用する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:06:03 GMT)
Multi-defender Security Games with Schedules [42.3] セキュリティゲームは、しばしば高いセキュリティ設定で戦略的相互作用をモデル化するために使用される。
現実的なシナリオの多くは、より複雑なシステムに埋め込まれた独自の関心と優先順位を持つ複数の異質なディフェンダーを特徴としている。
マルチディフェンダーのセキュリティゲームとは異なり、スケジュールの導入は均衡の非存在を引き起こす可能性があることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:39:02 GMT)
Plug-and-Play, Dense-Label-Free Extraction of Open-Vocabulary Semantic
Segmentation from Vision-Language Models [42.0] この課題に対して,COCO-OVSS (Plug-and-Play Open-Language-Vocabulary Semantic) を提案する。
OVSSは、直接テキストイメージのクロスアテンションを持つVLMと、画像テキストマッチング損失を利用してセマンティックセグメンテーションを生成する。
モデルが最も注意を払っているパッチを反復的にドロップすることで、セグメンテーションマスクの全範囲をよりよく解決することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:42:58 GMT)
Spectral Multiplexing of Rare-earth Emitters in a Co-doped Crystalline
Membrane [41.9] ここで、エルビウムエミッタは、ユーロピウムと共ドープした結晶性イットリウムオルソシリケート10ミクロンの膜を含むファブリペロ共振器で研究される。
共ドーピングはエミッタ周波数の不均一分布を調整し、360キュービット以上の高忠実度スペクトル多重化を可能にする。
将来の研究は、これを長寿命の核スピン記憶と組み合わせることで、研究された共ドープ膜を量子リピータと分散量子コンピュータのための有望なプラットフォームにするかもしれない。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:25:03 GMT)
AGI: Artificial General Intelligence for Education [41.5] 本稿では,人工知能(AGI)の重要な概念,能力,範囲,将来的な教育の可能性について概説する。
AGIは知的学習システム、教育評価、評価手順を大幅に改善することができる。
この論文は、AGIの能力が人間の感情や社会的相互作用を理解することに拡張されていることを強調している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:26:51 GMT)
LC4SV: A Denoising Framework Learning to Compensate for Unseen Speaker
Verification Models [41.2] 音声強調(SE)モジュールは、フロントエンド戦略として使用できる。
既存のSEメソッドは、SEモデルの予測信号のアーチファクトのため、下流のSVシステムにパフォーマンス改善をもたらすことができない。
本稿では,未知の下流SVモデルのプリプロセッサとして機能するLC4SVという汎用デノベーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:44:04 GMT)
Learning sources of variability from high-dimensional observational
studies [41.1] 因果推論は、変数の存在が観測結果に影響を及ぼすかどうかを研究する。
我々の研究は、任意の次元または可測空間を持つ結果に対する因果推定を一般化する。
本稿では,一貫した条件付き独立性テストを調整するための簡単な手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:59:49 GMT)
Embodied Multi-Modal Agent trained by an LLM from a Parallel TextWorld [41.0] 視覚言語モデル(VLM)は、静的な画像の特徴に合わせた大きな言語モデル(LLM)を統合する。
VLMは、具現化された視覚世界において訓練されていないため、その力学と整合することができない。
我々は、平行テキストの世界において優れたLDMエージェントを用いて、視覚の世界に住むVLMエージェントを訓練する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:53:56 GMT)
In Search of a Data Transformation That Accelerates Neural Field
Training [40.9] 画素位置の置換がSGDの収束速度にどのように影響するかに焦点をあてる。
対して、画素位置をランダムに変化させることで、トレーニングをかなり加速させることができる。
解析の結果、ランダムなピクセル置換は、初期最適化の妨げとなるが、信号の細部を捉えやすいパターンを取り除くことが示唆された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:17:49 GMT)
FELM: Benchmarking Factuality Evaluation of Large Language Models [40.8] 本稿では,Felmと呼ばれる大規模言語モデルのファクチュアリティ評価のためのベンチマークを紹介する。
我々は,大規模言語モデルから生成された応答を収集し,微粒な方法で事実ラベルを注釈付けする。
その結果,検索は事実性評価に役立つが,現在のLCMは事実の誤りを忠実に検出するには不十分であることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:06:53 GMT)
FeTrIL: Feature Translation for Exemplar-Free Class-Incremental Learning [40.7] 新しいクラスだけでなく過去の精度を高めるためには, 段階的プロセスの安定性と可塑性のバランスが必要である。
既存の非標準クラスインクリメンタルな手法は、モデルの連続的な微調整に焦点をあて、可塑性を優先するか、初期段階以降に固定された特徴抽出器を使用することに重点を置いている。
固定特徴抽出器と擬似特徴生成器を組み合わせて安定性・塑性バランスを改善する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:41:46 GMT)
A Survey of Graph Meets Large Language Model: Progress and Future
Directions [40.6] 大規模言語モデル(LLM)は、様々な領域で大きな成功を収めています。
LLMはグラフ関連タスクに活用され、従来のグラフニューラルネットワーク(GNN)ベースの手法を超越している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:32:05 GMT)
War and Peace (WarAgent): Large Language Model-based Multi-Agent
Simulation of World Wars [40.5] LLMを利用したマルチエージェントAIシステムである textbfWarAgent を提案する。
シミュレーションの有効性を評価することにより,最先端AIシステムの能力の進歩と限界を検討する。
我々の発見は、紛争解決と平和維持戦略にどのようにアプローチするかを再定義する、データ駆動およびAIによる洞察を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:59:49 GMT)
COLE: A Hierarchical Generation Framework for Graphic Design [40.1] 15世紀から進化してきたグラフィックデザインは、広告において重要な役割を担っている。
本稿では,これらの課題を包括的に解決するために設計された階層型生成フレームワークであるCOLEを紹介する。
COLEは、簡単な意図的なプロンプトを高品質なグラフィックデザインに変換すると同時に、ユーザ入力に基づいた柔軟な編集をサポートする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:22:17 GMT)
A Benchmark for Evaluating Machine Translation Metrics on Dialects
Without Standard Orthography [40.0] 非標準方言の指標がいかに堅牢かを評価する。
我々は、英語から2つのスイスドイツ語方言への自動機械翻訳のための、人間の翻訳と人間の判断のデータセットを収集する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:12:11 GMT)
Self-Discovering Interpretable Diffusion Latent Directions for
Responsible Text-to-Image Generation [39.6] 拡散モデルによるリスクは、バイアスや有害な画像などの不適切なコンテンツの潜在的な生成である。
これまでの研究は、拡散モデルの解釈可能な潜在空間におけるベクトルを意味論的概念として解釈する。
本稿では,ある概念に対する解釈可能な潜在方向を見つけるための,新たな自己教師型アプローチを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:40:45 GMT)
On the Calibration of Human Pose Estimation [39.2] Calibrated ConfidenceNet (CCNet)は、市販のポーズ推定フレームワークでAPを最大1.4%改善する軽量なポストホック追加である。
メッシュリカバリの下流タスクに適用されたCCNetは、3Dキーポイントエラーを1.0mm削減する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:31:09 GMT)
Towards End-to-End Embodied Decision Making via Multi-modal Large
Language Model: Explorations with GPT4-Vision and Beyond [38.9] 本研究では,最先端MLLMがエンド・ツー・エンド方式で具体的意思決定を処理できるかどうかを検討する。
以上の結果から, GPT4-Visionのような強力なMLLMは, 組込みエージェントの意思決定に有効であることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:23:14 GMT)
Post-hoc Interpretability for Neural NLP: A Survey [38.7] 解釈可能性(英: Interpretability)は、人間にとって理解しやすい言葉で説明を提供することである。
この調査は、最近のポストホック解釈可能性法がいかに人間に説明を伝えるかの分類を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:39:41 GMT)
Panacea: Panoramic and Controllable Video Generation for Autonomous
Driving [38.4] 運転シナリオにおいてパノラマおよび制御可能なビデオを生成する革新的な手法であるパナセアを提案する。
Panaceaは2つの重要な課題に対処する:「一貫性」と「保守性」
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:22:24 GMT)
Agent-Aware Training for Agent-Agnostic Action Advising in Deep
Reinforcement Learning [37.7] 深層強化学習(DRL)における非効率サンプリングの課題を軽減するため、専門家教員からの補助的指導を活用するための行動アドバイス
従来のエージェント特異的な行動アドバイス法はエージェント自体の不完全性によって妨げられ、エージェント非依存的なアプローチでは学習エージェントへの適応性が制限される。
本稿では,エージェント・アウェア・trAining yet Agent-Agnostic Action Advising (A7) という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:09:43 GMT)
The Falcon Series of Open Language Models [37.6] さまざまな高品質コーパスで訓練された因果デコーダのみのモデルとして,7B,40B,180Bというファルコンシリーズを紹介した。
最大のモデルであるFalcon-180Bは3.5兆個のテキストトークンで訓練されている。
Falcon-180B は PaLM や Chinchilla などのモデルよりも優れており、LLaMA 2 や Inflection-1 のような同時開発モデルでも改善されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:12:47 GMT)
On the Road with GPT-4V(ision): Early Explorations of Visual-Language
Model on Autonomous Driving [37.6] 本報告では,最新のVLMであるGPT-4Vの徹底的な評価を行う。
我々は、シーンを駆動し、決定を下し、最終的にはドライバーの能力で行動する、モデルを理解する能力について探求する。
GPT-4Vは,既存の自律システムと比較して,シーン理解や因果推論において優れた性能を示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:47:57 GMT)
Recognizing Conditional Causal Relationships about Emotions and Their
Corresponding Conditions [37.2] 入力された感情と原因のペアが、異なる文脈下で有効な因果関係を持つかどうかを判断する新しいタスクを提案する。
陰性サンプリングを用いて最終データセットを構築し、因果関係のない文書の数とバランスをとる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:47:25 GMT)
MultiGPrompt for Multi-Task Pre-Training and Prompting on Graphs [36.3] MultiGPromptは、グラフ表現学習のための新しいマルチタスク事前学習およびプロンプトフレームワークである。
本稿では,タスク固有の知識とグローバルな事前学習知識を活用するために,構成されたプロンプトとオープンプロンプトからなるデュアルプロンプト機構を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:36:53 GMT)
Self-training solutions for the ICCV 2023 GeoNet Challenge [36.1] 本ソリューションでは,Swin Transformerバックボーンを備えた2段階のソースフリードメイン適応フレームワークを用いて,米国からアジアドメインへの知識伝達を実現する。
提案手法は74.56%のHスコアを達成し,GeoUniDAチャレンジで1位となった。
GeoImNetとGeoPlacesの課題では、ソリューションはそれぞれ64.46%と51.23%というトップ3の精度に達した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:57:14 GMT)
People Make Better Edits: Measuring the Efficacy of LLM-Generated
Counterfactually Augmented Data for Harmful Language Detection [35.9] NLPモデルは、刺激的な特徴に対して堅牢であることは必須である。
過去の作業は、トレーニングデータ拡張を使用して、このような急激な機能に対処しようと試みてきた。
生成NLPモデルを用いて,このタスクが自動化可能かどうかを評価する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:23:48 GMT)
A-JEPA: Joint-Embedding Predictive Architecture Can Listen [35.3] 本稿では,音声スペクトルから自己教師付き学習を行うシンプルな拡張手法であるA-JEPAについて紹介する。
A-JEPAは、コンテキストエンコーダによるカリキュラムマスキング戦略で可視音声スペクトログラムパッチをエンコードし、よく設計された場所でサンプリングされた領域の表現を予測する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:15:50 GMT)
LLaFS: When Large-Language Models Meet Few-Shot Segmentation [35.3] 本稿では,LLaFSを提案する。LLaFSは,大規模言語モデル(LLM)を数発のセグメンテーションで活用するための最初の試みである。
LLLaFSは、LLMが獲得した膨大な事前知識を効果的なサプリメントとして利用し、LLMを使って画像を数ショットで分割する。
LLaFSは複数のデータセットで最先端の結果を達成し、数ショットのコンピュータビジョンタスクにLLMを使用する可能性を示している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:31:27 GMT)
Continuously Controllable Facial Expression Editing in Talking Face
Videos [34.8] 言語関連表現と感情関連表現はしばしば高結合である。
従来の画像から画像への変換手法は、我々のアプリケーションではうまく機能しない。
そこで本研究では,音声合成のための高品質な表情編集手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:31:04 GMT)
Riemannian Self-Attention Mechanism for SPD Networks [34.8] 本稿では,SPD多様体自己アテンション機構(SMSA)を提案する。
構造化表現の識別を改善するためにSMSAベースの幾何学習モジュール(SMSA-GL)を設計する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:34:46 GMT)
Unlocking Spatial Comprehension in Text-to-Image Diffusion Models [34.0] CompFuserは、テキストから画像への生成モデルにおける空間的理解と属性割り当てを強化する画像生成パイプラインである。
我々のパイプラインは、シーン内のオブジェクト間の空間的関係を定義する命令の解釈を可能にする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:02 GMT)
An exact mathematical description of computation with transient
spatiotemporal dynamics in a complex-valued neural network [33.7] 線形時間遅延相互作用を持つ複素数値ニューラルネットワーク(-NN)について検討する。
cv-NNは、部分的に同期したキメラ適応状態を含む洗練されたダイナミクスを表示する。
我々は,生体ニューロンによってcv-NN計算の計算が可能であることが実証された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:23:30 GMT)
Conditional Prompt Tuning for Multimodal Fusion [33.1] パラメータ効率のよいマルチモーダル融合において、あるモーダルの表現は、他のモーダルの促進を効果的に導くことができることを示す。
これは、バニラプロンプトベクトルを3種類の特殊プロンプトに切り離して、グローバルレベルとインスタンスレベルの機能を適応的にキャプチャすることで達成される。
本手法は,下流マルチモーダルタスクに対して,単調エンコーダにおける事前学習した知識を効果的に伝達することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:05:20 GMT)
The curse of language biases in remote sensing VQA: the role of spatial
attributes, language diversity, and the need for clear evaluation [32.7] RSVQAの目的は、リモートセンシング画像に関する自然言語で定式化された質問に答えることである。
言語バイアスの問題はしばしばリモートセンシングコミュニティで見過ごされている。
本研究の目的は,RSVQAにおける言語バイアスの問題を3重解析戦略を用いて強調することである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:45:15 GMT)
PyTorch Geometric High Order: A Unified Library for High Order Graph
Neural Network [32.5] PyTorch Geometric High Order (PyGHO)は、PyTorch (PyG)を拡張した高次グラフニューラルネットワーク(HOGNN)のためのライブラリである。
我々は、PyGHOの詳細な詳細を提示し、PyGHOで実装されたHOGNNと現実世界のタスクに関する公式実装を比較した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:34:48 GMT)
On robust overfitting: adversarial training induced distribution matters [32.5] 敵の訓練は、修正された損失関数を持つ標準的な訓練と見なすことができる。
しかし、その一般化誤差は標準損失下での標準訓練よりもはるかに大きいように見える。
この現象は頑丈なオーバーフィッティング(英語版)として知られ、研究の注目を集め、主に謎として残っている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:11:53 GMT)
Long Range Graph Benchmark [32.3] 単にワンホップメッセージパッシングに頼るMP-GNNは、既存のグラフベンチマークでよく使われる。
ベースラインのGNNとGraph Transformerネットワークの両方をベンチマークし、長距離依存をキャプチャするモデルがこれらのタスクにおいて著しく優れていることを検証した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:17:30 GMT)
UC-NeRF: Neural Radiance Field for Under-Calibrated multi-view cameras
in autonomous driving [32.0] UC-NeRFは、アンダーキャリブレーションされたマルチビューカメラシステムにおいて、新しいビュー合成に適した新しい方法である。
異なる画像領域における色の不整合を補正する階層ベースの色補正を提案する。
第2に,色補正と3次元回復のために,より視点が多様だが一貫したビューを生成する仮想ワープを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:47:59 GMT)
RichDreamer: A Generalizable Normal-Depth Diffusion Model for Detail
Richness in Text-to-3D [31.8] 我々は3次元生成のための一般化可能な正規-深度拡散モデルを学ぶ。
アルベド拡散モデルを導入し、アルベド成分にデータ駆動的制約を課す。
実験の結果,既存のテキスト・ツー・3Dパイプラインに組み込むと,モデルのリッチさが著しく向上することがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:22:33 GMT)
A Primer on Deep Learning for Causal Inference [31.4] このレビューは、潜在的な結果の枠組みの下で、ディープニューラルネットワークを用いた因果推論のための新たな文献を体系化する。
深層学習を用いて不均一な治療効果を推定・予測し、因果推論を非線形、時間変化、テキスト、ネットワーク、画像にエンコードされた設定にまで拡張する方法について、直感的な紹介を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:08:05 GMT)
StreamFlow: Streamlined Multi-Frame Optical Flow Estimation for Video
Sequences [31.2] 連続するフレーム間のオクルージョンは、長い間、光学的フロー推定において重要な課題を提起してきた。
本稿では,ビデオ入力に適したストリーム・イン・バッチ・マルチフレーム(SIM)パイプラインを提案する。
StreamFlowは、挑戦的なKITTIとSintelデータセットのパフォーマンスだけでなく、排他的領域でも特に改善されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:53:51 GMT)
MedGen: A Python Natural Language Processing Toolkit for Medical Text
Processing [30.9] MedGen(メドゲン)は、医学テキスト処理用に設計された総合自然言語処理(NLP)ツールキットである。
初めてMedGenは、質問応答、テキスト要約、テキスト単純化、機械翻訳の4つの高度な生成機能を含んでいる。
MedGenはテキストコーパス上でユーザフレンドリーなクエリと検索機能を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:13:29 GMT)
Diffusion 3D Features (Diff3F): Decorating Untextured Shapes with
Distilled Semantic Features [30.8] Diff3Fは、無テクスチャ入力のための堅牢でクラスに依存しない特徴記述子である。
追加のデータやトレーニングを必要とせずに、入力形状のセマンティックな特徴を生成します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:27:15 GMT)
Generative Social Choice [30.2] 本稿では,社会的選択理論の厳密さと大規模言語モデルによるテキスト生成と外挿選好の能力を組み合わせる枠組みである生成的社会的選択について紹介する。
本稿では,自由形式の文章として表現された意見を表す文のスレートを生成する問題に,この枠組みを適用した。
100人中93人が、抽出した5つの発言のスレートによって「ほとんど」あるいは「完璧」と感じていることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:31 GMT)
Training Chain-of-Thought via Latent-Variable Inference [30.2] 大規模言語モデル(LLM)は、チェーン・オブ・シンクレットのプロンプトを使って解答ステップを実行するように指示されたときに、より正確かつ解釈可能な問題を解決する。
CoTと教師付きチューニングを組み合わせるには、正しい回答だけでなく、それらの答えにつながる詳細な根拠の監督が必要である。
そこで本研究では,CoTプロンプトを用いて正しい回答を生成することで,電子対数類似度を最大化するための微調整戦略を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:47:32 GMT)
Building the Future of Responsible AI: A Reference Architecture for
Designing Large Language Model based Agents [30.1] 本稿では,基礎モデルに基づく自律エージェントのアーキテクチャ設計ガイダンスとして機能するパターン指向参照アーキテクチャを提案する。
2つの実世界のエージェントのアーキテクチャにマッピングすることで,提案する参照アーキテクチャの完全性と有用性を評価する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:03:23 GMT)
MANTIS at #SMM4H 2023: Leveraging Hybrid and Ensemble Models for
Detection of Social Anxiety Disorder on Reddit [29.9] 本稿では,ソーシャル・メディア・マイニング・フォー・ヘルス (Social Media Mining for Health) 2023 Shared Task 4: Binary classification of English Reddit post in self-reporting a social anxiety disorder diagnosisについて述べる。
本稿では,BiLSTMニューラルネットを併用した医療領域適応トランスフォーマを用いたハイブリッドモデルとアンサンブルモデルの有効性について検討・比較する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:33:41 GMT)
Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for
Character Animation [29.4] 拡散モデルは、その堅牢な生成能力のために、視覚世代研究の主流となっている。
本稿では,キャラクターアニメーションに適した新しいフレームワークを提案する。
トレーニングデータを拡張することにより、任意の文字をアニメーション化することが可能となり、他の画像とビデオの手法と比較して、文字アニメーションにおいて優れた結果が得られる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:27:15 GMT)
FedSOL: Stabilized Orthogonal Learning in Federated Learning [29.3] フェデレートラーニング(FL)は、個々のクライアントからローカルに訓練されたモデルを集約し、グローバルモデルを構築する。
FLはデータのプライバシを持つモデルを学ぶことができるが、クライアントデータの分散が不均一である場合、大きなパフォーマンス劣化に悩まされることが多い。
本稿では,グローバルアライメントの概念と局所的一般性を組み合わせたFedSoL(Federated Stability on Learning)を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:42:45 GMT)
FedSOL: Stabilized Orthogonal Learning in Federated Learning [29.3] フェデレートラーニング(FL)は、個々のクライアントからローカルに訓練されたモデルを集約し、グローバルモデルを構築する。
FLはデータのプライバシを持つモデルを学ぶことができるが、クライアントデータの分散が不均一である場合、大きなパフォーマンス劣化に悩まされることが多い。
本稿では,グローバルアライメントの概念と局所的一般性を組み合わせたFedSoL(Federated Stability on Learning)を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:42:45 GMT)
Goal-conditioned Offline Planning from Curious Exploration [29.0] 本研究では,教師なし探索技術の産物から目標条件付き行動を抽出することの課題について考察する。
従来の目標条件強化学習手法では,この困難なオフライン環境では,値関数とポリシの抽出が不十分であることがわかった。
そこで本研究では,学習した値のランドスケープに対するモデルベース計画と,グラフベースの値アグリゲーション手法を組み合わせることを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:48:18 GMT)
Federated Learning with Diffusion Models for Privacy-Sensitive Vision
Tasks [27.8] 拡散モデルは視覚に関連したタスク、特に画像生成において大きな可能性を持つ。
しかし、それらのトレーニングは一般的に、一般に公開されているソースから収集されたデータに依存して、集中的に行われる。
このアプローチは、データ収集に対するプライバシー上の懸念を伴う医療分野など、多くの領域で実現可能でも実用的でもないかもしれない。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:08:16 GMT)
Photo-SLAM: Real-time Simultaneous Localization and Photorealistic
Mapping for Monocular, Stereo, and RGB-D Cameras [27.5] Photo-SLAMは、ハイパープリミティブマップを備えた新しいSLAMフレームワークである。
そこで我々は,局所化のための明示的な幾何学的特徴を利用して,観測環境のテクスチャ情報を表現するために暗黙的な測光的特徴を学習する。
提案システムは,オンラインフォトリアリスティックマッピングのための最先端SLAMシステムよりも優れている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:19:00 GMT)
As-Plausible-As-Possible: Plausibility-Aware Mesh Deformation Using 2D
Diffusion Priors [27.4] 本稿では2次元拡散を利用したAs-Plausible-as-Possible(APAP)メッシュ変形手法を提案する。
我々のフレームワークは、メッシュの変形を表現するために、顔ごとのジャコビアンを用いており、メッシュ座標は微分可能なPoisson Solveによって計算される。
変形メッシュを描画し、得られた2D画像をスコア蒸留サンプリング(SDS)プロセスで使用することにより、事前訓練された2D拡散モデルから有意義な可視性を抽出することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:35:13 GMT)
Space-Time Diffusion Features for Zero-Shot Text-Driven Motion Transfer [27.3] 本稿では,対象オブジェクトとシーンを記述する入力テキストプロンプトに準拠する動画を合成する,テキスト駆動型モーショントランスファーの新しい手法を提案する。
我々は、事前に訓練された、固定されたテキスト-ビデオ拡散モデルを活用し、生成および動きの先行情報を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:03:27 GMT)
Does VLN Pretraining Work with Nonsensical or Irrelevant Instructions? [27.3] R2R 上の HAMT と VLN-BERT の下流性能には, 事前学習中の非意味的あるいは無関係な言語命令がほとんど影響しないことがわかった。
ダウンストリーム性能を向上する非意味な命令を生成する効率的な拡張手法であるUnigram + Objectを考案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 23:40:13 GMT)
Exo2EgoDVC: Dense Video Captioning of Egocentric Procedural Activities
Using Web Instructional Videos [27.2] 本稿では,高密度ビデオキャプションのクロスビュー知識伝達のための新しいベンチマークを提案する。
我々は、エゴセントリックな視点で見るWebインストラクショナルビデオのモデルを、エゴセントリックな視点に適応させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:51:13 GMT)
On Separate Normalization in Self-supervised Transformers [26.8] トークンと[]シンボルの正規化レイヤを分離した簡単な修正を提案する。
本手法は,両方のトークンに対して同一の正規化統計値を使用することによる潜在的な負の効果を軽減することを目的としている。
従来の正規化層を2つの別々の層に置き換える場合、平均2.7%の性能改善が観察される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:06:49 GMT)
Centre Stage: Centricity-based Audio-Visual Temporal Action Detection [26.4] 我々は,2つのモードを融合させるために,マルチスケールのクロスアテンションを用いて,オーディオモダリティを組み込む戦略を探求する。
本稿では,アクションセンタへのタイムステップの近さを推定する新しいネットワークヘッドを提案し,その中心性スコア(centity score)と呼ぶ。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:02:00 GMT)
Pre-training Language Models for Comparative Reasoning [26.2] 本稿では,テキストに対する比較推論能力を高めるための,事前学習型言語モデルのための新しいフレームワークを提案する。
本稿では,テキストに基づくエンティティ比較のためのスケーラブルなデータ収集手法を提案する。
本稿では,比較推論の新たな3つの目的を通じて,事前学習型言語モデルの枠組みを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:54:11 GMT)
StyLIP: Multi-Scale Style-Conditioned Prompt Learning for CLIP-based
Domain Generalization [26.1] StyLIPは、ドメイン間のCLIPの分類性能を高める、ドメインの一般化のための新しいアプローチである。
提案手法は,CLIPの事前学習された視覚エンコーダに埋め込まれた視覚的スタイルとコンテンツ情報を切り離すことを目的とした,ドメインに依存しないプロンプト学習戦略に焦点をあてる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:45:44 GMT)
DGNR: Density-Guided Neural Point Rendering of Large Driving Scenes [26.1] 本稿では,DGNR(Density-Guided Neural Rendering)と呼ばれるポイントベースの構築を支援するために,シーンから密度空間を学習する新しいフレームワークを提案する。
具体的には、学習された密度空間から得られる神経密度特徴から、微分可能な幾何学的画像を利用する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:25:55 GMT)
LEDITS++: Limitless Image Editing using Text-to-Image Models [25.8] LEDITS++は効率的で汎用的で正確なテキスト画像操作技術である。
数段の拡散ステップで高忠実度な結果が得られる。
複数の同時編集をサポートし、アーキテクチャに依存しない。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:45:35 GMT)
Value Approximation for Two-Player General-Sum Differential Games with
State Constraints [25.8] Hamilton-Jacobi-Isaacs (HJI) PDE を解くことで、2人のプレイヤー差分ゲームにおける平衡フィードバック制御が可能になるが、次元性(CoD)の呪いに直面している。
本研究では,(1)平衡実証とHJI PDEの両方を用いたハイブリッド学習法,(2)制約違反ペナルティのリプシッツ定数を増大させてHJIの列を解く値硬化法,(3)値が連続となる高次元補助状態空間に値を持ち上げるエピグラフィカル手法,の3つの可能性について検討する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:58:41 GMT)
Plug in the Safety Chip: Enforcing Constraints for LLM-driven Robot
Agents [25.6] 線形時間論理(LTL)に基づく問合せ型安全制約モジュールを提案する。
我々のシステムは、安全上の制約を厳格に遵守し、複雑な安全上の制約とうまく対応し、実用性の可能性を強調します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:08:29 GMT)
I-MedSAM: Implicit Medical Image Segmentation with Segment Anything [25.5] I-MedSAMは、連続表現とSegment Anything Model(SAM)の両方の利点を利用して、ドメイン横断能力と正確な境界線を求める。
Inlicit Neural Representation (INR) の効率的な学習のための不確実性誘導型サンプリング戦略を提案する。
トレーニング可能なパラメータが1.6Mしかない提案手法は、離散的および連続的な手法を含む既存の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:43:52 GMT)
A Survey of the Evolution of Language Model-Based Dialogue Systems [25.3] Task-oriented_dialogue_system (TOD) とopen-domain_dialogue_system (ODD) は大きな変換を経ている。
この調査は、対話システムの歴史的軌跡を掘り下げ、言語モデルの進歩と関係を解明するものである。
我々の調査は、LMのブレークスルーに沿った時系列的な視点を提供し、最先端の研究成果の包括的なレビューを提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:51:32 GMT)
Agents meet OKR: An Object and Key Results Driven Agent System with
Hierarchical Self-Collaboration and Self-Evaluation [25.3] OKR-Agentは、タスク解決におけるLarge Language Models(LLM)の機能を強化するように設計されている。
我々のフレームワークには、階層オブジェクトとキー結果の生成とマルチレベル評価という、2つの新しいモジュールが含まれています。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:16:30 GMT)
MM-NeRF: Multimodal-Guided 3D Multi-Style Transfer of Neural Radiance
Field [25.2] 3Dスタイルの転送は、特定のスタイルで3Dシーンのスタイリングされたビューを生成することを目的としている。
既存の手法は、テクスチャの詳細とマルチモーダルガイダンスによるスタイル化による高品質なスタイル化の課題を依然として抱えている。
MM-NeRFと呼ばれるNeRFのマルチモーダル誘導型3次元多次元転送を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:16:03 GMT)
Clean Label Disentangling for Medical Image Segmentation with Noisy
Labels [25.2] 医用画像のセグメンテーションに焦点を当てた現在の手法は、ノイズラベル問題として知られる誤ったアノテーションに悩まされている。
本稿では,クラス不均衡問題に対処するためのクラス不均衡サンプリング戦略を提案する。
クリーン・ラベル・ディエンタング・フレームワークを、新しいノイズの多い機能支援・クリーン・ラベル・ディエンタング・フレームワークに拡張します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:54:27 GMT)
Deep Planar Parallax for Monocular Depth Estimation [24.8] In-deepth Analysisでは、フロープレトレーニングを利用することで、連続するフレームモデリングのネットワークの利用を最適化できることが明らかにされている。
また,静的なシーン仮定に反する動的オブジェクトを扱うための平面位置埋め込みを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:07:46 GMT)
Graph Prompt Learning: A Comprehensive Survey and Beyond [24.6] 本稿では,AGI(Artificial General Intelligence)におけるグラフプロンプトの出現領域に関する先駆的な調査を紹介する。
本稿では,グラフ領域におけるプロンプトトークン,トークン構造,挿入パターンを明確にし,グラフプロンプト学習を理解するための統一的なフレームワークを提案する。
包括的な分類学では、この分野の100以上の著作を分類し、ノードレベル、エッジレベル、グラフレベルの目的にまたがる事前学習タスクと整合させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:36:59 GMT)
Scene Summarization: Clustering Scene Videos into Spatially Diverse
Frames [24.6] 本稿では,映像に基づくシーン理解タスクとして要約を提案する。
シーンの長いウォークスルーを、空間的に多様な小さなフレームにまとめることを目的としている。
私たちのソリューションは、SceneSumという名前の2段階の自己管理パイプラインです。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:18:26 GMT)
Evaluating Treatment Prioritization Rules via Rank-Weighted Average
Treatment Effects [24.3] 本稿では,治療優先化ルールの質を比較し,検証するための簡易かつ一般的な指標として,ランク重み付き平均治療効果指標を提案する。
RATEメトリクスは、優先順位付けルールの導出方法に非依存であり、治療から最も恩恵を受ける個人をどの程度正確に識別するかのみを評価する。
我々は脳卒中患者に対するアスピリンの最適標的を含む多くの応用の文脈でRATEを紹介した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:36:45 GMT)
CADTalk: An Algorithm and Benchmark for Semantic Commenting of CAD
Programs [23.7] 本稿では,CADプログラムのセマンティックコメント問題を紹介する。
目標は、入力プログラムを意味論的に意味のある形状の部分に対応するコードブロックに分割することである。
プログラム解析とビジュアル・セマンティック・アナリティクスを組み合わせることでこの問題を解決する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:27:48 GMT)
What If the TV Was Off? Examining Counterfactual Reasoning Abilities of
Multi-modal Language Models [23.4] 我々は,現代言語モデルの対実的推論能力をテストするために,新しいデータセットC-VQAを導入する。
このデータセットは、数値クエリや対語クエリなど、さまざまなタイプでオリジナルの質問を注入することで構築される。
このデータセットを用いた現代の視覚モデルの評価では、性能低下が顕著であり、いくつかのモデルでは40%まで低下している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:57:16 GMT)
What If the TV Was Off? Examining Counterfactual Reasoning Abilities of
Multi-modal Language Models [23.4] 我々は,現代言語モデルの対実的推論能力をテストするために,新しいデータセットC-VQAを導入する。
このデータセットは、数値クエリや対語クエリなど、さまざまなタイプでオリジナルの質問を注入することで構築される。
このデータセットを用いた現代の視覚モデルの評価では、性能低下が顕著であり、いくつかのモデルでは40%まで低下している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:57:16 GMT)
Utility Fairness in Contextual Dynamic Pricing with Demand Learning [23.3] 本稿では,ユーティリティフェアネス制約下でのパーソナライズされた価格設定のための新しいコンテキスト帯域幅アルゴリズムを提案する。
動的価格設定と需要学習を取り入れた当社のアプローチは,価格戦略における公正性の重要課題に対処する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:19:23 GMT)
The HR-Calculus: Enabling Information Processing with Quaternion Algebra [23.0] 四元数とその分割代数は三次元空間における回転/向きのモデル化において有利であることが証明されている。
四元数値信号に特化して設計された適応情報処理技術は、最近になって機械学習、信号処理、制御コミュニティの注目を集めている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:25:34 GMT)
Applications of Large Scale Foundation Models for Autonomous Driving [22.7] 大規模言語モデル(LLM)とチャットシステム、例えばチャットGPTやPaLMは、自然言語処理(NLP)において人工知能(AGI)を実現するための有望な方向性として急速に現れつつある。
本稿では、シミュレーション、世界モデル、データアノテーションと計画、E2Eソリューションなどに分類される、自動運転に応用された基礎モデルとLLMの技術について検討する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:42:02 GMT)
LegendreTron: Uprising Proper Multiclass Loss Learning [22.6] 損失関数は教師付き学習の基盤として機能し、しばしばモデル開発の前に選択される。
最近の研究は、損失とモデルを共同で引き起こそうとしている。
sc LegendreTron は,多クラス問題に対するアンフォプロペラの正準損失と確率を共同で学習する,新規かつ実用的な方法である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:36:53 GMT)
Towards Attributions of Input Variables in a Coalition [22.2] 我々は,各変数の帰属と連立帰属の対立を説明する新しい帰属法を開発する。
まず、Shapleyの値はAIモデルで符号化されたHarsanyi相互作用の割り当てとして再構成できる。
第2に、相互作用の再調整に基づいて、Shapleyの価値を連立の帰属にまで広げます。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:41:35 GMT)
Parallax-Tolerant Image Stitching with Epipolar Displacement Field [21.8] 本稿では, エピポーラ変位場に基づくワープ技術を確立するために, エピポーラ幾何学を利用する新しい手法を提案する。
縫合結果は、エピポーラ変位場に応じて画素を逆ワープすることで生成される。
この方法は、ワーピング則にエピポーラ制約を組み込んで、高品質なアライメントを確保し、パノラマの射影性を維持する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:44:01 GMT)
MAPSeg: Unified Unsupervised Domain Adaptation for Heterogeneous Medical
Image Segmentation Based on 3D Masked Autoencoding and Pseudo-Labeling [21.2] Masked Autoencoding and Pseudo-Labeling (MAPSeg) は医療画像セグメンテーションのための$textbfunified$ UDAフレームワークである。
MAPSegは、同等のパフォーマンスを維持しながら、$textbfcentralized$, $textbffederated$, $textbftest-time$ UDAに適用できる最初のフレームワークである。
我々は、MAPSegを、プライベート・幼児脳MRIデータセットとパブリック・心臓CT-MRIデータセットの最先端手法と比較し、MAPSegの成績の比較を行った。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:07:12 GMT)
Anonymous Jamming Detection in 5G with Bayesian Network Model Based
Inference Analysis [21.1] ジャミングと侵入検知は5G研究において重要であり、信頼性を維持し、ユーザエクスペリエンスの劣化を防止し、インフラの故障を避けることを目的としている。
本稿では,プロトコルスタックからの信号パラメータに基づく5Gの匿名ジャミング検出モデルを提案する。
このシステムは教師なし学習を用いて、未知の型を含むジャミングのリアルタイムかつ高精度な検出を行う。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:23:15 GMT)
DomainStudio: Fine-Tuning Diffusion Models for Domain-Driven Image
Generation using Limited Data [21.0] 本稿では,大規模ソースデータセット上で事前学習したDDPMを限定データを用いて対象ドメインに適応する新しいDomainStudioアプローチを提案する。
ソースドメインが提供する主題の多様性を維持し、ターゲットドメインに高品質で多様な適応型サンプルを取得するように設計されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:37:13 GMT)
Asynchronous Wireless Federated Learning with Probabilistic Client
Selection [20.9] Federated Learning(FL)は、クライアントがサーバによって調整された機械学習モデルを協調的にトレーニングする、有望な分散学習フレームワークである。
各クライアントはローカル更新を保持し、確率的にローカルモデルを送信する。
我々は,非確率収束問題をグローバルに最適に解くための反復アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:39:34 GMT)
Making Vision Transformers Truly Shift-Equivariant [20.6] ビジョントランスフォーマー (ViT) は、コンピュータビジョンのためのディープネットアーキテクチャの1つとなっている。
トークン化,自己アテンション,パッチマージ,位置エンコーディングなど,各モジュールに対する新しいデータ適応設計を導入する。
画像分類とセマンティックセグメンテーションタスクにおける適応モデルの評価を行った。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:47:52 GMT)
Efficient Multimodal Diffusion Models Using Joint Data Infilling with
Partially Shared U-Net [20.4] 部分共有U-Net (PS-U-Net) は、テキストと画像の入力を専用層を通過させ、モダリティ固有の細かな詳細を保存するためのスキップ接続を可能にする効率的なマルチモーダル拡散モデルである。
また,画像インパインティングに着想を得て,簡単な関節分布の学習を必要とせず,条件付き生成の新しいシナリオを導入する,効率的なマルチモーダルサンプリング手法を提案する。
我々はMS-COCOデータセットを実験的に探索し,既存のマルチモーダル拡散モデルと比較して高画質のマルチモーダルテキストと画像データを生成することを示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:34:44 GMT)
On the Effect of Defections in Federated Learning and How to Prevent
Them [20.3] フェデレートラーニング(Federated Learning)は、多数のエージェントが複数のラウンドで協力して単一のコンセンサスモデルを生成することができる、機械学習プロトコルである。
この研究は、そのような欠陥が最終モデルの堅牢性と一般化能力に与える影響を実証する。
本稿では,全てのエージェントに対して有効な解法を示すために,収束性を確保しつつ,欠陥の防止を理論的に保証する新しい最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:34:22 GMT)
The Sky's the Limit: Re-lightable Outdoor Scenes via a Sky-pixel
Constrained Illumination Prior and Outside-In Visibility [20.2] 制約のない画像コレクションからの屋外シーンの逆レンダリングは難しい課題である。
我々は、どんなスカイピクセルでも、遠方からの光を直接測定できるという事実を生かしている。
また、異なる空の可視性を計算するための新しいout-in'手法も導入する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:39:49 GMT)
Antenna Response Consistency Driven Self-supervised Learning for
WIFI-based Human Activity Recognition [19.8] 適切なアライメント基準を定義するソリューションとして textbfAntenna textbfResponse textbfConsistency (ARC) を導入する。
ARCは、実世界の雑音に堅牢性を導入しながら、入力空間からの意味情報を保持するように設計されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:59:02 GMT)
Material Palette: Extraction of Materials from a Single Image [19.4] 実世界の1つの画像から物理ベースレンダリング(PBR)素材を抽出する手法を提案する。
画像の領域を拡散モデルを用いて物質概念にマッピングし、シーン内の各材料に類似したテクスチャ画像のサンプリングを可能にする。
第二に、生成したテクスチャを空間変数BRDFに分解する別のネットワークの恩恵を受ける。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:58 GMT)
Graph Pre-training and Prompt Learning for Recommendation [19.0] GraphPLはパラメータ効率と動的グラフ事前学習と即時学習を組み合わせたフレームワークである。
本フレームワークは,時間的プロンプト機構とグラフ構造的プロンプト学習機構をシームレスに統合することにより,ユーザの好みを進化させる課題に対処する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:00:06 GMT)
Traffic Sign Interpretation in Real Road Scene [19.0] 本稿では,グローバルな意味的相互関連交通標識を自然言語に解釈することを目的とした交通標識解釈(TSI)タスクを提案する。
このデータセットは実際の道路シーンの画像で構成されており、道路や中国の都市部からドライバーの視点から捉えられている。
TSI-CNの実験は、TSIタスクが達成可能であり、TSIアーキテクチャは、シーンからのトラフィックサインをうまく解釈できることを示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:23:46 GMT)
Learning from Synthetic Human Group Activities [18.9] M3Actはマルチビュー・マルチパーソン・ヒューマン・アトミック・アクションとグループ・アクティビティのための合成データ・ジェネレータである。
Unityエンジンによって駆動されるM3Actは、複数のセマンティックグループ、非常に多様なフォトリアリスティックなイメージを備えている。
各種入力モダリティを用いた3つのコア実験におけるM3Actの利点を実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:45:11 GMT)
BIM: Block-Wise Self-Supervised Learning with Masked Image Modeling [18.9] Masked Image Modeling (MIM)は、画像パッチから貴重な洞察を抽出し、基盤となるディープニューラルネットワーク(DNN)の機能抽出能力を高めることを目的としている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:42:30 GMT)
A Combinatorial Approach to Robust PCA [18.7] 敵の汚職下でのガウスデータの回復問題について検討する。
ガウスノイズは未知の$k$-次元部分空間$U subseteq mathbbRd$と、各データポイントのランダムに選択された座標が敵の制御に該当すると仮定する。
我々の主な結果は、$ks2 = O(d)$のとき、期待して$tilde O(ks/d)$のほぼ最適エラーまですべてのデータポイントを復元する効率的なアルゴリズムです。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:49:51 GMT)
Replay across Experiments: A Natural Extension of Off-Policy RL [18.5] 複数の実験にまたがってリプレイを効果的に拡張するフレームワークを提案する。
コアとなるReplay Across Experiments (RaE)は、以前の実験からの経験を再利用して、探索とブートストラップ学習を改善する。
我々は、多数のRLアルゴリズムにまたがる利点を実証的に示し、移動と操作の両方にまたがる制御領域に挑戦する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:18:43 GMT)
STR-Cert: Robustness Certification for Deep Text Recognition on Deep
Learning Pipelines and Vision Transformers [18.5] Scene Text Recognition (STR) は複雑な画像に基づくシーケンス予測問題である。
本稿では,STRモデルの最初の認証手法であるSTR-Certを提案し,DeepPolyの多面体検証フレームワークを大幅に拡張した。
6つのデータセット上でSTRモデルを認証し比較し、ロバストネス認証の効率性とスケーラビリティを実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:53:08 GMT)
Identifiable Feature Learning for Spatial Data with Nonlinear ICA [18.5] 本稿では,高次元依存構造を持つデータに自然に適用する潜在成分を用いた新しい非線形ICAフレームワークを提案する。
特に、計算効率を誘導する前に、ディープニューラルネットワークミキシング関数とTPの組み合わせを扱うための変分法を拡張する新しい学習アルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:00:11 GMT)
Attentional Graph Neural Networks for Robust Massive Network
Localization [18.5] 我々は,古典的だが難解な非線形回帰問題であるネットワークローカライゼーションに対処するために,GNNとアテンション機構を用いる。
本稿では,重度非視線伝搬の存在下での異常な安定性と精度を実現するGNNベースのネットワークローカライズ手法を提案する。
制約に対処し、GNNモデルの適用性を現実のシナリオに拡張するために、拡張された柔軟性を提供する2つの注意グラフニューラルネットワーク(AGNN)を導入します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:05:13 GMT)
MobileCLIP: Fast Image-Text Models through Multi-Modal Reinforced
Training [18.4] 実行時のパフォーマンスに最適化された画像テキストモデルの新たなファミリであるMobileCLIPを紹介します。
MobileCLIPは、画像キャプションモデルと強力なCLIPエンコーダのアンサンブルからの知識伝達を使用して、効率的なモデルの精度を向上させる。
我々のアプローチは、強化データセットに付加的な知識を格納することで、列車時の計算オーバーヘッドを回避する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:55:42 GMT)
An Investigation of Time Reversal Symmetry in Reinforcement Learning [18.4] マルコフ決定過程(MDP)における時間反転対称性の概念を定式化する。
MDPにおける時間反転構造を利用することで、エージェントが経験したすべての環境遷移を、実現可能な逆時間遷移に変換することができる。
新たに合成したデータの有用性を検証するため,時間対称データ拡張(TSDA)と呼ばれる新しい手法を開発した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:02:06 GMT)
360Roam: Real-Time Indoor Roaming Using Geometry-Aware 360$^\circ$
Radiance Fields [18.3] 平滑で没入的なローミング体験を妨げつつ、スパルス360ドルの画像間の仮想ツアーが広く利用されている。
本稿では,局所放射場を適応的に割り当てた幾何認識放射場を用いた新しいアプローチを提案する。
本システムは、位置符号化とコンパクトニューラルネットワークを有効利用して、精度と速度を向上する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:45:07 GMT)
Revisiting LARS for Large Batch Training Generalization of Neural
Networks [18.2] LARSとLAMBは、AIのトレーニング安定性を確保するために、大規模バッチ学習において顕著なテクニックとして登場した。
ウォームアップを必要とせずに,初期段階における堅牢なトレーニングを容易にする,TVLARS (Time Varying LARS) と呼ばれる新しいアルゴリズムを提案する。
TVLARSはLARSとLAMBを一貫して上回り、分類シナリオでは最大2%改善している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:18:31 GMT)
Unified-modal Salient Object Detection via Adaptive Prompt Learning [18.1] 我々は、UniSODと呼ばれる統一フレームワークにおいて、シングルモーダルとマルチモーダルのSODに対処する最初の試みを行っている。
この目的のために、UniSODは適応的なプロンプト学習を通じてタスク固有のヒントでモダリティ認識プロンプトを学習する。
UniSODは、RGB、RGB-D、RGB-T SODの14のベンチマークデータセットで一貫したパフォーマンス改善を実現している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:51:08 GMT)
StyleCap: Automatic Speaking-Style Captioning from Speech Based on
Speech and Language Self-supervised Learning Models [17.9] StyleCapは、音声に現れる話し方の自然言語記述を生成する方法である。
StyleCapは、大きな言語モデル(LLM)ベースのテキストデコーダに入力されたプレフィックスベクトルを、音声表現ベクトルから予測するニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:49:17 GMT)
On the Impact of Sampling on Deep Sequential State Estimation [17.9] 逐次モデルにおける状態推定とパラメータ学習は近似手法を用いてうまく行うことができる。
モンテカルロの厳密な目的は、生成的モデリング性能を向上させるために文献で提案されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:59:49 GMT)
Contrastive encoder pre-training-based clustered federated learning for
heterogeneous data [17.6] フェデレートラーニング(FL)は、分散クライアントがデータのプライバシを保持しながら、グローバルモデルを協調的にトレーニングすることを可能にする。
本稿では,モデル収束とFLシステム全体の性能を改善するために,CP-CFL(Contrative Pre-training-based Clustered Federated Learning)を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:44:26 GMT)
AvatarGPT: All-in-One Framework for Motion Understanding, Planning,
Generation and Beyond [17.5] AvatarGPTは、モーション理解、計画、世代、およびモーション・イン・バイ・ザ・シンセシスのような他のタスクのためのオール・イン・ワン・フレームワークである。
すべてのタスクは、ユニバーサルインターフェースとして言語とシームレスに相互接続される。
実験により,AvatarGPTは低レベルタスクでSOTAを達成し,高レベルタスクで有望な結果が得られることが示された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:10:07 GMT)
A Unified Framework for Multimodal, Multi-Part Human Motion Synthesis [17.5] 我々は,マルチモーダル(テキスト,音楽,音声)とマルチパート(手,胴体)のヒューマンモーション生成を融合する,密着的でスケーラブルなアプローチを導入する。
本手法は,制御信号のモダリティに基づく特殊コードブックから,多モード動作生成課題をトークン予測タスクとして表現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:13:49 GMT)
SoUnD Framework: Analyzing (So)cial Representation in (Un)structured
(D)ata [17.4] 本研究では,非構造化データにおける人間の表現の分析を導くためのフレームワークを提案する。
このフレームワークをCommon Crawl Web text corpus (C4) と LAION-400M の2つのおもちゃの例に適用する。
また、データセットの使用、開発、ドキュメントのサービスにおける仮説的なアクションステップのセットを提案します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:48:00 GMT)
Rescuing referral failures during automated diagnosis of domain-shifted
medical images [17.3] 異なる人口層から取得した医療画像や、別の技術を用いて測定した場合、最先端の領域一般化アプローチでさえ、参照中に深刻な失敗を犯すことが示される。
我々は,これらの障害を解消し,大幅な性能向上を実現する,ロバストな一般化とポストホック参照アプローチの新たな組み合わせを評価する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:14:55 GMT)
BatteryML:An Open-source platform for Machine Learning on Battery
Degradation [16.4] BatteryML - データ前処理、機能抽出、そして従来のモデルと最先端モデルの両方の実装を統合するために設計された、ワンステップで全エンコンパス、オープンソースプラットフォームを提供する。
この合理化されたアプローチは、研究アプリケーションの実用性と効率を高めることを約束する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:32:55 GMT)
Robust Transductive Few-shot Learning via Joint Message Passing and
Prototype-based Soft-label Propagation [16.4] 少ないショットの学習は、いくつかのサポートサンプルを使用して新しいクラスに一般化できる学習モデルを開発することを目的としている。
トランスダクティブなFSLタスクでは、プロトタイプ学習とラベル伝搬が一般的である。
本稿では,これら2つの原則を統合し,効率的かつ堅牢なFSLアプローチを開発することを目的とする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:44:27 GMT)
MobileDiffusion: Subsecond Text-to-Image Generation on Mobile Devices [16.1] 我々は,高効率なテキスト・画像拡散モデルである textbfMobileDiffusion を提案する。
蒸留法と拡散GAN微調整法をMobileDiffusionに応用し, それぞれ8ステップと1ステップの推論を行った。
MobileDiffusionは、モバイルデバイス上で512times512$の画像を生成するために、驚くべきTextbfsub秒の推論速度を達成する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:14:41 GMT)
Towards Improving the Generation Quality of Autoregressive Slot VAEs [16.1] オブジェクト相関学習を強化する2つの改善を提案する。
まず、スロット間の高次相関をキャプチャするグローバルなシーンレベルの変数にスロットを条件付けする。
第2に、シーンオブジェクトの自動回帰生成に使用する一貫した順序を学習することを提案することにより、画像中のオブジェクトに対する標準順序の根本的な欠如に対処する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:01:54 GMT)
Enabling Fast 2-bit LLM on GPUs: Memory Alignment, Sparse Outlier, and
Asynchronous Dequantization [16.0] 大規模言語モデル(LLM)における2ビット量子化を用いた最先端手法
重みは群によって定量化されるが、重みの範囲はいくつかの群では大きいため、大きな量子化誤差と無視できない精度の損失をもたらす。
遅延化操作は50%以上の実行時間をもたらし、推論コストの削減を妨げます。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:44:59 GMT)
Unsupervised Multimodal Deepfake Detection Using Intra- and Cross-Modal
Inconsistencies [16.0] ディープフェイクビデオは、刑事司法、民主主義、個人の安全とプライバシーに悪影響を及ぼす可能性のある社会への脅威が増えていることを示している。
本稿では,内部および相互の整合性を測定することによって,ディープフェイク映像を非教師的に検出する手法を提案する。
提案手法は広範囲な実験により検証され,ディープフェイクビデオにおける重要な内的および横断的不整合の存在が実証された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:28:19 GMT)
Refining Decompiled C Code with Large Language Models [15.8] Cデコンパイラは、実行可能ファイルをソースコードに変換する。
一度再コンパイルされたC言語のソースコードは、元の実行ファイルと同じ機能を持つ実行ファイルを生成することが期待されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:09:54 GMT)
Geometry-Aware Adaptation for Pretrained Models [15.7] 本稿では、argmaxをFr'echet平均に置き換え、標準予測規則のドロップイン置換を提案する。
提案したアプローチであるLokiは、ImageNet上のSimCLRよりも29.7%向上しています。
そのような指標が得られない場合、Lokiはクラス埋め込みから自己派生メトリクスを使用でき、事前訓練されたゼロショットモデルの10.5%の改善が得られる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:35:51 GMT)
Toward Effective Secure Code Reviews: An Empirical Study of
Security-Related Coding Weaknesses [15.4] 我々は OpenSSL と PHP の2つの大規模オープンソースプロジェクトで実証的なケーススタディを行った。
135,560のコードレビューコメントに基づいて、40のコーディング弱点カテゴリのうち35に、レビュー担当者がセキュリティ上の懸念を提起していることが分かりました。
メモリエラーやリソース管理といった過去の脆弱性に関連するコーディングの弱点は、脆弱性よりも少ない頻度で議論された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:49:00 GMT)
Understanding the (Extra-)Ordinary: Validating Deep Model Decisions with
Prototypical Concept-based Explanations [14.9] 本稿では, 実例的(地域的)かつクラス的(グローバル的)な意思決定戦略をプロトタイプを通じて伝達する, ポストホックなコンセプトベースXAIフレームワークを提案する。
我々は,3つのデータセットにまたがるアウト・オブ・ディストリビューション・サンプル,突発的なモデル行動,データ品質問題同定におけるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:53:26 GMT)
Adversarial Doodles: Interpretable and Human-drawable Attacks Provide
Describable Insights [14.8] 本稿では, 解釈可能な形状を持つ逆ドゥードルを提案する。
我々は、人間が手動でそれらを複製しても、誤分類を引き起こすコンパクトな攻撃を得る。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:59:35 GMT)
GraSS: Contrastive Learning with Gradient Guided Sampling Strategy for
Remote Sensing Image Semantic Segmentation [14.8] RSIセマンティックセグメンテーションのためのGradient Guided Smpling Strategy (GraSS) を用いたコントラスト学習を提案する。
GraSSは2つのステージで構成されている。
GraSSは高分解能RSIセマンティックセグメンテーションにおけるSSCLの性能を効果的に向上させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:28:48 GMT)
Fantastic Generalization Measures are Nowhere to be Found [14.6] 本研究では,一様に密接な一般化の概念について検討し,人口減少との差が小さいことを示す。
ニューラルネットワークの一般化能力の潜在的な説明として、多くの一般化境界が文献で提案されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:47:56 GMT)
Fantastic Generalization Measures are Nowhere to be Found [14.6] 本研究では,一様に密接な一般化の概念について検討し,人口減少との差が小さいことを示す。
ニューラルネットワークの一般化能力の潜在的な説明として、多くの一般化境界が文献で提案されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:47:56 GMT)
PHG-Net: Persistent Homology Guided Medical Image Classification [14.5] 医用画像分類のためのトポロジ的特徴を探索する永続的ホモロジーガイド手法(PHG-Net)を提案する。
入力画像に対して、まずその3次永続図を計算し、トポロジ的特徴をベクトル表現に抽出する。
抽出したトポロジ的特徴は、特徴融合のためにCNNやTransformerによって生成された特徴マップに組み込まれる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:34:06 GMT)
Efficiently Explaining CSPs with Unsatisfiable Subset Optimization
(extended algorithms and examples) [14.2] 我々は,制約満足度問題の解法を段階的に説明する手法を最近提案した。
ここでは、コスト関数を用いて単純さを定量化する単純な推論ステップの列を説明する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:07:47 GMT)
THInImg: Cross-modal Steganography for Presenting Talking Heads in
Images [14.1] クロスモーダル・ステガノグラフィー(Cross-modal Steganography)は、公的に利用可能なカバー信号に秘密の信号を隠蔽する手法である。
人間の顔の特徴を活用して、識別画像内に長大な音声データを隠蔽するTHInImgを提案する。
THInImgは、最大80秒間の高品質なトーキーヘッドビデオ(音声を含む)を160x160解像度のアイデンティティ画像に表示することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:11:01 GMT)
LiveTune: Dynamic Parameter Tuning for Training Deep Neural Networks [14.1] トレーニング中のリアルタイムパラメータチューニングを可能にする新しいフレームワークであるLiveTuneを提案する。
Live Variablesは、システム上の指定されたポート上のパラメータを格納することで、継続的なトレーニングセッションを可能にする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 23:38:42 GMT)
Improving Lane Detection Generalization: A Novel Framework using HD Maps
for Boosting Diversity [14.0] レーン検出における単一ソース領域の一般化のための新しいフレームワークを提案する。
データをレーン構造や周囲に分解することで,HDマップと生成モデルを用いて多様性を向上させる。
実験により,本フレームワークは,領域適応法に匹敵する,車線検出の一般化性能を向上することを示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:15:27 GMT)
NeuroBack: Improving CDCL SAT Solving using Graph Neural Networks [14.0] 提案的満足度(SAT)は、計画、検証、セキュリティなど、多くの研究分野に影響を与えるNP完全問題である。
グラフニューラルネットワーク(GNN)を用いたCDCL SATソルバの高速化に向けた最近の研究
本稿では,(1)CDCL SATの解法に必要不可欠である変数の位相(すなわち値)を予測すること,(2)SATの解法開始前に1回だけニューラルネットワークに問い合わせること,の2つの知見に基づくNeuroBackという手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:05:18 GMT)
Eigenmatrix for unstructured sparse recovery [13.8] 例えば、有理近似、スペクトル関数推定、フーリエインバージョン、ラプラスインバージョン、スパースデコンボリューションなどがある。
主な課題は、サンプル値のノイズとサンプル位置の非構造性である。
本稿では、所望の近似固有値と固有ベクトルを持つデータ駆動構成である固有行列を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:54:29 GMT)
Dynamical Phase Transition due to Feedback-induced Skin Effect [13.6] オープン境界条件下での条件フィードバックを連続監視した自由フェルミオン系における多体ダイナミクスについて検討する。
エントロピーの対数的スケーリングから,時間的変化に伴う領域内スケーリングへの新たな動的位相遷移を見出した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:15:51 GMT)
Efficient Key-Based Adversarial Defense for ImageNet by Using
Pre-trained Model [13.6] エッジデバイスにキーベースのモデルをデプロイすることは、Apple CoreMLのような最新のモデルデプロイメントの進歩で実現可能である、と私たちは強調する。
そこで本研究では,事前学習モデルを活用し,効率的な微調整技術を用いて,限られた計算資源上でもキーベースモデルを増殖させる手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:40:16 GMT)
On the Role of Randomization in Adversarially Robust Classification [13.4] ランダムなアンサンブルは、敵のリスクに設定された仮説より優れていることを示す。
また、そのような決定論的分類器を含む決定論的仮説セットを明示的に記述する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:23:51 GMT)
Efficient In-Context Learning in Vision-Language Models for Egocentric
Videos [13.1] 本稿では,エゴセントリックなビデオのための大規模視覚言語モデル(VLM)において,コンテキスト内学習を取り入れた新しい学習手法を提案する。
$mathbbEILEV$は、モデルがビデオクリップとナレーションでインターリーブされたコンテキストを処理できるように、アーキテクチャおよびトレーニングデータアダプションを伴います。
我々の評価では、$mathbbEILEV$-trained モデルは、文脈内学習において、大量の自然主義的データに基づいて訓練されたより大きな VLM よりも優れていた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:53:06 GMT)
PCPT and ACPT: Copyright Protection and Traceability Scheme for DNN
Models [13.0] ディープニューラルネットワーク(DNN)は人工知能(AI)分野で大きな成功を収めている。
DNNモデルは、簡単に違法にコピーしたり、再配布したり、犯罪者に虐待されたりすることができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:22:32 GMT)
Kernelized Reinforcement Learning with Order Optimal Regret Bounds [13.0] $pi$KRVI は最小自明なヒルベルト二乗値の楽観的な修正である。
我々は、一般的な設定の下で、最初の順序最適後悔保証を証明します。
マタン核の場合、順序が最適である部分線型後悔境界を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:11:54 GMT)
A Unified Hardware-based Threat Detector for AI Accelerators [13.0] FPGAベースのAIアクセラレータを保護するために,UniGuardを設計する。
我々は、電力変動を捉え、教師付き機械学習モデルを訓練し、様々な種類の脅威を特定するために、タイム・トゥ・デジタル・コンバータを用いている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:55:02 GMT)
CLAP: Contrastive Learning with Augmented Prompts for Robustness on
Pretrained Vision-Language Models [12.8] 対照的な視覚言語モデル、例えばCLIPは、その例外的な一般化能力にかなりの注意を払っている。
既存の戦略は、画像エンコーダがこれらの例を"見る"ことによって、敵の例に対するレジリエンスを強化している。
テキスト拡張のみで頑健性を高める新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:00:59 GMT)
Advancing Attack-Resilient Scheduling of Integrated Energy Systems with
Demand Response via Deep Reinforcement Learning [12.8] 本稿では,IDR(Integrated demand response)対応IESのためのDRL(State-adversarial Deep reinforcement Learning)に基づく,革新的なモデルレスレジリエンススケジューリング手法を提案する。
提案手法は, RESと負荷による不確実性に適切に対処し, サイバー攻撃がスケジューリング戦略に与える影響を軽減し, 各種エネルギー源に対する安定した需要供給を確保することができることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 23:29:36 GMT)
Minimax Exploiter: A Data Efficient Approach for Competitive Self-Play [12.8] Minimax Exploiterは、敵の知識を活用するメインエージェントを利用するゲーム理論のアプローチである。
簡単なターンベースゲームやアーケード学習環境,現代的なビデオゲームであるFor Honorなど,さまざまな設定でアプローチを検証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:34:40 GMT)
TopoSemiSeg: Enforcing Topological Consistency for Semi-Supervised
Segmentation of Histopathology Images [12.6] ラベルのないデータからトポロジカル表現を学習する最初の半教師付き手法であるTopoSemiSegを提案する。
特に,教師と学生のネットワークが共有したトポロジ表現を学習するトポロジ対応型教師学生アプローチを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:04:35 GMT)
Quantum Money from Abelian Group Actions [12.6] 公開鍵量子マネーの構築と、量子ライティングと呼ばれる強化版も提供します。
本研究は,グループ行動の汎用群モデルにおいて,妥当な計算仮定の下でのセキュリティを実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:45:20 GMT)
GraphPrompt: Graph-Based Prompt Templates for Biomedical Synonym
Prediction [12.6] 我々は,70種類の概念と200万種類の概念-長期ペアを含む専門家計算データセットOBO-synを導入し,同義語予測手法の評価を行った。
グラフに応じてプロンプトテンプレートを生成するプロンプトベースの学習手法であるGraphPromptを提案する。
我々は,グラフベースのNLPタスクにグラフプロンプトとOBO-synデータセットを幅広く適用し,生物医学的データを多種多様な蓄積する基盤となることを想定する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:37:45 GMT)
DiffusionTalker: Personalization and Acceleration for Speech-Driven 3D
Face Diffuser [12.6] スピーチ駆動の3D顔アニメーションは、アカデミックや業界で魅力的なタスクだ。
近年のアプローチでは、音声駆動型3次元顔アニメーションの非決定論的事実を考察し、その課題に拡散モデルを適用している。
本研究では,DiffusionTalkerを提案する。DiffusionTalkerは,3次元顔アニメーションと知識蒸留を個人化して3次元アニメーション生成を高速化する,コントラスト学習を利用する拡散型手法である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:13:20 GMT)
Does Conceptual Representation Require Embodiment? Insights From Large
Language Models [12.5] ヒトとChatGPT(GPT-3.5およびGPT-4)の4,442の語彙概念の表現の比較
2) GPT-4 は GPT-3.5 よりも優れており,GPT-4 の利得は付加的な視覚学習と結びついており,触覚やイメージ容易性などの関連性にも寄与すると考えられる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:18:05 GMT)
Brain-ID: Learning Robust Feature Representations for Brain Imaging [12.3] 脳画像のための堅牢な特徴表現学習戦略であるBrain-IDを導入する。
脳IDはコントラスト非依存であり、取得した画像の外観に関わらず、各被験者の脳解剖に対して堅牢である。
我々は、Brain-ID機能の堅牢性を検証し、様々なダウンストリームアプリケーションでそれらの性能を評価する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:16:10 GMT)
netFound: Foundation Model for Network Security [12.1] 我々はネットワークセキュリティの基礎モデルであるnetFoundを開発した。
我々の実験は、既存の最先端MLベースのソリューションよりもnetFoundの方が優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:44:32 GMT)
Just ClozE! A Novel Framework for Evaluating the Factual Consistency
Faster in Abstractive Summarization [12.0] そこで我々はClozEと呼ばれるクローゼに基づく評価フレームワークを提案する。
これは、NLIレベルの推論の速度を維持しながら、QAから強い解釈可能性を引き継いでいる。
ClozEは、QAベースのメトリクスと比較して、評価時間を96%近く短縮できることを示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:38:19 GMT)
Understanding the robustness difference between stochastic gradient
descent and adaptive gradient methods [11.9] 勾配降下法(SGD)と適応勾配法はディープニューラルネットワークの訓練に広く用いられている。
これらの手法を用いて訓練したモデルの標準一般化性能の差は小さいが、SGDを用いて訓練したモデルは入力摂動下でははるかに頑健であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:37:39 GMT)
Mission-driven Exploration for Accelerated Deep Reinforcement Learning
with Temporal Logic Task Specifications [11.8] 未知の構造を持つ環境で動作している未知のダイナミクスを持つロボットについて考察する。
我々の目標は、オートマトン符号化されたタスクを満足する確率を最大化する制御ポリシーを合成することである。
そこで本研究では,制御ポリシーを類似手法と比較して顕著に高速に学習できるDRLアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:58 GMT)
Abusing Processor Exception for General Binary Instrumentation on Bare-metal Embedded Devices [11.5] PIFER (Practical Instrumenting Framework for Embedded fiRmware) は、組み込みベアメタルファームウェアに対して、汎用的できめ細かな静的バイナリーインスツルメンテーションを可能にする。
本稿では,修正後のファームウェアの正しい実行を保証するための命令翻訳方式を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:32:20 GMT)
OccamNet: A Fast Neural Model for Symbolic Regression at Scale [11.5] OccamNetは、データに適合する解釈可能でコンパクトでスパースなシンボルを見つけるニューラルネットワークモデルである。
本モデルでは,効率的なサンプリングと関数評価を行い,関数上の確率分布を定義する。
解析的および非解析的関数、暗黙的関数、単純な画像分類など、様々な問題に対する記号的適合を識別することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:35:32 GMT)
Marsellus: A Heterogeneous RISC-V AI-IoT End-Node SoC with 2-to-8b DNN
Acceleration and 30%-Boost Adaptive Body Biasing [11.3] Marsellusは、GlobalFoundries 22nm FDXで製造されたAI-IoTエンドノード用の全デジタル異種システムである。
2ビットの精度演算では180 Gop/sか3.32 Top/s/W、ハードウェアアクセラレーションされたDNN層では最大637 Gop/sか12.4 Top/s/Wに達する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:36:11 GMT)
Full-resolution MLPs Empower Medical Dense Prediction [11.2] 多層パーセプトロン(MLP)は、医療密度予測においてトランスフォーマーの優れた代替品である。
本フレームワークは,各種医療用高密度予測タスクの最先端性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:32:23 GMT)
Rate-Limited Quantum-to-Classical Optimal Transport in Finite and
Continuous-Variable Quantum Systems [11.2] 我々は、出力制約されたレート歪み符号化の観点から、レート制限された量子-古典的最適輸送を考える。
我々はクリッピングプロジェクションと量子化ブロックを用いて連続可変量子系の符号化フレームワークを開発する。
ガウス量子系に対しては、次数2の速度制限ワッサーシュタイン距離の解析解を導出する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 23:55:23 GMT)
MultiPlaneNeRF: Neural Radiance Field with Non-Trainable Representation [11.0] NeRFは2D画像から3Dオブジェクトを効率的に表現する人気モデルである。
上記の問題を同時に解くモデルとして,MultiPlaneNeRFを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:34:55 GMT)
Breaking Boundaries: Balancing Performance and Robustness in Deep
Wireless Traffic Forecasting [11.0] 正確性と堅牢性の間のトレードオフのバランスをとることは、時系列予測における長年の課題である。
本研究では,様々な摂動シナリオを考察し,実世界の通信データを用いた敵攻撃に対する防御機構を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:53:00 GMT)
Generative Data Augmentation Improves Scribble-supervised Semantic
Segmentation [11.0] セマンティックスクリブルに条件付き制御ネット拡散モデルを利用して高品質なトレーニングデータを生成する生成データ拡張手法を提案する。
我々のフレームワークは、完全に教師されたセグメンテーションを超越しても、小さなデータセットでのセグメンテーション性能を著しく改善することを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:44:33 GMT)
Hyper-Relational Knowledge Graph Neural Network for Next POI [10.9] 位置情報ベースのソーシャルネットワーク(LBSN)におけるPOIレコメンデーションシステムは,ユーザや企業に対して多くのメリットをもたらしている。
既存の多くの研究では、LBSNにおけるデータ空間の問題を軽減するためにKG(Knowledge Graph)を使用している。
本稿では,ハイパーリレーショナルな知識グラフニューラルネットワーク(HKGNN)モデルを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:55:00 GMT)
FP-Fed: Privacy-Preserving Federated Detection of Browser Fingerprinting [10.7] ブラウザの指紋認証は、Web上のユーザを追跡するサードパーティ製のクッキーの、魅力的な代替手段だ。
以前の研究では、その有病率と重症度を検出するためのいくつかの手法が提案されていた。
ブラウザ指紋検出のための最初の分散システムであるFP-Fedを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:43:17 GMT)
Two-dimensional Asymptotic Generalized Brillouin Zone Conjecture [10.7] 最小限の非自明なモデルを解くことにより、2次元ブリルアンゾーン(GBZ)理論に関する予想を提案する。
我々の予想の系は、任意の非エルミート的ハミルトニアンに対して、複素エネルギー平面上のその開境界スペクトルでカバーされる対応する領域は開境界幾何学とは独立であるべきだというものである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:13:37 GMT)
AdaFocus: Towards End-to-end Weakly Supervised Learning for Long-Video
Action Understanding [10.7] 本稿では,長時間動作理解タスクのための弱教師付きフレームワークを提案する。
AdaFocusは、アクションのスパイクアクション性と時間的位置を推定し、アクションクリップに適応的にフォーカスすることができる。
3つの長ビデオデータセットの実験は、その有効性を示している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:30:47 GMT)
Entity-Aspect-Opinion-Sentiment Quadruple Extraction for Fine-grained
Sentiment Analysis [10.5] 我々はEASQE(Entity-Aspect-Opinion-Sentiment Quadruple extract)と呼ばれる新しいタスクを提案する。
ABSAタスクにおける情報損失、非排他的アノテーション、意見誤解を避けるため、アスペクト用語を階層的にエンティティとアスペクトに分解することを目的としている。
我々はTrigger-Opinionの4つのデータセットとソースコードを公開し、この分野のさらなる研究を促進する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:50:00 GMT)
Improving Depth Gradient Continuity in Transformers: A Comparative Study
on Monocular Depth Estimation with CNN [10.3] 我々は、トランスフォーマーとCNNの区別を対照的に分析するために、スパースピクセルアプローチを採用している。
以上の結果から,トランスフォーマーはグローバルな文脈や複雑なテクスチャを扱うのに優れるが,CNNより遅れて奥行き勾配の連続性を保っていることが示唆された。
本稿では,高次微分,特徴融合,再校正による深度推定を改良したDGRモジュールを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:22:33 GMT)
Optimization Theory Based Deep Reinforcement Learning for Resource
Allocation in Ultra-Reliable Wireless Networked Control Systems [10.2] 本稿では,制御系と通信系の共同設計のための,新しい最適化理論に基づく深層強化学習(DRL)フレームワークを提案する。
通信システムのスケジュール性及びレート制約を満たすとともに、最小消費電力の目標とする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:49:29 GMT)
Spiking Neural Networks with Dynamic Time Steps for Vision Transformers [10.1] スパイキングニューラルネットワーク(SNN)は、複雑なタスクのための一般的な時間コンピューティングパラダイムのビジョンとして登場した。
トレーニング可能なスコアに応じて各ViTモジュールに時間ステップ数を動的に割り当てる新しいトレーニングフレームワークを提案する。
我々は、CIFAR10、CIFAR100、ImageNetなどの画像認識タスクにおいて、トレーニングフレームワークを評価し、その結果のSNNを異なるViTアーキテクチャで評価する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:30:43 GMT)
Outfit Completion via Conditional Set Transformation [10.1] 本稿では,この課題を集合検索タスクとして定式化し,その解決のための新しい枠組みを提案する。
この提案は、ディープニューラルネットワークを用いた条件セット変換アーキテクチャと、互換性に基づく正規化手法を含む。
実データを用いた実験結果から,提案手法は,服飾完了作業の精度,条件満足度,完了結果の整合性において,既存手法よりも優れていたことが明らかとなった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:30:52 GMT)
Generative Models: What do they know? Do they know things? Let's find
out! [9.8] 生成モデルが内部的に高品質なシーン固有写像を生成するという説得力のある証拠を提示する。
Intrinsic LoRAは、任意の生成モデルをシーン固有の予測子に変換する汎用的なプラグアンドプレイアプローチである。
提案手法では,鍵となる特徴写像のローランド適応(LoRA)を用い,生成モデルの総パラメータの0.6%未満を新たに学習した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:02 GMT)
FormalGeo: The First Step Toward Human-like IMO-level Geometric
Automated Reasoning [9.7] これは、私たちが過去3年間に達成した一連の研究の中で、初めての論文です。
我々は完全かつ互換性のある形式平面幾何学システムを構築した。
これは、IMOレベルの平面幾何学の課題と、可読性のあるAI自動推論の間に重要な橋渡しとなる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:00:35 GMT)
Communication Efficiency Optimization of Federated Learning for
Computing and Network Convergence of 6G Networks [9.7] フェデレーション学習は、参加するデバイスを横断してグローバルモデルをトレーニングすることによって、データプライバシなどの問題に効果的に対処する。
ネットワークトポロジやデバイスコンピューティング能力などの要因は、複雑なネットワーク環境におけるトレーニングや通信プロセスに影響を与える可能性がある。
計算可能、知覚可能、分散可能、分散可能、管理可能な新しいネットワークアーキテクチャは、フェデレートされた学習訓練を効果的にサポートすることができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:12:57 GMT)
Feedback RoI Features Improve Aerial Object Detection [9.6] 神経科学研究は、人間の視覚系が低レベルの知覚を導くために高レベルのフィードバック情報を利用することを示した。
本稿では、オブジェクト検出に類似したメカニズムを組み込むために、フィードバックマルチレベル機能エクストラクタ(Flex)を提案する。
Flexは、画像品質の変化と分類の不確実性に応じて、画像ワイドおよびインスタンスレベルのフィードバック情報に基づいて特徴選択を洗練する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:09:09 GMT)
The Claire French Dialogue Dataset [9.5] 本稿では,CFDDを構成する24個のコーパスについて述べる。
また、提案した完全なCFDDデータセットを8つのサブコーパスに分類し、最終データセットのフォーマットを標準化するためのプロセスを記述する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:55:22 GMT)
Active Open-Vocabulary Recognition: Let Intelligent Moving Mitigate CLIP
Limitations [9.4] オープン語彙認識のための新しいエージェントを提案する。
提案手法は,クラス固有の知識に頼ることなく,フレーム間の類似性や概念間の類似性を利用してエージェントの動きをナビゲートし,特徴を融合する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:24:07 GMT)
Text2Tree: Aligning Text Representation to the Label Tree Hierarchy for
Imbalanced Medical Classification [9.4] 本稿では、医療用テキストにおけるデータ課題を再考し、Text2Treeと呼ばれるフレームワークに依存しない新しいアルゴリズムを提案する。
ラベルのICDコードツリー構造をカスケードアテンションモジュールに組み込んで階層型ラベル表現を学習する。
異なるラベルのサンプルを再利用・識別することでテキスト分類を向上させるために,2つの新しい学習手法であるSimisity Surrogate Learning (SSL) とDissimilarity Mixup Learning (DML) が考案された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:02:08 GMT)
Filter-Pruning of Lightweight Face Detectors Using a Geometric Median
Criterion [9.3] 我々は,EXTD と EResFD という,すでに小型でコンパクトな2つの顔検出器にフィルタプルーニングを実装した。
提案手法は、既に軽量な顔検出器のモデルサイズをさらに小さくする可能性がある。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:02:38 GMT)
CapST: An Enhanced and Lightweight Model Attribution Approach for
Synthetic Videos [9.2] 本稿では、最近提案されたデータセット、DFDM(Deepfakes from Different Models)からのDeepfakeビデオのモデル属性問題について検討する。
データセットは、エンコーダ、デコーダ、中間層、入力解像度、圧縮比の5つの異なるモデルによって生成された6,450のDeepfakeビデオからなる。
ディープフェイク・ベンチマーク・データセット(DFDM)による実験結果から提案手法の有効性が示され、ディープフェイク・ビデオの正確な分類において最大4%の改善が達成された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:23:30 GMT)
ContextSeg: Sketch Semantic Segmentation by Querying the Context with
Attention [9.2] 本稿では、この問題を2段階に分けて扱うための、シンプルかつ高効率なアプローチであるContextSegについて述べる。
第1段階では、ストロークの形状と位置情報をよりよく符号化するために、オートエンコーダネットワークにおける余分な密度距離場を予測することを提案する。
第2段階では、全ストロークを単一のエンティティとして扱い、デフォルトのアテンション機構を備えた自動回帰変換器を用いて、同じ意味部分内でストロークのグループをラベル付けする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:53:55 GMT)
An HCAI Methodological Framework: Putting It Into Action to Enable
Human-Centered AI [9.1] 人間中心AI(HCAI)は、インテリジェントシステムの設計、開発、デプロイにおいて人間を優先することを提唱する。
HCAIの実装における方法論に関するガイダンスの欠如は、その採用を困難にしている。
本稿では,7つのコンポーネントを統合した総合的・学際的なHCAI方法論フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:11:51 GMT)
Shadows Don't Lie and Lines Can't Bend! Generative Models don't know
Projective Geometry...for now [9.0] 生成モデルは驚くほどリアルなイメージを作り出すことができる。
生成した画像の幾何学的特徴が実際の画像と異なることを示す。
次に, 幾何特性にのみ注目する分類器によって, 予め決められた画像が確実に識別可能であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:06 GMT)
Precision Enhancement in Spatial Measurement by Introducing Squeezed
Light into Weak Value Amplification [8.6] 高精度光空間測定を実験的に実現するために、WVA技術と圧縮ビーム注入を組み合わせるのはこれが初めてである。
マッハ・ツェンダー干渉計の真空入力ポートに圧縮ビームを加えることにより、500kHzで1.3倍の精度向上を実現することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:24:08 GMT)
Cross-level Attention with Overlapped Windows for Camouflaged Object
Detection [8.4] 本稿では,高次特徴によって導かれる低次特徴強調を実現するために,重なり合うウィンドウクロスレベルアテンション(OWinCA)を提案する。
3つの大規模カモフラージュオブジェクトデータセットを用いて行った実験は、OWinCANetが現在の最先端COD法を大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:18:42 GMT)
Interpreting Reward Models in RLHF-Tuned Language Models Using Sparse
Autoencoders [8.2] 大規模言語モデル(LLM)における暗黙報酬モデル(IRM)の解釈手法を提案する。
我々のアプローチは、ベースLSMとそのRLHF調整型からアクティベートされたオートエンコーダのペアを訓練する。
スパースオートエンコーダのIRM解釈への応用としてはこれが初めてである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:36:12 GMT)
Which Quantum Circuit Mutants Shall Be Used? An Empirical Evaluation of
Quantum Circuit Mutations [8.1] 実世界の382個の量子回路を変異させた700K以上の故障ベンチマーク(量子回路)を用いて,大規模な実験評価を行った。
この結果に基づいて、量子突然変異解析手法を体系的に定義する上で、研究者にとって貴重な知見を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:15:50 GMT)
HAtt-Flow: Hierarchical Attention-Flow Mechanism for Group Activity
Scene Graph Generation in Videos [8.1] Group Activity Scene Graph (GASG) の生成は、コンピュータビジョンにおいて難しい課題である。
我々は,JRDBデータセットを拡張したGASGデータセットを,textitAppearance, Interaction, position, Relationship, situation属性を含むニュアンスなアノテーションで導入する。
我々はまた,GASG性能を向上させるために,フローネットワーク理論に根ざした革新的アプローチである textbfHierarchical textbfAttention-textbfFlow (HAtt-Flow) 機構を導入する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:04:54 GMT)
Rethinking Directional Integration in Neural Radiance Fields [8.0] 数行のコード変更をNeRF変種に対して行うのと同じくらい簡単なNeRFレンダリング方程式の修正を導入する。
修正方程式は、学習された光線埋め込みによる光場レンダリングと解釈できることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:50 GMT)
FairShap: A Data Re-weighting Approach for Algorithmic Fairness based on
Shapley Values [8.0] 本稿では,公正なアルゴリズム決定のための新しいインスタンスレベルのデータ再重み付け手法であるFairShapを提案する。
異なる性質のいくつかの最先端データセットに対して、FairShapを実証的に検証する。
ベースラインと同等の精度で、より公平なモデルを生成する方法を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:41:59 GMT)
Thermalization without eigenstate thermalization [7.9] 孤立量子多体系におけるサブシステムの熱化について検討する。
この設定では、固有状態熱化仮説(ETH)が熱化を説明するために提案された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:58:55 GMT)
Evaluation of dynamic characteristics of power grid based on GNN and
application on knowledge graph [7.8] グラフニューラルネットワーク(GNN)を用いた電力網の故障検出手法を開発した。
このGNNベースのアプローチは、特殊な電気的特徴抽出モデルにより電力網内の故障ノードを特定する。
実験の結果、この手法は99.53%の精度でシミュレーションシナリオの障害ノードを正確に検出できることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:00:27 GMT)
"Do Users fall for Real Adversarial Phishing?" Investigating the Human response to Evasive Webpages [7.8] 最先端のソリューションでは、有名なブランドのWebページと視覚的に似ているかどうかをチェックすることによって、フィッシングサイトを検出する機械学習の適用が求められる。
一部のセキュリティ企業はフィッシング検知システム(PDS)にも導入し始めた。
本稿では、「商用MLベースのPSD」を回避する「総合的なフィッシングサイト」が「現実」の問題であるかどうかを精査する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:08:48 GMT)
Monitor Placement for Fault Localization in Deep Neural Network
Accelerators [7.8] 本稿では,シストリクスアレイ内のハードウェアモニタ配置を最適化する手法を提案する。
単一障害PEをローカライズするために、256$ systolic配列に対して0.33%のオーバヘッドしか発生しない。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:21:34 GMT)
Extending CAM-based XAI methods for Remote Sensing Imagery Segmentation [7.7] 我々は,モデルの不確実性を測定するために,「エントロピー」に基づく新しいXAI評価手法とメトリクスを導入する。
本研究では,Entropyを用いて,対象クラス内の画素のセグメンテーションにおけるモデル不確実性を監視することがより適切であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:36:58 GMT)
Matching Generalized-Bicycle Codes to Neutral Atoms for Low-Overhead
Fault-Tolerance [7.7] それらの特徴と基礎となるハードウェアとを慎重にマッチングすることにより、実際に使用できる量子LDPCコードを同定する。
我々は、原子配列における一般化自転車符号の性能を評価し、表面符号に匹敵する論理的誤り率を求める。
我々は、ベンチマークプログラムを標準、表面コードのみのアーキテクチャと最近提案された混合アーキテクチャで実装するコストを比較した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:31:08 GMT)
SAMv2: A Unified Framework for Learning Appearance, Semantic and
Cross-Modality Anatomical Embeddings [7.6] 我々は、外観、意味、および異質な解剖学的埋め込みを学習するための統一的なフレームワークSAMv2を提案する。
SAMv2は1ショットのランドマーク検出,経時的CTスキャンの病変追跡,CT-MRIアフィン/リグイド登録の3つのタスクで徹底的に評価した。
その結果,SAMv2はSAMや他の最先端手法よりも優れており,ランドマークに基づく医用画像解析タスクに対して,堅牢で多用途なアプローチが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:28:27 GMT)
SAMv2: A Unified Framework for Learning Appearance, Semantic and
Cross-Modality Anatomical Embeddings [7.6] 我々は、外観、意味、および異質な解剖学的埋め込みを学習するための統一的なフレームワークSAMv2を提案する。
SAMv2は1ショットのランドマーク検出,経時的CTスキャンの病変追跡,CT-MRIアフィン/リグイド登録の3つのタスクで徹底的に評価した。
その結果,SAMv2はSAMや他の最先端手法よりも優れており,ランドマークに基づく医用画像解析タスクに対して,堅牢で多用途なアプローチが可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:28:27 GMT)
Neural General Circulation Models [7.5] 一般的な循環モデル(GCM)は、気象と気候予測の基礎である。
本稿では,大気力学の微分可能解法とML成分を組み合わせた最初のGCMを提案する。
決定論的気象,アンサンブル気象,気候の予測を,機械学習や物理に基づく最良の手法と同等に生成できることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:29:19 GMT)
BakedAvatar: Baking Neural Fields for Real-Time Head Avatar Synthesis [7.5] リアルタイム神経頭アバターの新しい表現であるBakedAvatarを紹介した。
提案手法は,学習した頭部の異面から層状メッシュを抽出し,表現,ポーズ,ビューに依存した外観を計算する。
実験により,本表現は,他の最先端手法と同等品質の光実写結果を生成することを示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:31:46 GMT)
Optimal minimax rate of learning interaction kernels [7.3] 広帯域の交換可能な分布に対して最適な収束率を得るための最小二乗推定器(tLSE)を導入する。
以上の結果から, 大きな試料限界の逆問題が保たれた場合, 左テール確率はバイアス分散トレードオフを変化させないことがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:01:58 GMT)
"Reading Between the Heat": Co-Teaching Body Thermal Signatures for
Non-intrusive Stress Detection [7.3] ThermaStrainは、ウェアラブルのモダリティから接触のない熱のモダリティへの知識の伝達により、高いストレス予測性能を達成する新しいコトレーニングフレームワークである。
トレーニング中、ThermaStrainは、サーマルビデオからストレスを示す表現を生成するために、ウェアラブル・エレクトロミカル・アクティビティ(EDA)センサーを組み込んでいる。
試験では, 温度センサのみを使用し, 熱データから応力指示パターンを抽出し, EDA表現をエミュレートし, 応力評価を改善する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:36:11 GMT)
Investigating the Impact of Weight Sharing Decisions on Knowledge
Transfer in Continual Learning [7.3] 連続学習(CL)は、ニューラルネットワークのシーケンシャルトレーニングにおいて、カタストロフィックフォーッティング(CF)を避ける方法として注目されている。
本稿では,タスク間のフォワード・ナレッジ・トランスファー(FKT)に対して,異なる共有決定がどのような影響を及ぼすかを検討する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:31:06 GMT)
Robust Ocean Subgrid-Scale Parameterizations Using Fourier Neural
Operators [7.2] フーリエニューラル演算子に基づくパラメータ化を開発し、他の手法と比較して精度と一般化性を示す。
本稿では,周波数領域で動作するニューラルネットワークの可能性と限界について論じ,今後の研究への道を開く。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:54:13 GMT)
PEA-Diffusion: Parameter-Efficient Adapter with Knowledge Distillation
in non-English Text-to-Image Generation [7.1] 知識蒸留に基づくプラグアンドプレイ言語転送手法を提案する。
必要なのは、教師の知識蒸留の下で6Mパラメータしか持たない軽量なパラメータ効率アダプタ(PEA)を訓練することだけです。
UNetのパラメータの凍結は、言語固有のプロンプト評価セットにおいて、依然として顕著なパフォーマンスを達成できることに驚きます。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:31:52 GMT)
Exact Exponent for Atypicality of Random Quantum States [7.1] 両部量子系上の一様ランダム純粋状態から誘導されるランダム量子状態の特性について検討する。
我々は、州が平均から遠くないかもしれない大規模な偏差体制を調査する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:29:29 GMT)
Brain Diffusion for Visual Exploration: Cortical Discovery using Large
Scale Generative Models [6.9] 我々は,自然画像とfMRI記録を用いて,与えられた脳領域を活性化するために予測される画像を合成する,データ駆動型アプローチを提案する。
提案手法は,脳誘導画像合成と大規模拡散モデルを組み合わせた最近の生成法に基づいている。
これらの結果は、人間の視覚野の微細な機能的構造に対する理解を深めるものである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:59:46 GMT)
Automatic Recognition of Learning Resource Category in a Digital Library [6.9] 本稿では,文書画像分類のためのヘテロジニアス学習資源(HLR)データセットを提案する。
このアプローチでは、個々の学習リソースを構成文書イメージ(シート)に分解する。
これらの画像はOCRツールを通じて処理され、テキスト表現を抽出する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:48:18 GMT)
Zero-shot Referring Expression Comprehension via Structural Similarity
Between Images and Captions [6.8] ゼロショット参照表現理解は、提供されたテキストプロンプトに対応する画像内のバウンディングボックスをローカライズすることを目的としている。
既存の視覚言語アライメントモデル、例えばCLIPは両方の側面で苦労しているため、このタスクに直接使用することはできない。
我々は、大きな基礎モデルを活用して、画像とテキストの両方を(オブジェクト、述語、オブジェクト)の形式で三つ子に分解する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:55:37 GMT)
B-LSTM-MIONet: Bayesian LSTM-based Neural Operators for Learning the
Response of Complex Dynamical Systems to Length-Variant Multiple Input
Functions [6.8] マルチインプットディープニューラル演算子(MIONet)は、異なるバナッハ空間における複数の入力関数を可能にするためにDeepONetを拡張した。
MIONetは、出力位置の制約なしにデータセットグリッド間隔をトレーニングする柔軟性を提供する。
この作業はMIONetを再設計し、Long Short Term Memory(LSTM)を統合して、時間依存のデータからニューラル演算子を学ぶ。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:58:17 GMT)
Human Gaussian Splatting: Real-time Rendering of Animatable Avatars [6.6] この研究は、マルチビュービデオから得られたフォトリアリスティックな人体アバターのリアルタイムレンダリングの問題に対処する。
3次元ガウススプラッティングに基づく最初のアニマタブルな人体モデルを提案する。
本手法は, THuman4データセットの最先端技術よりもPSNR 1.5dbBが優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:05:41 GMT)
MIA-BAD: An Approach for Enhancing Membership Inference Attack and its
Mitigation with Federated Learning [6.5] メンバシップ推論攻撃(MIA)は、機械学習(ML)モデルのプライバシを妥協するための一般的なパラダイムである。
バッチ・ワイズ・アサート・データセット(MIA-BAD)を用いた強化されたメンバーシップ推論攻撃を提案する。
FLを用いたMLモデルのトレーニング方法を示すとともに,提案したMIA-BADアプローチによる脅威をFLアプローチで緩和する方法について検討する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:51:26 GMT)
High-efficiency single-photon source above the loss-tolerant threshold
for efficient linear optical quantum computing [6.5] 単光子純度0.9795(6)、光子不明瞭度0.9856、システム全体の効率0.712(18)を同時に示す。
このソースは、スケーラブルなフォトニック量子コンピューティングの効率しきい値に初めて到達した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:01:13 GMT)
Monocular Camera Localization for Automated Vehicles Using Image
Retrieval [6.3] 本研究では,1台のカメラを用いて,自動運転車の現在位置と方向角をリアルタイムで検出する問題に対処する。
リアルタイムにLiDARと高精細3Dマップを必要とする手法と比較して,提案手法はスケーラブルで計算効率がよい。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:58:28 GMT)
HiFA: High-fidelity Text-to-3D Generation with Advanced Diffusion
Guidance [6.3] 本研究は,高品質なテキスト・ツー・3D生成を実現するための全体的サンプリングと平滑化手法を提案する。
テキスト・画像拡散モデルの潜時空間と画像空間における復調スコアを計算する。
単一段最適化において高品質なレンダリングを生成するため,我々はNeRF線に沿ったz座標の分散の正則化を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:09:02 GMT)
Rethinking Mixup for Improving the Adversarial Transferability [6.3] 我々は、MIST(Mixing the Image but Separating the gradienT)と呼ばれる入力変換に基づく新たな攻撃を提案する。
MISTは、入力画像とランダムにシフトした画像とをランダムに混合し、混合画像毎に各損失項目の勾配を分離する。
ImageNetデータセットの実験では、MISTが既存のSOTA入力変換ベースの攻撃より優れていることが示されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:10:44 GMT)
General-Purpose vs. Domain-Adapted Large Language Models for Extraction
of Data from Thoracic Radiology Reports [6.3] ドメイン適応言語モデル(RadLing)と汎用大言語モデル(GPT-4)を用いたシステムの性能比較
RadLingは、文章の埋め込みを生成し、cosine-similarityを使ってCDEを識別するために使われた。
GPT-4システムはOpenAIの汎用埋め込みを使用して関連するCDEを識別し、GPT-4を使って値にマッピングした。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:34:40 GMT)
Wavelet-based Fourier Information Interaction with Frequency Diffusion
Adjustment for Underwater Image Restoration [6.2] 本稿では,周波数領域情報と拡散モデルの特徴をフル活用するWF-Diffを提案する。
WF-Diffは、ウェーブレットベースのフーリエ情報インタラクションネットワーク(WFI2-net)と周波数残差拡散調整モジュール(FRDAM)の2つの分離可能なネットワークで構成されている。
提案アルゴリズムは,実世界の水中画像データセット上でのSOTA性能を示し,視覚的品質の競争性能を実現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:58:32 GMT)
3D Teeth Reconstruction from Panoramic Radiographs using Neural Implicit
Functions [6.2] Occudentは神経暗黙機能を用いたパノラマX線写真からの3次元歯の再構築のための枠組みである。
合成画像を用いた最近の研究とは異なる、実際のパノラマラジオグラフィーを入力として訓練し、検証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:06:22 GMT)
Equilibrium in the Computing Continuum through Active Inference [5.8] 我々は,それぞれのエッジデバイスがサービスレベルオブジェクト(SLO)の実施方法の因果的理解を深めることを可能にする,協調的なエッジインテリジェンスのためのフレームワークを提案する。
ビデオストリーミングにおけるQuality of Service(QoS)とQuality of Experience(QoE)の確保にコンピュータ・コンティニュアム(CC)が責任を持つユースケースを評価する。
以上の結果から, エッジデバイスは4つのSLOを確保するために10回の訓練ラウンドしか必要とせず, さらに根底にある因果構造も合理的に説明可能であることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:19:54 GMT)
Cybercrime Bitcoin Revenue Estimations: Quantifying the Impact of Methodology and Coverage [5.7] サイバー犯罪ビットコインの収益を推定する最初の体系的な分析を行う。
広く信じられているのとは対照的に、収益は常に過小評価されているわけではない。
私たちは、初めて、(不足している)カバレッジが見積もりに与える影響を定量化します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:01:54 GMT)
E-ViLM: Efficient Video-Language Model via Masked Video Modeling with
Semantic Vector-Quantized Tokenizer [5.7] E-ViLMはビデオ言語コーパスから表現表現を学習し、広範なビデオ言語タスクにうまく一般化することができる。
我々のモデルはMSRVTTベンチマークで399.3ドル%トップ1ドル精度に達し、最先端の大規模VLアーキテクチャの精度の91.4ドル%を維持している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:57:17 GMT)
Quantum metrology in the noisy intermediate-scale quantum era [5.6] 量子気象学は、物理量に対する高精度の測定の物理的実現を追求している。
次世代の周波数標準、磁力計、レーダー、ナビゲーションの開発に応用できる可能性がある。
しかし、量子世界のユビキタスなデコヒーレンスは、量子資源を劣化させ、古典的な限界よりも精度を後退させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:57:28 GMT)
Identifying and Explaining Safety-critical Scenarios for Autonomous
Vehicles via Key Features [5.6] 本稿では,AVの安全でない動作を明らかにする能力に影響を及ぼすテストシナリオの重要な特徴を特定するために,ISA(インスタンス空間解析)を用いる。
ISAは、安全クリティカルなシナリオと通常の運転とを最も区別する機能を特定し、2Dのテストシナリオ結果(セーフ/アンセーフ)への影響を可視化する。
特定された機能の予測能力をテストするために、5つの機械学習分類器をトレーニングし、テストシナリオを安全または安全でないものとして分類する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:50:34 GMT)
Combating the "Sameness" in AI Art: Reflections on the Interactive AI
Installation Fencing Hallucination [5.5] この記事では、AI(Artificial Intelligence)アートにおける3つのタイプの「サミーネス」問題を要約する。
Fencing Hallucinationプロジェクトを通じて、同記事は、統一感を緩和するAIアート制作の設計を反映している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:00:34 GMT)
Unleashing the Potential of Spiking Neural Networks by Dynamic
Confidence [5.4] 本稿では、スパイキングニューラルネットワーク(SNN)における精度とレイテンシのトレードオフを緩和する新しい手法を提案する。
提案手法であるDynamic Confidenceは,SNNにいくつかの大きなメリットを提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:07:03 GMT)
Blockchain-based Zero Trust on the Edge [5.3] 本稿では,ブロックチェーンに拡張されたゼロトラストアーキテクチャ(ZTA)に基づく新たなアプローチを提案し,セキュリティをさらに強化する。
ブロックチェーンコンポーネントは、ユーザの要求を格納するための不変データベースとして機能し、潜在的に悪意のあるユーザアクティビティを分析して識別することで、信頼性を検証するために使用される。
スマートシティにおけるその実現可能性と適用性を検証するために,テストベッド上で実施したフレームワーク,アプローチのプロセス,実験について論じる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:43:21 GMT)
Pattern retrieval of traffic congestion using graph-based associations
of traffic domain-specific features [5.3] 本稿では,高速道路渋滞の交通パターンをコンテンツベースで検索するシステムを提案する。
検索結果を効果的に解釈するために,従来のコンポーネントに対するグラフベースのアプローチ(リレーショナルグラフ)を提案する。
後者のコンポーネントでは、ユーザの期待に応じて、混雑パターン間の類似性をカスタマイズできる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:33:22 GMT)
My3DGen: A Scalable Personalized 3D Generative Model [5.3] My3DGenは、最大50のトレーニングイメージを使用して、個人の前でパーソナライズされた3Dを生成する。
My3DGenは、新しいビューの合成、与えられた顔のセマンティックな編集、新しい外観の合成を可能にする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:45:17 GMT)
REF$^2$-NeRF: Reflection and Refraction aware Neural Radiance Field [5.3] 本稿では,ガラスケースを含むシーンのNeRFモデリング手法を提案する。
リフレクションとリフレクションは、視聴者の視点に依存して独立な要素を用いてモデル化される。
既存の手法と比較して,ガラス屈折率と全体像のより正確なモデリングが可能である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:14:22 GMT)
Edge AI for Internet of Energy: Challenges and Perspectives [5.3] The Digital landscape of the Internet of Energy (IoE) is on thebrink of a revolution transformation with the integration of edge Artificial Intelligence (AI)
この包括的なレビューは、エッジAIがIoEエコシステムを再構築する可能性と可能性を解明するものだ。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:01:56 GMT)
ReWaRD: Retinal Waves for Pre-Training Artificial Neural Networks
Mimicking Real Prenatal Development [5.2] 出生前および出生後網膜波は、霊長類の視覚系に対する事前学習機構であることが示唆されている。
我々は、異なる人工畳み込みニューラルネットワークを事前学習することで、この開発メカニズムを模倣する計算モデルを構築した。
この生物学的に妥当な事前学習の結果として生じる特徴は、霊長類の視覚系のV1特徴と密接に一致している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:14:05 GMT)
Radiology-Aware Model-Based Evaluation Metric for Report Generation [5.2] 提案手法は,放射線学領域に適応したCOMETアーキテクチャを用いて,機械による放射線学レポートの自動評価手法を提案する。
我々は、放射線学知識グラフであるRadGraphでトレーニングされた4つの医学的指向のモデルチェックポイントをトレーニングし、公開する。
以上の結果から,BERTscore,BLEU,CheXbertのスコアと中程度の相関が得られた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:08:26 GMT)
Observation of quantum nonlocality in Greenberger-Horne-Zeilinger
entanglement on a silicon chip [5.1] Greenberger-Horne-Zeilinger状態 (GHZ) は、量子物理学と局所現実論との激しい衝突を観測することができる。
4光子GHZ状態の生成と操作が可能な集積フォトニックチップ。
我々の研究は、複雑な集積量子デバイスで量子物理学の基礎的なテストを実行する方法である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:43:46 GMT)
Diffusion-EDFs: Bi-equivariant Denoising Generative Modeling on SE(3)
for Visual Robotic Manipulation [5.1] Diffusion-EDFsは、視覚ロボット操作タスクのための新しいSE(3)等価拡散に基づくアプローチである。
提案手法は,1時間以内で実効的なエンドツーエンドトレーニングを行うためには,5~10回の人間による実演を必要とせず,顕著なデータ効率を実現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:28:34 GMT)
Augmenting x-ray single particle imaging reconstruction with
self-supervised machine learning [5.1] 粒子配向を復元し、回折画像のみから相互空間強度を推定するエンド・ツー・エンドの自己教師型機械学習手法を提案する。
提案手法は,従来のアルゴリズムと比較して,再現性を大幅に向上した実験条件下での強靭性を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:05:44 GMT)
Penetration of Arbitrary Double Potential Barriers with Probability
Unity: Implications for Testing the Existence of a Minimum Length [5.1] 二重ポテンシャル障壁を越える量子トンネルの研究を行った。
任意の形状の大きな障壁が、単体確率の低い低エネルギー粒子によって侵入できることは、厳密に証明されている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:29:37 GMT)
Large Scale Masked Autoencoding for Reducing Label Requirements on SAR
Data [5.1] 本研究では,地球表面面積の8.7%をカバーするSAR振幅データに対して,自己教師付き事前学習方式,マスク付き自動符号化を適用した。
この事前学習方式を用いることで、下流タスクのラベル付け要求を1桁以上削減できることを示す。
本研究は,タスクモデルと地域固有のSARモデルの開発を促進することにより,気候変動の緩和を著しく促進する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:13:40 GMT)
Drivers of social influence in the Twitter migration to Mastodon [4.7] Elon Muskの買収後のTwitterユーザからMastodonへのマイグレーションは、集合行動を研究するユニークな機会である。
移行した約75,000人の利用者のソーシャルネットワークと公開会話を分析した。
移動の時間的痕跡は、社会的影響の現象と相容れないことが判明した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:08:33 GMT)
LiveNVS: Neural View Synthesis on Live RGB-D Streams [4.7] 本稿では,ライブRGB-D入力ストリーム上でニューラルノベルビューを合成するシステムLiveNVSを提案する。
LiveNVSは、キャプチャ中に未知のシーンの最先端のニューラルネットワークレンダリング品質を達成する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:29:39 GMT)
On the Performance of Multimodal Language Models [4.7] 本研究は、異なるマルチモーダル命令チューニングアプローチの比較分析を行う。
大規模言語モデルにマルチモーダル機能を組み込む際に,アーキテクチャ選択を導く上で重要な洞察を明らかにする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:50:54 GMT)
A personalized Uncertainty Quantification framework for patient survival
models: estimating individual uncertainty of patients with metastatic brain
tumors in the absence of ground truth [4.7] 脳転移に対する定位放射線治療を施行した1383例を対象に,本手法を考案し,評価した。
以上の結果から,全てのモデルにおいてICPが最低不確実性(2.21%),ICPDが最低不確実性(17.28%)を示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:07:30 GMT)
Understanding the Process of Data Labeling in Cybersecurity [4.6] サイバー脅威検出では、高品質なデータを得るのは難しい。
機械学習の特定の応用には、そのようなデータは人間のオペレーターによってラベル付けされなければならない。
データラベリングの文脈において,学術研究とセキュリティ実践の橋渡しを行う。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:20:07 GMT)
Point'n Move: Interactive Scene Object Manipulation on Gaussian
Splatting Radiance Fields [4.6] Point'n Moveは、露光領域のインペイントによるインタラクティブなシーンオブジェクト操作を実現する方法である。
我々はシーン表現としてガウス・スプレイティング・ラディアンス・フィールドを採用し、その明示的な性質と速度の優位性を完全に活用する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:33:49 GMT)
Rethinking Intermediate Layers design in Knowledge Distillation for
Kidney and Liver Tumor Segmentation [4.6] 医用イメージングタスクのための階層型層選択型フィードバック蒸留(HLFD)を提案する。
HLFDは、中間層から以前の層への知識を戦略的に蒸留し、最終層の知識を特徴レベルと画素レベルの中間層に伝達する。
腎臓セグメンテーションタスクでは、HLFDは学生モデル(KDなし)を10pp以上上回り、腫瘍特異的な特徴への焦点を著しく改善する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:22:08 GMT)
Imputation using training labels and classification via label imputation [4.5] ラベルをインプットに積み重ねることで,インプットのインプットが大幅に向上することを示す。
また、予測されたテストラベルを欠落値で初期化し、インプットでラベルを積み重ねる分類戦略を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:26:09 GMT)
FedECA: A Federated External Control Arm Method for Causal Inference
with Time-To-Event Data in Distributed Settings [4.3] 外部制御アーム(ECA)は、実験薬の早期臨床開発を知らせ、非ランダム化環境での規制承認の有効な証拠を提供することができる。
ECAを実装する主な課題は、現実世界のデータや歴史的な臨床試験にアクセスすることである。
私たちは、FL(Federated Learning)と呼ばれるプライバシー強化技術を活用して、データ共有の障壁を取り除きます。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:35:38 GMT)
Quality-diversity in dissimilarity spaces [4.2] 一般の異種性空間における品質多様性アルゴリズムを定式化するために、等級理論を適用する。
特に、Go-Exploreの非常に一般的なバージョンをインスタンス化し、デモします。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:56:51 GMT)
Towards Optimizing with Large Language Models [4.2] 各種タスクやデータサイズにまたがるLLMの最適化能力の評価を行う。
様々な視点からタスクパフォーマンスの総合評価を行うために,3つの異なる指標を紹介した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:38:03 GMT)
Reduced-order modeling for parameterized PDEs via implicit neural
representations [4.1] 我々は、パラメータ化偏微分方程式(PDE)を効率的に解くために、新しいデータ駆動型低次モデリング手法を提案する。
提案フレームワークは、PDEを符号化し、パラメトリゼーションニューラルネットワーク(PNODE)を用いて、複数のPDEパラメータを特徴とする潜時ダイナミクスを学習する。
我々は,提案手法を大規模なレイノルズ数で評価し,O(103)の高速化と,基底真理値に対する1%の誤差を得る。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:35:06 GMT)
Machine learning force-field models for metallic spin glass [4.1] 金属スピングラスの動的シミュレーションのためのスケーラブルな機械学習フレームワークを提案する。
Behler-Parrinello型ニューラルネットワークモデルを開発し、電子誘起局所磁場を高精度かつ効率的に予測する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:12:03 GMT)
Robust Diffusion GAN using Semi-Unbalanced Optimal Transport [4.1] 本研究は, 半不均衡な最適輸送に基づくロバストなトレーニング手法を導入し, 降圧器の影響を効果的に緩和する。
我々は, 画像品質, 分布のモードカバレッジ, 推論速度といった, 前述の生成的モデリング基準において, バニラDDGANよりも頑健な拡散GAN(RDGAN)が優れていることを実証した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:05:04 GMT)
"Medium-n studies" in computing education conferences [4.1] 我々は、コンピュータサイエンス教育研究者が直面する異なる環境で、いつ、いつ、いつ、p値を計算するべきかについての考察を概説する。
本稿では,要約データを提示し,レビュアーガイドラインに関する予備的な観察を行う。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:32:13 GMT)
Performance Analysis of Fixed Broadband Wireless Access in mmWave Band
in 5G [4.0] 本研究は、5G帯のミリ波帯における固定ブロードバンド無線アクセスの伝送データについて検討する。
本稿では,リアルタイム学習と伝送特性の分類のためのオンライン機械学習アプローチを提案する。
本研究は,送信データから送信角度と距離を直接高精度に検出できることを実証するものである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:38:38 GMT)
Understanding Practices around Computational News Discovery Tools in the
Domain of Science Journalism [3.7] 我々は,これらのジャーナリストのニュース発見を支援する計算手法について,時間効率とエージェンシーの観点から検討する。
我々は、3つの計算情報助成金のプロトタイプを、そのようなツールがいかに有用性を提供するかをよりよく理解するために、プローブとして使用したインタラクティブツールに組み込んだ。
本研究は, 計算ニュース発見ツールに関する社会工学的システムについて, より豊かな視点を提供し, 科学ジャーナリストの実践を支援するために, そうしたツールを改良する方法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:47:49 GMT)
Sluggish and Chemically-Biased Interstitial Diffusion in Concentrated
Solid Solution Alloys: Mechanisms and Methods [3.5] 間質拡散は非平衡条件下での材料の相安定性と照射応答を制御している。
機械学習(ML)と速度論的モンテカルロ(kMC)を組み合わせたFe-Ni系固溶体合金(CSAs)のスラグおよび化学バイアスによる間質拡散の研究
Fe-Ni合金のスラグ拡散と"Ni-Ni"-バイアス拡散は独特な"バリアロック"機構と説明されるのに対し、"Fe-Fe-Fe"-バイアス拡散は"コンポーネントドミナンス"機構の影響を受けている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:16:06 GMT)
Beyond Visual Cues: Synchronously Exploring Target-Centric Semantics for
Vision-Language Tracking [3.5] 単一のオブジェクトトラッキングは、最初の状態から、ビデオシーケンス内の特定のターゲットを見つけることを目的としている。ビジョンランゲージ(VL)トラッキングは、有望なアプローチとして登場した。
本稿では,VL追跡のためのターゲット中心のセマンティクスを徐々に探求する新しいトラッカーを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:28:12 GMT)
\texttt{GlycoNMR}: Dataset and benchmarks for NMR chemical shift
prediction of carbohydrates with graph neural networks [3.5] 分子表現学習(MRL)は、機械学習と化学科学のギャップを埋めるための強力なツールである。
MRLはタンパク質と一般的な生体分子のデータセットで大きな成功を収めた。
グリコNMRには、2,609の炭水化物構造と211,543のアノテート核磁気共鳴(NMR)化学シフトがある。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:51:19 GMT)
A Direct Lazy Sampling Proof Technique in Probabilistic Relational Hoare Logic [3.2] ランダムオラクルモデル(ROM)における共通要件である2つの遅延プログラム間の不一致性に着目した。
本稿では,不明瞭性を直接証明するHoare Logic (pRHL) を仮定する新しい手法を提案する。
また、この手法をEasyCryptの証明器で実装し、従来の方法に代わる便利な方法であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:58:12 GMT)
Super-Resolution through StyleGAN Regularized Latent Search: A
Realism-Fidelity Trade-off [3.2] 本稿では,高分解能(HR)画像を低分解能(LR)画像から構築する問題に対処する。
最近の教師なしアプローチでは、HR画像上で事前訓練されたStyleGANの潜伏空間を探索し、入力LR画像に最もダウンスケールした画像を求める。
我々は、潜在空間における探索を制約する新しい正規化器を導入し、逆符号が元の画像多様体に存在することを保証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:27:24 GMT)
Enhanced Synthetic MRI Generation from CT Scans Using CycleGAN with
Feature Extraction [3.2] 合成MRI画像を用いたCTスキャンによるモノモーダル登録の高速化手法を提案する。
提案手法は有望な結果を示し,いくつかの最先端手法より優れていた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:29:18 GMT)
Gaussian Processes for Monitoring Air-Quality in Kampala [3.2] 本研究では,センサが存在しない場所での現在の大気汚染を予測し,センサ位置で将来の大気汚染を予測するためのガウス過程の活用について検討する。
私たちは、AirQoのセンサーネットワークのデータを使って、ウガンダのカンパラ市に焦点を当てています。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:25:23 GMT)
No Transfers Required: Integrating Last Mile with Public Transit Using
Opti-Mile [3.1] 我々は、ラストマイルサービスと公共交通機関を組み合わせた新しい旅行計画手法「オプティマイル」を提案し、転送は不要である。
従来の最短経路に比べて18%の値上げで、オプティマイル走行が10%距離移動の減少につながることが実証された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:26:35 GMT)
Counter-terrorism in cyber-physical spaces: Best practices and
technologies from the state of the art [3.1] 近年のテロ攻撃のエスカレートに伴い、物理的な空間や都市部の保護と安全の需要が高まっている。
提案されているサイバー物理システムとスペースは、実際によりスマートな都市オブジェクトになり、積極的に警告を提供し、あらゆる脅威に対して保護される都市である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:06:30 GMT)
Enhancing Human Persuasion With Large Language Models [3.1] 大規模言語モデル(LLM)が人的コミュニケーションに与える影響について検討する。
消費者金融保護局が収集した780K以上の苦情に対して、AI検出ツールを使用します。
また,ChatGPTの公開直後の苦情の書面にLCMが用いられている証拠が発見された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:07:34 GMT)
DeepDecipher: Accessing and Investigating Neuron Activation in Large
Language Models [3.0] DeepDecipherは、トランスフォーマーモデルのレイヤでニューロンを探索するためのAPIとインターフェースである。
本稿ではDeepDecipherの設計と機能について概説する。
我々は、ニューロンを分析し、モデルを比較し、モデル行動に関する洞察を得る方法を実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:26:33 GMT)
Empowering COVID-19 Detection: Optimizing Performance Through Fine-Tuned
EfficientNet Deep Learning Architecture [2.9] 新型コロナウイルス(COVID-19)は、感染を抑えるために早期かつ正確に検出する必要がある、非常に伝染性の呼吸器疾患である。
専門家は放射線画像、特に胸部X線を診断プロトコルの貴重なアプローチとして用いている。
本研究では, 深層学習アルゴリズムを用いたX線画像(X線)を用いた新型コロナウイルス患者を迅速かつ正確に同定する可能性について検討した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:18:30 GMT)
(Ir)rationality in AI: State of the Art, Research Challenges and Open
Questions [2.9] 合理性の概念は人工知能の分野の中心である。
有理エージェントを構成するものの統一的な定義は存在しない。
特定のシナリオで最適であることを示す不合理な行動を考える。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:01:09 GMT)
Neural Texture Puppeteer: A Framework for Neural Geometry and Texture
Rendering of Articulated Shapes, Enabling Re-Identification at Interactive
Speed [2.9] 我々はニューラルテクスチュア Puppeteer と呼ぶテクスチャ化された形状のためのニューラルレンダリングパイプラインを提案する。
テクスチャオートエンコーダは、この情報を利用して、テクスチャ化された画像をグローバルな潜在コードにエンコードする。
本手法は,データに制限がある絶滅危惧種に適用できる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:51:05 GMT)
MultiModal-Learning for Predicting Molecular Properties: A Framework
Based on Image and Graph Structures [2.8] MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:28:35 GMT)
Towards Discriminative Representation with Meta-learning for
Colonoscopic Polyp Re-Identification [2.8] 大腸内視鏡によるポリープ再同定は、大きなギャラリーの同じポリープと異なるカメラで撮影された異なるビューの画像とを一致させることを目的としている。
ImageNetデータセットでトレーニングされたCNNモデルを直接適用する従来のオブジェクトReIDの手法は、不満足な検索性能をもたらす。
我々は、モデルがより一般的で差別的な知識を学習するのに役立つ、Colo-ReIDという、シンプルで効果的なトレーニング手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:57:12 GMT)
Programmable high-dimensional Hamiltonian in a photonic waveguide array [2.8] 本稿では、ハミルトニアン項を電気光学的に調整し、ハミルトニアン項の連続時間進化を1つのデバイスに実装できるプログラマブル導波路アレイを提案する。
アーキテクチャのマイクロスケール局所電場は、導波路結合係数と有効指標を独立に制御する。
我々のプラットフォームは、単一のデバイスで複数の凝縮物質量子力学の研究を可能にする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:29:16 GMT)
Programmable high-dimensional Hamiltonian in a photonic waveguide array [2.8] 本稿では、ハミルトニアン項を電気光学的に調整し、ハミルトニアン項の連続時間進化を1つのデバイスに実装できるプログラマブル導波路アレイを提案する。
アーキテクチャのマイクロスケール局所電場は、導波路結合係数と有効指標を独立に制御する。
我々のプラットフォームは、単一のデバイスで複数の凝縮物質量子力学の研究を可能にする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:29:16 GMT)
Decentralized Online Federated G-Network Learning for Lightweight
Intrusion Detection [2.7] 本稿では,協調学習を用いたGネットワークモデルに基づく分散・オンラインフェデレート学習侵入検出アーキテクチャを提案する。
公的なKitsuneデータセットとBot-IoTデータセットを用いた性能評価の結果、DOF-IDは、すべての協調コンポーネントの侵入検出性能を大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:23:39 GMT)
Decomposer: Semi-supervised Learning of Image Restoration and Image
Decomposition [2.7] 本稿では、歪み画像列を基本構造ブロックに分解する半教師付き再構成モデルを提案する。
我々は、多数の歪み画像列を提供するSIDARデータセットを使用する。
各歪みは、例えば加法ノイズや乗法ノイズなど、元の信号を異なる方法で変化させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:48:22 GMT)
Comparing Generative Chatbots Based on Process Requirements [2.6] 生成ベースのチャットボットは、数十億のパラメータに基づいてトレーニングされ、会話インテリジェンスをサポートする。
本稿では,プロセス実行支援の文脈において,優れた生成モデルであるGPTとPaLMの性能を比較した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:25:22 GMT)
Extended two-body Rydberg blockade interaction with off-resonant
modulated driving [2.6] 2ビットのRydbergブロックゲートを拡張するために余分なバッファ原子を導入する。
バッファ原子は、2つのクビット原子と結合し、互いに直接物理的に影響を与えない。
これらの取り組みにより、コールド原子量子ビットプラットフォームは固体電子のワイヤとジャンクションの概念に近づいた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:44:09 GMT)
Tracking a Year of Polarized Twitter Discourse on Abortion [2.6] 本研究では2022年1月から2023年1月までの5700万件以上の中絶関連ツイートを分析した。
感情、憎悪的なレトリック、有害なスピーチ、わいせつと侮辱の使用、フレーミング戦略が、リベラルで保守的なユーザーの間で1年間にわたって変動したことを示している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:49:17 GMT)
Efficient quantum loading of probability distributions through Feynman
propagators [2.6] 我々は、ハミルトニアンシミュレーションを用いて確率分布のロードのための量子アルゴリズムを、$hat H= Delta + V(x) mathbbI$ という形の1次元ハミルトニアンに対して提示する。
我々は、ファインマンプロパゲーターが解析的に閉じた形式を持つことが知られているポテンシャル$V(x)$を考え、これらのハミルトニアンを用いて確率分布を量子状態にロードする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:38:38 GMT)
Analyzing the Influence of Language Model-Generated Responses in
Mitigating Hate Speech on Social Media Directed at Ukrainian Refugees in
Poland [2.6] 本研究では,Large Language Models (LLM) によるソーシャルメディア上でのヘイトスピーチ対策の可能性を検討する。
目的は、ポーランドのウクライナ難民に向けられたヘイトスピーチの伝播を最小限にすることであった。
その結果, LLM生成応答を有害なツイートに対する応答として展開することで, ユーザのエンゲージメントを効果的に低下させることがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:08:42 GMT)
CoCoFormer: A controllable feature-rich polyphonic music generation
method [2.5] 本稿では,コードとリズムの入力をきめ細かいレベルで制御することで,モデルの出力を制御するコンディション合唱変換器(CoCoFormer)を提案する。
本稿では,CoCoFormerが現在のモデルよりも優れたレベルに達したことを実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:30:44 GMT)
Methods to Estimate Large Language Model Confidence [2.5] 本研究は, 難治性ヴィグネットの診断法を提案する際に, 大規模言語モデルの信頼性を評価する方法を評価するものである。
SC一致頻度は、特に診断において、モデル信頼性の最も有用な指標である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:44:06 GMT)
High-performance real-world optical computing trained by in situ
model-free optimization [2.4] 光コンピューティングシステムのその場トレーニングのためのモデルフリー最適化(MFO)手法を提案する。
MFOは、光学計算システムをブラックボックスとして扱い、光学計算重みの確率分布に直接損失をバックプロパガンダする。
提案手法のモデルフリーで高性能な性質と計算資源の需要の低さが組み合わさって,実験室から実世界の応用への光コンピューティングの移行を早める。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:53:32 GMT)
Dendrogram distance: an evaluation metric for generative networks using
hierarchical clustering [2.4] 本稿では,主に生成ネットワークに着目した生成モデル評価のための新しい指標を提案する。
この方法では、デンドログラムを使って実データと偽データを表現し、トレーニングと生成されたサンプルのばらつきを計算できる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:46:12 GMT)
Explaining Deep Learning Models for Age-related Gait Classification
based on time series acceleration [2.3] ディープラーニングモデルは、歩行分析にビッグデータを使用することを約束している。
これらのモデル固有のブラックボックスの性質は、臨床応用に課題をもたらす。
本研究は,高齢者関連歩行パターンに対するDLに基づく歩行分類の透明性を高めることを目的としている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:15:33 GMT)
Deriving and Evaluating a Detailed Taxonomy of Game Bugs [2.2] この研究の目的は、ゲーム開発者がバグに耐性のあるゲームを開発するのに役立つバグ分類を提供することだ。
ゲーム開発業界で発生したバグを報告した189件(学術文献78件,灰色111件)の資料の中から,436件の資料を分析し,MLR(Multivocal Literature Review)を行った。
MLRにより、エンドユーザーの視点から63のゲームバグカテゴリの詳細な分類を確定することができた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:51:42 GMT)
A Review on Cryptocurrency Transaction Methods for Money Laundering [2.2] マネーロンダリングに使われている現在の暗号通貨に基づく手法の特徴付けは、物理的およびデジタルマネーの流通フローを理解する上で最重要である。
本稿は、今後不正マネーロンダリング活動を防止するための効率的な戦略を設計するのに役立つかもしれない。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:17:11 GMT)
Generation of Games for Opponent Model Differentiation [2.2] これまでの結果から,人間の振る舞いをモデル化することで,アルゴリズムの性能が大幅に向上することが示唆された。
本研究では、悪意ある行為を行う可能性を高める人格タイプを特定する心理学者によって収集されたデータを用いる。
私たちはそのパラメータと心理的特徴を結びつける新しいモデルを作成しました。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:45:03 GMT)
Elucidating Discrepancy in Explanations of Predictive Models Developed
using EMR [2.2] 透明性と説明責任の欠如は、機械学習(ML)アルゴリズムの臨床的採用を妨げる。
本研究は電子カルテ(EMR)データのために開発された臨床診断支援アルゴリズムに適用する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:13:31 GMT)
Patent Documents to Engineering Design Knowledge Graphs [2.1] 本稿では,特許文書中の文から事実(h :: r :: t)を特定し,説明するためのデータ駆動型アプローチを提案する。
1) すべてのエンティティ(h)と関係(r)を識別し、2)一対のエンティティ(h :: ___ :: t)に対する特定の関係(r)を識別する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:59:20 GMT)
Vulnerability Analysis of Transformer-based Optical Character
Recognition to Adversarial Attacks [1.8] 我々は、標的攻撃と未目標攻撃の両方のアルゴリズムを開発し、評価する。
TrOCRは標的外攻撃に対して非常に脆弱であり、標的攻撃に対して若干脆弱でないことが判明した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:22:23 GMT)
Harnessing customized built-in elements -- Empowering Component-Based
Software Engineering and Design Systems with HTML5 Web Components [1.7] HTML5のカスタム組み込み要素は、Web開発を大きく変えます。
これらの要素により、開発者は特定の設計と目的に合わせて独自のHTMLコンポーネントを作成できる。
本研究では,コンポーネントベースソフトウェア工学(CBSE)とデザインシステムにおけるこれらの機能の役割について検討する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:42:53 GMT)
Advancing Web Accessibility -- A guide to transitioning Design Systems
from WCAG 2.0 to WCAG 2.1 [1.7] 本研究は、Webコンテンツガイドライン(WCAG)2.0から2.1へデザインシステムをアップグレードする重要なプロセスに焦点を当てる。
アクセシビリティ要件の増加に、最新の状態を維持することの重要性を強調している。
評価、戦略的計画、実装、テストはすべて、この戦略の一部です。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:33:32 GMT)
Personalized Predictions of Glioblastoma Infiltration: Mathematical
Models, Physics-Informed Neural Networks and Multimodal Scans [1.7] 医学的MRI検査からGlioblastoma (GBM) の浸潤を予測することは腫瘍の増殖動態を理解する上で重要である。
GBM成長の数学的モデルは、腫瘍細胞の空間分布の予測においてデータを補完することができる。
本研究では,単一3次元構造MRIスナップショットからGBM成長の反応拡散PDEモデルの患者特異的パラメータを推定するために,物理情報ニューラルネットワーク(PINN)を用いた手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:45:20 GMT)
Fast Particle-based Anomaly Detection Algorithm with Variational
Autoencoder [1.7] 本研究では,粒子ベース変分オートエンコーダ(VAE)の異常検出アルゴリズムであるSet-VAEを提案する。
従来のサブジェティネスに基づくジェット選択と比較して2倍の信号効率向上を示す。
システムトリガの今後の展開に注目して,異常検出の推論時間コストを削減するCLIP-VAEを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:29 GMT)
Forward Gradients for Data-Driven CFD Wall Modeling [1.6] 本稿では,壁境界流れCFDシミュレーションの代理として使用可能なサブグリッド壁モデルの訓練への応用について論じる。
本稿では,壁面境界流CFDシミュレーションの代理として使用可能なサブグリッド壁モデルの訓練への応用について論じる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:36:13 GMT)
Seizure detection from Electroencephalogram signals via Wavelets and
Graph Theory metrics [1.6] てんかん(てんかん、英: epilepsy)は、てんかん発作が脳の異常、過剰、同期的な活動による過度な発生である、最も一般的な神経疾患の1つである。
脳波信号は、脳から放出され、分析され、てんかん発作の検出と予測に重要な役割を果たす。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:07:14 GMT)
RETSim: Resilient and Efficient Text Similarity [1.6] RETSimは、テキスト検索、クラスタリング、データセット重複タスクのための堅牢なメトリック埋め込みを生成するためにトレーニングされた、軽量で多言語的なディープラーニングモデルである。
我々は、RETSimがMinHashやニューラルテキストの埋め込みよりもはるかに堅牢で正確であることを実証した。
また,W4NT3Dベンチマークを用いて,多言語・ほぼ重複したテキスト検索機能の評価を行った。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:54:33 GMT)
Likelihood-based Sensor Calibration using Affine Transformation [1.6] 本稿では,1973年に発表されたGlacier Researchによる改良された解について述べる。
この結果は,様々な応用に適用可能であることを示す。
シミュレーションや,8つの同一センサを持つマルチセンサボードの実測データを用いて,本研究を評価した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:47:37 GMT)
Statistics of tens-of-photon states scattered by optical cavity,
two-level atom and Jaynes-Cummings emitter [1.6] 導波管-QED系における光キャビティ(OC)、二レベル原子(TLAs)、ジャイアン・カミングスエミッタ(JCE)によって散乱する光子状態の統計について検討した。
我々は、OCが入射光子状態の統計を変更せず、光子番号に依存しないことを証明する。
TLAとJCEでは、光子数は光子束と反膨らみの挙動に強く影響を及ぼす。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:39:08 GMT)
Graph Theoretic Analysis of Three-Terminal Quantum Dot Thermocouples:
Onsager Relations and Spin-Thermoelectric Effects [1.4] 我々は、リンドブラッドマスター方程式を量子遷移ネットワークにマッピングし、両方の相互効果の鍵となる作用原理を捉える。
解析の結果,クーロン相互作用とスピン沸騰過程の両方を包含する量子熱力学ネットワークが,スピン熱電効果の出現に繋がることが明らかとなった。
これは古典的および量子的領域にまたがる熱力学の原理の普遍的な一般化を浮き彫りにする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:35:02 GMT)
Secure Traversable Event logging for Responsible Identification of Vertically Partitioned Health Data [1.4] 本論文は、識別情報と機密医療情報とを関連づけるプロセスを確保することを目的とする。
我々はまた、このような情報識別の事象を文書化する不変台帳を維持することで、カストディアンの責任を執行する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:32:26 GMT)
An Online Optimization-Based Decision Support Tool for Small Farmers in
India: Learning in Non-stationary Environments [1.4] これらのツールの恩恵を受けることができるインドの小農家は、それらにアクセスできない。
本稿では,個別の温室をマルコフ決定プロセス (MDP) としてモデル化し,Li と Li の Follow the Leader (FWL) のオンライン学習アルゴリズムを適用して作物計画のアドバイスを提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 23:33:16 GMT)
3D helical CT Reconstruction with a Memory Efficient Learned Primal-Dual
Architecture [1.4] 本稿では、ドメイン適応型ニューラルネットワークアーキテクチャであるLearned Primal-Dual(LPD)を改良し、この環境での再構築に応用することができる。
フルサイズの臨床データに非ロール型ディープラーニングアーキテクチャを適用したのはこれが初めてである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:13:20 GMT)
Invariance assumptions for class distribution estimation [1.3] 本研究では,データセットシフトによるクラス分布推定の問題について検討する。
トレーニングデータセットでは、機能とクラスラベルの両方が観察され、テストデータセットでは、機能のみが観察される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:57:10 GMT)
Experimental advances with the QICK (Quantum Instrumentation Control
Kit) for superconducting quantum hardware [1.3] 超伝導量子ビット系においてQICKが一意に有効であった最近の実験例について述べる。
これには多重信号生成と読み出し、ミキサーフリー読み出し、歪んだ高速フラックスパルス、パラメトリック演算のための位相コヒーレントパルスが含まれる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:05:50 GMT)
A unified weighting framework for evaluating nearest neighbour
classification [1.3] 従来型 (NN), ファジィ (FNN), ファジィ粗 (FRNN) の総合的および大規模評価を行った。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:24:02 GMT)
Deep Regularized Compound Gaussian Network for Solving Linear Inverse
Problems [1.3] 問題固有の統計的事前選択を可能にする線形逆問題に対する2つの新しいアプローチを考案する。
第1の方法は、正規化された最小二乗目的関数を最小化する反復アルゴリズムである。
第2の方法は、DR-CG-Netと呼ばれる新しいDeep regularized(DR)ニューラルネットワークで、事前情報を学習する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:53:57 GMT)
A Compound Gaussian Least Squares Algorithm and Unrolled Network for
Linear Inverse Problems [1.3] 本稿では,線形逆問題に対する2つの新しいアプローチを提案する。
1つ目は、正規化された最小二乗目的関数を最小化する反復アルゴリズムである。
2つ目は、反復アルゴリズムの「アンロール」または「アンフォールディング」に対応するディープニューラルネットワークである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:53:04 GMT)
Exploiting Causality Signals in Medical Images: A Pilot Study with
Empirical Results [1.2] 本稿では,ニューラルネットワークによる分類目的の画像から弱い因果信号を発見し,利用するための新しい手法を提案する。
このようにして、画像の1つの部分における特徴の存在が、画像の別の部分における他の特徴の出現にどのように影響するかをモデル化する。
提案手法は,畳み込みニューラルネットワークのバックボーンと因果係数抽出モジュールから構成される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:19:34 GMT)
Natural Language Processing Through Transfer Learning: A Case Study on
Sentiment Analysis [1.1] 本稿では,感情分析を中心に自然言語処理における伝達学習の可能性について考察する。
その主張は、スクラッチからのトレーニングモデルと比較して、事前訓練されたBERTモデルを使用したトランスファーラーニングは、感情分類の精度を向上できるというものである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:12:06 GMT)
Large Language Models Suffer From Their Own Output: An Analysis of the
Self-Consuming Training Loop [1.0] 大規模言語モデル(LLM)は多くのベンチマークで最先端となり、ChatGPTのような対話型アプリケーションは今や一般に広く使われている。
LLMは通常、インターネットから収集されるデータセットでトレーニングされるので、このLLM生成コンテンツは次世代のLLMのトレーニングに使用される可能性がある。
新たなデータセットを用いて,この自己消費学習ループを実験的に研究し,生成した出力の品質と多様性を解析的かつ正確に測定する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:36:43 GMT)
Survey on AI Ethics: A Socio-technical Perspective [0.9] AIに関連する倫理的懸念には、公正性、プライバシとデータ保護、責任と説明責任、安全性と堅牢性、透明性と説明可能性、環境への影響といった課題が含まれている。
この研究は、AIを社会に展開する際の現在と将来の倫理的懸念を統一する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:00:56 GMT)
Quantum steering for two-mode states with Continuous-variable in laser
channel [0.8] Einstein-Podolsky-Rosen ステアリングは、一方のデバイス独立量子情報処理において重要なリソースである。
この操舵特性は、量子システムと環境の間の相互作用によって破壊される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:18:49 GMT)
A knowledge-driven AutoML architecture [0.8] 本稿では,パイプラインと深い特徴合成のための知識駆動型AutoMLアーキテクチャを提案する。
主な目標は、AutoMLプロセスを説明可能なものにし、パイプラインと機能の合成にドメイン知識を活用することです。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:31:38 GMT)
A Rank Stabilization Scaling Factor for Fine-Tuning with LoRA [0.7] PEFTの一般的な手法はLoRA(Lo-Rank Adapters)であり、選択した層にトレーニング可能な低ランクの"アダプタ"を追加する。
このスケーリング係数は、アダプタをランクの要素で分割するので、ローラの学習が遅くなり、上位のアダプタでスタントのパフォーマンスが低下する。
我々はLoRAを適切なスケーリング係数で修正し、微調整の計算/性能トレードオフを容易に提供します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:23:20 GMT)
Policy Learning with Asymmetric Counterfactual Utilities [0.6] 非対称対実効関数を用いた最適政策学習について検討する。
最大電力損失を最小にすることで、最小限の決定ルールを導出する。
中間分類問題を解くことにより、観測データから最小損失決定ルールを学習できることが示される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:23:08 GMT)
Deployment of a Robust and Explainable Mortality Prediction Model: The
COVID-19 Pandemic and Beyond [0.6] 本研究では、新型コロナウイルスのパンデミック以降の死亡率予測におけるAIモデルの有効性、説明可能性、堅牢性について検討した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:15:53 GMT)
A Generic NLI approach for Classification of Sentiment Associated with
Therapies [0.6] 我々は、自然言語推論(NLI)に基づく手法を採用し、このタスクを文対分類問題として定式化する。
我々のベストモデルは75.22%のF1スコアを獲得し、これは全チームの平均(中間)スコアよりも11%(4%)多かった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:27:21 GMT)
ZTCloudGuard: Zero Trust Context-Aware Access Management Framework to Avoid Misuse Cases in the Era of Generative AI and Cloud-based Health Information Ecosystem [0.6] この記事では、クラウドエコシステムへのアクセスを管理するための、ゼロトラストベースのコンテキスト認識フレームワークを提案する。
このフレームワークには、信頼の連鎖を維持するための2つの主要なスコアスキーマがある。
この分析は、セマンティックスコアと構文スコアを生成するための、事前訓練された機械学習モデルに基づいている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:12:07 GMT)
Spectral signatures of vibronic coupling in trapped cold atomic Rydberg
systems [0.5] 電場と光学場に閉じ込められた原子とイオンは、多くの現在の量子シミュレーションと計算プラットフォームの基礎となる。
我々は、相対振動とRydberg状態の間の相互作用が量子ラビモデルを実現する2つのトラップされたRydbergイオンのケースについて議論する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:50:00 GMT)
Computational Hypergraph Discovery, a Gaussian Process framework for
connecting the dots [0.5] 本稿では,データ駆動型ハイパーグラフの発見と完成を目的とした,タイプ3問題に対する解釈可能なGPフレームワークを提案する。
提案手法は,線形系から非線形系へのRow Echelon形式還元のカーネル一般化と分散解析に基づく。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:02:06 GMT)
A point cloud approach to generative modeling for galaxy surveys at the
field level [0.5] 宇宙における銀河の分布を記述するために拡散に基づく生成モデルを導入する。
クイジョートシミュレーションスイートにおける暗黒物質ハローの最初の応用例を示す。
このアプローチは、宇宙データの包括的な分析を可能にするために拡張することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:00 GMT)
Vacuum-field-induced state mixing [0.5] 我々は, 原子-ナノ粒子分離のかなりの範囲内で, 崩壊速度が驚くほど低下することを示した。
我々の研究は、エネルギー準位が密接なエミッタに新しい量子状態操作の可能性を開く。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:46:09 GMT)
DynamicBEV: Leveraging Dynamic Queries and Temporal Context for 3D
Object Detection [0.5] 本稿では3次元オブジェクト検出に動的クエリを利用する新しいアプローチであるDynamicBEVを紹介する。
静的クエリとは対照的に、提案した動的クエリはK平均クラスタリングとTop-K Attentionを利用する。
効率をさらに高めるため、DynamicBEVは軽量テンポラル核融合モジュール(LTFM)を内蔵している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:01:16 GMT)
DepthSSC: Depth-Spatial Alignment and Dynamic Voxel Resolution for
Monocular 3D Semantic Scene Completion [0.5] DepthSSCはモノクロカメラのみをベースとしたセマンティックシーン補完手法である。
従来の手法で観察された空間的不整合や歪みの問題を緩和する。
複雑な3D構造の詳細をキャプチャーし、最先端のパフォーマンスを実現する効果を実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:47:51 GMT)
Unraveling the Geography of Infection Spread: Harnessing Super-Agents
for Predictive Modeling [0.5] ボロノイ・ダイアグラム・テッセルレーション(Voronoi Diagram tessellations)は、特定のストリートネットワークの場所に基づいて、標準のCensus Block Groupテッセルレーションより優れている。
本研究は,都市部における病気のモデリングを改良し,地理的特異性と高い計算効率を必要とするシナリオにおける公衆衛生戦略を支援する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:41:22 GMT)
Low frequency gravitational waves emerge Berry phase [0.4] 本稿では,GWの低周波領域で量子状態が研究されている玩具検出モデルを提案する。
低周波GWとの相互作用は自然に計算において断熱近似を与える。
このような幾何学的位相検出は,GWのフットプリントの顕在化に寄与する可能性がある。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:26:47 GMT)
Adaptive Step Sizes for Preconditioned Stochastic Gradient Descent [0.4] 本稿では,勾配降下(SGD)における適応ステップサイズに対する新しいアプローチを提案する。
我々は、勾配に対するリプシッツ定数と探索方向の局所的分散の概念という、数値的にトレース可能な量を用いる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:03:56 GMT)
STLGRU: Spatio-Temporal Lightweight Graph GRU for Traffic Flow
Prediction [0.4] STLGRUは、メモリ拡張アテンションとゲーティング機構を用いて、トラフィックネットワークの局所的およびグローバルな時空間関係を効果的に捉えることができる。
メモリモジュールとゲートユニットは空間的時間的依存をうまく学習でき、少ないパラメータでメモリ使用量を削減できることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:20:09 GMT)
Comparative Analysis of Shear Strength Prediction Models for Reinforced
Concrete Slab-Column Connections [0.4] この研究は、実験結果と機械学習予測を検証するスラブのFAAと補完されている。
PSOFNN、BATFNN、FNNの7つの異なるモデルがこのデータに基づいてトレーニングされ、その結果、PSOFNNが全体として最高のモデルであることが判明した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:22:25 GMT)
Segmentation of diagnostic tissue compartments on whole slide images
with renal thrombotic microangiopathies (TMAs) [0.4] 腎生検のスライス画像全体を用いて, 動脈, 動脈, 糸球体を確定診断するためのセグメンテーションモデルを訓練した。
我々のセグメンテーションモデルは、U-Netベースの組織検出とシフトウィンドウトランスフォーマーアーキテクチャを組み合わせることで、最も高度に変化した糸球体、動脈、動脈でも優れたセグメンテーション結果が得られる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:08:35 GMT)
Segmentation of diagnostic tissue compartments on whole slide images
with renal thrombotic microangiopathies (TMAs) [0.4] 腎生検のスライス画像全体を用いて, 動脈, 動脈, 糸球体を確定診断するためのセグメンテーションモデルを訓練した。
我々のセグメンテーションモデルは、U-Netベースの組織検出とシフトウィンドウトランスフォーマーアーキテクチャを組み合わせることで、最も高度に変化した糸球体、動脈、動脈でも優れたセグメンテーション結果が得られる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:08:35 GMT)
T-Rep: Representation Learning for Time Series using Time-Embeddings [0.4] 本稿では,時系列表現を時間ステップの粒度で学習する自己教師型T-Repを提案する。
T-Repはその特徴抽出器と共に時間のベクトル埋め込みを学び、時間的特徴を抽出する。
下流分類,予測,異常検出タスクにおけるT-Repの評価を行った。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:02:31 GMT)
Towards Understanding In-Context Learning with Contrastive
Demonstrations and Saliency Maps [0.3] 大規模言語モデル(LLM)の文脈内学習性能における様々な実演要素の役割について検討する。
具体的には, 地中構造ラベル, 入力分布, 相補的説明の影響について検討する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:12:36 GMT)
Sorting Out New York City's Trash Problem [0.3] 2つのプログラムはニューヨーク市のディバージョン率を改善し、通りからゴミ袋を取り除き、ニューヨーク市のお金を節約する可能性がある。
市の優先順位に基づいて最適なステッカー価格を決定するために,重み付き多目的最適化を行う。
この2つのプログラムはニューヨーク市のディバージョン率を改善し、街からゴミ袋を取り除き、ニューヨーク市のお金を節約する可能性がある。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:03:30 GMT)
Assessing the influence of attractor-verb distance on grammatical
agreement in humans and language models [0.3] 主名詞と動詞の間にアトラクター名詞が存在する場合の主動詞合意は複雑な行動を引き起こす。
我々は文の長さを等しく保ちながら、アトラクターと動詞の間の距離を変調する。
反応時間に対するアトラクタ距離の線形効果を報告する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:25:34 GMT)
Spin squeezing generated by the anisotropic central spin model [0.3] 異方性中心スピン系におけるスピンスクイーズと量子相転移について検討する。
このような中心スピン系は、中心スピンとスピン浴の間の遷移の比が無限大になる極限において、異方性リプキン-メシュコフ-グリックモデルにマッピングできる。
この研究はスピンスクイーズ状態を生成するための有望なスキームを提供し、量子センシングの潜在的な進歩の道を開く。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:53:15 GMT)
Thermalization in Kitaev's quantum double models via Tensor Network
techniques [0.3] 2次元キタエフの量子二重モデルに付随するデイビーズ発生器は、熱力学限界において、消滅しないスペクトルギャップを有することを示す。
このことは、これらのモデルが自己修正量子記憶として役に立たないという信念を厳格に検証している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:25:40 GMT)
Two-dimensional total absorption spectroscopy with conditional
generative adversarial networks [0.2] 我々は、TAS検出器で$E_x$および$E_gamma$データを展開するために条件付き生成対向ネットワークを使用する。
シミュレーションテストケースの93%以上において, 検出器分解能限界内でのキャラクタリゼーション能力を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:39:45 GMT)
A Multivariate Unimodality Test Harnenssing the Dip Statistic of
Mahalanobis Distances Over Random Projections [0.2] 線形ランダムプロジェクションとポイント・ツー・ポイント・ディスタンシングにより、一次元の一様性原理を多次元空間に拡張する。
我々の手法は$alpha$-unimodalityの仮定に根ざし、泥ッドと呼ばれる新しい一様性試験を提示する。
理論的および実証的研究は,多次元データセットの一様性評価における本手法の有効性を確認した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:11:02 GMT)
A Site-Resolved 2D Quantum Simulator with Hundreds of Trapped Ions under
Tunable Couplings [0.2] 大きな量子ビット容量と個々の読み出し能力は、大規模量子コンピューティングとシミュレーションの2つの重要な要件である。
2次元ウィグナー結晶中の512イオンの安定トラップと横動きのサイドバンド冷却について報告する。
本研究は,古典的に抽出可能な量子力学のシミュレーションと,2次元イオントラップ量子シミュレータを用いたNISQアルゴリズムの実行方法について述べる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:39 GMT)
Robust Parallel Laser Driving of Quantum Dots for Multiplexing of
Quantum Light Sources [0.2] 断熱的急速通過を用いた10個の量子ドットの同時トリガを示す。
我々は、15meVの光遷移エネルギーを持つ量子ドット系において、高忠実な量子状態が可能であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:32:45 GMT)
The History and Risks of Reinforcement Learning and Human Feedback [0.2] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデルをより使いやすく、より効果的にするための強力なテクニックとして登場した。
RLHFプロセスの中核は、最適化のための報酬関数として機能する人間の好みのモデルのトレーニングと利用である。
RLHF報酬モデルはしばしばパフォーマンスの達成の中心として言及されるが、能力、評価、トレーニング方法、オープンソースのモデルに関する記述はごくわずかである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:16:11 GMT)
LLMs for Science: Usage for Code Generation and Data Analysis [0.1] 大規模言語モデル (LLMs) は、今日の作業環境の多くの領域で生産性の向上を図っている。
LLMのポテンシャルが研究の実践においてどのように実現されるのかは、いまだ不明である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:29:33 GMT)
GeoScaler: Geometry and Rendering-Aware Downsampling of 3D Mesh Textures [0.1] 高解像度テクスチャマップは、3Dメッシュで現実世界のオブジェクトを正確に表現するために必要である。
GeoScalerは幾何学的手がかりを取り入れつつ、3Dメッシュのテクスチャマップをダウンサンプリングする方法である。
また,GeoScalerが生成したテクスチャは,従来のダウンサンプリング手法に比べて,画質のよいレンダリング画像を提供することを示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:55:25 GMT)
XAI for time-series classification leveraging image highlight methods [0.1] 時系列分類タスクにおいて解釈可能性を提供する教師学生アーキテクチャ(蒸留モデル)にディープニューラルネットワーク(DNN)を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:59:18 GMT)
Wiring surface loss of a superconducting transmon qubit [0.0] トランスモン量子ビットの表面損失の50%以上はジョセフソン接合配線から得られることを示す。
6つの可変浮動小数点量子ビットを作製し、配線設計最適化により最大20%のクビット品質係数の改善を実験的に示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:59:41 GMT)
When the Few Outweigh the Many: Illicit Content Recognition with
Few-Shot Learning [0.0] 本稿では,画像から違法行為を認識するための代替手法について検討する。
シームズニューラルネットワークは10クラスのデータセット上で20ショットの実験で90.9%に達する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:28:03 GMT)
Wasserstein Distributionally Robust Estimation in High Dimensions:
Performance Analysis and Optimal Hyperparameter Tuning [0.0] 雑音線形測定から未知パラメータを推定するための分布的ロバストな推定フレームワークを提案する。
このような推定器の2乗誤差性能を解析する作業に着目する。
凸凹最適化問題の解法として2乗誤差を復元できることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:29:06 GMT)
Visual Semantic Navigation with Real Robots [0.0] ビジュアルセマンティックナビゲーション(VSN)は、ロボットが見えない環境でナビゲートするための視覚意味情報を学ぶ能力である。
実ロボットにVSNモデルを組み込む新たなソリューションを提案する。
また,VSN 用の新しい ROS ベースのフレームワーク ROS4VSN をリリースし,任意の VSN モデルを ROS 互換ロボットに容易にデプロイし,実環境でテストできるようにした。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:24:42 GMT)
Variational adiabatic transport of tensor networks [0.0] 本稿では,行列積演算子としての断熱ゲージポテンシャルを構成するテンソルネットワークについて論じる。
私たちは、研究するモデルの臨界点を通じて、確実に状態を輸送できることを示します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:04 GMT)
Using large language models to study human memory for meaningful
narratives [0.0] 言語モデルは,人間の記憶を有意義な材料として研究するための科学的手段として利用できることを示す。
我々は,多数の参加者とともにオンライン記憶実験を行い,異なる長さの物語の認識・記憶データを収集した。
記憶における物語理解の役割を解明するために,提示された物語のスクランブル版を用いて,これらの実験を繰り返した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:25:45 GMT)
Universality in Ground State Masses of Nuclei [0.0] 核質量が極値統計に従うことが示されており、これは核基底状態のエネルギーが、ドンスカーとバラダンの大きな偏差理論の意味で極値として扱われることを意味している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:32:04 GMT)
Unclonable Cryptography in the Plain Model [0.0] 制限不能暗号の2つの顕著な例は、量子コピー保護と制限不能暗号である。
我々は、不明瞭なセキュリティを持つ非拘束の暗号化が、平易なモデルに存在することを初めて示している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:25:22 GMT)
Uncertainty Aware AI for 2D MRI Segmentation [0.0] 本稿では,MRIデータに用いた不確実性認識セグメンテーションモデルBA U-Netを提案する。
我々は、F1スコアとIoU(Intersection Over Union)を評価指標として、利用可能なBraTS 2020データセット上でモデルを評価した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:27:27 GMT)
Uncertainty Aware AI for 2D MRI Segmentation [0.0] 本稿では,MRIデータに用いた不確実性認識セグメンテーションモデルBA U-Netを提案する。
我々は、F1スコアとIoU(Intersection Over Union)を評価指標として、利用可能なBraTS 2020データセット上でモデルを評価した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:27:27 GMT)
TransNeXt: Robust Foveal Visual Perception for Vision Transformers [0.0] 生体模倣設計に基づくトークンミキサーAggregated Attentionを提案する。
従来のクエリやキーと対話する学習可能なトークンを組み込んでいます。
集約された注意と畳み込みGLUを組み合わせて、TransNeXtと呼ばれる新しいビジュアルバックボーンを作成します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:03:27 GMT)
Towards adiabatic quantum computing using compressed quantum circuits [0.0] 断熱量子コンピューティングのための量子回路を最適化するネットワークアルゴリズムについて述べる。
最適化には反断熱駆動が含まれており、変分行列積演算子を用いて断熱ゲージポテンシャルを表現している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:35:10 GMT)
Towards Responsible Governance of Biological Design Tools [0.0] 生成機械学習の最近の進歩は、生物設計ツール(BDT)の急速な進歩を可能にした
前例のないBDTの予測精度と新規設計能力は、新しい重要な二重利用リスクをもたらす。
他のデュアルユースAIシステムと同様、BDTも悪質な問題を抱えている。
我々は、責任ある開発、リスクアセスメント、透明性、アクセス管理、サイバーセキュリティ、レジリエンスへの投資などにおいて、BDTが誤用されるリスクを軽減するためのさまざまな手段を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:22:44 GMT)
Tight bounds for antidistinguishability and circulant sets of pure
quantum states [0.0] 純粋な量子状態の集合は、ランダムにサンプリングすると、サンプリングされていない状態が完全に決定される測定値が存在する場合、区別できないと言われる。
我々は、$n$純状態の集合の反識別性は、$(n-1)$-incoherence と呼ばれるグラム行列の性質と同値であることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:55:34 GMT)
The effect of source disclosure on evaluation of AI-generated messages:
A two-part study [0.0] 情報源開示がAIによる健康被害防止メッセージの評価に与える影響について検討した。
情報源の開示はメッセージの評価に大きな影響を及ぼすが、メッセージのランキングを大きく変更することはなかった。
AIに対する否定的な態度の適度なレベルを持つ人にとっては、ソース開示はAI生成メッセージの嗜好を減らした。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:04:58 GMT)
The Transformative Influence of Large Language Models on Software
Development [0.0] Generalized Large Language Models (LLM) は様々な分野に進出している。
LLMはAIペアプログラミングアシスタントとしての役割をますます高めており、重要な課題やオープンな問題も提示している。
予備的な調査結果は、データのプライバシー、偏見、誤報に関する懸念を浮き彫りにしている。
調査で確認した12のオープンな問題を特定し、これらの領域をカバーしています。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:18:54 GMT)
The Hoyle and associated excited states from the viewpoint of pocket
resonances in alpha + 8Be reactions [0.0] 基底状態のアルファ=粒子が8ドルBe核を公転する反応において, ポケット共鳴の観点からホイルと関連する励起状態の生成について検討した。
予測された反応断面積は、質量中心エネルギー$E_rm cm$の関数として、ボース共鳴を含む顕著な共鳴を示す。
天体物理学の応用については、宇宙物理学的な$S(E_rm cm)$-factor for $E_rm cm$$1.0 MeV も評価する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:52:16 GMT)
Temperature dependence of energy transport in the $\mathbb{Z}_3$ chiral
clock model [0.0] 本研究では, 1次元$mathbbZ_3$キラルクロックモデルの非可積分状態におけるエネルギー輸送について検討した。
本研究では, 比較的高温のモデルにおける輸送係数を, 空隙のない相と低温の相の両方よりも高い温度で抽出する。
量子臨界スケーリングが観測される温度には到達できないが、我々のアプローチはモデルの輸送特性にアクセスすることができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:10:08 GMT)
Syntax-Informed Interactive Model for Comprehensive Aspect-Based
Sentiment Analysis [0.0] 総合ABSAのためのシンタクティック・依存性強化マルチタスクインタラクション・アーキテクチャ(SDEMTIA)を提案する。
我々のアプローチは、SDEIN(Syntactic Dependency Embedded Interactive Network)を用いた構文知識(依存関係と型)を革新的に活用する。
また,学習効率を高めるために,マルチタスク学習フレームワークに,新規で効率的なメッセージパッシング機構を組み込んだ。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:03:22 GMT)
Strong-field theory of attosecond tunneling microscopy [0.0] 従来の走査型トンネル顕微鏡と超短パルスフェムト秒レーザーを併用することにより、分子・ナノ構造のコヒーレント電子ダイナミクスのアト秒観察が可能となる。
ここでは、強磁場近似に基づくモデルを考案する。全てのレシエーションにおいて、STMの標準モデルに驚くべき類似を提供する。
また,本モデルから直感的な3段階の3段階モデルが直接出現し,STM実験における最適条件について述べる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:25:26 GMT)
Single-qubit measurement of two-qubit entanglement in generalized Werner
states [0.0] 量子ビットの1つを検出することなく、2量子混合状態の族における絡み合いを測定する方法を示す理論を示す。
本手法は干渉計であり, 偶然の計測やポストセレクションは不要である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:12:47 GMT)
Simulating Quantum Computations on Classical Machines: A Survey [0.0] 本稿では,150以上のシミュレータと量子ライブラリを網羅的に研究する。
我々は、アクティブに維持されているシミュレータをショートリスト化し、10キュービット以上の量子アルゴリズムのシミュレーションを可能にする。
我々は,シュロディンガー法,ファインマン経路積分法,ハイゼンベルク法,ハイブリッド法など,最も重要なシミュレーション手法の分類法を提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:48:15 GMT)
Scattering solution of Schr\"odinger equation with $\delta$-potential in
deformed space with minimal length [0.0] 変形ハイゼンベルク代数の一般の場合、ディラック $delta$-function ポテンシャル問題を考える。
何らかの共鳴エネルギーに対して、入射波は完全に反射される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:27:19 GMT)
Scaling Political Texts with ChatGPT [0.0] GPT-4を用いて連続空間における政治的テキストの位置推定を行う。
GPT-4が生成する位置と専門家との相関は93%以上である。
個別のつぶやきに対して、GPT-4で得られた位置は、クラウドソースされた位置推定と91%の相関性が得られる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:45:02 GMT)
Safe Reinforcement Learning in a Simulated Robotic Arm [0.0] 強化学習(RL)エージェントは、最適なポリシーを学ぶために環境を探索する必要がある。
本稿では,Pandaロボットアームを用いたカスタマイズ環境を構築することにより,安全なRLアルゴリズムの適用性を向上させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:22:16 GMT)
Real-space blocking of qubit variables on parallel lattice gauge theory
links for quantum simulation [0.0] 格子ゲージ理論は、実験室や量子コンピュータで構築できる量子デバイスにマッピングされる。
この研究は、単純で低次元の量子ビット系の粗粒化を用いて、任意の大きさの局所ヒルベルト空間を得る方法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:35:10 GMT)
ROSO: Improving Robotic Policy Inference via Synthetic Observations [0.0] 本稿では、事前訓練されたポリシーのゼロショット性能を改善するために、生成人工知能の利用を提案する。
我々の実験は、生成AIをロボット推論に組み込むことで、成果が大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:52:35 GMT)
Quantum-probabilistic Hamiltonian learning for generative modelling &
anomaly detection [0.0] 本研究では,データ解析におけるハミルトニアンシステムの学習と活用の可能性について検討する。
我々は、シミュレーションされた大型ハドロン衝突型加速器データの生成モデル作成に量子ハミルトンモデルを用いる。
さらに、学習したハミルトニアンを用いて異常検出を行い、異なるサンプル型が異なる動的挙動を形成することを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:21:04 GMT)
Quantum uncertainty of gravitational field and entanglement in
superposed massive particles [0.0] 近年、重力ポテンシャルの量子重ね合わせの研究は大きな関心を集めている。
本研究では,電磁・重力ポテンシャルによる2つの粒子状態の絡み合いに着目した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:03:19 GMT)
Quantum simulation of the central spin model with a Rydberg atom and
polar molecules in optical tweezers [0.0] 本稿では、XX(スピン交換)相互作用を持つ中心スピンモデルの超低温量子シミュレータを提案する。
内部の粒子状態をスピン状態にマッピングすることで、スピン交換相互作用をシミュレートすることができる。
この設定でシミュレートできる2つの動的シナリオを数値的に解析する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:06:46 GMT)
Quantum control of continuous systems via nonharmonic potential
modulation [0.0] 非調和ポテンシャルに制限された1つの連続変数自由度の状態を操作する理論的提案を提案する。
Fock, Gottesman-Kitaev-Preskill, multi-legged-cat, 立方相状態を含む非ガウス状態の生成を示す。
単発状態判別とアルゴリズム冷却のためのプロトコルを提案し,この制御方式の雑音に対する頑健さを解析する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:30:22 GMT)
Quantum Imaging Beyond the Standard-Quantum Limit and Phase Distillation [0.0] 非線形干渉計を用いた量子センシングは、バイカラーイメージングの可能性を秘めている。
位相シフトアルゴリズムは、ノイズによって引き起こされる有害な効果に対してある程度頑健である。
非線形干渉計の自発性および高利得性について検討した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:14:45 GMT)
Prompting in Autoregressive Large Language Models [0.0] 自己回帰型大規模言語モデルは自然言語処理のランドスケープに変化をもたらした。
本研究は,既存の文献の分類手法について紹介し,この分類法に基づく簡潔な調査を行う。
我々は、将来の研究の方向性として役立つ自己回帰型LSMの推進という領域において、いくつかの未解決の問題を特定した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:56:34 GMT)
Promise Clique Homology on weighted graphs is $\text{QMA}_1$-hard and
contained in $\text{QMA}$ [0.0] 計算トポロジにおける古典問題の複雑性, ホモロジー問題について検討する。
複雑性は量子複雑性クラスによって特徴づけられる。
この結果は、ホモロジーと超対称量子力学の結びつきの側面と見なすことができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:15:30 GMT)
Predicting the Age of Astronomical Transients from Real-Time
Multivariate Time Series [0.0] 新しい天文学的なスカイサーベイは、すぐに前例のない数のトランジェントを記録するだろう。
本稿では,複数波長の時系列観測からリアルタイムに過渡現象の年齢を推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:00 GMT)
Predicting Multi-Joint Kinematics of the Upper Limb from EMG Signals
Across Varied Loads with a Physics-Informed Neural Network [0.0] PINNモデルは、フィードフォワードニューラルネットワーク(ANN)とジョイントトルクモデルを組み合わせることで構成される。
PINNモデルのトレーニングデータセットは、EMGと4つの異なる被験者から収集された時間データを含む。
その結果,関節角度予測では58%から83%の相関が認められた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:55:11 GMT)
PlaNet-ClothPick: Effective Fabric Flattening Based on Latent Dynamic
Planning [0.0] 最近の研究は、観測結果のぼやけた予測によるもので、潜伏した空間を直接計画することは困難である。
ファブリックの輪郭における遷移関数の急激な不連続性は、正確な潜在動的モデルを学ぶのを困難にしている。
本モデルでは,動作推定の高速化と,この領域の最先端ロボットシステムよりもトランジショナルモデルパラメータの削減が要求される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:22:30 GMT)
Pauli principle in polaritonic chemistry [0.0] キャビティの量子化放射モードと相互作用する分子アンサンブルの状態空間における置換対称性の強制効果について論じる。
パウリが許容する集合状態は、群論、すなわち、状態空間を区別不能な分子の置換群の適切な既約表現に射影することによって得られる。
数値的な結果は、赤外線キャビティモードと相互作用するH$O分子を緩和する現実的な例を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:52:37 GMT)
Over-Squashing in Graph Neural Networks: A Comprehensive survey [0.0] この調査は、グラフニューラルネットワーク(GNN)におけるオーバースカッシングの課題を掘り下げるものだ。
オーバースカッシングの原因、結果、緩和戦略を包括的に探求する。
グラフの書き換え、新しい正規化、スペクトル分析、曲率に基づく戦略など、様々な手法がレビューされている。
また、オーバー・スムーシングなど、オーバー・スカッシングと他のGNN制限との相互作用についても論じている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:03:06 GMT)
Optimal EEG Electrode Set for Emotion Recognition From Brain Signals: An
Empirical Quest [0.0] 人間の脳は複雑な器官であり、まだ完全には発見されていない。
近年の研究では、脳信号が感情認識に非常に有効であることが示されている。
感情提示における脳の各部位の貢献を実証的に分析した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:18:42 GMT)
Opening the Black Box: Towards inherently interpretable energy data
imputation models using building physics insight [0.0] 本稿では, 物理インフォームド・デノイング・オートエンコーダ (PI-DAE) を用いて, 商業ビルにおけるデータ計算の欠如について検討する。
特に,提案手法は物理に着想を得たソフト制約をデノナイジングオートエンコーダ(DAE)の損失関数に適用する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:34:44 GMT)
On the bias in iterative quantum amplitude estimation [0.0] 本稿では,反復型量子振幅推定(IQAE)のバイアスについて検討する。
IQAEは偏りがあり、その偏りは特定の値の$a$に対して高められることを示す。
最終ラウンドをグロバー数とショット数で再実行するだけで、バイアス軽減法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 07:02:29 GMT)
On the Robustness of Decision-Focused Learning [0.0] 決定焦点学習(Decision-Focused Learning, DFL)は、機械学習(ML)モデルを訓練し、不完全な最適化問題の欠落パラメータを予測するための新興学習パラダイムである。
DFLは、予測と最適化タスクを統合することで、エンドツーエンドシステムでMLモデルをトレーニングし、トレーニングとテストの目的の整合性を向上させる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:34:04 GMT)
On Commutative Penalty Functions in Parent-Hamiltonian Constructions [0.0] 我々は、正確な親ハミルトニアンを通勤から学べるフレームワークを考える。
この研究は、正確な親ハミルトニアンについて知られているコンポーネントを捉え、そのような構造に関するいくつかのテクニックを橋渡しする枠組みを提示している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:00:05 GMT)
Nanodiamond emulsions for enhanced quantum sensing and click-chemistry
conjugation [0.0] 本稿では,ナノダイアモンドを量子的特性を保った薄いエマルション層でコーティングする方法について報告する。
我々は,エマルション層がNV中心のスピン寿命に及ぼす影響について検討し,ナノダイアモンドの常磁性イオンに対する化学感度を定量化する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:28:40 GMT)
Multiparameter critical quantum metrology with impurity probes [0.0] 臨界量子量論の新しいパラダイムとして、2IKモデルを導入する。
既知の制御場を適用することにより,特異性を除去し,測定感度を回復できることを実証する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:32:51 GMT)
Multi-Channel Cross Modal Detection of Synthetic Face Images [0.0] 合成生成された顔画像は、人間による実際の画像と区別できないことが示されている。
高速かつ任意の画像後処理が可能な新しい生成モデルを提案する。
完全に合成された顔画像を検出するためのマルチチャネルアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:30:10 GMT)
More on the gauge principle and nonobservability of some quantum numbers
characterizing the Landau eigen-states [0.0] 対称ゲージにおけるランダウ・ハミルトニアンの固有状態は、2つの整数$n$と$m$によって特徴づけられる。
正準運動量と正準OAMは共にゲージ変量であるため、その固有値 $k_x$ と $m$ は観測値に対応していないと標準的に信じられている。
本論文の目的は、ランダウ問題の2つの理論的定式化の違いにかかわらず、この主張が正当化されないことを示すことである。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:48:43 GMT)
Modular Neural Networks for Time Series Forecasting: Interpretability
and Feature Selection using Attention [0.0] 本稿では,構築によって解釈可能な時系列予測のための新しいモジュール型ニューラルネットワークモデルを提案する。
リカレントニューラルネットワークはデータ内の時間的依存関係を学習し、アテンションベースの特徴選択コンポーネントは最も関連性の高い特徴を選択する。
モジュール型のディープネットワークは、選択した機能から独立してトレーニングされ、ユーザーが機能がどのように結果に影響を与えるかを示し、モデルを解釈できる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:51:06 GMT)
Modelling assisted tunneling on the Bloch sphere using the Quantum
Composer [0.0] ブロッホ球表現 (Bloch sphere representation) は、2レベル系の全ての可能な量子状態の幾何学モデルである。
明示的な応用として、二重井戸ポテンシャルにおける粒子の時間力学を考える。
教育者と開発者との対話と呼ばれる協調的なアプローチによって、ソフトウェアQuantum Composerの更新版が提示されます。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:42:11 GMT)
Mixed Hierarchy Network for Image Restoration [0.0] 画像復元における品質とシステムの複雑さのバランスをとることができる混合階層ネットワークを提案する。
我々のモデルはまずエンコーダ・デコーダアーキテクチャを用いて文脈情報を学習し,次に空間的詳細を保存する高分解能分岐と組み合わせる。
その結果、MHNetという名前の密接な相互接続階層アーキテクチャは、いくつかのイメージ復元タスクにおいて、強力なパフォーマンス向上をもたらす。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:44:10 GMT)
Message Recovery Attack in NTRU through VFK Lattices [0.0] 我々はNTRU暗号システムのすべての変種に対してメッセージリカバリ攻撃を実装した。
攻撃の有効性は、未知の量の近似を可能にする特定の神託に依存する。
攻撃に対するNTRU暗号システムの耐性を示す手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:20:59 GMT)
Maximal Elements of Quantum Communication [0.0] 準備と測定のシナリオは、通信行列によって自然に記述される。
恒等行列は量子論における唯一の極大要素であるが、古典理論とは対照的に、最大の要素ではない。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:33:49 GMT)
Light-amplified Landau-Zener conductivity in gapped graphene monolayers:
a simulacrum of photo-catalyzed vacuum instability [0.0] ギャップ状グラフェン単分子膜の電子のバンド間遷移は、フランキ面に強い定電場が重畳されるときにフェルミ面の近くで高度に刺激される。
この現象はフランツ・ケルディシュ効果と等価であり、高速振動場と結びついた光子エネルギーがグラフェンギャップのすぐ下にある状態に特に注意を払っている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:29:58 GMT)
Large Language Models Meet Computer Vision: A Brief Survey [0.0] 大規模言語モデル(LLM)とコンピュータビジョン(CV)は研究の重要な領域として現れ、人工知能(AI)分野において大きな進歩を遂げている。
この調査論文は、視覚変換器(ViT)とLLMに革命をもたらす可能性を強調しながら、トランスフォーマーの領域における最新の進歩を論じている。
調査は、この分野のオープンな方向性を強調し、将来の研究開発の場を示唆することで締めくくられる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:39:19 GMT)
Lane-Keeping Control of Autonomous Vehicles Through a Soft-Constrained
Iterative LQR [0.0] 我々は、CILQRアルゴリズムとモデル予測制御(MPC)制約緩和法を統合することで、ソフト制約付き反復線形四元数レギュレータ(Soft-CILQR)アルゴリズムを開発した。
数値シミュレーションでは, ソフトCILQRおよびCILQRソルバは, 正常に基準に向かってシステムを動かすことができたが, 加法障害を伴う条件下でのCILQRソルバよりもスムーズなステアリング入力軌道を得ることができた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:58:13 GMT)
Investing in the Quantum Future : State of Play and Way Forward for
Quantum Venture Capital [0.0] 本稿は、新しいスタートアップの出現を支える概念を紹介し、スケールアップ量子企業の資金調達を提唱する。
この論文は、社会と社会をより深く巻き込むことによって、業界への影響を改善するための提案を締めくくっている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:31:51 GMT)
Integration of Robotics, Computer Vision, and Algorithm Design: A
Chinese Poker Self-Playing Robot [0.0] このロボットは、カスタムの吸盤機構を使ってカードを拾い、プレイする。
13枚のカードを最適な手3、5、5枚のカードに分割するために、欲張りのアルゴリズムが開発された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:53:34 GMT)
Improved Prototypical Semi-Supervised Learning with Foundation Models:
Prototype Selection, Parametric vMF-SNE Pretraining and Multi-view
Pseudolabelling [0.0] コンピュータビジョンのための半教師あり学習のための改良されたアプローチを提案する。
局所構造を保存する高次元潜在空間間のニューラルネットワークを用いたマッピングを作成する。
また,複数のビューにまたがる予測を組み合わせ,より信頼性の高い監視信号を提供するソフトなマルチビュー擬似ラベルを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:12:28 GMT)
Identifying Systems with Symmetries using Equivariant Autoregressive
Reservoir Computers [0.0] 均質な自己回帰型貯水池コンピュータを用いた対称性を持つシステムの同定に焦点をあてる。
構造行列近似理論の一般的な結果が提示され、2倍のアプローチが探求される。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:59:41 GMT)
Heat Pulses in Electron Quantum Optics [0.0] メソスコピック導体における熱パルスのフロケ散乱理論を定式化する。
熱パルスの断熱放出は、線形応答において熱伝導量子によって与えられる熱電流につながる。
電流を生成するために、電子-ホール対称性を破り、熱電効果を可能にするマッハ-ツェンダー干渉計を用いる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:46:03 GMT)
H-Packer: Holographic Rotationally Equivariant Convolutional Neural
Network for Protein Side-Chain Packing [0.0] タンパク質側鎖パッキングは構造モデリングの重要なサブタスクである。
2つの軽量回転同変ニューラルネットワーク上に構築されたサイドチェーンパッキングのための新しい2段階アルゴリズムを提案する。
CASP13とCASP14の目標に対して,本手法の評価を行った。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:31:07 GMT)
Gravitational Wave Detection and Low-Noise Sapphire Oscillators [0.0] この論文は、Xバンド上で調整可能な超低雑音サファイア共振器発振器の開発について述べる。
この検出器は、史上初の大規模な精密光学系であった。
共鳴検出器の復活により、この論文はマルチモード音響システムにおいて重要な研究がなされている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 02:11:42 GMT)
Graph Partitioning with Fujitsu Digital Annealer [0.0] 本研究は,富士通デジタルアナーラーの性能と走行時間を評価する。
DAはケース1354ペガゼの電力グリッドネットワークを45のサブグループに分割し、60,930のバイナリ変数を要求した。
その結果,Fujitsu DAはグラフ分割の高速かつ効率的な最適化に有効であることが示唆された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 06:59:01 GMT)
Gradient-based Local Next-best-view Planning for Improved Perception of
Targeted Plant Nodes [0.0] 我々はこの問題をNBV計画タスクとして定式化する。
我々の定式化は、カットされる確率を最大化するために単一の目標ノードの認識精度を迅速に向上することに焦点を当てている。
本稿では, 局所勾配方向を直接推定するディファレンシャルレイサンプリングを用いた勾配型NBVプランナを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:02:33 GMT)
Giant Generation of Polarization-Entangled Photons in Metal Organic
Framework Waveguides [0.0] 金属有機フレームワーク(英: Metal-organic framework、MOF)は、化学的および光学的安定性が証明された非線形特性を持つ光学材料の新しいクラスである。
我々は,MOFを用いた1次元導波路を用いたコリニア型II自発パラメトリックダウン変換の位相整合条件について検討した。
2軸MOF結晶は, 周期的に配置したKTP導波路上での変換効率を2倍に向上することがわかった。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:51:41 GMT)
Geometric instability of graph neural networks on large graphs [0.0] グラフニューラルネットワーク(GNN)による埋め込みの幾何学的不安定性の解析
このような不安定性を測定するために,グラフネイティブグラフグラフグラム(GGI)を提案する。
これにより、ノード分類とリンク予測の両方のために、GNN埋め込みの様々な不安定な振る舞いを大きなグラフ上で研究することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:35:06 GMT)
Generation Of Colors using Bidirectional Long Short Term Memory Networks [0.0] 人間の視覚は、200万から700万の識別可能な色合いと推定される、幅広い色のスペクトルを区別することができる。
この研究は、無数の陰影に対する視覚的認識と、それらを正確に表現し、命名する能力のギャップを埋めようとしている。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:50:12 GMT)
Foundational Moral Values for AI Alignment [0.0] 我々は、道徳哲学から引き出された5つの基本的価値観を提示し、生存、持続的世代間存在、社会、教育、真実という人間の生存に必要なものの上に構築する。
これらの価値は、技術的アライメント作業のためのより明確な方向を提供するだけでなく、これらの価値を取得し、維持するためのAIシステムからの脅威と機会を強調するためのフレームワークとしても役立ちます。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:11:24 GMT)
Finnish 5th and 6th graders' misconceptions about Artificial
Intelligence [0.0] 本研究では,フィンランドの5年生と6年生のAI概念を分析した。
3つの誤解カテゴリーが同定された。
その結果, 文脈固有の言語的特徴は, 学生のAI誤解に寄与することが示唆された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:49:11 GMT)
Finite entropy fluctuations of a quantum particle in a Bose-Einstein
condensate [0.0] 非常に希薄な原子ガスの極限における量子粒子のコヒーレンス時間を定量的に測定する。
結合とゲージ対称性の破れは、2次元時間の自発的な量子ゆらぎと、平衡における対応する有限エントロピーによって理解することができる。
2次元時間の概念は最終的に、大温度の古典的極限における時間反転対称性を持つ純粋に想像的な時間という標準スキームに収束する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:20:07 GMT)
Fast universal control of a flux qubit via exponentially tunable
wave-function overlap [0.0] 本稿では,この課題を解決するために,緩和対策の調整可能なレベルを享受するフラックス量子ビット変動を提案する。
我々の量子ビット設計であるDSFQ(Double-shunted flux qubit)は、その3つの接合環幾何学を通して、一般的な二重井戸ポテンシャルを実現する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:07:36 GMT)
Fano-Andreev effect in a T-shaped Double Quantum Dot in the Coulomb
blockade regime [0.0] 本研究では,2つの量子ドット,2つの通常の鉛,1つの超伝導体からなる系における超伝導量子相関の効果について検討した。
超伝導相関はFano-Andreev干渉を引き起こし, 2つの反共振線形状を特徴とする。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 01:23:58 GMT)
Failure Artifact Scenarios to Understand High School Students' Growth in
Troubleshooting Physical Computing Projects [0.0] 物理コンピューティングプロジェクトは、学際的な問題解決を理解するためのリッチなコンテキストを提供する。
発見: 学生は、より特定性の高いバグを識別し、ドメインを横断し、バグの複数の原因を考慮し、改善した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:34:09 GMT)
Exploiting nonclassical motion of a trapped ion crystal for
quantum-enhanced metrology of global and differential spin rotations [0.0] イオンの集合運動の圧縮状態に結合することで、捕捉されたイオン配列における非古典的スピン状態の生成の可能性について理論的に検討する。
生成したスピン状態の相関は、スピンのサブアンサンブルの大域的あるいは微分的回転を量子的に検出するために調整することができる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 23:27:26 GMT)
Entropic property of randomized QAOA circuits [0.0] 量子近似最適化アルゴリズム(QAOA)は、パラメータ化量子回路を用いてビットストリングをサンプリングすることで離散最適化問題を解決することを目的としている。
我々は、確率に関する解析方程式と、そのようなサンプリングによって常にエネルギー分布のエントロピーが高くなるという数値的な証拠を提供する。
また, ランダムサンプリングよりも平均値が高い大域的最適値を得る確率も解析する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 16:57:10 GMT)
Entanglement of Quantum States which are Zero on the Symmetric Sector [0.0] 我々は、n クォーディットの量子系と、関連するヒルベルト空間のクレブシュ・ゴルダン分解を考える。
我々は、任意の分離可能な状態が対称セクター上の非零成分を持つ必要があることを証明している。
これらのシステムに対する絡み合いの目撃者のクラスを特定します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 22:48:24 GMT)
Enhancing exotic quantum fluctuations in a strongly entangled cavity BEC
system [0.0] 量子光場と相関量子物質の強い結合は、物質セクターにおけるエキゾチックな量子ゆらぎを引き起こすことを示す。
我々は、想像時間経路積分を用いて、顕微鏡ハミルトンから散逸するランダウ過程とベリャー過程を導出する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:58:14 GMT)
Energy diffusion in weakly interacting chains with fermionic
dissipation-assisted operator evolution [0.0] 計算時間進化法は, 絡み合いの成長を制御するスキームと組み合わせて, 十分に長い時間, 引き抜きにシミュレートする。
本稿では,フェミオン系を扱うために散逸支援演算子進化(DAOE)を一般化する。
FDAE, 新しいフェミオンE(FDAOE)および別のシミュレーション手法である密度行列トランケーション(DMT)の性能について検討する。
この鎖は、フェルミの黄金律に基づく単純な期待とは対照的に、相互作用強度のような拡散係数を第4の力にスケーリングするが、エルフの理論に基づく最近の予測と一致している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:00 GMT)
Easing Color Shifts in Score-Based Diffusion Models [0.0] スコアネットワークにおける非線形バイパス接続の性能を定量化する。
このネットワークアーキテクチャは生成した画像の品質を大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:18:38 GMT)
Development and evaluation of automated localisation and reconstruction
of all fruits on tomato plants in a greenhouse based on multi-view perception
and 3D multi-object tracking [0.0] 本稿では,閉鎖されたアグロフード環境におけるジェネリック表現構築のための新しいアプローチを提案する。
これは検出対象ごとに部分点雲を生成する検出アルゴリズムに基づいており、次いで3次元多目的追跡アルゴリズムが続く。
表象の精度を実環境において評価し,トマトにおけるトマトの表現と局在を成功させた。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 11:44:16 GMT)
Denoising Diffusion Probabilistic Models for Image Inpainting of Cell
Distributions in the Human Brain [0.0] そこで本研究では,細胞-体間染色部の光顕微鏡スキャンにより学習した拡散確率モデル(DDPM)を提案する。
訓練したDDPMは,この目的のために非常にリアルな画像情報を生成でき,可塑性細胞統計と細胞構造パターンを生成できることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:34:04 GMT)
Defining the boundaries: challenges and advances in identifying cells in
microscopy images [0.0] 画像内の物体のアウトライン化は、顕微鏡画像内の細胞の測定と解析において重要なステップである。
Cellposeのようなスペシャリストモデルは、精度とユーザーフレンドリさを改善し続けている。
ディープラーニングベースのツールは、この技術の進歩をますます支配している。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:18:44 GMT)
Deep Learning for Time Series Classification of Parkinson's Disease Eye
Tracking Data [0.0] 我々は、現在最先端のディープラーニングアルゴリズムを用いて、ササード実験による視線追跡データを用いて、パーキンソン病の分類を行う。
モデルが分類課題を学習し、未知の対象に一般化できることが判明した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:03:18 GMT)
Decoherence Limits the Cost to Simulate an Anharmonic Oscillator [0.0] 量子系における位相空間量子干渉に伴う微粒なサブプランク構造をデコヒーレンスで洗い出す方法について検討する。
オープン量子力学は、粗粒の有限差分積分を用いてより効率的にシミュレートすることができる。
この回帰は、非偏極ノイズチャネルのような凸ノイズモデルの形を持っていないことを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:54:32 GMT)
Control of individual electron-spin pairs in an electron-spin bath [0.0] 電子スピン浴における個々のNV中心のコヒーレントなバックアクションを示す。
一対の浴室スピンのダイナミクスを検出し、準備し、制御するために使用します。
我々の実験は、中心スピンのデコヒーレンスを弱める微視的な量子力学を明らかにした。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:36:52 GMT)
Compressing the Backward Pass of Large-Scale Neural Architectures by
Structured Activation Pruning [0.0] この研究は、訓練中のメモリ消費を減らすことを目的として、短命の空間性に焦点を当てている。
我々は,Block Sparse Compressed Row形式の構造化プルーニングとマグニチュードベースの基準を組み合わせて,効率的にプルーンの活性化を行う。
画像分類タスクにおけるResMLPの例として,大規模ニューラルネットワークのトレーニング速度,精度,メモリ使用量を評価することにより,アクティベーションプルーニングの有効性を報告する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 15:31:31 GMT)
Combining critical and quantum metrology [0.0] 本稿では,2つの手法を組み合わせて,閉鎖型・駆動型システムに適用可能な統一プロトコルを提案する。
我々は、量子的および古典的なフィッシャー情報に対する解析式をそのような設定で提供し、解明し、簡単な測定方法を提案する。
これらの結果は、ディックとリプキン・メシュコフ=グリック・ハミルトンの熱力学限界を特徴づけるスキューズ・ハミルトニアン(英語版)に焦点をあてて示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 04:21:39 GMT)
ClimateX: Do LLMs Accurately Assess Human Expert Confidence in Climate
Statements? [0.0] 気候ステートメントにおけるエキスパート信頼度(Expert Confidence in Climate Statements, ClimateX)データセットは,8094気候ステートメントからなる,新規でキュレートされた専門家ラベル付きデータセットである。
このデータセットを用いて,近年のLarge Language Models (LLMs) は,気候関連文における人間の専門家の信頼度を分類できることを示す。
全体として、モデルは、低信頼と中自信のステートメントに一貫性があり、重要な自信を示します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:26:57 GMT)
Charge transport battery with quantum feedback [0.0] 我々は,2つの電極が異なる化学ポテンシャルで帯電し,マルコフ量子フィードバックプロトコルによって最適化された2つの量子ドット列における量子バッテリの実現について検討した。
また、フォノン環境との相互作用が電池の充電・放電過程に及ぼす影響についても検討した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:44:49 GMT)
Cavity optomechanics in ultrastrong light matter coupling regime:
Self-alignment and collective rotation mediated by Casimir torque [0.0] 光学キャビティ内に量子二量体を配置する。
まず、光子の放出と再吸収によって媒介される二量体間の角運動量の交換が二量体のアライメントにつながると予測する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 13:57:06 GMT)
Calabi-Yau Four/Five/Six-folds as $\mathbb{P}^n_\textbf{w}$
Hypersurfaces: Machine Learning, Approximation, and Generation [0.0] この研究において、重みシステムからカラビ・ヤウ・ホッジ数を学ぶためにニューラルネットワークが実装された。
近似は常に厳密な下限を提供しており、計算が劇的に速いことが示されている。
重みシステムの相補的なデータセットが構築され、IP、反射率、および可視性特性が考慮された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:00:00 GMT)
COVID-19 detection using ViT transformer-based approach from Computed
Tomography Images [0.0] 我々は,CT画像を用いた新型コロナウイルス診断の精度と効率を高めるための新しいアプローチを提案する。
224x224サイズの入力画像に対して設定されたベースViT変換器を用いて、バイナリ分類タスクに適合するように出力を変更する。
本手法では,患者のCTスライスをCOVID-19または非COVID-19に分類し,系統的な患者レベルの予測戦略を実装した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 08:45:13 GMT)
Bulk-Measurement-Induced Boundary Phase Transition in Toric Code and
Gauge-Higgs Model [0.0] 筒状形状下のトーリック符号におけるバルク射影測定による境界位相遷移の研究を報告する。
バルク量子ビットの局所的な測定の頻度が増加するにつれて、境界上のスピングラス型長距離秩序が自然対称性の破れを示す。
バルク中の相転移についても検討し, 境界遷移との関係について考察した。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:04:17 GMT)
Black holes as tools for quantum computing by advanced extraterrestrial
civilizations [0.0] すべての十分に進んだ文明は、最終的にブラックホールを量子コンピュータに採用している。
伴うホーキング放射は粒子種では民主的である。
これはSETIにとって新しい道であり、それは重力によってのみ世界と相互作用する隠れ粒子の種からなる文明を含む。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:20:19 GMT)
Bidirectional Reactive Programming for Machine Learning [0.0] リアクティブ言語は、環境と継続的に同時に対話するシステムのプログラミングに特化しています。
後方再帰を可能にする対称反応性構造を導入する。
逆モードの自動微分、バックプロパゲーション、バッチ正規化、双方向リカレントニューラルネットワーク、トレーニングおよび強化学習アルゴリズムは、すべて双方向リアクティブプログラムとして自然にキャプチャされる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 17:25:16 GMT)
Beyond Labels: Advancing Cluster Analysis with the Entropy of Distance
Distribution (EDD) [0.0] 距離分布のエントロピー(Entropy of Distance Distribution、EDD)は、ラベルフリークラスタリング分析におけるパラダイムシフトである。
本手法ではシャノン情報エントロピーを用いて,データセット内の距離分布の「ピーク性」や「平坦性」を定量化する。
EDDのポテンシャルは、従来のクラスタリング分析を超えて、複雑なデータ構造を解き放つための堅牢でスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:22:17 GMT)
Artificial intelligence discovery of a charging protocol in a micromaser
quantum battery [0.0] 本稿では,量子電池のモデル依存パラメータを最適化するための勾配に基づく一般計算フレームワークを提案する。
ヒルベルト宇宙室上層部の電池を制御・自動的に安定化させる充電プロトコルが発見された。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:09:44 GMT)
Anti-Sexism Alert System: Identification of Sexist Comments on Social
Media Using AI Techniques [0.0] ソーシャルメディア(新聞記事のコメント、ソーシャルネットワークなど)に投稿された性的なコメントは、通常多くの注目を集め、ウイルスに感染し、関係者に被害を与える。
本稿では,自然言語処理(NLP)と人工知能(AI)に基づく反性行為警告システムを提案する。
このシステムはあらゆる公開投稿を分析し、性差別的なコメントと見なせるかどうかを判断する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 19:48:46 GMT)
Analyzing the collective emission of a Rydberg-blockaded single-photon
source based on an ensemble of thermal atoms [0.0] マイクロセル中のルビジウム原子の熱蒸気中の単一光子源の実現可能性について数値解析を行った。
3つの長方形レーザーパルスによる励起過程において、系のコヒーレントダイナミクスをヒルベルト空間でシミュレートする。
単一励起の集団崩壊は高速かつ指向的な光子放出につながり、さらにスピンエコーに類似したパルス列は光子の方向性を高める。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:57:49 GMT)
Almost Equivariance via Lie Algebra Convolutions [0.0] 我々は、現在の文献と異なるほぼ同値の定義を提供する。
リー群のリー代数に訴えることにより、モデルのほぼ同値を符号化する実用的な方法を与える。
我々は2つの存在定理を証明し、1つは一般多様体の等距離の有界距離におけるほぼ等距離の存在を示し、もう1つはヒルベルト空間の逆を示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 03:13:42 GMT)
Adversarial Distribution Balancing for Counterfactual Reasoning [0.0] 反実的推論のための機械学習アプローチは、非ランダムな治療管理による未観測結果と分布差の両方に対処する必要がある。
本稿では,ADBCR(Adversarial Distribution Balancing for Counterfactal Reasoning)を提案する。
ADBCRは3つのベンチマークデータセット上で最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 09:12:37 GMT)
Advancing State of the Art in Language Modeling [0.0] 一般化は統計言語モデリング研究の最も重要な目標であることは間違いない。
オープンソースコードで公開された公開ベンチマークと論文は、この分野を前進させる上で重要なものだ。
本稿では,一般化の観点から言語モデリングにおける最先端技術を支援するための,シンプルなフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 12:30:43 GMT)
Addressing the Impact of Localized Training Data in Graph Neural
Networks [0.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習において顕著な成功を収めた。
本稿では,グラフの局所化部分集合に対するGNNのトレーニングの影響を評価することを目的とする。
本稿では,局所化学習データとグラフ推論との分散不一致を最小化する正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:59:01 GMT)
Adaptive Bayesian Learning with Action and State-Dependent Signal
Variance [0.0] この原稿は、行動と状態依存的な信号分散を意思決定モデルに組み込むことにより、ベイズ学習の先進的な枠組みを提示する。
この枠組みは、様々な経済システムにおける複雑なデータフィードバックループと意思決定プロセスを理解する上で重要である。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:29:09 GMT)
A nonlinear frequency shift caused by asymmetry of the coherent
population trapping resonance: a generalization [0.0] 非対称スペクトルの多色光場により誘導されるコヒーレント集団トラップ共鳴について検討する。
一般的な場合、信号の周波数は共鳴の非対称性による光場の強度に非線形に依存する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:05:34 GMT)
A formula for the overlap between Generalized Coherent States of any
rank one simple Lie algebra [0.0] コヒーレント状態の集合から半古典的行動の出現を示す。
代数とその表現に依存するパラメータが大きくなると、それが常に起こることを検証します。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 00:18:59 GMT)
A Distribution-Based Threshold for Determining Sentence Similarity [0.0] 本稿では,意味的テキスト類似性(STS)問題に対する解決法を提案する。
このソリューションは、シアムアーキテクチャに基づくニューラルネットワークの使用を中心に展開され、類似した文と異なる文のペア間の距離の分布を生成する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 10:42:35 GMT)
A Characterization of State Transfer on Double Subdivided Stars [0.0] 本研究は、二重星$T_l,m$上の量子状態移動の存在について述べる。
我々は、その固有値の線形独立性を解析し、二重分割された恒星では完全な状態転移が見られないことを明らかにした。
そして、かなり良好な状態転移を示す二重星の完全な特徴を定めます。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 05:47:02 GMT)
A Brief History of Prompt: Leveraging Language Models. (Through Advanced
Prompting) [0.0] 私たちは、何年にもわたって急進的なエンジニアリングを形作った重要な発展を辿っている。
2018年と2019年の重要なコントリビューションについて検討し、微調整戦略、コントロールコード、テンプレートベースの生成に重点を置いている。
また、フェアネス、人間とAIのコラボレーション、低リソース適応の重要性の増大についても論じる。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 18:27:54 GMT)
A Baseline Analysis of Reward Models' Ability To Accurately Analyze
Foundation Models Under Distribution Shift [0.0] 我々は、分配シフトによる報酬モデルの性能への影響を評価する。
OODプロンプトと応答による新しい校正パターンと精度低下を示す。
我々は,これらの分布変化をプロンプトや応答で検出するために,分類によく用いられるOOD検出手法を報酬モデル設定に適用する。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 21:04:36 GMT)
30 W ultra-stable laser light at 2128 nm for future gravitational-wave
observatories [0.0] 2128nmの波長で30W近い波長の超安定レーザー光を発生させることを報告した。
アモルファスシリコンと窒化ケイ素からなるコーティングは、重力波検出器と光時計の両方に効果がある。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 20:38:17 GMT)
2-Level Reinforcement Learning for Ships on Inland Waterways [0.0] このフレームワークは、高レベルローカルパス計画(LPP)ユニットと低レベルパス追従(PF)ユニットの2つのレベルから構成される。
LPPエージェントは、近くの船舶、交通規則、水路の幾何学を考慮に入れた経路を計画する責任がある。
PF剤は、浅い水の影響や環境力の風、波、電流を考慮しつつ、低レベルのアクチュエータ制御を行う。
論文参考訳(メタデータ) (Tue, 28 Nov 2023 14:27:38 GMT)