Competition-Level Problems are Effective LLM Evaluators [124.8] 本稿では,Codeforcesにおける最近のプログラミング問題の解決において,大規模言語モデル(LLM)の推論能力を評価することを目的とする。
まず,問題の発生時間,難易度,遭遇したエラーの種類など,様々な側面を考慮して,GPT-4の望ましくないゼロショット性能を総合的に評価する。
驚くべきことに、GPT-4のTheThoughtivedのパフォーマンスは、2021年9月以降、あらゆる困難と種類の問題に対して一貫して問題が減少するような崖を経験している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:44:19 GMT)
MagicStick: Controllable Video Editing via Control Handle
Transformations [109.3] MagicStickは、抽出した内部制御信号の変換を利用してビデオプロパティを編集する、制御可能なビデオ編集方法である。
統合フレームワークにおける多数の実例について実験を行った。
また、形状対応テキストベースの編集や手作り動画生成と比較し、従来の作品よりも優れた時間的一貫性と編集能力を示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:58:06 GMT)
Describing Differences in Image Sets with Natural Language [106.2] モデルの振る舞いを理解し、データセットを分析するためには、セットレベルの差異を識別することが不可欠である。
本稿では、まずイメージをキャプションし、言語モデルに差分記述を提案するVisDiffを紹介する。
データセットとモデルにこれまで知られていなかった興味深い違いを見つけることができ、微妙な洞察を明らかにする上で、VisDiffの実用性を示すことができます。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:16 GMT)
GaussianDreamer: Fast Generation from Text to 3D Gaussians by Bridging
2D and 3D Diffusion Models [106.1] 2Dおよび3D拡散モデルは、プロンプトに基づいて適切な3Dオブジェクトを生成することができる。
3次元拡散モデルには優れた3次元整合性があるが、トレーニング可能な3次元データは高価で入手が難しいため、その品質と一般化は制限されている。
本稿では,2種類の拡散モデルから近年の明示的かつ効率的な3次元ガウススプラッティング表現を通じて電力を橋渡ししようとする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:22:57 GMT)
LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Models [105.7] 大規模マルチモーダルモデル(LMM)のグラウンド化能力はますます認識されている。
問題は、グラウンドド・ビジュアル・チャット(GVC)のためのデータセットがないことだ。
私たちはグラウンドとチャット機能を組み合わせられるGVCデータを作成しました。
我々のモデルは、RefCOCO/+/gやFlickr30K Entitiesのような古典的なグラウンドベンチマーク上での競合性能を実現している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:29:31 GMT)
InfoBot: Transfer and Exploration via the Information Bottleneck [105.3] 強化学習における中心的な課題は、報酬がわずかに分散されたタスクに対する効果的なポリシーを見つけることである。
我々は、事前の経験から意思決定状態について学ぶことを提案する。
この単純なメカニズムは、部分的に観察された状態であっても、決定状態を効果的に識別する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:00:24 GMT)
ReconFusion: 3D Reconstruction with Diffusion Priors [104.7] 本稿では,数枚の写真を用いて現実のシーンを再構成するReconFusionを提案する。
提案手法は,合成および多視点データセットに基づいて訓練された新規なビュー合成に先立って拡散を利用する。
本手法は,観測領域の外観を保ちながら,非拘束領域における現実的な幾何学とテクスチャを合成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:58 GMT)
Efficient Online Data Mixing For Language Model Pre-Training [101.5] 既存のデータ選択方法は、遅くて計算コストのかかるプロセスに悩まされる。
一方、データミキシングは、データポイントをまとめることで、データ選択の複雑さを低減する。
我々は,データ選択とデータ混合の両要素を組み合わせたオンラインデータ混合(ODM)の効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:42:35 GMT)
Let's Think Outside the Box: Exploring Leap-of-Thought in Large Language
Models with Creative Humor Generation [100.9] Chain-of-Thought(CoT)は、大きな言語モデルをステップバイステップで推論し、その論理的推論能力を動機付ける。
大規模言語モデル(LLM)におけるLeap-of-Thought(LoT)能力について検討する。
LoTは、強い結びつきと知識の飛躍を含む、シークエンシャルで創造的なパラダイムである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:41:57 GMT)
AlignBench: Benchmarking Chinese Alignment of Large Language Models [100.3] 中国語大言語モデルのアライメントを評価するための総合ベンチマークであるAlignBenchを紹介する。
筆者らのベンチマークでは,多次元LCM-as-JudgeとChain-of-Thoughtを用いて,説明と最終評価を評価として用いた。
GPT-4の評価能力の95%を回復する中国専用評価器LLMであるCritiqueLLMによるAlignBenchの評価を報告する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:04:15 GMT)
Multi-task Image Restoration Guided By Robust DINO Features [98.7] DINOv2から抽出したロバストな特徴を利用した新しいマルチタスク画像復元手法であるmboxtextbfDINO-IRを導入する。
実験により,DINOv2の浅部特徴は低レベル画像の特徴が豊富であるが,深部特徴は劣化に敏感な頑健な意味表現を保証していることがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:46:12 GMT)
DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.9] 我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:07:32 GMT)
Zero-Shot Point Cloud Registration [94.4] ZeroRegは、ポイントクラウドデータセットのトレーニングを不要にする最初のゼロショットポイントクラウド登録アプローチである。
ZeroRegの基盤は、キーポイントからポイントクラウドへの画像特徴の新たな移行であり、三次元幾何学的近傍からの情報を集約することによって強化されている。
3DMatch、3DLoMatch、ScanNetなどのベンチマークでは、ZeroRegはそれぞれ84%、46%、75%という印象的なリコール比(RR)を達成した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:33:16 GMT)
Machine Reading Comprehension using Case-based Reasoning [92.5] 本稿では,機械読解における解答抽出の正確かつ解釈可能な手法を提案する。
本手法は,類似した質問に対する文脈的回答が相互に意味的類似性を共有するという仮説に基づいている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:59:58 GMT)
Neural Priming for Sample-Efficient Adaptation [92.1] ニューラルプライミング(Neural Priming)は、大規模な事前学習されたモデルを分散シフトや下流タスクに適応させる手法である。
ニューラルプライミングは、LAION-2Bほどの大きさの事前訓練であっても、テスト時に行うことができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:24:56 GMT)
Is Ego Status All You Need for Open-Loop End-to-End Autonomous Driving? [88.4] エンドツーエンドの自動運転は、フルスタックの観点から自律性を目標とする、有望な研究の方向性として浮上している。
比較的単純な駆動シナリオを特徴とするnuScenesデータセットは、エンド・ツー・エンド・モデルにおける知覚情報の未使用化につながる。
予測軌跡が道路に付着するかどうかを評価するための新しい指標を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:32:31 GMT)
Compositional Generalization for Data-to-Text Generation [86.8] 本稿では,群に述語をクラスタ化することで構成一般化に対処する新しいモデルを提案する。
本モデルでは,1つの述語を1度に1つのクラスタに依存して文単位でテキストを生成する。
すべての評価指標でT5ベースラインをはるかに上回る。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:23:15 GMT)
PromptonomyViT: Multi-Task Prompt Learning Improves Video Transformers
using Synthetic Scene Data [85.5] 本稿では,映像理解を改善するために合成シーンデータを活用する手法を提案する。
本稿では,ビデオトランスのためのマルチタスク・プロンプト学習手法を提案する。
複数のビデオ理解タスクやデータセットに対して,高いパフォーマンス向上を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:40:59 GMT)
RESIN-EDITOR: A Schema-guided Hierarchical Event Graph Visualizer and
Editor [82.0] 本稿では,対話型イベントグラフビジュアライザであるRESIN-EDITORについて紹介する。
RESIN-EDITORのユニークな特徴は、階層グラフの可視化、包括的なソーストレース、インタラクティブなユーザー編集である。
ソースコード、ビデオデモ、RESIN-EDITORのライブウェブサイトが公開されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:25:38 GMT)
Large Language Models on Graphs: A Comprehensive Survey [81.8] 大規模言語モデル(LLM)は、自然言語処理の大幅な進歩を生み出している。
本稿では,グラフ上の大規模言語モデルに関連するシナリオと手法を体系的にレビューする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:14:27 GMT)
Nash Learning from Human Feedback [80.9] ペアワイズフィードバックを用いた大規模言語モデルの微調整のための代替パイプラインを提案する。
我々はこのアプローチを人間のフィードバックからナッシュラーニング(NLHF)と呼ぶ。
ミラー降下原理に基づく新しいアルゴリズム解であるNash-MDを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:05:06 GMT)
Stable Segment Anything Model [79.9] SAM(Segment Anything Model)は、高品質なプロンプトが与えられた場合、顕著に迅速なセグメンテーションを実現する。
本稿では,SAMのセグメンテーション安定性について,多様なプロンプト特性のスペクトルにわたって包括的解析を行った。
1)SAMのセグメンテーション安定性を広範囲に改善し,2)SAMの強力なセグメンテーション効率と一般化を維持した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:57:17 GMT)
Simplifying Neural Network Training Under Class Imbalance [77.4] 実世界のデータセットは、しばしば高いクラス不均衡であり、ディープラーニングモデルのパフォーマンスに悪影響を及ぼす可能性がある。
クラス不均衡下でのニューラルネットワークのトレーニングに関する研究の大部分は、特殊な損失関数、サンプリング技術、または2段階のトレーニング手順に焦点を当てている。
バッチサイズやデータ拡張,ラベルの平滑化といった,標準的なディープラーニングパイプラインの既存のコンポーネントを単にチューニングするだけで,そのような特殊なクラス不均衡な手法を使わずに,最先端のパフォーマンスを達成できることを実証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:52:44 GMT)
Diffusion-SS3D: Diffusion Model for Semi-supervised 3D Object Detection [77.2] 半教師付き3次元物体検出のための拡散モデルを用いて,擬似ラベルの品質向上に向けた新たな視点であるDiffusion-SS3Dを提案する。
具体的には、劣化した3Dオブジェクトサイズとクラスラベル、分布を生成し、拡散モデルをデノナイズプロセスとして利用し、バウンディングボックス出力を得る。
我々は,ScanNetとSUN RGB-Dベンチマークデータセットの実験を行い,既存手法に対する最先端性能の実現を実証した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:54:03 GMT)
Towards More Unified In-context Visual Understanding [77.0] マルチモーダル出力を有効にした視覚理解のための新しいICLフレームワークを提案する。
まず、テキストと視覚的プロンプトの両方を量子化し、統一された表現空間に埋め込む。
次にデコーダのみのスパーストランスアーキテクチャを用いて生成モデリングを行う。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:02:21 GMT)
Multitask Learning Can Improve Worst-Group Outcomes [76.9] マルチタスク学習(MTL)は、そのような広く使われている技法の一つである。
我々は、MTLが最悪のグループ精度に与える影響を理解する。
共同表現空間を正規化することで標準MTLを変更することを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:38:24 GMT)
GPT4Point: A Unified Framework for Point-Language Understanding and
Generation [76.6] GPT4PointはMLLMフレームワーク内での3Dオブジェクトの理解と生成のための画期的なポイント言語マルチモーダルモデルである。
GPT4Pointは強力な3D MLLMであり、ポイントクラウドキャプションやQ&Aのような様々なポイントテキスト参照タスクをシームレスに実行できる。
幾何学的な形状や色を維持する低品質のポイントテキスト機能によって、高品質な結果が得られる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:55 GMT)
DeepInception: Hypnotize Large Language Model to Be Jailbreaker [74.5] 本稿では,大規模言語計算モデル(LLM)をジェイルブレーカーとして容易に催眠し,その誤用リスクを解消する,DeepInceptionと呼ばれる軽量な手法を提案する。
DeepInceptionは、以前のものと競合するジェイルブレイクの成功率を実現し、その後のインタラクションにおいて継続的なジェイルブレイクを実現することができます。
我々の調査は、LCMの安全面と誤用リスクに対する防御強化にもっと注意を払うべきだと訴えている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:35:24 GMT)
Fine-grained Controllable Video Generation via Object Appearance and
Context [74.2] 細粒度制御可能なビデオ生成法(FACTOR)を提案する。
FACTORは、オブジェクトの位置とカテゴリを含む、オブジェクトの外観とコンテキストを制御することを目的としている。
本手法は,オブジェクトの外観を微調整せずに制御し,オブジェクトごとの最適化作業を省く。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:47:33 GMT)
LooseControl: Lifting ControlNet for Generalized Depth Conditioning [73.8] 拡散に基づく画像生成のための一般化深度条件付けを可能にするLooseControlを提案する。
深度条件付き画像生成のためのSOTAであるControlNetは、顕著な結果をもたらすが、ガイダンスのための詳細な深度マップへのアクセスに依存している。
E1)3Dボックス編集により、画像のスタイルを凍結しながら、ボックスを変更、追加、削除することで、画像の精細化が可能になる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:00:20 GMT)
VideoDubber: Machine Translation with Speech-Aware Length Control for
Video Dubbing [73.6] ビデオダビングは、映画やテレビ番組のオリジナルスピーチをターゲット言語の音声に変換することを目的としている。
翻訳された音声が対応するビデオと適切に一致するようにするためには、翻訳された音声の長さ/順を元の音声にできるだけ近づけるべきである。
本稿では,ビデオダビング作業に適した機械翻訳システムを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:24:29 GMT)
DiffusionPCR: Diffusion Models for Robust Multi-Step Point Cloud
Registration [73.4] ポイントクラウド登録(PCR)は、2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では, PCR を拡散確率過程として定式化し, ノイズ変換を基礎的真理にマッピングする。
実験ではDiffusionPCRの有効性を示し,3Dおよび3DLoMatchに対する最先端の登録リコール率(95.3%/81.6%)を得た。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:41 GMT)
DreamVideo: High-Fidelity Image-to-Video Generation with Image Retention
and Text Guidance [73.2] 本稿では,事前学習した映像拡散モデルに基づいてフレーム保持分岐を考案し,高忠実度映像生成手法を提案する。
我々のモデルは強力な画像保持能力を持ち、他の画像-映像モデルと比較してUCF101のFVDが高い。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:16:31 GMT)
Projection Regret: Reducing Background Bias for Novelty Detection via
Diffusion Models [72.1] 本研究では,非意味情報のバイアスを緩和する効率的な新規性検出手法であるemphProjection Regret(PR)を提案する。
PRは、テスト画像とその拡散ベースの投影の間の知覚距離を計算し、異常を検出する。
拡張実験により、PRは生成モデルに基づく新規性検出手法の先行技術よりも有意なマージンで優れていることが示された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:44:47 GMT)
Exploring Social Bias in Downstream Applications of Text-to-Image
Foundation Models [72.1] 合成画像を用いて、社会的バイアスに対するテキスト・画像モデル、画像編集と分類の2つの応用を探索する。
提案手法を用いて,最先端のオープンソーステキスト・ツー・イメージ・モデルであるtextitStable Diffusion における有意義かつ有意義なセクション間社会的バイアスを明らかにする。
本研究は、下流業務・サービスにおけるテキスト・ツー・イメージ基盤モデルの導入について、未発表の点に注意を払っている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:36:49 GMT)
Hulk: A Universal Knowledge Translator for Human-Centric Tasks [71.9] 我々は、最初のマルチモーダルな人間中心ジェネラリストモデルであるハルクを提示する。
2Dビジョン、3Dビジョン、スケルトンベース、視覚言語タスクをカバーしている。
ハルクは人間中心のタスクをモダリティの翻訳として扱い、幅広いタスクに知識を統合する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:37:25 GMT)
DGInStyle: Domain-Generalizable Semantic Segmentation with Image
Diffusion Models and Stylized Semantic Control [71.6] DGInStyleと呼ばれる効率的なデータ生成パイプラインを提案する。
街路シーンの多様なデータセットを生成し、ドメインに依存しないセマンティックセマンティックセマンティクスモデルをトレーニングし、人気のある自動運転データセット上でモデルを評価する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:34:12 GMT)
ChatGPT's One-year Anniversary: Are Open-Source Large Language Models
Catching up? [71.1] ChatGPTは、AIのランドスケープ全体において、地震的な変化をもたらした。
モデルは人間の質問に答え、幅広いタスクのパネルで指示に従うことができることを示した。
クローズドソースのLLMは一般的にオープンソースよりも優れていますが、後者の進歩は急速に進んでいます。
これは研究だけでなく、ビジネスにも重要な意味を持つ。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:58:46 GMT)
Machine Vision Therapy: Multimodal Large Language Models Can Enhance
Visual Robustness via Denoising In-Context Learning [71.1] 本稿では,視覚モデルからノイズ予測を補正するマシンビジョンセラピーを提案する。
復調ラベルを微調整することにより、教師なしの方法で学習モデルの性能を高めることができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:29:14 GMT)
Towards Automatic Power Battery Detection: New Challenge, Benchmark
Dataset and Baseline [70.3] PBD(パワーバッテリ検出)と呼ばれる新しいタスクに関する総合的研究を行う。
X線画像から高密度陰極と陽極板のエンドポイントをローカライズし、電池の品質を評価することを目的としている。
我々は,多次元協調ネットワーク(MDCNet)と呼ばれるPBDのための新しいセグメンテーションベースソリューションを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:18:38 GMT)
LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models [67.6] LongLoRAは、トレーニング済みの大規模言語モデルのコンテキストサイズを拡張する、効率的な微調整アプローチである。
7B/13Bから70BまでのLlama2モデル上での各種タスクに対する実験結果が強かった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:12:50 GMT)
Mismatch Quest: Visual and Textual Feedback for Image-Text Misalignment [67.3] 本稿では,検出されたテキストと画像のペア間の相違点の詳細な説明を行う。
我々は、大きな言語モデルと視覚的接地モデルを活用して、与えられた画像に対して妥当なキャプションを保持するトレーニングセットを自動構築する。
また,テキストと視覚的ミスアライメントアノテーションを組み合わせた新たな人為的なテストセットも公開する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:07:34 GMT)
Towards More Practical Group Activity Detection: A New Benchmark and
Model [67.1] グループアクティビティ検出(グループアクティビティ検出、英: Group Activity Detection、GAD)は、ビデオにおいて、各グループのメンバを特定し、同時にグループのアクティビティを分類するタスクである。
Caf'eと呼ばれる新しいデータセットを提示し、より実用的な評価シナリオとメトリクスを提示します。
また、未知数のグループと潜在グループメンバーを効率的に効率的に扱う新しいGADモデルを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:48:17 GMT)
Generator Born from Classifier [66.6] データサンプルに頼ることなく、イメージジェネレータを再構築することを目指している。
本稿では,ネットワークパラメータの収束条件を満たすために,ジェネレータを訓練する新しい学習パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:41:17 GMT)
Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning [65.3] 視覚、言語、音声などのデータに富む領域では、ディープラーニングが高性能なタスク固有モデルを提供するのが一般的である。
リソース制限されたドメインでのディープラーニングは、(i)限られたデータ、(ii)制約付きモデル開発コスト、(iii)効果的な微調整のための適切な事前学習モデルの欠如など、多くの課題に直面している。
モデル再プログラミングは、ソースドメインから十分に訓練されたモデルを再利用して、モデル微調整なしでターゲットドメインのタスクを解くことで、リソース効率のよいクロスドメイン機械学習を可能にする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:01:05 GMT)
Diversified in-domain synthesis with efficient fine-tuning for few-shot
classification [64.9] 画像分類は,クラスごとのラベル付き例の小さなセットのみを用いて,画像分類器の学習を目的としている。
合成データを用いた数ショット学習における一般化問題に対処する新しいアプローチである DisEF を提案する。
提案手法を10種類のベンチマークで検証し,ベースラインを一貫して上回り,数ショット分類のための新しい最先端の手法を確立した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:18:09 GMT)
AV2AV: Direct Audio-Visual Speech to Audio-Visual Speech Translation
with Unified Audio-Visual Speech Representation [64.1] システムの入力と出力はマルチモーダル(音声と視覚)である
私たちは、自分の主要言語を利用することで、仮想ミーティングで世界中の個人とリアルタイムな会話を行うことができます。
音声モダリティのみを翻訳する音声音声合成(A2A)とは対照的に,提案したAV2AVは音声・視覚音声を直接翻訳する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:36:44 GMT)
EtC: Temporal Boundary Expand then Clarify for Weakly Supervised Video
Grounding with Multimodal Large Language Model [63.9] 不完全な境界を拡大する上で、より価値のある情報を導入しながら、元の時間的内容の整合性を維持する新しい視点を提案する。
ビデオの連続性、すなわち隣接するフレーム間の視覚的類似性により、我々は、初期擬似境界内で各フレームにアノテートするために強力なマルチモーダル大言語モデル(MLLM)を使用する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:15:56 GMT)
Drag-A-Video: Non-rigid Video Editing with Point-based Interaction [63.8] そこで我々はDrag-A-Videoと呼ばれるインタラクティブなポイントベースビデオ操作のための拡散に基づく新しい手法を提案する。
本手法では,入力ビデオの第1フレームのマスクだけでなく,ハンドポイントとターゲットポイントのペアをクリックできる。
映像の内容を正確に修正するために,ビデオの機能を更新するために,新しい映像レベルのモーションインスペクタを用いる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:05:59 GMT)
FastPillars: A Deployment-friendly Pillar-based 3D Detector [63.1] 既存のBEVベースの(つまりバードアイビュー)検出器は、トレーニングと推論を高速化するためにスパース・コンボリューション(SPConv)を好む。
FastPillarsは、CenterPoint(SPConvベース)よりも1.8倍のスピードアップと3.8mAPH/L2の改善で、Openデータセットの最先端の精度を提供する
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:58:06 GMT)
Multimodal Prompt Perceiver: Empower Adaptiveness, Generalizability and
Fidelity for All-in-One Image Restoration [62.3] MPerceiverは、オールインワン画像復元のための適応性、一般化性、忠実性を高めるための新しいマルチモーダル・プロンプト学習手法である。
MPerceiverは、オールインワンIRの9つのタスクでトレーニングされ、ほとんどのタスクで最先端のタスク固有のメソッドより優れています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:47:11 GMT)
Prompt2NeRF-PIL: Fast NeRF Generation via Pretrained Implicit Latent [61.6] 本稿では,3次元シーンの直接条件付けと高速なNeRFパラメータ生成のための高速なNeRF生成について検討する。
Prompt2NeRF-PILは、単一の前方通過で様々な3Dオブジェクトを生成することができる。
我々は,テキストからNeRFモデルDreamFusionと画像からNeRF手法Zero-1-to-3の3次元再構成速度を3倍から5倍に高速化することを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:32:46 GMT)
Visually Grounded Language Learning: a review of language games,
datasets, tasks, and models [60.3] 多くのVision+Language (V+L)タスクは、視覚的モダリティでシンボルをグラウンドできるモデルを作成することを目的として定義されている。
本稿では,V+L分野において提案されるいくつかの課題とモデルについて,系統的な文献レビューを行う。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:17:29 GMT)
DreaMo: Articulated 3D Reconstruction From A Single Casual Video [59.9] 対象者の視界が不完全である単一かつカジュアルに捉えたインターネットビデオから3次元形状の連続的再構成について検討した。
DreaMoは、ノベルビューレンダリング、詳細な形状復元、骨格生成において有望な品質を示している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:47:37 GMT)
Revisit Human-Scene Interaction via Space Occupancy [59.7] HSI(Human-Scene Interaction)の生成は、さまざまな下流タスクに不可欠な課題である。
本研究では,シーンとのインタラクションが,抽象的な物理的視点からシーンの空間占有と本質的に相互作用していることを論じる。
純粋な動きシーケンスを、見えないシーン占有と相互作用する人間の記録として扱うことで、動きのみのデータを大規模にペア化された人間-占有相互作用データベースに集約することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:03:00 GMT)
Rank-without-GPT: Building GPT-Independent Listwise Rerankers on
Open-Source Large Language Models [59.5] 大型言語モデル(LLM)に基づくリストワイズリランカはゼロショットの最先端である。
本研究では,GPTに依存しないリストワイズリランカを初めて構築する。
GPT-3.5に基づくリストワイド・リランカを13%上回り, GPT-4をベースとしたリストワイド・リランカの97%の有効性を実現した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:57:40 GMT)
Spatial-Temporal Enhanced Transformer Towards Multi-Frame 3D Object
Detection [59.0] 我々は、DETRのようなパラダイムに基づいた、多フレーム3Dオブジェクト検出のための新しいエンドツーエンドフレームワークであるSTEMDを提案する。
具体的には、オブジェクト間の空間的相互作用と複雑な時間的依存をモデル化するために、空間的時間的グラフアテンションネットワークを導入する。
我々は,計算オーバーヘッドをわずかに加えるだけで,難解なシナリオに対処する手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:28:55 GMT)
GauHuman: Articulated Gaussian Splatting from Monocular Human Videos [58.6] GauHumanは、高速トレーニング(12分)とリアルタイムレンダリング(最大189FPS)の両方のためのガウススプラッティングを備えた3次元人体モデルである。
ガウフマンはカノニカル空間でガウススプラッティングを符号化し、3次元ガウスを線形ブレンドスキンニング(LBS)で正標準空間からポーズ空間に変換する
ZJU_MocapとMonoCapデータセットの実験は、GauHumanが高速なトレーニングとリアルタイムレンダリング速度によって、最先端のパフォーマンスを定量的に質的に達成していることを示している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:14 GMT)
GIT-Net: Generalized Integral Transform for Operator Learning [58.1] 本稿では、部分微分方程式(PDE)演算子を近似するディープニューラルネットワークアーキテクチャであるGIT-Netを紹介する。
GIT-Netは、PDEを定義するためによく使われる微分作用素が、特殊機能基底で表現されるときに、しばしば同義的に表現されるという事実を利用する。
数値実験により、GIT-Netは競争力のあるニューラルネットワーク演算子であり、様々なPDE問題に対して小さなテストエラーと低い評価を示すことが示された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:03:54 GMT)
Breast Ultrasound Report Generation using LangChain [58.1] 本稿では,Large Language Models (LLM) を用いたLangChainによる複数の画像解析ツールを胸部報告プロセスに統合することを提案する。
本手法は,超音波画像から関連する特徴を正確に抽出し,臨床的文脈で解釈し,包括的で標準化された報告を生成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:28:26 GMT)
Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.7] クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:44:36 GMT)
Neural Sign Actors: A diffusion model for 3D sign language production
from text [54.0] 手話は難聴者や難聴者のコミュニティにとって主要なコミュニケーション手段である。
深層学習はSL認識と翻訳の多くの手法を支援しており、顕著な成果を上げている。
この研究は、現実的なニューラルサインアバターに向けて重要かつ必要なステップを示し、聴覚と聴覚のコミュニティ間のコミュニケーションギャップを埋める。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:04:34 GMT)
Prompt Optimization via Adversarial In-Context Learning [53.1] adv-ICLは、ジェネレータとディスクリミネータの間の2プレイヤーゲームとして実装される。
ジェネレータは、判別器を騙すのに十分な出力を生成する。
本稿では,Adv-ICLが最先端のプロンプト最適化技術を大幅に改善することを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:44:45 GMT)
Gaussian3Diff: 3D Gaussian Diffusion for 3D Full Head Synthesis and
Editing [53.1] 本稿では,3次元人間の頭部を顕著な柔軟性で生成するための新しい枠組みを提案する。
本手法は,顔の特徴や表情を微妙に編集した多彩でリアルな3次元頭部の作成を容易にする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:05:58 GMT)
End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.8] 本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:21:18 GMT)
Inverse Reinforcement Learning for Text Summarization [52.8] 本稿では,抽象的な要約モデルを学習するための効果的なパラダイムとして,逆強化学習(IRL)を導入する。
異なる領域におけるデータセット間の実験結果は、MLEおよびRLベースラインに対する要約のための提案したIRLモデルの優位性を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:06:17 GMT)
Reconciling AI Performance and Data Reconstruction Resilience for
Medical Imaging [52.6] 人工知能(AI)モデルは、トレーニングデータの情報漏洩に対して脆弱であり、非常に敏感である。
差別化プライバシ(DP)は、定量的なプライバシー予算を設定することで、これらの感受性を回避することを目的としている。
非常に大きなプライバシ予算を使用することで、リコンストラクション攻撃は不可能であり、パフォーマンスの低下は無視可能であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:21:30 GMT)
Alchemist: Parametric Control of Material Properties with Diffusion
Models [51.6] 本手法は,フォトリアリズムで知られているテキスト・イメージ・モデルの生成先行に乗じる。
我々は,NeRFの材料化へのモデルの適用の可能性を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:58:26 GMT)
How should the advent of large language models affect the practice of
science? [51.6] 大規模言語モデルの出現は科学の実践にどのように影響を与えるべきか?
我々は4つの科学者グループを招待し、この質問を反映し、彼らの見解を共有し、議論をおこなった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:45:12 GMT)
LivePhoto: Real Image Animation with Text-guided Motion Control [51.3] この研究はLivePhotoという名前の実用的なシステムを示し、ユーザーが興味のある画像をテキスト記述でアニメーション化することができる。
まず、よく学習されたテキスト・ツー・イメージ・ジェネレータ(すなわち、安定拡散)がさらに入力として画像を取るのを助ける強力なベースラインを確立する。
次に、時間的モデリングのためのモーションモジュールを改良されたジェネレータに装備し、テキストとモーションのリンクをより良くするための、慎重に設計されたトレーニングパイプラインを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:59:52 GMT)
Grounding Everything: Emerging Localization Properties in
Vision-Language Transformers [51.3] 事前学習された視覚言語(VL)モデルでは、微調整なしでゼロショットのオープン語彙オブジェクトローカライゼーションが可能であることを示す。
本稿では,CLIPSurgeryが自己注意経路に導入した価値価値注意の考え方を一般化するグラウンドング・エコノミクス・モジュール(GEM)を提案する。
セマンティックセグメンテーションのための様々なベンチマークタスクとデータセットに基づいて提案したGEMフレームワークを評価する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:39:31 GMT)
One-step Diffusion with Distribution Matching Distillation [50.5] 本稿では,拡散モデルを1ステップ画像生成器に変換する手法である分散マッチング蒸留(DMD)を紹介する。
約KLの発散を最小化することにより,拡散モデルと分布レベルで一致した一段階画像生成装置を強制する。
提案手法は,イメージネット64x64では2.62 FID,ゼロショットCOCO-30kでは11.49 FIDに到達した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:08:36 GMT)
HybridNeRF: Efficient Neural Rendering via Adaptive Volumetric Surfaces [50.4] ニューラル放射場は、最先端のビュー合成品質を提供するが、レンダリングが遅くなる傾向がある。
本稿では,ほとんどの物体を表面としてレンダリングすることで,両表現の強みを生かしたHybridNeRFを提案する。
仮想現実分解能(2Kx2K)のリアルタイムフレームレート(少なくとも36FPS)を達成しながら、エラー率を15~30%改善する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:04:49 GMT)
FRAPP\'E: A Post-Processing Framework for Group Fairness Regularization [50.2] 本稿では, ペナル化対象を持つ任意のインプロセッシング手法をポストプロセッシング手順に変換するための一般的なフレームワークを提案する。
提案手法は,実世界のデータに対して理論的および実験により,処理後の処理方法が,処理中の処理者が提示する公正なエラーのトレードオフに一致するか,あるいは超えるかを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:09:21 GMT)
REST: Enhancing Group Robustness in DNNs through Reweighted Sparse
Training [49.6] ディープニューラルネットワーク(DNN)は様々な領域で有効であることが証明されている。
しかし、彼らは推論中に一部の少数派でうまく行動するのに苦労することが多い。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:27:54 GMT)
Concept Drift Adaptation in Text Stream Mining Settings: A Comprehensive
Review [49.3] 本研究は,テキストストリームシナリオにおけるコンセプトドリフト適応に関する体系的な文献レビューを行った。
我々は,テキストドリフトカテゴリ,テキストドリフト検出のタイプ,モデル更新機構,宛先ストリームマイニングタスク,テキスト表現の種類,テキスト表現更新機構などの未解決の側面について,40の論文を選択した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:15:16 GMT)
Quantum information spreading in generalised dual-unitary circuits [49.2] 局所演算子は、二重単位回路のように光速で拡散することを示す。
これらの特性を用いて、回路内の絡み合い膜に対する閉形式表現を求める。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:09:27 GMT)
T-Cal: An optimal test for the calibration of predictive models [49.1] 有限検証データセットを用いた予測モデルの誤校正を仮説検証問題として検討する。
誤校正の検出は、クラスの条件付き確率が予測の十分滑らかな関数である場合にのみ可能である。
我々は、$ell$-Expected Error(ECE)のデバイアスドプラグイン推定器に基づくキャリブレーションのためのミニマックステストであるT-Calを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:28:57 GMT)
Adaptive Instrument Design for Indirect Experiments [48.8] RCTとは異なり、間接的な実験は条件付き機器変数を利用して治療効果を推定する。
本稿では,データ収集ポリシーを適応的に設計することで,間接実験におけるサンプル効率の向上に向けた最初のステップについて述べる。
我々の主な貢献は、影響関数を利用して最適なデータ収集ポリシーを探索する実用的な計算手順である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:38:04 GMT)
Rethinking and Simplifying Bootstrapped Graph Latents [48.8] グラフ・コントラッシブ・ラーニング(GCL)はグラフ自己教師型ラーニングにおいて代表的なパラダイムとして登場した。
SGCLは2つの繰り返しの出力を正のペアとして利用するシンプルで効果的なGCLフレームワークである。
我々は,SGCLがより少ないパラメータ,少ない時間と空間コスト,およびかなりの収束速度で競合性能を達成可能であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:49:50 GMT)
ViewRefer: Grasp the Multi-view Knowledge for 3D Visual Grounding with
GPT and Prototype Guidance [48.7] 視覚的グラウンドティングのための多視点フレームワークであるViewReferを提案する。
テキストブランチでは、ViewReferは単一の接地テキストを複数の幾何学的な記述に拡張する。
3次元モードでは、ビュー間でのオブジェクトの相互作用を促進するために、ビュー間の注意を伴うトランスフォーマー融合モジュールが導入された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:34:18 GMT)
Interpretable 2D Vision Models for 3D Medical Images [47.8] 本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:08:45 GMT)
Byzantine-Robust Distributed Online Learning: Taming Adversarial
Participants in An Adversarial Environment [47.6] 本稿では,ビザンチン攻撃下でのオンライン学習について検討する。
本研究では, ビザンチン・ロバスト分散オンラインモーメントアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:06:49 GMT)
Lessons from Usable ML Deployments and Application to Wind Turbine
Monitoring [47.4] 使用可能なML(説明可能なMLを超える1ステップ)を、説明可能なMLを越える1ステップとします。
これらの教訓を風力タービン監視の課題に適用する。
再生可能エネルギー領域におけるMLの現実的影響を実証したい。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:13:50 GMT)
GPT-Driver: Learning to Drive with GPT [47.1] 我々は,OpenAI GPT-3.5モデルを自律走行車のための信頼性の高い運動プランナに変換する,シンプルで効果的なアプローチを提案する。
我々は、Large Language Models(LLMs)固有の強力な推論能力と一般化の可能性に乗じる。
我々は,大規模な nuScenes データセットに対する我々のアプローチを評価し,GPT ベースの運動プランナの有効性,一般化能力,解釈可能性について検証した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:26:29 GMT)
Imitating Shortest Paths in Simulation Enables Effective Navigation and
Manipulation in the Real World [47.0] シミュレーションにおける最短経路プランナーの模倣は、オブジェクトを巧みにナビゲートし、探索し、操作できるエージェントを生み出すことを示す。
この驚くべき結果は、エンドツーエンドのトランスフォーマーベースのSPOCアーキテクチャ、広範な画像拡張と組み合わせた強力なビジュアルエンコーダによって実現されます。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:45 GMT)
Value Functions are Control Barrier Functions: Verification of Safe
Policies using Control Theory [46.9] 本稿では,制御理論から学習値関数への検証手法の適用方法を提案する。
我々は値関数と制御障壁関数の間の関係を確立する原定理を定式化する。
我々の研究は、RLベースの制御システムの汎用的でスケーラブルで検証可能な設計のための公式なフレームワークに向けた重要な一歩である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:47:31 GMT)
DEPN: Detecting and Editing Privacy Neurons in Pretrained Language
Models [46.0] 大量のデータに基づいて事前訓練された大規模な言語モデルは、トレーニングデータ内の豊富な知識と情報をキャプチャする。
事前訓練された言語モデルにおけるデータ記憶と復活の能力は、以前の研究で明らかになったように、データ漏洩のリスクをもたらす。
本稿では,事前学習言語モデルにおけるプライバシニューロンの検出と編集のためのフレームワークDEPNを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:14:24 GMT)
MIND: Multi-Task Incremental Network Distillation [45.7] 本研究では,リプレイフリーソリューションの性能向上を目的としたパラメータ分離手法 MIND を提案する。
以上の結果から,MINDの優れた性能は,クラス増分学習やドメイン増分学習によってもたらされる課題に対処する可能性を示している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:46:52 GMT)
H-GAP: Humanoid Control with a Generalist Planner [45.5] ヒューマノイド一般自動符号化プランナー(Humanoid Generalist Autoencoding Planner、H-GAP)は、人間のモーションキャプチャーデータから派生したヒューマノイド軌道に基づいて訓練された生成モデルである。
56自由度ヒューマノイドでは、H-GAPが幅広い運動行動の表現と生成を学習していることが実証的に証明されている。
また,H-GAPのスケーリング特性に関する実証的研究を行い,データの追加による性能向上の可能性を示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:40:24 GMT)
Supervised learning of spatial features with STDP and homeostasis using
Spiking Neural Networks on SpiNNaker [45.1] 本稿では,スパイキングニューラルネットワーク(SNN)を用いた教師あり学習手法を提案する。
SNNは1つまたは複数のパターンを認識するように訓練され、ネットワークのパフォーマンスを測定するためにパフォーマンスメトリクスが抽出される。
一つのネットワーク上で訓練されたパターンの数が増加するにつれて、識別の精度はこれらのパターンの類似性と関連付けられる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:53:31 GMT)
Understanding Parameter Saliency via Extreme Value Theory [44.8] 畳み込みニューラルネットワーク(CNN)の診断にパラメータ・サリエンシ(パラメータ・サリエンシ)の概念を提案する。
トップランクの有能なフィルタを微調整することで、ImageNetの誤同定を効率よく修正できることが示されている。
しかし、パラメータの正当性ランキングがなぜ誤同定を引き起こすのかを理解するための知識ギャップがまだ残っている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:00:20 GMT)
Customization Assistant for Text-to-image Generation [44.5] 本稿では,新しいモデル設計と新しいトレーニング戦略からなる新しいフレームワークを提案する。
得られたアシスタントは、テストタイムを微調整することなく、2〜5秒でカスタマイズされた生成を行うことができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:54:42 GMT)
MVHumanNet: A Large-scale Dataset of Multi-view Daily Dressing Human
Captures [44.2] MVHumanNetは4,500人の身元からなる多視点人間の行動系列からなるデータセットである。
我々のデータセットには、人のマスク、カメラパラメータ、2Dおよび3Dキーポイント、SMPL/SMPLXパラメータ、および対応するテキスト記述を含む、9000の日次服、6万のモーションシーケンス、645万の豊富なアノテーションが含まれています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:50:12 GMT)
Gaussian Head Avatar: Ultra High-fidelity Head Avatar via Dynamic
Gaussians [44.0] 軽量なスパースビュー設定のための制御可能な3次元ガウスヘッドアバターを提案する。
提案手法は,超過大表現下でも2K解像度での超高忠実なレンダリング品質を実現するため,最先端のスパースビュー法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:01:44 GMT)
Investigating the Catastrophic Forgetting in Multimodal Large Language
Models [43.9] MLLMにおける破滅的忘れの評価のためのMulTimodalityを評価するEMTについて紹介する。
ほぼ全ての評価されたMLLMは、標準的な画像分類タスクにおけるビジョンエンコーダと同じパフォーマンスレベルを維持することができない。
微調整が進むにつれて、MLLMは幻覚し始め、一般化可能性が著しく失われる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:59:33 GMT)
Qualitative Failures of Image Generation Models and Their Application in
Detecting Deepfakes [43.4] 生成した画像の品質と、現実世界に見られるものとの間には、ギャップが残っている。
これらの失敗を理解することで、これらのモデルに改善が必要な領域を特定することができます。
今日の社会におけるディープフェイクの流行は深刻な懸念である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:43:34 GMT)
BIVDiff: A Training-Free Framework for General-Purpose Video Synthesis
via Bridging Image and Video Diffusion Models [43.2] 本稿では,BIVDiffと命名されたトレーニング不要な汎用ビデオ合成フレームワークを提案する。
まず、フレームワイド映像生成に画像拡散モデルを使用し、次いで、生成されたビデオ上でMixed Inversionを行い、最後に、時間的平滑化のためにビデオ拡散モデルに反転潜像を入力する。
BIVDiffの有効性と汎用性を検証するため、制御可能なビデオ生成ビデオ編集、ビデオインペイント、アウトペイントなど、幅広い映像生成タスクを実行する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:56:55 GMT)
Orthogonal Adaptation for Modular Customization of Diffusion Models [42.5] 我々は、カスタマイズされたモデルを効率的にマージすることを目的として、Modular Customizationと呼ばれる新しい問題に対処する。
直交適応(Orthogonal Adaptation, Orthogonal Adaptation)は,微調整時に相互にアクセスできないカスタマイズモデルを支援する手法である。
提案手法は単純かつ汎用的であり,モデルアーキテクチャのほぼすべての最適化可能な重みに適用可能である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:17:48 GMT)
What Machine Learning Can Do for Focusing Aerogel Detectors [42.2] スーパーチャームタウ工場実験における粒子識別は、集束型エアロゲルリングイメージングチェレンコフ検出器(FARICH)によって提供される。
検出位置の特定は適切な冷却を困難にするため、かなりの数の周囲のバックグラウンドヒットが捕捉される。
本研究では,コンピュータビジョンの機械学習技術に触発された信号ヒットのフィルタリング手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:46:16 GMT)
Uni3DL: Unified Model for 3D and Language Understanding [41.7] 3Dおよび言語理解のための統一モデルであるUni3DLを提案する。
Uni3DLは、ポイントクラウド上で直接動作する。
多様な3D視覚言語理解タスクに対して厳格に評価されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:30:27 GMT)
FINER: Flexible spectral-bias tuning in Implicit NEural Representation
by Variable-periodic Activation Functions [40.8] 暗黙の神経表現は、信号処理の分野で革命を引き起こしている。
現在のINR技術は、サポートされた周波数セットをチューニングする制限された能力に悩まされている。
本稿では,FINERを提案する可変周期アクティベーション関数を提案する。
本研究では,FINERの2次元画像適合性,3次元符号付き距離場表現,および5次元ニューラル場放射率最適化の文脈における機能を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:23:41 GMT)
A Practical Approach to Novel Class Discovery in Tabular Data [40.3] 新規クラスディスカバリー(英: Novel Class Discovery, NCD)は、未知のクラスを正確に分割するために、ラベル付けされた既知のクラスの集合から知識を抽出する問題である。
本研究では、$k$-foldのクロスバリデーションプロセスを適用し、既知のクラスの一部を各フォルダに隠すことで、NCDメソッドのハイパーパラメータを調整することを提案する。
この手法の潜在空間は,新規クラスの数を確実に推定するために有効であることがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:46:09 GMT)
Learning to Holistically Detect Bridges from Large-Size VHR Remote
Sensing Imagery [40.0] 大規模超高分解能(VHR)RSIにおける全体的橋梁検出は不可欠である。
大規模なVHR RSIを備えたデータセットの欠如は、ブリッジ検出におけるディープラーニングアルゴリズムのパフォーマンスを制限している。
本稿では,多様な地理的位置から採取した6,000VHR RSIからなるGLH-Bridgeという大規模データセットを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:15:22 GMT)
Materials Expert-Artificial Intelligence for Materials Discovery [39.7] 我々は,この人間の直感をカプセル化し,具体化するために,"Materials Expert-Artificial Intelligence"(ME-AI)を導入する。
ME-AIは専門家の直観を独立して再現し、それを拡張した。
私たちの成功は、機械学習に支援された材料発見を約束するものとして、“マシンボットによる人間の洞察”アプローチを指摘しています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:29:18 GMT)
Uncertainty Quantification in Multivariable Regression for Material
Property Prediction with Bayesian Neural Networks [39.6] 物理インフォームドBNNにおける不確実性定量化(UQ)のアプローチを提案する。
本稿では, 鋼のクリープ破断寿命を予測するためのケーススタディを提案する。
クリープ寿命予測の最も有望なフレームワークは、マルコフ・チェイン・モンテカルロによるネットワークパラメータの後方分布の近似に基づくBNNである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:00:59 GMT)
Architectural Approaches to Overcome Challenges in the Development of
Data-Intensive Systems [39.6] データ集約型コンピューティングシステムの設計における根本的な課題について調査する。
私たちは、これらの課題に対処する可能性とともに、最も人気のあるソフトウェアアーキテクチャスタイルをいくつか提示します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:42:25 GMT)
Effective Backdoor Mitigation Depends on the Pre-training Objective [39.6] より強い事前学習目標を使用する場合,CreateCLIPは有効ではないことを示す。
この洞察は、より強力な事前訓練目標とバックドア攻撃に対するセキュリティとのトレードオフのバランスを求める実践者にとって重要なものだ。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:52:47 GMT)
Digital twinning of cardiac electrophysiology models from the surface
ECG: a geodesic backpropagation approach [39.4] 逆等角問題の解法としてGeodesic-BPを提案する。
その結果,Geodesic-BPは人工心臓の活性化を高精度に再現できることが示唆された。
パーソナライズド医療への将来のシフトを考えると、Geodesic-BPは将来の心臓モデルの機能化に役立つ可能性がある。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:52:36 GMT)
Foundation Models for Weather and Climate Data Understanding: A
Comprehensive Survey [39.1] 私たちは、気象や気候データのために特別に設計された最先端のAI方法論を、徹底的に、タイムリーに概説しています。
主な対象は、気象・気候データの種類、主モデル、モデルスコープと応用、気象・気候のデータセットの4つである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:10:54 GMT)
Free Lunch for Gait Recognition: A Novel Relation Descriptor [39.0] テスト歩行と事前選択した歩行アンカーの関係をキャプチャする新しい$textbfRelation Descriptor$を提案する。
GREW, Gait3D, OU-M, CASIA-B, CCPGに対する本法の有効性を検討した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:37:33 GMT)
Analyzing and Improving the Training Dynamics of Diffusion Models [38.5] 一般的なADM拡散モデルアーキテクチャにおいて、不均一かつ非効率なトレーニングの原因をいくつか特定し、修正する。
この哲学の体系的な応用は、観測されたドリフトと不均衡を排除し、同じ計算複雑性でネットワークをかなり良くする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:55:47 GMT)
VideoSwap: Customized Video Subject Swapping with Interactive Semantic
Point Correspondence [37.9] 密度の高い対応に依存するビデオ編集アプローチは、ターゲット編集が形状変化を伴う場合、効果がない。
我々は,対象者の運動軌跡を調整し,その形状を変更するために,少数の意味点しか必要としないという観察から着想を得た VideoSwap フレームワークを紹介した。
大規模な実験では、さまざまな現実世界のビデオで結果を交換する最先端のビデオ被験者がデモされている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:14:25 GMT)
Exploring Weight Balancing on Long-Tailed Recognition Problem [37.8] トレーニング段階ごとの神経崩壊とコーン効果に着目して重量バランスを解析した。
本分析により, トレーニング段階数を1に減らし, 精度を向上し, トレーニング手法をさらに単純化することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:19:21 GMT)
Large Knowledge Model: Perspectives and Challenges [37.4] emphLarge Language Models (LLMs) は、広範囲なシーケンスベースの世界知識をニューラルネットワークに事前学習する。
この記事は「知識のレンズを通して大きなモデルを探求する」。
我々は,多種多様な知識構造を管理するために特別に設計されたemphLarge Knowledge Models(LKM)の作成を提唱する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:07:30 GMT)
DreamInpainter: Text-Guided Subject-Driven Image Inpainting with
Diffusion Models [37.1] 本研究は,テキストガイドによる主題駆動画像の描画について紹介する。
我々は、被写体再現の精度を確保するために、密集した被写体特徴を計算する。
我々は、余分な被写体の詳細を排除するために識別トークン選択モジュールを使用します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:23:19 GMT)
PipeOptim: Ensuring Effective 1F1B Schedule with Optimizer-Dependent
Weight Prediction [37.1] 1F1B (one forward, one backward) スケジュールを持つ非同期パイプラインモデル並列処理は、バブルオーバーヘッドをほとんど発生しない。
「1F1B」スケジュールは必然的に、異なるミニバッチのクロストレーニングによる重量不整合と重量安定の問題を引き起こす。
非同期パイプライン学習のための独立重み予測戦略(PipeOptim)を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:16:55 GMT)
UPOCR: Towards Unified Pixel-Level OCR Interface [37.0] We propose UPOCR, a simple-yet- effective generalist model for Unified Pixel-level OCR interface。
具体的には,多様なOCRタスクのパラダイムをイメージ・ツー・イメージ変換として,アーキテクチャを視覚変換器(ViT)ベースのエンコーダ・デコーダとして統一する。
テキスト除去、テキストセグメンテーション、改ざんテキスト検出を含む3つの画素レベルのOCRタスクで実験を行った。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:53:17 GMT)
AI-driven emergence of frequency information non-uniform distribution
via THz metasurface spectrum prediction [36.8] 我々は,AI予測に基づく準曲面のテラヘルツスペクトル変調効果の予測に関する研究中に,異なる周波数に関連する未報告の情報特性を明らかにした。
このアプローチは、既存のデータセットの利用を効果的に最適化し、人工知能、化学、複合材料設計、バイオメディシンなどの分野における学際的な研究と応用の道を開く。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:48:58 GMT)
Exploring Distributional Shifts in Large Language Models for Code
Analysis [36.7] コード機能を持つ3つの大規模言語モデルがどのようにドメイン外データに一般化するかを検討する。
コード要約とコード生成という,2つの基本的なアプリケーションについて検討する。
複数のドメインに適応したモデルが同時に、単一のドメインに適応したモデルと同等に動作していることが分かりました。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:25:52 GMT)
Inflating 2D Convolution Weights for Efficient Generation of 3D Medical
Images [35.8] 3次元医用画像は取得・注釈するのに高価であり,多くのパラメータが3次元畳み込みに関与している。
本稿では3D Split&Shuffle-GANと呼ばれる新しいGANモデルを提案する。
提案手法は,パラメータが大幅に少ない3次元画像の画質向上につながることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:59:59 GMT)
Model Copyright Protection in Buyer-seller Environment [35.3] 入出力型ニューラルネットワーク(ISNN)を用いたディープニューラルネットワーク(DNN)の著作権保護手法を提案する。
トレーニング期間中、クリーンな画像に特定の摂動を加え、それらを合法的な入力としてマークし、他の入力は違法な入力として扱われる。
実験の結果,提案手法の有効性,有効性,安全性が示された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:15:10 GMT)
LLaFS: When Large-Language Models Meet Few-Shot Segmentation [35.3] 本稿では,LLaFSを提案する。LLaFSは,大規模言語モデル(LLM)を数発のセグメンテーションで活用するための最初の試みである。
LLLaFSは、LLMが獲得した膨大な事前知識を効果的なサプリメントとして利用し、LLMを使って画像を数ショットで分割する。
LLaFSは複数のデータセットで最先端の結果を達成し、数ショットのコンピュータビジョンタスクにLLMを使用する可能性を示している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:04:37 GMT)
Multi-View Spectrogram Transformer for Respiratory Sound Classification [34.7] 視覚変換器に時間周波数特性の異なるビューを埋め込むために、MVST(Multi-View Spectrogram Transformer)を提案する。
ICBHIデータセットによる実験結果から,提案したMVSTは呼吸音の分類方法よりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:10:37 GMT)
Unsupervised Video Domain Adaptation with Masked Pre-Training and
Collaborative Self-Training [34.2] 画像教師モデルを用いて,映像学生モデルを対象領域に適応させる。
UNITEは、まず自己教師付き事前訓練を使用して、ターゲットのドメインビデオ上で差別的特徴学習を促進する。
次に,ビデオ学生モデルとイメージ教師モデルを用いて,マスク付き対象データを用いた自己学習を行い,未ラベル対象ビデオのための改良された擬似ラベルを生成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:39:19 GMT)
Language Agent Tree Search Unifies Reasoning Acting and Planning in
Language Models [33.8] 大規模言語モデル(LLM)は、様々な意思決定タスクにおいて印象的なパフォーマンスを示している。
LATS(Language Agent Tree Search)は, LLMの計画, 行動, 推論能力の相乗化を目的とした汎用フレームワークである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:25:55 GMT)
Congestion-aware Distributed Task Offloading in Wireless Multi-hop
Networks Using Graph Neural Networks [33.8] 既存のオフロード方式は主にモバイルデバイスとサーバに焦点を当て、複数のモバイルデバイスからのタスクによるネットワークの混雑を無視する。
本稿では,グラフベース機械学習を用いて分散グリードフレームワークを増強し,分散タスクオフロード方式を提案する。
提案手法は,コンテキストに依存しないベースライン下での混雑や不安定な待ち行列の低減に有効であるとともに,ローカルコンピューティングによる実行遅延の改善にも有効である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:46:30 GMT)
T3D: Towards 3D Medical Image Understanding through Vision-Language
Pre-training [33.5] 我々は、高解像度の3D医療画像用に設計された最初のフレームワークであるT3Dを紹介する。
T3Dには2つのテキストインフォームド・プレテキストタスクが含まれている: (lowerromannumeral1) テキストインフォームド・コントラスト学習; (lowerromannumeral2) テキストインフォームド・イメージ復元。
T3Dは、臓器や腫瘍のセグメンテーションなどのタスクや疾患の分類において、現在のvSSLメソッドよりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:01:07 GMT)
Think Twice Before Selection: Federated Evidential Active Learning for
Medical Image Analysis with Domain Shifts [33.3] 本稿では,多様なドメインから派生したローカルデータの情報性を評価するための最初の試みを行う。
本稿では,ドメインシフト下でのデータ評価を校正する新しい手法であるFederated Evidential Active Learning(FEAL)を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:32:27 GMT)
Comparative study of quantum emitter fabrication in wide bandgap
materials using localized electron irradiation [33.2] 量子光源は、様々な量子技術応用のための重要な基礎となる要素である。
そのような物質の1つのプラットフォームは、六方晶窒化ホウ素(hBN)の蛍光欠陥であり、バンドギャップ内で深いサブレベルを誘導する。
本稿では, 剥離した多層ミカフレーク中の量子エミッタをhBNおよび他の広帯域3D結晶で作製し, 比較する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:12:37 GMT)
On the Identifiability of Quantized Factors [33.1] 一般非線形微分同相の下で量子化潜在因子を復元することは可能であることを示す。
本稿では、この新しい形の量子化因子識別可能性を紹介し、量子化因子の回復の包括的証明を提供する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:46:11 GMT)
Cost-effective On-device Continual Learning over Memory Hierarchy with
Miro [32.9] Miroは、リソース状態に基づいてCLシステムを動的に構成する新しいシステムランタイムである。
Miroは、私たちが構築するベースラインシステムを大幅に上回り、コスト効率を継続的に向上します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:51:52 GMT)
Data Upcycling Knowledge Distillation for Image Super-Resolution [32.7] 知識蒸留(KD)は、深層ニューラルネットワークを圧縮するための有望だが挑戦的な手法として現れる。
本稿では,効率的なデータ利用,すなわちデータリサイクル知識蒸留(DUKD)の観点からアプローチを行った。
我々は、ペア化された可逆データ拡張によって実装されたSRモデルのKDにおけるラベル整合性正規化を実現する。
様々なベンチマークに関する総合的な実験は、DUKD法が過去の技術よりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:38:52 GMT)
Unsupervised Keypoints from Pretrained Diffusion Models [32.5] 我々は、テキストから画像への拡散モデルにおける創発的な知識を、より堅牢な教師なしキーポイントに活用する。
私たちの中核となる考え方は、生成モデルが画像のコンパクトな領域に一貫して従う原因となるテキスト埋め込みを見つけることです。
CelebA、CUB-200-2011、Tai-Chi-HD、DeepFashion、Human3.6mのデータセットでパフォーマンスを検証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:36:01 GMT)
DemaFormer: Damped Exponential Moving Average Transformer with
Energy-Based Modeling for Temporal Language Grounding [32.5] 時間的言語グラウンディングは、自然言語クエリに意味的に対応するビデオモーメントをローカライズすることを目指している。
モーメントクエリ分布を明示的に学習するためのエネルギーモデルフレームワークを提案する。
また、指数移動平均と学習可能な減衰係数を利用するトランスフォーマーベースの新しいアーキテクチャであるDemaFormerを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:37:21 GMT)
PartSLIP++: Enhancing Low-Shot 3D Part Segmentation via Multi-View
Instance Segmentation and Maximum Likelihood Estimation [32.3] 最近の進歩であるPartSLIPは、ゼロと少数ショットの3D部分セグメンテーションにおいて大きな進歩を遂げている。
先代の制限を克服するために設計された拡張バージョンであるPartSLIP++を紹介する。
ローショットな3Dセマンティクスとインスタンスベースのオブジェクト部分分割タスクの両方において、PartSLIP++はPartSLIPよりも優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:33:04 GMT)
Retrieving Conditions from Reference Images for Diffusion Models [31.9] 改良されたデータセットと評価が望まれるだけでなく、条件付き画像からのみ関連情報を取得するためのより慎重な方法が期待されている。
このデータセットによって実現された新しいタスクを述べ、これらのタスクを完了させる成功を測定するための新しい多様性指標を導入します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:04:16 GMT)
Creative Agents: Empowering Agents with Imagination for Creative Tasks [31.9] 本稿では,言語命令に基づくタスク結果の詳細な想像力を生成するイマジネータを用いて,制御器を拡張したクリエイティブエージェントのためのソリューションのクラスを提案する。
私たちは創造的なタスクを、オープンワールドの挑戦的なゲームMinecraftでベンチマークします。
我々は、創造的エージェントの詳細な実験分析を行い、創造的エージェントがMinecraftの生存モードにおける多様な建築創造を達成する最初のAIエージェントであることを示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:00:52 GMT)
Fairness in Medical Image Analysis and Healthcare: A Literature Survey [31.8] 医療画像分析(MedIA)と医療におけるフェアネス研究の現状を概観する。
具体的には、まず公平性の定義、不公平性の原因、潜在的な解について論じる。
次に,公平度評価と不公平度軽減によって分類されたMedIAの公正度に関する最近の研究について論じる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:59:42 GMT)
FIMO: A Challenge Formal Dataset for Automated Theorem Proving [31.7] FIMOは、IMOレベルでの高度な自動定理証明を容易にするように設計されている。
公式な問題文は149で、非公式な問題記述とそれに対応する非公式な証明の両方を伴っている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:38:01 GMT)
Motion Informed Needle Segmentation in Ultrasound Images [31.3] 本稿では,従来のカルマンフィルタ(KF)とデータ駆動学習を組み合わせた針分割手法を提案する。
我々は、新しい畳み込みニューラルネットワーク(CNN)をベースとしたKFインスパイアブロックを用いた、最新の最先端の針分割モデルと比較して、優れた性能を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:14:18 GMT)
Quantum simulation for time-dependent Hamiltonians -- with applications
to non-autonomous ordinary and partial differential equations [31.2] 我々は、任意の非自律的ユニタリ力学系を自律的ユニタリ系に変換する代替形式論を提案する。
これにより、時間依存ハミルトニアンのシミュレーションは、時間依存ハミルトニアンのシミュレーションほど難しくない。
時間依存型ハミルトニアンのための新しい量子プロトコルは、資源効率の良い方法で、測定なしで実行可能であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:59:23 GMT)
TPA3D: Triplane Attention for Fast Text-to-3D Generation [31.0] テキスト誘導型3次元生成(TPA3D)のためのトライプレーンアテンションを提案する。
TPA3Dは、高速テキストから3D生成のための、エンドツーエンドのトレーニング可能なGANベースのディープラーニングモデルである。
TPA3Dは, きめ細かい記述と整合した高品質な3次元テクスチャ形状を生成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:39:37 GMT)
E4SRec: An Elegant Effective Efficient Extensible Solution of Large
Language Models for Sequential Recommendation [30.2] シークエンシャルレコメンデーション(E4SRec)のための大規模言語モデルに対するエレガント効果的な効率的な拡張性ソリューションを提案する。
E4SRecは、アイテムを表現するためにIDのみを使用する従来のレコメンデータシステムと、Large Language Modelsをシームレスに統合する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:50:18 GMT)
Constrained Twin Variational Auto-Encoder for Intrusion Detection in IoT
Systems [30.2] 侵入検知システム(IDS)は、悪意のある攻撃から何十億ものIoTデバイスを保護する上で重要な役割を果たす。
本稿では,CTVAE(Constrained Twin Variational Auto-Encoder)と呼ばれる新しいディープニューラルネットワーク/アーキテクチャを提案する。
CTVAEは、最先端の機械学習および表現学習方法と比較して、精度と検出攻撃におけるFscoreの約1%を向上することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:42:04 GMT)
TWIGMA: A dataset of AI-Generated Images with Metadata From Twitter [29.8] TWIGMAは,2021年1月から2023年3月までに収集された800,000以上のgen-AI画像を含むデータセットである。
その結果,gen-AI画像には特徴があり,非gen-AI画像と比較すると,平均的,低変動性を示すことがわかった。
われわれは、Twitter上でAI生成画像のテーマの経年変化を観察し、ユーザーは芸術的に洗練されたコンテンツをますます共有している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:17:22 GMT)
LiDAR-based Person Re-identification [29.7] 本稿では,3次元体形の特徴を抽出するための事前学習戦略を利用するLiDARベースのReIDフレームワークReID3Dを提案する。
我々の知る限り、私たちはLiDARベースのReIDのためのソリューションを最初に提案しました。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:44:17 GMT)
SAVE: Protagonist Diversification with Structure Agnostic Video Editing [29.7] 従来の作品は通常、自明で一貫した形状でうまく機能し、元のものと大きく異なる体形を持つ難しいターゲットで容易に崩壊する。
動きのパーソナライズを単一音源映像から分離し,それに応じて動きの調整を行う。
我々はまた、新しい擬似光学フローを導入することにより、動き語を適切な動き関連領域に適応するように調整する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:13:20 GMT)
Privacy-Aware Data Acquisition under Data Similarity in Regression
Markets [29.6] データの類似性とプライバシの嗜好が市場設計に不可欠であることを示す。
我々は、データ類似性が市場参加や取引データの価値にどのように影響するかを数値的に評価する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:39:04 GMT)
Balance is Essence: Accelerating Sparse Training via Adaptive Gradient
Correction [29.6] ディープニューラルネットワークでは、メモリと計算コストが大幅に削減される。
スパーストレーニングは、これらのコストを削減する最も一般的な手法の1つである。
本研究では,この問題を克服し,時空協調効率の実現を目指す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:05:00 GMT)
Stable Diffusion Exposed: Gender Bias from Prompt to Image [28.9] 本稿では,性別指標が安定拡散画像に与える影響を分析するための評価プロトコルを提案する。
本研究の結果は,特定の性別に合わせて調整された楽器など,物体の描写に違いがあることが示唆された。
また、中性的なプロンプトは、女性よりも男性的なプロンプトと整合したイメージを生成する傾向があることも明らかにした。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:12:59 GMT)
Diffusion Noise Feature: Accurate and Fast Generated Image Detection [28.3] 生成モデルは、驚くほどリアルなイメージを生成できる先進的な段階に達している。
生成された画像に対する既存の画像検出器は、低精度や限定的な一般化といった課題に直面している。
本稿では,生成画像の検出能力を高めるために,強力な一般化機能を備えた表現を求めることにより,この問題に対処する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:01:11 GMT)
Fast non-autoregressive inverse folding with discrete diffusion [27.6] 本稿では,CATHベンチマークの性能を損なうことなく,一定回数の呼び出しによって23倍の速度で推論を行う非自己回帰的な代替手法について述べる。
提案手法は,拡散速度を変調することにより,推定速度と精度のトレードオフの柔軟性を与える。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:57:42 GMT)
DiffusionAtlas: High-Fidelity Consistent Diffusion Video Editing [27.0] 本稿では,拡散型ビデオ編集フレームワークであるDiffusionAtlasについて述べる。
本手法は,視覚時間拡散モデルを用いて拡散アトラス上で直接オブジェクトを編集し,フレーム間のコヒーレントなオブジェクト識別を保証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:40:30 GMT)
Towards Granularity-adjusted Pixel-level Semantic Annotation [26.9] GranSAMは、手作業による監督を必要とせずに、ラベルのないデータに対して、ユーザ定義の粒度レベルでセマンティックセグメンテーションを提供する。
安定拡散モデルやWebクローリング画像によって生成された合成画像から意味情報を蓄積する。
PASCAL VOC 2012とCOCO-80データセットの実験を行い、mIoUの+17.95%と+5.17%の増加を観測した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:37:18 GMT)
RS5M: A Large Scale Vision-Language Dataset for Remote Sensing
Vision-Language Foundation Model [26.7] 我々は、DVLM(Domain Pre-trained Vision-Language Model)を含む新しいフレームワークを提案する。
リモートセンシング(RS)分野における画像とテキストのペア化データセットであるRS5Mについて述べる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:23:36 GMT)
Domain-wise Invariant Learning for Panoptic Scene Graph Generation [26.2] パノプティック・シーングラフ生成(PSG)は、オブジェクトの検出とそれに対応する関係(述語)の予測を含む。
偏見付き述語アノテーションの存在は、異なる述語間の明確な決定境界を確立する能力を妨げているため、PSGモデルにとって大きな課題となる。
本稿では,各対象物対内の予測予測リスクを測定することによって,潜在的なバイアスのあるアノテーションを推論する新しい枠組みを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:37:54 GMT)
Unifying the Perspectives of NLP and Software Engineering: A Survey on
Language Models for Code [26.0] 本稿では,言語モデルを用いたコード処理の最近の進歩を体系的にレビューする。
私たちは、コード処理モデルを、GPTファミリで表される一般的な言語モデルと、特にコードで事前訓練された特殊なモデルに分解します。
AST、CFG、ユニットテストなどのコード固有の機能や、トレーニングコード言語モデルのアプリケーションについて議論し、この領域における重要な課題と将来的な方向性を特定します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:09:06 GMT)
Deep Knowledge Tracing is an implicit dynamic multidimensional item
response theory model [25.9] ディープ・ナレッジ・トレーシング(Deep Knowledge Trace, DKT)は、リカレントニューラルネットワークに依存するナレッジ・トレースの競合モデルである。
本稿では,エンコーダデコーダアーキテクチャとして深い知識追跡を行う。
より単純なデコーダは、DKTが使用するデコーダよりもパラメータが少なく、学生のパフォーマンスをより良く予測できることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:52:09 GMT)
Alleviating Exposure Bias in Diffusion Models through Sampling with
Shifted Time Steps [24.8] 拡散確率モデル (DPM) は高品質な画像の合成において顕著な有効性を示した。
これまでの研究は、トレーニング中に入力を摂動することでこの問題を緩和しようと試みてきた。
モデルを再学習することなく,提案する新しいサンプリング手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:48:12 GMT)
TpuGraphs: A Performance Prediction Dataset on Large Tensor
Computational Graphs [24.8] 本稿では,フルテンソルプログラムの性能予測データセットであるTpuGraphsを紹介する。
データセットの各グラフは、機械学習のワークロードの主計算を表します。
TpuGraphsは、最大のグラフプロパティ予測データセットよりも25倍のグラフを提供する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:36:34 GMT)
Sample-based Dynamic Hierarchical Transformer with Layer and Head
Flexibility via Contextual Bandit [24.8] トランスフォーマーは一定の数のレイヤーとヘッドを必要とし、個々のサンプルの複雑さに屈曲する。
本稿では,レイヤとヘッドを単一のデータサンプルで動的に設定できる動的階層変換モデルを提案する。
トレーニングと推論の両方で最大74%の計算節約を達成でき、精度は最小限です。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:04:11 GMT)
Explainable Severity ranking via pairwise n-hidden comparison: a case
study of glaucoma [24.2] 原発性開放隅角緑内障(英: primary open-angle glaucoma, POAG)は、慢性進行性視神経疾患である。
POAGを診断し、その重症度を決定するためには、患者は包括的拡張眼科検査を受けなければならない。
眼底画像を用いて緑内障の重症度を分類・比較・解釈する枠組みを構築した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:12:05 GMT)
FaceStudio: Put Your Face Everywhere in Seconds [24.1] アイデンティティを保存する画像合成は、パーソナライズされたスタイリスティックなタッチを加えながら、被験者のアイデンティティを維持することを目指している。
Textual InversionやDreamBoothといった従来の手法は、カスタムイメージ作成に力を入れている。
本研究は,人間の画像に焦点をあてたアイデンティティ保存合成への新たなアプローチを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:02:45 GMT)
RL-Based Cargo-UAV Trajectory Planning and Cell Association for Minimum
Handoffs, Disconnectivity, and Energy Consumption [23.7] 無人航空機(UAV)は、ラストマイル貨物輸送のための有望な技術である。
既存の携帯電話ネットワークは、主に地上ユーザー向けに設計された。
本稿では, 共同貨物・UAV軌道計画とセルアソシエーションのための新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:06:09 GMT)
AmbiGen: Generating Ambigrams from Pre-trained Diffusion Model [23.7] 本稿では,大規模な視覚・言語拡散モデルであるDeepFloyd IFを蒸留し,アンビグラムを生成することを提案する。
英語で最も一般的な500語に対して,単語の精度が11.6%以上向上し,編集距離が41.9%以上削減された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:56:06 GMT)
Continual Learning for Instruction Following from Realtime Feedback [23.1] 我々は,協調作業中のユーザからのフィードバックから,指示追従エージェントを継続的に訓練するためのアプローチを提案し,展開する。
対話中、人間のユーザは自然言語を使ってエージェントに指示し、指示に従ってエージェントを観察するときにリアルタイムのバイナリフィードバックを提供する。
我々は、ユーザのフィードバックを即時報酬に変換する、文脈的帯域幅学習アプローチを設計する。
我々は、何千もの人間とエージェントの相互作用を通じて評価し、時間とともに命令の実行精度が15.4%向上したことを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:22:11 GMT)
Clustering Pseudo Language Family in Multilingual Translation Models
with Fisher Information Matrix [22.9] 祖先のみに基づくクラスタリング言語は、最適な結果をもたらすことができる。
本稿では,漁船情報行列(FIM)をクラスタリング言語ファミリーに活用する革新的な手法を提案する。
我々は、これらの擬似言語ファミリーの創始と応用について、深く議論する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:03:27 GMT)
Decoding Data Quality via Synthetic Corruptions: Embedding-guided
Pruning of Code Data [22.5] この作業は,“低品質”なコードデータの識別と削除に埋め込みを使用することに重点を置いている。
まず, 組込み空間における「低品質」コードの特徴について, 合成汚職を用いて検討する。
Stackデータセットの低品質エントリを識別および削除するために、埋め込みスペースで運用する新しいプルーニングメトリクスを考案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:19:30 GMT)
PMMTalk: Speech-Driven 3D Facial Animation from Complementary Pseudo
Multi-modal Features [22.3] 音声駆動の3D顔アニメーションは、最近大幅に改善されている。
関連作品の多くは音響的モダリティのみを利用しており、視覚的・テキスト的手がかりの影響を無視している。
顔アニメーションの精度を向上させるために,Pseudo Multi-Modal 機能を用いた新しいフレームワーク PMMTalk を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:12:38 GMT)
Split & Merge: Unlocking the Potential of Visual Adapters via Sparse
Training [22.2] 本稿では,新しいアダプタチューニング手法としてMixture of Sparse Adapters(MOSA)を提案する。
MoSAは、計算やストレージのオーバーヘッドが増すことなく、標準アダプタよりも大幅にパフォーマンスが向上する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:50:55 GMT)
Lenna: Language Enhanced Reasoning Detection Assistant [22.1] 大規模な言語モデルに埋め込まれた推論能力と世界知識は、画像認識タスクにおいて、はるかに少ない研究と活用がなされている。
MLLMの頑健なマルチモーダル特徴表現を利用した言語強化推論検出アシスタントLennaを提案する。
LennaはReasonDetで優れたパフォーマンスを示しており、トレーニングコストはかなり低い。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:19:35 GMT)
Primal-Attention: Self-attention through Asymmetric Kernel SVD in Primal
Representation [21.9] 非対称カーネル特異値分解(KSVD)による自己注意の表現と最適化のための新しい視点を提供する。
KSVDの最適化は、正規化損失を最小限に抑え、余分な分解を伴わずに低ランク特性を促進できることを示す。
これは、自己アテンションにおける非対称核の原始双対表現を提供し、モデリングと最適化にうまく適用した最初の作品である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:26:05 GMT)
Slide-SAM: Medical SAM Meets Sliding Window [21.8] 本稿では,隣接する3つのスライスからなるスタックを予測ウィンドウとして扱うSlide-SAMを提案する。
まず3Dボリュームから3つのスライスを取り、中央スライスにポイントまたはバウンディングボックスをプロンプトし、3つのスライスすべてに対してセグメンテーションマスクを予測する。
本モデルは,複数の公開およびプライベートな医療データセットを用いて訓練し,広範囲な3次元セグメトネーション実験によりその効果を実証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:10:25 GMT)
Generating Fine-Grained Human Motions Using ChatGPT-Refined Descriptions [21.7] 本研究では,人間の動き生成のためのFG-MDM(Fin-Grained Human Motion Diffusion Model)というフレームワークを提案する。
FG-MDMは、トレーニングデータの分布の外においても、きめ細かな、スタイリングされた動きを生成することができる。
我々は、HumanML3DとKITのためのきめ細かいテキストアノテーションをリリースします。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:01:43 GMT)
The neural dynamics of auditory word recognition and integration [21.6] 本稿では,この知覚過程をベイズ決定理論で定式化する単語認識の計算モデルを提案する。
我々は,このモデルを用いて,架空の物語を受動的に聴いた被験者が記録した頭皮脳波信号を説明する。
このモデルは、単語が素早く認識できるかどうかに応じて、単語の異なるニューラル処理を明らかにする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:20:16 GMT)
Subgradient Regularized Multivariate Convex Regression at Scale [21.6] 次数正規化凸回帰関数を$d$次元で$n$のサンプルに適合させる新しい大規模アルゴリズムを提案する。
本研究のフレームワークは,n=105$と$d=10$で,段階的な正規化凸回帰問題のインスタンスを数分で解くことができることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:24:39 GMT)
Evaluating Agents using Social Choice Theory [21.3] 我々は、投票理論のレンズを通して、多くの一般的な評価問題を見ることができると論じる。
各タスクは別個の投票者として解釈され、全体的な評価を得るためには、通常のランク付けやエージェントのペア比較しか必要としない。
これらの評価は解釈可能で柔軟性があり、現在クロスタスク評価に直面している多くの問題を回避している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:40:37 GMT)
Finding Point with Image: A Simple and Efficient Method for UAV
Self-Localization [21.2] 本稿では、画像を用いたFindering Point with Image(FPI)というエンドツーエンドの位置決めフレームワークを提案する。
FPIは、UAVビュー画像を介して、衛星ビュー画像中のUAVの対応する位置を直接識別することを目的としている。
本フレームワークの実用性を検証するため,UAVと衛星ビューからなるUL14というペアデータセットを構築した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:18:10 GMT)
Unleashing the Creative Mind: Language Model As Hierarchical Policy For
Improved Exploration on Challenging Problem Solving [21.0] 大きな言語モデル(LLM)は大きな進歩を遂げていますが、それでも困難な推論問題に苦戦しています。
本研究では,LLMを文脈内学習による階層的政策としてフレーミングすることで,LLMの創造的潜在能力を解き放つ。
探索された解群の中から選択して最終回答を得るための,効果的かつ効率的なトーナメントベースアプローチを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:44:45 GMT)
WoVoGen: World Volume-aware Diffusion for Controllable Multi-camera
Driving Scene Generation [20.9] ワールドボリューム対応マルチカメラ駆動シーンジェネレータ(WoVoGen)を提案する。
WoVoGenは、4Dワールドボリュームをビデオ生成の基礎要素として利用するように設計されている。
本モデルでは,車載制御シーケンスに基づく将来の4次元時空間容積を想定するフェーズと,マルチカメラビデオを生成するフェーズの2つのフェーズで運用する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:05:14 GMT)
Grounding Foundation Models through Federated Transfer Learning: A
General Framework [20.9] GPT-4のような基礎モデル(FM)は、様々な自然言語処理やコンピュータビジョンタスクにおいて顕著な成功を収めている。
FMをドメイン固有のタスクに適応させたり、ドメイン固有の知識で拡張することで、FMの潜在能力を最大限に活用することができる。
近年,フェデレート・トランスファー・ラーニング(FTL)を活用したFMの基盤化の必要性が,学術と産業の両面で強く現れている。
FTL-FM研究の強い成長と、FTL-FMが産業応用に与える影響を動機として、FTL-FMフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:35:03 GMT)
Locally purified density operators for noisy quantum circuits [20.5] ノイズ量子回路から発生する混合量子状態は、局所精製密度演算子(LPDO)によって効率的に表現できることを示す。
雑音の多い乱数量子回路を最大$d=40$でシミュレーションすることにより、この枠組みを数値的に検証する。
この研究は、オープン量子系における効率的な混合状態表現の理解を深め、ノイズ量子回路の絡み合い構造に関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:10:30 GMT)
Error tradeoff relation for estimating the unitary-shift parameter of a
relativistic spin-1/2 particle [20.4] 本研究の目的は、相対論的スピン-1/2系における2つのユニタリシフトパラメータを推定するための非自明なトレードオフ関係の存在を議論することである。
移動オブザーバは、パラメトリックモデルが古典的であっても、2つのパラメータを同時に推定することはできない。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:44:55 GMT)
Solving Inverse Physics Problems with Score Matching [20.3] 本稿では,拡散モデルからの最近の進歩を活用して,物理系の時間的進化に関わる逆問題を解決することを提案する。
本手法は,近似逆物理シミュレータと学習された補正関数を組み合わせることで,システムの現在の状態を段階的に遡上する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:06:18 GMT)
Inspecting Model Fairness in Ultrasound Segmentation Tasks [20.3] 2つの超音波データセットを用いて,一連の深層学習(DL)セグメンテーションモデルについて検討する。
以上の結果から,最先端のDLアルゴリズムでさえ,超音波セグメンテーション作業において不公平な動作を示すことが明らかとなった。
これらの結果は重要な警告として機能し、実際のシナリオに展開する前に、慎重にモデル評価を行う必要性を強調します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:08:08 GMT)
Investigation of UAV Detection in Images with Complex Backgrounds and
Rainy Artifacts [20.2] UAV検出のための視覚に基づく物体検出法が開発されている。
複雑な背景と雨のような気象要素を持つ画像におけるUAV検出は、まだ合理的に研究されていない。
この研究は、最先端のオブジェクト検出モデルのベンチマークにも重点を置いている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:35:18 GMT)
Beyond Detection: Unveiling Fairness Vulnerabilities in Abusive Language
Models [20.1] 本研究では, 乱用言語検出におけるフェアネスと検出性能の両方を損なう可能性について検討する。
フェアネスと検出性能の目標制御を可能にするため,バックドア攻撃を利用したFABLEフレームワークを提案する。
ベンチマークデータセットの実験は、乱用言語検出におけるFABLE攻撃の公平性と有用性を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:36:23 GMT)
All Rivers Run to the Sea: Private Learning with Asymmetric Flows [19.8] 我々は、非プライベートな集中型トレーニングとしてモデルパフォーマンスに匹敵する、新しいプライベートトレーニングと推論フレームワークであるDeltaを提案する。
デルタは情報に敏感な表現を低次元空間に埋め込み、情報に敏感な部分を高次元の残留物に押し込む。
理論的には、Deltaは公共環境における差分プライバシーを保証し、プライベート環境における複雑さを大幅に低減する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:15:51 GMT)
SEVA: Leveraging sketches to evaluate alignment between human and
machine visual abstraction [19.7] スケッチは、スパースだが有意義な抽象イメージを作成するための強力なツールである。
現在の視覚アルゴリズムは様々な視覚的タスクにおいて高い性能を達成している。
スケッチがどの程度人間的な方法で理解されているかは、まだ不明である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:54:55 GMT)
Data-Driven Target Localization Using Adaptive Radar Processing and
Convolutional Neural Networks [19.4] 本稿では,アダプティブレーダ検出後のレーダターゲット位置推定を改善するためのデータ駆動方式を提案する。
我々は、正規化適応整合フィルタ(NAMF)のレーダリターン、範囲、方位(およびドップラー)から熱マップテンソルを生成する。
次に、これらの熱マップテンソルからターゲット位置を推定するために回帰畳み込みニューラルネットワーク(CNN)を訓練する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:16:26 GMT)
Contact Energy Based Hindsight Experience Prioritization [19.4] 強化学習(RL)アルゴリズムでは,報酬の少ないマルチゴールロボット操作作業が困難である。
Hindsight Experience Replay (HER)のような最近のアルゴリズムは、失敗軌跡を生かして学習を高速化している。
本稿では,コンタクトによるリッチな情報に基づいて,リプレイバッファからサンプルを選択するための,CEBP(Contact Energy Based Prioritization)を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:32:25 GMT)
Let the LLMs Talk: Simulating Human-to-Human Conversational QA via
Zero-Shot LLM-to-LLM Interactions [19.4] 対話型質問応答システムの目的は,ユーザとの対話によって情報を取得する対話型検索システムを作ることである。
既存の作業では、人間の注釈を使って質問者(学生)と回答者(教師)の役割を演じる。
教師と学生のインタラクションをシミュレーションするためにゼロショット学習者LLMを用いたシミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:38:02 GMT)
Interactive Segmentation for Diverse Gesture Types Without Context [19.3] 本稿では,画像のみをマークしなければならない簡易な対話型セグメンテーションタスクを提案する。
入力は、任意のジェスチャータイプを指定せずに、任意のジェスチャータイプを指定できる。
我々は,新しいタスクに適応したセグメンテーションを含む対話的セグメンテーションアルゴリズムを多数分析する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:56:26 GMT)
Towards Causal Representations of Climate Model Data [18.8] この研究は因果表現学習の可能性、特に単一パーセンシャル・デコーディング(CDSD)法によるemphCausal Discoveryの可能性を掘り下げるものである。
以上の結果から,CDSDをより解釈可能で堅牢な気候モデルエミュレーションへのステップストーンとして使用するという課題,限界,約束が明らかになった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:13:34 GMT)
Towards Fast and Stable Federated Learning: Confronting Heterogeneity
via Knowledge Anchor [18.7] 本稿では,異なる通信ラウンド間の局所訓練において,各クラスを忘れる程度を系統的に分析する。
これらの知見に触発され,FedKA(Federated Knowledge Anchor)と呼ばれる新しい,簡単なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:12:56 GMT)
Visual Program Distillation: Distilling Tools and Programmatic Reasoning
into Vision-Language Models [18.3] 視覚言語モデル(VLM)を生成する命令チューニングフレームワークである視覚プログラム蒸留(VPD)を提案する。
VPDは、複数の候補プログラムをサンプルにすることで、大きな言語モデルの推論能力を蒸留する。
それぞれの正しいプログラムを推論ステップの言語記述に変換し、VLMに蒸留する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:58:37 GMT)
Robust Backdoor Detection for Deep Learning via Topological Evolution Dynamics [18.3] ディープラーニングにおけるバックドア攻撃は、特定の入力パターンに対して悪意ある振る舞いを引き起こすために、モデルに隠れたバックドアを挿入する。
本稿では,新しいSSDT (Source-Specific and Dynamic-Triggers) バックドアを導入することで,この仮定に厳しい制約があることを述べる。
本研究では,ロバストなバックドア検出のためのモデルに依存しない基盤としてTED(トポロジカル・エボリューション・ダイナミクス)を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:29:12 GMT)
The Bayesian Stability Zoo [18.1] 学習理論文献に見られる安定性の多くの定義が互いに等価であることを示す。
各家族において、近似微分プライバシー、純粋微分プライバシー、複製可能性、グローバル安定性、完全一般化、テレビの安定性、相互情報安定性、KL分割安定性、R'enyi分割安定性を含む様々な定義の等価性を確立する。
この研究は、学習理論における安定性概念のより体系的な分類への一歩であり、これは明確性を促進し、近年出現した安定性概念の一連の理解を改善することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:50:00 GMT)
Visual Hindsight Self-Imitation Learning for Interactive Navigation [18.0] 本稿では,視覚的ハイビジョン・セルフ・イミテーション・ラーニング(VHS)を提案する。
VHSはインタラクティブなビジュアルナビゲーションタスクにおいて、既存の技術よりも優れています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:34:12 GMT)
Multi-Criteria Client Selection and Scheduling with Fairness Guarantee
for Federated Learning Service [18.0] フェデレートラーニング(FL)は、複数のクライアントが生のトレーニングデータを共有せずに、機械学習モデルを協調的にトレーニングすることを可能にする。
公平性を保証するマルチ基準クライアント選択とスケジューリング方式を提案する。
我々のスキームは、特にデータが非IDである場合、モデル品質を改善することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:56:24 GMT)
Accelerating Learnt Video Codecs with Gradient Decay and Layer-wise
Distillation [18.0] 本稿では, 勾配減衰と適応層ワイド蒸留に基づく新しいモデル非依存プルーニング手法を提案する。
その結果,BD-PSNRでは最大65%のMACと2倍のスピードアップ,0.3dB未満のBD-PSNRが得られた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:26:09 GMT)
GeNIe: Generative Hard Negative Images Through Diffusion [17.8] テキストプロンプトに条件付き拡散モデルであるGeNIeを導入し、対照的なデータポイントをマージする。
最近の画像編集法に触発されて、拡散イテレーションの数とノイズの量を制限する。
提案手法の有効性を,数ショット,長テール分布設定で検証し,本手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:34:30 GMT)
MASP: Scalable GNN-based Planning for Multi-Agent Navigation [17.8] エージェント数の多いナビゲーションタスクのための目標条件付き階層型プランナを提案する。
また、グラフニューラルネットワーク(GNN)を活用し、エージェントと目標間の相互作用をモデル化し、目標達成を改善する。
その結果、MASPは古典的な計画ベースの競合やRLベースラインよりも優れていた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:05:04 GMT)
DeepPointMap: Advancing LiDAR SLAM with Unified Neural Descriptors [17.7] 両面において優れた選好を実現する統一アーキテクチャであるDeepPointMapを提案する。
ニューラルネットワークを用いて、点群から非常に代表的でスパースな神経記述子を抽出する。
より挑戦的なマルチエージェント協調SLAMに拡張することで、私たちのフレームワークの汎用性を紹介します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:40:41 GMT)
Robust Reinforcement Learning in Continuous Control Tasks with
Uncertainty Set Regularization [17.3] 強化学習(Reinforcement Learning, RL)は、環境摂動下での一般化と堅牢性を欠いていると認識されている。
我々は $textbfU$ncertainty $textbfS$et $textbfR$egularizer (USR) という新しい正規化器を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:44:04 GMT)
BenchLMM: Benchmarking Cross-style Visual Capability of Large Multimodal
Models [16.9] 我々は3つの異なるスタイルに対してLMMの堅牢性を評価するため,新しいベンチマークであるBenchLMMを提案する。
知的LMMは、スタイル変化に直面した際の誤りの原因を解釈することが期待される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:06:59 GMT)
C3: High-performance and low-complexity neural compression from a single
image or video [16.8] 本稿では,強速度歪み(RD)性能を有するニューラル圧縮法であるC3を紹介する。
結果として生じるC3の復号複雑性は、同様のRD性能を持つニューラルベースラインよりも桁違いに低い。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:28:59 GMT)
ULMA: Unified Language Model Alignment with Demonstration and Point-wise
Human Preference [16.7] 最近のアライメントフレームワークは、デモデータによる教師付き微調整と、人間の嗜好データによる嗜好学習の2つのステップで構成されている。
まず、ポイントワイズDPOと呼ばれる選好学習手法を開発し、ポイントワイズ選好データに対処する。
教師付き微調整とポイントワイド選好学習の関連性に関するさらなる啓示により、人間の実演とポイントワイド選好データの両方に統一的な枠組みを構築することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:52:12 GMT)
Deterministic Guidance Diffusion Model for Probabilistic Weather
Forecasting [16.4] textbftextitDeterministic textbftextitGuidance textbftextitDiffusion textbftextitModel (DGDM)を導入する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:03:15 GMT)
ScienceBenchmark: A Complex Real-World Benchmark for Evaluating Natural
Language to SQL Systems [16.3] 我々はScienceBenchmarkを紹介した。これは3つの現実世界、ドメイン固有のデータベースのための、新しい複雑なNL-to-ベンチマークである。
Spiderの上位パフォーマンスシステムがベンチマークで非常に低いパフォーマンスを達成するため、我々のベンチマークは非常に難しいことを示しています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:05:58 GMT)
Diffusion-Based Speech Enhancement in Matched and Mismatched Conditions
Using a Heun-Based Sampler [16.1] 拡散モデルは、最近音声強調にうまく適用された新しい生成モデルである。
先行研究は、最先端の差別モデルと比較して、不一致条件下での優れた性能を実証している。
提案システムは,複数のデータベースをトレーニングに利用することにより,一致条件と一致条件の双方において,最先端の識別モデルよりも優れた性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:40:38 GMT)
Protein Language Model-Powered 3D Ligand Binding Site Prediction from
Protein Sequence [16.1] タンパク質の結合部位の予測は、タンパク質の機能を理解し、潜在的な薬物をスクリーニングする重要な課題である。
既存の方法の多くは、入力として実験的に決定されたタンパク質ホロ構造を必要とする。
タンパク質配列とリガンド分子グラフのみを入力とするLaMPSiteを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:47:38 GMT)
Learning Deep O($n$)-Equivariant Hyperspheres [16.0] 私たちの主な貢献は理論であり、幾何学的深層学習における大きな課題に取り組みます。
我々は、最近開発された3次元球状ニューロンの理論を、そのニューロンを$n$Dに拡張することで強化する。
我々は理論的貢献を実験的に検証し、我々のアプローチがベンチマークデータセットの競合手法よりも優れていることを発見した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:29:30 GMT)
Near-Optimal Mean Estimation with Unknown, Heteroskedastic Variances [16.0] Subset-of-Signalsモデルはヘテロスケダティック平均推定のベンチマークとして機能する。
我々のアルゴリズムは、このオープンな問題を対数的要因に分解する。
たとえ$d=2$であっても、我々の手法は各サンプルのばらつきを知るのに匹敵するレートを可能にします。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:13:10 GMT)
Unified learning-based lossy and lossless JPEG recompression [15.9] 本稿では,学習量子化テーブルとマルコフ階層型変分オートエンコーダから構成されるJPEG再圧縮フレームワークを提案する。
実験の結果,JPEGが上界に近づくと,任意に低歪みが得られることがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:07:27 GMT)
Hardware Resilience Properties of Text-Guided Image Classifiers [15.8] 本稿では,過渡的ハードウェアエラーに直面した配置中の画像分類モデルの信頼性を高める新しい手法を提案する。
当社のアプローチは,ハードウェアの信頼性の平均的な向上を目覚ましい5.5倍に達成しています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:56:04 GMT)
Synchronization is All You Need: Exocentric-to-Egocentric Transfer for
Temporal Action Segmentation with Unlabeled Synchronized Video Pairs [15.7] 本稿では,既存のラベル付きエキソセントリックビデオを活用する新しい手法と,ラベルなし,同期化されたエキソセントリックビデオの新たなセットを提案する。
その結果、従来の教師なし領域適応と時間的シーケンスアライメントアプローチに対する提案手法の有効性と有効性を示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:24:43 GMT)
Single site-controlled inverted pyramidal InGaAs QD-nanocavity operating
at the onset of the strong coupling regime [15.5] GaAsフォトニック結晶空洞の反極における単サイト制御逆ピラミッド型InGaAs QDは、実際のオンチップフォトニック量子情報処理に非常に有望である。
ここでは, フォノンを介するコヒーレントな励起子-光子相互作用の開始点を明らかにする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:13:07 GMT)
ViscoNet: Bridging and Harmonizing Visual and Textual Conditioning for
ControlNet [15.0] 本稿では、視覚的プロンプトによるテキスト・ツー・イメージ・ヒューマン・ジェネレーション・モデルを強化する新しい手法であるViscoNetを紹介する。
視覚特性や芸術的スタイルをテキストや画像のプロンプトで操作できる人間の画像生成におけるViscoNetの有効性を実証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:41:17 GMT)
A Multi-In-Single-Out Network for Video Frame Interpolation without
Optical Flow [14.9] 深層学習に基づくビデオフレーム (VFI) 法は、2つの入力フレーム間の動きを推定することに集中している。
動作ベクトル推定に依存しないマルチインシングルアウト(MISO)に基づくVFI法を提案する。
我々はMISO-VFIがビデオフレーム内のベクトル時間をよりよくキャプチャできる新しい動き知覚損失を導入した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:07:12 GMT)
WhisBERT: Multimodal Text-Audio Language Modeling on 100M Words [14.9] 我々はWhisbertを1億ワードとそれに対応する音声からなるデータセットで訓練する。
テキストのみと音声とテキストの両方で同時にトレーニングされたモデルのバージョンを比較した。
Whisbertはマルチモーダル・マスクド・モデリングでうまく機能するが、その複雑な目的を最適化するのに苦労している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:03:13 GMT)
Quantum spin probe of single charge dynamics [14.7] 光学的に不活性なスピン欠陥を探索する方法は、原子スケールで半導体物理学を明らかにする。
我々は、欠陥中心の電荷とスピン状態の内在的相関を利用して、欠陥電荷の集団およびダイナミクスを測定する。
これらのスピン共鳴に基づく手法は、関連する物質の他の固体欠陥系に一般化する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:06:05 GMT)
Tweetorial Hooks: Generative AI Tools to Motivate Science on Social
Media [14.4] 本研究では,大規模言語モデル(LLM)を用いて,複雑な科学的トピックのフックを書くプロセスの足場を構築する手法を提案する。
評価の結果、システムは認知負荷を低減し、より良いフックを書くのに役立ちます。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:36:29 GMT)
Revitalizing Legacy Video Content: Deinterlacing with Bidirectional
Information Propagation [14.3] 本稿では,アニメーションとライブアクションの映像コンテンツを挿入するディープラーニングに基づく手法を提案する。
提案手法は,複数スケールにわたる双方向情報伝搬を支援する。
提案手法は,複数フィールドを同時に処理し,フレーム単位の時間を短縮し,リアルタイム処理を可能にする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:06:02 GMT)
Are Synthetic Data Useful for Egocentric Hand-Object Interaction
Detection? An Investigation and the HOI-Synth Domain Adaptation Benchmark [14.2] 本研究では,手動物体間相互作用の合成画像に,手動物体接触状態,バウンディングボックス,ピクセルワイドセグメンテーションマスクをラベル付けしたシミュレータを提案する。
合成データとドメイン適応手法を用いることで、従来の教師付き手法に匹敵する性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:29:00 GMT)
Cyber Insurance for Cyber Resilience [13.7] 本章では,定量的サイバー保険設計の枠組みについて概観する。
最先端の攻撃ベクターと防御機構の相関の上に構築される。
個人のリスク嗜好を定量化する現代的な手法を用いて、認識操作の経済的影響と道徳的ハザードを関連づける。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:50:34 GMT)
Zero Trust for Cyber Resilience [13.3] この章はゼロトラストモデルにおけるサイバーレジリエンスに注意を向けている。
従来の周辺セキュリティからゼロ信頼への進化を紹介し,その違いについて議論する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:53:20 GMT)
Learning High-Dimensional Differential Graphs From Multi-Attribute Data [12.9] 類似構造を持つことが知られている2つのガウス図形モデル(GGM)の違いを推定する問題を考える。
差分グラフ推定の既存の方法は単一属性(SA)モデルに基づいている。
本稿では,多属性データから差分グラフ学習のためのグループラッソペナル化Dトレース損失関数手法を解析する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:54:46 GMT)
Unraveling the Enigma of Double Descent: An In-depth Analysis through
the Lens of Learned Feature Space [12.9] 二重降下は、機械学習領域内の反直観的な側面を示す。
ノイズの多いデータで訓練された不完全なモデルに二重降下が生じると我々は主張する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:53:43 GMT)
Machine Learning Driven Sensitivity Analysis of E3SM Land Model
Parameters for Wetland Methane Emissions [12.8] メタン(CH4)は二酸化炭素に次いで2番目に重要な温室効果ガスであり、観測された温暖化の16-25%に寄与する。
感度分析(SA)は、メタン放出の臨界パラメータを特定し、将来の予測におけるバイアスや不確実性を減少させるのに役立つ。
本研究では,エナジー・エクサスケール・アース・システム・モデル(E3SM)ランド・モデル(ELM)のメタン・モジュールにおける臨界生物地球化学的プロセスに関与する19のパラメータについてSAを行う。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:16:13 GMT)
Comparing Styles across Languages [12.6] 本稿では,多言語LMからスタイリスティックな違いを抽出し,言語間のスタイルを比較するための説明フレームワークを提案する。
我々のフレームワークはあらゆる言語で包括的なスタイルレキシカを生成する。
この枠組みを用いて丁寧さを比較し、最初の全体論的多言語多言語丁寧さデータセットを作成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:18:40 GMT)
NeutronStream: A Dynamic GNN Training Framework with Sliding Window for
Graph Streams [12.4] NeutronStreamは動的グラフニューラルネットワーク(GNN)モデルをトレーニングするためのフレームワークである。
グラフ更新の空間的および時間的依存関係をキャプチャする。
中性子ストリームは1.48Xから5.87Xまでのスピードアップを実現し、平均精度は3.97%向上した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:58:05 GMT)
Robust Combiners and Universal Constructions for Quantum Cryptography [12.1] 堅牢なコンバインダは、暗号プリミティブの多くの候補を組み合わせて、同じプリミティブの新たな候補を生成する。
普遍的な構成はプリミティブの明示的な構成であり、プリミティブが存在する限り正確かつ安全である。
本研究では、いくつかの量子暗号プリミティブに対して、ロバストなコンバインダーと普遍的な構成を定義する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:40:55 GMT)
Building Trustworthy NeuroSymbolic AI Systems: Consistency, Reliability,
Explainability, and Safety [11.9] 我々は、NeuroSymbolicメソッド上で、一貫性、信頼性、ユーザレベルの説明可能性、安全性がどのように構築されているかを示すCRESTフレームワークを紹介します。
この記事では、CRESTフレームワーク内で選択されたAIシステムとして、Large Language Models(LLM)に焦点を当てる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:13:55 GMT)
CRAFT: Contextual Re-Activation of Filters for face recognition Training [11.5] 我々は「CRAFT: 顔認識訓練用フィルタのコンテキスト再活性化」を提案する。
CRAFTは,非活性フィルタの割合を平均で44%から32%に減らし,標準トレーニングでは見つからないフィルタパターンを発見する。
CRAFTは、リアクションのない標準トレーニングと比較して、標準的な顔認識ベンチマークデータセットでモデル精度が向上することを示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:58:50 GMT)
NeuroMixGDP: A Neural Collapse-Inspired Random Mixup for Private Data
Release [11.4] プライバシを保存するデータリリースアルゴリズムは、ユーザのプライバシを保護する能力に注目を集めている。
生データの混成は、データ拡張の新しい方法を提供し、有用性を改善するのに役立つ。
本稿では, 単純な構造を活かし, ノイズの多い混合機能をリリースするために, ニューラル・コラプス機能を混在させる手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:42:31 GMT)
Amortized Bayesian Decision Making for simulation-based models [11.4] シミュレータ上でベイズ決定を行う方法に関する問題に対処する。
本手法は,シミュレーションデータ上にニューラルネットワークを学習し,予測コストを予測する。
次に,医療神経科学における実世界のシミュレーターにおける最適な行動を推測するために,本手法を適用した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:29:54 GMT)
Efficient Deep Learning Models for Privacy-preserving People Counting on
Low-resolution Infrared Arrays [11.4] 赤外線(IR)アレイセンサーは低コストで省エネでプライバシー保護のソリューションを提供する。
これまでの研究は、ディープラーニング(DL)がこのタスクにおいて優れたパフォーマンスが得られることを示した。
商業用8x8アレイから収集したIR画像からなる新しいデータセット上で,6種類のDLアーキテクチャを比較した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:16:40 GMT)
Algorithms for mean-field variational inference via polyhedral
optimization in the Wasserstein space [11.2] ワッサーシュタイン空間上の有限次元多面体部分集合の理論を開発し、一階法による函数の最適化を行う。
我々の主な応用は平均場変動推論の問題であり、これは分布の$pi$ over $mathbbRd$を製品測度$pistar$で近似しようとするものである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:02:04 GMT)
Jellyfish: A Large Language Model for Data Preprocessing [10.9] Jellyfish(ジェリーフィッシュ)は、Llama 2 13Bモデルで開発されたDPの普遍的なタスク解決ツールである。
いくつかの典型的なDPタスクのデータセットで命令調整される。
自然言語を理解する能力は、DPタスクの指示を手作業で作成することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:02:46 GMT)
Recovery of damaged information via scrambling in indefinite casual
order [10.6] スクランブルは、ローカルオペレーターとのローカル情報へのアクセスを防止する。
不確定なカジュアルな順序でスクランブルすることで、損傷した量子情報を復元する改良スキームを実証する。
さらに,クラウドベースの量子コンピュータであるQuafuについて実験を行った。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:21:20 GMT)
Harmonizing Global Voices: Culturally-Aware Models for Enhanced Content
Moderation [10.5] メディアニュースや記事の広範なデータセットに基づいて大規模な言語モデルをトレーニングし、文化的に直感的なモデルを作成します。
その結果,広範囲なメディアデータセットのトレーニングが文化意識の獲得に成功し,地域レベルでのコンテンツ違反処理の改善につながった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:11:09 GMT)
On the Initialization of Graph Neural Networks [10.2] グラフニューラルネットワーク層間の前方・後方伝播のばらつきを解析する。
GNN最適化(Virgo)における可変不安定化のための新しい手法を提案する。
15のデータセットで包括的な実験を行い、Virgoが優れたモデルパフォーマンスをもたらすことを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:55:49 GMT)
Beyond Isolation: Multi-Agent Synergy for Improving Knowledge Graph
Construction [10.1] 本稿では,知識グラフ構築のための新しいフレームワークであるCooperKGCを紹介する。
CooperKGCは協調処理ネットワークを確立し、エンティティ、リレーション、イベント抽出タスクを同時に処理できるKGCコラボレーションチームを組み立てる。
我々の実験は、CooperKGC内の多様なエージェント間の協調と情報相互作用の促進が、単独で動作している個々の認知プロセスよりも優れた結果をもたらすことを明白に示している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:27:08 GMT)
Quantum and private capacities of low-noise channels [10.1] 我々は、低ノイズ量子チャネルの量子容量とプライベート容量の両方を先行順序に決定する。
超添加性と縮退符号は量子容量に対して無視できる利点がある。
シールドは 量子能力以上の プライベートな能力は改善しない
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:51:57 GMT)
HeadGaS: Real-Time Animatable Head Avatars via 3D Gaussian Splatting [10.0] 本稿では,3次元頭部再構成とアニメーションに3次元ガウスプレート(3DGS)を用いた最初のモデルであるHeadGaSを提案する。
我々は,HeadGaSが,ベースラインを最大2dBまで越えた,リアルタイム推論フレームレートの最先端結果を提供することを示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:19:22 GMT)
(Provable) Adversarial Robustness for Group Equivariant Tasks: Graphs,
Point Clouds, Molecules, and More [9.9] 本稿では,タスク等価性を考慮した正反対ロバスト性の概念を提案する。
しかし、認証方法は、多くのモデルでは利用できない。
我々は、ノード分類のような同型同変タスクに対して、最初のアーキテクチャ固有のグラフ編集距離証明、すなわち、健全性保証を導出する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:09:45 GMT)
Harnessing Discrete Representations For Continual Reinforcement Learning [9.7] 強化学習の文脈における分類的価値のベクトルとして観測を表現することの利点について検討する。
従来の連続表現と比較すると、離散表現よりも学習した世界モデルは、キャパシティの少ない世界のより正確なモデルであることが分かる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:45:24 GMT)
TokenCut: Segmenting Objects in Images and Videos with Self-supervised
Transformer and Normalized Cut [9.6] 本稿では,自己教師型トランスフォーマーによって得られた特徴を利用して,画像やビデオ中の有能なオブジェクトを検出し,セグメント化するグラフベースのアルゴリズムについて述べる。
このアプローチの単純さにもかかわらず、いくつかの共通画像およびビデオ検出およびセグメンテーションタスクにおける最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:01:49 GMT)
Fully Convolutional Slice-to-Volume Reconstruction for Single-Stack MRI [9.5] 磁気共鳴イメージング(MRI)において、スライス・ツー・ボリューム再構成(SVR)とは、未知の3次元磁気共鳴体積を運動によって破壊された2次元スライススタックからコンピュータで再構成することである。
本稿では,従来の作業の欠点を克服するSVR手法を提案する。
成人脳と胎児脳のSVR実験により、我々の完全畳み込み法は以前のSVR法より2倍正確であることが示された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:45:44 GMT)
Pitfall of Optimism: Distributional Reinforcement Learning by
Randomizing Risk Criterion [9.4] 本稿では,リスクの一方的な傾向を避けるために,リスク基準のランダム化によって行動を選択する新しい分散強化学習アルゴリズムを提案する。
理論的結果は,提案手法がバイアス探索に該当せず,最適回帰に収束することが保証されていることを裏付けるものである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:14:37 GMT)
BEDD: The MineRL BASALT Evaluation and Demonstrations Dataset for
Training and Benchmarking Agents that Solve Fuzzy Tasks [9.4] BASALT Evaluation and Demonstrationsデータセットを通じて、コミュニティにベンチマークを提供します。
BEDDは、MinecraftでBASALTタスクを完了した約14,000人のプレイヤーのビデオから、2600万のイメージアクションペアを集めている。
また、人的およびアルゴリズム的なエージェントに対する3,000以上の密集した人間的評価も含まれている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:29:44 GMT)
A Policy Resonance Approach to Solve the Problem of Responsibility
Diffusion in Multiagent Reinforcement Learning [9.3] 単一エージェント探索探索戦略を単一エージェントアルゴリズムから必然的に継承することは、潜在的なコラボレーションの失敗を引き起こす。
我々はこの問題を責任拡散(RD)と呼び、同名の社会心理学効果と類似点を共有している。
我々は,複雑な協調作業におけるエージェントの協調的性能を促進するために,SOTAアルゴリズムがこのアプローチを適用可能であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:37:57 GMT)
A Case for Synthesis of Recursive Quantum Unitary Programs [9.3] 量子プログラムは、量子プログラミングに関連する直感的な量子知識のために、コーディングと検証が難しいことで知られている。
本稿では、新しい帰納的量子プログラム言語を含む、最初の量子プログラム合成フレームワークであるQ Synthを紹介する。
Q Synthは量子加算器回路、量子固有値反転回路、量子フーリエ変換を含む10個の量子ユニタリプログラムをうまく合成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:49:07 GMT)
MedDM:LLM-executable clinical guidance tree for clinical decision-making [9.3] LLMで直接使用できる適切な臨床ガイダンスツリーデータセットは存在しない。
まず LLM-executavle Clinical Guide Tree (CGT) を提案する。
本研究は,フローチャートから医療診断意思決定データセット(MedDM)を構築した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:44:07 GMT)
SAM-Assisted Remote Sensing Imagery Semantic Segmentation with Object
and Boundary Constraints [9.2] 本稿では,SAM生成オブジェクト(SGO)とSAM生成境界(SGB)という2つの新しい概念を活用することにより,SAMの生出力を活用するフレームワークを提案する。
本稿では,SGOのコンテンツ特性を考慮し,セマンティックな情報を持たないセグメンテーション領域を活用するために,オブジェクト整合性の概念を導入する。
境界損失は、モデルが対象の境界情報に注意を向けることによって、SGBの特徴的な特徴に重きを置いている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:33:47 GMT)
Panoptica -- instance-wise evaluation of 3D semantic and instance
segmentation maps [9.1] Panopticaは2Dおよび3Dセグメンテーションマップからインスタンスワイドセグメンテーション品質メトリクスを計算するための汎用的でパフォーマンスに最適化されたパッケージである。
panopticaはPythonで実装されたオープンソースで、包括的なドキュメントとチュートリアルが付属している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:34:56 GMT)
HIG: Hierarchical Interlacement Graph Approach to Scene Graph Generation
in Video Understanding [9.1] 既存の手法は単純な関係モデルを活用しながら複雑な相互作用に焦点を当てている。
階層構造内の統一層とグラフを利用する階層型インターレースグラフ (HIG) という新しい手法を提案する。
提案手法は,様々なシナリオで実施された広範囲な実験を通じて,他の手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:47:19 GMT)
More Quantum Speedups for Multiproposal MCMC [9.1] マルチプロポサルマルコフ連鎖モンテカルロ(MCMC)アルゴリズムは、目標分布をより効率的にサンプリングするために、各イテレーションで複数の提案から選択する。
最近の研究は、そのような多目的MCMCアルゴリズムの2次量子スピードアップの可能性を示している。
QPMCMC2は,ターゲット評価に$mathcalO(1)$と$mathcalO(log P)$ qubitsしか必要としない。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:42:31 GMT)
A Hardware Evaluation Framework for Large Language Model Inference [9.1] この研究は、LLM(Large Language Models)のハードウェア評価フレームワークを紹介します。
LLMは高速で正確で汎用的で、様々なハードウェアの設計を記述し評価することができる。
LLMの助けを借りて、この研究はアーキテクチャ上の意味を描き、新しいコスト効率のハードウェア設計を探求する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:01:33 GMT)
Graph Information Bottleneck for Remote Sensing Segmentation [9.0] 本稿では、画像をグラフ構造として扱い、リモートセンシングセグメンテーションのための単純なコントラスト視覚GNNアーキテクチャを提案する。
具体的には,ノードマップとエッジマップのグラフビューを構築し,最適なグラフ構造表現を得る。
UNetの畳み込みモジュールをSC-ViGモジュールに置き換え、セグメンテーションと分類タスクを完成させる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:23:22 GMT)
Cross-feature Contrastive Loss for Decentralized Deep Learning on
Heterogeneous Data [8.9] 異種データに基づく分散学習のための新しい手法を提案する。
一対の隣接するエージェントのクロスフィーチャーは、他のエージェントのモデルパラメータに関するエージェントのデータから得られる特徴である。
実験の結果,提案手法は異種データを用いた分散学習手法に比べて性能(テスト精度が0.2~4%向上)が優れていることがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:31:51 GMT)
Detecting algorithmic bias in medical AI-models [8.7] 本稿では,医療AI意思決定支援システムにおけるアルゴリズムバイアスの領域を検出するための革新的な枠組みを提案する。
本手法は,医学・AIモデルにおける潜在的なバイアスを,特に敗血症予測の文脈で効果的に同定する。
AIベースの医療判断における公平性と公平性を保証するための重要な手段として機能する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:47:34 GMT)
Robust Clustering using Hyperdimensional Computing [8.6] 本稿では,超次元計算(HDC)領域におけるデータのクラスタリングについて述べる。
類似性に基づくk平均、等しいビン幅ヒストグラム、等しいビン高さヒストグラム、類似性に基づく親和性伝播の4つのHDCベースのクラスタリングアルゴリズムを提案する。
既存のHDClusterと比較して、提案したHDCベースのクラスタリングアルゴリズムは、精度の向上、堅牢なパフォーマンス向上、イテレーションの削減、実行時間の短縮を実現しています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:46:29 GMT)
Using Curiosity for an Even Representation of Tasks in Continual Offline
Reinforcement Learning [8.6] 本稿では,リプレイバッファに好奇性を用いることで,オフラインマルチタスク連続強化学習を改善する方法を検討する。
特に,タスク境界検出ツールとしての好奇心と,古い遷移を維持するための優先度指標としての好奇心の利用について検討する。
これらのバッファは、エージェントのタスクへの露出が時間とともに等しくない場合に、アート再生バッファの状態に悩まされる破滅的な忘れの問題を軽減するために使用できることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:53:05 GMT)
Active Learning for Abrupt Shifts Change-point Detection via
Derivative-Aware Gaussian Processes [8.6] 本稿では,変化点の特定を効果的に行うためにDACD法を提案する。
GP導出平均と分散を基準として、DACDは次のサンプリングデータポイントを順次選択する。
様々なシナリオにおけるDACD法の有効性について検討し、他のアクティブな学習変化点検出手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:44:05 GMT)
CROP: Towards Distributional-Shift Robust Reinforcement Learning using
Compact Reshaped Observation Processing [8.6] 一般化のための最近のアプローチは、トレーニングデータの多様性を高めるためにデータ拡張技術を適用している。
重要な情報のみを含む適切な観察を行うことは、それ自体が困難な作業であることが示されている。
政策最適化に使用する状態情報を削減するために,CROP(Compact Reshaped Observation Processing)を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:16:23 GMT)
Rethinking Radiology Report Generation via Causal Reasoning and
Counterfactual Augmentation [8.1] 放射線学報告生成(RRG)は、視覚と言語分野の相互作用として注目されている。
共同ビジョン結合と条件文コヒーレンス結合は、レポートの精度を暗黙的に低下させる2つの側面である。
対実的サンプル合成と対実的レポート再構成を含む対実的拡張戦略を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:25:23 GMT)
A Central Motor System Inspired Pre-training Reinforcement Learning for
Robotic Control [8.1] 本稿では,ロボットがリッチモータースキルを習得することのできる,事前学習型強化学習アルゴリズムを提案する。
まず,任意運動の選択機構を利用して,脳に類似したスキルベースネットワークを設計する。
本研究では,4種類のロボットと22種類のタスク環境について実験を行い,提案手法により,柔軟な運動能力を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:47:30 GMT)
Airdrops: Giving Money Away Is Harder Than It Seems [8.1] エアドロップの設計空間を概説し、エアドロップが理想的に生み出すべき結果の合理的なリストを指定する。
本研究は,複数の大規模エアロッドからのオンチェーンデータを解析し,過去のエアロッドの成功を実証的に評価する。
我々の分析は、一般的な気滴設計が与える共通の落とし穴を概観し、それを用いて、より良い気滴設計のための具体的なガイドラインを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:27:15 GMT)
Training on Synthetic Data Beats Real Data in Multimodal Relation
Extraction [8.0] 本稿では,テキストや画像などの一意的なデータのみをトレーニング中に利用できるような,新たな問題設定について考察する。
我々は,実マルチモーダルテストデータ上で良好に動作する合成データから,マルチモーダル関係を訓練することを目指している。
完全合成画像で訓練された最良のモデルは、F1の3.76%のマージンで、実際のマルチモーダルデータで訓練された最先端モデルよりも優れています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:11:34 GMT)
Dimensionality Reduction and Dynamical Mode Recognition of Circular
Arrays of Flame Oscillators Using Deep Neural Network [8.0] 本研究では,振動燃焼系における動的モードを認識するための有望な手法 (Bi-LSTM-VAE-WDC) を提案する。
具体的には, 燃焼系の高次元時空間データを低次元位相空間に還元するために, Bi-LSTM-VAE次元縮小モデルを導入した。
その結果,新しいBi-LSTM-VAE法では位相点の非重複分布が生成され,非教師なしモード認識と分類が効果的であることが示唆された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:25:45 GMT)
Realistic Scatterer Based Adversarial Attacks on SAR Image Classifiers [7.9] 対向攻撃は、分類器を誤用して誤った予測を行うように、地上目標のSAR画像を摂動する。
本研究は,散乱器を用いた物理対向攻撃であるOn-Target Scatterer Attack (OTSA)を提案する。
本研究は,既存の手法と比較して,位置制約下での攻撃による成功率が有意に高いことを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:36:34 GMT)
Skipping Scheme for Gate-hiding Garbled Circuits [7.8] ゲートを隠蔽するガーブラード回路は、時間コストを大幅に削減する可能性がある。
本方式では,回路全体を計算する必要をなくし,不要な実行経路を回避するためにスキップゲートを導入する。
半正直シナリオにおけるシミュレーションベースと対称性ベースのセキュリティを組み合わせたハイブリッドセキュリティの証明を行い,ゲートヒディング条件下でのセキュリティの実証を行った。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:38:09 GMT)
Topological Graph Signal Compression [7.8] 本稿では,グラフ上での信号圧縮のための新しいTDL法を提案する。
我々のフレームワークは標準GNNとフィードフォワードアーキテクチャの両方を改善している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:42:53 GMT)
Resolving Multiphoton Coincidences in Single-Photon Detector Arrays with
Row-Column Readouts [7.8] 行列読み出し付き単光子検出器アレイにおいて,最大4光子一致を解消する手法を提案する。
この手法の自然シーンイメージングへの応用はモンテカルロ実験を用いて実証された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:58:43 GMT)
General-Purpose Retrieval-Enhanced Medical Prediction Model Using
Near-Infinite History [7.7] このような課題に対処するために、検索型医療予測モデル(REMed)を提案する。
REMedは基本的に、無制限の臨床イベントを評価し、関連するイベントを選択し、予測する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:20:11 GMT)
Perspectives from Naive Participants and Experienced Social Science
Researchers on Addressing Embodiment in a Virtual Cyberball Task [7.7] 本稿では,アバターのカスタマイズやユーザからのフィードバックを含む没入型仮想サイバーボールタスクの設計について述べる。
我々は15人のCyberball利害関係者と詳細なユーザテストとフィードバックセッションを行った。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:09:59 GMT)
Scaling Laws for Adversarial Attacks on Language Model Activations [7.7] 我々は,言語モデルのアクティベーションをターゲットとした,敵対的攻撃のクラスを探索する。
出力空間内の1ビットを制御するのに必要な入力空間の制御ビット数は著しく一定である。
トークンの代わりに言語モデルのアクティベーションを攻撃しやすくすることの実践的意味は、マルチモーダルおよび選択された検索モデルである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:12:15 GMT)
Benchmarking highly entangled states on a 60-atom analog quantum
simulator [7.4] 我々は60原子のアナログRydberg量子シミュレータを用いて有限性ベンチマークと混合状態絡み合い推定を行う。
本研究により,アナログおよびデジタル量子デバイスが絡み合いを発生させる能力を評価するための新たなパラダイムが実現された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:50:04 GMT)
GSDC Transformer: An Efficient and Effective Cue Fusion for Monocular
Multi-Frame Depth Estimation [7.2] 単分子多フレーム深度推定におけるキュー融合の効率的な構成法を提案する。
我々は、正確な形状に頼ることなく、シーン特性をスーパートークンの形で表現する。
本手法は,KITTIデータセット上での高速核融合速度で最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:22:24 GMT)
MGTR: Multi-Granular Transformer for Motion Prediction with LiDAR [7.1] 我々は,異なる種類のトラフィックエージェントに対して,異なる粒度のコンテキスト特徴を利用するエンコーダデコーダネットワークであるMulti-Granular TRansformer (MGTR) フレームワークを提案する。
我々は,オープンデータセットの動作予測ベンチマーク上でMGTRを評価し,提案手法が最先端のパフォーマンスを達成し,リーダボードで1位となったことを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:48:31 GMT)
Facilitating the Production of Well-tailored Video Summaries for Sharing
on Social Media [7.1] 本稿では,ソーシャルメディア上でのオンライン共有に適した要約作成を支援するウェブツールを提案する。
ビデオ要約とアスペクト比変換のための統合AIモデルに基づいて、フル長ビデオの複数の要約を生成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:47:28 GMT)
zkDL: Efficient Zero-Knowledge Proofs of Deep Learning Training [7.0] ZkDLは、ディープラーニングトレーニングのための効率的なゼロ知識証明である。
zkReLUは、ReLU活性化とそのバックプロパゲーションの特別な証明である。
FAC4DNNはニューラルネットワークをモデル化する特殊な演算回路設計である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:42:53 GMT)
PG-VTON: A Novel Image-Based Virtual Try-On Method via Progressive
Inference Paradigm [6.9] プログレッシブ推論パラダイム(PGVTON)を用いた新しい仮想試行法を提案する。
形状案内として試着解析を応用し,ワープ・マッピング・コンポジションによる衣服試着を実装した。
実験により,本手法は2つの挑戦シナリオ下での最先端性能を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:04:12 GMT)
UTBoost: A Tree-boosting based System for Uplift Modeling [6.9] アップリフトモデリング(アップリフトモデリング)とは、マネージャが顧客のアップリフトを見積もるのに使用できる一連の機械学習技術を指す。
そこで本研究では,GBDT(Gradient Boosting Decision Trees)アルゴリズムの2つの革新的適応法を提案する。
大規模データセットを用いた実験により,提案手法の有用性が示された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:41:23 GMT)
Flood Event Extraction from News Media to Support Satellite-Based Flood
Insurance [6.9] 保険のような災害の経済的ショックを吸収する安全網は、バングラデシュのような洪水に最も弱い地域では利用できないことが多い。
インデックスベースの保険は安価なソリューションとして現れており、気象データや衛星からの情報を考慮し、「フロードインデックス」を作成する。
本研究では,高分解能時間情報をニュースメディアから抽出することで,衛星ベースの洪水指数保険を支援する新しいアプローチについて検討する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:39:42 GMT)
An Integrated System for Spatio-Temporal Summarization of 360-degrees
Videos [6.8] 本稿では,360度ビデオの要約システムを提案する。
ビデオ制作は主にイベントとそのシナプスを簡潔な要約に検出する。
この分析は、360度ビデオの正当性検出のための最先端の手法に依存している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:48:31 GMT)
NeuRAD: Neural Rendering for Autonomous Driving [6.8] 神経放射場(NeRF)は自律走行(AD)コミュニティで人気を集めている。
近年の手法は, 閉ループシミュレーションにおけるNeRFのポテンシャルを示し, ADシステムの試験を可能にしている。
我々は,動的ADデータに適した,堅牢なビュー合成手法であるNeuRADを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:53:18 GMT)
ScAR: Scaling Adversarial Robustness for LiDAR Object Detection [6.5] モデルの敵の堅牢性は、敵の攻撃に抵抗する能力である。
我々は,LiDARオブジェクト検出のためのブラックボックススケーリング逆攻撃法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:03:33 GMT)
A Unified Simulation Framework for Visual and Behavioral Fidelity in
Crowd Analysis [6.5] We present a human crowd simulator, called UniCrowd, and its associated validation pipeline。
本稿では,コンピュータビジョンタスク,特に検出とセグメンテーションに適したアノテートデータを生成する方法と,クラウドカウント,人間のポーズ推定,軌道解析と予測,異常検出などの関連アプリケーションについて述べる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:43:27 GMT)
Inherent limitations of LLMs regarding spatial information [6.4] 本稿では,空間推論やナビゲーション関連タスクにおけるChatGPTと類似モデルの性質的制約について検討する。
このデータセットは、空間点のプロット、二次元(2次元)空間での計画経路、三次元(3次元)環境における開発経路の3つの重要なタスクで構成されている。
評価の結果,空間的理解におけるモデルの能力と限界について重要な知見が得られた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:02:20 GMT)
Thesis Distillation: Investigating The Impact of Bias in NLP Models on
Hate Speech Detection [6.3] 本論文は私の博士論文における研究成果の要約である。
NLPモデルにおけるバイアスがヘイトスピーチ検出の課題に与える影響を3つの観点から検討する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:43:44 GMT)
A Dynamic Network for Efficient Point Cloud Registration [6.3] 我々は,コンピュータビジョンタスクにおけるネットワーク効率向上のために広く利用されている動的アプローチを,ポイントクラウド登録タスクに導入する。
我々は、複数回のポイントクラウドデータに反復的な登録プロセスを用いて、一致するポイントクラスタの領域を特定し、最終的にノイズの多いポイントを除去することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:47:46 GMT)
TR3D: Towards Real-Time Indoor 3D Object Detection [6.2] TR3Dは、エンドツーエンドで訓練された完全畳み込み3Dオブジェクト検出モデルである。
ポイントクラウドとRGBの両方の入力を利用するため、我々は2Dと3Dの機能の早期融合を導入する。
TR3D+FFと呼ばれる初期の特徴融合モデルでは,SUN RGB-Dデータセット上で既存の3Dオブジェクト検出手法よりも優れている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:33:52 GMT)
MEMTO: Memory-guided Transformer for Multivariate Time Series Anomaly
Detection [6.2] MEMTOはメモリ誘導トランスフォーマーで、入力データに応じて各メモリ項目が更新される度合いを学習する。
提案手法は,多様な領域から得られた5つの実世界のデータセットに対して評価する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:28:19 GMT)
Inherent Inconsistencies of Feature Importance [6.0] 特徴重要度は、予測結果に対する個々の特徴の寄与にスコアを割り当てる手法である。
本稿では,特徴重要度スコアの異なる文脈間のコヒーレントな関係を確立するために設計された公理的枠組みを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:29:53 GMT)
Semi-Supervised Health Index Monitoring with Feature Generation and
Fusion [5.9] 我々はHealth Index (HI) 構築のためのDeep Semi-supervised Anomaly Detection (DeepSAD) 法を適用した。
我々は、等方性制約を持つ交互投影アルゴリズムを用いて、DeepSADの埋め込みを正規化HIに変換し、傾向を増大させる。
我々の貢献により、よりアクセシブルで信頼性の高いHI推定が可能となる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:27:51 GMT)
Stackelberg Driver Model for Continual Policy Improvement in
Scenario-Based Closed-Loop Autonomous Driving [5.8] 安全クリティカルなシナリオを合成するための効率的な手法のクラスとして、敵生成法が登場した。
Stackelberg Driver Model (SDM) を調整し、車両相互作用の階層的な性質を正確に特徴づける。
提案アルゴリズムは,特に高次元シナリオにおいて,いくつかのベースラインと比較して優れた性能を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:41:23 GMT)
Excitonic enhancement of cavity-mediated interactions in a two-band
Hubbard model [5.6] 本研究では,光共振器に結合した2次元2バンドハバードモデルで発生するキャビティ媒介相互作用について検討した。
我々は、高エネルギー自由度を投影し、平均場レベルでの内在的相互作用を処理することによって、効果的な低エネルギーハミルトニアンを導出する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:36:17 GMT)
Adaptive spectral graph wavelets for collaborative filtering [5.5] 協調フィルタリングはレコメンデーションシステムにおいて一般的なアプローチであり、その目的はパーソナライズされた項目の提案を提供することである。
本稿では,暗黙的なフィードバックデータに対するスペクトルグラフウェーブレット協調フィルタリングフレームワークを提案する。
グラフの局所的および大域的構造を捉えることに加えて、我々の手法は空間的およびスペクトル的領域におけるグラフ信号の局所化をもたらす。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:22:25 GMT)
The Use of Multi-Scale Fiducial Markers To Aid Takeoff and Landing
Navigation by Rotorcraft [5.5] 本稿では,マルチスケールフィデューシャルマーカーを用いた視覚SLAMの性能を定量的に評価する。
各種環境条件下での離着陸時の性能評価を行った。
私たちのデータセットとフィジュアルマーカーによるビジュアルSLAMの実装のコードが、オープンソースとして公開されています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:08:25 GMT)
Pseudo Replay-based Class Continual Learning for Online New Category
Anomaly Detection in Additive Manufacturing [5.5] 本稿では,クラスインクリメンタルラーニングとオーバーサンプリングベースデータ生成を統合した,新しい擬似リプレイ型連続学習を開発する。
本フレームワークの有効性を添加製造プロセスで検証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:43:23 GMT)
Investigating Technology Usage Span by Analyzing Users' Q&A Traces in
Stack Overflow [5.4] ソフトウェア開発者にとっては、高い使用率を持つ技術を見つけることが不可欠です。
C#とJavaプログラミング言語は高い使用率を持ち、JavaScriptが続く。
私たちの調査では、SwiftUI、.NET-6.0、Visual Studio 2022、Blazor WebAssemblyフレームワークといった新興テクノロジも公開しています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:17:48 GMT)
Learning Energy-based Model via Dual-MCMC Teaching [5.3] 最大推定量(MLE)を用いてエネルギーベースモデル(EBM)を学習する。
本稿では,エネルギーベースモデル(EBM)の基本学習問題について考察する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:39:54 GMT)
Exploring Error Bits for Memory Failure Prediction: An In-Depth
Correlative Study [5.3] 修正不能エラー(UE)は、DIMM(Dual Inline Memory Module)の欠陥の主要な指標である。
既存のアプローチは主に、エラービットによって提供される情報を完全に考慮することなく、修正可能なエラー(CE)を使用してUEを予測することに焦点を当てている。
本稿では,CEとUEの相関関係に関する総合的研究を行い,時間的誤りビット情報の重要性を強調した。
提案手法は,UEスコアによる仮想マシンの中断回数を約59%削減する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:11:52 GMT)
Towards the Inferrence of Structural Similarity of Combinatorial
Landscapes [5.1] 最も一般的な問題の1つは類推である。与えられた問題に対して、解決者はフィットネスのランドスケープの戦略的歩みと見なすことができる。
本研究では、フィットネスランドスケープのプロキシとしてローカルオプティマネットワークを用いて、グラフデータマイニング技術を活用して、それらのランドスケープに埋め込まれた潜伏構造情報を探索する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:34:51 GMT)
A Comparative Study of AI-Generated (GPT-4) and Human-crafted MCQs in
Programming Education [5.1] 我々は,高等教育におけるPythonプログラミングクラスから,特定の学習目標(LO)に適合したマルチチョイス質問(MCQ)を生成するGPT-4の能力について分析した。
GPT-4は明確な言語でMCQを生成でき、1つの正しい選択と高品質なイントラクタを生成できることがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:29:43 GMT)
Entangling Excitons with Microcavity Photons [5.0] 励起子とキャビティ光子、または2つの励起子ポラリトン間の絡み合いを確立することができることを示す。
絡み合いは安定した状態にあり、室温で達成できる可能性がある。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:06:09 GMT)
PolyFit: A Peg-in-hole Assembly Framework for Unseen Polygon Shapes via
Sim-to-real Adaptation [4.9] PolyFitは5-DoFペグインホールアセンブリ用に設計された教師あり学習フレームワークである。
F/Tデータを正確な外因性ポーズ推定に利用し、ペグのポーズを調整して不一致を是正する。
穴内成功率は97.3%と96.3%で、シミュレーションでは目に見えない形状である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:28:33 GMT)
Dual-VQE: A quantum algorithm to lower bound the ground-state energy [4.9] 変分量子固有解法 (VQE) はハミルトンの基底状態エネルギーを上界で推定する。
本稿では,二変量量子固有解法(Dual-VQE)を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:02:19 GMT)
A Unified Theory of Diversity in Ensemble Learning [4.8] 本稿では,多様な教師付き学習シナリオにおける多様性の性質を説明する,アンサンブルの多様性の理論を提案する。
この枠組みは,アンサンブル損失のバイアス分散分解において,多様性が隠された次元であることを明らかにする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:09:24 GMT)
MOTOR: A Time-To-Event Foundation Model For Structured Medical Records [4.8] 我々はMOTOR(Many Outcome Time Oriented Representations)と呼ばれるTTE基盤モデルを提案する。
TTEモデルは、特定の事象が起こるまでの時間の確率分布を推定するために使用される。
最大5500万件の患者記録(9億件の臨床イベント)を事前トレーニングすることで、この課題に対処する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:24:44 GMT)
Towards Open-set Gesture Recognition via Feature Activation Enhancement
and Orthogonal Prototype Learning [4.7] ジェスチャー認識は人間と機械の相互作用における基礎的なタスクである。
頑健なシステムにおいて、未知の無関心な動作を効果的に識別し、拒否することが不可欠である。
本稿では,2つの新しい特徴,特徴のアクティベーションレベル,投射の不整合性を利用した,より効果的なPL手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:49:15 GMT)
Spintronics for image recognition: performance benchmarking via
ultrafast data-driven simulations [4.6] 単一スピントロニクスナノ構造を用いたエコー状態ネットワーク(ESN)による画像分類の実証を行った。
我々は、STVO力学をシミュレートするために、データ駆動型Thiele方程式アプローチと呼ばれる超高速なデータ駆動シミュレーションフレームワークを用いる。
我々は、MNIST、EMNIST-letters、Fashion MNISTデータセットで分類課題を解決するために、この手法をうまく適用することで、ソリューションの汎用性を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:07:28 GMT)
The Contemporary Art of Image Search: Iterative User Intent Expansion
via Vision-Language Model [4.5] 画像検索のための革新的なユーザ意図拡張フレームワークを提案する。
本フレームワークは,視覚モデルを用いてマルチモーダルなユーザ入力を解析・構成する。
提案フレームワークは,ユーザの画像検索体験を大幅に改善する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:24:38 GMT)
Watermarking for Neural Radiation Fields by Invertible Neural Network [4.5] Invertible Neural Network Watermarking を用いて, ニューラルネットワークの著作権保護手法を提案する。
このスキームは、各トレーニング画像に透かしを埋め込んで、神経放射野を訓練し、複数の視点から透かし情報の抽出を可能にする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:14:44 GMT)
$n$-body anti-bunching in a degenerate Fermi gas of $^3$He* atoms [4.3] 我々は3ドルHe*原子のユニークな単一原子検出特性を用いて、$n$body量子相関の同時測定を行う。
フェミオン系に付随するリッチな物理を探索するために相関関数を用いる方法が提案されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:41:00 GMT)
ASPEN: High-Throughput LoRA Fine-Tuning of Large Language Models with a
Single GPU [4.2] 本稿では,変圧器をベースとした大規模言語モデル(LLM)を微調整するフレームワークであるASPENを紹介する。
ASPENは、LoRAメソッドを使用して、1つのGPU上で複数のジョブを効率的にトレーニングし、共有事前学習モデルと適応スケジューリングを活用する。
実験によると、NVIDIA A100 80GB GPU上で複数のLLaMA-7Bモデルをトレーニングする場合、ASPENはGPUメモリの53%を節約している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:38:38 GMT)
Precise Asymptotic Generalization for Multiclass Classification with
Overparameterized Linear Models [4.1] Subramanian et al.'22 の予想では、データポイント、特徴、クラスの数はすべて一緒になる。
我々の新しい下限は情報理論の強い逆に似ており、それらは誤分類率が0か1に近づくことを証明している。
厳密な解析の鍵はハンソン・ライトの不等式の新しい変種であり、スパースラベルの多重クラス問題に広く有用である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:50:55 GMT)
DINO-Mix: Enhancing Visual Place Recognition with Foundational Vision
Model and Feature Mixing [4.1] 本稿では,基礎的な視覚モデルと特徴集約を組み合わせた,DINO-Mixと呼ばれる新しいVPRアーキテクチャを提案する。
提案したDINO-Mixアーキテクチャは,現在最先端(SOTA)手法を著しく上回っていることを実験的に実証した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:13:53 GMT)
Weakly Supervised Detection of Hallucinations in LLM Activations [4.0] 本研究では,大規模言語モデルが内部状態の幻覚を符号化するかどうかを監査する手法を提案する。
本稿では,異常パターンを検出するために,サブセットスキャンを用いた弱教師付き監査手法を提案する。
OPTは内部で幻覚情報を符号化できるが, BERTでは幻覚を符号化する能力が限られていたことが確認された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:35:11 GMT)
MKA: A Scalable Medical Knowledge Assisted Mechanism for Generative
Models on Medical Conversation Tasks [4.0] このメカニズムは、一般的な神経生成モデルを支援し、医療会話タスクにおけるより良いパフォーマンスを達成することを目的としている。
医療固有の知識グラフは、6種類の医療関連情報を含むメカニズム内に設計されている。
評価結果は,本機構と組み合わせたモデルが,複数の自動評価指標において元の手法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:55:54 GMT)
Floquet Chiral Quantum Walk in Quantum Computer [3.9] 非局所性によって実現された花束キラル量子ウォークを実現する。
カイラルウェーブパケットはアンダーソン局在のような従来の波動現象の共通した特徴を欠いていることがわかった。
従来の非キラルモデルと比較することにより, カイラル波の安定性を観察する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:54 GMT)
Learning Cortical Anomaly through Masked Encoding for Unsupervised
Heterogeneity Mapping [3.8] 本稿では、複雑な脳疾患の教師なし検出を目的とした、新しい自己教師型フレームワークであるCAM(Cortical Anomaly Detection through Masked Image Modeling)を紹介する。
我々は、この枠組みを精神スペクトル上の個人の検出に用いている。
Schizoaffectiveは0.696、Schizophreniformは0.769である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:44:25 GMT)
Structured World Representations in Maze-Solving Transformers [3.8] この研究は、小さなトランスモデルによって形成された抽象化に焦点を当てている。
迷路位相と有効経路の構造的内部表現が一貫した出現を示す証拠を見出した。
また,注目ヘッドの同定により経路追従回路の解読を行う。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:24:26 GMT)
Quantum Process Learning Through Neural Emulation [3.7] 入力アンサンブルの内部表現を構築し,未知の過程をエミュレートするニューラルネットワークを導入する。
我々のモデルは量子コンピューティング、量子フォトニクス、量子多体物理学への応用において高い精度を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:56:07 GMT)
TriDeNT: Triple Deep Network Training for Privileged Knowledge
Distillation in Histopathology [3.6] 提案するTriDeNTは,推論中に利用できない特権データを利用した,パフォーマンス向上のための自己教師型手法である。
本研究では, 空間化学, 空間転写学, 専門的核アノテーションなど, 様々なデータに対して本手法の有効性を実証する。
あらゆる設定において、TriDeNTは、ダウンストリームタスクにおける他の最先端メソッドよりも優れており、最大101%の改善が観察されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:18:25 GMT)
A Framework for Neurosymbolic Robot Action Planning using Large Language
Models [3.6] シンボリックタスク計画と機械学習アプローチのギャップを埋める枠組みを提案する。
我々は、大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する。
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:51:15 GMT)
Choroidalyzer: An open-source, end-to-end pipeline for choroidal
analysis in optical coherence tomography [3.6] Choroidalyzerはオープンソースのエンドツーエンドパイプラインで、コロイド領域、血管、卵胞を分割する。
我々は,不正確なセグメンテーションを手作業で修正した後に,最先端の自動手法を用いた。
U-Net深層学習モデルを訓練し,葉中心領域の脈絡膜厚,面積,血管指数を算出した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:40:40 GMT)
Quantum delegation with an off-the-shelf device [3.4] 我々は, OTSモデルを用いて, 時間量子計算の委譲方法を示す。
これはQMAに対する最初の相対論的(1ラウンド)2プロップゼロ知識証明システムを提供する。
証明手法として、定数サイズのパウリ測度のみを用いて、n個のEPR対に対する新しい自己検定を行う。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:23:49 GMT)
Similarity-based Knowledge Transfer for Cross-Domain Reinforcement
Learning [3.3] 我々は,エンコーダ・デコーダのセットを用いて,異なる空間に適合する半教師付きアライメント損失を開発する。
従来の手法と比較して、我々の手法は専門家のポリシーによって整列、ペア化、あるいは収集されるデータを必要としない。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:26:01 GMT)
GDN: A Stacking Network Used for Skin Cancer Diagnosis [3.3] 本稿では,皮膚癌,基底細胞癌,メラノーマの2種類の画像分類モデルであるGoogLe-Dense Network(GDN)について述べる。
GDNは2つのシーケンシャルなレベルから構成されている。第1のレベルはGoogLeNetとDenseNetによって達成された基本的な分類タスクを実行し、効率を高めるために並列にトレーニングされている。
提案手法を,データセット上のResNet,VGGNet,DenseNet,GoogLeNetの4つのベースラインネットワークと比較し,GoogLeNetとDenseNetがResNetとVGGNetを大きく上回った。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:33:55 GMT)
Learning a Sparse Representation of Barron Functions with the Inverse
Scale Space Flow [3.2] L2$ 関数 $f$ が与えられたとき、逆スケール空間の流れはスパース測度 $mu$ を見つけるために使われる。
本手法の収束特性は, 理想的な設定で, 測定ノイズやサンプリングバイアスの場合に解析される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:26:02 GMT)
Navigating the Synthetic Realm: Harnessing Diffusion-based Models for
Laparoscopic Text-to-Image Generation [3.2] 拡散型生成モデルを用いて短いテキストプロンプトから合成腹腔鏡画像を生成するための直感的なアプローチを提案する。
画像ガイド下手術の分野では,拡散モデルがスタイルやセマンティクスの知識を得ることができた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:20:22 GMT)
Controllable Music Production with Diffusion Models and Guidance
Gradients [3.2] 44.1kHzステレオオーディオにおいて,拡散モデルから条件付き生成を用いて,様々な現実的なタスクに対処する方法を実証する。
このシナリオには、継続性、音楽オーディオのインペイントと再生、2つの異なる音楽トラック間のスムーズな遷移の生成、既存のオーディオクリップへの所望のスタイル特性の転送などが含まれる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:32:03 GMT)
An Automated Machine Learning Approach for Detecting Anomalous Peak
Patterns in Time Series Data from a Research Watershed in the Northeastern
United States Critical Zone [3.2] 本稿では,米国北東部臨界水域におけるセンサによる時系列データの異常検出を支援する機械学習フレームワークを提案する。
このフレームワークは特に、センサーの故障や自然現象から生じるピークパターンの異常を識別することに焦点を当てている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:47:14 GMT)
Leveraging Model Fusion for Improved License Plate Recognition [3.0] 複数のモデルを使用すると、特定のデータセット/シナリオのサブパーパフォーマンスが低下する。
実験には幅広いデータセットが含まれており、イントラおよびクロスデータセットのセットアップにおいて、融合アプローチの実質的な利点が明らかにされている。
認識タスクが余分な時間で許容できるアプリケーションの場合、効果的な戦略は4-6モデルを組み合わせることである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:50:54 GMT)
Policy Gradient with Kernel Quadrature [2.9] 我々は,ディスカウントされたリターンや報酬のプロセスモデリングを構築し,エピソードの空間上で正の定型カーネルを導出する。
サンプルエピソードの情報を圧縮し,削減したエピソードをポリシーネットワークに渡して勾配更新を行う。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:43:54 GMT)
Improving the performance of twin-field quantum key distribution with
advantage distillation technology [2.9] 解析法により得られた最大伝送距離は420kmから470kmに増加する。
ペアフィールド量子鍵分布は, 誤り訂正誤差が50%に近い場合でも, 正のセキュア鍵を生成可能であることを証明した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:32:03 GMT)
Data-Driven Traffic Reconstruction and Kernel Methods for Identifying
Stop-and-Go Congestion [2.7] 交通流におけるSAG(Identifying-and-go Event)は、気候変動対策のためのデータ駆動研究を進めるための重要な道のりである。
SAGは高速道路の外部交通の33-50%を占めると見積もられている。
この研究は、トラヒックシステムの持続可能性を高めるためのデータ駆動決定の基礎に貢献する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:32:48 GMT)
Vicious Classifiers: Data Reconstruction Attack at Inference Time [2.7] 本研究では,モデル出力のみを観測することで,悪質なサーバが入力データを再構成する方法について検討する。
本稿では,推論時間における悪質と正直な分類器の識別を支援する防衛機構を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:30:50 GMT)
Lower-bounding entanglement with nonlocality in a general Bell's
scenario [2.6] 絡み合い測度は、数学において劇的に異なるが、基本的には興味のある状態と最も近い分離可能な状態の間の距離である。
距離に基づくベル非局所性を持つ状態間のこの最小距離、すなわち古典的相関の集合に対する関心の相関の間の最小距離を関連付ける。
このことは絡み合いとベル非局所性の間の定量的な関係を確立し、様々な文脈における絡み合いの境界につながる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:01:50 GMT)
Advantage of Quantum Machine Learning from General Computational
Advantages [2.5] 量子機械学習(QML)の全体的マイルストーンは、あらゆる古典的な学習方法に対するQMLの利点を実証することである。
ここでは、古典的なデータを用いた教師付き学習タスクのファミリーを前例のないほど広く構築し、QMLの利点を実証する。
我々の学習課題は、少数の入力に間に合うように効率的に計算できる関数の一般クラスを実行することで実現可能である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:00:00 GMT)
Revisiting Hidden Representations in Transfer Learning for Medical
Imaging [2.5] 7つの医学分類課題について,ImageNetとRadImageNetを比較した。
その結果,ImageNetとRadImageNetは直感とは対照的に,異なる中間表現に収束する可能性が示唆された。
その結果, ネットワーク間の微調整前後の類似性は, 性能向上と相関しないことがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:18:54 GMT)
FERGI: Automatic Annotation of User Preferences for Text-to-Image
Generation from Spontaneous Facial Expression Reaction [2.4] 我々は、人間の嗜好フィードバックのデータを用いて、テキスト・ツー・イメージ生成モデルを微調整する。
生成した画像に対する自然表情反応からユーザの嗜好を自動的に注釈する手法を開発し,テストする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:33:49 GMT)
Convergence Rates for Stochastic Approximation: Biased Noise with
Unbounded Variance, and Applications [2.3] 1951年にRobinsとMonroによって導入された近似アルゴリズムは、$mathbff(boldsymbol the) = mathbf0という形の方程式を解く標準的な方法である。
我々はSA理論を拡張し、非ゼロ条件平均および/または条件分散と同期SAとの誤差を包含する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:22:39 GMT)
Iterative autoregression: a novel trick to improve your low-latency
speech enhancement model [2.3] ストリーミングモデルは、リアルタイム音声強調ツールの重要なコンポーネントである。
本稿では,自己回帰型低遅延音声強調モデルの訓練方法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:36:32 GMT)
Learning "Look-Ahead" Nonlocal Traffic Dynamics in a Ring Road [2.2] 基礎図とルックアヘッドカーネルを学習するために,物理インフォームドニューラルネットワークを開発した。
学習した非局所LWRは,3つの異なるシナリオにおいて,より正確な交通波伝搬予測が得られることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:00:32 GMT)
Braids and Higher-order Exceptional Points from the Interplay Between
Lossy Defects and Topological Boundary States [2.2] 局所的損失欠陥によるSu-Schrieffer-Heeger鎖の摂動が高次例外点(HOEP)につながることを示す。
一方、パラメータ空間における例外的直線 (EL) の非アベル的ブレイディング特性によって生じる。
一方、非エルミート的欠陥によって引き起こされるエッジ状態の非局在化が、欠陥状態とそれらをハイブリダイズするという事実から、そのような特別な交叉が生じていることが示される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:00:00 GMT)
Uniswap Daily Transaction Indices by Network [2.0] DeFiは仲介者を排除して金融サービスを変革している。
本研究は、Unixwapからの5000万件以上の取引を調査した。
当社のデータセットは、Polygonのようなネットワーク間のL1とL2のトランザクションを特徴としています。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:53:46 GMT)
Quantum Machine Learning on Near-Term Quantum Devices: Current State of
Supervised and Unsupervised Techniques for Real-World Applications [1.9] この調査は、量子ハードウェア上で実行される教師なしおよび教師なしの学習アプリケーションに焦点を当てる。
エンコーディング、アンサッツ構造、エラー軽減、これらの課題に対処するための勾配法といったテクニックをカバーしている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:26:19 GMT)
LExCI: A Framework for Reinforcement Learning with Embedded Systems [1.9] 本稿では,RLライブラリと組込みシステムとのギャップを埋める LExCI というフレームワークを提案する。
オープンソースライブラリのRLlibを使用して,組み込みシステム上でエージェントをトレーニングするための,無償かつオープンソースツールを提供する。
操作性は、最先端の2つのRL-algorithmと、迅速な制御プロトタイピングシステムで実証されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:06:25 GMT)
Score-Aware Policy-Gradient Methods and Performance Guarantees using
Local Lyapunov Conditions: Applications to Product-Form Stochastic Networks
and Queueing Systems [1.9] スコア・アウェア・グラデーションMD(SAGE)と呼ばれるMDPの勾配の新たなファミリーを導入する。
決定の定常分布が指数族に属する場合、SAGEは値-関数推定なしで政策勾配を推定できる。
適切な仮定の下では、適切なポリシーに十分近づき始めた場合に、ポリシー段階の手法が最適なポリシーに大きく収束していることが示される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:44:58 GMT)
A (simple) classical algorithm for estimating Betti numbers [1.9] 経路積分モンテカルロ法を用いて、$k$-th正規化ベッチ数を$n$要素上の単純複素数として推定する簡単なアルゴリズムを記述する。
一般の単純複素数に対して、我々のアルゴリズムの実行時間は$nOleft(frac1sqrtgammalogfrac1varepsilonright)$で、加法精度は (0,$1) のラプラシアンとヴァレプシロンのスペクトルギャップを測定する$gamma$である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:48:17 GMT)
Do AI models produce better weather forecasts than physics-based models?
A quantitative evaluation case study of Storm Ciar\'an [1.9] ストーム・シアラン(Storm Ciar'an)は、ヨーロッパ北部で16人が死亡し、大きな被害を受けた暴風雨である。
機械学習と数値ウェザー予測モデルによるStorm Ciar'anの予測を比較した。
本研究は,機械学習の天気予報の性能と特性について検討した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:52:33 GMT)
GPT vs Human for Scientific Reviews: A Dual Source Review on
Applications of ChatGPT in Science [1.8] 我々は、人間レビュアーと大規模な言語モデルSciSpaceによってレビューされた、異なる科学領域にわたる13のGPT関連論文について考察する。
客観的質問に対するSciSpaceの回答の50%は、人間レビュアーの回答と一致していることがわかった。
主観的質問では、非インフォームド評価器は、SciSpaceと人間の反応の異なる好みを示した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:41:52 GMT)
On the instrumental variable estimation with many weak and invalid
instruments [1.8] 楽器変数(IV)モデルにおける計算の基本的な問題点について検討する。
スパースペナルティ構造と等価な「スパース特性」を仮定し,サロゲートステップ同定法の利点を検証し,証明する。
スパース同定条件に整合した代理ステップ選択推定法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:06:56 GMT)
Unknown Sample Discovery for Source Free Open Set Domain Adaptation [1.8] Open Set Domain Adaptation (OSDA)は、ソースドメインでトレーニングされたモデルを、分散シフトの対象となるターゲットドメインに適応させることを目的としている。
本研究では,教師モデルを用いて未知のサンプル分離を行うSF-OSDA手法として,未知サンプル発見(USD)を導入する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:07:51 GMT)
Auto DP-SGD: Dual Improvements of Privacy and Accuracy via Automatic
Clipping Threshold and Noise Multiplier Estimation [1.8] DP-SGDは、ディープラーニングアプリケーションにおける個人識別情報を保護するための一般的な方法として登場した。
本稿では,各トレーニングサンプルの勾配を勾配情報を失うことなくスケールするAuto DP-SGDを提案する。
我々は,Auto DP-SGDが既存のSOTA DP-SGDメソッドよりも,様々なベンチマークデータセットのプライバシと精度で優れていることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 00:09:57 GMT)
Toward Energy-Efficient Massive MIMO: Graph Neural Network Precoding for
Mitigating Non-Linear PA Distortion [1.7] グラフニューラルネットワーク(GNN)は、チャネルとプリコーディング行列の間のマッピングを学習し、非線形歪みによる和率を最大化する。
歪み制限方式では、このGNNベースのプリコーダは、ゼロ強制(ZF)、ZF、デジタル事前歪み(DPD)および歪み対応ビームフォーミング(DAB)プリコーダよりも優れる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:25:35 GMT)
Learning beyond sensations: how dreams organize neuronal representations [1.7] 仮想体験の生成を通じて表現を整理する2つの相補的な学習原理について論じる。
これらの原理は、既知の皮質構造や力学、睡眠の現象学と互換性がある。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:20:33 GMT)
ReconU-Net: a direct PET image reconstruction using U-Net architecture
with back projection-induced skip connection [1.7] 本研究では, 深層学習に基づく直接ポジトロン放射トモグラフィ(PET)画像再構成のためのバックプロジェクション駆動型U-Net型アーキテクチャReconU-Netを提案する。
提案したReconU-Netアーキテクチャはバックプロジェクション操作の物理モデルをスキップ接続に一意に統合する。
提案したReconU-Net法は,他の深層学習に基づく直接再構成法と比較して,より正確な構造で再構成画像を生成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:51:42 GMT)
Towards Measuring Representational Similarity of Large Language Models [1.7] 7Bパラメータを持つ大規模言語モデルの表現の類似性を測定する。
以上の結果から,LLMは他と大きく異なるものが存在することが示唆された。
本研究は, 類似度スコアの注意深い研究の必要性を示唆する表現的類似度尺度を用いる際の課題を明らかにする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:48:04 GMT)
ESP2CS: Securing Internet of Vehicles through Blockchain-enabled Communications and Payments [1.7] インターネット・オブ・ビークルズ(IoV)は、安全、効率、環境の持続可能性を高めることで交通に革命をもたらすことを約束している。
本研究は、Everyth Based Secure Payment and Communication Solution (ESP2CS)を紹介する。
ESP2CSはサイバーの脅威が高まっている中で、堅牢で安全なVV2X通信と支払いを保証する。
このソリューションは、車両間の通信の合理化、駐車スペースの検出、トランザクション管理のためのAndroid Autoアプリケーションによって補完されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:02:56 GMT)
C-NERF: Representing Scene Changes as Directional Consistency
Difference-based NeRF [1.6] ニューラルレイディアンスフィールド(NeRF)で表現されたシーンにおける物体の変動による変化を検出することを目的としている。
任意のビューと2セットのシーンイメージが異なるタイムスタンプでキャプチャされた場合、そのビュー内のシーン変化を予測することができる。
提案手法は,最先端の2次元変化検出法とNeRF法を有意差で上回っている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:27:12 GMT)
AI-SAM: Automatic and Interactive Segment Anything Model [1.6] 我々は、新しいパラダイムとその最初のモデル、Automatic and Interactive Segment Anything Model(AI-SAM)を紹介する。
実験により,AI-SAMによる自動設定の有効性を実証し,最先端の性能を実現した。
重要な点として、追加のユーザープロンプトを組み込む柔軟性を提供し、それによってパフォーマンスをさらに向上させる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:37:38 GMT)
Towards Optimizations of Quantum Circuit Simulation for Solving Max-Cut
Problems with QAOA [1.5] 量子近似最適化アルゴリズム(QAOA)は、近似を用いて最適化問題を解くために用いられる一般的な量子アルゴリズムの1つである。
しかし、仮想量子コンピュータ上でのQAOAの実行は、最適化問題を解くのに遅いシミュレーション速度に悩まされている。
本稿では,QAOAの量子演算を数学的に最適化し,QCSを高速化する手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:08:57 GMT)
Device-Independent Quantum Secure Direct Communication Under
Non-Markovian Quantum Channels [1.3] デバイス非依存型量子セキュアダイレクト通信(DI-QSDC)は、量子暗号において有望なプリミティブである。
本稿では,非マルコフ雑音によるDI-QSDCの性能向上効果について検討する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:30:38 GMT)
Double Integral Enhanced Zeroing Neural Network Optimized with ALSOA
fostered Lung Cancer Classification using CT Images [1.2] 肺がんは最も致命的な疾患の1つであり、疾患や死亡の原因となっている。
提案手法は既存の手法で解析した18.32%,27.20%,34.32%の精度で得られた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:53:35 GMT)
Classification for everyone : Building geography agnostic models for
fairer recognition [1.1] 私たちはこのバイアスを2つのデータセット、The Dollar StreetデータセットとImageNetに定量的に提示します。
そして、このバイアスを減らすために様々な方法を提示します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:41:03 GMT)
Conceptualizing the Relationship between AI Explanations and User Agency [0.9] 我々は,ケーススタディと思考実験を通して,ユーザ中心のレンズを通してエージェントと説明の関係を分析する。
提案手法は,利用者が将来的なインタラクションにおいて,より効果的な結果の変換を行えるようにすることで,エージェンシーのためのいくつかの第1ステップの1つとなることが判明した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:56:05 GMT)
A new class of distances on complex projective spaces [0.9] 複素射影空間 $mathbbP(mathbbCn)$ は、大きさ $n$ の全ての純状態の空間として解釈できる。
この空間上の距離は、アースモービル問題によって$n$ポイント確率単純集合上で定義される古典的な距離から誘導することができる」。
この構成は三角形の不等式を満たす量につながり、これは量子2$-ワッサーシュタイン族に属する複素射影空間の真の距離をもたらす。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:55:57 GMT)
Convolutional layers are equivariant to discrete shifts but not
continuous translations [0.9] 畳み込みニューラルネットワーク(CNN)は、重み付けによるシフト同変である畳み込み層で構成されている。
CNNは、境界効果が無視され、プールやサブサンプリングが欠如している場合でも、変換同変ではない。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:05:32 GMT)
Symmetry resolution of the computable cross-norm negativity of two
disjoint intervals in the massless Dirac field theory [0.8] 場の量子論の混合状態における絡み合いは、クロス計算可能ノルムまたは再配置基準を用いて記述することができる。
質量を持たないディラックフェルミオン場理論の基底状態における2つの不斉区間に対する対称性の分解について研究する。
2つの不連続区間に対して、それらは非収縮性荷電ループを持つトーラス上の理論の分配関数に対応することを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:56:48 GMT)
A Kernel-Based Neural Network Test for High-dimensional Sequencing Data
Analysis [0.8] シーケンシングデータの複雑な関連解析のための新しいカーネルベースニューラルネットワーク(KNN)テストを導入する。
KNNに基づいて、高次元遺伝データの関心の表現型との結合性を評価するために、ウォルド型試験が導入された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:06:23 GMT)
Estimation of Physical Parameters of Waveforms With Neural Networks [0.8] フルウェーブフォームLiDARのポテンシャルは、単なる高さ推定や3D再構成よりもはるかに大きい。
既存のLiDARデータ解析の分野では、逆モデリングによる深さ推定や対数強度の回帰、減衰係数の近似のための深さ推定などがある。
本研究では,LIDARデータ解析におけるパラメータ推定のためのニューラルネットワークに基づく新しい解を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:54:32 GMT)
When PETs misbehave: A Contextual Integrity analysis [0.7] 私たちは、プライバシー技術がプライバシーを損なうためにどのように悪用されるかを説明するために、コンテキスト統合の理論を使用します。
年齢検証のための匿名認証、不正コンテンツ検出のためのクライアント側スキャン、機械学習モデルのトレーニングのための同型暗号化の3つのPETとシナリオについて検討する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:27:43 GMT)
Teenagers and Artificial Intelligence: Bootcamp Experience and Lessons
Learned [0.7] 私たちは2023年夏に60人の高校生のコホートに提供される3日間のブートキャンプを設計しました。
カリキュラムは、アニメーションビデオコンテンツ、簡単にフォローできるスライド、インタラクティブな遊び場、およびクイズを通じて、直接配信された。
ブートキャンプ後の調査の結果、全体の満足度は91.4%だった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:01:39 GMT)
Enhancing Vehicle Entrance and Parking Management: Deep Learning
Solutions for Efficiency and Security [0.7] あらゆる組織における車両の入場と駐車は、記録保持、効率性、セキュリティ上の懸念を含む複雑な課題である。
我々は最先端のディープラーニングモデルを活用し、あらゆる組織に車両の進入と駐車のプロセスを自動化した。
車両検出,ナンバープレート検出,顔検出,認識などの深層学習モデルの訓練を行ったが,YOLOv8nモデルは他のモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:02:53 GMT)
Revisiting Game Representations: The Hidden Costs of Efficiency in
Sequential Decision-making Algorithms [0.7] 不完全な情報の下でのシーケンシャルな意思決定アルゴリズムの進歩は、大きなゲームで顕著な成功を収めている。
これらのアルゴリズムは伝統的に広義のゲーム形式を用いてゲームを形式化する。
プレイヤー固有の情報状態木に基づく特殊表現の使用が,一般的な回避策であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:12:46 GMT)
Density-wave-type supersolid of two-dimensional tilted dipolar bosons [0.7] 傾斜双極子ボソンの希薄気体の密度波型超固体相を二次元(2D)幾何で予測する。
この多体相は、ボース・アインシュタイン凝縮と0温度での超流動性と共存するストライプパターンの形成と弾性によって表される。
予測された超固体効果は、ヘテロ構造の励起子から、光ポテンシャルの低温原子や極性分子まで、様々な実験装置で実現することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:43:00 GMT)
Is one brick enough to break the wall of spoken dialogue state tracking? [0.7] タスク指向対話(TOD)システムでは、システムのユーザニーズに対する理解を正しく更新することが、スムーズな対話の鍵となる。
本稿では,3つのアプローチを比較して,完全な音声対話状態追跡への道筋を一歩進める。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:44:12 GMT)
On minimizing the training set fill distance in machine learning
regression [0.7] 本研究では,選択した集合の充填距離を最小化することを目的としたデータ選択手法を提案する。
FPSを用いてトレーニングセットを選択することで、ガウスカーネル回帰アプローチの特定の場合のモデルの安定性を向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:23:55 GMT)
Optimizing Fault-Tolerant Quality-Guaranteed Sensor Deployments for UAV
Localization in Critical Areas via Computational Geometry [0.6] 小型の無人航空機(UAV)は、空港、発電所、政府や軍事施設などの重要な地域に深刻な脅威をもたらす。
本稿では,UAVローカライゼーションのための三角センサの展開を計算し,複数のセンサ品質レベルのカバレッジ,コスト効率,耐故障性などの指標を最適化する。
我々は,2つの大きな3D臨界領域,ローマレオナルド・ダ・ヴィンチ国際空港(FCO)とウィーン国際空港(VIC)におけるUAVローカライゼーションのための最適なセンサ配置を計算し,我々のアプローチの実現可能性を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:58:22 GMT)
Enhanced Breast Cancer Tumor Classification using MobileNetV2: A
Detailed Exploration on Image Intensity, Error Mitigation, and
Streamlit-driven Real-time Deployment [0.6] 本研究は, 乳がん腫瘍を正常, 良性, 悪性のカテゴリに分類するための, Google の MobileNetV2 に基づく高度な転写学習モデルを提案する。
精度は 0.82、精度は 0.83、リコールは 0.81、ROC-AUCは 0.94、PR-AUCは 0.88、MCCは 0.74 である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:58:14 GMT)
RotaTR: Detection Transformer for Dense and Rotated Object [0.5] 指向性検出へのDETRの拡張として,回転物体検出TRansformer(RotaTR)を提案する。
具体的には、DTRの指向目標検出能力を高めるために、回転感度変形(RSDeform)アテンションを設計する。
RotaTRは、元のDETRと比較して密度と向きの強い物体を検出するのに大きな利点を示している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:06:04 GMT)
Calibrating dimension reduction hyperparameters in the presence of noise [0.5] 本稿では,ノイズの存在下での次元減少問題をモデル化する枠組みを提案する。
過度に適合するデータにおいて、近隣住民の役割と役割について検討する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:16:17 GMT)
Experimental Insights Towards Explainable and Interpretable Pedestrian
Crossing Prediction [0.5] 本研究では,深層学習とファジィ論理を組み合わせた新しいニューロシンボリックアプローチを提案する。
我々は,一連の説明可能な特徴を利用する説明可能な予測器(ExPedCross)を開発し,歩行者が横断するか否かを予測するファジィ推論システムを開発した。
その結果,歩行者横断予測課題における説明可能性と解釈可能性について実験的に考察した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:39:32 GMT)
A Comprehensive Study of Vision Transformers in Image Classification
Tasks [0.5] 画像分類のための視覚変換器に関する既存の論文を包括的に調査する。
まず,モデルの設計に影響を及ぼす人気画像分類データセットを紹介する。
まず、視覚タスクに注意機構を適応させようとする初期の試みから始まる、時系列順の視覚トランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:46:27 GMT)
Colour versus Shape Goal Misgeneralization in Reinforcement Learning: A
Case Study [0.4] ダイ・ランゴスコら(2022年)によるプロクゲン・マゼ環境における色対形状目標の誤一般化について検討する。
簡易な環境下で1000以上のエージェントを訓練し,1000万回以上のエピソードで評価した結果,特定の色チャンネルを通して目標物を検出することを学習したエージェントの行動に起因する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:00:46 GMT)
CVE representation to build attack positions graphs [0.4] サイバーセキュリティにおいて、CVE(Common Vulnerabilities and Exposures)は、ハードウェアまたはソフトウェアの脆弱性を公開している。
この記事では、これらの脆弱性は、完全な攻撃シナリオにおいてどのようにチェーン化されるのかを理解するために、より詳細に記述されるべきである、と指摘する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:57:14 GMT)
Characterization of Locality in Spin States and Forced Moves for
Optimizations [0.4] 最適化問題において、エネルギーランドスケープにおける局所最小値の存在は、世界最小値を求めるために問題となる。
そこで我々は,局所最小値から効率よく抜け出すアルゴリズムを開発したが,正確なサンプリングは得られなかった。
提案アルゴリズムはリジェクションフリーなアルゴリズムに基づいているため,計算コストは低い。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:21:00 GMT)
A Q-learning approach to the continuous control problem of robot
inverted pendulum balancing [0.3] 本研究では,ロボット逆振り子バランスの連続制御問題に対する離散的行動空間強化学習法(Q-learning)の適用性を評価する。
システム力学の数学的モデルが実装され、実システムから取得したデータに対する曲線フィッティングによって導出される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:40:48 GMT)
Deep Set Neural Networks for forecasting asynchronous bioprocess
timeseries [0.3] 栽培実験はしばしばスパース級数と不規則級数を生成する。
ほとんどの統計的および機械学習ツールは、スパースデータを最初から扱うように設計されていない。
入力データのトリプルトエンコーディングを備えたDeep Set Neural Networksは,計算処理やアライメント処理を必要とせずに,バイオプロセスデータの処理をうまく行うことができることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:20:50 GMT)
Deep Learning for Fast Inference of Mechanistic Models' Parameters [0.3] 本稿では,観測対象の力学モデルのパラメータを直接予測するために,ディープニューラルネットワーク(NN)を提案する。
本稿では,ニューラルネットワークとメカニスティックモデルを組み合わせたトレーニング手法を検討する。
ニューラルネットワークの推定値は、さらなる適合によってわずかに改善されているのに対して、これらの推定は、適合手順単独よりも測定精度が良いことがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 22:16:54 GMT)
BioImage.IO Chatbot: A Personalized Assistant for BioImage Analysis
Augmented by Community Knowledge Base [0.2] BioImage$.IO(バイオイメージ$.IO)は、バイオイメージ・コミュニティ向けに開発されたAI駆動アシスタントである。
多様なデータベースから情報を集約して解釈することで、パーソナライズされたコンテキスト対応の回答を提供する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:36:48 GMT)
Maximum likelihood thresholds of Gaussian graphical models and graphical
lasso [0.2] グラフの最大値閾値は、対応するグラフィカルモデルに適合するために必要なデータポイントの最小値である。
このプロジェクトでは、グラフィカルラッソを用いて n 個のデータポイント上のグラフィカルモデルを選択して適合させる場合、n が対応するグラフの最大最大しきい値より大きいか等しいか?
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:29:37 GMT)
Projective Space Stern Decoding and Application to SDitH [0.2] ここでは、有限体上の一般線形コードに対する標準的な復号アルゴリズムが、本質的に有限体のサイズである因子によって高速化できることが示される。
本手法をSDitHに適用し,NISTが要求するセキュリティ要件を満たすには,原文と更新版の両方のパラメータが不足していることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:33:15 GMT)
Physics-informed neural networks with unknown measurement noise [0.1] 非ガウス雑音の場合、標準のPINNフレームワークが故障することを示す。
本稿では,エネルギーベースモデル(EBM)を共同で学習し,適切な雑音分布を学習することを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:05:05 GMT)
Two-dimensional symmetry-protected topological phases and transitions in
open quantum systems [0.1] 2次元(2次元)クラスター状態の対称性保護位相SPT位相に対する局所デコヒーレンスの影響について検討した。
我々は、$mathbbZ(0)timesmathbbZ_2(1)$ SPT相の位相的位相遷移を有限デコヒーレンス強度で発生する自明な位相に示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:11:21 GMT)
Real-Time Surface-to-Air Missile Engagement Zone Prediction Using
Simulation and Machine Learning [0.1] 地対空ミサイル(SAM)は、現代の防空システムにおいて不可欠である。
エンゲージメントゾーン(Engagement Zone、EZ)は、SAMがターゲットを効果的に動かし、中立化できる空間領域である。
本研究では、機械学習とカスタム設計のシミュレーションツールを統合して教師付きアルゴリズムを訓練する手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:50:27 GMT)
p-Adic Quantum Mechanics, the Dirac Equation, and the violation of
Einstein causality [0.0] 我々は、粒子や反粒子の存在を予測し、標準粒子のような電荷共役を予測できる新しいp進ディラック方程式を導入する。
進化が p-進ディラック方程式によって制御される量子系はアインシュタイン因果性を満たすものではないことを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:17:41 GMT)
Variability of echo state network prediction horizon for partially
observed dynamical systems [0.0] 本研究では,部分状態入力と完全状態出力を併用したエコー状態ネットワーク(ESN)フレームワークについて検討する。
ESNは,数回のリャプノフ期までの短期的な予測を行うことができることを示す。
ノイズの多い数値データセットや実験データセットでトレーニングした場合でも,ESNはシステムのダイナミクスを効果的に学習できることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:50:52 GMT)
Vacuum Branching, Dark Energy, Dark Matter [0.0] 以前のバージョンでは、分岐の平均2乗量子複雑性の測定値の最小値を求めることにより、状態ベクトルを分岐に分解することを提案した。
本稿では、ミンコフスキー空間の格子上の電子と陽子の量子電磁力学に初期バージョンを適用する。
真空分岐が観測されたダークエネルギーとダークマター密度の起源であるという仮説は、分枝形成を管理する複雑性測度に入るパラメータ$b$に対して$O(10-18 m3)$と推定される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:43:07 GMT)
User Interaction Data in Apps: Comparing Policy Claims to
Implementations [0.0] 我々は、ポリシークレームとデータ収集手法の整合性を評価するために、静的解析手法を用いて、さまざまなカテゴリにまたがるトップ100アプリを分析した。
我々の調査結果は、データ収集における透明性の欠如と、それに伴う再識別のリスクを強調し、ユーザのプライバシと信頼に関する懸念を高めている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:11:11 GMT)
Universality in driven open quantum matter [0.0] 普遍性(University)は、様々な自由度を持つシステムにおいて質的かつ定量的な予測を可能にする強力な概念である。
ここでは、非平衡定常状態の特定のクラスにおける、開量子物質(英語版)の表現に焦点を当てる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:00:07 GMT)
Understanding Environmental Posts: Sentiment and Emotion Analysis of
Social Media Data [0.0] 本研究は,2014年から2023年までの10年間の気候変動と環境に対する一般の認識を分析した。
否定的な環境ツイートは、肯定的あるいは中立的なツイートよりもはるかに一般的である。
環境ツイートで最も一般的な感情は、恐怖、信頼、予測である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:26:28 GMT)
Transformer-Based Deep Learning Model for Bored Pile Load-Deformation
Prediction in Bangkok Subsoil [0.0] モデルは、土壌プロファイルと杭の特徴をトークン化入力として符号化し、負荷変形曲線を出力として生成する。
このモデルは、負荷変形曲線予測に十分な精度と一般化能力を示し、平均絶対誤差はテストデータに対して5.72%である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:54:13 GMT)
Traffic Signal Control with Communicative Deep Reinforcement Learning
Agents: a Case Study [0.0] 我々は最近提案されたマルチエージェント強化学習アルゴリズムであるマルチエージェント・アドバンテージ・アクター・クリティカル(MA2C)を分析した。
我々は,MA2Cと独立アドバンテージ・アクター・クリティカル(IA2C)や他の強化学習や強化学習アルゴリズムを比較した。
この結果から,擬似ランダム車流を訓練したMA2Cは,代替手法よりも優れた性能を発揮する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:00:33 GMT)
Toward autocorrection of chemical process flowsheets using large
language models [0.0] 本稿では,フローシート内のエラーを識別し,ユーザに対して修正を提案する,新しい生成AI手法を提案する。
モデルへの入力は、潜在的に誤ったフローシートであり、モデルの出力は修正されたフローシートの提案である。
このモデルは、合成されたフローシートの独立したテストデータセット上で、トップ1の精度80%、トップ5の精度84%を達成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:39:41 GMT)
The Landscape of Modern Machine Learning: A Review of Machine,
Distributed and Federated Learning [0.0] 最新の高度な機械学習アルゴリズム、アプリケーション、フレームワークについて、ハイレベルな概要を提供する。
私たちの仕事は、現代の機械学習の広大な分野への入門テキストとして役立ちます。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:40:05 GMT)
The Automated Bias Triangle Feature Extraction Framework [0.0] 本稿では,教師なしのセグメンテーションに基づくコンピュータビジョン手法によって構築されたバイアス三角形の特徴抽出フレームワークを提案する。
これにより、教師付き学習アプローチを通知するための人的入力や大規模なトレーニングデータセットの必要性が回避される。
特に、この手法の直接的な結果として、訓練データなしで、効果的に、効率的に、効果的にパウリスピン遮断(PSB)検出を行うことを実証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:12:31 GMT)
Text Intimacy Analysis using Ensembles of Multilingual Transformers [0.0] 本稿では,SemEval共有タスク9について,テキストの親密度を推定する作業について述べる。
データセットは10言語のツイートで構成されており、トレーニングデータセットで利用できるのは6つのみである。
言語固有の単言語モデルとともに多言語モデルのアンサンブルが最高の性能を持つことを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:04:22 GMT)
TSVR+: Twin support vector regression with privileged information [0.0] 機械学習の領域では、データは特権情報(PI)と呼ばれる追加の属性を含むことができる。
我々は、特権情報(LUPI)を用いた学習とTSVRの融合を導入し、特権情報(TSVR+)を用いたツインサポートベクター回帰と呼ばれる新しいアプローチを提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:15:10 GMT)
Synthetic $\mathbb{Z}_2$ gauge theories based on parametric excitations
of trapped ions [0.0] 捕捉したイオンの結晶におけるZ2ゲージ理論のアナログ量子シミュレーションの詳細なスキームを提案する。
異なるスピンモーション結合方式に対応するパラメトリック励起に基づく多目的ツールボックスを提案する。
このビルディングブロックは、1つの閉じ込められたイオンで実装されると、最小のZ2ゲージ理論に対応する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:43:53 GMT)
Surveying Wikipedians: a dataset of users and contributors' practices on
Wikipedia in 8 languages [0.0] データセットはウィキペディアのユーザーに焦点を当てており、回答者の人口統計や社会経済的特徴に関する情報を含んでいる。
データは、2023年6月から7月にかけてオンラインで公開されているアンケートを用いて収集された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:04:12 GMT)
Surface induced odd-frequency spin-triplet superconductivity as a
veritable signature of Majorana bound states [0.0] 我々は、表面誘起奇数周波数(odd-$nu$)スピントリップ超伝導ペアリングがマヨラナ境界状態(MBS)の検証可能なシグネチャとなることを予測した。
p_x$-SF-$p_x$ ジョセフソン接合では、MBSを特徴とする位相相、MBSを含まない位相相、MBSを含まない自明位相の3つの異なる位相が現れる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:49:12 GMT)
Statistical inference for generative adversarial networks and other
minimax problems [0.0] 本稿では,GAN(Generative Adversarial Network)を統計的推論の観点から検討する。
GANは、2つのニューラルネットワーク、ジェネレータ、識別器のパラメータを推定し、特定のミニマックス問題の解法として一般的な機械学習手法である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:28:33 GMT)
Spin-dependent multiple reentrant localization in an antriferromagnetic
helix with transverse electric field: Hopping dimerization-free scenario [0.0] Reentrant Localization (RL) は近年顕著な現象である。
本研究は, ホッピング二量体化がRLを実現する重要な要因ではないことを示す。
反強磁性秩序を持つヘリカル磁気系を考慮し、スピン依存RLを複数のエネルギー領域で発見する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:11:03 GMT)
Spectral Properties of the Symmetry Generators of Conformal Quantum
Mechanics: A Path-Integral Approach [0.0] 経路積分法は、共形量子力学のSO(2,1)対称性のジェネレータのスペクトル特性を研究するために用いられる。
我々は、連続スペクトルを持つ双曲作用素の新しい結果と、それらの量子力学的解釈を強調した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 23:21:38 GMT)
Separating the wave and particle attributes of two entangled photons [0.0] 我々は、2つの絡み合った光子の波動と粒子特性を空間的に分離する実現可能なスキームを提唱した。
2光子状態の量子チェシャー・キャット現象を実装した我々のスキームは、2つの絡み合った光子の波動特性と粒子特性の観測がボーアの相補性原理に従うことを保証している。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:17:48 GMT)
Scattering theory of mesons in doped antiferromagnetic Mott insulators:
Multichannel perspective and Feshbach resonance [0.0] 反強磁性(AFM)モット絶縁体をドーピングするホールにおける比較的高温の超伝導
近年、強結合と低ドーピングでは、基本的な1ホールと2ホールの中間子型成分(磁気ポーラロンと双極子対)がフェシュバッハ共鳴を実現する可能性が示唆されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:52 GMT)
Scalable digital quantum simulation of lattice fermion theories with
local encoding [0.0] 我々は、フェルミオン格子場理論の量子シミュレーションを行うためのプラットフォームニュートラル一般戦略の有効性を数値解析的に分析する。
このような局所フェルミオン符号化はテンソルネットワークの数値シミュレーションにも有用であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 13:34:22 GMT)
Resonant versus non-resonant spin readout of a nitrogen-vacancy center
in diamond under cryogenic conditions [0.0] スピン選択狭帯域レーザー励起が窒素空孔の読み出しに及ぼす影響について検討した。
非共鳴照明と比較して感度が4倍以上向上したことを示す。
これらの結果は、凝縮物質系の研究へのNVセンシングの適用の機会を開いている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:27:08 GMT)
Regularization Trade-offs with Fake Features [0.0] 本稿では、過度にパラメータ化されたモデルがフェイク機能を含むフレームワークについて考察する。
本稿では、リッジ回帰問題の一般化誤差に縛られる非漸近的高確率について述べる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:12:53 GMT)
Rational extensions of an oscillator-shaped quantum well potential in a
position-dependent mass background [0.0] 位置依存質量に関連する最近提案された量子井戸モデルは、スカーフIポテンシャルに対する定数質量シュル「オーディンガー方程式に点正準変換を適用することで解ける。
さらに、$X$-ヤコビ例外に関連した位置依存質量モデルも検討されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:18:17 GMT)
Rare Galaxy Classes Identified In Foundation Model Representations [0.0] 我々は、事前訓練されたモデルの学習された表現の中で構造を探索することにより、希少かつ視覚的に特徴的な銀河群を同定する。
これらの表現は、事前学習ラベルを予測するのに必要なもの以上のパターンに出現して銀河を配置していることが示される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:36:04 GMT)
R3D-SWIN:Use Shifted Window Attention for Single-View 3D Reconstruction [0.0] 本稿では,ウィンドウアテンションのボクセル3D再構成ネットワークを提案する。
ボクセル3D再構成にシフトウインドウ・アテンションを応用した最初の試みである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 12:42:37 GMT)
Qubit-environment entanglement in time-dependent pure dephasing [0.0] システム環境の絡み合いを定量化する方法は、時間依存ハミルトニアンに簡単に一般化できることを示す。
我々はこれらの手法を用いて、キュービットオシレータシステムのデコヒーレンスの性質を研究する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:23:25 GMT)
Quantifying Quantum Entanglement in Two-Qubit Mixed State from Connected
Correlator [0.0] 我々は、量子エンタングルメントの定量化にコネクテッド相関行列を用いる。
相関関係が量子エンタングルメントの有効な尺度であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:46:14 GMT)
Predicting Bone Degradation Using Vision Transformer and Synthetic
Cellular Microstructures Dataset [0.0] 骨劣化を予測・可視化する頑健で高速な計算法が開発されている。
我々のディープラーニング手法であるTransVNetは、異なる3Dボキセル化画像を取り込み、数ヶ月にわたってその進化を予測することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:00:08 GMT)
Positron annihilation and binding in aromatic and other ring molecules [0.0] 消滅スペクトルは、入射陽電子エネルギーの関数として解決された芳香族および複素環環分子に対して提示される。
測定された結合エネルギーと、テクティタブ初期多体理論の予測との間には、優れた一致を見いだすことができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:11:30 GMT)
Personalized Video Relighting With an At-Home Light Stage [0.0] 我々は,高品質で時間的に一貫した映像をリアルタイムに生成するパーソナライズされたビデオリライティングアルゴリズムを開発した。
モニタでYouTubeビデオを見ているユーザのビデオをキャプチャすることで、任意の条件下で高品質なリライティングを行うことのできるパーソナライズされたアルゴリズムをトレーニングできることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 02:46:37 GMT)
Parallel Proof-of-Work with DAG-Style Voting and Targeted Reward Discounting [0.0] 本稿では,DAG方式の暗号プロトコルであるDAG方式の暗号プロトコルを並列に検証する。
一貫性の保証、トランザクションスループットの向上、トランザクション確認レイテンシの低減、インセンティブ攻撃に対するレジリエンスの向上などを提供する。
私たちの分析の興味深い副産物は、報酬の割引なしの並行証明は、現実的なネットワークシナリオではBitcoinよりもインセンティブ攻撃に対する耐性が低いことだ。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:14:33 GMT)
Optimality of generalized Choi maps in $M_3$ [0.0] 一般化された長井写像が最適である場合、すなわち正の写像と完全正の写像の和として表すことができない。
この性質は超越性よりも弱いが、量子絡みの検出において重要な役割を果たすことが判明した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:57:11 GMT)
On Optimal Consistency-Robustness Trade-Off for Learning-Augmented
Multi-Option Ski Rental [0.0] 学習強化型マルチオプションスキーレンタル問題は、古典的なスキーレンタル問題を2つの方法で一般化する。
ランダム化アルゴリズムでは、一貫性-ロバスト性トレードオフに対する最初の非自明な下界を示す。
私たちのアルゴリズムは、一貫性が 1.086 であるとき、e/2 の係数の範囲内のロバスト性に対する低い境界と一致します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:33:51 GMT)
Offline and online energy-efficient monitoring of scattered uncertain
logs using a bounding model [0.0] ブラックボックスのサイバー物理システムログは、状態タイムスタンプと寸法の両方で不確実である。
我々は、動的システムの非線形拡張によって与えられる過近似だが表現的モデルを利用する。
オフラインログが与えられた場合、当社のアプローチでは、偽アラームの数が限られているため、安全仕様に対するログの監視が可能です。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:02:46 GMT)
Neural parameter calibration and uncertainty quantification for epidemic
forecasting [0.0] 感染パラメータの確率密度を学習する問題に対して,新しい強力な計算手法を適用した。
ニューラルネットワークを用いて、2020年にベルリンで発生した新型コロナウイルスの感染拡大に関するデータにODEモデルを調整します。
本手法は,感染の簡易SIRモデルにおいて,本手法の真の後部への収束を示すとともに,縮小データセット上での学習能力を実証する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:34:59 GMT)
MIMONets: Multiple-Input-Multiple-Output Neural Networks Exploiting
Computation in Superposition [0.0] 本稿では,複数の入力を同時に処理できるマルチインプット・マルチプル・アウトプットニューラルネットワーク(MIMONets)を提案する。
MIMONetsは非線形ニューラルトランスフォーメーションを適用してデータ構造を均等に処理し、重畳された入力項目の数にほぼ比例するスピードアップをもたらす。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:25:45 GMT)
Longitudinal (curvature) couplings of an $N$-level qudit to a
superconducting resonator at the adiabatic limit and beyond [0.0] マルチレベルシステム(qudit)と超伝導(SC)共振器の電磁界との結合について検討する。
一般分散状態における長手多層相互作用を記述するハミルトニアンを初めて導いた。
異なる量子ビット系における断熱結合から分散結合への移行を例に挙げる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:33:59 GMT)
Locally mediated entanglement in linearised quantum gravity [0.0] 情報理論の議論: 局所体が媒介する絡み合いは、その体が古典的でないことを証明する。
重力を瞬間的にモデル化した効果の以前の導出。
この枠組みでは、絡み合いは場の量子的特徴によって明らかに仲介される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:04:10 GMT)
Liquid State Genetic Programming [0.0] 本稿では,LSGP(Liquid State Genetic Programming)と呼ばれる新しい遺伝的プログラミング法を提案する。
LSGPは、入力(液体)を格納する動的メモリと、問題を解決するために使用される遺伝的プログラミング技術を組み合わせたハイブリッド手法である。
数値実験により、LSGPは、検討されたテスト問題に対して、標準的な遺伝的プログラミングと同じような、時には同等に機能することが示された。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:09:21 GMT)
Lights out: training RL agents robust to temporary blindness [0.0] 観測結果の隠蔽表現と新しいnステップ損失関数を用いたニューラルネットワークアーキテクチャを導入する。
私たちの実装は、トレーニングされたものよりも、位置情報ベースの盲点に耐えられるので、一時的な盲点に対する堅牢性を示します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:10:05 GMT)
Leveraging Domain Adaptation and Data Augmentation to Improve Qur'anic
IR in English and Arabic [0.0] トレーニングモデルには大量のデータが必要であり、ドメイン内でのトレーニングでは取得が困難である。
我々は、MRR@10とNDCG@5の測定結果を大幅に改善するデータ拡張手法を採用している。
英語のIRタスクのためのイスラムコーパスとドメイン固有のモデルが欠如していることは、このリソース不足に対処する動機となった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:44:08 GMT)
Large Language Models, scientific knowledge and factuality: A systematic
analysis in antibiotic discovery [0.0] 本研究では,生物医学的背景知識と対話するための大規模言語モデルの可能性を検討する。
化学化合物定義生成と化学化合物・ファングス関係決定の2つのプロンプトベースタスクにおいて、最先端の10のモデルが試験される。
その結果、最近のモデルでは流布率が改善されているが、実際の精度は依然として低く、表現過剰な実体に偏っていることがわかった。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:51:55 GMT)
LLMs for Multi-Modal Knowledge Extraction and Analysis in
Intelligence/Safety-Critical Applications [0.0] 近年,大規模言語モデルの性能向上が急速に進んでいる。
このようなモデルを多種多様なアプリケーションで使用するという強い需要がある。
しかし、未解決の脆弱性や制限のため、インテリジェンスやセーフティクリティカルなアプリケーションに適用する前には、非常に注意が必要である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:04:50 GMT)
Islands Far Outside the Horizon [0.0] 半古典的な重力下での絡み合った島にある情報は、遠方の放射から非摂動的に再構成することができる。
この現象は、地平線を張ったブラックホールの外側でよく起こる。
原則として、遠方の観測者は、ブラックホール情報パラドックスが相補性やファイアウォールによって解決されるか否かを実験的に判定することができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:00:19 GMT)
Indefinite causal order for quantum phase estimation with Pauli noise [0.0] レターは、ノイズの存在下での量子位相推定の基準時間論的タスクに適用された不定因数順序のスイッチング量子チャネルの最近のスキームを探求する。
以前は偏極ノイズや熱雑音が報告されていた探査を、キュービットにとって重要であり、これまでは解決されていなかったパウリノイズのクラスに拡張する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:30:31 GMT)
Improving Automated Algorithm Selection by Advancing Fitness Landscape
Analysis [0.0] 私は、将来の仕事の基盤となる基盤を強化するために、現在の課題を仕事の体で特定し、対処します。
ディープラーニングの台頭は、自動アルゴリズムの選択に十分な機会を提供する。
情報入力を他の問題に拡張する手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:53:25 GMT)
Improved real-space parallelizable matrix-product state compression and
its application to unitary quantum dynamics simulation [0.0] 改良された実空間並列化行列積状態(MPS)圧縮法を提案する。
さらに、この手法を用いてユニタリ量子力学をシミュレートし、並列時間進化ブロック決定アルゴリズムを導入する。
得られた数値結果は、pTEBDアルゴリズムが現在の最先端MPSアルゴリズムと同じレベルのシミュレーション精度を達成することを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 11:14:48 GMT)
Impact of Tokenization on LLaMa Russian Adaptation [0.0] LLaMaロシア語適応の文脈で語彙置換の問題に対処する可能性を検討する。
自動評価の結果、語彙置換はロシア語のモデルの質を向上させることが示された。
命令調整されたモデルの人間による追加評価は、ロシア語適応語彙を持つモデルがより高いユーザの好みで回答を生成することを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:16:03 GMT)
Hyperfine interaction in the Autler-Townes effect II: control of
two-photon selection rules in the Morris-Shore basis [0.0] アルカリ金属原子のAutler-Townesレーザー励起スペクトルにおける特定の明るいピークの欠如について検討した。
我々の研究は、これらのスペクトルのディップは、超微細(HF)成分中の断熱性(またはレーザー修飾)状態の特定の構造によって引き起こされていることを明らかにした。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:40:27 GMT)
How Good Is Open Bicycle Infrastructure Data? A Countrywide Case Study
of Denmark [0.0] 自転車はデンマークの交通システムの持続可能性シフトの鍵となる要素であり、自転車の速度を高めるためには、より全国的な自転車インフラ網が必要である。
このようなネットワークを計画するには、高品質なインフラデータが必要であるが、自転車のインフラデータの質は極めて低い。
ここでは、デンマークの専用自転車インフラ上の2つの大きなオープンデータセットであるOpenStreetMap(OSM)とGeoDanmarkを国全体のデータ品質評価で比較する。
いずれのデータセットも十分な品質を持っておらず、完全なデータセットを得るにはデータセットの折り畳みが必要であることが分かりました。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:14:48 GMT)
HRCTCov19 -- A High-Resolution Chest CT Scan Image Dataset for COVID-19
Diagnosis and Differentiation [0.0] 新型コロナウイルスのパンデミックの間、CT(Computerd tomography)は新型コロナウイルスの患者を診断するための一般的な方法であった。
公開でアクセス可能な新型コロナウイルスのCT画像データセットは、プライバシー上の懸念から入手するのが困難である。
HRCTCov19は、新しい新型コロナウイルス高分解能胸部CTスキャン画像データセットである。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:30:12 GMT)
Go-No go criteria for performing quantum chemistry calculations on
quantum computers [0.0] 本稿では,この2種類の問題に対する主要な量子的アプローチを評価するための2つの基準を提案する。
ノイズによるノイズの抑制効果は、対応する古典的アルゴリズムよりも一般的には好ましくない精度の全体的なスケーリングによるものである。
第2の基準は量子位相推定(QPE)アルゴリズムに適用され、(ノイズのない)フォールトトレラント量子コンピュータが利用可能になったときにVQEの代替としてしばしば提示される。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 09:37:05 GMT)
Gauging tensor networks with belief propagation [0.0] 本稿では,信仰伝播を用いたテンソルネットワークのゲージ化アルゴリズムを提案する。
本研究では,この手法が既知のテンソルネットワークゲージ法と密接に関連していることを示す。
我々は,このアルゴリズムが既存のガウグアルゴリズムよりも高速であることを示す数値的証拠とスケーリング論を提示する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:12:28 GMT)
Full Counting Statistics of Charge in Quenched Quantum Gases [0.0] ボースとフェルミの気体を相互作用する1次元の粒子数の完全な数え上げ統計について検討する。
特に、ボース=アインシュタイン凝縮の初期状態から切り出されたリーブ=ライニガーモデルとゴーディン=ヤンモデルの時間発展を考える。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:00:36 GMT)
Fragility of the antichiral edge states under disorder [0.0] 反キラルエッジ状態として知られる共伝播エッジモードは、いわゆる修正ハルデンモデルで起こると予測されている。
一般的な信念に反して、これらのエッジモードは障害に対して脆弱であり、容易に局所化可能であることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:11:25 GMT)
Flexible Communication for Optimal Distributed Learning over
Unpredictable Networks [0.0] 高圧縮比(CR)のトレーニングは、DenseSGDのように高い精度を達成するが、通信コストが高いため、並列スケーリングが低い。
帯域幅に最適化されたAR互換のTopk圧縮機を提案し,特定のネットワーク構成におけるAllgather(AG)よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 04:51:19 GMT)
FlexModel: A Framework for Interpretability of Distributed Large
Language Models [0.0] マルチGPUとマルチノード構成に分散したモデルを扱うための,合理化されたインターフェースを提供するソフトウェアパッケージであるFlexModelを紹介する。
このライブラリは既存のモデル配布ライブラリと互換性があり、PyTorchモデルをカプセル化している。
ユーザ登録可能なHookFunctionを公開して,分散モデル内部との直接的なインタラクションを容易にする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:19:33 GMT)
Feshbach hypothesis of high-Tc superconductivity in cuprates [0.0] We present a Feshbach perspective on the origin of strong pairing in Fermi-Hubbard type models。
ホールドープカップレートの既存の実験および数値結果から、2つのホールの光、長寿命、低エネルギー励起状態の存在を予想できる。
私たちが提案する創発性フェシュバッハ共鳴は、他のドープ反強磁性モット絶縁体において超伝導を損なう可能性がある。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:59 GMT)
Fast CT anatomic localization algorithm [0.0] 我々はCTスキャンで各スライスの位置を自動的に決定する方法を示す。
これらのスライスに基づいて,スライス指数を推定された軸方向の解剖学的位置にマッピングする線形モデルを用いる。
このアプローチは計算効率が良く、典型的な処理時間はスキャン1秒未満である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:09:47 GMT)
Failures of the Feynman-Dyson diagrammatic perturbation expansion of
propagators [0.0] 電子プロパゲータとしての一粒子多体グリーン関数のファインマン・ダイソン図形摂動膨張の3つの病理学的挙動を示す。
まず、周波数依存性の自己エネルギーの摂動膨張は、広い周波数領域の正確な自己エネルギーでは収束しない。
第二に、奇階自己エネルギーを持つダイソン方程式は定性的に間違った形状であり、その結果、衛星の根の大部分は複雑で非物理的である。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:46:25 GMT)
Exploring the nonclassical dynamics of the "classical'' Schr\"odinger
equation [0.0] ボームの量子ポテンシャルに比例する項を通常のシュル・オーディンガー方程式に差し引いた非線形効果について検討する。
非線形「古典的」な状態の力学が依然として強く非古典的である理由を解析学的に説明する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 18:59:50 GMT)
Expert-guided Bayesian Optimisation for Human-in-the-loop Experimental
Design of Known Systems [0.0] 我々は,高スループット(バッチ)ベイズ最適化と人類学的決定理論を併用して,ドメインの専門家が最適実験の選択に影響を及ぼすことを可能にする。
我々の方法論は、人間が連続的な選択よりも個別に選択する方が優れているという仮説を利用しており、専門家が重要な早期決定に影響を及ぼすことを可能にする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:09:31 GMT)
Exceptional Points in a $\mathcal{PT}$-symmetrical quantum system: a
Scattering matrix approach [0.0] 非エルミート開1次元量子系の挙動をパリティ時間対称性で解析する。
例外点の前後におけるS行列の位相の挙動と分布を求める。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 01:52:36 GMT)
Evaluating the Convergence Limit of Quantum Neural Tangent Kernel [0.0] 我々は、量子アンサンブルと量子ニューラルネットワークという2つのモデルのためのカーネルを構築し、これらのモデルの無限個の量子ビットの極限における収束性を示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 03:04:26 GMT)
Engines for predictive work extraction from memoryful quantum stochastic
processes [0.0] 我々は、量子出力を持つ非マルコフ量子プロセスから予測的作業抽出法を開発した。
我々の研究は、基本的に量子形式で環境自由エネルギーを利用する機械の展望を開放する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:23:03 GMT)
Empathy and Distress Detection using Ensembles of Transformer Models [0.0] 本稿では,WASSA 2023共感・感情・パーソナリティ共有タスクへのアプローチについて述べる。
自然言語処理において、共感と悲惨な検出が重要な課題である。
Pearsonのrスコアは0.346で、共感と悲惨な検出のサブタスクでは3位です。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:50:34 GMT)
Efficient Microwave Spin Control of Negatively Charged Group-IV Color
Centers in Diamond [0.0] ダイヤモンド中の負電荷型グループIV色中心における電子スピン状態のマイクロ波誘起操作
テクティタック磁場の対称性軸とそれと平行なテクティタック磁場とのアライメントは、効率的なスピン操作のために歪を時代遅れにすることができる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:23:38 GMT)
Dynamics of the molecular geometric phase [0.0] 分子幾何学的位相の精密な動的枠組みにおける運命について検討した。
核配置空間における任意の経路に対して、瞬時にゲージ不変位相が導入された。
閉経路位相の時間的進化はマクスウェル・ファラデー誘導法則に従うことが示されている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:07:14 GMT)
Does a sparse ReLU network training problem always admit an optimum? [0.0] 最適解の存在は、特にスパースReLUニューラルネットワークの文脈において、必ずしも保証されないことを示す。
特に,特定の疎度パターンを持つディープネットワークにおける最適化問題は,必ずしも最適パラメータを持つとは限らないことを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:53:25 GMT)
Detection of Seismic Infrasonic Elephant Rumbles Using Spectrogram-Based
Machine Learning [0.0] 携帯電話で捉えた地震信号を増幅し、フィルタリングし、デジタル化する電子回路の設計と実装について述べる。
スリランカのゾウ孤児院の空き地で、地震性赤道象の群れが集められた。
また, 地震波の同定における高精度化につながるスペクトルを識別する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:26:14 GMT)
Deep Learning-Driven Enhancement of Welding Quality Control: Predicting
Welding Depth and Pore Volume in Hairpin Welding [0.0] 本研究では,溶接深度と平均孔容積の2つの重要な溶接部を予測できる頑健な深部学習モデルを提案する。
深層学習ネットワークを小さな数値実験ヘアピン溶接データセットに適用すると,有望な結果が得られた。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:43:31 GMT)
Deep Learning in Computed Tomography Pulmonary Angiography Imaging: A
Dual-Pronged Approach for Pulmonary Embolism Detection [0.0] 本研究の目的は,深層学習技術を活用し,肺塞栓症(PE)のコンピュータ支援診断を強化することである。
当社のエンドツーエンド分類フレームワークでは,アテンションガイド型畳み込みニューラルネットワーク(AG-CNN)を導入している。
AG-CNNは、FUMPEデータセット上でそれぞれ0.927、0.862、0.879、0.805のAUROC、感度、特異度、F1スコアを達成する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 08:13:34 GMT)
Deep Learning Segmentation of Spiral Arms and Bars [0.0] 銀河系スパイラルアームとバーをセグメント化するための最初の深層学習モデルを提案する。
専門家らは、我々のスパイラルアームマスクを89%の評価で「ほぼ完璧」と評価した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:30:16 GMT)
Data-driven discovery of relevant information in quantum simulators [0.0] 合成量子物質における情報抽出の理論的枠組みを提案する。
我々は、支配的な自由度を特定するためのシステムに依存しないアプローチを実証する。
仮定不要のアプローチは、すぐに様々な実験プラットフォームに適用できる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:44:53 GMT)
Critiquing Computing Artifacts through Programming Satirical Python
Scripts [0.0] 我々は、文化的応答性コンピューティング(CRC)教育の一環として、アーティファクトを批判する「風刺的プログラミング」の可能性について検討した。
風刺的なPythonスクリプトの例を示し、Pythonの要素を使ってスクリプトを作成しました。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 19:17:25 GMT)
Continual Learning with Distributed Optimization: Does CoCoA Forget? [0.0] タスクが順次到着する継続的学習問題に着目する。
目指すのは、新しく到着したタスクに対して、以前見たタスクのパフォーマンスを低下させることなく、うまく機能することである。
分散学習アルゴリズムCOCOAについて検討する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:18:56 GMT)
Constructing Nearby Commuting Matrices for Reducible Representations of
$su(2)$ with an Application to Ogata's Theorem [0.0] arXiv:1111.5933 のオガタの定理は、任意の多くの行列が、N$サイトと固定されたサイト次元$d$のマクロ可観測物に対応することを示した。
本研究では, 既約部分表現の多重度が単調に減少する挙動を示すような, $su(2) の正規化表現に対して, 近傍の通勤行列を構築する方法を開発した。
位置次元$d=2$に対して、近傍の可観測物がどれほど近いかを明確に見積もって、オガタの定理の構成的証明を与える。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:35:26 GMT)
Comparative Analysis of CPU and GPU Profiling for Deep Learning Models [0.0] 本稿では、Pytorchを用いて深層ニューラルネットワークをトレーニングしながら、CPUとGPUの時間とメモリ割り当てを示す。
単純なネットワークでは、CPUよりもGPUが大幅に改善されることはない。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 06:12:04 GMT)
Causal flow preserving optimisation of quantum circuits in the
ZX-calculus [0.0] 本稿では,非クリフォードゲート数と2ビットゲート数を最小化する最適化アルゴリズムを提案する。
回路をZXダイアグラムに変換することで、回路に戻る前に単純化することができる。
QFT回路を最適化するための特に効果的な戦略も注目されており、非クリフォードゲートに対して正確に1つの2ビットゲートとなる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 14:24:44 GMT)
Can a Tabula Recta provide security in the XXI century? [0.0] この状況において、人間計算可能なアルゴリズムがいかにして十分なセキュリティを確保できるかについて議論する。
共有テキストソースからエントロピーを集中するアルゴリズム、非バイナリ空間の演算に基づくストリーム暗号、チャレンジテキストからパスワードを生成するハッシュ様アルゴリズムの3種類について論じる。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:36:27 GMT)
Calculation of Relativistic Single-Particle States [0.0] 方法とは、ポテンシャルがクーロン・シュトゥルミアン基底で表される非相対論的な方法の拡張である。
相対論的問題の拡張において、Klein-Gordon 方程式と Dirac 方程式を有効シュリンガー形式にキャストする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 05:07:09 GMT)
Autoencoders for discovering manifold dimension and coordinates in data
from complex dynamical systems [0.0] Autoencoder frameworkは暗黙の正則化と内部線形層と$L$正則化(重崩壊)を組み合わせる
このフレームワークは、状態空間モデリングや予測の応用のために自然に拡張できることを示す。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 17:16:57 GMT)
Attention-enhanced neural differential equations for physics-informed
deep learning of ion transport [0.0] 我々はナノ多孔膜を横断するイオン輸送を特徴付ける機械学習に基づくアプローチを開発した。
提案する枠組みは、電気中立性に基づく帰納バイアスを含む注意力強化型ニューラルディファレンス方程式を中心にしている。
さらに, 物理的に有意なイオン対存在関係の解明における注意機構の役割について検討した。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 16:39:24 GMT)
Asymmetric leader-laggard cluster synchronization for collective
decision-making with laser network [0.0] フォトニック加速器は、情報処理に光の究極の性質を活用することで、関心を集めている。
本研究は,カオスレーザーとフォトニックデバイスをベースとした機械学習の能力と意義を明らかにする。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 07:04:21 GMT)
Assertion Enhanced Few-Shot Learning: Instructive Technique for Large
Language Models to Generate Educational Explanations [0.0] 人間の教育者は、生徒から教育的な説明を求め、予測する本質的な能力を持っている。
我々は,大規模言語モデルの少数ショット学習機能を用いて,インテリジェント・チューリング・システムを構築することを目的としている。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:41:34 GMT)
Are Vision Transformers More Data Hungry Than Newborn Visual Systems? [0.0] ビジョントランス (ViT) は、多くのコンピュータビジョンベンチマークにおいて最高性能のモデルである。
ViTは脳よりも飢えているデータであると考えられており、ViTは同様のレベルのパフォーマンスに到達するために、より多くのトレーニングデータを必要としている。
我々は、ViTと新生ニワトリの学習能力を直接比較し、ViTと新生ニワトリの並列制御飼育実験を行った。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:53:24 GMT)
Algoritmo de Contagem Qu\^antico Aplicado ao Grafo Bipartido Completo [0.0] Groverのアルゴリズムは、$O(sqrtN/k)$ stepsを使って$N$要素を持つ、順序のないデータベースで$k$要素を見つけることができる。
この研究は、他のグラフのマーク要素の値$k$を推定するために量子カウントアルゴリズムを使用する問題に取り組む。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:15:09 GMT)
Algorithmic Fairness with Feedback [0.0] まず、ノイズデータに基づく決定において、公平性アルゴリズムの統計的概念が、公平性の概念とは無関係であることを示す。
次に、公正性、うらやましい自由、偏見の自由性の2つの個別の福祉的概念について議論し、エラーレートバランスと予測パリティに相当する条件を確立する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 21:42:14 GMT)
Absence of backscattering in Fermi-arc-mediated conductivity of
topological Dirac semimetal Cd$_{3}$As$_{2}$ [0.0] ヒ化カドミウムは、フェルミ準位における理想的な3次元ディラック点を実現するために、トポロジカルな物質として再沈殿した。
これらのディラック点は、強い量子振動、大きな磁気抵抗、超高モビリティ、グラフェンを超えるフェルミ速度など、いくつかの異常な輸送現象を引き起こす。
ここでは電子構造から直接誘導される強結合モデルに基づいて, ヒ化カドミウム薄膜のフェルミアーク状態を計算する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 20:10:19 GMT)
A Self-Commissioning Edge Computing Method for Data-Driven Anomaly
Detection in Power Electronic Systems [0.0] 現場応用のための制御されたラボ環境でうまく機能する手法は、重大な課題を提示する。
オンライン機械学習は、この問題を克服するための強力なツールだが、トレーニングプロセスの安定性と予測可能性を保証する上で、さらなる課題がもたらされる。
この研究は、これらの欠点を最小限のメモリ使用量で軽減するエッジコンピューティング手法を提案する。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 10:56:25 GMT)
A Review of Password-less User Authentication Schemes [0.0] レビューでは、2004年にパスワードにネイルが配置されて以来提案されてきたパスワードレス認証方式について検討している。
ユーザエクスペリエンス、全体的なセキュリティ、デプロイの容易性に対する影響に基づいて、真にパスワードレスで実用的なスキームを評価します。
論文参考訳(メタデータ) (Tue, 5 Dec 2023 15:57:40 GMT)